FastVLM – 苹果推出的高效视觉语言模型

FastVLM是什么 FastVLM是苹果推出的高效的视觉语言模型(VLM),能提升高分辨率图像处理的效率和性能。模型引入FastViTHD新型混合视觉编码器,有效减少视觉token数量,显著降低编码...
4周前
4,7600

Eagle 2.5 – 英伟达推出的视觉语言模型

Eagle 2.5是什么 Eagle 2.5是英伟达推出的视觉语言模型,专注于长上下文多模态学习的 AI 模型,参数规模仅为 8B。参数量较小,但在处理高分辨率图像和长视频序列方面表现出色,性能媲美参...
4周前
4,7550