Eagle 2.5 – 英伟达推出的视觉语言模型

Eagle 2.5是什么 Eagle 2.5是英伟达推出的视觉语言模型,专注于长上下文多模态学习的 AI 模型,参数规模仅为 8B。参数量较小,但在处理高分辨率图像和长视频序列方面表现出色,性能媲美参...
2个月前
1,2450

DAM-3B – 英伟达推出的多模态大语言模型

DAM-3B是什么 DAM-3B(Describe Anything 3B)是英伟达推出的多模态大语言模型,专为生成图像和视频中特定区域的详细描述设计。模型通过点、边界框、涂鸦或掩码等方式指定目标区域...
2个月前
1,2150

Psi R0 – 灵初智能推出的端到端具身模型

Psi R0是什么 Psi R0是灵初智能发布的首个基于强化学习的端到端具身模型。支持双灵巧手协同进行复杂操作,能够将多个技能串联混训,生成具有推理能力的智能体,完成并闭环长程灵巧操作任务。Psi R...
2个月前
1,2150