CoA – 谷歌推出的多智能体协作框架 CoA是什么 CoA(Chain-of-Agents)是谷歌推出的多智能体协作框架,用于解决大语言模型(LLM)在处理长文本任务时面临的上下文限制问题。CoA框架将长文本分割成多个较短的片段,由多个工... Ai项目 4个月前3,7500
Runway Gen-4 – Runway 推出最新的AI视频生成模型 Runway Gen-4是什么 Runway Gen-4 是 AI 初创公司 Runway 推出的高保真AI视频生成模型。支持在多个场景中保持人物、物体和环境的一致性,无需额外精调或训练。用户提供一张... Ai项目 4个月前03,7300
Gemini 2.0 Flash – Google推出的多模态 AI 模型 Gemini 2.0 Flash是什么 Gemini 2.0 Flash是Google推出的多模态AI模型,结合文本理解和图像生成能力。根据自然语言输入生成高质量的图像,支持多轮对话式的图像编辑,保持... Ai项目 4个月前03,7250
TIGER – 清华大学推出的轻量级语音分离模型 TIGER是什么 TIGER(Time-frequency Interleaved Gain Extraction and Reconstruction Network)是清华大学研究团队提出的轻量级... Ai项目 4个月前03,7050
OctoTools – 斯坦福推出解决复杂推理任务的开源智能体框架 OctoTools是什么 OctoTools 是斯坦福大学推出的开源智能体框架,基于可扩展的工具解决复杂的推理任务。OctoTools用标准化的工具卡片(tool cards)封装工具功能,无需额外训... Ai项目 4个月前03,6950
WebSSL – Meta联合纽约大学等机构推出的视觉自监督学习系列模型 WebSSL是什么 WebSSL(Web-scale Self-Supervised Learning)是Meta、纽约大学等机构推出的视觉自监督学习(SSL)系列模型,基于大规模网络数据(如数十亿图... Ai项目 4个月前3,6750
Gemini 2.0 Flash Thinking – 谷歌推出的最新推理模型,支持百万上下文展示思考路径 Gemini 2.0 Flash Thinking是什么 Gemini 2.0 Flash Thinking 是谷歌最新发布的推理增强型 AI 模型,专为复杂问题的高效推理和可解释性设计。在 Chat... Ai项目 4个月前3,6650
QwQ-32B – 阿里通义千问开源的最新推理模型 QwQ-32B是什么 QwQ-32B 是阿里巴巴开源的新型推理模型,参数量为 320 亿。基于大规模强化学习(RL)训练,在数学推理、编程等任务上表现出色,性能比肩 6710 亿参数的 DeepSee... Ai项目 4个月前03,6600
Qwen2.5-Omni – 阿里开源的端到端多模态模型 Qwen2.5-Omni是什么 Qwen2.5-Omni 是阿里开源的 Qwen 系列旗舰级多模态模型,拥有7B参数,Qwen2.5-Omni具备强大的多模态感知能力,能处理文本、图像、音频和视频输入... Ai项目 4个月前03,6600
Apollo – Meta 联合斯坦福大学推出的大型多模态模型 Apollo是什么 Apollo是Meta和斯坦福大学合作推出的大型多模态模型(LMMs),专注于视频理解。Apollo基于系统研究,揭示视频理解在LMMs中的关键驱动因素,推出“Scaling Co... Ai项目 4个月前3,6250