WebThinker – 人民大学联合智源研究院等机构推出的深度研究智能体 WebThinker是什么 WebThinker是中国人民大学、北京智源人工智能研究院和华为泊松实验室等机构提出的深度研究智能体。WebThinker赋能大型推理模型(LRMs)在推理过程中自主进行网... Ai项目 2周前4,4000
Multiverse – Enigma Labs推出的全球首款AI生成多人游戏模型 Multiverse是什么 Multiverse是以色列团队Enigma Labs推出的全球首个AI生成多人游戏模型。是多人赛车游戏,玩家可以超车、漂移、加速,每一次行动会实时影响并重塑游戏世界。模型... Ai项目 2周前4,4100
Open Code Reasoning – 英伟达开源的代码推理AI模型 Open Code Reasoning是什么 Open Code Reasoning(OCR)是英伟达开源的代码推理AI模型,基于Nemotron架构,专为提升代码推理和生成能力设计。OCR包含32B... Ai项目 2周前5,1400
KuaiMod – 快手推出的自动化短视频质量判别框架 KuaiMod是什么 KuaiMod 是快手推出的基于多模态大模型的短视频质量判别框架,能高效识别和过滤有害及低质量内容。框架借鉴普通法(Common Law)体系,基于案例驱动的方式动态更新审核策略... Ai项目 2周前4,4900
VITA-Audio – 开源的端到端多模态语音大模型,低延迟、推理快 VITA-Audio是什么 VITA-Audio 是开源的端到端多模态语音大模型,具有低延迟、推理速度快的特点。通过轻量级的多模态交叉标记预测(MCTP)模块,可在首次前向传播中生成音频输出,将生成首... Ai项目 2周前4,6250
Parakeet TDT 0.6B – 英伟达开源的自动语音识别模型 Parakeet TDT 0.6B是什么 Parakeet TDT 0.6B 是英伟达推出的开源自动语音识别(ASR)模型。采用FastConformer编码器和TDT解码器架构,通过预测文本标记及其... Ai项目 2周前5,4600
TesserAct – AI 4D具身世界模型,能预测3D场景的动态演变 TesserAct是什么 TesserAct 是创新的 4D 具身世界模型,能预测 3D 场景随时间的动态演变,响应具身代理的动作。通过训练 RGB-DN(RGB、深度和法线)视频数据来学习,超越了传... Ai项目 2周前4,7950
VoltAgent – 开源的AI Agent构建和编排框架 VoltAgent是什么 VoltAgent 是开源的 TypeScript 框架,用在构建和编排 AI Agent。VoltAgent 提供构建 AI 应用的基础结构和工具,简化与大语言模型(LLM... Ai项目 2周前4,7250
Aero-1-Audio – LMMs-Lab 推出的轻量级音频模型 Aero-1-Audio是什么 Aero-1-Audio 是 LMMs-Lab 开发的轻量级音频模型,基于 Qwen-2.5-1.5B 构建,仅包含 1.5 亿参数。专为长音频处理设计,能支持长达 1... Ai项目 2周前4,5950
DianJin-R1 – 阿里云通义点金联合苏大推出的金融推理大模型 DianJin-R1是什么 DianJin-R1是阿里云通义点金团队与苏州大学联合推出的金融领域推理增强大模型,专为金融任务设计,融合了先进的技术和全面的数据支持。模型通过推理增强监督和强化学习提升金... Ai项目 2周前6,2950