Dolphin – 清华联合海天瑞声推出的语音识别大模型 Dolphin是什么 Dolphin是清华大学电子工程系语音与音频技术实验室联合海天瑞声共同推出的面向东方语言的语音大模型。支持40个东方语种的语音识别,中文语种涵盖22种方言(含普通话),能精准识别... Ai项目 5个月前02,4800
Meta Motivo – Meta 推出控制数字智能体动作的人工智能模型 Meta Motivo是什么 Meta Motivo 是 Meta 公司推出的AI模型,能提升元宇宙体验的真实性。Meta Motivo基于控制虚拟人形智能体的全身动作,模拟人类行为,增强用户互动。模... Ai项目 5个月前2,4750
Infinity – 字节跳动推出的高分辨率图像生成模型 Infinity是什么 Infinity是字节跳动推出的基于位级自回归建模的视觉生成模型,能根据语言指令生成高分辨率、逼真的图像。Infinity通过无限词汇量的标记器、分类器和位自纠正机制,显著提升... Ai项目 5个月前2,4750
RAG-FiT – 英特尔实验室推出用于开发、增强大模型的开源RAG框架 RAG-FiT是什么 RAG-FiT(曾用名RAG Foundry)是英特尔实验室推出的开源框架,用在微调(fine-tuning)增强大型语言模型(LLMs)在检索增强生成(RAG)任务中的表现。R... Ai项目 5个月前2,4750
Agentic Reasoning – 牛津大学推出增强LLM推理能力的框架 Agentic Reasoning是什么 Agentic Reasoning是牛津大学推出的增强大型语言模型(LLM)推理能力的框架。基于整合外部工具(如网络搜索、代码执行和结构化记忆)解决复杂的多步... Ai项目 5个月前02,4750
明岐 – 上海交大推出的医学多模态大模型,精准诊断罕见病 明岐是什么 明岐是上海交通大学计算机学院LoCCS实验室推出的首个精准诊断罕见病的医学多模态大模型。基于“大模型能力矩阵 + 专家路由协同”的双引擎驱动架构,整合医学影像、病历文本及化验指标等数据,为... Ai项目 5个月前02,4750
MedReason – 美国加州联合南洋理工等机构推出的医学推理框架 MedReason是什么 MedReason是美国加州大学圣克鲁斯分校、加拿大不列颠哥伦比亚大学、新加坡南洋理工大学等机构推出的医学推理框架,基于知识图谱提升大型语言模型(LLMs)在医学领域的推理能... Ai项目 5个月前02,4750
SketchVideo – 快手联合多所高校推出基于草图的视频生成与编辑框架 SketchVideo是什么 SketchVideo 是中国科学院大学,香港科技大学和快手可灵团队推出的基于草图的视频生成与编辑框架。在关键帧上绘制草图,结合文本提示,实现对视频的空间布局和运动的精细... Ai项目 4个月前2,4700
MinT – 生成顺序事件的文本转视频模型,灵活控制时间戳 MinT是什么 MinT(Mind the Time)是Snap Research、多伦多大学和向量研究所联合推出的多事件视频生成框架,基于精确的时间控制,根据文本提示生成包含多个事件的视频序列。Mi... Ai项目 5个月前2,4700
Inf-DiT – 清华联合智谱 AI 推出的超高分辨率图像生成模型 Inf-DiT是什么 Inf-DiT 是清华大学、智谱AI 推出基于扩散模型的图像上采样方法,能生成超高分辨率图像。Inf-DiT引入单向块注意力机制(UniBA),将生成过程中的空间复杂度从 O(N... Ai项目 5个月前2,4700