MoBA – Moonshot AI 提出的新型注意力机制 MoBA是什么 MoBA(Mixture of Block Attention)是 Moonshot AI 提出的新型注意力机制,提高大型语言模型(LLMs)处理长上下文任务的效率。通过将上下文划分为... Ai项目 1年前04,5550
AgiBot Digital World – 智元机器人推出的机器人仿真框架 AgiBot Digital World是什么 AgiBot Digital World 是智元机器人推出的高保真机器人仿真框架,为机器人操作技能研究与应用提供高效支持。AgiBot Digital ... Ai项目 1年前04,5550
GCDance – 萨里大学和江南大学推出的3D舞蹈生成框架 GCDance是什么 GCDance(Genre-Controlled 3D Full Body Dance Generation Driven by Music)是英国萨里大学和江南大学推出的3D舞... Ai项目 1年前04,5550
FluxSR – 上海交大联合华为等高校推出的图像超分辨率模型 FluxSR是什么 FluxSR是新型的单步扩散模型,是上海交通大学、哈佛大学、华南理工大学和华为诺亚方舟实验室推出的专门用在真实世界图像超分辨率(Real-ISR)任务。FluxSR基于FLUX.1... Ai项目 1年前4,5500
FireRedASR – 小红书开源的自动语音识别模型 FireRedASR是什么 FireRedASR 是小红书开源的工业级自动语音识别(ASR)模型家族,支持普通话、中文方言和英语,在普通话 ASR 基准测试中达到了新的最佳水平(SOTA),在歌词识别... Ai项目 1年前04,5500
子曰翻译2.0 – 网易有道推出的最新翻译大模型 子曰翻译2.0是什么 子曰翻译2.0是网易有道推出的最新翻译大模型,模型在数据、算法和评估三个关键维度进行了系统性升级,实现了翻译质量、效率和鲁棒性的质的飞跃。 在数据层面,有道收集清洗了数千万高质量... Ai项目 1年前04,5500
DeepMesh – 清华和南洋理工推出的 3D 网格生成框架 DeepMesh是什么 DeepMesh 是清华大学和南洋理工大学研究人员提出的 3D 网格生成框架,基于强化学习和自回归变换器生成高质量的 3D 网格。通过两项关键创新来优化网格生成:一是高效的预训... Ai项目 1年前04,5500
Chinese-LiPS – 智源研究院联合南大开源的中文多模态语音识别数据集 Chinese-LiPS是什么 Chinese-LiPS 是智源研究院联合南开大学共同打造的高质量中文多模态语音识别数据集,包含100小时的语音、视频和手动转录文本,创新性地融合了唇读视频和演讲者的幻... Ai项目 1个月前4,5450
FACTS Grounding – 谷歌推出的评估大模型能力的基准测试 FACTS Grounding是什么 FACTS Grounding是谷歌DeepMind推出的评估大型语言模型(LLMs)能力的基准测试,衡量模型根据给定上下文生成事实准确且无捏造信息的文本的能力... Ai项目 1个月前4,5400
moonshot-v1-vision-preview – 月之暗面推出的多模态图片理解模型 moonshot-v1-vision-preview是什么 moonshot-v1-vision-preview 是月之暗面推出的多模态图片理解模型,模型完善了 moonshot-v1 模型系列的多模... Ai项目 1个月前4,5400