Open-Sora 2.0 – 潞晨科技开源的AI视频生成模型 Open-Sora 2.0是什么 Open-Sora 2.0 是潞晨科技推出的全新开源SOTA(State-of-the-Art)视频生成模型。Open-Sora 2.0 用 20 万美元(224 张... Ai项目 12个月前04,3350
Gemini Robotics – 谷歌 DeepMind 推出的具身智能大模型 Gemini Robotics是什么 Gemini Robotics 是谷歌 DeepMind 推出的基于 Gemini 2.0 的机器人项目,将大型多模态模型的能力引入物理世界。项目包含两个主要模型... Ai项目 12个月前06,2300
PP-TableMagic – 百度飞桨团队开源的表格识别工具 PP-TableMagic是什么 PP-TableMagic 是百度飞桨团队推出的高性能表格识别工具,用在将图片中的表格结构化信息提取出来,转换为 HTML 等格式,进行进一步的数据处理和分析。PP... Ai项目 12个月前05,7700
Gemini 2.0 Flash – Google推出的多模态 AI 模型 Gemini 2.0 Flash是什么 Gemini 2.0 Flash是Google推出的多模态AI模型,结合文本理解和图像生成能力。根据自然语言输入生成高质量的图像,支持多轮对话式的图像编辑,保持... Ai项目 12个月前07,3750
TokenSwift – 超长文本生成加速框架,90分钟内生成10万Token文本 TokenSwift是什么 TokenSwift 是北京通用人工智能研究院团队推出的超长文本生成加速框架,能在90分钟内生成10万Token的文本,相比传统自回归模型的近5小时,速度提升了3倍,生成质... Ai项目 12个月前04,4500
MIDI – AI 3D场景生成技术,能将单张图像转化为360度3D场景 MIDI是什么 MIDI(Multi-Instance Diffusion for Single Image to 3D Scene Generation)是先进的3D场景生成技术,能在短时间内将单张... Ai项目 12个月前04,7400
Evolving Agents – 开源的AI Agent管理与进化框架 Evolving Agents是什么 Evolving Agents 是用在创建、管理和进化 AI 代理的生产级框架。Evolving Agents支持智能代理之间的通信和协作,根据语义理解需求、基于... Ai项目 12个月前05,3900
MT-MegatronLM – 摩尔线程开源的混合并行训练框架 MT-MegatronLM是什么 MT-MegatronLM 是摩尔线程推出的面向全功能 GPU 的开源混合并行训练框架,主要用于高效训练大规模语言模型。支持 dense 模型、多模态模型及 MoE... Ai项目 12个月前07,5550
APB – 清华联合腾讯等机构推出的分布式长上下文推理框架 APB是什么 APB(Accelerating Distributed Long-Context Inference by Passing Compressed Context Blocks acro... Ai项目 12个月前04,3800
Botgroup.chat – 开源的AI机器人群聊项目,支持多个AI模型群聊对话 Botgroup.chat是什么 Botgroup.chat 是基于 React 和 Cloudflare Pages 的多人 AI 聊天应用。支持多个 AI 角色同时参与对话,提供类似群聊的交互体验... Ai项目 12个月前06,4200