EchoMimicV2 – 阿里推出的开源数字人项目,能生成完整数字人半身动画 EchoMimicV2是什么 EchoMimicV2是阿里蚂蚁集团推出的半身人体AI数字人项目,基于参考图片、音频剪辑和手部姿势序列生成高质量动画视频,确保音频内容与半身动作的一致性。EchoMimi... Ai项目 2周前5,3750
Embodied Reasoner – 浙大联合阿里等机构推出的具身交互推理模型 Embodied Reasoner是什么 Embodied Reasoner是浙江大学、中国科学院软件研究所、阿里巴巴集团等机构推出的新型的具身交互推理模型,基于视觉搜索、推理和行动协同完成复杂任务... Ai项目 2周前5,3700
Inf-DiT – 清华联合智谱 AI 推出的超高分辨率图像生成模型 Inf-DiT是什么 Inf-DiT 是清华大学、智谱AI 推出基于扩散模型的图像上采样方法,能生成超高分辨率图像。Inf-DiT引入单向块注意力机制(UniBA),将生成过程中的空间复杂度从 O(N... Ai项目 2周前5,3700
Multi-Agent Orchestrator – 亚马逊开源的多智能体框架 Multi-Agent Orchestrator是什么 Multi-Agent Orchestrator 是用于管理和协调多个智能代理(Agent)的框架。通过分类器识别用户输入的意图,将请求分配给最... Ai项目 12个月前05,3700
DreamGen – 英伟达推出的新型机器人学习技术 DreamGen是什么 DreamGen是英伟达推出的创新的机器人学习技术,基于AI视频世界模型生成合成数据,让机器人能在梦境中学习新技能。DreamGen仅需少量现实视频数据,能生成大规模逼真的训练... Ai项目 2周前5,3650
文心大模型4.5 Turbo – 百度推出的最新多模态大模型 文心大模型4.5 Turbo是什么 文心大模型4.5 Turbo是百度推出的高性能、低成本多模态大模型。基于文心大模型4.5的基础上进行优化,具备多模态、强推理能力,能处理文本、图像等多种输入形式。相... Ai项目 2周前5,3600
CityDreamer4D – 南洋理工推出的无边界 4D 城市建模框架 CityDreamer4D是什么 CityDreamer4D是南洋理工大学 S-Lab 团队开发的用于生成无边界 4D 城市的组合生成模型。将动态物体(如车辆)与静态场景(如建筑和道路)分离,通过三个... Ai项目 12个月前5,3600
OpenDeepResearcher – 开源 AI 研究工具,自动完成搜索、评估、提取和报告生成 OpenDeepResearcher是什么 OpenDeepResearcher 是开源的 AI 研究工具,能帮助用户高效地完成复杂的信息查询和分析任务。基于迭代搜索和推理,自动从网络中获取相关数据... Ai项目 12个月前5,3600
FramePack – 斯坦福开源的AI视频生成模型 FramePack是什么 FramePack 是斯坦福大学开源的AI视频生成模型。基于压缩输入帧的上下文长度,解决视频生成中的“遗忘”和“漂移”问题,让模型能高效处理大量帧,保持较低的计算复杂度。Fr... Ai项目 12个月前05,3600
VersaGen – 实现文本到图像合成中视觉控制能力的生成式 AI 代理 VersaGen是什么 VersaGen是文本到图像合成的生成式AI代理,能实现灵活的视觉控制能力。VersaGen能处理包括单一视觉主体、多个视觉主体、场景背景,这些元素的任意组合在内的多种视觉控制... Ai项目 2周前5,3550