Ai项目 | AI工具导航 | 前沿AI技术资源 | AGI导航 | ChatGPT插件 | RPA自动化 | 智能体 | AGI工具 | AI硬件 | 第48页

EchoMimicV2 – 阿里推出的开源数字人项目，能生成完整数字人半身动画

EchoMimicV2是什么 EchoMimicV2是阿里蚂蚁集团推出的半身人体AI数字人项目，基于参考图片、音频剪辑和手部姿势序列生成高质量动画视频，确保音频内容与半身动作的一致性。EchoMimi...

Ai项目

2周前

5,3750

Embodied Reasoner – 浙大联合阿里等机构推出的具身交互推理模型

Embodied Reasoner是什么 Embodied Reasoner是浙江大学、中国科学院软件研究所、阿里巴巴集团等机构推出的新型的具身交互推理模型，基于视觉搜索、推理和行动协同完成复杂任务...

Ai项目

2周前

5,3700

Inf-DiT – 清华联合智谱 AI 推出的超高分辨率图像生成模型

Inf-DiT是什么 Inf-DiT 是清华大学、智谱AI 推出基于扩散模型的图像上采样方法，能生成超高分辨率图像。Inf-DiT引入单向块注意力机制（UniBA），将生成过程中的空间复杂度从 O(N...

Ai项目

2周前

5,3700

Multi-Agent Orchestrator – 亚马逊开源的多智能体框架

Multi-Agent Orchestrator是什么 Multi-Agent Orchestrator 是用于管理和协调多个智能代理（Agent）的框架。通过分类器识别用户输入的意图，将请求分配给最...

Ai项目

12个月前

05,3700

DreamGen – 英伟达推出的新型机器人学习技术

DreamGen是什么 DreamGen是英伟达推出的创新的机器人学习技术，基于AI视频世界模型生成合成数据，让机器人能在梦境中学习新技能。DreamGen仅需少量现实视频数据，能生成大规模逼真的训练...

Ai项目

2周前

5,3650

文心大模型4.5 Turbo – 百度推出的最新多模态大模型

文心大模型4.5 Turbo是什么文心大模型4.5 Turbo是百度推出的高性能、低成本多模态大模型。基于文心大模型4.5的基础上进行优化，具备多模态、强推理能力，能处理文本、图像等多种输入形式。相...

Ai项目

2周前

5,3600

CityDreamer4D – 南洋理工推出的无边界 4D 城市建模框架

CityDreamer4D是什么 CityDreamer4D是南洋理工大学 S-Lab 团队开发的用于生成无边界 4D 城市的组合生成模型。将动态物体（如车辆）与静态场景（如建筑和道路）分离，通过三个...

Ai项目

12个月前

5,3600

OpenDeepResearcher – 开源 AI 研究工具，自动完成搜索、评估、提取和报告生成

OpenDeepResearcher是什么 OpenDeepResearcher 是开源的 AI 研究工具，能帮助用户高效地完成复杂的信息查询和分析任务。基于迭代搜索和推理，自动从网络中获取相关数据...

Ai项目

12个月前

5,3600

FramePack – 斯坦福开源的AI视频生成模型

FramePack是什么 FramePack 是斯坦福大学开源的AI视频生成模型。基于压缩输入帧的上下文长度，解决视频生成中的“遗忘”和“漂移”问题，让模型能高效处理大量帧，保持较低的计算复杂度。Fr...

Ai项目

12个月前

05,3600

VersaGen – 实现文本到图像合成中视觉控制能力的生成式 AI 代理

VersaGen是什么 VersaGen是文本到图像合成的生成式AI代理，能实现灵活的视觉控制能力。VersaGen能处理包括单一视觉主体、多个视觉主体、场景背景，这些元素的任意组合在内的多种视觉控制...

Ai项目

2周前

5,3550