Ai项目 | AI工具导航 | 前沿AI技术资源 | AGI导航 | ChatGPT插件 | RPA自动化 | 智能体 | AGI工具 | AI硬件 | 第27页

JoyVASA – 京东健康开源的音频驱动的数字人头项目

JoyVASA是什么 JoyVASA是京东健康国际公司开源的音频驱动的数字人头项目，基于扩散模型技术，根据音频信号生成与音频同步的面部动态和头部运动。JoyVASA能实现人物的唇形同步和表情控制，还扩...

Ai项目

2周前

5,4400

TIP-I2V – 超170万大规模真实文本和图像提示数据集

TIP-I2V是什么 TIP-I2V是大规模真实文V本和图像提示数据集，用在图像到视频生成领域。TIP-I2V包含超过170万独特的用户文本和图像提示，及五种SOTA图生视频模型生成的相应视频。数据集...

Ai项目

2周前

5,2700

FLUX Tools – 黑森林实验室推出的模型工具套组

FLUX Tools是什么 FLUX Tools是黑森林实验室推出的一套模型工具，能增强基础文本到图像模型FLUX.1的控制性和可操作性。FLUX Tools包括FLUX.1 Fill（图像修复和扩展...

Ai项目

2周前

4,7800

SmoothCache – Roblox 和女王大学推出用于DiT的通用推理加速技术

SmoothCache是什么 SmoothCache 是用在Diffusion Transformers （DiT）模型的通用推理加速技术，是 Roblox 和女王大学的研究团队推出。基于分析相邻扩散...

Ai项目

2周前

4,7050

AutoConsis – 美团联合复旦大学推出的UI内容一致性AI检测工具

AutoConsis是什么 AutoConsis是UI内容一致性智能检测工具，是美团技术团队与复旦大学联合推出的。工具基于深度学习和大型语言模型自动识别和提取界面中的关键数据，检测并识别数据间的不一致...

Ai项目

2周前

5,8850

OmniEdit – 滑铁卢大学等机构开源的通用图像编辑模型

OmniEdit是什么 OmniEdit是先进的图像编辑技术，通过结合多个专家模型的监督来训练一个通用模型，处理多种图像编辑任务。能处理不同纵横比的图像，七种不同的图像编辑任务，包括对象替换、移除、添...

Ai项目

2周前

5,7100

In-Context LoRA – 阿里通义推出的基于DiTs的图像生成框架

In-Context LoRA是什么 In-Context LoRA是阿里巴巴通义实验室推出的基于扩散变换器（DiTs）的图像生成框架，用模型的内在上下文学习能力，最小化调整激活模型的上下文生成能力...

Ai项目

2周前

4,8500

Add-it – 英伟达推出无需训练的图像编辑技术

Add-it是什么 Add-it是NVIDIA推出的无需训练的图像编辑技术，能根据文本指令在图像中添加对象。这项技术基于扩展扩散模型的注意力机制，整合场景图像、文本提示和生成图像的信息，实现结构一致性...

Ai项目

2周前

4,7550

DINO-X – IDEA 研究院推出的通用视觉大模型

DINO-X是什么 DINO-X是IDEA研究院推出的通用视觉大模型，具备开放世界对象检测与理解能力。支持文本、视觉和定制提示，能识别图像中的任何对象而无需用户提示。基于超过1亿样本的Groundin...

Ai项目

2周前

7,1700

The Matrix – 阿里联合港大等多所机构推出的AI基础世界模拟器

The Matrix是什么 The Matrix是与电影同名的首个AI基础世界模拟器，是全华人团队推出的（作者分别来自阿里巴巴、香港大学、滑铁卢大学和加拿大AI研究机构Vector Insititut...

Ai项目

2周前

5,3450