Ai项目 | AI工具导航 | 前沿AI技术资源 | AGI导航 | ChatGPT插件 | RPA自动化 | 智能体 | AGI工具 | AI硬件 | 第50页

Florence-VL – 微软和马里兰大学共同开源的多模态大语言模型

Florence-VL是什么 Florence-VL是创新的多模态大型语言模型（MLLMs），是马里兰大学和微软研究院共同推出的。Florence-VL用生成式视觉基础模型Florence-2丰富视觉...

Ai项目

2周前

5,3400

Sitcom-Crafter – 北航联合港中文等高校推出的 3D 人类动作生成系统

Sitcom-Crafter是什么 Sitcom-Crafter 是北京航空航天大学、香港中文大学（深圳）、悉尼科技大学、中山大学等高校联合推出的 3D 场景中人类动作生成系统。基于用户提供的长剧情指...

Ai项目

12个月前

05,3400

GaussianCity – 南洋理工大学 S-Lab 团队推出的 3D 城市生成框架

GaussianCity是什么 GaussianCity 是南洋理工大学 S-Lab 团队推出的高效无边界3D城市生成框架，基于3D高斯绘制（3D-GS）技术。引入紧凑的 BEV-Point 表示方法...

Ai项目

12个月前

05,3400

A2A – 谷歌开源的首个标准智能体交互协议

A2A是什么 A2A（Agent2Agent Protocol）是谷歌开源的首个标准智能体交互协议，让不同框架和供应商构建的AI智能体相互协作。A2A基于标准化的通信方式，打破系统孤岛，让智能体安全地...

Ai项目

12个月前

05,3400

Infinity – 字节跳动推出的高分辨率图像生成模型

Infinity是什么 Infinity是字节跳动推出的基于位级自回归建模的视觉生成模型，能根据语言指令生成高分辨率、逼真的图像。Infinity通过无限词汇量的标记器、分类器和位自纠正机制，显著提升...

Ai项目

2周前

5,3350

TIP-I2V – 超170万大规模真实文本和图像提示数据集

TIP-I2V是什么 TIP-I2V是大规模真实文V本和图像提示数据集，用在图像到视频生成领域。TIP-I2V包含超过170万独特的用户文本和图像提示，及五种SOTA图生视频模型生成的相应视频。数据集...

Ai项目

2周前

5,3300

ViewExtrapolator – 南洋理工联合UCAS团队推出的新型视图合成方法

ViewExtrapolator是什么 ViewExtrapolator是南洋理工大学、UCAS研究团队共同推出的新视角外推方法，基于稳定视频扩散（Stable Video Diffusion, SV...

Ai项目

2周前

5,3300

PSHuman – 开源的单图像3D人像重建技术，仅需一张照片

PSHuman是什么 PSHuman是先进的单图像3D人像重建技术。基于跨尺度多视图扩散模型，仅需一张照片，能生成高度逼真的3D人像模型，包括精细的面部表情和全身姿态。核心优势在于能同时建模全局形状和...

Ai项目

2周前

5,3300

DITTO-2 – Adobe 联合加大推出的音乐生成模型

DITTO-2是什么 DITTO-2 是 Adobe 和加州大学研究人员联合推出的新型音乐生成模型，通过优化扩散模型的推理时间，实现快速且可控的音乐生成。模型基于扩散模型的推理时间优化（Inferen...

Ai项目

2周前

5,3250

AingDesk – 开源AI客户端工具，一键部署上百款 AI 模型到个人电脑

AingDesk是什么 AingDesk 是开源的客户端软件，帮助用户快速将上百款 AI 模型部署到个人电脑上。通过一键部署功能，简化复杂的模型安装过程，没有技术背景的用户也能轻松上手。AingDes...

Ai项目

12个月前

05,3250