Florence-VL – 微软和马里兰大学共同开源的多模态大语言模型 Florence-VL是什么 Florence-VL是创新的多模态大型语言模型(MLLMs),是马里兰大学和微软研究院共同推出的。Florence-VL用生成式视觉基础模型Florence-2丰富视觉... Ai项目 2周前5,3400
Sitcom-Crafter – 北航联合港中文等高校推出的 3D 人类动作生成系统 Sitcom-Crafter是什么 Sitcom-Crafter 是北京航空航天大学、香港中文大学(深圳)、悉尼科技大学、中山大学等高校联合推出的 3D 场景中人类动作生成系统。基于用户提供的长剧情指... Ai项目 12个月前05,3400
GaussianCity – 南洋理工大学 S-Lab 团队推出的 3D 城市生成框架 GaussianCity是什么 GaussianCity 是南洋理工大学 S-Lab 团队推出的高效无边界3D城市生成框架,基于3D高斯绘制(3D-GS)技术。引入紧凑的 BEV-Point 表示方法... Ai项目 12个月前05,3400
A2A – 谷歌开源的首个标准智能体交互协议 A2A是什么 A2A(Agent2Agent Protocol)是谷歌开源的首个标准智能体交互协议,让不同框架和供应商构建的AI智能体相互协作。A2A基于标准化的通信方式,打破系统孤岛,让智能体安全地... Ai项目 12个月前05,3400
Infinity – 字节跳动推出的高分辨率图像生成模型 Infinity是什么 Infinity是字节跳动推出的基于位级自回归建模的视觉生成模型,能根据语言指令生成高分辨率、逼真的图像。Infinity通过无限词汇量的标记器、分类器和位自纠正机制,显著提升... Ai项目 2周前5,3350
TIP-I2V – 超170万大规模真实文本和图像提示数据集 TIP-I2V是什么 TIP-I2V是大规模真实文V本和图像提示数据集,用在图像到视频生成领域。TIP-I2V包含超过170万独特的用户文本和图像提示,及五种SOTA图生视频模型生成的相应视频。数据集... Ai项目 2周前5,3300
ViewExtrapolator – 南洋理工联合UCAS团队推出的新型视图合成方法 ViewExtrapolator是什么 ViewExtrapolator是南洋理工大学、UCAS研究团队共同推出的新视角外推方法,基于稳定视频扩散(Stable Video Diffusion, SV... Ai项目 2周前5,3300
PSHuman – 开源的单图像3D人像重建技术,仅需一张照片 PSHuman是什么 PSHuman是先进的单图像3D人像重建技术。基于跨尺度多视图扩散模型,仅需一张照片,能生成高度逼真的3D人像模型,包括精细的面部表情和全身姿态。核心优势在于能同时建模全局形状和... Ai项目 2周前5,3300
DITTO-2 – Adobe 联合加大推出的音乐生成模型 DITTO-2是什么 DITTO-2 是 Adobe 和加州大学研究人员联合推出的新型音乐生成模型,通过优化扩散模型的推理时间,实现快速且可控的音乐生成。模型基于扩散模型的推理时间优化(Inferen... Ai项目 2周前5,3250
AingDesk – 开源AI客户端工具,一键部署上百款 AI 模型到个人电脑 AingDesk是什么 AingDesk 是开源的客户端软件,帮助用户快速将上百款 AI 模型部署到个人电脑上。通过一键部署功能,简化复杂的模型安装过程,没有技术背景的用户也能轻松上手。AingDes... Ai项目 12个月前05,3250