DoraCycle – 新加坡国立大学推出多模态领域适应的统一生成模型 DoraCycle是什么 DoraCycle 是新加坡国立大学 Show Lab 推出多模态领域适应的统一生成模型,通过两个多模态循环(text-to-image-to-text 和 image-to... Ai项目 12个月前05,0200
IMAGPose – 南京理工大学推出姿态引导图像生成的统一框架 IMAGPose是什么 IMAGPose 是南京理工大学推出的用于人体姿态引导图像生成的统一条件框架。解决传统方法在姿态引导的人物图像生成中存在的局限性,如无法同时生成多个不同姿态的目标图像、从多视角... Ai项目 12个月前05,5300
Heygem – 硅基智能推出的开源数字人模型 Heygem是什么 Heygem 是硅基智能推出的开源数字人模型,专为 Windows 系统设计。基于先进的AI技术,仅需 1 秒视频或 1 张照片,能在 30 秒内完成数字人形象和声音克隆,在 60... Ai项目 12个月前04,9150
LanDiff – 浙大联合月之暗面推出的文本到视频生成混合框架 LanDiff是什么 LanDiff是用于高质量的文本到视频(T2V)生成的创新混合框架,结合了自回归语言模型(LLM)和扩散模型(Diffusion Model)的优势,通过粗到细的生成方式,有效克... Ai项目 12个月前05,7450
FoxBrain – 鸿海研究院推出的推理大语言模型 FoxBrain是什么 FoxBrain 是鸿海研究院推出的繁体中文大型语言模型(LLM),具有强大的推理能力。基于 Meta Llama 3.1 架构,拥有 70B 参数,专注于数学和逻辑推理领域... Ai项目 12个月前05,0100
COMET – 字节开源的通信优化系统 COMET是什么 COMET是字节跳动推出的针对Mixture-of-Experts(MoE)模型的优化系统,能解决分布式训练中通信开销过大的问题。基于细粒度的计算-通信重叠技术,COMET将通信与计... Ai项目 12个月前06,3600
VideoPainter – 港中文联合腾讯等机构推出的视频修复和编辑框架 VideoPainter是什么 VideoPainter 是香港中文大学、腾讯ARC Lab、东京大学、澳门大学等机构推出的视频修复和编辑框架,专门用在处理任意长度的视频内容。VideoPainter... Ai项目 12个月前05,0200
TrajectoryCrafter – 腾讯和港中文推出的单目视频自由运镜技术 TrajectoryCrafter是什么 TrajectoryCrafter 是腾讯PCG ARC Lab和香港中文大学推出的,用在单目视频的相机轨迹重定向方法,支持在后期自由调整视频的相机位置和角度... Ai项目 12个月前04,7350
LanPaint – 零训练 AI 图像修复工具 LanPaint是什么 LanPaint 是用在Stable Diffusion 模型的高质量图像修复工具,无需额外训练实现精准的图像修复和替换。LanPaint基于多轮迭代推理优化修复效果,支持无缝... Ai项目 12个月前05,0850
START – 阿里联合中科大推出的自学推理模型 START是什么 START(Self-Taught Reasoner with Tools)是阿里巴巴集团和中国科学技术大学推出的新型工具增强型推理模型,结合外部工具(如Python代码执行器)提升... Ai项目 12个月前05,0400