Add-it – 英伟达推出无需训练的图像编辑技术

Add-it是什么 Add-it是NVIDIA推出的无需训练的图像编辑技术,能根据文本指令在图像中添加对象。这项技术基于扩展扩散模型的注意力机制,整合场景图像、文本提示和生成图像的信息,实现结构一致性...
2个月前
1,1850

DINO-X – IDEA 研究院推出的通用视觉大模型

DINO-X是什么 DINO-X是IDEA研究院推出的通用视觉大模型,具备开放世界对象检测与理解能力。支持文本、视觉和定制提示,能识别图像中的任何对象而无需用户提示。基于超过1亿样本的Groundin...
2个月前
1,8600

AutoVFX – 自然语言驱动的视频特效编辑框架

AutoVFX是什么 AutoVFX是先进的物理特效框架,是伊利诺伊大学香槟分校研究团队推出的,能根据自然语言指令自动创建真实感和动态的视觉特效(VFX)视频。框架集成神经场景建模、基于大型语言模型...
2个月前
1,4200