Add-it – 英伟达推出无需训练的图像编辑技术

Add-it是什么 Add-it是NVIDIA推出的无需训练的图像编辑技术,能根据文本指令在图像中添加对象。这项技术基于扩展扩散模型的注意力机制,整合场景图像、文本提示和生成图像的信息,实现结构一致性...
4天前
150

DINO-X – IDEA 研究院推出的通用视觉大模型

DINO-X是什么 DINO-X是IDEA研究院推出的通用视觉大模型,具备开放世界对象检测与理解能力。支持文本、视觉和定制提示,能识别图像中的任何对象而无需用户提示。基于超过1亿样本的Groundin...
4天前
1400