PartEdit – KAUST推出的细粒度图像编辑方法

PartEdit是什么 PartEdit是KAUST推出基于预训练扩散模型的细粒度图像编辑方法。PartEdit基于优化特定的文本标记(称为“部分标记”),让扩散模型精准定位和编辑图像中对象的各个部分...
12个月前
04,7900

Ola – 清华联合腾讯等推出的全模态语言模型

Ola是什么 Ola是清华大学、腾讯 Hunyuan 研究团队和新加坡国立大学 S-Lab 合作开发的全模态语言模型。通过渐进式模态对齐策略,逐步扩展语言模型支持的模态,从图像和文本开始,再引入语音和...
12个月前
05,0200

Hibiki – Kyutai Labs 推出的实时语音翻译模型

Hibiki是什么 Hibiki是Kyutai Labs开源的用在同时语音翻译的解码器模型,能实时将一种语言的语音翻译成另一种语言的语音或文本。Hibiki基于多流语言模型架构,同步处理源语音和目标语...
12个月前
04,5800