ACE – 阿里通义实验室推出的全能图像生成和编辑模型 ACE是什么 ACE(All-round Creator and Editor)是阿里巴巴集团Tongyi Lab推出的基于扩散变换器的全能图像生成和编辑模型。ACE引入长上下文条件单元(LCU)和统... Ai项目 5天前750
ViewExtrapolator – 南洋理工联合UCAS团队推出的新型视图合成方法 ViewExtrapolator是什么 ViewExtrapolator是南洋理工大学、UCAS研究团队共同推出的新视角外推方法,基于稳定视频扩散(Stable Video Diffusion, SV... Ai项目 5天前2200
OpenScholar – 华盛顿大学联合艾伦研究所开源的学术搜索工具 OpenScholar是什么 OpenScholar是华盛顿大学和艾伦AI研究所共同推出的检索增强型语言模型(LM),能帮助科学家基于检索和综合科学文献中的相关论文回答问题。系统用大规模的科学论文数据... Ai项目 5天前1500
SmolVLM – Hugging Face推出的轻量级视觉语言模型 SmolVLM是什么 SmolVLM是Hugging Face推出的轻量级视觉语言模型,专为设备端推理设计。以20亿参数量,实现了高效内存占用和快速处理速度。SmolVLM提供了三个版本以满足不同需求... Ai项目 5天前2200
OneDiffusion – 无缝支持双向图像合成和理解的开源扩散模型 OneDiffusion是什么 OneDiffusion是AI2推出的多功能大规模扩散模型,能无缝支持双向图像合成和理解,涵盖文本到图像生成、条件图像生成、图像理解等多种任务。基于将所有条件和目标图像... Ai项目 5天前1250
LongAlign – 港大推出的提升文本到图像扩散模型处理长文本对齐方法 LongAlign是什么 LongAlign是香港大学研究团队推出的文本到图像(T2I)扩散模型的改进方法,能提升长文本输入的对齐精度。LongAlign用段级编码技术,将长文本分割处理,适应编码模型... Ai项目 5天前2800
ebook2audiobookXTTS – 开源电子书转有声书 AI 工具,支持16种语言 ebook2audiobookXTTS是什么 ebook2audiobookXTTS是开源的AI工具,能将电子书转换为有声书。ebook2audiobookXTTS支持多种电子书格式,如epub、pd... Ai项目 5天前2550
Optima – 清华联合北邮推出优化通信效率和任务有效性的训练框架 Optima是什么 Optima是清华大学推出的优化基于大型语言模型(LLM)的多智能体系统(MAS)的框架。基于一个迭代的生成、排名、选择和训练范式,显著提高通信效率和任务效果。Optima平衡了任... Ai项目 5天前2300
MuCodec – 清华、腾讯AI、港中文共同推出的超低比特率音乐编解码器 MuCodec是什么 MuCodec是清华大学深圳国际研究生院、腾讯AI实验室和香港中文大学的研究人员共同推出的超低比特率音乐编解码器,能实现音乐的高效压缩与高保真重建。MuCodec基于MuEnco... Ai项目 5天前1450
Find3D – 加州理工学院推出的3D部件分割模型 Find3D是什么 Find3D是加州理工学院推出的3D部件分割模型,能根据任意文本查询分割任意对象的任何部分。Find3D用一个强大的数据引擎自动从互联网上的3D资产生成训练数据,并用对比训练方法训... Ai项目 5天前1250