MultiBooth – 清华联合 Meta 等机构推出的多概念图像生成方法 MultiBooth是什么 MultiBooth是清华大学深圳国际研究生院、 Meta、香港科技大学等机构推出的多概念图像生成方法,能从文本中生成包含多个用户指定概念的图像。MultiBooth将生成... Ai项目 5个月前2,8650
Aria-UI – 港大联合 Rhymes AI 开源面向 GUI 智能交互的多模态模型 Aria-UI是什么 Aria-UI是香港大学和Rhymes AI共同推出的为图形用户界面(GUI)定位任务设计的大型多模态模型。基于纯视觉方法,不依赖于HTML或AXTree等辅助输入,用大规模、多... Ai项目 5个月前2,9400
TransPixar – 港中文联合 Adobe 等机构开源的生成透明背景视频技术 TransPixar是什么 TransPixar是香港中文大学、Adobe研究院 、香港科技大学和智能摩尔联合开源的,先进的文本到视频生成方法,扩展预训练的RGB视频模型生成包含透明度信息的RGBA视... Ai项目 5个月前2,1250
STAR – 南大、字节、西南大学联合开源的现实世界视频超分辨率框架 STAR是什么 STAR是南京大学、字节跳动、西南大学联合推出的,创新的现实世界视频超分辨率(VSR)框架,能从低分辨率(LR)视频生成高分辨率(HR)视频,同时保持细节清晰度和时间一致性。STAR整... Ai项目 5个月前2,3900
星火人设 – 科大讯飞推出的专为情感交互设计的独立模型 星火人设是什么 星火人设是科大讯飞推出的专为情感交互而设计的独立模型(角色模拟API),具备人物设定、剧情演绎与语言风格等控制选项,支持模型精调。在规模C端用户的双盲体验测试中,星火人设的效果已处于行... Ai项目 5个月前2,4800
万相2.1 – 通义万相最新推出的视频生成模型 万相2.1是什么 万相2.1是阿里推出的通义万相升级版本。基于自研的高效VAE和DiT架构,增强时空上下文建模能力,支持无限长1080P视频的高效编解码,首次实现中文文字视频生成功能。升级后的通义万相... Ai项目 5个月前3,5800
星火纪要 – 科大讯飞推出的会议交流总结和分析平台 星火纪要是什么 星火纪要是科大讯飞推出的集转录、总结、翻译、分析为一体的音视频处理平台,广泛应用于通用会议、访谈、销售、培训等场景。能帮助个人高效总结会议重点内容,提升工作学习效率;辅助企业从众多会议... Ai项目 5个月前2,7050
Hallo3 – 复旦联合百度开源的高动态与真实感肖像动画生成框架 Hallo3是什么 Hallo3是复旦大学和百度公司联合推出的,基于扩散变换器网络(Diffusion Transformer Networks)的肖像图像动画技术,能生成高度动态和逼真的视频。Hal... Ai项目 5个月前2,1800
rStar-Math – 微软推出的小模型复杂推理与自进化SLMs的创新技术 rStar-Math是什么 rStar-Math是微软亚洲研究院推出的创新研究项目,基于蒙特卡洛树搜索(MCTS)驱动的深度思考,使小型语言模型(SLMs)在数学推理方面达到甚至超越OpenAI大型模... Ai项目 5个月前2,4500
SPAR3D – Stability AI等机构推出的单试图重建 3D 网络模型 SPAR3D是什么 SPAR3D是Stability AI和伊利诺伊大学香槟分校推出的,先进的单图生成3D模型方法,能从单张图像中高效重建出高质量的3D对象。SPAR3D基于两阶段设计,第一阶段用点扩... Ai项目 5个月前3,2800