MatAnyone – 南洋理工和商汤科技推出的人像视频抠图框架 MatAnyone是什么 MatAnyone是南洋理工大学S-Lab实验室和商汤科技推出的,针对复杂背景人像视频抠图的先进框架,专注于目标指定的视频抠图任务。MatAnyone基于一致的内存传播模块和... Ai项目 12个月前4,7800
JoyGen – 京东和港大推出音频驱动的3D说话人脸视频生成框架 JoyGen是什么 JoyGen是京东科技和香港大学推出的,音频驱动的3D说话人脸视频生成框架,专注于实现精确的唇部与音频同步及高质量的视觉效果。JoyGen结合音频特征和面部深度图,驱动唇部运动的生... Ai项目 12个月前5,7850
EMAGE – 清华联合东大等机构推出的音频生成全身共语手势框架 EMAGE是什么 EMAGE(Expressive Masked Audio-conditioned GEsture modeling)是清华大学、东京大学、庆应义塾大学等机构推出的生成全身共语手势框... Ai项目 12个月前6,3550
LIMO – 上海交大推出的高效推理方法,仅需817条训练样本 LIMO是什么 LIMO(Less Is More for Reasoning)是上海交通大学研究团队提出的高效推理方法,通过极少量高质量的训练样本激活大语言模型(LLM)的复杂推理能力。核心假设是在... Ai项目 12个月前4,9350
SANA 1.5 – 英伟联合MIT、清北等机构推出的文生图新框架 SANA 1.5是什么 SANA 1.5是英伟达联合MIT、清华、北大等机构推出的新型高效的线性扩散变换器(Linear Diffusion Transformer),用于文本到图像生成任务。在 SA... Ai项目 12个月前4,8150
ASAP – 卡内基梅隆大学联合英伟达推出的模拟与真实物理对齐框架 ASAP是什么 ASAP(Aligning Simulation and Real Physics)是卡内基梅隆大学和英伟达联合推出的,用在解决仿人机器人模拟与现实动力学不匹配问题的两阶段框架。ASA... Ai项目 12个月前4,3350
MAETok – 港大联合北大等机构推出的自动编码器 MAETok是什么 MAETok(Masked Autoencoders Tokenizer)是卡内基梅隆大学、香港大学、北京大学等机构推出的扩散模型的新型图像标记化方法。MAETok基于掩码建模(M... Ai项目 12个月前5,0950
Eino – 字节跳动开源的大模型应用开发框架 Eino是什么 Eino 是字节跳动开源的大模型应用开发框架,能帮助开发者高效构建基于大模型的 AI 应用。Eino以 Go 语言为基础,具备稳定的内核、灵活的扩展性和完善的工具生态。Eino 的核心... Ai项目 12个月前4,9650
NutWorld – 新加坡国立、南洋理工和Skywork AI推出的视频处理框架 NutWorld是什么 NutWorld是新加坡国立大学、南洋理工大学和Skywork AI推出的视频处理框架,能将日常单目视频高效地转换为动态3D高斯表示(Gaussian Splatting)。N... Ai项目 12个月前6,0750
AstrBot – 开源多平台聊天机器人及开发框架 AstrBot是什么 AstrBot是多平台聊天机器人及开发框架,支持多种大语言模型(如 OpenAI GPT、Google Gemini、Llama 等)和多种消息平台(如 QQ、Telegram... Ai项目 12个月前4,6550