The Matrix – 阿里联合港大等多所机构推出的AI基础世界模拟器 The Matrix是什么 The Matrix是与电影同名的首个AI基础世界模拟器,是全华人团队推出的(作者分别来自阿里巴巴、香港大学、滑铁卢大学和加拿大AI研究机构Vector Insititut... Ai项目 4天前2450
DreamPolish – 智谱AI、清华、北大联合推出的文本到3D生成模型 DreamPolish是什么 DreamPolish是智谱 AI、清华大学和北京大学推出的文本到3D生成模型,基于两阶段方法改进复杂对象的精细几何结构和高质量纹理的生成。第一阶段用多种神经表示逐步细化... Ai项目 4天前2450
OmniBooth – 华为诺亚方舟联合港科大推出的图像生成框架 OmniBooth是什么 OmniBooth是华为诺亚方舟实验室和港科大研究团队共同推出的图像生成框架,支持基于文本提示或图像参考进行空间控制和实例级定制。框架用用户定义的掩码和相关联的文本或图像指导... Ai项目 4天前1100
DynaMem – 纽约大学和Hello Robot推出的动态空间语义记忆系统 DynaMem是什么 DynaMem是纽约大学和Hello Robot推出的动态空间语义记忆系统,专为开放世界中的移动操作设计。基于维护一个特征点云作为机器人记忆,处理环境中的动态变化,如物体的添加和... Ai项目 4天前1350
MVPaint – 腾讯PCG联合多所高校共同推出的3D纹理生成框架 MVPaint是什么 MVPaint是腾讯PCG 、上海AI LAB、南洋理工大学S-Lab、清华大学共同推出的3D纹理生成框架,基于同步多视角扩散技术实现高分辨率、无缝且多视图一致的3D纹理生成。M... Ai项目 4天前1250
LTX Video – Lightricks推出的开源AI视频生成模型 LTX Video是什么 LTX Video是Lightricks推出的开源AI视频生成模型,能在4秒内生成5秒的高质量视频,速度超过观看速度。基于2亿参数的DiT架构,确保帧间平滑运动和结构一致性... Ai项目 4天前2100
BALROG – 基准测试工具,用于评估LLMs和VLMs在复杂动态环境中的推理能力 BALROG是什么 BALROG是评估大型语言模型(LLMs)和视觉语言模型(VLMs)在游戏上的推理能力,特别是模型在动态环境中的规划、空间推理和探索能力。基于一系列挑战性的游戏环境,包括程序生成的... Ai项目 4天前1600
AutoVFX – 自然语言驱动的视频特效编辑框架 AutoVFX是什么 AutoVFX是先进的物理特效框架,是伊利诺伊大学香槟分校研究团队推出的,能根据自然语言指令自动创建真实感和动态的视觉特效(VFX)视频。框架集成神经场景建模、基于大型语言模型... Ai项目 4天前2500
Markdown-to-Image – 开源的在线 Markdown 转海报编辑器 Markdown-to-Image是什么 Markdown-to-Image是开源的Markdown 转海报编辑器,作为React组件能将Markdown文本内容转换成图像,适用于创建社交媒体帖子、海... Ai项目 4天前1550
TÜLU 3 – Ai2 推出的系列开源指令遵循模型 TÜLU 3是什么 TÜLU 3是艾伦人工智能研究所(Ai2)推出的一系列开源指令遵循模型,包括8B和70B两个版本,未来计划推出405B版本。模型在性能上超越Llama 3.1 Instruct版本... Ai项目 4天前1500