GeneMAN – 上海AI Lab联合北大等高校推出的3D人体模型创建框架 GeneMAN是什么 GeneMAN是上海AI实验室、北京大学、南洋理工大学、上海交通大学联合推出的3D人形创建框架,能从单张图片中创建出高保真度的3D人体模型。框架不依赖于参数化人体模型,是用多源高... Ai项目 2个月前1,7150
SPAR3D – Stability AI等机构推出的单试图重建 3D 网络模型 SPAR3D是什么 SPAR3D是Stability AI和伊利诺伊大学香槟分校推出的,先进的单图生成3D模型方法,能从单张图像中高效重建出高质量的3D对象。SPAR3D基于两阶段设计,第一阶段用点扩... Ai项目 2个月前1,7100
RoboBrain – 智源研究院开源的具身大脑模型 RoboBrain是什么 RoboBrain是智源研究院推出的开源具身大脑模型,推动单机智能迈向群体智能。由三个模块组成:用于任务规划的基座模型、用于可操作区域感知的A-LoRA模块和用于轨迹预测的T... Ai项目 2个月前01,7100
Kimi-VL – 月之暗面开源的轻量级多模态视觉语言模型 Kimi-VL是什么 Kimi-VL 是月之暗面开源的轻量级多模态视觉语言模型,基于轻量级MoE模型Moonlight(16B总参数,2.8B激活参数)和原生分辨率的MoonViT视觉编码器(400M... Ai项目 2个月前01,7100
Qwen2.5-VL – 阿里通义千问开源的视觉语言模型 Qwen2.5-VL是什么 Qwen2.5-VL是阿里通义千问团队开源的旗舰视觉语言模型,具有3B、7B和72B三种不同规模。模型在视觉理解方面表现出色,能识别常见物体,分析图像中的文本、图表等元素... Ai项目 2个月前1,7050
FlexIP – 腾讯推出的个性化图像生成编辑框架 FlexIP是什么 FlexIP 是腾讯提出的面向图像合成的灵活主体属性编辑框架,平衡图像生成中的身份保持和个性化编辑。框架采用双适配器架构,将身份保持与个性化编辑解耦,通过高层语义概念与低层空间细节... Ai项目 2个月前01,7000
Gemini 2.0 – 谷歌推出的原生多模态输入输出 + Agent 为核心的AI模型 Gemini 2.0是什么 Gemini 2.0是谷歌最新推出的原生多模态输入输出的AI模型。Gemini 2.0 Flash是2.0家族第一个模型,以多模态输入输出和Agent技术为核心,速度比 1... Ai项目 2个月前1,6950
混元图生视频 – 腾讯混元开源的图生视频模型 混元图生视频是什么 混元图生视频是腾讯混元推出的开源图生视频模型,用户可以通过上传一张图片进行简短描述,让图片动起来生成5秒的短视频。模型支持对口型、动作驱动和背景音效自动生成等功能。模型适用于写实... Ai项目 2个月前01,6900
SAM 2.1 – Meta 开源的视觉分割模型 SAM 2.1是什么 SAM 2.1(全称Segment Anything Model 2.1)是Meta(Facebook的母公司)推出的先进视觉分割模型,用于图像和视频。基于简单的Transfor... Ai项目 2个月前1,6850
LangGraph – 基于图结构构建与部署多代理动态工作流的开源框架 LangGraph是什么 LangGraph是为构建状态化、多智能体(Multi-Agent) 系统而设计的,特别是与大型语言模型(LLMs)一起使用时,用在创建代理和多代理工作流。作为 LangCh... Ai项目 2个月前1,6800