SpatialLM – 群核科技开源的空间理解多模态模型 SpatialLM是什么 SpatialLM 是群核科技开源的空间理解多模态模型,赋予机器人和智能系统类似人类的空间认知能力。通过分析普通手机拍摄的视频,能重建出详细的 3D 场景布局,标注出房间结构... Ai项目 1年前05,0250
Multi-Agent Orchestrator – 亚马逊开源的多智能体框架 Multi-Agent Orchestrator是什么 Multi-Agent Orchestrator 是用于管理和协调多个智能代理(Agent)的框架。通过分类器识别用户输入的意图,将请求分配给最... Ai项目 1年前05,4600
龙猫LongCat – 美团自主研发的生成式AI大模型 龙猫LongCat是什么 LongCat(龙猫)是美团自主研发的生成式AI大模型,通过人工智能技术提升公司内部工作效率和创新能力。模型具备强大的多模态能力,能处理文本、图像等多种数据类型,在生成任务上... Ai项目 1年前04,9100
食神 – 老板电器推出的首个烹饪大模型 食神是什么 食神是老板电器推出的首个烹饪垂直领域大模型。基于老板电器46年积累的海量烹饪数据,结合DeepSeek技术,能精准理解烹饪场景需求。用户可通过语音、文字等方式与“食神”交互,获取个性化菜谱... Ai项目 1年前07,0200
Soundwave – 港中文深圳开源的语音理解大模型 Soundwave是什么 Soundwave是香港中文大学(深圳)开源的语音理解大模型,专注于语音与文本的智能对齐和理解。通过创新的对齐适配器和压缩适配器技术,有效解决了语音和文本在表示空间上的差异... Ai项目 1年前06,0000
Motia – AI Agent 开发框架,支持多种编程语言、一键部署智能体 Motia是什么 Motia 是专为软件工程师设计的 AI Agent 框架,简化 AI 智能体的开发、测试和部署过程。支持多种编程语言,如 Python、TypeScript 和 Ruby,开发者可... Ai项目 1年前04,0750
InfiniteYou – 字节跳动开源的身份保持图像生成框架 InfiniteYou是什么 InfiniteYou(InfU)是字节跳动智能创作团队推出的基于扩散变换器(Diffusion Transformers,如 FLUX)的身份保持图像生成框架。基于 I... Ai项目 1年前04,4400
RuoYi AI – 全栈式 AI 开发平台,快速搭建个性化 AI 应用 RuoYi AI是什么 RuoYi AI 是全栈式 AI 开发平台,提供完整的前端、后台管理及小程序应用,支持灵活修改和分发代码。RuoYi AI 支持本地 RAG 方案,集成 Milvus/Weav... Ai项目 1年前05,6300
MoshiVis – Kyutai 开源的多模态实时语音模型 MoshiVis是什么 MoshiVis 是 Kyutai 推出的开源多模态语音模型,基于 Moshi 实时对话语音模型开发,增加了视觉输入功能。能实现图像的自然、实时语音交互,将语音和视觉信息相结合... Ai项目 1年前06,2700
DeepMesh – 清华和南洋理工推出的 3D 网格生成框架 DeepMesh是什么 DeepMesh 是清华大学和南洋理工大学研究人员提出的 3D 网格生成框架,基于强化学习和自回归变换器生成高质量的 3D 网格。通过两项关键创新来优化网格生成:一是高效的预训... Ai项目 1年前04,5500