Ai项目 | AI工具导航 | 前沿AI技术资源 | AGI导航 | ChatGPT插件 | RPA自动化 | 智能体 | AGI工具 | AI硬件 | 第115页

SpatialLM – 群核科技开源的空间理解多模态模型

SpatialLM是什么 SpatialLM 是群核科技开源的空间理解多模态模型，赋予机器人和智能系统类似人类的空间认知能力。通过分析普通手机拍摄的视频，能重建出详细的 3D 场景布局，标注出房间结构...

Ai项目

1年前

05,0250

Multi-Agent Orchestrator – 亚马逊开源的多智能体框架

Multi-Agent Orchestrator是什么 Multi-Agent Orchestrator 是用于管理和协调多个智能代理（Agent）的框架。通过分类器识别用户输入的意图，将请求分配给最...

Ai项目

1年前

05,4600

龙猫LongCat – 美团自主研发的生成式AI大模型

龙猫LongCat是什么 LongCat（龙猫）是美团自主研发的生成式AI大模型，通过人工智能技术提升公司内部工作效率和创新能力。模型具备强大的多模态能力，能处理文本、图像等多种数据类型，在生成任务上...

Ai项目

1年前

04,9100

食神 – 老板电器推出的首个烹饪大模型

食神是什么食神是老板电器推出的首个烹饪垂直领域大模型。基于老板电器46年积累的海量烹饪数据，结合DeepSeek技术，能精准理解烹饪场景需求。用户可通过语音、文字等方式与“食神”交互，获取个性化菜谱...

Ai项目

1年前

07,0200

Soundwave – 港中文深圳开源的语音理解大模型

Soundwave是什么 Soundwave是香港中文大学（深圳）开源的语音理解大模型，专注于语音与文本的智能对齐和理解。通过创新的对齐适配器和压缩适配器技术，有效解决了语音和文本在表示空间上的差异...

Ai项目

1年前

06,0000

Motia – AI Agent 开发框架，支持多种编程语言、一键部署智能体

Motia是什么 Motia 是专为软件工程师设计的 AI Agent 框架，简化 AI 智能体的开发、测试和部署过程。支持多种编程语言，如 Python、TypeScript 和 Ruby，开发者可...

Ai项目

1年前

04,0750

InfiniteYou – 字节跳动开源的身份保持图像生成框架

InfiniteYou是什么 InfiniteYou（InfU）是字节跳动智能创作团队推出的基于扩散变换器（Diffusion Transformers，如 FLUX）的身份保持图像生成框架。基于 I...

Ai项目

1年前

04,4400

RuoYi AI – 全栈式 AI 开发平台，快速搭建个性化 AI 应用

RuoYi AI是什么 RuoYi AI 是全栈式 AI 开发平台，提供完整的前端、后台管理及小程序应用，支持灵活修改和分发代码。RuoYi AI 支持本地 RAG 方案，集成 Milvus/Weav...

Ai项目

1年前

05,6300

MoshiVis – Kyutai 开源的多模态实时语音模型

MoshiVis是什么 MoshiVis 是 Kyutai 推出的开源多模态语音模型，基于 Moshi 实时对话语音模型开发，增加了视觉输入功能。能实现图像的自然、实时语音交互，将语音和视觉信息相结合...

Ai项目

1年前

06,2700

DeepMesh – 清华和南洋理工推出的 3D 网格生成框架

DeepMesh是什么 DeepMesh 是清华大学和南洋理工大学研究人员提出的 3D 网格生成框架，基于强化学习和自回归变换器生成高质量的 3D 网格。通过两项关键创新来优化网格生成：一是高效的预训...

Ai项目

1年前

04,5500