SpatialLM – 群核科技开源的空间理解多模态模型 SpatialLM是什么 SpatialLM 是群核科技开源的空间理解多模态模型,赋予机器人和智能系统类似人类的空间认知能力。通过分析普通手机拍摄的视频,能重建出详细的 3D 场景布局,标注出房间结构... Ai项目 5个月前02,4150
MiniMax MCP Server – MiniMax 推出基于 MCP 的多模态生成服务器 MiniMax MCP Server是什么 MiniMax MCP Server 是 MiniMax 稀宇科技推出的基于模型上下文协议(MCP)的多模态生成服务器。通过简单的文本输入,可调用视频生成... Ai项目 5个月前02,4150
Open Code Reasoning – 英伟达开源的代码推理AI模型 Open Code Reasoning是什么 Open Code Reasoning(OCR)是英伟达开源的代码推理AI模型,基于Nemotron架构,专为提升代码推理和生成能力设计。OCR包含32B... Ai项目 4个月前2,4100
OmniBooth – 华为诺亚方舟联合港科大推出的图像生成框架 OmniBooth是什么 OmniBooth是华为诺亚方舟实验室和港科大研究团队共同推出的图像生成框架,支持基于文本提示或图像参考进行空间控制和实例级定制。框架用用户定义的掩码和相关联的文本或图像指导... Ai项目 5个月前2,4100
Whisper Input – 开源AI语音输入工具,支持多语言实时转录和翻译 Whisper Input是什么 Whisper Input 是开源的语音输入工具,基于 Python 和 OpenAI 的 Whisper 模型开发。通过简单的快捷键操作(如按下 Option 键开... Ai项目 5个月前2,4100
Soundwave – 港中文深圳开源的语音理解大模型 Soundwave是什么 Soundwave是香港中文大学(深圳)开源的语音理解大模型,专注于语音与文本的智能对齐和理解。通过创新的对齐适配器和压缩适配器技术,有效解决了语音和文本在表示空间上的差异... Ai项目 5个月前02,4100
RuoYi AI – 全栈式 AI 开发平台,快速搭建个性化 AI 应用 RuoYi AI是什么 RuoYi AI 是全栈式 AI 开发平台,提供完整的前端、后台管理及小程序应用,支持灵活修改和分发代码。RuoYi AI 支持本地 RAG 方案,集成 Milvus/Weav... Ai项目 5个月前02,4100
瀚海智语 – 海洋垂直领域大模型,基于360 智脑和 DeepSeek 研发 瀚海智语是什么 瀚海智语(OceanDS)是国家海洋环境预报中心联合海洋出版社和三六零数字安全科技共同推出的国内首个海洋垂直领域大语言模型,模型以360智脑13B和Deepseek-R1-70B大模型... Ai项目 5个月前02,4100
OmniSQL – 开源文本到 SQL 模型,自然语言转换为 SQL 查询语句 OmniSQL是什么 OmniSQL 是开源的文本到 SQL 模型,将自然语言问题高效转换为 SQL 查询语句。通过创新的数据合成框架生成了首个百万量级的文本到 SQL 数据集 SynSQL-2.5M... Ai项目 5个月前02,4100
Cua – 专为 MacOS 推出的开源 AI Agent项目 Cua是什么 Cua 是 trycua 团队推出的开源AI Agent项目,为 macOS 用户提供高性能的虚拟化和 AI 代理功能。Cua基于苹果的 Virtualization.Framework... Ai项目 5个月前02,4100