PhysGen3D – 清华等高校联合推出的单图创建交互式 3D 场景 PhysGen3D是什么 PhysGen3D 是创新的框架,能将单张图像转换为交互式的 3D 场景,生成具有物理真实感的视频。结合了基于图像的几何和语义理解以及基于物理的模拟,通过从单张图像中推断物体... Ai项目 1年前05,3600
EmotiVoice – 网易有道开源的AI语音合成系统 EmotiVoice是什么 EmotiVoice是网易有道开源的多语言、多声音和提示控制的文本到语音(TTS)系统。EmotiVoice支持英语和中文,提供超过2000种声音,支持基于提示生成带有不同... Ai项目 1年前05,1900
Vibe Draw – AI 3D建模工具,涂鸦草图一键转为3D模型 Vibe Draw是什么 Vibe Draw是开源的 AI 3D建模工具,支持将用户在2D画布上绘制的涂鸦草图转化为精美的3D模型。用户能用文本提示或继续绘制迭代优化模型,一键导出为标准格式(.glT... Ai项目 1年前05,0300
OmniSQL – 开源文本到 SQL 模型,自然语言转换为 SQL 查询语句 OmniSQL是什么 OmniSQL 是开源的文本到 SQL 模型,将自然语言问题高效转换为 SQL 查询语句。通过创新的数据合成框架生成了首个百万量级的文本到 SQL 数据集 SynSQL-2.5M... Ai项目 1年前06,1500
MegaTTS 3 – 字节与浙江大学合作推出的零样本语音合成系统 MegaTTS 3是什么 MegaTTS 3是字节跳动与浙江大学合作推出的零样本文本到语音合成系统,采用轻量级扩散模型,参数量仅0.45B,能高效生成高质量语音。系统将语音分解为内容、音色、韵律等属性... Ai项目 1年前05,3400
AutoGLM沉思 – 智谱推出首个免费、具备深度研究和操作能力的AI Agent AutoGLM沉思是什么 AutoGLM沉思是智谱推出的首个免费、具备深度研究和操作能力的AI Agent,能模拟人类思维过程,处理复杂的开放式问题。AutoGLM沉思具备强大的推理能力和自主操作能力... Ai项目 1年前05,3200
cpmGO – 面壁智能推出的首个纯端侧汽车智能助手 cpmGO是什么 cpmGO (小钢炮超级助手)是面壁智能推出的全球首个纯端侧智能助手,专为汽车智能座舱设计。cpmGO 基于面壁小钢炮MiniCPM 端侧模型开发,具备视觉、语音、多模态交互、图形U... Ai项目 1年前04,0050
AReaL-boba – 蚂蚁联合清华开源的强化学习训练框架 AReaL-boba是什么 AReaL-boba 是蚂蚁技术研究院和清华大学联合推出的开源强化学习训练框架。AReaL-boba是 AReaL 的升级版本,降低了强化学习训练门槛,用户能轻松训练推理模... Ai项目 1年前04,5900
Qlib – 微软开源的金融 AI 量化投资工具 Qlib是什么 Qlib 是微软亚洲研究院推出的面向金融行业的AI量化投资工具,帮助量化研究者探索 AI 技术在投资领域的潜力。Qlib提供高性能的数据处理基础设施,支持从数据获取、模型训练到投资组合... Ai项目 1年前05,9850
OpenDeepSearch – AI搜索工具,支持深度网络搜索和信息检索 OpenDeepSearch是什么 OpenDeepSearch 是开源的深度搜索工具,基于开源推理模型和推理代理提升搜索性能,专为 Hugging Face 的 SmolAgents 无缝集成进行优... Ai项目 1年前06,1150