PaddleSpeech – 百度飞桨团队开源的语音处理工具 PaddleSpeech是什么 PaddleSpeech 是百度飞桨团队开源的语音处理工具,提供全面的语音处理功能,包括语音识别、语音合成、声纹识别、语音翻译等。PaddleSpeech提供命令行界面... Ai项目 1年前05,4550
ChatAnyone – 阿里通义推出的实时风格化肖像视频生成框架 ChatAnyone是什么 ChatAnyone是阿里巴巴通义实验室推出的实时风格化肖像视频生成框架。通过音频输入,生成具有丰富表情和上半身动作的肖像视频。采用高效分层运动扩散模型和混合控制融合生成模... Ai项目 1年前04,5100
Math24o – SuperCLUE 开源的高中奥林匹克数学竞赛推理测评基准 Math24o是什么 Math24o 是中文大模型测评基准 SuperCLUE 开源的高中奥林匹克数学竞赛级别的数学推理测评基准。主要用于评估大型语言模型在数学推理方面的能力。使用2024年全国高中数... Ai项目 1年前06,0050
RoboBrain – 智源研究院开源的具身大脑模型 RoboBrain是什么 RoboBrain是智源研究院推出的开源具身大脑模型,推动单机智能迈向群体智能。由三个模块组成:用于任务规划的基座模型、用于可操作区域感知的A-LoRA模块和用于轨迹预测的T... Ai项目 1年前010,3500
RoboOS – 智源研究院推出的首个跨本体具身大小脑协作框架 RoboOS是什么 RoboOS是智源研究院推出的首个跨本体具身大小脑协作框架。基于“大脑-小脑”分层架构,具身大脑RoboBrain负责全局感知与决策,小脑技能库负责低延迟精准执行,跨机器人数据中枢... Ai项目 1年前06,5950
Vidu Q1 – 生数科技推出的高可控视频大模型 Vidu Q1是什么 Vidu Q1 是清华大学人工智能研究院副院长、生数科技创始人兼首席科学家朱军教授团队推出的高可控视频大模型。支持生成1080p高清视频,画质细腻,细节丰富,能满足5秒视频的生成... Ai项目 1年前05,1900
ObjectMover – 港大联合 Adobe 推出的新型图像编辑模型 ObjectMover是什么 ObjectMover 是香港大学和 Adobe Research 联合提出的新型图像编辑模型,解决图像中物体移动、插入和移除时出现的光照、阴影不协调以及物体失真等问题... Ai项目 1年前04,4700
PhysGen3D – 清华等高校联合推出的单图创建交互式 3D 场景 PhysGen3D是什么 PhysGen3D 是创新的框架,能将单张图像转换为交互式的 3D 场景,生成具有物理真实感的视频。结合了基于图像的几何和语义理解以及基于物理的模拟,通过从单张图像中推断物体... Ai项目 1年前05,3600
EmotiVoice – 网易有道开源的AI语音合成系统 EmotiVoice是什么 EmotiVoice是网易有道开源的多语言、多声音和提示控制的文本到语音(TTS)系统。EmotiVoice支持英语和中文,提供超过2000种声音,支持基于提示生成带有不同... Ai项目 1年前05,1900
Vibe Draw – AI 3D建模工具,涂鸦草图一键转为3D模型 Vibe Draw是什么 Vibe Draw是开源的 AI 3D建模工具,支持将用户在2D画布上绘制的涂鸦草图转化为精美的3D模型。用户能用文本提示或继续绘制迭代优化模型,一键导出为标准格式(.glT... Ai项目 1年前05,0300