TripoSG – VAST AI 开源的高保真 3D 形状合成技术 TripoSG是什么 TripoSG 是 VAST-AI-Research 团队推出的基于大规模修正流(Rectified Flow, RF)模型的高保真 3D 形状合成技术, 通过大规模修正流变换器... Ai项目 1年前05,3400
TripoSF – VAST AI 开源的新一代 3D 基础模型 TripoSF是什么 TripoSF是VAST推出的新一代3D基础模型,突破传统3D建模在细节、复杂结构和扩展性上的瓶颈。采用SparseFlex表示方法,结合稀疏体素结构,仅在物体表面附近的区域存储... Ai项目 1年前05,1000
DistilQwen2.5-R1 – 阿里推出的小型系列深度推理模型 DistilQwen2.5-R1是什么 DistilQwen2.5-R1 是阿里巴巴推出的基于知识蒸馏技术的小型化系列深度推理模型,包含3B、7B、14B和32B四个参数量级的模型。DistilQwe... Ai项目 1年前06,3700
PaddleSpeech – 百度飞桨团队开源的语音处理工具 PaddleSpeech是什么 PaddleSpeech 是百度飞桨团队开源的语音处理工具,提供全面的语音处理功能,包括语音识别、语音合成、声纹识别、语音翻译等。PaddleSpeech提供命令行界面... Ai项目 1年前05,4550
ChatAnyone – 阿里通义推出的实时风格化肖像视频生成框架 ChatAnyone是什么 ChatAnyone是阿里巴巴通义实验室推出的实时风格化肖像视频生成框架。通过音频输入,生成具有丰富表情和上半身动作的肖像视频。采用高效分层运动扩散模型和混合控制融合生成模... Ai项目 1年前04,5100
Math24o – SuperCLUE 开源的高中奥林匹克数学竞赛推理测评基准 Math24o是什么 Math24o 是中文大模型测评基准 SuperCLUE 开源的高中奥林匹克数学竞赛级别的数学推理测评基准。主要用于评估大型语言模型在数学推理方面的能力。使用2024年全国高中数... Ai项目 1年前06,0050
RoboBrain – 智源研究院开源的具身大脑模型 RoboBrain是什么 RoboBrain是智源研究院推出的开源具身大脑模型,推动单机智能迈向群体智能。由三个模块组成:用于任务规划的基座模型、用于可操作区域感知的A-LoRA模块和用于轨迹预测的T... Ai项目 1年前010,3500
RoboOS – 智源研究院推出的首个跨本体具身大小脑协作框架 RoboOS是什么 RoboOS是智源研究院推出的首个跨本体具身大小脑协作框架。基于“大脑-小脑”分层架构,具身大脑RoboBrain负责全局感知与决策,小脑技能库负责低延迟精准执行,跨机器人数据中枢... Ai项目 1年前06,5950
Vidu Q1 – 生数科技推出的高可控视频大模型 Vidu Q1是什么 Vidu Q1 是清华大学人工智能研究院副院长、生数科技创始人兼首席科学家朱军教授团队推出的高可控视频大模型。支持生成1080p高清视频,画质细腻,细节丰富,能满足5秒视频的生成... Ai项目 1年前05,1900
ObjectMover – 港大联合 Adobe 推出的新型图像编辑模型 ObjectMover是什么 ObjectMover 是香港大学和 Adobe Research 联合提出的新型图像编辑模型,解决图像中物体移动、插入和移除时出现的光照、阴影不协调以及物体失真等问题... Ai项目 1年前04,4700