AgiBot World – 智元机器人开源的百万真机数据集 AgiBot World是什么 AgiBot World是智元机器人开源的百万真机数据集,旨在推动具身智能的发展。数据集包含八十余种日常技能,覆盖家居、餐饮、工业等五大核心场景,数据规模和质量远超谷歌... Ai项目 2周前4,6300
StereoCrafter – 腾讯开源将任意2D视频转为立体3D视频的框架 StereoCrafter是什么 StereoCrafter是腾讯AI Lab和ARC Lab共同推出的创新框架,能将单目视频(2D视频)转换为立体3D视频,满足日益增长的3D内容需求。StereoC... Ai项目 2周前4,6600
Large Motion Model – 商汤科技联合南洋理工推出的统一多模态运动生成模型 Large Motion Model是什么 Large Motion Model(LMM)是统一的多模态运动生成模型,是新加坡南洋理工大学S-Lab和商汤科技研究团队共同推出的。LMM能处理包括文本到... Ai项目 2周前5,1650
VideoPhy – UCLA 联合谷歌推出评估视频生成模型物理常识能力的基准测试 VideoPhy是什么 VideoPhy是UCLA和谷歌研究研究院联合推出的,首个评估视频生成模型物理常识能力的基准测试,能衡量模型生成的视频是否遵循现实世界的物理规则。VideoPhy基准包含688... Ai项目 2周前5,0900
DynamicControl – 腾讯优图联合南洋理工等机构推出的动态条件控制图像生成新框架 DynamicControl是什么 DynamicControl是腾讯优图联合南洋理工、浙大等研究机构推出的集成多模态大语言模型(MLLM)推理能力的文本生成图像(T2I)任务新框架。DynamicC... Ai项目 2周前4,9700
琅琊 – 中国科学院海洋研究所自主研发的海洋大模型1.0版本 琅琊是什么 琅琊是中国科学院海洋研究所自主研发的新一代海洋人工智能大模型1.0版本,专注于海洋状态变量预报。模型结合了先进的人工智能算法和专业的海洋科学知识,能实现对全球海洋状态变量的中短期高精度预报... Ai项目 2周前4,3950
Mind GPT-3o – 理想汽车推出的多模态端到端大模型 Mind GPT-3o是什么 Mind GPT-3o是理想汽车推出的多模态端到端大模型,融合语音、视觉和语言理解技术,实现高效实时交互。Mind GPT-3o具备记忆、规划、工具使用和表达能力,能提升... Ai项目 2周前5,0150
Qwen-Agent – 阿里通义开源的 Agent 应用开发框架 Qwen-Agent是什么 Qwen-Agent是基于通义千问模型(Qwen)的开源Agent开发框架,支持开发者用Qwen模型的指令遵循、工具使用、规划和记忆能力构建智能代理应用。Qwen-Agen... Ai项目 2周前4,6550
LowCodeEngine – 阿里开源的低代码开发框架 LowCodeEngine是什么 LowCodeEngine是阿里巴巴开源的低代码开发框架,基于提供拖拽、配置等简单操作,让开发者快速构建复杂的系统页面。框架以强大的定制能力、优雅的开发体验、丰富的A... Ai项目 2周前6,0750
SPAR – 智谱团队推出的自我博弈训练框架 SPAR是什么 SPAR是智谱团队推出的自我博弈框架,能增强大型语言模型在遵循指令方面的能力。框架基于内部的生成者和完善者两个角色进行互动,生成者执行指令生成回复,完善者对回复进行分析和改进。SPAR... Ai项目 2周前4,8600