GR00T N1 – 英伟达开源的人形机器人基础模型 GR00T N1是什么 GR00T N1 是英伟达推出的全球首个开源基础模型,专为通用人形机器人设计。基于多模态输入(如语言和图像)实现多样化环境中的操作任务。GR00T N1 基于大规模人形机器人数... Ai项目 5个月前03,4950
Dify-Plus – 基于 Dify 二次开发的企业级增强版项目 Dify-Plus是什么 Dify-Plus 是基于 Dify 二次开发的企业级增强版项目,集成基于 gin-vue-admin 的管理中心。Dify-Plus在 Dify 基础上新增用户额度、密钥额... Ai项目 5个月前03,4850
SurveyGO – 清华联合面壁智能开源的AI论文写作工具 SurveyGO是什么 SurveyGO(卷姬) 是清华联合面壁智能团队开源的AI论文写作工具。支持根据用户输入的论文主题和描述,快速生成结构清晰、内容丰富的综述文章,帮助科研人员和学生高效完成文献综... Ai项目 5个月前03,4800
Sky-T1 – NovaSky 开源的推理 AI 模型,可从零开始复现该模型 Sky-T1是什么 Sky-T1是加州大学伯克利分校Sky Computing实验室的研究团队NovaSky发布的开源推理AI模型,名为Sky-T1-32B-Preview。是首个开源推理模型,训练数... Ai项目 5个月前3,4750
AlphaQubit – 谷歌推出的量子错误解码器 AlphaQubit是什么 AlphaQubit是谷歌推出基于AI技术的量子错误解码器,用深度学习架构Transformers识别和纠正量子计算中的错误。AlphaQubit基于精确的误差识别,助力量... Ai项目 5个月前3,4700
PanoDreamer – 单张图像生成连贯360° 3D场景的新方法 PanoDreamer是什么 PanoDreamer是能够从单张图像生成连贯的360° 3D场景的新方法。这种方法不同于现有技术,它将问题构建为单图像全景和深度估计的两个优化任务,并引入交替最小化策略... Ai项目 5个月前3,4700
VisionFM – 通用眼科AI大模型,具备少样本多种疾病诊断能力 VisionFM是什么 VisionFM(伏羲慧眼)是多模态多任务的视觉基础模型,专为通用眼科人工智能而设计。通过预训练3.4百万张来自560,457个个体的眼科图像,覆盖广泛的眼科疾病、成像模态、设... Ai项目 5个月前3,4650
MV-MATH – 中科院推出的基准数据集,评估模型处理多视觉信息的数学推理能力 MV-MATH是什么 MV-MATH 是中科院自动化所提出的新基准数据集,评估多模态大语言模型(MLLMs)在多视觉场景中的数学推理能力。数据集包含2009个高质量的数学问题,每个问题都结合了多个图像... Ai项目 5个月前03,4600
Midscene.js – AI驱动的 UI 自动化测试框架 Midscene.js是什么 Midscene.js是基于AI技术的自动化SDK,通过用大型语言模型(LLM)简化UI自动化测试中的命令。用户用自然语言描述交互步骤或预期数据格式,Midscene.j... Ai项目 5个月前3,4400
食神 – 老板电器推出的首个烹饪大模型 食神是什么 食神是老板电器推出的首个烹饪垂直领域大模型。基于老板电器46年积累的海量烹饪数据,结合DeepSeek技术,能精准理解烹饪场景需求。用户可通过语音、文字等方式与“食神”交互,获取个性化菜谱... Ai项目 5个月前03,4400