R1-Onevision – 开源多模态视觉推理模型,基于 Qwen2.5-VL 微调 R1-Onevision是什么 R1-Onevision 是开源的多模态大语言模型,专注于复杂视觉推理任务。基于 Qwen2.5-VL 微调而成,通过整合视觉和文本数据,能精准地进行多模态信息解释。在... Ai项目 12个月前05,8450
Vanna – 开源AI检索生成框架,自动生成精确的SQL查询 Vanna是什么 Vanna是开源的Python RAG(Retrieval-Augmented Generation)框架,能帮助用户基于大型语言模型(LLMs)为其数据库生成精确的SQL查询。Va... Ai项目 2周前5,8300
Bamba-9B – 基于 Mamba2 架构的仅解码语言模型 Bamba-9B是什么 Bamba-9B是IBM、普林斯顿大学、卡内基梅隆大学和伊利诺伊大学香槟分校联合推出的,基于Mamba2架构的仅解码语言模型模型。模型在完全开放的数据集上训练,能提高大型语言模... Ai项目 2周前5,8300
Oumi – 开源 AI 平台,支持 1000 万到 4050 亿参数模型训练 Oumi是什么 Oumi 是完全开源的 AI 平台,简化从数据准备、模型训练到评估和部署的整个生命周期。支持从 1000 万到 4050 亿参数的模型训练,涵盖文本和多模态模型(如 Llama、Qwe... Ai项目 12个月前5,8300
QVQ – 阿里通义开源的视觉推理模型 QVQ是什么 QVQ是阿里基于Qwen2-VL-72B构建的开源多模态推理模型,结合视觉理解和复杂问题解决能力,提升人工智能的认知能力。QVQ在视觉推理任务中展现出增强的能力,尤其在需要复杂分析思维的... Ai项目 2周前5,8050
SNOOPI – AI文本到图像生成框架,提升单步扩散模型的效率和性能 SNOOPI是什么 SNOOPI是创新的文本到图像生成框架,基于增强单步扩散模型的指导提升模型性能和控制力。SNOOPI包括PG-SB(适当指导 – SwiftBrush)和NASA(负向... Ai项目 2周前5,8000
3DV-TON – 阿里达摩院联合浙大等推出的视频虚拟试穿框架 3DV-TON是什么 3DV-TON(Textured 3D-Guided Consistent Video Try-on via Diffusion Models)是阿里巴巴达摩院、湖畔实验室和浙江... Ai项目 2周前5,7950
BEHAVIOR Robot Suite – 李飞飞团队开源的机器人家庭任务自动化框架 BEHAVIOR Robot Suite是什么 BEHAVIOR Robot Suite(BRS)是斯坦福大学李飞飞团队推出的用在学习全身操作完成日常家务任务的框架。基于分析家务活动,确定机器人需要具... Ai项目 12个月前05,7950
LangManus – AI自动化框架,多智能体协同完成复杂任务 LangManus是什么 LangManus 是 AI 自动化框架,基于分层多智能体系统设计。包含多种智能体,如协调员、规划员、研究员、程序员等,各司其职,协同完成复杂任务。框架支持多种开源语言模型... Ai项目 12个月前05,7900
Granite 4.0 Tiny Preview – IBM推出的语言模型 Granite 4.0 Tiny Preview是什么 Granite 4.0 Tiny Preview 是 IBM 推出的 Granite 4.0 语言模型家族中最小的模型的预览版本。Granite... Ai项目 2周前5,7850