Bamba-9B – 基于 Mamba2 架构的仅解码语言模型

Bamba-9B是什么 Bamba-9B是IBM、普林斯顿大学、卡内基梅隆大学和伊利诺伊大学香槟分校联合推出的,基于Mamba2架构的仅解码语言模型模型。模型在完全开放的数据集上训练,能提高大型语言模...
2周前
5,8300

QVQ – 阿里通义开源的视觉推理模型

QVQ是什么 QVQ是阿里基于Qwen2-VL-72B构建的开源多模态推理模型,结合视觉理解和复杂问题解决能力,提升人工智能的认知能力。QVQ在视觉推理任务中展现出增强的能力,尤其在需要复杂分析思维的...
2周前
5,8050