Bamba-9B – 基于 Mamba2 架构的仅解码语言模型

Bamba-9B是什么 Bamba-9B是IBM、普林斯顿大学、卡内基梅隆大学和伊利诺伊大学香槟分校联合推出的,基于Mamba2架构的仅解码语言模型模型。模型在完全开放的数据集上训练,能提高大型语言模...
2周前
5,6800