BAGEL – 字节跳动开源的多模态基础模型

BAGEL是什么 BAGEL是字节跳动开源的多模态基础模型,拥有140亿参数,其中70亿为活跃参数。采用混合变换器专家架构(MoT),通过两个独立编码器分别捕捉图像的像素级和语义级特征。BAGEL遵循...
2周前
6,9550

Imagen 4 – 谷歌推出的最新图像生成AI模型

Imagen 4是什么 Imagen 4是谷歌发布的最新图像生成AI模型。支持高达2K分辨率的图像生成,细节呈现逼真,可清晰呈现复杂织物纹理、水滴折射及动物毛发质感等。在文本渲染方面,Imagen 4...
2周前
6,9350

Codex CLI – OpenAI 开源的AI编程智能体

Codex CLI是什么 Codex CLI 是 OpenAI 推出的轻量级AI编程智能体。Codex CLI基于自然语言指令帮助开发者高效生成代码、执行文件操作和进行版本控制。Codex CLI 支...
12个月前
06,9150