UFO² – 微软推出的 Windows 桌面 Agent 操作系统 UFO²是什么 UFO² 是微软推出的面向 Windows 桌面的多Agent操作系统(AgentOS),基于深度系统集成和自然语言交互实现复杂桌面任务的自动化。UFO²基于中央 HostAgent ... Ai项目 12个月前07,0500
Qwen2.5-VL – 阿里通义千问开源的视觉语言模型 Qwen2.5-VL是什么 Qwen2.5-VL是阿里通义千问团队开源的旗舰视觉语言模型,具有3B、7B和72B三种不同规模。模型在视觉理解方面表现出色,能识别常见物体,分析图像中的文本、图表等元素... Ai项目 2周前7,0450
NobodyWho – AI游戏引擎插件,本地运行 LLM 实现互动小说创作 NobodyWho是什么 NobodyWho是为 Godot 游戏引擎设计的插件,通过本地运行的大型语言模型(LLM)实现互动小说创作。支持 Windows、Linux 和 macOS 平台,用户无需... Ai项目 12个月前07,0400
OpenMath-Nemotron – 英伟达开源的数学推理系列模型 OpenMath-Nemotron是什么 OpenMath-Nemotron是英伟达推出的系列开源数学推理模型,专门用在解决复杂数学问题,包括奥林匹克级别的难题。模型基于大规模数据集OpenMathR... Ai项目 2周前7,0100
MV-MATH – 中科院推出的基准数据集,评估模型处理多视觉信息的数学推理能力 MV-MATH是什么 MV-MATH 是中科院自动化所提出的新基准数据集,评估多模态大语言模型(MLLMs)在多视觉场景中的数学推理能力。数据集包含2009个高质量的数学问题,每个问题都结合了多个图像... Ai项目 12个月前06,9700
HunyuanCustom – 腾讯混元开源的多模态定制视频生成框架 HunyuanCustom是什么 HunyuanCustom是腾讯混元团队推出的多模态驱动的定制化视频生成框架。HunyuanCustom支持图像、音频、视频和文本等多种输入条件,支持生成具有特定主体... Ai项目 2周前6,9650
Instella – AMD开源的30亿参数系列语言模型 Instella是什么 Instella是AMD推出的系列30亿参数的开源语言模型。模型完全从零开始在AMD Instinct™ MI300X GPU上训练而成,基于自回归Transformer架构... Ai项目 12个月前06,9650
BAGEL – 字节跳动开源的多模态基础模型 BAGEL是什么 BAGEL是字节跳动开源的多模态基础模型,拥有140亿参数,其中70亿为活跃参数。采用混合变换器专家架构(MoT),通过两个独立编码器分别捕捉图像的像素级和语义级特征。BAGEL遵循... Ai项目 2周前6,9550
Imagen 4 – 谷歌推出的最新图像生成AI模型 Imagen 4是什么 Imagen 4是谷歌发布的最新图像生成AI模型。支持高达2K分辨率的图像生成,细节呈现逼真,可清晰呈现复杂织物纹理、水滴折射及动物毛发质感等。在文本渲染方面,Imagen 4... Ai项目 2周前6,9350
Codex CLI – OpenAI 开源的AI编程智能体 Codex CLI是什么 Codex CLI 是 OpenAI 推出的轻量级AI编程智能体。Codex CLI基于自然语言指令帮助开发者高效生成代码、执行文件操作和进行版本控制。Codex CLI 支... Ai项目 12个月前06,9150