Ai项目 | AI工具导航 | 前沿AI技术资源 | AGI导航 | ChatGPT插件 | RPA自动化 | 智能体 | AGI工具 | AI硬件 | 第8页

UFO² – 微软推出的 Windows 桌面 Agent 操作系统

UFO²是什么 UFO² 是微软推出的面向 Windows 桌面的多Agent操作系统（AgentOS），基于深度系统集成和自然语言交互实现复杂桌面任务的自动化。UFO²基于中央 HostAgent ...

Ai项目

12个月前

07,0500

Qwen2.5-VL – 阿里通义千问开源的视觉语言模型

Qwen2.5-VL是什么 Qwen2.5-VL是阿里通义千问团队开源的旗舰视觉语言模型，具有3B、7B和72B三种不同规模。模型在视觉理解方面表现出色，能识别常见物体，分析图像中的文本、图表等元素...

Ai项目

2周前

7,0450

NobodyWho – AI游戏引擎插件，本地运行 LLM 实现互动小说创作

NobodyWho是什么 NobodyWho是为 Godot 游戏引擎设计的插件，通过本地运行的大型语言模型（LLM）实现互动小说创作。支持 Windows、Linux 和 macOS 平台，用户无需...

Ai项目

12个月前

07,0400

OpenMath-Nemotron – 英伟达开源的数学推理系列模型

OpenMath-Nemotron是什么 OpenMath-Nemotron是英伟达推出的系列开源数学推理模型，专门用在解决复杂数学问题，包括奥林匹克级别的难题。模型基于大规模数据集OpenMathR...

Ai项目

2周前

7,0100

MV-MATH – 中科院推出的基准数据集，评估模型处理多视觉信息的数学推理能力

MV-MATH是什么 MV-MATH 是中科院自动化所提出的新基准数据集，评估多模态大语言模型（MLLMs）在多视觉场景中的数学推理能力。数据集包含2009个高质量的数学问题，每个问题都结合了多个图像...

Ai项目

12个月前

06,9700

HunyuanCustom – 腾讯混元开源的多模态定制视频生成框架

HunyuanCustom是什么 HunyuanCustom是腾讯混元团队推出的多模态驱动的定制化视频生成框架。HunyuanCustom支持图像、音频、视频和文本等多种输入条件，支持生成具有特定主体...

Ai项目

2周前

6,9650

Instella – AMD开源的30亿参数系列语言模型

Instella是什么 Instella是AMD推出的系列30亿参数的开源语言模型。模型完全从零开始在AMD Instinct™ MI300X GPU上训练而成，基于自回归Transformer架构...

Ai项目

12个月前

06,9650

BAGEL – 字节跳动开源的多模态基础模型

BAGEL是什么 BAGEL是字节跳动开源的多模态基础模型，拥有140亿参数，其中70亿为活跃参数。采用混合变换器专家架构（MoT），通过两个独立编码器分别捕捉图像的像素级和语义级特征。BAGEL遵循...

Ai项目

2周前

6,9550

Imagen 4 – 谷歌推出的最新图像生成AI模型

Imagen 4是什么 Imagen 4是谷歌发布的最新图像生成AI模型。支持高达2K分辨率的图像生成，细节呈现逼真，可清晰呈现复杂织物纹理、水滴折射及动物毛发质感等。在文本渲染方面，Imagen 4...

Ai项目

2周前

6,9350

Codex CLI – OpenAI 开源的AI编程智能体

Codex CLI是什么 Codex CLI 是 OpenAI 推出的轻量级AI编程智能体。Codex CLI基于自然语言指令帮助开发者高效生成代码、执行文件操作和进行版本控制。Codex CLI 支...

Ai项目

12个月前

06,9150