Ai项目 | AI工具导航 | 前沿AI技术资源 | AGI导航 | ChatGPT插件 | RPA自动化 | 智能体 | AGI工具 | AI硬件 | 第27页

ASAL – Sakana AI 联合 OpenAI 等推出使用基础模型搜索人工生命的系统

ASAL是什么 ASAL（Automated Search for Artificial Life）是用基础模型自动化搜索人工生命（ALife）的系统。ASAL是Sakana AI及MIT、OpenA...

Ai项目

2周前

5,6550

Midscene.js – AI驱动的 UI 自动化测试框架

Midscene.js是什么 Midscene.js是基于AI技术的自动化SDK，通过用大型语言模型（LLM）简化UI自动化测试中的命令。用户用自然语言描述交互步骤或预期数据格式，Midscene.j...

Ai项目

2周前

5,6200

PC Agent – 上海交大联合 GAIR 推出的电脑智能体AI系统

PC Agent是什么 PC Agent是上海交通大学和Generative AI Research Lab (GAIR)联合推出的先进AI系统。系统基于模拟人类认知过程，执行如组织研究材料、起草报告...

Ai项目

2周前

5,2500

Open Notebook – 开源 AI 笔记工具，自动将多格式笔记转换成博客

Open Notebook是什么 Open Notebook是开源、注重隐私的谷歌NotebookLM替代工具，能帮助用户管理研究工作流程，生成AI辅助笔记，并与内容互动。Open Notebook支...

Ai项目

2周前

5,7300

QVQ – 阿里通义开源的视觉推理模型

QVQ是什么 QVQ是阿里基于Qwen2-VL-72B构建的开源多模态推理模型，结合视觉理解和复杂问题解决能力，提升人工智能的认知能力。QVQ在视觉推理任务中展现出增强的能力，尤其在需要复杂分析思维的...

Ai项目

2周前

5,7950

DreamOmni – 港中文、字节等机构共同推出的统一图像生成和编辑模型

DreamOmni是什么 DreamOmni 是香港中文大学、字节跳动和香港科技大学共同推出的统一图像生成和编辑模型。模型整合文本到图像（T2I）生成和多种编辑任务，包括指令式编辑、修复、拖拽编辑和参...

Ai项目

2周前

4,9750

OmniAudio-2.6B – Nexa AI推出的端侧多模态音频语言模型

OmniAudio-2.6B是什么 OmniAudio-2.6B是Nexa AI推出的音频语言模型，专为边缘部署设计，能实现快速且高效的音频文本处理。OmniAudio-2.6B是具有2.6亿参数的多...

Ai项目

2周前

5,0000

Sketch2Sound – Adobe 联合西北大学推出的AI音频生成技术

Sketch2Sound是什么 Sketch2Sound是Adobe 研究院和西北大学推出的AI音频生成技术，能基于声音模仿和文本提示生成高品质音效。Sketch2Sound从声音模仿中提取响度、亮度...

Ai项目

2周前

4,4900

Granite 3.1 – IBM 推出的新版语言模型

Granite 3.1是什么 Granite 3.1是IBM推出的新一代语言模型，具有强大的性能和更长的上下文处理能力。Granite 3.1模型家族有 4 种不同的尺寸和 2 种架构：密集模型2B和...

Ai项目

2周前

4,8850

OCTAVE – Hume AI推出的语音语言模型

OCTAVE 是什么 OCTAVE（Omni-Capable Text and Voice Engine）是Hume AI推出的新一代语音语言模型，结合EVI 2模型和OpenAI、Elevenlab...

Ai项目

2周前

6,3400