Ai项目 | AI工具导航 | 前沿AI技术资源 | AGI导航 | ChatGPT插件 | RPA自动化 | 智能体 | AGI工具 | AI硬件 | 第57页

Llama Nemotron – 英伟达推出的系列推理模型

Llama Nemotron是什么 Llama Nemotron是NVIDIA推出的一系列推理模型，专注于推理和多种智能代理（agentic AI）任务。模型基于Llama开源模型，经过NVIDIA的...

Ai项目

12个月前

05,2400

Audio-SDS – NVIDIA推出的扩展文本条件音频扩散模型

Audio-SDS是什么 Audio-SDS是NVIDIA AI研究团队推出的创新技术，将Score Distillation Sampling（SDS）技术扩展至文本条件音频扩散模型，为音频处理领域...

Ai项目

2周前

5,2350

UltraMem – 字节豆包大模型团队推出的全新超稀疏模型架构

UltraMem是什么 UltraMem 是字节跳动豆包大模型团队提出的全新超稀疏模型架构，解决传统 MoE 架构在推理时的高额访存问题。架构通过优化内存访问和计算效率，显著降低推理成本，推理速度较 ...

Ai项目

12个月前

05,2350

Scribe – ElevenLabs 推出的高精度语音转文本模型

Scribe是什么 Scribe 是 ElevenLabs 推出的高精度语音转文本模型，专为多语言和复杂音频环境设计。支持99种语言，英语和意大利语的转录准确率分别达到96.7%和98.7%，在小语种...

Ai项目

12个月前

05,2350

Open Computer Agent – Hugging Face 推出的免费云端 AI Agent 工具

Open Computer Agent是什么 Open Computer Agent 是 Hugging Face 推出的免费云端 AI Agent 工具。支持在 Linux 虚拟机中运行，基于预装的...

Ai项目

2周前

5,2300

Satori – 开源的大语言推理模型，具备自回归搜索和自我纠错能力

Satori是什么 Satori是 MIT、哈佛大学等机构研究者推出的 7B 参数的大型语言模型，专注于提升推理能力。基于Qwen-2.5-Math-7B，Satori通过小规模的格式微调和大规模的增...

Ai项目

12个月前

05,2300

FoloUp – 开源AI语音面试平台，自动生成定制化面试问题

FoloUp是什么 FoloUp 是开源的AI语音面试平台，能帮助企业高效地进行招聘面试。FoloUp能根据职位描述自动生成定制化的面试问题，基于AI技术与候选人进行自然、对话式的语音面试。平台能实时...

Ai项目

12个月前

05,2300

Morphik – 开源的多模态检索增强生成工具

Morphik是什么 Morphik 是开源的多模态检索增强生成（RAG）工具，专为处理高技术性和视觉内容丰富的文档设计。支持对图像、PDF、视频等多种格式的文档进行搜索，采用 ColPali 等技术...

Ai项目

2周前

5,2250

Project Mariner – 谷歌推出的浏览网站智能体，能帮用户操作表格、在线购物

Project Mariner是什么 Project Mariner 是谷歌 DeepMind 推出的浏览器助手。Project Mariner基于 Gemini 2.0 技术，用 Chrome 扩展...

Ai项目

2周前

5,2250

MultiBooth – 清华联合 Meta 等机构推出的多概念图像生成方法

MultiBooth是什么 MultiBooth是清华大学深圳国际研究生院、 Meta、香港科技大学等机构推出的多概念图像生成方法，能从文本中生成包含多个用户指定概念的图像。MultiBooth将生成...

Ai项目

2周前

5,2250