Ai项目 | AI工具导航 | 前沿AI技术资源 | AGI导航 | ChatGPT插件 | RPA自动化 | 智能体 | AGI工具 | AI硬件 | 第59页

ebook2audiobookXTTS – 开源电子书转有声书 AI 工具，支持16种语言

ebook2audiobookXTTS是什么 ebook2audiobookXTTS是开源的AI工具，能将电子书转换为有声书。ebook2audiobookXTTS支持多种电子书格式，如epub、pd...

Ai项目

2周前

5,2050

MiniRAG – 港大推出高效部署小语言模型的新型 RAG 系统

MiniRAG是什么 MiniRAG是香港大学推出的新型检索增强型生成（RAG）系统，专为在资源受限的场景下高效部署小型语言模型（SLMs）设计。MiniRAG基于两个关键技术实现这一目标：一是语义感...

Ai项目

2周前

5,2050

EasyControl Ghibli – 免费生成吉卜力风格图像的 AI 模型

EasyControl Ghibli是什么 EasyControl Ghibli 是基于 EasyControl 框架开发的 AI 模型，已上线 Hugging Face 平台，专注于将普通图像转换为...

Ai项目

12个月前

05,2050

PDF to Podcast – 英伟达推出的 PDF 转音频内容 AI 工具

PDF to Podcast是什么 PDF to Podcast是NVIDIA推出的PDF转音频的AI工具，基于NVIDIA NIM微服务架构的，能将PDF文档转换为生动的音频内容，如播客。基于大型语...

Ai项目

12个月前

05,2000

VidSketch – 浙江大学推出的视频动画生成框架

VidSketch是什么 VidSketch 是浙江大学 CAD&CG 国家重点实验室和软件学院推出的创新视频生成框架，根据手绘草图和简单文本提示生成高质量的视频动画。VidSketch基于...

Ai项目

12个月前

05,2000

Open Code Reasoning – 英伟达开源的代码推理AI模型

Open Code Reasoning是什么 Open Code Reasoning（OCR）是英伟达开源的代码推理AI模型，基于Nemotron架构，专为提升代码推理和生成能力设计。OCR包含32B...

Ai项目

2周前

5,1900

AutoDroid-V2 – 清华推出的移动端GUI自动化脚本代理

AutoDroid-V2是什么 AutoDroid-V2是清华大学人工智能产业研究院推出的基于小型语言模型（SLM）的移动端GUI自动化脚本代理，能基于代码生成技术提升设备上的GUI代理性能。Auto...

Ai项目

2周前

5,1900

Baichuan-Omni-1.5 – 百川智能开源的全模态理解模型

Baichuan-Omni-1.5是什么 Baichuan-Omni-1.5是百川智能开源的全模态模型。支持文本、图像、音频和视频的全模态理解，具备文本和音频的双模态生成能力。模型在视觉、语音及多模态...

Ai项目

2周前

5,1900

Moonlight-16B-A3B – 月之暗面开源的 MoE 模型

Moonlight-16B-A3B是什么 Moonlight-16B-A3B 是 Moonshot AI 推出的新型 Mixture-of-Expert (MoE) 模型，具有 160 亿总参数和 3...

Ai项目

12个月前

05,1900

PodAgent – 港中文、微软、小红书联合推出的播客生成框架

PodAgent是什么 PodAgent 是香港中文大学、微软和小红书联合推出的播客生成框架。基于模拟真实的脱口秀场景，用多智能体协作系统（包括主持人、嘉宾和编剧）自动生成丰富且结构化的对话内容。Po...

Ai项目

12个月前

05,1900