ebook2audiobookXTTS – 开源电子书转有声书 AI 工具,支持16种语言 ebook2audiobookXTTS是什么 ebook2audiobookXTTS是开源的AI工具,能将电子书转换为有声书。ebook2audiobookXTTS支持多种电子书格式,如epub、pd... Ai项目 2周前5,2050
MiniRAG – 港大推出高效部署小语言模型的新型 RAG 系统 MiniRAG是什么 MiniRAG是香港大学推出的新型检索增强型生成(RAG)系统,专为在资源受限的场景下高效部署小型语言模型(SLMs)设计。MiniRAG基于两个关键技术实现这一目标:一是语义感... Ai项目 2周前5,2050
EasyControl Ghibli – 免费生成吉卜力风格图像的 AI 模型 EasyControl Ghibli是什么 EasyControl Ghibli 是基于 EasyControl 框架开发的 AI 模型,已上线 Hugging Face 平台,专注于将普通图像转换为... Ai项目 12个月前05,2050
PDF to Podcast – 英伟达推出的 PDF 转音频内容 AI 工具 PDF to Podcast是什么 PDF to Podcast是NVIDIA推出的PDF转音频的AI工具,基于NVIDIA NIM微服务架构的,能将PDF文档转换为生动的音频内容,如播客。基于大型语... Ai项目 12个月前05,2000
VidSketch – 浙江大学推出的视频动画生成框架 VidSketch是什么 VidSketch 是浙江大学 CAD&CG 国家重点实验室和软件学院推出的创新视频生成框架,根据手绘草图和简单文本提示生成高质量的视频动画。VidSketch基于... Ai项目 12个月前05,2000
Open Code Reasoning – 英伟达开源的代码推理AI模型 Open Code Reasoning是什么 Open Code Reasoning(OCR)是英伟达开源的代码推理AI模型,基于Nemotron架构,专为提升代码推理和生成能力设计。OCR包含32B... Ai项目 2周前5,1900
AutoDroid-V2 – 清华推出的移动端GUI自动化脚本代理 AutoDroid-V2是什么 AutoDroid-V2是清华大学人工智能产业研究院推出的基于小型语言模型(SLM)的移动端GUI自动化脚本代理,能基于代码生成技术提升设备上的GUI代理性能。Auto... Ai项目 2周前5,1900
Baichuan-Omni-1.5 – 百川智能开源的全模态理解模型 Baichuan-Omni-1.5是什么 Baichuan-Omni-1.5是百川智能开源的全模态模型。支持文本、图像、音频和视频的全模态理解,具备文本和音频的双模态生成能力。模型在视觉、语音及多模态... Ai项目 2周前5,1900
Moonlight-16B-A3B – 月之暗面开源的 MoE 模型 Moonlight-16B-A3B是什么 Moonlight-16B-A3B 是 Moonshot AI 推出的新型 Mixture-of-Expert (MoE) 模型,具有 160 亿总参数和 3... Ai项目 12个月前05,1900
PodAgent – 港中文、微软、小红书联合推出的播客生成框架 PodAgent是什么 PodAgent 是香港中文大学、微软和小红书联合推出的播客生成框架。基于模拟真实的脱口秀场景,用多智能体协作系统(包括主持人、嘉宾和编剧)自动生成丰富且结构化的对话内容。Po... Ai项目 12个月前05,1900