FlowiseAI – AI应用构建工具,拖拽可视化组件自定义LLM应用 FlowiseAI是什么 Flowise 是开源的低代码或无代码拖放工具,通过拖拽可视化组件,用户可以快速构建自定义的 LLM 应用程序。提供了一套易于使用的工具和组件,无需或仅需少量编码,用户能够快... Ai项目 5个月前3,1950
LlamaV-o1 – 多模态视觉推理模型,采用逐步推理学习方法解决复杂任务 LlamaV-o1是什么 LlamaV-o1是阿联酋穆罕默德·本·扎耶德人工智能大学等机构提出的新多模态视觉推理模型,提升大型语言模型的逐步视觉推理能力。引入视觉推理链基准测试VRC-Bench,包含... Ai项目 5个月前2,3350
Kokoro-TTS – 轻量级文本转语音模型,支持多语言多语音风格生成 Kokoro-TTS是什么 Kokoro-TTS 是 hexgrad 开发的轻量级文本转语音(TTS)模型,具有 8200 万参数。基于 StyleTTS 2 和 ISTFTNet 的混合架构,采用纯... Ai项目 5个月前2,6150
KHOJ – 开源 AI 个人化助手,一站式知识管理工具 KHOJ是什么 KHOJ是开源的个人化AI助手,帮助用户整合和检索知识。支持连接用户的在线和本地文档,如PDF、Markdown、纯文本、GitHub和Notion文件等,通过语义搜索功能,快速找到所... Ai项目 5个月前3,4500
Luma Ray2 – Luma AI 推出的最新视频生成模型 Luma Ray2是什么 Luma Ray2 是 Luma AI 推出的最新视频生成模型,Ray2 基于 Luma 新的多模态架构训练后展现出先进功能,该架构的计算能力是 Ray1 的 10 倍。能生... Ai项目 5个月前2,5200
RAIN – 视频流制作实时动画生成和真人表情移植解决方案 RAIN是什么 RAIN(Real-time Animation Of Infinite Video Stream)是创新的实时动画解决方案,基于消费级硬件,如单个RTX 4090 GPU,实现无限视... Ai项目 5个月前2,2300
Pipecat – 构建语音和多模态对话代理的开源框架 Pipecat是什么 Pipecat是开源的Python框架,专注于构建语音和多模态对话代理。基于内置的语音识别、文本转语音(TTS)和对话处理功能,简化AI服务的复杂协调、网络传输、音频处理和多模态... Ai项目 5个月前2,2400
RealtimeSTT – AI实时语音转文本库,自动检测说话的开始与结束 RealtimeSTT是什么 RealtimeSTT是开源的实时语音转文本库,专为低延迟应用设计。有强大的语音活动检测功能,可自动识别说话的开始与结束,通过WebRTCVAD和SileroVAD进行精... Ai项目 5个月前2,4600
Step R-mini – 阶跃星辰推出的 Step 系列首个推理模型 Step R-mini是什么 Step R-mini(全称Step Reasoner mini)是阶跃星辰推出的推理模型, 是 Step 系列模型家族的首个推理模型,擅长主动规划、尝试和反思,基于慢思... Ai项目 5个月前2,4950
GLM-Realtime – 智谱推出的端到端多模态模型 GLM-Realtime是什么 GLM-Realtime是智谱推出的全新端到端多模态模型,具备低延迟的视频理解与语音交互能力,特别融入清唱功能,让大模型在对话中能展现歌唱才能。模型支持长达2分钟的内容... Ai项目 5个月前1,8900