Kokoro-TTS – 轻量级文本转语音模型,支持多语言多语音风格生成 Kokoro-TTS是什么 Kokoro-TTS 是 hexgrad 开发的轻量级文本转语音(TTS)模型,具有 8200 万参数。基于 StyleTTS 2 和 ISTFTNet 的混合架构,采用纯... Ai项目 2周前5,1850
LlamaV-o1 – 多模态视觉推理模型,采用逐步推理学习方法解决复杂任务 LlamaV-o1是什么 LlamaV-o1是阿联酋穆罕默德·本·扎耶德人工智能大学等机构提出的新多模态视觉推理模型,提升大型语言模型的逐步视觉推理能力。引入视觉推理链基准测试VRC-Bench,包含... Ai项目 2周前5,1650
FlowiseAI – AI应用构建工具,拖拽可视化组件自定义LLM应用 FlowiseAI是什么 Flowise 是开源的低代码或无代码拖放工具,通过拖拽可视化组件,用户可以快速构建自定义的 LLM 应用程序。提供了一套易于使用的工具和组件,无需或仅需少量编码,用户能够快... Ai项目 2周前5,7150
MiniCPM-o 2.6 – 面壁智能开源的多模态大模型,性能媲美GPT-4o MiniCPM-o 2.6是什么 MiniCPM-o 2.6 是MiniCPM-o 系列最新、性能最佳的多模态大模型,具有 8B 参数量。MiniCPM-o 2.6在视觉、语音和多模态直播等多个领域表... Ai项目 2周前4,9400
moonshot-v1-vision-preview – 月之暗面推出的多模态图片理解模型 moonshot-v1-vision-preview是什么 moonshot-v1-vision-preview 是月之暗面推出的多模态图片理解模型,模型完善了 moonshot-v1 模型系列的多模... Ai项目 2周前4,3300
Titans – 谷歌推出的新型神经记忆架构 Titans是什么 Titans是谷歌推出的新型神经网络架构,能突破Transformer在处理长序列数据时的记忆瓶颈。Titans引入神经长期记忆模块,模拟人脑记忆机制,强化对意外事件的记忆能力。T... Ai项目 2周前4,7600
星火语音同传大模型 – 科大讯飞推出的端到端语音同传大模型 星火语音同传大模型是什么 星火语音同传大模型是科大讯飞于2025年1月15日发布的国内首个具备端到端语音同传能力的大模型。模型在内容完整度、信息准确度以及语言质量上均处于行业领先水平,超过谷歌Gemi... Ai项目 2周前5,1300
讯飞星火X1 – 科大讯飞推出的首个全国产深度推理大模型 讯飞星火X1是什么 讯飞星火X1是科大讯飞于2025年1月15日发布的国内首个基于全国产算力平台训练的具备深度思考和推理能力的大模型。在解题过程中更接近人类的“慢思考”方式,仅用更少的算力就实现了业界... Ai项目 2周前5,2750
MiniMax-01 – MiniMax开源的全新系列模型 MiniMax-01是什么 MiniMax-01是MiniMax推出的全新系列模型,包含基础语言大模型MiniMax-Text-01和视觉多模态大模型MiniMax-VL-01。MiniMax-01首... Ai项目 2周前5,1100
MinMo – 阿里通义实验室推出的多模态语音交互大模型 MinMo是什么 MinMo是阿里巴巴通义实验室FunAudioLLM团队推出的多模态大模型,专注于实现无缝语音交互。MinMo拥有约80亿参数,基于多阶段训练,在140万小时多样化语音数据和广泛语音... Ai项目 2周前5,1450