MinMo – 阿里通义实验室推出的多模态语音交互大模型 MinMo是什么 MinMo是阿里巴巴通义实验室FunAudioLLM团队推出的多模态大模型,专注于实现无缝语音交互。MinMo拥有约80亿参数,基于多阶段训练,在140万小时多样化语音数据和广泛语音... Ai项目 2周前5,3150
Kokoro-TTS – 轻量级文本转语音模型,支持多语言多语音风格生成 Kokoro-TTS是什么 Kokoro-TTS 是 hexgrad 开发的轻量级文本转语音(TTS)模型,具有 8200 万参数。基于 StyleTTS 2 和 ISTFTNet 的混合架构,采用纯... Ai项目 2周前5,3150
AgentSociety – 清华大学推出的社会模拟器 AgentSociety是什么 AgentSociety 是清华大学推出的基于大语言模型(LLM)的社会模拟器,通过构建具有“类人心智”的智能体来模拟复杂的社会行为和现象。结合社会学理论,赋予智能体情... Ai项目 12个月前05,3150
PaddleSpeech – 百度飞桨团队开源的语音处理工具 PaddleSpeech是什么 PaddleSpeech 是百度飞桨团队开源的语音处理工具,提供全面的语音处理功能,包括语音识别、语音合成、声纹识别、语音翻译等。PaddleSpeech提供命令行界面... Ai项目 12个月前05,3150
WorldMem – 南洋理工联合北大和上海 AI Lab 推出的世界生成模型 WorldMem是什么 WorldMem 是南洋理工大学、北京大学和上海 AI Lab 推出的创新 AI 世界生成模型。模型基于引入记忆机制,解决传统世界生成模型在长时序下缺乏一致性的关键问题。在Wo... Ai项目 2周前5,3100
ShowUI – 新加坡国立联合微软推出用于 GUI 自动化的视觉-语言-操作模型 ShowUI是什么 ShowUI是新加坡国立大学Show Lab和微软共同推出的视觉-语言-行动模型,能提升图形用户界面(GUI)助手的工作效率。模型基于UI引导的视觉令牌选择减少计算成本,用交错视觉... Ai项目 2周前5,3100
PromptWizard – 微软开源的 AI 提示词自动化优化框架 PromptWizard PromptWizard是微软推出的自动化提示优化框架,改进大型语言模型(LLMs)在特定任务中的表现。基于自我演变和自我适应机制,PromptWizard用反馈驱动的批评和... Ai项目 2周前5,3100
AutoGLM沉思 – 智谱推出首个免费、具备深度研究和操作能力的AI Agent AutoGLM沉思是什么 AutoGLM沉思是智谱推出的首个免费、具备深度研究和操作能力的AI Agent,能模拟人类思维过程,处理复杂的开放式问题。AutoGLM沉思具备强大的推理能力和自主操作能力... Ai项目 12个月前05,3100
DeepSite – 基于 DeepSeek 开源的 AI 前端开发工具 DeepSite是什么 DeepSite 是基于 DeepSeek-V3 模型的在线开发工具,用户无需配置环境或安装软件,在网页上直接输入需求,快速生成游戏、应用或网页的代码,支持实时预览效果。Dee... Ai项目 12个月前05,3050
Evolving Agents – 开源的AI Agent管理与进化框架 Evolving Agents是什么 Evolving Agents 是用在创建、管理和进化 AI 代理的生产级框架。Evolving Agents支持智能代理之间的通信和协作,根据语义理解需求、基于... Ai项目 12个月前05,3000