Ai项目 | AI工具导航 | 前沿AI技术资源 | AGI导航 | ChatGPT插件 | RPA自动化 | 智能体 | AGI工具 | AI硬件 | 第52页

MinMo – 阿里通义实验室推出的多模态语音交互大模型

MinMo是什么 MinMo是阿里巴巴通义实验室FunAudioLLM团队推出的多模态大模型，专注于实现无缝语音交互。MinMo拥有约80亿参数，基于多阶段训练，在140万小时多样化语音数据和广泛语音...

Ai项目

2周前

5,3150

Kokoro-TTS – 轻量级文本转语音模型，支持多语言多语音风格生成

Kokoro-TTS是什么 Kokoro-TTS 是 hexgrad 开发的轻量级文本转语音（TTS）模型，具有 8200 万参数。基于 StyleTTS 2 和 ISTFTNet 的混合架构，采用纯...

Ai项目

2周前

5,3150

AgentSociety – 清华大学推出的社会模拟器

AgentSociety是什么 AgentSociety 是清华大学推出的基于大语言模型（LLM）的社会模拟器，通过构建具有“类人心智”的智能体来模拟复杂的社会行为和现象。结合社会学理论，赋予智能体情...

Ai项目

12个月前

05,3150

PaddleSpeech – 百度飞桨团队开源的语音处理工具

PaddleSpeech是什么 PaddleSpeech 是百度飞桨团队开源的语音处理工具，提供全面的语音处理功能，包括语音识别、语音合成、声纹识别、语音翻译等。PaddleSpeech提供命令行界面...

Ai项目

12个月前

05,3150

WorldMem – 南洋理工联合北大和上海 AI Lab 推出的世界生成模型

WorldMem是什么 WorldMem 是南洋理工大学、北京大学和上海 AI Lab 推出的创新 AI 世界生成模型。模型基于引入记忆机制，解决传统世界生成模型在长时序下缺乏一致性的关键问题。在Wo...

Ai项目

2周前

5,3100

ShowUI – 新加坡国立联合微软推出用于 GUI 自动化的视觉-语言-操作模型

ShowUI是什么 ShowUI是新加坡国立大学Show Lab和微软共同推出的视觉-语言-行动模型，能提升图形用户界面（GUI）助手的工作效率。模型基于UI引导的视觉令牌选择减少计算成本，用交错视觉...

Ai项目

2周前

5,3100

PromptWizard – 微软开源的 AI 提示词自动化优化框架

PromptWizard PromptWizard是微软推出的自动化提示优化框架，改进大型语言模型（LLMs）在特定任务中的表现。基于自我演变和自我适应机制，PromptWizard用反馈驱动的批评和...

Ai项目

2周前

5,3100

AutoGLM沉思 – 智谱推出首个免费、具备深度研究和操作能力的AI Agent

AutoGLM沉思是什么 AutoGLM沉思是智谱推出的首个免费、具备深度研究和操作能力的AI Agent，能模拟人类思维过程，处理复杂的开放式问题。AutoGLM沉思具备强大的推理能力和自主操作能力...

Ai项目

12个月前

05,3100

DeepSite – 基于 DeepSeek 开源的 AI 前端开发工具

DeepSite是什么 DeepSite 是基于 DeepSeek-V3 模型的在线开发工具，用户无需配置环境或安装软件，在网页上直接输入需求，快速生成游戏、应用或网页的代码，支持实时预览效果。Dee...

Ai项目

12个月前

05,3050

Evolving Agents – 开源的AI Agent管理与进化框架

Evolving Agents是什么 Evolving Agents 是用在创建、管理和进化 AI 代理的生产级框架。Evolving Agents支持智能代理之间的通信和协作，根据语义理解需求、基于...

Ai项目

12个月前

05,3000