Fugatto – 英伟达推出的多功能AI音频生成模型 Fugatto是什么 Fugatto是英伟达(NVIDIA)推出的音频合成和转换模型,全称为”Foundational Generative Audio Transformer Opus ... Ai项目 2个月前1,2200
LongRAG – 智谱联合清华和中科院推出的双视角鲁棒检索框架 LongRAG是什么 LongRAG是清华大学、中国科学院和智谱的研究团队推出的,面向长文本问答(LCQA)的双视角鲁棒检索增强生成(RAG)框架。基于混合检索器、LLM增强信息提取器、CoT引导过滤... Ai项目 2个月前1,5200
Illustrious – 开源文本到图像生成模型,专注于生成高质量动漫风格图像 Illustrious是什么 Illustrious是开源的文本到图像动漫图像生成模型,是Onoma AI Research推出的。基于优化批量大小、dropout控制、训练图像分辨率和多级标题等关键... Ai项目 2个月前1,2150
aisuite – 吴恩达发布开源Python库,一个接口调用多个大模型 aisuite是什么 aisuite是开源的Python库,吴恩达(Andrew Ng)发布的,旨在提供一个统一的接口来调用多个大型语言模型(LLM)服务。支持包括OpenAI、Anthropic、A... Ai项目 2个月前1,2600
XGrammar – 陈天奇团队推出的LLM结构化生成引擎 XGrammar是什么 XGrammar是由陈天奇团队推出的开源软件库,能为大型语言模型(LLM)提供高效、灵活且可移植的结构化数据生成能力。基于上下文无关语法(CFG)定义结构,支持递归组合以表示复... Ai项目 2个月前1,2500
Edify 3D – NVIDIA 推出的3D生成模型 Edify 3D是什么 Edify 3D 是 NVIDIA 推出的先进3D资产生成方案,能从文本提示或参考图像快速合成高质量的3D模型。Edify 3D能在两分钟内生成具有详细几何形状、清晰拓扑结构... Ai项目 2个月前1,2800
SongCreator – AI音乐模型,能理解、生成和编辑歌曲 SongCreator是什么 SongCreator是清华大学深圳国际研究生院、香港中文大学等机构推出的AI音乐生成模型,能从歌词出发生成包含声乐和伴奏的完整歌曲。基于双序列语言模型(DSLM)和注意... Ai项目 2个月前1,2450
Teacher2Task – 谷歌推出的多教师学习框架 Teacher2Task什么 Teacher2Task是谷歌团队推出的多教师学习框架,引入教师特定的输入标记和重新构思训练过程,消除对手动聚合启发式方法的需求。框架不依赖聚合标签,将训练数据转化为N... Ai项目 2个月前1,4800
DynaSaur – Adobe 推出的大语言模型代理框架 DynaSaur是什么 DynaSaur是Adobe Research推出的大型语言模型(LLM)代理框架,突破传统LLM代理系统受限于预定义动作集合的限制。框架支持代理动态创建和组合动作,基于生成和... Ai项目 2个月前1,5200
Takin AudioLLM – 喜马拉雅推出的系列零样本语音生成模型 Takin AudioLLM是什么 Takin AudioLLM是喜马拉雅Everest团队推出的一系列高质量零样本语音生成模型,包括Takin TTS、Takin VC和Takin Morphing... Ai项目 2个月前1,0550