Gemini Coder – AI 应用生成工具,文本描述实时生成代码和预览 Gemini Coder是什么 Gemini Coder 是基于 Google 的 Gemini API、Next.js 和 Tailwind CSS 的工具,用在快速生成 app 应用。Gemini... Ai项目 4周前4,8000
Oliva – 开源语音RAG助手,实时语音搜索向量数据库 Oliva是什么 Oliva 是开源的语音RAG助手,结合 Langchain 和 Superlinked 技术,基于语音驱动的 RAG(检索增强生成)架构,帮助用户在 Qdrant 向量数据库中实时... Ai项目 1年前04,8000
FlexIP – 腾讯推出的个性化图像生成编辑框架 FlexIP是什么 FlexIP 是腾讯提出的面向图像合成的灵活主体属性编辑框架,平衡图像生成中的身份保持和个性化编辑。框架采用双适配器架构,将身份保持与个性化编辑解耦,通过高层语义概念与低层空间细节... Ai项目 1年前04,8000
ClearerVoice-Studio – 阿里通义实验室开源的语音处理框架 ClearerVoice-Studio是什么 ClearerVoice-Studio 是阿里巴巴达摩院通义实验室开源的语音处理框架,集成语音增强、分离和音视频说话人提取等功能。框架基于复数域深度学习算... Ai项目 4周前4,7950
Suna – Kortix推出的全球首款通用型 AI Agent 开源项目 Suna是什么 Suna 是Kortix推出的全球首款通用型 AI Agent 开源项目,支持高效解决现实场景中的各类任务。基于自然流畅的对话交互,Suna 支持智能辅助研究分析、数据处理及日常事务... Ai项目 1年前04,7950
VMix – 字节联合中科大推出增强模型生成美学质量的适配器 VMix是什么 VMix是创新的即插即用美学适配器,提升文本到图像扩散模型生成图像的美学质量。通过解耦输入文本提示中的内容描述和美学描述,将细粒度的美学标签(如色彩、光线、构图等)作为额外条件引入生成... Ai项目 4周前4,7900
ACE++ – 阿里通义推出的升级版图像生成与编辑模型 ACE++是什么 ACE++是阿里巴巴通义实验室推出的先进的图像生成与编辑工具,通过指令化和上下文感知的内容填充技术,实现了高质量的图像创作和编辑功能。ACE++ 提供多种模型,分别针对不同任务:AC... Ai项目 12个月前04,7900
SyncAnimation – 南科大等推出的实时音频驱动生成头部运动框架 SyncAnimation是什么 SyncAnimation是实时端到端的音频驱动框架,用于生成人体姿态和说话头像动画。通过音频信号实时生成与音频同步的上半身姿态和面部表情,包括嘴唇动作,实现高精度和... Ai项目 12个月前4,7850
Crawl4LLM – 清华和卡内基梅隆大学联合开源的智能爬虫系统 Crawl4LLM是什么 Crawl4LLM 是清华大学和卡内基梅隆大学联合开源的智能爬虫系统,提升大语言模型(LLM)预训练效率。Crawl4LLM基于智能评估网页对 LLM 预训练的价值,优先抓取... Ai项目 12个月前04,7850
心影大模型 – 心影随形推出的AI模型,深度融合游戏攻略与角色陪伴 心影大模型是什么 心影大模型是心影随形顶尖AI团队研发的AI大模型,正式通过国家生成式人工智能服务备案。模型专注于游戏领域,深度融合游戏攻略与角色陪伴场景,全面应用于“逗逗游戏伙伴”APP。 基于超百... Ai项目 1年前04,7850