SigLIP 2 – 谷歌 DeepMind 推出的多语言视觉语言编码器模型 SigLIP 2是什么 SigLIP 2 是Google DeepMind 提出先进的多语言视觉-语言模型 ,是 SigLIP 的升级版本,提升图像与文本之间的对齐能力。通过改进的训练方法和架构,显著... Ai项目 12个月前05,6300
QwQ-Max – 阿里推出的深度推理模型,基于 Qwen2.5-Max QwQ-Max是什么 QwQ-Max是阿里巴巴基于Qwen2.5-Max推出的深度推理模型,是 Qwen 系列的一部分。QwQ-Max-Preview作为预览版本推出,QwQ-Max专注于深度推理、数... Ai项目 12个月前05,6250
Lobe Vidol – AI数字人交互平台,可与虚拟人和 3D 模型聊天互动 Lobe Vidol是什么 Lobe Vidol是开源的数字人创作平台,让每个人都能轻松创建和互动自己的虚拟偶像。Lobe Vidol提供流畅的对话体验、背景设置、动作姿势库、优雅的用户界面、角色编辑... Ai项目 2周前5,6150
MiniPerplx – AI 搜索引擎,基于 Grok 2.0 模型 MiniPerplx是什么 MiniPerplx 是开源的 AI 搜索引擎,基于 Grok 2.0 模型进行搜索。MiniPerplx提供了免费的替代方案,用在搜索网页、推特帖子、研究论文和 YouT... Ai项目 2周前5,6150
RuoYi AI – 全栈式 AI 开发平台,快速搭建个性化 AI 应用 RuoYi AI是什么 RuoYi AI 是全栈式 AI 开发平台,提供完整的前端、后台管理及小程序应用,支持灵活修改和分发代码。RuoYi AI 支持本地 RAG 方案,集成 Milvus/Weav... Ai项目 12个月前05,6100
OpenUtau – 开源的AI歌声合成工具,自动适配系统语言 OpenUtau是什么 OpenUtau 是开源的歌声合成工具,兼容 UTAU 音源库和重采样器,支持 VSQX 导入、多语言界面及预渲染功能,帮助创作者快速预览作品节省时间。OpenUtau现代化的... Ai项目 12个月前05,6100
AlphaQubit – 谷歌推出的量子错误解码器 AlphaQubit是什么 AlphaQubit是谷歌推出基于AI技术的量子错误解码器,用深度学习架构Transformers识别和纠正量子计算中的错误。AlphaQubit基于精确的误差识别,助力量... Ai项目 2周前5,6000
JoyVASA – 京东健康开源的音频驱动的数字人头项目 JoyVASA是什么 JoyVASA是京东健康国际公司开源的音频驱动的数字人头项目,基于扩散模型技术,根据音频信号生成与音频同步的面部动态和头部运动。JoyVASA能实现人物的唇形同步和表情控制,还扩... Ai项目 2周前5,6000
Animate Anyone 2 – 阿里通义推出的高保真角色图像动画生成技术 Animate Anyone 2是什么 Animate Anyone 2 是阿里巴巴集团通义实验室推出的高保真角色图像动画生成技术,通过结合环境信息生成更具真实感的角色动画。与传统方法不同,能从视频中... Ai项目 12个月前05,6000
ConsistentDreamer – 华为推出的单张图像生成 3D 资产技术 ConsistentDreamer是什么 ConsistentDreamer 是华为慕尼黑研究中心提出的新型图像到 3D 资产生成技术,通过单张图像生成视图一致的 3D 网格。方法通过多视图先验图像引... Ai项目 12个月前05,5950