HunyuanCustom – 腾讯混元开源的多模态定制视频生成框架 HunyuanCustom是什么 HunyuanCustom是腾讯混元团队推出的多模态驱动的定制化视频生成框架。HunyuanCustom支持图像、音频、视频和文本等多种输入条件,支持生成具有特定主体... Ai项目 1个月前1,6750
GLM-Z1-Air – 智谱推出的深度思考模型 GLM-Z1-Air是什么 GLM-Z1-Air 是智谱公司推出的基于 GLM-4-Air-0414 的深度思考模型。GLM-Z1-Air在预训练阶段引入更多推理类数据,在对齐阶段深度优化通用能力,展... Ai项目 2个月前01,6650
gpt-4o-mini-transcribe – OpenAI 推出的语音转文本模型 gpt-4o-mini-transcribe是什么 gpt-4o-mini-transcribe 是 OpenAI 推出的语音转文本模型,gpt-4o-transcribe的精简版。gpt-4o-mi... Ai项目 2个月前01,6600
Step-R1-V-Mini – 阶跃星辰最新推出的多模态推理模型 Step-R1-V-Mini是什么 Step-R1-V-Mini 是阶跃星辰最新推出的多模态推理模型。支持图文输入和文字输出,具备良好的指令遵循和通用能力,能高精度感知图像完成复杂推理任务。模型在视觉... Ai项目 2个月前01,6600
Univer – 开源 AI 办公工具,支持Word、Excel等文档处理全栈解决方案 Univer是什么 Univer是开源的全栈框架,支持创建和编辑电子表格、文档及幻灯片,为用户提供统一且强大的办公解决方案。Univer能在浏览器和Node.js环境中运行,易于集成到各种应用中。Un... Ai项目 2个月前1,6550
Lyria 2 – DeepMind 推出的 AI 音乐生成模型 Lyria 2是什么 Lyria 2 是谷歌 DeepMind 推出的第三代 AI 音乐生成模型,作为 Vertex AI 平台的核心组件,具备高保真音频生成能力,能输出 48kHz、24-bit 的... Ai项目 2个月前1,6500
FoloUp – 开源AI语音面试平台,自动生成定制化面试问题 FoloUp是什么 FoloUp 是开源的AI语音面试平台,能帮助企业高效地进行招聘面试。FoloUp能根据职位描述自动生成定制化的面试问题,基于AI技术与候选人进行自然、对话式的语音面试。平台能实时... Ai项目 2个月前01,6500
Avat3r – 慕尼黑大学联合 Meta 推出的 3D 高斯头像生成模型 Avat3r是什么 Avat3r 是慕尼黑工业大学和 Meta Reality Labs 推出的高保真三维头部头像的大型可动画高斯重建模型,仅需几张输入图像,能生成高质量且可动画化的 3D 头部头像... Ai项目 2个月前01,6500
MinT – 生成顺序事件的文本转视频模型,灵活控制时间戳 MinT是什么 MinT(Mind the Time)是Snap Research、多伦多大学和向量研究所联合推出的多事件视频生成框架,基于精确的时间控制,根据文本提示生成包含多个事件的视频序列。Mi... Ai项目 2个月前1,6400
DisPose – 北大等多所高校推出的增强人物图像控制动画质量的技术 DisPose是什么 DisPose是北京大学、中国科学技术大学、清华大学和香港科技大学的研究团队共同推出的,提高人物图像动画质量的控制技术,基于从骨骼姿态和参考图像中提取有效的控制信号,无需额外的密... Ai项目 2个月前1,6200