MatAnyone – 南洋理工和商汤科技推出的人像视频抠图框架 MatAnyone是什么 MatAnyone是南洋理工大学S-Lab实验室和商汤科技推出的,针对复杂背景人像视频抠图的先进框架,专注于目标指定的视频抠图任务。MatAnyone基于一致的内存传播模块和... Ai项目 12个月前4,7800
HMA – MIT联合Meta等推出的机器人动作视频动态建模方法 HMA是什么 HMA(Heterogeneous Masked Autoregression)是麻省理工学院、Meta和伊利诺伊大学香槟分校开源的,用在建模机器人动作视频动态的方法。HMA基于异构预训... Ai项目 12个月前04,7800
memobase – 基于用户画像的长期记忆系统 memobase是什么 memobase 是开源的基于用户画像的长期记忆系统,专为生成式人工智能应用设计。memobase能为虚拟助手、教育工具等应用提供用户记忆功能,帮助AI记住、理解和与用户共同成... Ai项目 12个月前04,7800
AI-ClothingTryOn – AI虚拟试穿应用,支持生成多版本试衣效果 AI-ClothingTryOn是什么 AI-ClothingTryOn 是基于 Python 的桌面应用程序,用 Google Gemini AI 技术实现虚拟试衣功能。AI-ClothingTry... Ai项目 1年前04,7800
Nexus-Gen – 魔搭联合华东师范等机构开源的全模态图像生成模型 Nexus-Gen是什么 Nexus-Gen 是魔搭团队、华东师范大学等机构推出的开源全能图像生成模型,支持同时完成图像理解、生成和编辑任务。Nexus-Gen融合强大的语言模型与扩散模型的能力,基于... Ai项目 4周前4,7750
OOTDiffusion – 开源AI虚拟试衣工具,智能适配性别和体型自动调整衣物 OOTDiffusion是什么 OOTDiffusion是开源的AI虚拟试衣工具,能智能适配不同性别和体型,自动调整衣物尺寸和形状,生成自然贴合的试穿效果。OOTDiffusion支持半身和全身试穿模... Ai项目 4周前4,7750
DiTCtrl – 港中文联合腾讯等机构推出的多提示视频生成方法 DiTCtrl是什么 DiTCtrl是基于多模态扩散变换器(MM-DiT)架构的多提示视频生成方法,是香港中文大学和腾讯等机构联合推出的。DiTCtrl能在无需额外训练的情况下,实现多个文本提示之间的... Ai项目 4周前4,7750
DiffEditor – 北大联合腾讯推出的细粒度图像编辑工具 DiffEditor是什么 DiffEditor是北京大学深圳研究生院与腾讯PCG的研究团队提出的基于扩散模型(Diffusion Model)的图像编辑工具,通过引入图像提示(image promp... Ai项目 4周前4,7750
FlowGram – 字节跳动开源的可视化工作流搭建引擎 FlowGram是什么 FlowGram是字节跳动开源的基于节点编辑的可视化工作流搭建引擎,帮助开发者快速构建固定布局或自由连线布局的工作流。支持两种布局模式:固定布局适合顺序工作流和决策树,提供层次... Ai项目 4周前4,7700
I2V-01-Live – 海螺AI推出的图生视频模型,将静态图像转化为动态视频 I2V-01-Live是什么 I2V-01-Live是海螺AI推出的图生视频模型,能将静态二维图像转化为动态视频。模型基于深度学习技术,增强动作的流畅度和生动性,让人物或对象的动作更加自然和真实。I2... Ai项目 4周前4,7700