H-Optimus-0 – 法国初创公司Bioptimus开源的病理学AI基础模型 H-Optimus-0是什么 H-Optimus-0是法国初创公司Bioptimus发布的世界上最大的开源病理学AI基础模型。模型拥有11亿参数,是在专有数据集上训练的,数据集包含从4000个临床实践... Ai项目 5个月前2,5000
Roop-Unleashed – AI换脸工具,支持批量换脸、VR换脸、直播换脸 Roop-Unleashed是什么 Roop-Unleashed 是基于 Roop 的开源项目,专注于深度伪造(Deepfake)技术的实现与优化。用户无需进行复杂的训练过程,可快速实现图像和视频中的... Ai项目 5个月前3,9450
书生·浦像 – 上海AI Lab 联合港中文和浙大推出的超高动态成像算法 书生·浦像是什么 书生·浦像是上海人工智能实验室联合香港中文大学、浙江大学等机构研发的超高动态成像算法,核心为浦像HDR(UltraFusion HDR)。算法结合了AIGC技术和HDR技术,通过曝光... Ai项目 5个月前2,7300
DeepSeek R1-Zero – DeepSeek推出的开源推理模型,基于纯强化学习训练 DeepSeek R1-Zero是什么 DeepSeek R1-Zero 是 DeepSeek 团队开发的完全依赖纯强化学习(RL)训练的推理模型,未使用任何监督微调(SFT)数据。在推理任务上表现出... Ai项目 5个月前3,2050
VideoWorld – 字节联合交大等机构推出的自回归视频生成模型 VideoWorld是什么 VideoWorld是北京交通大学、中国科学技术大学和字节跳动合作开展的一项研究项目,探索深度生成模型是否能仅通过未标注的视频数据学习复杂的知识,包括规则、推理和规划能力... Ai项目 5个月前2,0650
Step-1o Vision – 阶跃星辰推出的原生端到端视觉理解模型 Step-1o Vision是什么 Step-1o Vision 是阶跃星辰最新研发的原生端到端多模态生成与理解一体化模型中的视觉版本。专注于视觉任务,具备强大的图像识别、感知、推理和指令跟随能力,能... Ai项目 5个月前2,4700
3DIS-FLUX – 浙大联合哈佛推出的多实例生成框架 3DIS-FLUX是什么 3DIS-FLUX是基于深度学习的多实例生成框架,通过解耦实例合成实现高质量的图像生成。结合3DIS框架的深度驱动场景构建和FLUX模型的扩散变换器架构,分为两阶段:首先生成... Ai项目 5个月前2,5950
DITTO-2 – Adobe 联合加大推出的音乐生成模型 DITTO-2是什么 DITTO-2 是 Adobe 和加州大学研究人员联合推出的新型音乐生成模型,通过优化扩散模型的推理时间,实现快速且可控的音乐生成。模型基于扩散模型的推理时间优化(Inferen... Ai项目 5个月前2,5450
DiffEditor – 北大联合腾讯推出的细粒度图像编辑工具 DiffEditor是什么 DiffEditor是北京大学深圳研究生院与腾讯PCG的研究团队提出的基于扩散模型(Diffusion Model)的图像编辑工具,通过引入图像提示(image promp... Ai项目 5个月前2,0950
Textoon – 阿里通义实验室推出的文本提示生成2D卡通人物工具 Textoon是什么 Textoon是阿里巴巴集团通义实验室推出的创新项目,首个能根据文本提示生成Live2D格式2D卡通角色的方法。基于先进的语言和视觉模型,能在一分钟内生成多样化且可交互的2D角色... Ai项目 5个月前2,4450