OmniSVG – 复旦大学联合 StepFun 推出端到端多模态矢量图形生成模型 OmniSVG是什么 OmniSVG 是复旦大学和 StepFun 联合开发的全球首个端到端多模态 SVG(可缩放矢量图形)生成模型。基于预训练视觉语言模型(VLM),通过创新的 SVG 标记化方法... Ai项目 12个月前04,9100
Neural4D 2o – DreamTech 推出支持多模态交互的 3D 模型 Neural4D 2o是什么 Neural4D 2o 是 DreamTech 推出的全球首个支持多模态交互的 3D 大模型。模型基于文本、图像、3D 和运动数据的联合训练,实现 3D 生成的上下文一致... Ai项目 12个月前04,9100
MVGenMaster – 复旦联合阿里等实验室推出的多视图扩散模型 MVGenMaster是什么 MVGenMaster是复旦大学、阿里巴巴达摩院和湖潘实验室共同推出的多视图扩散模型,基于增强3D先验处理多样化的新视角合成(NVS)任务。模型基于度量深度和相机姿态扭曲... Ai项目 3周前4,9050
GAS – 卡内基梅隆联合上海 AI Lab 等推出的单图生成3D人体框架 GAS是什么 GAS(Generative Avatar Synthesis from a Single Image)是卡内基梅隆大学、上海人工智能实验室和斯坦福大学的研究人员提出的从单张图像生成高质... Ai项目 12个月前04,9050
DeepGEMM – DeepSeek 开源的 FP8 通用矩阵乘法库 DeepGEMM是什么 DeepGEMM是DeepSeek开源的为高效简洁的FP8矩阵乘法(GEMM)设计的库,目前仅支持NVIDIA Hopper张量核心。DeepGEMM支持普通和混合专家(MoE... Ai项目 12个月前04,9050
Hunyuan3D 2.0 – 腾讯推出的大规模 3D 资产生成系统 Hunyuan3D 2.0是什么 Hunyuan3D 2.0 是腾讯推出的大规模 3D 资产生成系统,专注于从文本和图像生成高分辨率的 3D 模型。系统采用两阶段生成流程:首先生成无纹理的几何模型,再... Ai项目 12个月前04,9050
AnchorCrafter – 中科院联合腾讯推出的AI虚拟主播带货视频制作技术 AnchorCrafter是什么 AnchorCrafter是基于扩散模型的智能视频制作系统,用在自动生成具有高保真度的主播风格产品推广视频。基于整合人-物交互(HOI)到姿态引导的人体视频生成中,实... Ai项目 3周前4,9000
VMB – 中科院联合多所高校机构推出增强多模态音乐生成的框架 VMB是什么 VMB(Visuals Music Bridge)是中国科学院信息工程研究所、中国科学院大学网络空间安全学院、上海人工智能实验室、上海交通大学等机构推出的多模态音乐生成框架,能从文本、图... Ai项目 3周前4,9000
VSI-Bench – 李飞飞谢赛宁团队推出的视觉空间智能基准测试集 VSI-Bench是什么 VSI-Bench(Visual-Spatial Intelligence Benchmark)是李飞飞、谢赛宁及他们的研究团队推出的视觉空间智能基准测试集,研究者构建用在评... Ai项目 3周前4,9000
Cua – 专为 MacOS 推出的开源 AI Agent项目 Cua是什么 Cua 是 trycua 团队推出的开源AI Agent项目,为 macOS 用户提供高性能的虚拟化和 AI 代理功能。Cua基于苹果的 Virtualization.Framework... Ai项目 12个月前04,9000