Edify 3D – NVIDIA 推出的3D生成模型 Edify 3D是什么 Edify 3D 是 NVIDIA 推出的先进3D资产生成方案,能从文本提示或参考图像快速合成高质量的3D模型。Edify 3D能在两分钟内生成具有详细几何形状、清晰拓扑结构... Ai项目 4周前4,9100
Perception-as-Control – 阿里通义实验室推出的图像动画框架 Perception-as-Control是什么 Perception-as-Control是阿里巴巴通义实验室推出的图像动画框架,能根据用户意图实现细粒度的运动控制。Perception-as-Co... Ai项目 4周前4,9100
OmniSVG – 复旦大学联合 StepFun 推出端到端多模态矢量图形生成模型 OmniSVG是什么 OmniSVG 是复旦大学和 StepFun 联合开发的全球首个端到端多模态 SVG(可缩放矢量图形)生成模型。基于预训练视觉语言模型(VLM),通过创新的 SVG 标记化方法... Ai项目 12个月前04,9100
EMO2 – 阿里研究院推出的音频驱动头像视频生成技术 EMO2是什么 EMO2 (End-Effector Guided Audio-Driven Avatar Video Generation)是阿里巴巴智能计算研究院开发的音频驱动头像视频生成技术,全... Ai项目 4周前4,9050
GAS – 卡内基梅隆联合上海 AI Lab 等推出的单图生成3D人体框架 GAS是什么 GAS(Generative Avatar Synthesis from a Single Image)是卡内基梅隆大学、上海人工智能实验室和斯坦福大学的研究人员提出的从单张图像生成高质... Ai项目 12个月前04,9050
DeepGEMM – DeepSeek 开源的 FP8 通用矩阵乘法库 DeepGEMM是什么 DeepGEMM是DeepSeek开源的为高效简洁的FP8矩阵乘法(GEMM)设计的库,目前仅支持NVIDIA Hopper张量核心。DeepGEMM支持普通和混合专家(MoE... Ai项目 12个月前04,9050
Profiling Data – DeepSeek开源训练和推理框架的性能分析数据 Profiling Data是什么 Profiling Data是DeepSeek开源的训练和推理框架的性能分析数据,基于PyTorch Profiler捕获的程序运行过程中的详细信息,用在分析和优化... Ai项目 12个月前04,9000
Seed1.5-VL – 字节跳动Seed推出的视觉语言多模态大模型 Seed1.5-VL是什么 Seed1.5-VL 是字节跳动 Seed 团队最新发布的视觉-语言多模态大模型,具备强大的通用多模态理解和推理能力,推理成本显著降低。模型由一个 532M 参数的视觉编码... Ai项目 4周前4,8950
CAMPHOR – 苹果推出的端侧小语言模型多智能体框架 CAMPHOR是什么 CAMPHOR是苹果团队推出的端侧小语言模型(SLM)多智能体框架,能提升移动设备的隐私保护和响应速度。框架基于在设备本地处理多个用户输入并进行个人上下文推理,确保用户隐私安全... Ai项目 4周前4,8950
DRT-o1 – 腾讯研究院推出的文学翻译系列AI模型 DRT-o1是什么 DRT-o1是腾讯研究院推出的一系列AI模型,通过长链思考推理(CoT)技术显著提升了文学作品的翻译质量,尤其在处理比喻和隐喻等修辞手法时。模型能更深入地理解文本,保留原文的情感色... Ai项目 4周前4,8950