Gemma 3 QAT – 谷歌推出的最新开源模型,Gemma 3 量化版 Gemma 3 QAT是什么 Gemma 3 QAT(Quantization-Aware Training)是谷歌推出的最新一代开源模型,是Gemma 3 的量化优化版本。通过量化感知训练技术,Ge... Ai项目 2个月前01,7550
Lumina-Video – 上海 AI Lab 和港中文推出的视频生成框架 Lumina-Video是什么 Lumina-Video是上海 AI Lab 和香港中文大学推出的视频生成框架,基于Next-DiT架构,针对视频生成中的时空复杂性进行优化。基于多尺度Next-DiT... Ai项目 2个月前01,7500
FantasyTalking – 阿里联合北邮推出静态肖像生成可控数字人的框架 FantasyTalking是什么 FantasyTalking 是阿里巴巴 AMAP 团队和北京邮电大学联合提出的新型框架,用于从单张静态肖像生成逼真的可动画化虚拟形象。基于预训练的视频扩散变换器模... Ai项目 2个月前01,7500
Dify-Plus – 基于 Dify 二次开发的企业级增强版项目 Dify-Plus是什么 Dify-Plus 是基于 Dify 二次开发的企业级增强版项目,集成基于 gin-vue-admin 的管理中心。Dify-Plus在 Dify 基础上新增用户额度、密钥额... Ai项目 2个月前01,7350
Codex CLI – OpenAI 开源的AI编程智能体 Codex CLI是什么 Codex CLI 是 OpenAI 推出的轻量级AI编程智能体。Codex CLI基于自然语言指令帮助开发者高效生成代码、执行文件操作和进行版本控制。Codex CLI 支... Ai项目 2个月前01,7350
QVQ-72B-Preview – 阿里通义开源的多模态推理模型 QVQ-72B-Preview是什么 QVQ-72B-Preview 是阿里云通义千问团队开源的多模态推理模型,专注于提升视觉推理能力。模型在多个基准测试中表现出色,在多模态理解和推理任务上展现了强大... Ai项目 2个月前1,7300
AnimateAnything – 浙江大学联合北航推出的统一可控视频生成技术 AnimateAnything是什么 AnimateAnything是浙江大学和北京航空航天大学研究者推出的统一可控视频生成技术。AnimateAnything能精确操作视频,包括控制相机轨迹、文本提... Ai项目 2个月前1,7200
Samsung Gauss2 – 三星推出的第二代多模态生成式AI模型 Samsung Gauss2是什么 Samsung Gauss2是三星公司推出的第二代多模态生成式AI模型,能提升Galaxy AI功能的性能和效率。Samsung Gauss2能同时处理文本、代码和... Ai项目 2个月前1,7200
OmniCam – 浙大联合上海交大等高校推出的多模态视频生成框架 OmniCam是什么 OmniCam 是先进的多模态视频生成框架,通过摄像机控制实现高质量的视频生成。支持多种输入模态组合,用户可以提供文本描述、视频中的轨迹或图像作为参考,精确控制摄像机的运动轨迹... Ai项目 2个月前01,7200
GeneMAN – 上海AI Lab联合北大等高校推出的3D人体模型创建框架 GeneMAN是什么 GeneMAN是上海AI实验室、北京大学、南洋理工大学、上海交通大学联合推出的3D人形创建框架,能从单张图片中创建出高保真度的3D人体模型。框架不依赖于参数化人体模型,是用多源高... Ai项目 2个月前1,7150