Step-Video-TI2V – 阶跃星辰开源的图生视频模型 Step-Video-TI2V是什么 Step-Video-TI2V 是阶跃星辰(StepFun)推出的开源图生视频(Image-to-Video)生成模型,拥有 300 亿参数,能根据文本描述和图像... Ai项目 5个月前02,5200
DeepMesh – 清华和南洋理工推出的 3D 网格生成框架 DeepMesh是什么 DeepMesh 是清华大学和南洋理工大学研究人员提出的 3D 网格生成框架,基于强化学习和自回归变换器生成高质量的 3D 网格。通过两项关键创新来优化网格生成:一是高效的预训... Ai项目 5个月前02,5200
SVDQuant – MIT 推出的扩散模型后训练量化技术 SVDQuant是什么 SVDQuant是MIT研究团队推出的后训练量化技术,针对扩散模型,将模型的权重和激活值量化至4位,减少内存占用加速推理过程。SVDQuant引入高精度的低秩分支吸收量化过程中... Ai项目 5个月前2,5150
EnerVerse – 智元机器人推出的首个机器人4D世界模型 EnerVerse是什么 EnerVerse 是智元机器人团队开发的首个机器人4D世界模型,通过生成未来具身空间来指导机器人完成复杂任务。模型采用自回归扩散模型,结合稀疏记忆机制(Sparse Mem... Ai项目 5个月前2,5150
通古大模型 – 华南理工大学推出的古籍大语言模型 通古大模型是什么 通古大模型是华南理工大学深度学习与视觉计算实验室(SCUT-DLVCLab)推出的专注于古籍文言文处理的人工智能语言模型。基于百川2-7B-Base进行增量预训练,使用24.1亿古籍... Ai项目 5个月前02,5150
CorrDiff – NVIDIA 推出的生成式 AI 模型,专注于全球气象数据 CorrDiff是什么 CorrDiff 是 NVIDIA 推出的生成式 AI 模型,用于将低分辨率的全球天气数据下采样为高分辨率数据,提高天气预测的准确性和效率。采用两步法处理数据:首先通过 UNe... Ai项目 5个月前02,5150
OThink-MR1 – OPPO联合港科大推出的多模态语言模型优化框架 OThink-MR1是什么 OThink-MR1是OPPO研究院和香港科技大学(广州)联合推出的多模态语言模型优化框架。基于动态调整Kullback-Leibler(KL)散度策略(GRPO-D)和奖... Ai项目 5个月前02,5150
Project Mariner – 谷歌推出的浏览网站智能体,能帮用户操作表格、在线购物 Project Mariner是什么 Project Mariner 是谷歌 DeepMind 推出的浏览器助手。Project Mariner基于 Gemini 2.0 技术,用 Chrome 扩展... Ai项目 5个月前2,5100
VISION XL – AI视频修复处理工具,修复缺失、支持四倍超分辨率 VISION XL是什么 VISION XL是高效的视频修复和超分辨率工具,基于潜在扩散模型技术,专注于解决高清视频的逆问题。工具能修复视频缺失部分、去除模糊,提升视频清晰度,最高可达四倍超分辨率。V... Ai项目 5个月前2,5100
SpatialVLA – 上海 AI Lab 联合上科大等推出的空间具身通用操作模型 SpatialVLA是什么 SpatialVLA 是上海 AI Lab、中国电信人工智能研究院和上海科技大学等机构共同推出的新型空间具身通用操作模型,基于百万真实数据预训练,为机器人赋予通用的3D空间... Ai项目 5个月前02,5100