FramePack – 斯坦福开源的AI视频生成模型 FramePack是什么 FramePack 是斯坦福大学开源的AI视频生成模型。基于压缩输入帧的上下文长度,解决视频生成中的“遗忘”和“漂移”问题,让模型能高效处理大量帧,保持较低的计算复杂度。Fr... Ai项目 5个月前02,4500
SWE-1 – Windsurf推出的首个软件工程 AI 模型系列 SWE-1是什么 SWE-1是Windsurf团队推出的首个软件工程 AI 模型系列,专为整个软件开发流程优化,涵盖代码生成、测试、调试、资料查找等开发环节,提升开发效率和用户体验。SWE-1包含三款... Ai项目 4个月前2,4450
Audio-SDS – NVIDIA推出的扩展文本条件音频扩散模型 Audio-SDS是什么 Audio-SDS是NVIDIA AI研究团队推出的创新技术,将Score Distillation Sampling(SDS)技术扩展至文本条件音频扩散模型,为音频处理领域... Ai项目 4个月前2,4450
DreamO – 字节联合北大推出的图像定制生成框架 DreamO是什么 DreamO 是字节跳动创作团队联合北京大学深圳研究生院电子与计算机工程学院联合推出的用在图像定制生成的统一框架,基于预训练的扩散变换器(DiT)模型实现多种图像生成任务的灵活定制... Ai项目 5个月前2,4450
NVILA – 英伟达推出的视觉语言大模型 NVILA是什么 NVILA是NVIDIA推出的系列视觉语言模型,能平衡效率和准确性。模型用“先扩展后压缩”策略,有效处理高分辨率图像和长视频。NVILA在训练和微调阶段进行系统优化,减少资源消耗,在... Ai项目 5个月前2,4450
Miras – 谷歌推出的深度学习架构设计通用框架 Miras是什么 Miras是谷歌推出的用在深度学习架构设计的通用框架,特别是序列建模任务。Miras基于关联记忆和注意力偏差的概念,将Transformer、现代线性RNN等模型重新定义为具有内部优... Ai项目 5个月前2,4450
Textoon – 阿里通义实验室推出的文本提示生成2D卡通人物工具 Textoon是什么 Textoon是阿里巴巴集团通义实验室推出的创新项目,首个能根据文本提示生成Live2D格式2D卡通角色的方法。基于先进的语言和视觉模型,能在一分钟内生成多样化且可交互的2D角色... Ai项目 5个月前2,4450
LIMO – 上海交大推出的高效推理方法,仅需817条训练样本 LIMO是什么 LIMO(Less Is More for Reasoning)是上海交通大学研究团队提出的高效推理方法,通过极少量高质量的训练样本激活大语言模型(LLM)的复杂推理能力。核心假设是在... Ai项目 5个月前2,4450
DeepRant 鲸喷 – 专为游戏玩家设计的多语言快捷翻译开源工具 DeepRant 鲸喷是什么 DeepRant 鲸喷是专为游戏玩家设计的多语言快捷翻译工具。DeepRant能帮助玩家在国际服务器中快速进行文字交流,消除语言障碍。玩家在游戏中选中文字后按下快捷键,翻... Ai项目 5个月前02,4450
UltraMem – 字节豆包大模型团队推出的全新超稀疏模型架构 UltraMem是什么 UltraMem 是字节跳动豆包大模型团队提出的全新超稀疏模型架构,解决传统 MoE 架构在推理时的高额访存问题。架构通过优化内存访问和计算效率,显著降低推理成本,推理速度较 ... Ai项目 5个月前02,4450