LanDiff – 浙大联合月之暗面推出的文本到视频生成混合框架 LanDiff是什么 LanDiff是用于高质量的文本到视频(T2V)生成的创新混合框架,结合了自回归语言模型(LLM)和扩散模型(Diffusion Model)的优势,通过粗到细的生成方式,有效克... Ai项目 12个月前05,7450
FoxBrain – 鸿海研究院推出的推理大语言模型 FoxBrain是什么 FoxBrain 是鸿海研究院推出的繁体中文大型语言模型(LLM),具有强大的推理能力。基于 Meta Llama 3.1 架构,拥有 70B 参数,专注于数学和逻辑推理领域... Ai项目 12个月前05,0100
COMET – 字节开源的通信优化系统 COMET是什么 COMET是字节跳动推出的针对Mixture-of-Experts(MoE)模型的优化系统,能解决分布式训练中通信开销过大的问题。基于细粒度的计算-通信重叠技术,COMET将通信与计... Ai项目 12个月前06,3600
VideoPainter – 港中文联合腾讯等机构推出的视频修复和编辑框架 VideoPainter是什么 VideoPainter 是香港中文大学、腾讯ARC Lab、东京大学、澳门大学等机构推出的视频修复和编辑框架,专门用在处理任意长度的视频内容。VideoPainter... Ai项目 12个月前05,0200
TrajectoryCrafter – 腾讯和港中文推出的单目视频自由运镜技术 TrajectoryCrafter是什么 TrajectoryCrafter 是腾讯PCG ARC Lab和香港中文大学推出的,用在单目视频的相机轨迹重定向方法,支持在后期自由调整视频的相机位置和角度... Ai项目 12个月前04,7350
LanPaint – 零训练 AI 图像修复工具 LanPaint是什么 LanPaint 是用在Stable Diffusion 模型的高质量图像修复工具,无需额外训练实现精准的图像修复和替换。LanPaint基于多轮迭代推理优化修复效果,支持无缝... Ai项目 12个月前05,0850
START – 阿里联合中科大推出的自学推理模型 START是什么 START(Self-Taught Reasoner with Tools)是阿里巴巴集团和中国科学技术大学推出的新型工具增强型推理模型,结合外部工具(如Python代码执行器)提升... Ai项目 12个月前05,0400
SeedFoley – 字节推出的端到端视频音效生成模型 SeedFoley是什么 SeedFoley 是字节跳动豆包大模型语音团队开发的端到端视频音效生成模型,为视频创作提供智能音效生成服务。通过融合时空视频特征与扩散生成模型,实现音效与视频的高度同步。模... Ai项目 12个月前04,9950
R1-Omni – 阿里通义开源的全模态大语言模型 R1-Omni是什么 R1-Omni 是阿里通义推出的基于强化学习(RLVR)的全模态大语言模型,专注于情感识别任务。通过结合视觉和音频信息,能清晰地解释情感识别的推理过程,展现出强大的情感理解能力... Ai项目 12个月前04,9850
DeepSeek百宝箱 – DeepSeek API在多种软件中的集成应用 DeepSeek百宝箱是什么 DeepSeek百宝箱是 DeepSeek官方 维护的 GitHub 项目,展示如何将 DeepSeek API 集成到各种流行软件中。项目列出了一系列支持 DeepSe... Ai项目 12个月前05,7600