CorrDiff – NVIDIA 推出的生成式 AI 模型,专注于全球气象数据 CorrDiff是什么 CorrDiff 是 NVIDIA 推出的生成式 AI 模型,用于将低分辨率的全球天气数据下采样为高分辨率数据,提高天气预测的准确性和效率。采用两步法处理数据:首先通过 UNe... Ai项目 12个月前06,0150
Smallpond – DeepSeek开源的轻量级数据处理框架 Smallpond是什么 Smallpond是DeepSeek推出的基于 DuckDB 和 3FS 构建的轻量级数据处理框架,专为高性能和大规模数据处理设计。Smallpond支持处理 PB 级数据集... Ai项目 12个月前05,4050
SongGen – 上海 AI Lab 和北航、港中文推出的歌曲生成模型 SongGen是什么 SongGen是上海AI Lab、北京航空航天大学和香港中文大学推出的单阶段自回归Transformer模型,用在从文本生成歌曲。SongGen基于歌词和描述性文本(如乐器、风格... Ai项目 12个月前05,0400
VideoFusion – AI视频剪辑工具,自动去除视频黑边、水印和字幕 VideoFusion是什么 VideoFusion 是开源的短视频拼接与处理软件,专为高效视频编辑设计。支持自动去除视频中的黑边、水印和字幕,能将视频自动旋转为横屏或竖屏,适配不同播放场景。软件具备... Ai项目 12个月前04,6500
Baichuan-Audio – 百川智能开源的端到端语音交互模型 Baichuan-Audio是什么 Baichuan-Audio是百川智能推出的端到端音频大语言模型,支持无缝集成音频理解和生成功能,实现支持高质量、可控的实时中英双语对话。Baichuan-Audi... Ai项目 12个月前05,4000
AIMv2 – 苹果开源的多模态自回归预训练视觉模型 AIMv2是什么 AIMv2是苹果公司开源的多模态自回归预训练视觉模型,通过图像和文本的深度融合提升视觉模型的性能。采用创新的预训练框架,将图像划分为非重叠的图像块,将文本分解为子词令牌,然后将两者拼... Ai项目 12个月前05,2200
VidSketch – 浙江大学推出的视频动画生成框架 VidSketch是什么 VidSketch 是浙江大学 CAD&CG 国家重点实验室和软件学院推出的创新视频生成框架,根据手绘草图和简单文本提示生成高质量的视频动画。VidSketch基于... Ai项目 12个月前05,2000
HippoRAG 2 – 俄亥俄州立大学推出的检索增强生成框架 HippoRAG 2是什么 HippoRAG 2是俄亥俄州立大学推出的检索增强生成(RAG)框架,解决现有RAG系统在模拟人类长期记忆动态性和关联性方面的局限性。HippoRAG 2基于个性化Page... Ai项目 12个月前04,4350
LDGen – 理想汽车推出的多语言文本到图像生成技术 LDGen是什么 LDGen是创新的文本到图像合成技术,通过结合大型语言模型(LLMs)与扩散模型,提升文本描述到图像生成的质量和语义一致性。通过分层标题优化和人类指令技术,提取文本中的精确语义信息... Ai项目 12个月前04,2150
AI-Infra-Guard – 腾讯开源的 AI 基础设施安全评估工具 AI-Infra-Guard是什么 AI-Infra-Guard是腾讯开源的高效、轻量级易于使用的 AI 基础设施安全评估工具,能发现和检测 AI 系统中的潜在安全风险。AI-Infra-Guard支... Ai项目 12个月前05,9450