FineWeb 2 – Hugging Face推出的多语言预训练数据集 FineWeb 2是什么 FineWeb 2是Hugging Face推出的多语言预训练数据集,覆盖超过1000种语言。FineWeb 2基于定制化的数据管道处理,包括语言识别、去重、内容过滤和PII... Ai项目 3周前4,9250
VideoGrain – 悉尼科技大学和浙大推出的视频编辑框架 VideoGrain是什么 VideoGrain 是悉尼科技大学和浙江大学推出的零样本多粒度视频编辑框架,能实现类别级、实例级和部件级的精细视频修改。VideoGrain基于调节时空交叉注意力和自注意... Ai项目 12个月前04,9250
SeedFoley – 字节推出的端到端视频音效生成模型 SeedFoley是什么 SeedFoley 是字节跳动豆包大模型语音团队开发的端到端视频音效生成模型,为视频创作提供智能音效生成服务。通过融合时空视频特征与扩散生成模型,实现音效与视频的高度同步。模... Ai项目 12个月前04,9250
MT-TransformerEngine – 摩尔线程开源的高效训练与推理优化框架 MT-TransformerEngine是什么 MT-TransformerEngine 是摩尔线程开源的高效训练与推理优化框架,专为 Transformer 模型设计。框架通过算子融合、并行加速等技... Ai项目 12个月前04,9250
Avatar IV – HeyGen 最新推出的AI数字人模型 Avatar IV是什么 Avatar IV 是 HeyGen 最新推出的AI数字人模型,用在快速创建逼真视频。用户只需上传一张照片和一段脚本或音频,能生成自然流畅的视频。模型基于音频驱动的表情引擎... Ai项目 3周前4,9200
QLIP – 英伟达推出的视觉标记化方法 QLIP是什么 QLIP(Quantized Language-Image Pretraining)是英伟达等推出的视觉标记化方法,结合高质量的图像重建和零样本图像理解能力。QLIP二进制球形量化(B... Ai项目 3周前4,9200
DynaSaur – Adobe 推出的大语言模型代理框架 DynaSaur是什么 DynaSaur是Adobe Research推出的大型语言模型(LLM)代理框架,突破传统LLM代理系统受限于预定义动作集合的限制。框架支持代理动态创建和组合动作,基于生成和... Ai项目 3周前4,9200
新言意码 – 前月之暗面明超平创立的 AI Coding 项目 新言意码是什么 新言意码是专注于AI编程应用开发的公司,由前月之暗面海外产品Noisee的明超平创立。公司全称深圳新言意码科技有限公司,成立于2024年9月23日,位于广东省深圳市,主要在其他技术推广... Ai项目 3周前4,9200
AgentCPM-GUI – 清华联合面壁智能开源的端侧GUI智能体模型 AgentCPM-GUI是什么 AgentCPM-GUI 是清华大学和面壁智能团队联合推出的开源端侧 GUI Agent ,针对中文应用优化。模型基于 MiniCPM-V(80 亿参数)构建,能接受智... Ai项目 3周前4,9150
ConsisID – 北大联合鹏城实验室等机构推出的文本到视频生成模型 ConsisID是什么 ConsisID是北京大学和鹏城实验室等机构推出的文本到视频(Text-to-Video, IPT2V)生成模型,基于频率分解技术保持视频中人物身份的一致性。模型用免调优(tu... Ai项目 3周前4,9150