MNN – 阿里开源的移动端深度学习推理框架 MNN是什么 MNN(Mobile Neural Network)是阿里巴巴集团开源的轻量级深度学习推理框架,为移动端、服务器、个人电脑、嵌入式设备等多种设备提供高效的模型部署能力。MNN支持Tens... Ai项目 2周前5,1350
DiTCtrl – 港中文联合腾讯等机构推出的多提示视频生成方法 DiTCtrl是什么 DiTCtrl是基于多模态扩散变换器(MM-DiT)架构的多提示视频生成方法,是香港中文大学和腾讯等机构联合推出的。DiTCtrl能在无需额外训练的情况下,实现多个文本提示之间的... Ai项目 2周前4,6950
联通元景 – 中国联通AI开源的中文原生文生图模型 联通元景是什么 联通元景(UniT2IXL)是中国联通AI推出的中文原生文生图模型,完全在国产昇腾AI基础软硬件平台上实现训练和推理。模型采用复合语言编码模块,优化中文长文本和特色词汇理解,提升图像生... Ai项目 2周前5,0000
Valley – 字节跳动推出的多模态大模型 Valley是什么 Valley是字节跳动推出的多模态大模型,用于处理涉及文本、图像和视频数据的多样化任务。Valley在内部电子商务和短视频基准测试中取得了最佳成绩,并在OpenCompass测试中... Ai项目 2周前4,8650
Enhance-A-Video – 上海AI Lab 联合新加坡国立等推出的视频生成质量增强算法 Enhance-A-Video是什么 Enhance-A-Video 是新加坡国立大学、上海人工智能实验室和德克萨斯大学奥斯汀分校联合推出的视频生成增强算法。算法能够显著提升AI视频生成质量,特别是在... Ai项目 2周前5,1750
AGUVIS – 香港大学联合 Salesforce 推出统一纯视觉的GUI自动化框架 AGUVIS是什么 AGUVIS是香港大学、Salesforce 联合推出的统一的纯视觉框架,专为自主GUI智能体设计,能在各种平台(如网页、桌面、移动设备)上操作。AGUVIS基于图像观察和自然语言... Ai项目 2周前5,1900
CogAgent-9B – 智谱AI开源 GLM-PC 的基座模型 CogAgent-9B是什么 CogAgent-9B是基于 GLM-4V-9B 训练的专用Agent任务模型,仅依赖屏幕截图作为输入,无需HTML等文本表征。CogAgent-9B支持高分辨率图像处理... Ai项目 2周前4,7300
cobalt – 开源的流媒体下载工具,支持全平台视频、音频和图片下载 cobalt是什么 cobalt是开源的流媒体下载工具,提供纯净、简洁无广告的体验。cobalt支持全平台视频、音频和图片下载,包括主流视频网站、社交媒体和音乐平台。cobalt提供个性化设置,支持多... Ai项目 2周前5,0850
ModernBERT – 英伟达和 HuggingFace 等机构联合开源的新一代编码器模型 ModernBERT是什么 ModernBERT是Answer.AI、LightOn、约翰斯·霍普金斯大学、英伟达和HuggingFace联合推出的现代编码器-only Transformer模型,是... Ai项目 2周前5,0000
Infinity – 字节跳动推出的高分辨率图像生成模型 Infinity是什么 Infinity是字节跳动推出的基于位级自回归建模的视觉生成模型,能根据语言指令生成高分辨率、逼真的图像。Infinity通过无限词汇量的标记器、分类器和位自纠正机制,显著提升... Ai项目 2周前5,2150