VideoMaker – 浙大联合腾讯和华为推出的零样本定制视频生成框架 VideoMaker是什么 VideoMaker是浙江大学、腾讯和华为诺亚方舟实验室共同开发的创新项目,基于视频扩散模型(VDM)的零样本定制视频生成框架。与传统方法不同,VideoMaker无需额外... Ai项目 5个月前2,9450
TITAN – 哈佛医学院研究推出的多模态全切片病理基础模型 TITAN是什么 TITAN是哈佛医学院研究团队开发的多模态全切片病理基础模型,通过视觉自监督学习和视觉-语言对齐预训练,能在无需微调或临床标签的情况下提取通用的切片表示,生成病理报告。它使用了335... Ai项目 5个月前2,0050
TANGOFLUX – 英伟达联合新加坡科技设计大学开源的文本到音频生成模型 TANGOFLUX是什么 TANGOFLUX是高效的文本到音频生成模型,是新加坡科技设计大学(SUTD)和NVIDIA共同推出的。模型拥有约5.15亿参数,能在单个A40 GPU上仅用3.7秒生成长达... Ai项目 5个月前2,5800
MMedAgent – 专为医疗领域设计的多模态AI智能体,管理多种医疗任务 MMedAgent是什么 MMedAgent是专为医疗领域设计的多模态AI智能体,通过整合各种开源医疗模型来管理多种医疗任务。系统包括一个指令调整的多模态大型语言模型(MLLM),作为行动规划器和结果... Ai项目 5个月前2,4050
VITRON – Skywork AI 联合新加坡国立、南洋理工推出的像素级视觉大型语言模型 VITRON是什么 VITRON是Skywork AI、新加坡国立大学和南洋理工大学联合推出的像素级视觉大型语言模型(LLM),能全面理解和处理静态图像与动态视频,对图像和视频进行理解、生成、分割和编... Ai项目 5个月前1,9750
n8n – 开源工作流自动化平台,支持400多个应用程序、拖放创建复杂工作流 n8n是什么 n8n是开源的自动化工作流管理系统,提供一个低代码平台,支持用户用拖放的方式创建复杂的工作流,无需编写代码。n8n支持400多个应用程序和服务的集成,包括AI组件,让自动化各种业务流程变... Ai项目 5个月前1,8400
SoulChat2.0 – 华南理工大学推出的心理咨询师数字孪生大语言模型 SoulChat2.0是什么 SoulChat2.0是华南理工大学未来技术学院-广东省数字孪生人重点实验室基于SoulChat1.0模型推出的心理咨询师数字孪生大语言模型。首次定义了特定心理咨询师的数... Ai项目 5个月前2,0700
SAC-KG – 通用知识图谱构建框架,能构建超百万节点的领域知识图谱 SAC-KG是什么 SAC-KG是基于大型语言模型(LLMs)自动构建领域知识图谱的通用框架。由生成器、验证器和剪枝器三个主要组件构成,能自动从原始领域语料库中生成特定领域的一级知识图谱,确保生成的三... Ai项目 5个月前2,2150
TryOffAnyone – 将模特穿着服装的图像还原成平铺商品图的 AI 工具 TryOffAnyone是什么 TryOffAnyone是能将穿着服装的人物照片转换成平铺的服装展示图的AI工具。基于先进的Latent Diffusion Models技术,自动识别并提取照片中的服... Ai项目 5个月前1,9000
LongDocURL – 中科院联合淘天集团推出的多模态长文档理解基准数据集 LongDocURL是什么 LongDocURL是中国科学院自动化研究所和阿里巴巴淘宝天猫集团联合发布的多模态长文档理解基准数据集。专注于评估模型在处理长文档、复杂元素和多样化任务中的理解、推理和定位... Ai项目 5个月前2,3950