SPRIGHT – 专注于空间关系的大型视觉语言数据集 SPRIGHT是什么 SPRIGHT(SPatially RIGHT)是亚利桑那州立大学 、Intel 实验室 、Hugging Face 、华盛顿大学等机构联合推出的,专注于空间关系的大型视觉-语言... Ai项目 2周前6,4100
VideoRAG – 用于长视频理解的检索增强生成技术 VideoRAG是什么 VideoRAG是用于长视频理解的检索增强生成(Retrieval-Augmented Generation)技术。通过提取视频中的视觉对齐辅助文本,帮助大型视频语言模型(LV... Ai项目 2周前4,5600
Mobile-Agent – 自主多模态移动设备代理,通过视觉感知实现智能化手机操作 Mobile-Agent是什么 Mobile-Agent 是具有移动性的智能代理软件实体,能在网络的各个节点之间移动,代表用户或其他代理进行工作。能根据具体情况中断当前执行,移动至另一设备上恢复运行... Ai项目 2周前4,6250
Edicho – 蚂蚁集团联合港科大等高校推出的多图像一致性编辑方法 Edicho是什么 Edicho 是香港科技大学、蚂蚁集团、斯坦福大学和香港中文大学推出的,基于扩散模型的图像编辑方法,能在多图像间实现一致性编辑。Edicho用免训练的方法,无需额外训练即可应用。E... Ai项目 2周前7,6700
CHRONOS – 阿里通义联合上海交大等推出时间线摘要生成新框架 CHRONOS是什么 CHRONOS是上海交通大学计算机科学与工程系、阿里巴巴集团通义实验室等机构联合推出的,用在新闻时间线摘要生成的新型框架,基于迭代自问自答的方式,用大型语言模型(LLMs)构建开... Ai项目 2周前6,3350
麦橘超然 – 麦橘推出的AI文生图模型,基于 Flux.1 架构 麦橘超然是什么 麦橘超然(MajicFlus)是麦橘推出的基于Flux.1架构的AI模型,专注于生成高质量的人像图像,擅长表现亚洲女性的细腻与美感。模型融合多种技术,能生成逼真的人物摄影风格,细致呈现... Ai项目 2周前4,5300
JoyCaption – 开源的图像提示词生成工具 JoyCaption是什么 JoyCaption 是开源的图像提示词生成工具,用于训练扩散模型。JoyCaption 涵盖广泛的图像风格、内容、种族、性别和取向,最小化过滤理解世界的各个方面,但不支持... Ai项目 2周前4,8300
VideoRefer – 浙大联合阿里达摩学院推出的视频对象感知与推理技术 VideoRefer是什么 VideoRefer是浙江大学和阿里达摩学院联合推出的,专门用在视频中对象的感知和推理。基于增强视频大型语言模型(Video LLMs)的空间-时间理解能力,让模型能在视频... Ai项目 2周前4,7300
AIOpsLab – 微软等机构共同开源的面向 AIOps 代理的综合 AI 框架 AIOpsLab是什么 AIOpsLab是微软公司、加州大学伯克利分校、伊利诺伊大学香槟分校、微软研究院等机构推出的,用在构建、评估和改进云服务运营管理AIOps代理的原型框架。AIOpsLab基于模... Ai项目 2周前4,2400
Gemini Coder – AI 应用生成工具,文本描述实时生成代码和预览 Gemini Coder是什么 Gemini Coder 是基于 Google 的 Gemini API、Next.js 和 Tailwind CSS 的工具,用在快速生成 app 应用。Gemini... Ai项目 2周前4,6400