Ai项目 | AI工具导航 | 前沿AI技术资源 | AGI导航 | ChatGPT插件 | RPA自动化 | 智能体 | AGI工具 | AI硬件 | 第14页

SPRIGHT – 专注于空间关系的大型视觉语言数据集

SPRIGHT是什么 SPRIGHT（SPatially RIGHT）是亚利桑那州立大学、Intel 实验室、Hugging Face 、华盛顿大学等机构联合推出的，专注于空间关系的大型视觉-语言...

Ai项目

2周前

6,4100

VideoRAG – 用于长视频理解的检索增强生成技术

VideoRAG是什么 VideoRAG是用于长视频理解的检索增强生成（Retrieval-Augmented Generation）技术。通过提取视频中的视觉对齐辅助文本，帮助大型视频语言模型（LV...

Ai项目

2周前

4,5600

Mobile-Agent – 自主多模态移动设备代理，通过视觉感知实现智能化手机操作

Mobile-Agent是什么 Mobile-Agent 是具有移动性的智能代理软件实体，能在网络的各个节点之间移动，代表用户或其他代理进行工作。能根据具体情况中断当前执行，移动至另一设备上恢复运行...

Ai项目

2周前

4,6250

Edicho – 蚂蚁集团联合港科大等高校推出的多图像一致性编辑方法

Edicho是什么 Edicho 是香港科技大学、蚂蚁集团、斯坦福大学和香港中文大学推出的，基于扩散模型的图像编辑方法，能在多图像间实现一致性编辑。Edicho用免训练的方法，无需额外训练即可应用。E...

Ai项目

2周前

7,6700

CHRONOS – 阿里通义联合上海交大等推出时间线摘要生成新框架

CHRONOS是什么 CHRONOS是上海交通大学计算机科学与工程系、阿里巴巴集团通义实验室等机构联合推出的，用在新闻时间线摘要生成的新型框架，基于迭代自问自答的方式，用大型语言模型（LLMs）构建开...

Ai项目

2周前

6,3350

麦橘超然 – 麦橘推出的AI文生图模型，基于 Flux.1 架构

麦橘超然是什么麦橘超然（MajicFlus）是麦橘推出的基于Flux.1架构的AI模型，专注于生成高质量的人像图像，擅长表现亚洲女性的细腻与美感。模型融合多种技术，能生成逼真的人物摄影风格，细致呈现...

Ai项目

2周前

4,5300

JoyCaption – 开源的图像提示词生成工具

JoyCaption是什么 JoyCaption 是开源的图像提示词生成工具，用于训练扩散模型。JoyCaption 涵盖广泛的图像风格、内容、种族、性别和取向，最小化过滤理解世界的各个方面，但不支持...

Ai项目

2周前

4,8300

VideoRefer – 浙大联合阿里达摩学院推出的视频对象感知与推理技术

VideoRefer是什么 VideoRefer是浙江大学和阿里达摩学院联合推出的，专门用在视频中对象的感知和推理。基于增强视频大型语言模型（Video LLMs）的空间-时间理解能力，让模型能在视频...

Ai项目

2周前

4,7300

AIOpsLab – 微软等机构共同开源的面向 AIOps 代理的综合 AI 框架

AIOpsLab是什么 AIOpsLab是微软公司、加州大学伯克利分校、伊利诺伊大学香槟分校、微软研究院等机构推出的，用在构建、评估和改进云服务运营管理AIOps代理的原型框架。AIOpsLab基于模...

Ai项目

2周前

4,2400

Gemini Coder – AI 应用生成工具，文本描述实时生成代码和预览

Gemini Coder是什么 Gemini Coder 是基于 Google 的 Gemini API、Next.js 和 Tailwind CSS 的工具，用在快速生成 app 应用。Gemini...

Ai项目

2周前

4,6400