AutoConsis – 美团联合复旦大学推出的UI内容一致性AI检测工具 AutoConsis是什么 AutoConsis是UI内容一致性智能检测工具,是美团技术团队与复旦大学联合推出的。工具基于深度学习和大型语言模型自动识别和提取界面中的关键数据,检测并识别数据间的不一致... Ai项目 2周前5,9550
GigaTok – 港大联合字节推出用于自回归图像生成的视觉分词器 GigaTok是什么 GigaTok 是用于自回归图像生成的视觉分词器,参数量达 30 亿。通过语义正则化技术,将分词器特征与预训练视觉编码器(如 DINOv2)的语义特征对齐,有效约束潜在空间复杂度... Ai项目 12个月前05,9550
CorrDiff – NVIDIA 推出的生成式 AI 模型,专注于全球气象数据 CorrDiff是什么 CorrDiff 是 NVIDIA 推出的生成式 AI 模型,用于将低分辨率的全球天气数据下采样为高分辨率数据,提高天气预测的准确性和效率。采用两步法处理数据:首先通过 UNe... Ai项目 12个月前05,9250
Ingredients – 多ID照片定制视频生成框架,基于多ID照片与视频扩散相结合 Ingredients是什么 Ingredients是强大的框架,基于将多个特定身份(ID)照片与视频扩散Transformer相结合,用在定制视频创作。Ingredients基于三个核心模块实现高度... Ai项目 2周前5,9200
Liquid – 华中科技、字节、港大联合推出的统一多模态生成框架 Liquid是什么 Liquid是华中科技大学、字节跳动和香港大学联合推出的极简统一多模态生成框架。基于VQGAN将图像编码为离散的视觉token,与文本token共享同一词汇空间,让大型语言模型(L... Ai项目 12个月前05,9200
Micro LLAMA – 教学版 LLAMA 3模型实现,用于学习大模型的核心原理 Micro LLAMA是什么 Micro LLAMA是精简的教学版LLAMA 3模型实现,能帮助学习者理解大型语言模型架构。整个项目仅约180行代码,便于理解和学习。Micro LLAMA用的是LLA... Ai项目 2周前5,9150
UniReal – 港大联合 Adobe 推出的通用图像生成和编辑框架 UniReal是什么 UniReal是香港大学和Adobe研究院共同推出的框架,专注于实现多种图像生成和编辑任务。框架基于模拟现实世界动态,能在单一模型中处理包括图像生成、编辑、定制和合成在内的广泛任... Ai项目 2周前5,9100
InternVL – OpenGVLab 推出的多模态大模型 InternVL是什么 InternVL 是上海人工智能实验室 OpenGVLab 推出的多模态大模型,专注于视觉与语言任务。采用 ViT-MLP-LLM 架构,通过视觉模块(如 InternViT... Ai项目 12个月前05,9000
InspireMusic – 阿里通义实验室开源的音乐生成技术 InspireMusic是什么 InspireMusic 是阿里巴巴通义实验室开源的音乐生成技术,通过人工智能为用户生成高质量的音乐作品。基于多模态大模型技术,支持通过简单的文字描述或音频提示快速生成... Ai项目 12个月前05,8950
LazyGraphRAG – 微软推出的图形增强生成增强检索框架 LazyGraphRAG是什么 LazyGraphRAG是微软研究院推出的图形增强生成增强检索(RAG)框架,是GraphRAG的迭代版本。LazyGraphRAG在数据索引成本上大幅降低,是Grap... Ai项目 2周前5,8900