Ai项目 | AI工具导航 | 前沿AI技术资源 | AGI导航 | ChatGPT插件 | RPA自动化 | 智能体 | AGI工具 | AI硬件 | 第31页

FACTS Grounding – 谷歌推出的评估大模型能力的基准测试

FACTS Grounding是什么 FACTS Grounding是谷歌DeepMind推出的评估大型语言模型（LLMs）能力的基准测试，衡量模型根据给定上下文生成事实准确且无捏造信息的文本的能力...

Ai项目

2周前

4,7900

MV-Adapter – 北航联合 VAST 等开源的多视图一致图像生成模型

MV-Adapter是什么 MV-Adapter是多视图一致图像生成模型，是北京航空航天大学、VAST和上海交通大学的研究团队推出的。MV-Adapter能将预训练的文本到图像扩散模型转化为多视图图像...

Ai项目

2周前

6,6500

豆包3D生成模型 – 豆包推出3D生成模型，自然语言交互实时生成3D场景图

豆包3D生成模型是什么豆包3D生成模型是豆包推出的3D生成模型，属于豆包大模型家族。模型基于3D-DiT 架构，能生成高质量 3D 模块。与火山引擎数字孪生平台 veOmniverse 结合使用，能...

Ai项目

2周前

6,7100

豆包视觉理解模型 – 豆包推出视觉理解模型，具备识别和推理能力

豆包视觉理解模型是什么豆包视觉理解模型是豆包推出的先进AI大模型，具备视觉识别和理解推理能力。豆包视觉理解模型具备强大的视觉定位能力，支持多目标、小目标及通用目标的框定位和点定位，支持进行定位计数...

Ai项目

2周前

6,4900

VMB – 中科院联合多所高校机构推出增强多模态音乐生成的框架

VMB是什么 VMB（Visuals Music Bridge）是中国科学院信息工程研究所、中国科学院大学网络空间安全学院、上海人工智能实验室、上海交通大学等机构推出的多模态音乐生成框架，能从文本、图...

Ai项目

2周前

4,9000

NodeTool – AI工作流可视化构建器，拖放节点设计复杂工作流

NodeTool是什么 NodeTool是开源的AI工作流可视化构建器。NodeTool集成广泛的AI工具和模型，基于简单、可视化的界面，让用户无需编码即可快速原型设计和测试。NodeTool支持在本...

Ai项目

2周前

5,2100

ColorFlow – 清华和腾讯共同推出的图像序列着色模型

ColorFlow是什么 ColorFlow是清华大学和腾讯ARC实验室共同推出的图像序列着色模型，能精细化地保持图像序列中个体身份的同时进行着色。基于检索增强、上下文学习和超分辨率技术，ColorF...

Ai项目

2周前

4,0000

Ivy-VL – AI Safeguard联合卡内基梅隆和斯坦福开源的轻量级多模态模型

Ivy-VL是什么 Ivy-VL是AI Safeguard联合卡内基梅隆大学和斯坦福大学推出的轻量级多模态AI模型，专为移动端和边缘设备设计。模型拥有3B参数量，相较于其他多模态大模型，显著降低计算资...

Ai项目

2周前

4,8350

Manga Image Translator – 开源漫画图片文字翻译工具，多语言翻译无缝嵌入原图

Manga Image Translator是什么 Manga Image Translator是开源的漫画图片文字翻译工具，能一键翻译漫画和图片中的文字。Manga Image Translator...

Ai项目

2周前

4,6500

Lyra – SmartMore联合多所高校推出的增强多模态交互能力

Lyra是什么 Lyra是香港中文大学、SmartMore和香港科技大学推出的高效多模态大型语言模型（MLLM），专注于提升语音、视觉和语言模态的交互能力。Lyra基于开源大型模型、多模态LoRA模块...

Ai项目

2周前

5,5150