Ai项目 | AI工具导航 | 前沿AI技术资源 | AGI导航 | ChatGPT插件 | RPA自动化 | 智能体 | AGI工具 | AI硬件 | 第92页

TongGeometry – 北京通院联合北大AI研究院推出的几何模型

TongGeometry是什么 TongGeometry 是北京通用AI研究院和北京大学AI研究所联合推出的基于树搜索的几何模型，专门用在提出和解决奥林匹克级别的几何问题。TongGeometry基于...

Ai项目

12个月前

05,1800

Magma – 微软研究院联合华盛顿等高校推出的多模态AI基础模型

Magma是什么 Magma 是微软研究院推出的新型多模态AI基础模型，能为多模态人工智能代理（AI agents）提供通用能力。Magma能理解和执行多模态输入的任务，覆盖数字和物理环境。Magma...

Ai项目

12个月前

04,1750

流畅阅读 – 开源AI浏览器翻译插件，支持双语对照显示

流畅阅读是什么流畅阅读（FluentRead）是开源的浏览器翻译插件，致力于为用户提供类似母语的阅读体验。流畅阅读基于先进的AI技术，支持多种翻译引擎，包括传统机器翻译和AI大模型翻译，支持用户自定...

Ai项目

12个月前

04,2350

Muse – 微软研究院推出的生成式AI模型

Muse是什么 Muse是微软推出的首个用在游戏创意生成的生成式AI模型，基于“World and Human Action Model”（WHAM）。Muse能生成游戏视觉效果和控制器操作，基于学习...

Ai项目

12个月前

05,1500

HealthGPT – 浙大联合阿里等机构推出的医学视觉语言模型

HealthGPT是什么 HealthGPT 是浙江大学、电子科技大学、阿里巴巴等多家机构联合开发的先进的医学视觉语言模型（Med-LVLM），通过异构知识适应技术实现医学视觉理解和生成任务的统一框架...

Ai项目

12个月前

05,0200

PaliGemma 2 mix – 谷歌DeepMind推出的升级版视觉语言模型

PaliGemma 2 mix是什么 PaliGemma 2 Mix是谷歌DeepMind发布的最新多任务视觉语言模型（VLM）。集成了多种视觉和语言处理能力，支持图像描述、目标检测、图像分割、OCR...

Ai项目

12个月前

04,3300

FlexTok – Apple 联合 EPFL 推出的图像处理技术

FlexTok是什么 FlexTok 是瑞士洛桑联邦理工学院（EPFL）和苹果公司联合开发的图像处理技术。通过将二维图像重新采样为一维离散标记序列（token sequences），以灵活的长度描述图...

Ai项目

12个月前

05,1450

Helix – Figure 推出的端到端通用控制模型

Helix是什么 Helix 是 Figure 推出的通用视觉-语言-动作（VLA）模型，用于人形机器人的控制。Helix首创性地实现对机器人整个上身（包括手腕、躯干、头部和手指）的高速率（200Hz...

Ai项目

12个月前

04,0550

BioEmu – 微软推出的生成式深度学习系统

BioEmu是什么 BioEmu是微软研究院推出的生成式深度学习系统，高效模拟蛋白质的动态结构和平衡态构象。能在单个GPU上每小时生成数千种蛋白质结构样本，效率远超传统的分子动力学（MD）模拟。通过结...

Ai项目

12个月前

04,8400

OSUM – 西北工业大学开源的语音理解模型

OSUM是什么 OSUM（Open Speech Understanding Model）是西北工业大学计算机学院音频、语音与语言处理研究组推出的开源语音理解模型。OSUM结合Whisper编码器和Q...

Ai项目

12个月前

04,9600