TongGeometry – 北京通院联合北大AI研究院推出的几何模型 TongGeometry是什么 TongGeometry 是北京通用AI研究院和北京大学AI研究所联合推出的基于树搜索的几何模型,专门用在提出和解决奥林匹克级别的几何问题。TongGeometry基于... Ai项目 12个月前05,1800
Magma – 微软研究院联合华盛顿等高校推出的多模态AI基础模型 Magma是什么 Magma 是微软研究院推出的新型多模态AI基础模型,能为多模态人工智能代理(AI agents)提供通用能力。Magma能理解和执行多模态输入的任务,覆盖数字和物理环境。Magma... Ai项目 12个月前04,1750
流畅阅读 – 开源AI浏览器翻译插件,支持双语对照显示 流畅阅读是什么 流畅阅读(FluentRead)是开源的浏览器翻译插件,致力于为用户提供类似母语的阅读体验。流畅阅读基于先进的AI技术,支持多种翻译引擎,包括传统机器翻译和AI大模型翻译,支持用户自定... Ai项目 12个月前04,2350
Muse – 微软研究院推出的生成式AI模型 Muse是什么 Muse是微软推出的首个用在游戏创意生成的生成式AI模型,基于“World and Human Action Model”(WHAM)。Muse能生成游戏视觉效果和控制器操作,基于学习... Ai项目 12个月前05,1500
HealthGPT – 浙大联合阿里等机构推出的医学视觉语言模型 HealthGPT是什么 HealthGPT 是浙江大学、电子科技大学、阿里巴巴等多家机构联合开发的先进的医学视觉语言模型(Med-LVLM),通过异构知识适应技术实现医学视觉理解和生成任务的统一框架... Ai项目 12个月前05,0200
PaliGemma 2 mix – 谷歌DeepMind推出的升级版视觉语言模型 PaliGemma 2 mix是什么 PaliGemma 2 Mix是谷歌DeepMind发布的最新多任务视觉语言模型(VLM)。集成了多种视觉和语言处理能力,支持图像描述、目标检测、图像分割、OCR... Ai项目 12个月前04,3300
FlexTok – Apple 联合 EPFL 推出的图像处理技术 FlexTok是什么 FlexTok 是瑞士洛桑联邦理工学院(EPFL)和苹果公司联合开发的图像处理技术。通过将二维图像重新采样为一维离散标记序列(token sequences),以灵活的长度描述图... Ai项目 12个月前05,1450
Helix – Figure 推出的端到端通用控制模型 Helix是什么 Helix 是 Figure 推出的通用视觉-语言-动作(VLA)模型,用于人形机器人的控制。Helix首创性地实现对机器人整个上身(包括手腕、躯干、头部和手指)的高速率(200Hz... Ai项目 12个月前04,0550
BioEmu – 微软推出的生成式深度学习系统 BioEmu是什么 BioEmu是微软研究院推出的生成式深度学习系统,高效模拟蛋白质的动态结构和平衡态构象。能在单个GPU上每小时生成数千种蛋白质结构样本,效率远超传统的分子动力学(MD)模拟。通过结... Ai项目 12个月前04,8400
OSUM – 西北工业大学开源的语音理解模型 OSUM是什么 OSUM(Open Speech Understanding Model)是西北工业大学计算机学院音频、语音与语言处理研究组推出的开源语音理解模型。OSUM结合Whisper编码器和Q... Ai项目 12个月前04,9600