ToddlerBot – 斯坦福大学开源的机器学习与人形机器人平台 ToddlerBot是什么 ToddlerBot是斯坦福大学开源的用在运动操作的开源机器学习与人形机器人平台,为高效收集大规模、高质量的训练数据设计。ToddlerBot具备30个主动自由度,用Dyn... Ai项目 12个月前04,0550
Phantom – 字节跳动推出的主体一致视频生成框架 Phantom是什么 Phantom是字节跳动智能创作团队推出的用在主体一致视频生成(Subject-to-Video, S2V)的框架。基于跨模态对齐技术,结合文本和图像提示,从参考图像中提取主体元... Ai项目 12个月前06,5250
Aider – 开源AI编程助手,基于命令行指定自动完成代码修改 Aider是什么 Aider 是开源的AI辅助编程工具,基于终端与大型语言模型(LLM)配合,实现高效代码编辑和开发。Aider支持多种编程语言,如 Python、JavaScript、TypeScr... Ai项目 12个月前05,5000
TongGeometry – 北京通院联合北大AI研究院推出的几何模型 TongGeometry是什么 TongGeometry 是北京通用AI研究院和北京大学AI研究所联合推出的基于树搜索的几何模型,专门用在提出和解决奥林匹克级别的几何问题。TongGeometry基于... Ai项目 12个月前05,1800
Magma – 微软研究院联合华盛顿等高校推出的多模态AI基础模型 Magma是什么 Magma 是微软研究院推出的新型多模态AI基础模型,能为多模态人工智能代理(AI agents)提供通用能力。Magma能理解和执行多模态输入的任务,覆盖数字和物理环境。Magma... Ai项目 12个月前04,1750
流畅阅读 – 开源AI浏览器翻译插件,支持双语对照显示 流畅阅读是什么 流畅阅读(FluentRead)是开源的浏览器翻译插件,致力于为用户提供类似母语的阅读体验。流畅阅读基于先进的AI技术,支持多种翻译引擎,包括传统机器翻译和AI大模型翻译,支持用户自定... Ai项目 12个月前04,2350
Muse – 微软研究院推出的生成式AI模型 Muse是什么 Muse是微软推出的首个用在游戏创意生成的生成式AI模型,基于“World and Human Action Model”(WHAM)。Muse能生成游戏视觉效果和控制器操作,基于学习... Ai项目 12个月前05,1500
HealthGPT – 浙大联合阿里等机构推出的医学视觉语言模型 HealthGPT是什么 HealthGPT 是浙江大学、电子科技大学、阿里巴巴等多家机构联合开发的先进的医学视觉语言模型(Med-LVLM),通过异构知识适应技术实现医学视觉理解和生成任务的统一框架... Ai项目 12个月前05,0200
PaliGemma 2 mix – 谷歌DeepMind推出的升级版视觉语言模型 PaliGemma 2 mix是什么 PaliGemma 2 Mix是谷歌DeepMind发布的最新多任务视觉语言模型(VLM)。集成了多种视觉和语言处理能力,支持图像描述、目标检测、图像分割、OCR... Ai项目 12个月前04,3300
FlexTok – Apple 联合 EPFL 推出的图像处理技术 FlexTok是什么 FlexTok 是瑞士洛桑联邦理工学院(EPFL)和苹果公司联合开发的图像处理技术。通过将二维图像重新采样为一维离散标记序列(token sequences),以灵活的长度描述图... Ai项目 12个月前05,1450