MedRAX – AI医学推理Agent,用于胸部X光检查和解决复杂医学问题 MedRAX是什么 MedRAX(Medical Reasoning Agent for Chest X-ray)是专门用于胸部X光检查的医学推理AI代理。通过整合最先进的胸部X光分析工具和多模态大型... Ai项目 12个月前05,1700
LangBot – 多模态即时聊天机器人构建与管理的开源平台 LangBot是什么 LangBot 是开源的即时聊天机器人平台,支持多平台(如 QQ、微信、飞书、Discord 等)和多种大语言模型(如 ChatGPT、DeepSeek、Gemini 等)。La... Ai项目 12个月前04,9650
LLMDet – 阿里通义联合中山大学等机构推出的开放词汇目标检测模型 LLMDet是什么 LLMDet是阿里巴巴集团通义实验室、中山大学计算机科学与工程学院、鹏城实验室等机构推出的开放词汇目标检测器,基于与大型语言模型(LLM)协同训练提升目标检测性能。LLMDet能收... Ai项目 12个月前05,2100
VisoMaster – AI换脸和编辑软件,支持图片和视频高质量换脸 VisoMaster是什么 VisoMaster 是基于 AI 技术的换脸和编辑软件,功能强大操作简便。支持图片、视频以及直播换脸,能生成自然逼真的换脸效果,应用于娱乐、影视制作等领域。支持多种输入输... Ai项目 12个月前04,7650
FlashVideo – 字节联合港大推出的高分辨率视频生成框架 FlashVideo是什么 FlashVideo是字节跳动团队提出的高效的高分辨率视频生成框架,通过两阶段方法解决了传统单阶段扩散模型在高分辨率视频生成中面临的巨大计算成本问题。在第一阶段,Flash... Ai项目 12个月前05,0400
ACE++ – 阿里通义推出的升级版图像生成与编辑模型 ACE++是什么 ACE++是阿里巴巴通义实验室推出的先进的图像生成与编辑工具,通过指令化和上下文感知的内容填充技术,实现了高质量的图像创作和编辑功能。ACE++ 提供多种模型,分别针对不同任务:AC... Ai项目 12个月前04,7500
LLaVA-Rad – 微软推出的小型多模态模型,专注于临床放射学报告生成 LLaVA-Rad是什么 LLaVA-Rad是微软研究院推出的小型多模态模型,专注于临床放射学报告生成。是LLaVA-Med项目的分支,特别是胸部X光(CXR)成像。基于LLaVA-Med的基础架构和... Ai项目 12个月前05,4050
Satori – 开源的大语言推理模型,具备自回归搜索和自我纠错能力 Satori是什么 Satori是 MIT、哈佛大学等机构研究者推出的 7B 参数的大型语言模型,专注于提升推理能力。基于Qwen-2.5-Math-7B,Satori通过小规模的格式微调和大规模的增... Ai项目 12个月前05,2300
Goku – 港大和字节联合推出的最新视频生成模型 Goku是什么 Goku是香港大学和字节跳动联合发布的最新视频生成模型,专为图像和视频的联合生成设计。基于先进的rectified flow Transformer框架,支持文生视频、图生视频及文生图... Ai项目 12个月前04,7200
AnythingLLM – 开源的全栈 AI 客户端,支持本地部署和API集成 AnythingLLM是什么 AnythingLLM 是开源免费且支持多模态交互的全栈 AI 客户端。AnythingLLM支持文本、图像和音频等多种输入方式,将任何文档或内容转化为上下文,供各种语言... Ai项目 12个月前05,2400