BrowseComp – OpenAI 开源的 AI Agent 网络浏览能力基准 BrowseComp是什么 BrowseComp 是 OpenAI 开源的用于评估 AI Agent网络浏览能力的基准测试。包含 1266 个极具挑战性的问题,覆盖电影、科学与技术、艺术、历史、体育... Ai项目 5个月前02,5600
NodeRAG – 开源基于异构图的智能检索与生成系统 NodeRAG是什么 NodeRAG 是基于异构图的检索增强生成(Retrieval-Augmented Generation,RAG)系统。通过构建包含多种节点类型的异构图,将文档信息和语言模型生成... Ai项目 4个月前2,5550
OminiControl – AI图像生成框架,实现图像主题控制和空间精确控制 OminiControl是什么 OminiControl是高度通用且参数高效的图像生成框架,为扩散变换器模型如FLUX.1设计,实现对图像生成过程的精细控制。OminiControl支持主题驱动控制和... Ai项目 5个月前2,5550
GenMAC – 港大、清华联合微软推出文本到视频生成的多代理协作框架 GenMAC是什么 GenMAC是香港大学、清华大学和微软研究院推出的多代理协作的迭代框架,用在解决文本到视频生成中的复杂场景生成问题。基于将任务分解为设计、生成和重新设计三个阶段,在生成与重新设计之... Ai项目 5个月前2,5550
JoyGen – 京东和港大推出音频驱动的3D说话人脸视频生成框架 JoyGen是什么 JoyGen是京东科技和香港大学推出的,音频驱动的3D说话人脸视频生成框架,专注于实现精确的唇部与音频同步及高质量的视觉效果。JoyGen结合音频特征和面部深度图,驱动唇部运动的生... Ai项目 5个月前2,5550
WorldCraft – 港科大推出的3D虚拟世界创建和定制系统 WorldCraft是什么 WorldCraft是香港科技大学推出的基于大型语言模型(LLM)代理的3D世界创建和定制系统,用在创建和定制逼真的3D虚拟世界。基于自然语言交互,让用户能轻松生成复杂的室... Ai项目 5个月前02,5550
OpenAI o3 – OpenAI推出的新一代最强推理模型 OpenAI o3是什么 OpenAI o3模型是继o1之后的新一代推理模型,是 OpenAI 首次将图像推理融入思维链的模型,能直接在思维链中思考图像。用户可以上传模糊、颠倒或低质量的图像,模型依然... Ai项目 5个月前2,5500
AutoMouser – AI Chrome扩展程序,实时交互跟踪自动生成测试代码 AutoMouser是什么 AutoMouser是Chrome扩展程序,能智能地跟踪用户交互,基于OpenAI的GPT模型自动生成Selenium测试代码。通过记录用户的浏览器操作,如点击、拖动、悬停... Ai项目 5个月前2,5500
AnyCharV – 港中文联合清华等机构推出的角色可控视频生成框架 AnyCharV是什么 AnyCharV是香港中文大学、清华大学深圳国际研究生院、香港大学联合推出的角色可控视频生成框架,能将任意参考角色图像与目标驱动视频相结合,生成高质量的角色视频。AnyChar... Ai项目 5个月前02,5500
Omnitool – 开源 AI 桌面,支持多种主流AI平台和服务 Omnitool是什么 Omnitool是开源的AI桌面环境,为用户提供统一的交互界面,能快速接入和使用多种AI模型。Omnitool支持本地运行,能在Mac、Windows或Linux设备上安装,数... Ai项目 5个月前02,5500