OCRmyPDF – 专为 PDF 文件转换为可搜索、可复制的文档AI工具 OCRmyPDF是什么 OCRmyPDF 是开源的命令行工具,专为将扫描的 PDF 文件转换为可搜索、可复制的文档。通过添加 OCR 文本层,将无法直接编辑的扫描 PDF 文件能被搜索和编辑。工具支持... Ai项目 5个月前2,8950
WebThinker – 人民大学联合智源研究院等机构推出的深度研究智能体 WebThinker是什么 WebThinker是中国人民大学、北京智源人工智能研究院和华为泊松实验室等机构提出的深度研究智能体。WebThinker赋能大型推理模型(LRMs)在推理过程中自主进行网... Ai项目 4个月前2,8900
X-AnyLabeling – AI图像标注工具,支持图像和视频多样化标注样式 X-AnyLabeling是什么 X-AnyLabeling是集成多种深度学习算法的图像标注软件,专注于提升标注效率和精度。X-AnyLabeling支持图像和视频的多样化标注样式,适配多种AI训练场... Ai项目 5个月前2,8900
SigStyle – 吉大联合 Adobe 等机构推出的风格迁移框架 SigStyle是什么 SigStyle 是吉林大学、南京大学智能科学与技术学院及Adobe推出的新型签名风格迁移框架,支持将单张风格图像中独特的视觉特征(如几何结构、色彩搭配、笔触等)无缝迁移到内容... Ai项目 5个月前02,8900
DCEdit – 北交大联合美图推出的双层控制图像编辑方法 DCEdit是什么 DCEdit 是新型的双层控制图像编辑方法,是北京交通大学和美图2MT实验室联合推出的。DCEdit基于精确语义定位策略(PSL),用视觉和文本自注意力优化交叉注意力图,提供更精准... Ai项目 5个月前02,8900
文心大模型4.5 Turbo – 百度推出的最新多模态大模型 文心大模型4.5 Turbo是什么 文心大模型4.5 Turbo是百度推出的高性能、低成本多模态大模型。基于文心大模型4.5的基础上进行优化,具备多模态、强推理能力,能处理文本、图像等多种输入形式。相... Ai项目 5个月前2,8800
Avat3r – 慕尼黑大学联合 Meta 推出的 3D 高斯头像生成模型 Avat3r是什么 Avat3r 是慕尼黑工业大学和 Meta Reality Labs 推出的高保真三维头部头像的大型可动画高斯重建模型,仅需几张输入图像,能生成高质量且可动画化的 3D 头部头像... Ai项目 5个月前02,8800
Promptriever – 信息检索模型,支持自然语言提示响应用户搜索需求 Promptriever是什么 Promptriever 是约翰斯·霍普金斯大学和Samaya AI联合推出的新型检索模型,能像语言模型一样接受自然语言提示,用直观的方式响应用户的搜索需求。Promp... Ai项目 5个月前2,8750
HiFiVFS – 腾讯联合VIVO推出的高保真视频换脸框架 HiFiVFS是什么 HiFiVFS(High Fidelity Video Face Swapping)是腾讯和VIVO公司推出的高保真视频换脸框架,HiFiVFS基于Stable Video Di... Ai项目 5个月前2,8750
Hali – 特斯联Buttons推出的多模态多智能体协作Agent Hali是什么 Hali是特斯联联合国际轻奢品牌Buttons推出的多模态多智能体协作AI Agent。Hali具备类人思考、长记忆、物理世界感知和多智能体协作四大特点,语义理解准确率超97%,中英文... Ai项目 5个月前2,8700