Shandu – AI研究工具,自动进行多层次信息挖掘和分析 Shandu是什么 Shandu 是开源的 AI 研究自动化工具,结合了 LangChain 和 LangGraph 技术,能自动化地进行多层次信息挖掘和分析,生成结构化的研究报告。Shandu 的核... Ai项目 12个月前05,2800
HiFiVFS – 腾讯联合VIVO推出的高保真视频换脸框架 HiFiVFS是什么 HiFiVFS(High Fidelity Video Face Swapping)是腾讯和VIVO公司推出的高保真视频换脸框架,HiFiVFS基于Stable Video Di... Ai项目 2周前5,2750
OCRmyPDF – 专为 PDF 文件转换为可搜索、可复制的文档AI工具 OCRmyPDF是什么 OCRmyPDF 是开源的命令行工具,专为将扫描的 PDF 文件转换为可搜索、可复制的文档。通过添加 OCR 文本层,将无法直接编辑的扫描 PDF 文件能被搜索和编辑。工具支持... Ai项目 12个月前5,2750
Qwen2.5-Omni-3B – 阿里 Qwen 团队推出的轻量级多模态 AI 模型 Qwen2.5-Omni-3B是什么 Qwen2.5-Omni-3B 是阿里巴巴 Qwen 团队推出的轻量级多模态 AI 模型。是 Qwen2.5-Omni-7B 的精简版,专为消费级硬件设计,支持文... Ai项目 2周前5,2700
Sketch2Lineart – AI绘画工具,自动将手绘草图转换成清晰的线条画 Sketch2Lineart是什么 Sketch2Lineart是基于人工智能的绘画工具,能将简单的手绘草图转换成清晰的线条画。通过自动生成草图描述并据此绘制线条画,支持调整细节适应不同风格。用户只需... Ai项目 2周前5,2700
CAT4D – 谷歌和哥伦比亚大学等高校推出的单目视频创建4D场景方法 CAT4D是什么 CAT4D是Google DeepMind、哥伦比亚大学和加州大学圣地亚哥分校共同推出的,能从单目视频创建4D场景(动态3D)表示。CAT4D基于多视图视频扩散模型,能在任意指定的相... Ai项目 2周前5,2700
DeepSeek-V2.5-1210 – DeepSeek V2.5 的最终版微调模型,支持联网搜索 DeepSeek-V2.5-1210是什么 DeepSeek-V2.5-1210是 DeepSeek 推出的 DeepSeek V2 系列收官AI模型,DeepSeek V2.5 的最终版微调模型。模... Ai项目 2周前5,2700
CodeArena – 用于测试不同LLM编程能力的在线平台 CodeArena是什么 CodeArena是在线平台,基于让多个大型语言模型(LLM)同时构建相同的应用程序,实时显示排名结果,比较LLM生成代码的能力。CodeArena平台主要评估和比较不同LL... Ai项目 2周前5,2700
Lumina-Video – 上海 AI Lab 和港中文推出的视频生成框架 Lumina-Video是什么 Lumina-Video是上海 AI Lab 和香港中文大学推出的视频生成框架,基于Next-DiT架构,针对视频生成中的时空复杂性进行优化。基于多尺度Next-DiT... Ai项目 12个月前05,2700
BrowseComp – OpenAI 开源的 AI Agent 网络浏览能力基准 BrowseComp是什么 BrowseComp 是 OpenAI 开源的用于评估 AI Agent网络浏览能力的基准测试。包含 1266 个极具挑战性的问题,覆盖电影、科学与技术、艺术、历史、体育... Ai项目 12个月前05,2700