node-DeepResearch – Deep Research开源复现版 AI Agent,支持多步推理和复杂查询 node-DeepResearch是什么 node-DeepResearch 是开源的 AI 智能体项目,基于持续搜索和阅读网页,用 Gemini 语言模型和 Jina Reader 工具,逐步推理... Ai项目 5个月前1,9850
OmniHuman – 字节跳动推出的单张照片生成全身动态视频生成框架 OmniHuman是什么 OmniHuman是字节跳动推出的端到端多模态条件化人类视频生成框架,能基于单张人类图像和运动信号(如音频、视频或两者的组合)生成逼真的人类视频。OmniHuman基于多模态... Ai项目 5个月前2,1800
DeepRAG – 中科院、中科大和腾讯微信AI部联合推出的新型检索增强生成框架 DeepRAG是什么 DeepRAG 是中科院、中科大和腾讯微信AI部联合推出的新型检索增强生成(RAG)框架,提升大型语言模型(LLMs)在推理和检索任务中的性能。通过将检索增强推理建模为马尔可夫决... Ai项目 5个月前2,1200
MnnLlmApp – 阿里巴巴开源的离线大模型 Android 手机应用AI助手 MnnLlmApp是什么 MnnLlmApp 是阿里巴巴基于 MNN-LLM 框架开源的 Android 手机应用,支持各类大语言模型(LLM)在手机上离线运行。具备多模态功能,能实现文本生成文本、图... Ai项目 5个月前2,5850
DynamicFace – 小红书联合上海交大等推出的视频换脸技术 DynamicFace是什么 DynamicFace是小红书团队推出新型的视频换脸技术,技术通过结合扩散模型和即插即用的时间层,基于3D面部先验知识,实现高质量和一致性的视频换脸效果。 Dynamic... Ai项目 5个月前2,5550
Gemini 2.0 Pro – 谷歌推出的高性能多模态AI模型 Gemini 2.0 Pro是什么 Gemini 2.0 Pro是Google推出的高性能实验版AI模型,专为编程性能和复杂提示处理优化。Gemini 2.0 Pro具备200万tokens的超大上下... Ai项目 5个月前4,8900
Open Deep Research – Deep Research开源复现版智能体,支持切换多种语言模型 Open Deep Research是什么 Open Deep Research 是开源的 AI 智能体,是Deep Research开源复现项目,基于推理大量网络数据完成复杂的多步骤研究任务。Ope... Ai项目 5个月前3,7900
Chatbox AI – 开源的AI客户端助手,支持多种主流AI模型 Chatbox AI是什么 Chatbox AI是开源的跨平台AI客户端应用和智能助手,支持 Windows、Mac、Linux、iOS、Android 和网页版,集成多种先进的语言模型(如 Chat... Ai项目 5个月前3,8750
RAG-FiT – 英特尔实验室推出用于开发、增强大模型的开源RAG框架 RAG-FiT是什么 RAG-FiT(曾用名RAG Foundry)是英特尔实验室推出的开源框架,用在微调(fine-tuning)增强大型语言模型(LLMs)在检索增强生成(RAG)任务中的表现。R... Ai项目 5个月前2,4750
FluxSR – 上海交大联合华为等高校推出的图像超分辨率模型 FluxSR是什么 FluxSR是新型的单步扩散模型,是上海交通大学、哈佛大学、华南理工大学和华为诺亚方舟实验室推出的专门用在真实世界图像超分辨率(Real-ISR)任务。FluxSR基于FLUX.1... Ai项目 5个月前2,3900