Airweave – 将任何应用程序转为 Agent 知识库的开源工具 Airweave是什么 Airweave 是开源工具,能将任何应用程序的数据(包括API、数据库、网站等)同步到图数据库和向量数据库中,让数据能基于智能代理或搜索机制进行检索。Airweave用数据分... Ai项目 5个月前02,4650
Yuxi-Know – 基于大模型 RAG 知识库的 AI 知识图谱问答平台 Yuxi-Know是什么 Yuxi-Know(语析)是基于大模型RAG知识库与知识图谱技术构建的智能问答平台。Yuxi-Know支持多种知识库文件格式(如PDF、TXT、MD、Docx),支持将文件内... Ai项目 5个月前02,4650
DynaSaur – Adobe 推出的大语言模型代理框架 DynaSaur是什么 DynaSaur是Adobe Research推出的大型语言模型(LLM)代理框架,突破传统LLM代理系统受限于预定义动作集合的限制。框架支持代理动态创建和组合动作,基于生成和... Ai项目 5个月前2,4600
MagicDriveDiT – 华为联合港中文等机构推出的自动驾驶高分辨率长视频生成方法 MagicDriveDiT是什么 MagicDriveDiT是香港中文大学、香港科技大学、华为云和华为诺亚方舟实验室共同推出基于DiT架构的新型视频生成方法,专为自动驾驶应用设计,实现高分辨率和长视频... Ai项目 5个月前2,4600
MarkItDown – 微软开源的多功能、多格式文档转Markdown工具 MarkItDown是什么 MarkItDown是微软开源的多功能文档转换工具,能将PDF、PPT、Word、Excel、图像、音频、HTML等多种格式的文件转换成Markdown格式。支持OCR文字... Ai项目 5个月前2,4600
SocioVerse – 复旦大学联合小红书等机构开源的社会模拟世界模型 SocioVerse是什么 SocioVerse(众生) 是复旦大学、上海创智学院、罗切斯特大学和小红书联合推出的社会模拟世界模型。基于大语言模型(LLM)驱动的智能体和包含1000万真实用户的数据池... Ai项目 5个月前2,4600
Emotion-LLaMA – 多模态情绪识别与推理模型,融合音频、视觉和文本输入 Emotion-LLaMA是什么 Emotion-LLaMA是多模态情绪识别与推理模型,融合了音频、视觉和文本输入,通过特定情绪编码器整合信息。模型基于修改版LLaMA,经指令调整以提升情感识别能力... Ai项目 5个月前2,4600
H-Optimus-0 – 法国初创公司Bioptimus开源的病理学AI基础模型 H-Optimus-0是什么 H-Optimus-0是法国初创公司Bioptimus发布的世界上最大的开源病理学AI基础模型。模型拥有11亿参数,是在专有数据集上训练的,数据集包含从4000个临床实践... Ai项目 5个月前2,4600
WorldSense – 小红书联合上海交大推出的多模态全面评测新基准 WorldSense是什么 WorldSense是小红书和上海交通大学推出的,用在评估多模态大型语言模型(MLLMs)在现实世界场景中对视觉、听觉和文本输入的综合理解能力的基准测试。WorldSens... Ai项目 5个月前02,4600
XMusic – 腾讯多媒体实验室自主研发的AI通用作曲框架 XMusic是什么 XMusic是腾讯多媒体实验室自主研发的AI通用作曲框架。用户只需上传视频、图片、文字、标签、哼唱等任意内容,XMusic能生成情绪、曲风、节奏可控的高质量音乐。基于自研的多模态和... Ai项目 5个月前2,4550