AutoRAG是什么
AutoRAG是中国科学院计算技术研究所(ICT/CAS)、中国科学院的人工智能安全重点实验室及中国科学院大学的研究人员共同推出的新型自主迭代检索模型,专为大型语言模型(LLMs)设计,能增强在知识密集型任务中的表现。AutoRAG基于与检索器的多轮对话,系统地规划检索和细化查询,自主地合成基于推理的决策指令,获取和利用有价值的外部知识。AutoRAG能根据问题的复杂性和检索到的知识的相关性,动态调整迭代次数,无需人为干预,提高性能和效率。
AutoRAG的主要功能
- 自主迭代检索:AutoRAG能与检索器进行多轮对话,自主地进行检索规划和查询细化,获取解决问题所需的外部知识。
- 推理与决策:模型用内部推理能力,决定何时需要检索新信息,及需要检索哪些具体信息。
- 动态调整迭代次数:根据问题的复杂性和检索到的知识的相关性,自主调整与检索器交互的次数。
- 性能提升:在多个基准测试中显示出优越的性能,尤其是在处理复杂和多跳问答任务时。
- 增强可解释性:模型用自然语言形式表达迭代检索过程,提高模型的可解释性,让用户更直观地理解模型的操作。
AutoRAG的技术原理
- 基于LLMs的决策:AutoRAG建立在大型语言模型强大的决策能力之上,基于微调和利用模型实现自主决策。
- 多轮对话:模型与检索器进行多轮交互,模拟人类在解决问题时的信息检索过程。
- 迭代检索过程:将迭代检索视为一个包含多个迭代的对话过程,每个迭代都包括检索规划、信息提取和答案推断。
- 数据构建与训练:自动合成基于推理的决策指令,构建训练数据集,并对LLMs进行监督式微调。
- 推理类型:在迭代检索中融入三种推理类型:检索规划、信息提取和答案推断,模拟人类的认知过程。
- 数据过滤与格式化:在生成数据时,过滤和格式化数据,确保推理和查询的质量,及最终答案的准确性。
AutoRAG的项目地址
- 项目官网:auto-rag.com
- GitHub仓库:https://github.com/Marker-Inc-Korea/AutoRAG
- HuggingFace模型库:https://huggingface.co/AutoRAG
- arXiv技术论文:https://arxiv.org/pdf/2411.19443
AutoRAG的应用场景
© 版权声明
文章版权归作者所有,未经允许请勿转载。