在这一期咖啡休息室概念中,我们将了解AgenticRAG如何帮助解决传统RAG的局限性。
RAG 框架RAG(检索增强生成)框架按照特定的顺序运行:
文档 -> 文本块 -> 向量数据库 -> 文本块检索(Top K)-> 大型语言模型
然而,当处理某些类型的查询时,这个序列会遇到障碍。
传统RAG管道
问题1:摘要生成考虑一个查询如“总结文档”。
- 传统的 RAG 方法检索 top K 个片段并对其进行总结。
- 但是,如果检索文档中的所有片段并对其进行总结,岂不是更全面吗?
RAG 的摘要问题
问题2:比较文档- 当被要求比较文档A和文档B时,基本的RAG会随机检索一些片段并尝试比较这些Top K片段。
- 这并不能准确地反映情况,因为它不能代表文档的全部内容。
问题2:比较文档
问题3:结构化数据分析考虑一个问题如“下一次休假是什么时候?”。
- 第一步是从结构化表格中检索员工所属的地区。
- 根据地区,从请假政策文档中提取该地区的下一个假期。
- 使用当前的RAG框架,这个过程并不像上述步骤那样直接。
问题3:结构化数据分析
问题4:多部分问题考虑一个问题如“识别所有地区的通用假期?”。
- 想象一下,你有一份公司在120个国家使用的请假政策文件。
- 由于你传递的是前K个上下文,可以比较的最大区域数量限制为K,其中K是传递给LLM的块的数量。
问题4:多部分问题
查看我们的 AgenticRAG with LlamaIndex 课程,包含 5个真实案例研究。
课程链接: https://www.masteringllm.com/course/agentic-retrieval-augmented-generation-agenticrag
新课程:使用LlamaIndex的AgenticRAG新的AgenticRAG与LlamaIndex课程包括5个实时案例研究和代码示例masteringllm.medium.com Agentic RAGAgentic RAG 可以通过自定义代理替换来解决这四个问题。
- 代理将与多个系统交互。
- RAG 现在是该系统的一部分,代理可以使用它。
Agentic RAG
- 代理使用LLM来自动化推理和工具选择
- RAG只是代理可能决定使用的另一种工具。
- 路由代理是简单的代理,用于路由查询。
- 一个代理可以将查询路由到一个或多个工具。
- 记住我们的问题“总结文档”或如果我们想结合“总结+语义搜索”的问题,可以使用下面的路由示例来解决。
路由代理
查询规划代理- 查询规划代理将查询分解为子查询。
- 每个子查询都可以在RAG管道上执行。
查询规划代理
基于代理的工具- 大型语言模型(LLMs)可以拥有多种工具,例如调用API、推断API参数。
- RAG现在是LLM可能使用的一种工具。
工具 For 代理
概要- RAG 在处理复杂问题时存在局限性。
- 一些用例,如摘要、比较等,仅靠 RAG 无法解决。
- Agentic RAG 可以帮助克服 RAG 的局限性。
- Agentic RAG 将 RAG 视为可以用于语义搜索的工具。
- 配备了路由、查询规划和工具的代理可以超越传统 RAG 应用程序的表现。
查看我们的 AgenticRAG with LlamaIndex Course,包含5个真实的案例研究。
基于LlamaIndex的Agentic检索增强生成(AgenticRAG)学习基于LlamaIndex学习Agentic检索增强生成(AgenticRAG)。克服传统RAG的挑战……www.masteringllm.com 所有之前的咖啡休息概念查找我们所有的咖啡休息概念系列:
[精通LLM:生成式AI和LLM的全面课程精通LLM致力于在未来5年内培训1000万AI工程师。我们提供全面的课程……
www.masteringllm.com](https://www.masteringllm.com/?source=post_page-----4402ef7f8448--------------------------------#/coffee_break_concepts)
您的 反馈和点赞鼓励我们 为社区创造更好的内容。
你可以鼓多次掌吗?是的你可以