从零到一：用AI Agent与RAG技术，打造你的专属智能问答系统-原创手记-慕课网

在2026年的今天，人工智能领域百花齐放，但有两项技术无疑站在了聚光灯下，它们分别是AI Agent（智能代理）和RAG（检索增强生成）。AI Agent让机器具备了主动思考与执行任务的能力，不再是被动的问答工具；而RAG技术则解决了大模型“一本糊涂账”的问题，让它能够快速、准确地调用外部知识。当这两项技术强强联手时，一个强大的组合诞生了：AI Agent + RAG = 一个能理解你、记住你、并为你解决特定领域问题的智能伙伴。

本文将带你一步步搭建一个属于你自己的智能问答系统，让你的私人知识库（无论是读书笔记、工作文档还是项目资料）都能变成一个可以随时对话的专家。

核心概念：AI Agent + RAG 如何协同作战？

想象一下，你是一个侦探，面对一个棘手的案件。AI Agent就像是你的搭档，负责分析线索、制定调查计划并执行（比如去图书馆查资料、询问目击者）。而RAG技术则是你的“超级数据库”，它能在浩如烟海的档案中，瞬间为你找出与当前案件最相关的那几份关键卷宗。

在这个系统中：

AI Agent：扮演“大脑”和“指挥官”的角色。它接收用户提问，理解意图，决定何时需要查阅外部知识（调用RAG），并对RAG返回的信息进行整合，最终生成自然流畅的回答。
RAG：扮演“外置记忆”和“信息检索员”的角色。它将你的私人文档（PDF、Word、网页等）进行索引和存储。当Agent需要知识时，RAG会迅速在你的知识库中搜索最匹配的信息片段，并将其提供给Agent。

动手实践：四步搭建你的智能知识库

第一步：准备你的“弹药库”——知识文档

首先，你需要准备好要“喂给”AI的资料。这些可以是你多年积累的读书笔记、某个项目的完整文档、或是行业内的白皮书。将这些文档统一存放到一个文件夹中，格式不限（PDF, Word, TXT等均可）。

第二步：构建“检索系统”——部署RAG引擎

接下来，我们需要一个强大的RAG引擎来处理这些文档。目前市面上有许多优秀的开源工具，如LlamaIndex、LangChain等。我们可以使用LlamaIndex来快速实现。以下是核心代码示例：

from llama_index.core import VectorStoreIndex, SimpleDirectoryReader, StorageContext, ServiceContext
from llama_index.core.node_parser import SentenceSplitter
from llama_index.embeddings.openai import OpenAIEmbedding
import os

# 设置你的OpenAI API密钥
os.environ["OPENAI_API_KEY"] = "your-openai-api-key"

def build_rag_system(documents_path):
    """
    构建RAG检索系统
    :param documents_path: 存放知识文档的文件夹路径
    :return: 可用于查询的VectorStoreIndex对象
    """
    # 1. 加载文档
    print("正在加载文档...")
    documents = SimpleDirectoryReader(input_dir=documents_path).load_data()

    # 2. 配置服务上下文，使用OpenAI的embedding模型
    embed_model = OpenAIEmbedding(model="text-embedding-3-small")
    service_context = ServiceContext.from_defaults(embed_model=embed_model)

    # 3. 将文档分割成块 (Chunking)
    print("正在分割文档...")
    node_parser = SentenceSplitter(chunk_size=512, chunk_overlap=50)
    nodes = node_parser.get_nodes_from_documents(documents)

    # 4. 创建向量存储索引
    print("正在创建向量索引...")
    index = VectorStoreIndex(nodes, service_context=service_context)

    print("RAG系统构建完成！")
    return index

# 使用示例
knowledge_base_path = "./my_knowledge_docs"  # 替换为你的文档路径
index = build_rag_system(knowledge_base_path)

# 持久化索引 (可选)
# index.storage_context.persist(persist_dir="./storage")

这段代码完成了RAG系统的核心构建步骤：加载文档、使用先进的embedding模型将文本向量化、将文本分割成块以提高检索精度，并最终构建一个高效的向量索引。

第三步：配置你的“智能大脑”——设置AI Agent

现在，我们需要为这个系统配置一个“大脑”，也就是AI Agent。我们将使用LlamaIndex的QueryEngine来轻松实现。它会自动调用RAG进行检索，并将结果交给LLM生成答案。

from llama_index.llms.openai import OpenAI

def create_agent(index):
    """
    创建AI Agent查询引擎
    :param index: 上一步构建好的VectorStoreIndex
    :return: 查询引擎
    """
    # 初始化LLM (这里使用GPT-4o)
    llm = OpenAI(model="gpt-4o")

    # 创建查询引擎，这是我们的“智能大脑”
    query_engine = index.as_query_engine(
        llm=llm,
        similarity_top_k=3,  # 检索最相关的3个文档块
        response_mode="tree_summarize", # 整合多个检索结果的模式
    )

    return query_engine

def query_agent(query_engine, question):
    """
    向Agent提问
    :param query_engine: 查询引擎
    :param question: 用户的问题
    :return: AI的回答
    """
    response = query_engine.query(question)
    return str(response)

# 使用示例
agent = create_agent(index)

# 开始提问
question = "根据我的笔记，关于XX项目的市场策略是什么？"
answer = query_agent(agent, question)
print(f"问题: {question}")
print(f"回答: {answer}")

# 你也可以创建一个简单的循环来持续对话
while True:
    user_input = input("\n请输入你的问题 (输入 'quit' 退出): ")
    if user_input.lower() == 'quit':
        break
    try:
        answer = query_agent(agent, user_input)
        print(f"AI: {answer}")
    except Exception as e:
        print(f"发生错误: {e}")

这段代码展示了如何将RAG索引与一个强大的大语言模型（如GPT-4o）结合，创建一个query_engine。这个引擎就是你的AI Agent，它会自动完成“检索-思考-生成”的全过程。

第四步：创建“对话接口”——前端交互

最后，为了让使用更方便，你可以创建一个简单的Web界面。我们可以使用Streamlit来快速搭建一个美观的交互页面。

首先，安装Streamlit：
pip install streamlit

然后创建一个 app.py 文件：

import streamlit as st
from your_rag_script import build_rag_system, create_agent, query_agent # 导入上面写的函数

st.title("我的智能知识库助手 🧠")

# 在Streamlit中初始化session state来保存agent
if 'agent' not in st.session_state:
    with st.spinner('正在加载知识库...'):
        index = build_rag_system("./my_knowledge_docs") # 你的知识库路径
        st.session_state.agent = create_agent(index)
    st.success('知识库加载完成！')

# 创建聊天历史
if 'messages' not in st.session_state:
    st.session_state.messages = []

# 显示历史消息
for message in st.session_state.messages:
    with st.chat_message(message["role"]):
        st.markdown(message["content"])

# 接收用户输入
if prompt := st.chat_input("请输入你的问题..."):
    # 显示用户消息
    st.chat_message("user").markdown(prompt)
    st.session_state.messages.append({"role": "user", "content": prompt})

    # 显示助手消息
    with st.chat_message("assistant"):
        with st.spinner('AI正在思考...'):
            response = query_agent(st.session_state.agent, prompt)
        st.markdown(response)
    st.session_state.messages.append({"role": "assistant", "content": response})

运行这个Web应用：
streamlit run app.py

现在，你可以在浏览器中看到一个类似ChatGPT的界面，与你的专属AI专家进行对话了！

你的AI专家能做什么？

一旦系统搭建完成，你将获得一个高度个性化的AI助手。你可以直接问它：

“根据我的笔记，关于XX项目的市场策略是什么？”
“我之前总结的《XX书籍》的核心观点有哪些？”
“请基于我们过往的项目经验，优化这份方案。”

它不再会像通用大模型那样“胡编乱造”，而是会精准地从你的知识库中提取信息，给出有据可依的回答。

结语：拥抱“私人定制”的智能时代

AI Agent与RAG的结合，正在将“知识管理”推向一个全新的维度。它不再是简单的文档存储和关键词搜索，而是实现了真正意义上的“知识对话”。通过本文的介绍和代码示例，相信你已经了解了构建这样一个系统的底层逻辑和技术实现路径。

虽然具体的技术实现细节可能涉及代码和配置，但其核心理念非常清晰：将AI的强大推理能力与你独有的知识资产相结合，创造出一个专属于你的、不断学习和成长的智能伙伴。这正是当前技术浪潮中最激动人心的方向之一。动手尝试吧，让你的智慧结晶，成为你最强的“外脑”。