继续浏览精彩内容
慕课网APP
程序员的梦工厂
打开
继续
感谢您的支持,我会继续努力的
赞赏金额会直接到老师账户
将二维码发送给自己后长按识别
微信支付
支付宝支付

个人能力“蒸馏”与企业级Agentic RAG:Agent真的还需要RAG吗?

呼啦一阵风
关注TA
已关注
手记 378
粉丝 75
获赞 325

延续此前关于个人能力“蒸馏”的思考,当我们试图将这种能力从个人扩展到企业级应用时,一个核心议题浮出水面:在构建企业级Agentic RAG(检索增强生成)数据库应用的过程中,Agent究竟还需要RAG技术吗?

随着大模型技术的飞速迭代,模型自身的上下文窗口已突破百万级别,同时工程层面的Skills机制也有效缓解了模型输出的不稳定性。在这些技术红利的加持下,Agent的数据处理能力取得了长足进步,甚至能独立解决约80%的常规问题。这也催生了像OpenClaw这类备受关注的架构,其本质是对工作流程(Workflow)和标准操作程序(SOP)的极致梳理与优化,也就是业界热议的“养虾”概念。

在此基础上,涌现出了如Obsidian与Claudian组合的方案。这类模式被归类为“工作区Agent”或“文件系统型Agent”,其核心特征是以私有工作空间为上下文,以文件系统为主要操作对象。这让许多人产生了一个直观的错觉:过去我们依赖繁琐的RAG流程引入私有数据,而现在直接把文件丢给工作区Agent似乎就能获得不错的效果。那么,Agent是否真的不再需要RAG了?

要回答这个问题,我们必须先厘清当前存在的两种截然不同的Agent技术范式:协同型Agent高可信型Agent

协同共创与严肃交付:两种截然不同的范式

从用户视角和核心假设来看,这两类Agent有着本质的区别:

协同型Agent(生产力工具属性)
典型代表是AI编程助手(AI Coding Agent)。这类工具的核心假设是:使用者具备极强的专业评判能力。AI在这里扮演的是“杠杆”角色,旨在放大个人的专业能力。由于是“人机共创”,系统允许出现一定程度的偏差或错误,使用者可以自行判断代码质量并进行修正。因此,它对数据的核心诉求是广度和探索性,并不追求唯一的标准答案。

高可信型Agent(专家替代属性)
典型代表是AI医生、AI律师或企业级智能客服。这类Agent的核心假设是:用户不需要、也不具备专业判断能力,他们完全信赖AI的输出。在严肃的商业或专业领域,80%的准确率是绝对无法接受的,系统必须追求99.9%以上的精确度与权威性。每一个结论都必须有据可循,能够精准追溯到权威文档的具体章节。

基于这两种范式的差异,我们可以清晰地看到技术路径的分野:如果你的目标是能力放大,应选择协同型,走Workspace Agent路线;如果你的目标是替代专业判断,则必须选择稳定输出型,走Agentic RAG路线。

便利性 > 正确性:Workspace Agent 的代价

Workspace Agent 最大的魅力在于它几乎消除了数据接入的所有前置成本。你无需对私有数据进行复杂的预处理,无需设计文本切片策略,也无需调整向量检索的 TopK 参数。只需将文件拖入系统,Agent 便能立即开始工作。这种“上传即用”的流畅体验,正是其备受推崇的原因。

然而,这份便利性背后必然存在代价:它将数据准备的成本,转移到了对使用者判断力的依赖上。从底层设计上,Workspace Agent 将数据视为“工作素材”,优先追求便利性。这意味着,你必须有能力驾驭并验证它的输出。一旦脱离了具备强专业能力的个人用户,扩展到十人以上的团队,由于缺乏统一的认知标准,相同的问题往往会产生多种不同的理解,其便捷性的优势也将随之消减。

严肃性 > 便利性:高可信 RAG 的壁垒

高可信 Agent 采取了截然不同的路径。它将数据视为“证据来源”,要求在数据进入系统之前,就必须完成严谨的知识建模。这远不止是简单的文本切片和向量化,而是一套复杂的知识工程:

  1. 界定边界与构建结构:必须明确并穷举AI系统要完成的具体任务范围,确保知识体系能够精准支撑该系统的运作。
  2. 梳理逻辑关系链:通过核心枢纽(如独一无二的关键词)检索出知识实体,并依据实体间的逻辑链梳理关联。逻辑链条越清晰,AI的表现越稳定。
  3. 控制实体复杂度:知识库的实体类型和层级深度需要严格控制,在真实世界的复杂度与数据工程的投入产出比之间取得平衡。
  4. 架构级文档设计:项目负责人需亲自撰写达到伪代码详细程度的架构文档,确保AI每次都能精准、完整且不多余地获取所需知识。

这套方法论的实施成本极高,且深度依赖于行业Know-How。但一旦构建成功,其收益极为明确:输出结果具备可解释性、可追溯性和可审计性。高可信RAG将确保正确率的成本前置到了数据建设阶段,因此无需依赖使用者进行独立判断。

二八法则下的融合策略

既然高可信RAG如此复杂,是否意味着我们可以完全抛弃它?答案显然是否定的。在企业级应用中,技术选型往往更倾向于融合与共生。

这就引出了经典的“二八法则”:80%的客户问题,往往围绕20%的核心场景不断衍生。即便是严肃的业务场景,最核心的流程(如AI医生的诊断、用药方案)必须交由高可信Agent严谨处理,追求99.999%的可靠性;而其余80%的非核心流程(如运动、饮食建议),则可以开放给Workspace Agent自由发挥。这是一种能够兼顾知识有效性与数据工程实施成本的最佳策略。

结论:Agent 需要的是“进化版”的 RAG

回到最初的问题:Agent 是否需要 RAG?

在目前的协作型 Agent(如 Coding Agent)领域,传统的 RAG 技术确实正被逐渐弃用。Claude Code 团队曾公开表示,他们转而采用了一种名为 Agentic Search 的技术,让模型自主决定搜索、阅读与迭代,这种机制在处理结构完整的代码和文档时极为高效。

但这并不代表 RAG 的消亡。对于高可信 Agent 而言,RAG 依然是不可或缺的基石。只是这里的 RAG,其本质已经进化为知识工程。真正的难点在于搜索开始前的知识边界划定、实体结构设计以及关系链的深度梳理。

所谓的“同事.skill”或能力蒸馏,如果仅仅停留在“先做什么、后做什么”的步骤序列(Workflow),那它只是数字化转型的延伸,目标是降本增效。若要真正“蒸馏一个人”,就必须深入思考他为何如此判断、如何进行取舍、遇到异常如何决策。这正是高可信 Agent 所依赖的数据工程。

因此,Agent 并非不需要 RAG,而是不再需要过去那种简单粗暴的 RAG。它需要的是一套能够承载行业Know-How、具备严密逻辑链条的进化版知识检索体系。

打开App,阅读手记
0人推荐
发表评论
随时随地看视频慕课网APP