继续浏览精彩内容
慕课网APP
程序员的梦工厂
打开
继续
感谢您的支持,我会继续努力的
赞赏金额会直接到老师账户
将二维码发送给自己后长按识别
微信支付
支付宝支付

AI竞争下半场:当“引擎”不再稀缺,谁来打造智能体的“缰绳”?

动漫人物
关注TA
已关注
手记 271
粉丝 18
获赞 72

“造出智能体(Agent)本身并不难,真正的挑战在于如何为它套上可靠的‘缰绳’(Harness)。”

2026年2月,OpenAI工程师Ryan Lopopolo在总结Codex项目时留下的这句话,如今正成为整个AI行业的共识。他带领一支不到10人的团队,用5个月时间让Codex自动生成了超百万行代码,且全程无需人工手写一行。这套确保模型稳定、高效运行的系统性框架,被他定义为“缰绳工程”。

数据印证了“缰绳”的价值:Codex的周活跃用户从3月初的160万飙升至5月的400万以上。除了模型本身的迭代,其“缰绳”设计功不可没——有开发者测试发现,完成相同任务时,Claude Code消耗的Token量是Codex的3到4倍。这并非单纯源于模型差异,更在于Codex将任务拆解为多个并行子任务,每个子任务拥有独立上下文,互不干扰,从而大幅提升了效率。

如今,“智能体 = 模型 + 缰绳”已成为行业公式。若将智能体比作汽车,大模型便是提供动力的引擎;但没有传动系统、转向机构和刹车系统的“裸引擎”无法上路。“缰绳”,正是将“引擎”转化为可驾驶“整车”的那套系统工程。

就连以模型突破见长的DeepSeek,也在本月公开招聘“缰绳产品经理”和“缰绳研发工程师”,明确对标Claude Code打造自有缰绳体系。当最强大模型的“保质期”越来越短,模型能力日益基础设施化,“缰绳”已取代模型,成为AI竞争的新核心战场。

一、产业链重构:三层架构的利益再分配

“缰绳”的崛起,正在反向重塑AI产业的三层架构,传统的价值分配格局面临洗牌。

模型层:定价权旁落的风险

过去,模型公司既训练模型又掌控应用方式,性能越强定价越高。但“缰绳”动摇了这一逻辑。在DeepSeek官方下场前,社区项目“DeepSeek-TUI”已获超3万Stars——同一个模型,在精调的缰绳中表现优异,在粗糙的外壳里则大打折扣。模型未变,但缰绳决定了能力兑现的上下限。若模型公司辛苦训练的能力最终由他人的缰绳承接,便可能沦为供应商,利润被压缩,产品优劣也由渠道方评判。

应用层:护城河向缰绳迁移

过去,应用公司的壁垒在于对业务的深刻理解,这些知识蕴藏于产品决策、交互细节和功能逻辑中。如今,这些经验正沉淀到缰绳层:Salesforce将销售线索追踪流程固化其中,Claude Code把代码评审标准嵌入其内。今年5月,老牌客服SaaS公司Intercom甚至直接更名为Fin,围绕缰绳重构业务。一旦业务理解被固化为可执行的Agent行为,知识所有权便跟随缰绳转移,而非依附于特定团队。尚未重视缰绳的应用公司,几年后可能发现护城河已被悄然侵蚀。

基础设施层:算力需求被反向定义

英伟达等公司的产品规划曾由大规模模型训练驱动。但随着缰绳普及,Agent推理成为算力市场新主导力量。Agent具备长链路、多次调用、工具集成与记忆保持等特征,其负载呈现长周期、不可预测的动态变化,需要不同的调度策略、内存架构和网络拓扑。英伟达计划2026年发布的Vera Rubin平台,便是专为智能体与大规模推理时代构建。缰绳正开始反向塑造下一代芯片形态。

二、场景为王:缰绳的天然扎根之地

缰绳并非即插即用的插件,必须在真实场景中反复试错才能成型。缺乏场景纠偏,缰绳便会僵化。这也导致缰绳内部必然发生分化。

代码场景率先跑通 ,因为每一条执行轨迹都自带反馈信号,可供模型学习。这也是Anthropic和OpenAI将首战选在代码领域的原因。但代码之外的世界没有编译器,客服答疑、风控判断等场景不存在自动化客观标准,反馈要么依赖昂贵的人工标注,要么依靠真实业务结果。这意味着,能将缰绳做好的玩家,必然是最贴近真实业务反馈的人。

长远来看,模型能力的提升或许会消解缰绳的工程层(如失败重试、上下文截断等问题未来可能由模型自身解决),但无法消解其场景层 ——那些扎根于真实业务、经由真实失败打磨而成的内核,是再强大的模型也无法替代的。

拥有真实业务反馈的玩家已展现出优势。Salesforce凭借数十年CRM数据沉淀,其Agentforce年度经常性收入达8亿美元,增速169%,实现商业闭环;腾讯WorkBuddy从决定采用claw模式到全量上线仅用一周,得益于其缰绳早已在内部经2000多名员工日常使用打磨成熟。

这种分化预示着:当模型深入不同行业腹地时,必须被置入相应的缰绳中锤炼。代码、协同办公、电商交易等场景将孕育出截然不同的缰绳,且非代码场景的反馈信号极难跨行业复制。拥有独特业务闭环的玩家,将在自身领域建立起坚固壁垒,外来者很难仅凭堆叠算力或扩大模型规模来撼动其地位。

三、标准化之争:从场景实践到协议博弈

当智能体在不同缰绳中形成各异的行为模式后,它们最终必须能够“彼此对话”。若各自采用私有协议,生态将重蹈PC时代软件互不兼容的覆辙。下一阶段的竞争,必将从场景层的工程实践升级至协议与标准层面的角逐。

Anthropic于2024年底推出MCP协议,抽象模型接入工具的通用流程;Google于2025年4月发布A2A协议,致力于跨厂商多智能体协同。先行者构建的协议网络将成为后来者难以逾越的准入壁垒,谁率先推广协议、整合生态,谁就能占据类似Android或iOS的平台主导地位。国内腾讯、阿里、字节等巨头已全面跟进适配MCP,避免在事实标准形成过程中掉队。

但标准化的意义远不止互通。当智能体能代你下单、支付甚至签署合同时,风险管控成为商业化落地的前提。 今年5月,中国信通院联合腾讯、华为等发布的ATH协议,通过用户、智能体与服务方的三方握手明确权限边界,采取权限交集原则,任何一方缺失都将导致操作无法进行,回应了安全可信的核心挑战。

与协议之争同步的,是智能体协作基础设施的构建 。多个智能体间的任务调度、共享内存、权限界定等问题,无法完全在协议层面解决,需要底层基础设施承载。其形态可能是现有终端操作系统的进一步集成,也可能催生独立的智能体生态,还可能在超级生态内部自然生长——微信依托14亿用户、450万小程序及覆盖支付到政务的庞大场景,本身已构成一张现成的智能体协作网络,智能体无需从零搭建舞台,只需接入这张真实业务网络便能顺势前行。

结语:没有捷径的中间层

过去评判AI公司实力,看模型性能、榜单排名、资金规模;如今,评估维度已扩展为:能否用缰绳反向优化模型、是否有真实场景提供反馈、能否在标准化进程中占据有利位置、是否构建了多智能体协作基础设施。

模型依然是基本盘,但每一家AI公司接下来需要回答的,已不仅是“我的模型有多强”,更要厘清自己在缰绳重塑的新格局中扮演何种角色。

缰绳或许只是一个起点,数年后可能有新的名称和形态。但在模型与场景之间,始终需要一个中间层——它负责连接模型、嵌入业务、沉淀反馈。这一层所积累的,除了工程技术,更包括对业务的理解、持续的反馈数据,以及公司与真实用户之间日复一日的校准与磨合。这件事没有捷径,只能在足够长的时间里慢慢积累,在足够大规模的真实业务中反复锤炼。

打开App,阅读手记
0人推荐
发表评论
随时随地看视频慕课网APP