AI开始“造武器”：当大模型能自动挖漏洞、写攻击链，连OpenAI都慌了-原创手记-慕课网

2026年4月，一条来自Axios的爆料震动了科技圈：OpenAI正秘密筹备一款具备强大网络攻防能力的AI产品，仅限少数可信合作伙伴内测。表面看，这只是又一家巨头在拓展AI边界；但深挖一层，你会发现——人类可能刚刚跨过一道危险的门槛：AI已不再只是辅助工具，而正在成为自主的“漏洞猎人”甚至“数字武器匠”。

更耐人寻味的是，率先引发这场连锁反应的，并非OpenAI，而是其竞争对手Anthropic。

从写代码到写攻击链：AI的能力滑向深渊

就在几周前，Anthropic悄然启动了一个名为 Project Glasswing 的封闭计划，将旗下下一代模型 Mythos 以“Claude Mythos Preview”的形式，仅提供给少数科技与安全公司。官方理由直白得令人不安：“这个模型太强了，不适合公开。”

有多强？
据内部测试显示，Mythos能在海量开源项目中自动识别高危漏洞，自动生成完整的攻击链（Exploit Chain），甚至组合多个独立漏洞实现复杂入侵。更可怕的是，没有安全背景的普通工程师只需下达指令：“帮我找一个远程代码执行漏洞”，第二天醒来，就能收到一份可直接运行的PoC（概念验证）。

过去，发现漏洞与武器化利用之间，隔着一道由专业知识、经验与时间筑成的鸿沟。如今，AI正在用算法填平它。

这不再是“会不会写PPT”的时代，也不是“能不能调用工具”的Agent阶段，而是进入了AI能否自主完成“侦察-分析-利用-修复建议”全链条的新纪元。而这条链条的终点，连接着电网、水厂、医院、银行、操作系统——现代社会的命脉。

OpenAI的“防御性恐慌”

面对Anthropic的先发制人，OpenAI迅速跟进。但值得注意的是，Axios后续澄清：OpenAI此次开放的并非未发布的通用旗舰模型“Spud”，而是一款独立的网络安全专用产品。

这一细节至关重要。它表明，AI巨头们已形成共识：最危险的能力，必须被隔离、封装、严格管控。

事实上，OpenAI早在2026年2月就埋下伏笔——推出 GPT-5.3-Codex 时，同步启动 “Trusted Access for Cyber” 计划，投入1000万美元API额度，仅邀请合法安全研究机构参与。官方坦言，这是其“迄今最具网络安全能力的模型”，并首次在安全维度上部署多层防护机制。

翻译过来就是：我们造出了自己都害怕的东西，必须锁起来。

AI时代的“核不扩散”困境

这种“造出来又不敢放”的矛盾，折射出AI发展进入全新阶段：能力越强，责任越重，控制越难。

安全专家Rob Lee（SANS研究所）一针见血：“你已经无法阻止模型去扫描代码库、枚举缺陷——因为这种能力一旦存在，就不可逆。”Palo Alto Networks高管也警告：即便OpenAI或Anthropic暂时封锁，其他公司也会在数周或数月内追上。

于是，整个行业被迫引入一种类似“漏洞责任披露”（Responsible Disclosure）的新逻辑：

不是“做不做”，而是“先给谁”；
不是“发不发”，而是“怎么控节奏”；
不是“有没有”，而是“如何防止落入恶意之手”。

这就像地震尚未发生，地质学家已开始加固地基——恐惧源于对后果的预判，而非现实的灾难。

世界开始分层：AI时代的“能力折叠”

更深远的影响在于，AI能力正走向分层化：

大众用户：获得安全、顺滑、功能受限的通用模型；
企业与安全机构：接入深度定制、具备攻防能力的专业版本；
核心圈层：掌握连合作伙伴都无法触及的内部能力。

表面上，所有人都在用AI；实际上，决定数字世界攻防平衡的，是那些看不见、摸不着、仅在白名单中流动的“高危能力”。这既像AI时代的“核管控”，也似一场静默的“北京折叠”——技术权力从未如此集中。

结语：效率与失控的钢丝

短期看，将最强能力交予防守方，或许是避免全社会“裸奔”的唯一选择。但从长远看，这场竞赛已彻底转向底层：浏览器、内核、云平台、关键基础设施——AI正深入人类最古老也最敏感的博弈场：进攻与防御、开放与封锁、效率与失控。

正如一位安全研究员所言：“以前我们怕AI太笨，现在我们怕它太会干活。”
而最讽刺的是，真正敲响警钟的，不是黑客的攻击，而是AI公司自己的恐惧。