2026年4月,一条来自Axios的爆料震动了科技圈:OpenAI正秘密筹备一款具备强大网络攻防能力的AI产品,仅限少数可信合作伙伴内测。表面看,这只是又一家巨头在拓展AI边界;但深挖一层,你会发现——人类可能刚刚跨过一道危险的门槛:AI已不再只是辅助工具,而正在成为自主的“漏洞猎人”甚至“数字武器匠”。
更耐人寻味的是,率先引发这场连锁反应的,并非OpenAI,而是其竞争对手Anthropic。
从写代码到写攻击链:AI的能力滑向深渊
就在几周前,Anthropic悄然启动了一个名为 Project Glasswing 的封闭计划,将旗下下一代模型 Mythos 以“Claude Mythos Preview”的形式,仅提供给少数科技与安全公司。官方理由直白得令人不安:“这个模型太强了,不适合公开。”
有多强?
据内部测试显示,Mythos能在海量开源项目中自动识别高危漏洞,自动生成完整的攻击链(Exploit Chain),甚至组合多个独立漏洞实现复杂入侵。更可怕的是,没有安全背景的普通工程师只需下达指令:“帮我找一个远程代码执行漏洞”,第二天醒来,就能收到一份可直接运行的PoC(概念验证)。
过去,发现漏洞与武器化利用之间,隔着一道由专业知识、经验与时间筑成的鸿沟。如今,AI正在用算法填平它。
这不再是“会不会写PPT”的时代,也不是“能不能调用工具”的Agent阶段,而是进入了AI能否自主完成“侦察-分析-利用-修复建议”全链条的新纪元。而这条链条的终点,连接着电网、水厂、医院、银行、操作系统——现代社会的命脉。
OpenAI的“防御性恐慌”
面对Anthropic的先发制人,OpenAI迅速跟进。但值得注意的是,Axios后续澄清:OpenAI此次开放的并非未发布的通用旗舰模型“Spud”,而是一款独立的网络安全专用产品。
这一细节至关重要。它表明,AI巨头们已形成共识:最危险的能力,必须被隔离、封装、严格管控。
事实上,OpenAI早在2026年2月就埋下伏笔——推出 GPT-5.3-Codex 时,同步启动 “Trusted Access for Cyber” 计划,投入1000万美元API额度,仅邀请合法安全研究机构参与。官方坦言,这是其“迄今最具网络安全能力的模型”,并首次在安全维度上部署多层防护机制。
翻译过来就是:我们造出了自己都害怕的东西,必须锁起来。
AI时代的“核不扩散”困境
这种“造出来又不敢放”的矛盾,折射出AI发展进入全新阶段:能力越强,责任越重,控制越难。
安全专家Rob Lee(SANS研究所)一针见血:“你已经无法阻止模型去扫描代码库、枚举缺陷——因为这种能力一旦存在,就不可逆。”Palo Alto Networks高管也警告:即便OpenAI或Anthropic暂时封锁,其他公司也会在数周或数月内追上。
于是,整个行业被迫引入一种类似“漏洞责任披露”(Responsible Disclosure)的新逻辑:
- 不是“做不做”,而是“先给谁”;
- 不是“发不发”,而是“怎么控节奏”;
- 不是“有没有”,而是“如何防止落入恶意之手”。
这就像地震尚未发生,地质学家已开始加固地基——恐惧源于对后果的预判,而非现实的灾难。
世界开始分层:AI时代的“能力折叠”
更深远的影响在于,AI能力正走向分层化:
- 大众用户:获得安全、顺滑、功能受限的通用模型;
- 企业与安全机构:接入深度定制、具备攻防能力的专业版本;
- 核心圈层:掌握连合作伙伴都无法触及的内部能力。
表面上,所有人都在用AI;实际上,决定数字世界攻防平衡的,是那些看不见、摸不着、仅在白名单中流动的“高危能力”。这既像AI时代的“核管控”,也似一场静默的“北京折叠”——技术权力从未如此集中。
结语:效率与失控的钢丝
短期看,将最强能力交予防守方,或许是避免全社会“裸奔”的唯一选择。但从长远看,这场竞赛已彻底转向底层:浏览器、内核、云平台、关键基础设施——AI正深入人类最古老也最敏感的博弈场:进攻与防御、开放与封锁、效率与失控。
正如一位安全研究员所言:“以前我们怕AI太笨,现在我们怕它太会干活。”
而最讽刺的是,真正敲响警钟的,不是黑客的攻击,而是AI公司自己的恐惧。
当造物主开始畏惧自己的造物,或许我们该问的不是“AI能做什么”,而是——人类准备好承担这份力量了吗?
随时随地看视频