2026年4月,网络安全领域出现了一个分水岭时刻。Anthropic宣布了Claude Mythos Preview的存在——不是因为它准备好了要发布,而是因为它的能力已经强大到必须公开讨论。几天后,OpenAI跟进发布GPT-5.5-Cyber。同一个威胁面前,两家公司给出了截然不同的答案。
Mythos能做什么
Mythos Preview能够自主发现每个主流操作系统和浏览器中的零日漏洞,其中许多漏洞已在代码里潜伏了十年甚至二十年。最令人震惊的案例之一,是一个在OpenBSD中潜伏了27年的安全缺陷——这是一个以安全著称的操作系统。
它不只是找到漏洞,还能构造可用的攻击代码。在一个记录在案的案例中,Mythos写出了一个链式利用四个漏洞的浏览器攻击程序,完成了渲染器和操作系统沙箱的双重逃逸。更值得注意的是使用门槛:Anthropic内部没有任何安全背景的工程师,只需简单指示Mythos连夜寻找漏洞,第二天早上就能得到完整的可用攻击代码。
Anthropic明确表示,这些能力并非刻意训练的结果,而是通用推理和代码能力提升的副产品。没有人教它成为顶级安全研究员——它只是变得更聪明了,这种能力自然涌现。
OpenAI的回应
GPT-5.5-Cyber在Mythos发布数天后推出。从独立机构的评测来看,两者已处于同一量级。英国AI安全研究所对两款模型进行了相同的企业网络攻击模拟测试(TLO),这是一个32步的完整企业内网渗透链,模拟真实的横向移动、权限提升和数据窃取。结果是:Mythos在10次尝试中完成3次,GPT-5.5完成2次。差距存在,但并不悬殊。
在更高级的网络安全任务评测中,GPT-5.5甚至略微领先,被评为目前测试过的模型中表现最强的。两款模型在基础安全任务上均已达到满分——这类任务自2026年2月起就已被完全饱和,不再有区分意义。
技术能力上,GPT-5.5-Cyber新增了二进制逆向工程功能,允许安全研究人员在没有源代码的情况下分析编译后的软件,寻找恶意代码和漏洞。这是一个实用的防御工具,也是一个同样锋利的攻击工具。
两种哲学的碰撞
真正的差距不在能力,而在选择。
Anthropic的选择是封闭。他们组建了Project Glasswing联盟,约50家机构入选,包括AWS、Apple、Microsoft、Nvidia等,并承诺提供最高1亿美元的使用额度和400万美元的捐款给开源安全组织。逻辑是:先给防御方一个窗口期,在攻击者获得类似工具之前尽可能多地修补漏洞。他们估计,类似能力将在六到十八个月内从其他实验室扩散出去。
OpenAI的选择是开放。他们通过”可信访问网络”(TAC)项目,向政府机构、关键基础设施运营商、安全厂商和云平台逐步开放GPT-5.5-Cyber,并明确表示不能把网络防御能力只留给财富500强。他们的策略是:与其限制模型能做什么,不如管控谁能用它。
两者都有道理,两者也都有代价。封闭意味着受益者只是少数大机构;目前Mythos发现的漏洞中,超过99%尚未被修补,窗口期的效果存疑。开放意味着监管更难,双重用途风险更高,一旦扩散到恶意行为者手中,后果难以控制。
真正令人不安的事
这场Anthropic与OpenAI之间的策略争论,本身就已经很重要。但更深的问题在于:无论哪家公司做出什么选择,这个方向都不会停止。
这两种能力都不是任何人主动设计出来的。它们是通用智能提升的副产品——模型变得更擅长推理和写代码,网络攻击能力就随之涌现。这意味着,我们无法通过拒绝开发某种特定能力来回避这个问题。只要AI继续变得更聪明,类似Mythos的能力就会持续出现,来自更多实验室,包括那些没有Anthropic或OpenAI谨慎程度的地方。
Project Glasswing这个名字来自一种翅膀透明的蝴蝶。Anthropic的用意大概是:让漏洞变得可见,本身就是一种防御。这个比喻很美,但透明的翅膀,终究挡不住真正的猎食者。
防御者现在拥有最好的工具,也面临最短的窗口期。这两件事同时为真。
数据来源:Anthropic、OpenAI、英国AI安全研究所(AISI)、AISLE
发表回复