Claude Mythos VS GPT-5.5-Cyber

2026年4月，网络安全领域出现了一个分水岭时刻。Anthropic宣布了Claude Mythos Preview的存在——不是因为它准备好了要发布，而是因为它的能力已经强大到必须公开讨论。几天后，OpenAI跟进发布GPT-5.5-Cyber。同一个威胁面前，两家公司给出了截然不同的答案。

Mythos能做什么

Mythos Preview能够自主发现每个主流操作系统和浏览器中的零日漏洞，其中许多漏洞已在代码里潜伏了十年甚至二十年。最令人震惊的案例之一，是一个在OpenBSD中潜伏了27年的安全缺陷——这是一个以安全著称的操作系统。

它不只是找到漏洞，还能构造可用的攻击代码。在一个记录在案的案例中，Mythos写出了一个链式利用四个漏洞的浏览器攻击程序，完成了渲染器和操作系统沙箱的双重逃逸。更值得注意的是使用门槛：Anthropic内部没有任何安全背景的工程师，只需简单指示Mythos连夜寻找漏洞，第二天早上就能得到完整的可用攻击代码。

Anthropic明确表示，这些能力并非刻意训练的结果，而是通用推理和代码能力提升的副产品。没有人教它成为顶级安全研究员——它只是变得更聪明了，这种能力自然涌现。

OpenAI的回应

GPT-5.5-Cyber在Mythos发布数天后推出。从独立机构的评测来看，两者已处于同一量级。英国AI安全研究所对两款模型进行了相同的企业网络攻击模拟测试（TLO），这是一个32步的完整企业内网渗透链，模拟真实的横向移动、权限提升和数据窃取。结果是：Mythos在10次尝试中完成3次，GPT-5.5完成2次。差距存在，但并不悬殊。

在更高级的网络安全任务评测中，GPT-5.5甚至略微领先，被评为目前测试过的模型中表现最强的。两款模型在基础安全任务上均已达到满分——这类任务自2026年2月起就已被完全饱和，不再有区分意义。

技术能力上，GPT-5.5-Cyber新增了二进制逆向工程功能，允许安全研究人员在没有源代码的情况下分析编译后的软件，寻找恶意代码和漏洞。这是一个实用的防御工具，也是一个同样锋利的攻击工具。

两种哲学的碰撞

真正的差距不在能力，而在选择。

Anthropic的选择是封闭。他们组建了Project Glasswing联盟，约50家机构入选，包括AWS、Apple、Microsoft、Nvidia等，并承诺提供最高1亿美元的使用额度和400万美元的捐款给开源安全组织。逻辑是：先给防御方一个窗口期，在攻击者获得类似工具之前尽可能多地修补漏洞。他们估计，类似能力将在六到十八个月内从其他实验室扩散出去。

OpenAI的选择是开放。他们通过”可信访问网络”（TAC）项目，向政府机构、关键基础设施运营商、安全厂商和云平台逐步开放GPT-5.5-Cyber，并明确表示不能把网络防御能力只留给财富500强。他们的策略是：与其限制模型能做什么，不如管控谁能用它。

两者都有道理，两者也都有代价。封闭意味着受益者只是少数大机构；目前Mythos发现的漏洞中，超过99%尚未被修补，窗口期的效果存疑。开放意味着监管更难，双重用途风险更高，一旦扩散到恶意行为者手中，后果难以控制。

真正令人不安的事

这场Anthropic与OpenAI之间的策略争论，本身就已经很重要。但更深的问题在于：无论哪家公司做出什么选择，这个方向都不会停止。

这两种能力都不是任何人主动设计出来的。它们是通用智能提升的副产品——模型变得更擅长推理和写代码，网络攻击能力就随之涌现。这意味着，我们无法通过拒绝开发某种特定能力来回避这个问题。只要AI继续变得更聪明，类似Mythos的能力就会持续出现，来自更多实验室，包括那些没有Anthropic或OpenAI谨慎程度的地方。

Project Glasswing这个名字来自一种翅膀透明的蝴蝶。Anthropic的用意大概是：让漏洞变得可见，本身就是一种防御。这个比喻很美，但透明的翅膀，终究挡不住真正的猎食者。

防御者现在拥有最好的工具，也面临最短的窗口期。这两件事同时为真。

数据来源：Anthropic、OpenAI、英国AI安全研究所（AISI）、AISLE

Claude Mythos VS GPT-5.5-Cyber

Mythos能做什么

OpenAI的回应

两种哲学的碰撞

真正令人不安的事

评论

发表回复取消回复

更多文章