人工智能发现漏洞的速度已经超过了修复漏洞的速度。
三月27日,Anthropic的一个未受保护的数据缓存泄露了约3000份内部文件。一篇博客草稿透露了即将推出的新模型“Mythos”,Anthropic将其自评为“在网络安全能力方面远超任何人工智能模型”。同日,CrowdStrike和Okta的股价均暴跌7%,而Palo Alto Networks的股价则下跌6%。
市场之所以恐慌,并不是因为出现了更强大的机型。这是因为该模型的创作者指出,其在攻击方面的进展已经超过了防御方能够跟上的速度。
人工智能在网络安全领域的领先指数
根据学术基准测试平台CAIBench的测试结果,在模拟真实攻防环境的Cybench测试中,Claude Sonnet的成功率达到了46%。排名第二的GPT-5为28%,谷歌的Gemini 2.5 Pro仅达到18%,而开源模型qwen3-32B则更低,仅为10%。

虽然46%这个数字看似不高,但这却是复杂渗透任务的成功率,其中包含漏洞发现、构建利用链以及权限提升等步骤。在一项更基础的基准测试中,克劳德的成功率已达到75%,接近其上限。
区别不在于谁稍微好一点,而在于程度上的差异。Claude 的综合攻防能力是 GPT-5 的 1.6 倍,是 Gemini 的 2.5 倍。在网络安全的这一维度中,各模型能力分布的状况并非呈阶梯状,而是存在巨大差距。
6个月内翻一番
更值得分析的不是水平间距,而是垂直速度。
根据Anthropic的官方数据,2025年二月发布的Sonnet 3.7在Cybench测试中(10次尝试)取得了35.9%的成功率。同年下半年,Sonnet 4.5 的市场份额达到 76.5%。Anthropic研究团队得出的结论是:在6个月内,成功率翻了一番。
这个速度是什么意思?在实际场景的对比中:今年三月,我们使用Claude Opus 4.6对Firefox代码库进行了审核。据InfoQ报道,两周内共发现了22个安全漏洞,其中14个属于高风险漏洞。尽管经过多年的人工审计和数百万小时的CPU模糊测试,这些漏洞仍未被发现。Anthropic的安全团队此前披露,Claude在多个生产级开源项目中发现了500多个高风险漏洞,其中一些漏洞已存在数十年之久。

而传统渗透测试的行业标准周期为2至3周,这还只是针对一个应用程序的情况。根据威瑞森(Verizon)《2025年数据泄露调查报告》,从关键漏洞公开披露到遭到攻击者大规模利用的中位数时间为5天,而发布补丁所需的中位数时间为32至38天。
人工智能发现漏洞的速度正在呈指数级增长,而人类修复漏洞的速度却只是线性增长。时间差就是攻击窗口。
在泄露的Mythos草案中,Anthropic写道,该模型“预示着新一波模型的到来,这些模型能够以远超防御者应对能力的方式利用漏洞。”根据已知的性能曲线来看,这绝非夸大其词。
发布越快,警告越紧急
如果将Anthropic过去三年的行动按时间顺序排列,你会发现一个明显的规律:每当推出更强大的模型,紧接着就会采取更高级别的安全应对措施。
2023年七月,白宫签署了一项自愿承诺,随后于同年九月发布了首份《负责任扩展政策》(RSP v1.0)。2024年十月,RSP升级至2.0版,新增了针对生化武器能力的阈值。2025年十一月,Anthropic披露了GTG-1002事件。一个由中国支持的威胁组织利用“克劳德代码”(Claude Code)对约30家机构发动了攻击,在整个行动过程中,80%至90%的战术行动均由人工智能独立执行。这是有记录以来首次由人工智能策划的大规模跨组织间谍活动。
2026年二月,RSP更新至3.0版,并同步发布了Claude Code Security。同月,五角大楼将Anthropic列为“供应链风险”,原因是Anthropic拒绝撤销合约中禁止大规模监控和完全自主武器的条款。一个月后,Mythos的泄露文件显示,Anthropic在草案中承认,该模型带来了“前所未有的网络安全风险”。

能力发布的步伐正在加速。从Claude 1到Claude 3相隔一年,而从Opus 4.5到Opus 4.6则不到三个月。安全应对措施也在加速,但它们总是被动应对:安全漏洞首先被利用,安全策略补丁随后才跟上。三月27日网络安全类股票的集体下跌,正是市场对这一时间差的定价。
今年早些时候,Dark Reading 的一项调查显示,48% 的网络安全专业人士认为,基于人工智能的代理将是 2026 年的首要攻击途径。两年前,这个选项几乎不在考虑之列。
Anthropic的Mythos发布策略包括向防御型组织提供早期访问权限,"赋予他们先发优势"。这一表述本身就承认了攻防双方的不对等。如果防守方不需要先发优势,那就意味着进攻方尚未逼近门前。
猜你喜欢

矿企的 AI 豪赌:估值进入分化阶段,翻身仗不好打

Alliance 联创致创业者的一封信:写在 Cursor 卖出 600 亿美元之际

稳定币终于找到真实收益:链上再保险 Re 详解|对话 Re 创始人 Karan Saroya

不可能三角根本就是伪问题

微策略会走进死亡螺旋吗?下半年宏观走势如何?

Blockchain Capital 合伙人:套利的核心秘诀

STRC 脱锚 11%,Strategy 的永动机还转得动吗?

WEEX App焕新体验——新标签页让交易体验更顺畅,资产管理更轻松

WEEX 搜索功能全新升级:快人一步,抢占盈利先机

早报|伊利诺伊州签署全美最严数字资产税法;RWA 代币化市场规模突破 430 亿美元,机构加速推动链上资产迁移

完整版首秀问答!美联储主席沃什:坚守2%通胀目标,成立五个特别工作组,个人未提交点阵图

从颠覆者到影子市场:加密市场正在成为传统金融的殖民地

达里奥重磅长文:当前市场环境下该如何布局?

OKX Star 锐评币安的竞争优势:当监管拉平护城河,竞争才刚开始

加密交易所打新的新玩法

DeepSeek 融资故事

早报|DeepSeek 完成超 70 亿美元融资,估值超 500 亿美元;马斯克个人财富已超越比特币总市值

