Anthropic 深度 · 安全事件 · 2026.03.26

Claude Mythos 泄露事件
Anthropic 下一代模型意外曝光,网络安全能力「远超所有 AI」

一次 CMS 配置错误,暴露了近 3000 个未发布资产——包括超越 Opus 的全新 tier 模型 Claude Mythos(关联名称 Capybara)。在墨西哥 150GB 政府数据泄露事件的阴影下,Anthropic 的安全治理承诺正面临前所未有的审视。

~3000
泄露资产数
150GB
墨西哥数据泄露
超越 Opus
全新模型 tier
2 位
安全研究员发现
编辑洞察:这不只是一次 CMS 配置失误。当一家以「负责任的 AI 开发」为核心品牌叙事的公司,因最基础的数字资产管理疏忽暴露了其最敏感的模型计划时——尤其是在该模型被描述为拥有「远超所有 AI」的网络安全攻击能力的背景下——这一事件所揭示的,是安全治理承诺与安全实践之间令人不安的落差。

2026 年 3 月 26 日,Fortune 独家报道了 Anthropic 的一次重大数据泄露事件:两位安全研究员发现该公司的外部 CMS 系统存在配置错误,导致近 3000 个未发布资产(包括图片、PDF、音频文件和博文草稿)被公开访问。[1][2]

泄露内容中最引人注目的,是一个名为 Claude Mythos(关联名称 Capybara)的全新模型的存在。Anthropic 内部文档将其定位为超越 Opus 的更高层级,Anthropic 发言人对 Fortune 表示其代表了「a step change in AI performance」,并特别指出其网络安全能力「currently far ahead of any other AI model」。[1][4]

这一事件发生在一个微妙的时间节点:就在一个月前,Bloomberg 报道了一名黑客利用 Claude 订阅服务入侵墨西哥政府系统、窃取 150GB 敏感数据的事件[3];Anthropic 刚在 2 月发布了删除「暂停训练」硬承诺的 RSP v3.0[7]。本报告将完整复盘泄露事件始末、解析 Mythos 模型定位、梳理安全争议全景,并评估对行业的深远影响。

Anthropic
图片来源:NewsBytesApp / Getty Images
§1

泄露事件始末:CMS 配置错误如何暴露 3000 个资产

Fortune 独家报道、安全研究员审阅、技术细节与 Anthropic 的回应

发现与审阅过程

此次泄露由 Fortune 记者 Beatrice Nolan 率先发现,随后邀请两位安全研究员对泄露材料进行评估:Roy Paz(LayerX Security 高级 AI 安全研究员)定位并审阅了未加密材料,Alexandre Pauwels(剑桥大学网络安全研究员)对泄露内容进行了独立评估。他们确认 Anthropic 使用的外部内容管理系统(CMS)存在配置错误,导致上传到该系统的数字资产在上传时被自动分配了公开可访问的 URL。[2]

🔍 Roy Paz

LayerX Security 高级 AI 安全研究员。LayerX 是一家专注于浏览器安全的以色列网络安全公司,其研究团队长期关注 AI 公司的安全实践。[2]

🎓 Alexandre Pauwels

剑桥大学网络安全研究员。独立发现了同一漏洞,从学术角度验证了这一安全隐患的存在。[2]

技术细节:CMS 配置错误

根据 Fortune 的报道,问题的根源在于 Anthropic 使用的外部 CMS 系统的默认配置:数字资产在上传时默认设置为公开状态,系统会自动为每个上传的文件分配一个公开可访问的 URL。这意味着任何知道或能猜测到 URL 模式的人,都可以直接访问这些未发布的文件。[2]

~3000
未发布资产总数
4 类
资产类型
公开
默认访问权限
即时
修复响应

泄露的资产包括四大类:

Anthropic 的回应

在 Fortune 联系 Anthropic 后,该公司立即移除了公开访问权限并承认这是一次「人为配置错误」。Anthropic 强调,此次泄露「与 Claude、Cowork 或任何 Anthropic AI 工具无关」——即泄露不涉及 AI 模型本身的安全或用户数据,仅涉及营销和传播团队使用的 CMS 系统中的内容资产。[1]

关键区分:Anthropic 明确将此事件定性为 CMS 系统的配置问题,而非 AI 模型或核心基础设施的安全漏洞。但对于一家以安全为核心品牌承诺的公司而言,在最基础的数字资产管理层面出现如此疏忽,依然引发了外界对其安全文化全面性的质疑。[1][2]
§2

Claude Mythos 模型解析:超越 Opus 的全新 tier

关联名称 Capybara,Anthropic 发言人称其为「a step change」

Anthropic 公司标识
Anthropic 公司标识 · 图片来源:Fortune / Getty Images

泄露文档中最具爆炸性的信息,是一个名为 Claude Mythos(泄露文档同时提及 Capybara,两者具体关系尚不明确)的全新模型的详细描述。根据泄露的内部资料,Mythos 并非 Opus 的迭代升级,而是 Anthropic 模型产品线中一个全新的、更高的层级(tier)——比 Opus 更大、更智能、也更贵。[1][4]

🏷 名称与代号

正式名称:Claude Mythos
关联名称:Capybara(Fortune 报道称两者"appear to refer to the same model",但部分泄露材料暗示可能是同一 tier 的不同版本)
定位:超越 Opus 的全新 tier,Anthropic 模型产品线最高层级[1][4]

官方表态

Anthropic 发言人对 Fortune 声明:
「a step change in AI performance」(发言人对外声明)
「the most capable we've built to date」(发言人对外声明)[1]

核心能力与定位

根据泄露的内部文档,Claude Mythos 在软件编程、学术推理、网络安全等多个 benchmark 上大幅超越 Opus 4.6。[1][5] 但最引人关注的,是 Anthropic 对其网络安全能力的描述:

"Currently far ahead of any other AI model in cyber capabilities... presages an upcoming wave of models that can exploit vulnerabilities in ways that far outpace the efforts of defenders."[1][5]

这段描述的含义极为重大:Anthropic 自己承认,Mythos 在网络安全攻击能力上不仅超越了所有现有 AI 模型,还预示着一波新模型的到来,这些模型利用漏洞的能力将远超防御者的应对速度[5]

维度Claude Opus 4.6Claude Mythos变化
产品层级旗舰(Opus tier)超旗舰(新 tier)全新层级
软件编程领先大幅超越 Opus显著提升
学术推理领先大幅超越 Opus显著提升
网络安全远超所有 AI 模型双刃剑
运营成本$5/$25极其昂贵大幅上升
当前状态公开可用Early Access 测试受限访问

发布策略:谨慎发布与 Early Access

泄露文档显示,Anthropic 为 Mythos 采取了谨慎发布策略:初期仅向少量早期客户开放,聚焦于网络安全防御用例。这一策略反映了 Anthropic 对 Mythos 强大网络安全能力的双刃剑本质的深刻认知——既能用于发现和修复漏洞,也可能被滥用于攻击。[1][6]

Anthropic 在确认 Mythos 存在后表示,该模型目前正在 early access 客户中进行测试,且运营成本「极其昂贵」(extremely expensive to operate)。[1]

欧洲 CEO 闭门峰会

Dario Amodei
Anthropic CEO Dario Amodei · 图片来源:Fortune / Getty Images

泄露资料还揭示了 Anthropic 计划在英国举办一场面向欧洲大型企业 CEO 的邀请制闭门峰会。Anthropic CEO Dario Amodei 计划亲自出席,目的是向大型企业客户推销 Claude AI 模型。这一信息的泄露可能影响 Anthropic 的企业销售策略和谈判节奏。[2]

Mythos 定位总结:Claude Mythos 代表了 Anthropic 在模型能力上的一次质的飞跃。超越 Opus 的全新 tier 定位、被官方承认的「远超所有 AI」的网络安全能力、以及极高的运营成本,共同描绘了一个专为高价值、高风险场景设计的顶级模型形象。但 Mythos 的存在也引发了一个根本性问题:当一个模型被其创造者自己描述为「利用漏洞的能力远超防御者」时,如何确保它不被滥用?[1][5]

登录后阅读完整报告

包含详细分析、数据图表、竞品对比、参考文献等

Google 登录