Claude Mythos 泄露事件：Anthropic 下一代模型意外曝光，网络安全能力「远超所有 AI」

编辑洞察：这不只是一次 CMS 配置失误。当一家以「负责任的 AI 开发」为核心品牌叙事的公司，因最基础的数字资产管理疏忽暴露了其最敏感的模型计划时——尤其是在该模型被描述为拥有「远超所有 AI」的网络安全攻击能力的背景下——这一事件所揭示的，是安全治理承诺与安全实践之间令人不安的落差。

2026 年 3 月 26 日，Fortune 独家报道了 Anthropic 的一次重大数据泄露事件：两位安全研究员发现该公司的外部 CMS 系统存在配置错误，导致近 3000 个未发布资产（包括图片、PDF、音频文件和博文草稿）被公开访问。^[1]^[2]

泄露内容中最引人注目的，是一个名为 Claude Mythos（关联名称 Capybara）的全新模型的存在。Anthropic 内部文档将其定位为超越 Opus 的更高层级，Anthropic 发言人对 Fortune 表示其代表了「a step change in AI performance」，并特别指出其网络安全能力「currently far ahead of any other AI model」。^[1]^[4]

这一事件发生在一个微妙的时间节点：就在一个月前，Bloomberg 报道了一名黑客利用 Claude 订阅服务入侵墨西哥政府系统、窃取 150GB 敏感数据的事件^[3]；Anthropic 刚在 2 月发布了删除「暂停训练」硬承诺的 RSP v3.0^[7]。本报告将完整复盘泄露事件始末、解析 Mythos 模型定位、梳理安全争议全景，并评估对行业的深远影响。

图片来源：NewsBytesApp / Getty Images

§1

泄露事件始末：CMS 配置错误如何暴露 3000 个资产

Fortune 独家报道、安全研究员审阅、技术细节与 Anthropic 的回应

发现与审阅过程

此次泄露由 Fortune 记者 Beatrice Nolan 率先发现，随后邀请两位安全研究员对泄露材料进行评估：Roy Paz（LayerX Security 高级 AI 安全研究员）定位并审阅了未加密材料，Alexandre Pauwels（剑桥大学网络安全研究员）对泄露内容进行了独立评估。他们确认 Anthropic 使用的外部内容管理系统（CMS）存在配置错误，导致上传到该系统的数字资产在上传时被自动分配了公开可访问的 URL。^[2]

🔍 Roy Paz

LayerX Security 高级 AI 安全研究员。LayerX 是一家专注于浏览器安全的以色列网络安全公司，其研究团队长期关注 AI 公司的安全实践。^[2]

🎓 Alexandre Pauwels

剑桥大学网络安全研究员。独立发现了同一漏洞，从学术角度验证了这一安全隐患的存在。^[2]

技术细节：CMS 配置错误

根据 Fortune 的报道，问题的根源在于 Anthropic 使用的外部 CMS 系统的默认配置：数字资产在上传时默认设置为公开状态，系统会自动为每个上传的文件分配一个公开可访问的 URL。这意味着任何知道或能猜测到 URL 模式的人，都可以直接访问这些未发布的文件。^[2]

~3000

未发布资产总数

4 类

资产类型

公开

默认访问权限

即时

修复响应

泄露的资产包括四大类：

🖼
图片文件
包括产品截图、营销素材、未发布的 UI 设计等可视化资产。^[2]
📄
PDF 文档
包含内部文档、技术说明和产品规划相关材料。^[2]
🎧
音频文件
可能包括内部会议录音、播客预录等音频内容。^[2]
📝
博文草稿
包括尚未正式发布的博客文章——正是这些草稿泄露了 Claude Mythos 模型的存在和详细信息。^[1]^[2]

Anthropic 的回应

在 Fortune 联系 Anthropic 后，该公司立即移除了公开访问权限并承认这是一次「人为配置错误」。Anthropic 强调，此次泄露「与 Claude、Cowork 或任何 Anthropic AI 工具无关」——即泄露不涉及 AI 模型本身的安全或用户数据，仅涉及营销和传播团队使用的 CMS 系统中的内容资产。^[1]

关键区分：Anthropic 明确将此事件定性为 CMS 系统的配置问题，而非 AI 模型或核心基础设施的安全漏洞。但对于一家以安全为核心品牌承诺的公司而言，在最基础的数字资产管理层面出现如此疏忽，依然引发了外界对其安全文化全面性的质疑。^[1]^[2]

§2

Claude Mythos 模型解析：超越 Opus 的全新 tier

关联名称 Capybara，Anthropic 发言人称其为「a step change」

Anthropic 公司标识 · 图片来源：Fortune / Getty Images

泄露文档中最具爆炸性的信息，是一个名为 Claude Mythos（泄露文档同时提及 Capybara，两者具体关系尚不明确）的全新模型的详细描述。根据泄露的内部资料，Mythos 并非 Opus 的迭代升级，而是 Anthropic 模型产品线中一个全新的、更高的层级（tier）——比 Opus 更大、更智能、也更贵。^[1]^[4]

🏷 名称与代号

正式名称：Claude Mythos
关联名称：Capybara（Fortune 报道称两者"appear to refer to the same model"，但部分泄露材料暗示可能是同一 tier 的不同版本）
定位：超越 Opus 的全新 tier，Anthropic 模型产品线最高层级^[1]^[4]

⚡ 官方表态

Anthropic 发言人对 Fortune 声明：
「a step change in AI performance」（发言人对外声明）
「the most capable we've built to date」（发言人对外声明）^[1]

核心能力与定位

根据泄露的内部文档，Claude Mythos 在软件编程、学术推理、网络安全等多个 benchmark 上大幅超越 Opus 4.6。^[1]^[5] 但最引人关注的，是 Anthropic 对其网络安全能力的描述：

"Currently far ahead of any other AI model in cyber capabilities... presages an upcoming wave of models that can exploit vulnerabilities in ways that far outpace the efforts of defenders."^[1]^[5]

这段描述的含义极为重大：Anthropic 自己承认，Mythos 在网络安全攻击能力上不仅超越了所有现有 AI 模型，还预示着一波新模型的到来，这些模型利用漏洞的能力将远超防御者的应对速度。^[5]

维度	Claude Opus 4.6	Claude Mythos	变化
产品层级	旗舰（Opus tier）	超旗舰（新 tier）	全新层级
软件编程	领先	大幅超越 Opus	显著提升
学术推理	领先	大幅超越 Opus	显著提升
网络安全	强	远超所有 AI 模型	双刃剑
运营成本	$5/$25	极其昂贵	大幅上升
当前状态	公开可用	Early Access 测试	受限访问

发布策略：谨慎发布与 Early Access

泄露文档显示，Anthropic 为 Mythos 采取了谨慎发布策略：初期仅向少量早期客户开放，聚焦于网络安全防御用例。这一策略反映了 Anthropic 对 Mythos 强大网络安全能力的双刃剑本质的深刻认知——既能用于发现和修复漏洞，也可能被滥用于攻击。^[1]^[6]

Anthropic 在确认 Mythos 存在后表示，该模型目前正在 early access 客户中进行测试，且运营成本「极其昂贵」（extremely expensive to operate）。^[1]

欧洲 CEO 闭门峰会

Anthropic CEO Dario Amodei · 图片来源：Fortune / Getty Images

泄露资料还揭示了 Anthropic 计划在英国举办一场面向欧洲大型企业 CEO 的邀请制闭门峰会。Anthropic CEO Dario Amodei 计划亲自出席，目的是向大型企业客户推销 Claude AI 模型。这一信息的泄露可能影响 Anthropic 的企业销售策略和谈判节奏。^[2]

Mythos 定位总结：Claude Mythos 代表了 Anthropic 在模型能力上的一次质的飞跃。超越 Opus 的全新 tier 定位、被官方承认的「远超所有 AI」的网络安全能力、以及极高的运营成本，共同描绘了一个专为高价值、高风险场景设计的顶级模型形象。但 Mythos 的存在也引发了一个根本性问题：当一个模型被其创造者自己描述为「利用漏洞的能力远超防御者」时，如何确保它不被滥用？^[1]^[5]

登录后阅读完整报告

包含详细分析、数据图表、竞品对比、参考文献等

Google 登录

或

Claude Mythos 泄露事件Anthropic 下一代模型意外曝光，网络安全能力「远超所有 AI」