Anthropic 发布 Claude Fable 5 和 Mythos 5 系统卡 — 详细的网络能力评估、双配置安全架构和代理提示注入基准结果

事件经过

2026 年 6 月 9 日，Anthropic 发布了 Claude Fable 5 供普通用户使用，Claude Mythos 5 供限制的网络防御者团体使用，以及详细的系统卡。关键发现：Mythos 5 是迄今为止评估的最有能力的网络模型，在漏洞利用开发方面远远领先 Opus 4.8；Fable 5 使用网络安全分类器，在检测到与网络相关的查询时，约 5% 的会话路由到 Opus 4.8；Mythos 5 在外部 Gray Swan 提示注入基准上取得了最低（最好）的结果；突破网络安全防护被评估为"极其困难但并非不可能"；未防护的 Mythos 5 可在化学和生物研究方面"大幅提升资源充足的威胁行为体"。Fable 5 的价格为 $10/1M 输入 / $50/1M 输出令牌——不到 Mythos Preview 价格的一半。

影响分析

这是第一个第 2 层系统卡，量化了 Mythos 规模的双用途网络风险，并记录了用于管理它的具体防护架构。Fable 5 在 Mythos 级别能力下的公开发布——即使使用分类器——也意味着 AI 辅助网络攻击的威胁模型已实质性转变：防御者必须现在假设对手已获得或将获得可比能力水平的模型。Gray Swan 提示注入基准得分是代理安全评估框架的有用外部参考点。

建议行动

阅读 Fable 5/Mythos 5 系统卡以更新您组织的 AI 威胁模型；具体而言，使用 Gray Swan 基准和 METR 评估结果作为您自己红队范围的参考点，并向客户简述 Mythos 级模型现在可通过 Fable 5 被大众访问的影响。