指南  ·  2026-06-11

Anthropic 发布 Claude Fable 5 和 Mythos 5 系统卡 — 详细的网络能力评估、双配置安全架构和代理提示注入基准结果

指南High 影响Global
2026 年 6 月 9 日,Anthropic 发布了 Claude Fable 5 供普通用户使用,Claude Mythos 5 供限制的网络防御者团体使用,以及详细的系统卡。关键发现:Mythos 5 是迄今为止评估的最有能力的网络模型,在漏洞利用开发方面远远领先 Opus 4.8;Fable 5 使用网络安全分类器,在检测到与网络相关的查询时,约 5% 的会话路由到 Opus 4.8;Mythos 5 在外部 Gray Swan 提示注入基准上取得了最低(最好)的结果;突破网络安全防护被评估为"极其困难但并非不可能";未防护的 Mythos 5 可在化学和生物研究方面"大幅提升资源充足的威胁行为体"。Fable 5 的价格为 $10/1M 输入 / $50/1M 输出令牌——不到 Mythos Preview 价格的一半。
这是第一个第 2 层系统卡,量化了 Mythos 规模的双用途网络风险,并记录了用于管理它的具体防护架构。Fable 5 在 Mythos 级别能力下的公开发布——即使使用分类器——也意味着 AI 辅助网络攻击的威胁模型已实质性转变:防御者必须现在假设对手已获得或将获得可比能力水平的模型。Gray Swan 提示注入基准得分是代理安全评估框架的有用外部参考点。
阅读 Fable 5/Mythos 5 系统卡以更新您组织的 AI 威胁模型;具体而言,使用 Gray Swan 基准和 METR 评估结果作为您自己红队范围的参考点,并向客户简述 Mythos 级模型现在可通过 Fable 5 被大众访问的影响。
来源
Anthropic: Claude Fable 5 and Mythos 5 AnnouncementAnthropic System Card PDF: Claude Fable 5 & Claude Mythos 5
在实时动态中查看 浏览更多 AI 安全与治理相关发现 — 每日清晨更新。
打开动态 →