Anthropic、Claude Fable 5およびMythos 5システムカードを公開 — 詳細なサイバー機能評価、デュアル構成セーフティアーキテクチャ、およびエージェントプロンプトインジェクションベンチマーク結果

何が起きたか

2026年6月9日、Anthropicは一般向けにClaude Fable 5を、サイバーディフェンダーの限定グループ向けにClaude Mythos 5を詳細なシステムカードとともにリリースした。主な知見：Mythos 5は現在までに評価された最も高性能なサイバーモデルであり、エクスプロイト開発ではOpus 4.8を大幅に上回る成績を達成；Fable 5はサイバーセキュリティ分類器を使用しており、サイバー関連クエリが検出された場合、セッションの約5%をOpus 4.8にルーティング；Mythos 5は外部Gray Swanプロンプトインジェクションベンチマークで最低（最良）の結果を達成；サイバーセキュリティセーフガードの破壊は「極めて困難だが不可能ではない」と評価；セーフガードなしのMythos 5は化学および生物学研究において「十分なリソースを持つ脅威アクターを大幅に強化できる」。Fable 5の価格は$10/1M入力トークン / $50/1M出力トークンで、Mythos Previewの半分以下。

なぜ重要か

これは初のTier 2システムカードであり、Mythosスケールでのデュアルユース型サイバーリスクを定量化し、これを管理するために使用される特定のセーフガードアーキテクチャを文書化している。分類器を備えていても、Mythosクラスの機能レベルでのFable 5の公開リリースは、AI支援サイバー攻撃の脅威モデルが大幅に変わったことを意味する：ディフェンダーは現在、敵対者が同等の機能を持つモデルにアクセスしているか、アクセスするようになることを想定する必要がある。Gray Swanプロンプトインジェクションベンチマークのスコアは、エージェントセーフティ評価フレームワークの有用な外部参照ポイントである。

必要な対応

Fable 5/Mythos 5システムカードを読んで、組織のAI脅威モデルを更新してください。特に、Gray Swanベンチマークおよび METR評価結果を自身のレッドティーミングスコープの参照ポイントとして使用し、Mythosクラスモデルが現在Fable 5を通じて一般向けにアクセス可能になったことの含意についてクライアントに説明してください。