OpenAIのGPT-5.5のサイバー機能の評価

何が起きたか

英国AI安全研究所は、キャプチャ・ザ・フラッグ形式の演習を使用してOpenAIのGPT-5.5をサイバー機能タスクで評価し、脆弱性研究と悪用スキルを評価しました。GPT-5.5は、AISIの企業ネットワーク攻撃シミュレーションをエンドツーエンドで完了した2番目のモデル（AnthropicのClaude Mythos Previewに次ぐ）です。これは人間が約20時間かかると推定される複数ステップの演習です。初期チェックポイントからの結果は、GPT-5.5がClaude Mythosと同様レベルのサイバーパフォーマンスに到達していることを示しており、複数のフロンティア開発者が高度な攻撃的サイバー機能に収束していることを示しています。

なぜ重要か

異なる開発者による2つの独立したフロンティアモデルが、構造化テストにおいてエンドツーエンドの自律的サイバー侵入機能を実証しています。これは、高度な攻撃的サイバーAIがもはや一度限りの機能ではなく、フロンティアラボエコシステム全体で再現可能な結果であり、防御組織がAI強化攻撃に備えるための期間を短縮することを示しています。

必要な対応

レッドチームとサイバー防御リーダーを招集して、AISIの公開評価方法論を確認し、組織の脅威モデルが複数ステップの自律的な侵入を考慮しているかどうかを評価してください。インシデント対応プレイブックを更新して、攻撃者がAIを偵察、ラテラルムーブメント、およびマシン速度での悪用に活用するシナリオを含めてください。