Attack  ·  用語集

Sandbox escape (AI coding agents)

セキュリティ境界(サンドボックスと呼ばれる)は、AI コーディングエージェントのアクションを承認されたファイルとディレクトリに限定することになっています。サンドボックスエスケープは、攻撃者がその境界を回避する方法を見つけた場合で、AI エージェント(およびそれが読むものに影響を与えることができる誰でも)がコンピュータ上の任意のファイルにアクセスまたは変更する能力を持つようになります。AI コーディングツールでは、これは単に悪意のあるコードリポジトリを開くことでトリガーされる可能性があります。
開発者は AI コーディングアシスタントがプロジェクトフォルダ内で安全に動作することを信頼しています。サンドボックスエスケープは、開発者が開く任意のリポジトリ(パブリックなものを含む)がマシン全体と企業の認証情報を静かに危険にさらす可能性があることを意味します。同じ広く使用されているツール(Cursor)の単一リリースで、2 つの独立したエスケープパスが見つかりました。
参考資料
MITRE ATT&CK — Escape to Host (T1611)
ライブフィードで追跡 この概念が実際のAIセキュリティ・ガバナンスの動向でどう現れるかを確認。
フィードを開く →