定義
実行中のAIエージェントをハイジャックし、データまたはツールを通じて悪意のある指示を与えることで、タスク実行中にその動作を制御する攻撃。攻撃者は本質的にエージェントを「操舵」して、有害なコマンド(マルウェア実行、データ流出)を正当なオペレーターからの指示のように実行させる。
なぜ重要か
エージェントは広範なシステムアクセス(開発者認証情報、コードリポジトリ、クラウドインフラストラクチャ)を持っているため、agentjackingの成功は完全なネットワーク侵入と同等の被害をもたらす可能性がある。これは2026年に本番エンタープライズ環境で文書化された。