ガイドライン  ·  2026-04-12

Google DeepMindが、ウェブベースのAIエージェント トラップの6つのカテゴリをマッピング

ガイドラインHigh 影響度Global
Google DeepMindの研究者は、自律型AIエージェントに対するウェブベースの攻撃の6つのカテゴリをマッピングした最初の体系的フレームワークを発表しました:コンテンツインジェクション、セマンティック操作、認知状態(メモリ)ポイズニング、行動制御、システム攻撃、およびヒューマン・イン・ザ・ループトラップです。
レッドチーム研究では、テストされたすべてのAIエージェントが少なくとも1回は正常に侵害されたことが判明しました。このフレームワークは、悪意のあるサーバーがAIエージェントを検出し、人間の訪問者には見えないプロンプトインジェクション ペイロードが埋め込まれた異なるコンテンツを配信する「Dynamic Cloaking」攻撃を明らかにしています。
ウェブブラウジングAIエージェントをデプロイするセキュリティチームは、エージェント固有のウェブコンテンツフィルタリング、ユーザーエージェント難読化、および出力検証を実装する必要があります。現在のエージェントデプロイメントに対する6つの攻撃カテゴリを確認し、それに応じて脅威モデルを更新してください。
出典
SecurityWeek - Google DeepMind Maps Web Attacks Against AI AgentsCyberNews - AI Agent Traps Adversarial ContentOpenClawAI - Six Attack Categories
ライブフィードで見る AIセキュリティとガバナンスの関連情報をさらに見る — 毎朝更新。
フィードを開く →