技術的な説明
監査結果によると、prompt injection は本番環境の AI デプロイメントの 73% に存在し、間接的(データソース由来)インジェクションは現在、文書化された企業の攻撃試行の 80% 以上を占めています。OpenAI は公開声明で、この問題が完全に排除される可能性は低いことを認めています。
攻撃経路
直接的なプロンプト操作と、有害なドキュメント、Web ページ、エージェントが信頼できるデータとして消費するツール出力を通じた間接的なインジェクション。
影響を受けるシステム
すべての LLM バックアップアプリケーションとエージェント。特に広範なツールアクセスを持つエージェント AI に対して重大です。
緩和策
指示/データの境界を強制する。ツール呼び出しをサンドボックス化する。ツールスコープに最小権限を適用する。異常な動作を監視する。継続的に red-team を実施する。