技術的な説明
Adversa AIの2026年4月のエージェント型AI セキュリティ調査によると、監査対象の30のAIエージェントフレームワークの93%がスコープなしAPIキーに依存しており、0%がエージェント単位のアイデンティティを実装し、97%がユーザー同意メカニズムを欠いています。さらに、LLMエージェントに対するメモリポイズニング攻撃はGPT-5 miniやClaude Sonnet 4.5を含む主要モデルに対して90%以上の成功率を達成しています。
攻撃経路
攻撃者はエージェント単位のアイデンティティとスコープなしAPIキーの欠如を利用して、エージェントフレームワーク全体で権限昇格を行います。メモリポイズニングは、将来のワークフローをハイジャックする悪意のあるエントリをエージェントの永続メモリに注入することです。TrinityGuard評価フレームワークは、マルチエージェントシステム全体で平均7.1%のセーフティパス率しか検出しませんでした。
影響を受けるシステム
30の主要AIエージェントフレームワークを評価。メモリポイズニングのテスト対象の具体的なモデルにはGPT-5 miniおよびClaude Sonnet 4.5が含まれます。AG2/AutoGenを使用するマルチエージェントオーケストレーションプラットフォームも影響を受けます。
緩和策
すべてのエージェントフレームワークにエージェント単位のアイデンティティとスコープ付きAPIキーを実装します。エージェントメモリストアのメモリ整合性チェックと入力検証をデプロイします。AG2/AutoGen統合を備えたオープンソースのTrinityGuardフレームワークを使用してエージェントデプロイメントを評価します。