現実的なシナリオにおけるツール使用LLMエージェントのデータ漏洩リスクの評価

何が起きたか

シンガポールAI安全研究所（SG AISI）と韓国AI安全研究所（KR AISI）は、2026年6月15日に、非敵対的で日常的な条件下で動作するツール使用LLMエージェントのデータ漏洩リスクの厳密な評価（arXiv:2606.17114）を共同で発表した。2つの研究所は独立してテストパイプラインを構築した――ReActスタイルのエージェント足場、モデルシミュレーションされたユーザー、MCPベースのツール環境、およびタスク固有のLLM判定ルーブリック――その後、12の現実的なタスク（従業員オンボーディング、カスタマーサポート、DevOps、Webオートメーション、エンタープライズ生産性）の共通セットを実行した。5つのリスク分類をカバーした：データ認識の欠如、対象者認識、ポリシーコンプライアンス、データ最小化、およびアクセス境界認識。見出しの発見は明白である：テストされた3つのエージェント全体で、「すべてのシナリオにおいて完全に正しく完全に安全な実行を達成したものはなく」「成功したタスク完了はしばしば不要な情報へのアクセスまたは不適切な受信者への情報開示などのデータ処理の失敗と一致した」。論文は「運用的データ漏洩は敵対的流出とは異なる一次的なエージェント安全性の懸念である」と結論付けており、能力とデータ処理安全性は別々に評価される必要があると述べている。注記：プレプリント、まだピアレビューされていない。

なぜ重要か

企業がメール、CRM、コードリポジトリ、および内部データベースへのアクセスを持つLLMエージェントをデプロイするにつれて、この政府間評価は、良性の日常的なエージェント使用でも定期的に機密データを漏洩することを示す最初の体系的でマルチ機関の証拠を提供する――それを広範なデプロイ前の強制的なエージェントデータ処理標準の最強の現在の経験的事例にする。

必要な対応

敏感なデータに触れるエンタープライズエージェントデプロイ前の門として、能力ベンチマークとは別のデータ処理安全性評価を要求する。現在のエージェント権限をこの論文で特定された5つのリスク分類に対してレビューする。