Attack  ·  用語集

System prompt leakage

組織がAIシステムに読み込ませる隠された指示セット—その「システムプロンプト」—はAIのペルソナ、ルール、機密コンテキスト、およびビジネスロジックを定義します。システムプロンプトの漏洩は、攻撃者がAIを騙すか誤設定することで、これらの指示を明かさせることで発生し、専有ワークフロー、内部データ参照、セキュリティバイパスのヒント、または競争情報を露出させます。
システムプロンプトはしばしば、組織がエンドユーザーから隠れていると想定しているビジネス機密情報を含んでいます。漏洩したプロンプトはセキュリティ制御を明かし、標的を絞った攻撃を可能にするか、知的財産およびコンプライアンスプロセスを露出させる可能性があります。GitLabのAIコーディングアシスタントの欠陥は、まさにこの種の機密データを露出させました。
参考資料
OWASP LLM Top 10 — LLM07:2025 System Prompt Leakage
ライブフィードで追跡 この概念が実際のAIセキュリティ・ガバナンスの動向でどう現れるかを確認。
フィードを開く →