Attack  ·  用語集

Data and model poisoning

悪質な行為者が AI モデルの訓練またはアップデートに使用されるデータを意図的に破損させるか、モデルが実行時に利用するナレッジベースに悪意のあるコンテンツを注入する攻撃。目標は、モデルの動作を誤らせ、偏った出力を生成させるか、後でトリガーされる可能性のある隠れたバックドアを作成することです。
毒性を持つ訓練データはエンドユーザーには見えず、製品のアップデートを通じて存続する可能性があります。つまり、侵害されたモデルは展開後も長期間にわたって微妙に間違った、または有害な回答を提供する可能性があります。AI パッケージに毒性を与えるサプライチェーン攻撃(Shai-Hulud/Miasma ワームなど)は、これがもはや仮説的ではないことを示しています。
参考資料
OWASP LLM Top 10 2025 — LLM04: Data and Model PoisoningMITRE ATLAS — ML Supply Chain Compromise
ライブフィードで追跡 この概念が実際のAIセキュリティ・ガバナンスの動向でどう現れるかを確認。
フィードを開く →