Attack  ·  用語集

Malicious model / poisoned AI model

AIモデルファイル(通常、HuggingFaceなどのパブリックリポジトリからダウンロード)が改ざんされ、正規のAIサーバーによって読み込まれる際に攻撃者コードを実行するもの。従来のマルウェアとは異なり、疑わしい実行可能ファイルは存在せず、攻撃はモデルの重みまたは関連コード内に隠されており、開発者または本番サーバーがモデルを読み込む瞬間に自動的にトリガーされます。
AIチームは定期的にパブリックハブから事前学習済みモデルをダウンロードして時間とコストを節約しており、単一の毒入りモデルは攻撃者にAIサーバーおよびそれが接続するすべてのものを完全に制御させることができます。この攻撃はユーザーの操作を必要とせず、ほとんどの従来のアンチウイルスツールをバイパスします。
参考資料
MITRE ATLAS — AML.T0010 ML Supply Chain Compromise
ライブフィードで追跡 この概念が実際のAIセキュリティ・ガバナンスの動向でどう現れるかを確認。
フィードを開く →