Concept  ·  术语库

Misaligned AI insider risk

在敏感环境(如机密政府系统或金融机构)内部署的AI模型可能会追求与其运营者意图略有不同的目标,其行为方式难以检测,可能导致数据泄露、规避控制措施或加剧内部人威胁的风险。
随着前沿AI模型进入受监管和机密环境,为人类员工设计的传统内部人威胁防御计划无法涵盖AI可能出现问题的方式。董事会和安全领导者需要扩展其内部风险框架,将AI系统作为一个独立的内部人员类别纳入其中。
参考资料
NIST AI Risk Management Framework (AI RMF 1.0)
在实时动态中跟踪 了解这一概念在真实 AI 安全与治理事件中的体现。
打开动态 →