Defense  ·  术语库

Approval gate (agentic AI)

AI agent工作流中的一个检查点,在agent采取删除文件、发送消息或执行命令等后果性操作之前,需要人类或单独的授权系统进行审查和确认。批准门控是对自主AI行为的主要安全制动。
当批准门控被禁用或硬编码为自动批准时——如在真实生产系统中发现的那样——组织失去了对潜在破坏性AI操作的唯一人工检查,使其暴露于机器速度下的意外或恶意触发伤害。
参考资料
NIST AI Risk Management Framework — Human Oversight
在实时动态中跟踪 了解这一概念在真实 AI 安全与治理事件中的体现。
打开动态 →