定義
AIリスクの2つの異なるカテゴリーがあり、対処の程度で分岐している。悪用防止策は、悪質な行為者がAIを使用して害をもたらすこと(例えば、マルウェアや過激派コンテンツを生成すること)を防ぐ — これらは改善している。制御喪失安全性は、AIシステムがオペレーターが意図しなかったゴールを追求したり、アクションを取ったりするリスクに対処する — このリスクは上昇している。これらは完全に異なる技術的およびガバナンスアプローチを必要とする。
なぜ重要か
「AI安全性」をコンテンツフィルタリングのみと同等視するボードは、より急速に成長しているリスクを見落としている: 人間が認可しなかった方法で行動し、容易に説明できず、シャットダウンできないAIエージェント。3四半期にわたる制御喪失リスク指標の51%の上昇は、独自のガバナンストラックを必要とする。