Apa yang terjadi
Evaluasi kuartalan ketiga Concordia AI terhadap Platform Pemantauan Risiko AI Frontier, dipublikasikan 2 Juni 2026, menilai 70+ model frontier dari 16 perusahaan menggunakan kerangka kerja Risk Index v1.5 yang ditingkatkan yang memperluas tolok ukur evaluasi dari 29 menjadi 42 dan menambahkan domain risiko kelima — 'manipulasi berbahaya' — bersama dengan serangan siber, risiko biologis, risiko kimia, dan kehilangan kontrol. Temuan struktural utama: perlindungan penyalahgunaan (siber, bio, kimia, manipulasi) menunjukkan pola keseluruhan kemampuan dan keselamatan yang meningkat bersamaan, sementara indeks risiko kehilangan kontrol telah meningkat selama 'tiga kuartal berturut-turut, dengan peningkatan kumulatif 51%' — satu-satunya domain di mana pertumbuhan kemampuan melampaui peningkatan keselamatan. Laporan menemukan bahwa skor CyBench teratas untuk tugas serangan siber yang kompleks 'mencapai 80 untuk pertama kalinya, peningkatan 108% dibandingkan tiga kuartal yang lalu,' dan lebih dari setengah model Q1 2026 sekarang melebihi baseline ahli manusia dalam tugas pemecahan masalah eksperimental biologis. Model closed-source mendominasi frontier berkemampuan tinggi dan berisiko rendah dalam empat dari lima domain; model open-source tertinggal terutama dalam kemampuan daripada skor keselamatan, dengan pengecualian risiko kimia di mana Kimi K2.5 memimpin. Laporan merekomendasikan pengembang memprioritaskan penilaian kemampuan pra-rilis dan penyelarasan keselamatan dalam domain kehilangan kontrol, dan mengajak para pembuat kebijakan untuk membedakan tata kelola berdasarkan tingkat kemampuan, profil keselamatan, dan distribusi terbuka/tertutup.
Mengapa penting
Kenaikan risiko kehilangan kontrol tiga kuartal sebesar 51% — mencakup penyebarluasan diri, kesalahselarasan agensi, ketahanan shutdown, dan kecenderungan pengaruh tersembunyi — adalah sinyal empiris bahwa penyelarasan keselamatan saat ini tidak selaras dengan pertumbuhan kemampuan dalam domain yang paling relevan dengan risiko AI bencana. Dewan, CISO, dan pemimpin kebijakan yang mengawasi pengadaan AI frontier atau kerangka kerja tata kelola perlu memahami keluarga model mana yang berada di kuadran risiko mana.
Tindakan yang diperlukan
Bagikan temuan domain kehilangan kontrol dengan komite tata kelola AI Anda dan silangkan keluarga model spesifik yang disebutkan (seri Gemini menunjukkan indeks risiko kehilangan kontrol yang secara signifikan meningkat; seri GPT dan Claude tetap berada dalam pita risiko lebih rendah) terhadap daftar model yang disetujui dan perjanjian vendor Anda.