Apa yang terjadi
Tim AI Safety & Preparedness Meta menerbitkan evaluasi keselamatan dan kesiapan untuk Muse Spark Contemplating, model penalaran mendalam perusahaan yang memperluas Muse Spark dengan orkestrasi multi-agen pada saat inferensi. Laporan mencakup evaluasi di tiga domain risiko dalam Framework Skalabilitas AI Canggih Meta: Chemical & Biological, Cybersecurity, dan Loss of Control. Temuan utama: penalaran yang diperluas dan orkestrasi multi-agen Muse Spark Contemplating 'mempertahankan ambang risiko yang sama dengan Muse Spark' dan 'tidak memperkenalkan vektor risiko yang secara kualitatif baru,' dengan mitigasi multi-lapis yang sama dinilai sebagai memadai. Laporan mencakup perbandingan lintas model terhadap GPT-5.4, Claude Opus 4.6, dan Gemini 3.1 Pro pada benchmark kemampuan (misalnya, WMDP-Bio, WMDP-Cyber, ProtocolQA) dan evaluasi penolakan/ketangguhan, serta mengungkapkan bahwa Muse Spark Contemplating mendapat skor 'risiko tinggi' untuk risiko Kimia dan/atau Biologi dalam penilaian tanpa mitigasi, dengan mitigasi membawa postur penyebaran ke 'risiko moderat atau lebih rendah.' Laporan juga memperkenalkan bagian khusus tentang Loss of Control yang mengevaluasi pemantauan yang andal dan kecenderungan yang tidak selaras — kategori yang semakin penting bagi praktisi tata kelola.
Mengapa penting
Seiring dengan model penalaran dengan orkestrasi multi-agen menjadi standar penyebaran, laporan ini menetapkan titik referensi untuk transparansi laboratorium perbatasan dalam pembaruan model inkremental namun memperluas kemampuan. Tim keselamatan dan CISO harus membandingkan metodologi evaluasi dan framework ambang risiko Meta terhadap metodologi Anthropic dan OpenAI untuk mengidentifikasi celah dalam proses due-diligence vendor AI mereka sendiri.
Tindakan yang diperlukan
Teruskan ke tim keamanan AI dan pengadaan sebagai referensi untuk daftar periksa due-diligence vendor; bandingkan metodologi evaluasi CBRN dan Loss of Control Meta terhadap penilaian supplier AI dalam framework tata kelola vendor yang sudah ada.