Apa yang terjadi
Pada 9 Juni 2026, Anthropic merilis Claude Fable 5 untuk penggunaan umum dan Claude Mythos 5 untuk kelompok terbatas cyberdefenders, bersama dengan kartu sistem terperinci. Temuan utama: Mythos 5 adalah model cyber paling mampu yang dievaluasi hingga saat ini, mencetak jauh lebih maju dari Opus 4.8 dalam pengembangan exploit; Fable 5 menggunakan pengklasifikasi keamanan siber yang mengarahkan ~5% sesi ke Opus 4.8 ketika query terkait cyber terdeteksi; Mythos 5 mencapai hasil terendah (terbaik) pada benchmark prompt-injection Gray Swan eksternal; memecahkan safeguard keamanan siber dinilai sebagai 'sangat sulit meskipun tidak mustahil'; dan Mythos 5 tanpa safeguard dapat 'secara signifikan meningkatkan threat actors yang well-resourced' pada penelitian kimia dan biologi. Fable 5 dihargai $10/1M input / $50/1M output tokens — kurang dari setengah harga Mythos Preview.
Mengapa penting
Ini adalah kartu sistem Tier 2 pertama yang mengukur dual-use cyber risk pada skala Mythos dan mendokumentasikan arsitektur safeguard spesifik yang digunakan untuk mengelolanya. Rilis publik Fable 5 pada tingkat kemampuan kelas Mythos — bahkan dengan pengklasifikasi — berarti model ancaman untuk cyberattacks berbantuan AI telah bergeser secara material: pembela harus sekarang berasumsi bahwa lawan memiliki atau akan memiliki akses ke model dengan kemampuan yang sebanding. Skor benchmark prompt-injection Gray Swan adalah titik referensi eksternal yang berguna untuk kerangka kerja evaluasi keamanan agentic.
Tindakan yang diperlukan
Baca kartu sistem Fable 5/Mythos 5 untuk memperbarui model ancaman AI organisasi Anda; secara khusus, gunakan benchmark Gray Swan dan hasil evaluasi METR sebagai titik referensi untuk cakupan red-teaming Anda sendiri, dan informasikan klien tentang implikasi model kelas Mythos kini dapat diakses oleh publik umum melalui Fable 5.