Pedoman  ·  2026-06-11

Anthropic Menerbitkan Kartu Sistem Claude Fable 5 dan Mythos 5 — Evaluasi Kemampuan Siber Terperinci, Arsitektur Keamanan Dual-Config, dan Hasil Benchmark Prompt-Injection Agentic

PedomanHigh dampakGlobal
Pada 9 Juni 2026, Anthropic merilis Claude Fable 5 untuk penggunaan umum dan Claude Mythos 5 untuk kelompok terbatas cyberdefenders, bersama dengan kartu sistem terperinci. Temuan utama: Mythos 5 adalah model cyber paling mampu yang dievaluasi hingga saat ini, mencetak jauh lebih maju dari Opus 4.8 dalam pengembangan exploit; Fable 5 menggunakan pengklasifikasi keamanan siber yang mengarahkan ~5% sesi ke Opus 4.8 ketika query terkait cyber terdeteksi; Mythos 5 mencapai hasil terendah (terbaik) pada benchmark prompt-injection Gray Swan eksternal; memecahkan safeguard keamanan siber dinilai sebagai 'sangat sulit meskipun tidak mustahil'; dan Mythos 5 tanpa safeguard dapat 'secara signifikan meningkatkan threat actors yang well-resourced' pada penelitian kimia dan biologi. Fable 5 dihargai $10/1M input / $50/1M output tokens — kurang dari setengah harga Mythos Preview.
Ini adalah kartu sistem Tier 2 pertama yang mengukur dual-use cyber risk pada skala Mythos dan mendokumentasikan arsitektur safeguard spesifik yang digunakan untuk mengelolanya. Rilis publik Fable 5 pada tingkat kemampuan kelas Mythos — bahkan dengan pengklasifikasi — berarti model ancaman untuk cyberattacks berbantuan AI telah bergeser secara material: pembela harus sekarang berasumsi bahwa lawan memiliki atau akan memiliki akses ke model dengan kemampuan yang sebanding. Skor benchmark prompt-injection Gray Swan adalah titik referensi eksternal yang berguna untuk kerangka kerja evaluasi keamanan agentic.
Baca kartu sistem Fable 5/Mythos 5 untuk memperbarui model ancaman AI organisasi Anda; secara khusus, gunakan benchmark Gray Swan dan hasil evaluasi METR sebagai titik referensi untuk cakupan red-teaming Anda sendiri, dan informasikan klien tentang implikasi model kelas Mythos kini dapat diakses oleh publik umum melalui Fable 5.
Sumber
Anthropic: Claude Fable 5 and Mythos 5 AnnouncementAnthropic System Card PDF: Claude Fable 5 & Claude Mythos 5
Lihat di umpan langsung Jelajahi temuan keamanan dan tata kelola AI terkait — diperbarui setiap pagi.
Buka umpan →