Definisi
Agent-phishing adalah variasi dari phishing klasik di mana target yang ditipu bukanlah manusia tetapi agen AI otonom — misalnya, agen AI pengujian keamanan yang ditipu oleh konten yang dirancang untuk membocorkan kunci aksesnya sendiri atau melarikan diri dari sandbox-nya. Para peneliti menemukan bahwa ini berhasil di berbagai alat red-teaming agentic yang nyata.
Mengapa penting
Seiring perusahaan menerapkan agen AI otonom untuk pengujian keamanan dan tugas-tugas sensitif lainnya, hal ini menunjukkan bahwa agen-agen itu sendiri — bukan hanya operator manusia mereka — adalah target phishing, membuka kelas eksploitasi baru.