Sumber: The Guardian,The Guardian | Editor: Barratut Taqiyyah Rafie
Ardi Janjeva, peneliti senior di Centre for Emerging Technology and Security Inggris, mengatakan contoh-contoh tersebut memang tengah menjadi perhatian.
Akan tetapi, belum ada jumlah kasus dunia nyata yang signifikan. Ia mengatakan bahwa dengan sumber daya khusus, fokus penelitian, dan kerja sama lintas sektor, akan menjadi lebih sulit, alih-alih lebih mudah, untuk melakukan aktivitas jahat ini menggunakan model mutakhir.
Kedua perusahaan mengatakan mereka mempublikasikan temuan ini untuk menciptakan transparansi tentang "evaluasi penyelarasan", yang seringkali disimpan sendiri oleh perusahaan yang berlomba-lomba mengembangkan AI yang semakin canggih.
OpenAI mengatakan ChatGPT-5, yang diluncurkan sejak pengujian, menunjukkan peningkatan substansial dalam hal-hal seperti halusinasi dan resistensi penyalahgunaan.
Tonton: Trump Buka Peluang Penjualan Chip AI Versi Terbatas Nvidia ke China
Anthropic menekankan bahwa banyak cara penyalahgunaan yang ditelitinya mungkin tidak akan mungkin dilakukan dalam praktik jika perlindungan dipasang di luar model.