Sumber: TechCrunch | Editor: Prihastomo Wahyu Widodo
KONTAN.CO.ID - OpenAI semakin percaya diri bahwa sistem GPT-5 miliknya sudah setara dengan manusia di banyak bidang pekerjaan.
OpenAI, pada hari Kamis (25/9), merilis tolok ukur baru yang menguji performa model AI-nya dibandingkan dengan manusia yang profesional di berbagai industri dan pekerjaan.
Uji coba dengan nama GDPval tersebut merupakan upaya awal untuk memahami seberapa dekat sistem OpenAI dalam mengungguli manusia, terutama dalam pekerjaan yang bernilai ekonomis.
Hasil penilaian ini juga akan sangat menentukan kelanjutan misi awal OpenAI untuk mengembangkan kecerdasan umum buatan atau Artificial General Intelligence (AGI).
Baca Juga: ChatGPT Go Murah Hadir di Indonesia, Cek Cara Daftar dan Fiturnya
Kemampuan GPT-5 Setara dengan Tenaga Profesional
Dalam uji coba terbaru tersebut, OpenAI menyatakan bahwa model GPT-5 dan Claude Opus 4.1 milik Anthropic sudah mendekati kualitas karya yang dihasilkan oleh para pakar industri.
Dilansir dari TechCrunch, OpenAI mengakui bahwa GDPval saat ini hanya mencakup sejumlah kecil tugas yang dilakukan manusia dalam pekerjaan nyata mereka.
Perlu diketahui, GDPval didasarkan pada sembilan industri yang memberikan kontribusi terbesar terhadap produk domestik bruto Amerika Serikat, termasuk domain seperti perawatan kesehatan, keuangan, manufaktur, dan pemerintahan.
Baca Juga: Daftar Negara yang Melarang Penggunaan ChatGPT di Tahun 2025
Dalam salah satu tahap awal uji coba, OpenAI meminta para profesional berpengalaman untuk membandingkan laporan yang dihasilkan AI dengan laporan yang dihasilkan oleh profesional lain.
Untuk GPT-5-high, versi GPT-5 yang ditingkatkan, OpenAI mengklaim model AI tersebut mendapat peringkat lebih baik atau setara dengan pakar industri sebanyak 40,6% selama uji coba.
Sebagai perbandingan, model GPT-4o hanya mencetak skor 13,7%. Penilaian itu diambil sekitar 15 bulan lalu. Peningkatan hampir tiga kali lipat pada GPT-5 jelas merupakan kemajuan yang luar biasa.
OpenAI berencana untuk membuat pengujian yang lebih tangguh di masa mendatang yang dapat mencakup lebih banyak industri dan alur kerja interaktif.
Baca Juga: 15 Prompt ChatGPT yang Wajib Digunakan Trader Kripto
Gunakan AI untuk Meringankan Pekerjaan
Kepala ekonom OpenAI, Dr. Aaron Chatterji, mengatakan bahwa hasil GDPval menunjukkan bahwa para profesional bisa mulai menyerahkan tugas mereka kepada AI. Di saat yang sama, mereka bisa menghabiskan waktu pada tugas-tugas lainnya.
"Model ini semakin baik dalam beberapa hal ini. Orang-orang di pekerjaan tersebut sekarang dapat menggunakan model ini untuk mengalihkan sebagian pekerjaan mereka dan melakukan hal-hal," kata Chatterji.
Di luar hasil positif yang dicapai, tingkat kesetaraan AI jelas masih belum bisa ada di angka 100%. Teknologi milik OpenAI memang akan sangat berharga untuk berbagai industri. Namun, peran manusia jelas masih jadi yang utama.
Baca Juga: 5 Kemampuan Baru ChatGPT-5: Lebih Cepat, Lebih Cermat
Tonton: Presiden FIFA Komentari Status Ketua PSSI Erick Thohir Setelah Jadi Menpora