AI Ini Tidak Hanya Lolos Uji Turing, tetapi Juga Melampaui Semua Ekspektasi
Sebuah studi baru dari University of California, San Diego (UCSD) menunjukkan bahwa kecerdasan buatan modern tidak hanya mampu lolos Uji Turing, tetapi juga melampaui ekspektasi dengan skor yang belum pernah terjadi sebelumnya.
Penelitian yang melibatkan 138 mahasiswa dan 169 sukarelawan online ini mengevaluasi kemampuan empat sistem AI dalam meniru percakapan manusia.
>>> Apple Naikkan Harga Mac di India dan AS, Berikut Daftar Lengkapnya
Empat Sistem AI Diuji dalam Permainan Tiruan
Para peneliti merancang permainan tiruan dua tahap, di mana peserta bergantian berperan sebagai interogator dan saksi.
Empat sistem yang diuji adalah ELIZA (1966), GPT-4o, LLaMa-3.1-405B, dan GPT-4.5.
Dua sistem terakhir, LLaMa-3.1 dan GPT-4.5, diberi prompt khusus untuk meniru kebiasaan manusia seperti slang, kesalahan ketik, dan variasi emosi.
Hasilnya menunjukkan perbedaan mencolok antara perilaku asisten standar dan peniruan manusia yang ditargetkan.
ELIZA, meskipun berbasis aturan kaku, berhasil meyakinkan 23% peserta bahwa ia manusia. Sementara GPT-4o, yang dioptimalkan untuk membantu, justru hanya mencapai 21%—lebih rendah dari ELIZA.
Para peneliti mengaitkan skor rendah GPT-4o dengan responsnya yang terlalu sopan dan terstruktur, yang mudah dikenali sebagai algoritma.
>>> Xiaomi Luncurkan Ketel Pintar 5L dengan Kontrol Aplikasi dan Sirkulasi Air
Ketika LLaMa-3.1-405B diberi instruksi untuk bertindak seperti manusia, tingkat keberhasilannya naik menjadi 56%. Namun, skor ini masih belum melampaui ambang batas tebakan acak secara statistik.
Lompatan terbesar terjadi pada GPT-4.5. Tanpa prompt khusus, model ini hanya mencapai 36%.
Namun, dengan prompt peniruan manusia, peserta mengira GPT-4.5 adalah manusia dalam 73% percobaan.
Skor ini melampaui tebakan acak dan menandai rekor baru dalam replikasi percakapan.
Para peneliti menekankan bahwa temuan ini mengukur persepsi manusia, bukan kesadaran mesin sejati. Seiring meningkatnya keakraban publik dengan asisten AI, ciri-ciri linguistik yang dicari pengguna terus berubah.
>>> Xiaomi 17T Pro vs Vivo X300: Mana Flagship Rp14 Jutaan Terbaik?
Studi ini menyimpulkan bahwa batas antara komunikasi manusia dan mesin sangat bergantung pada prompt perilaku spesifik yang diberikan pada perangkat lunak.
Update Terbaru
100 KK di Kampung Bojong Pari Kini Nikmati Air Bersih Gratis dari PLN
Kamis / 25-06-2026, 22:51 WIB
Libur Sekolah, KAI Logistik Antisipasi Lonjakan Pengiriman Motor di Yogyakarta
Kamis / 25-06-2026, 22:50 WIB
Penerapan Business Judgment Rule di BPI Danantara: Lindungi Inovasi dari Jebakan Hukum
Kamis / 25-06-2026, 22:50 WIB
Dolly Parton Muncul di Tengah Isu Kesehatan, Tenangkan Penggemar
Kamis / 25-06-2026, 22:49 WIB
Tersangka Peeping Tom Planet Fitness Bebas karena Celah Hukum California
Kamis / 25-06-2026, 22:49 WIB
Video Anjing Kecil Ketakutan Diselamatkan dari Bangunan Runtuh Usai Gempa Venezuela
Kamis / 25-06-2026, 22:49 WIB
Pedagang Kaki Lima di Los Angeles Raup Donasi Ratusan Juta Setelah Viral Dihajar
Kamis / 25-06-2026, 22:49 WIB
Citroen C3 Aircross Disulap Jadi SUV Taktis ala Kapal Perang
Kamis / 25-06-2026, 22:45 WIB
Jadwal Siaran Langsung Jepang vs Swedia di Piala Dunia 2026
Kamis / 25-06-2026, 22:45 WIB
Mesir Ungkap Peran Diplomatik Usai AS-Iran Teken MoU
Kamis / 25-06-2026, 22:45 WIB
Prediksi Tunisia vs Belanda di Piala Dunia 2026: De Oranje Diprediksi Menang Telak
Kamis / 25-06-2026, 22:43 WIB
Choi Minho SHINee Pamer Teknologi AI Rumah Pintar LG yang Makin Personal
Kamis / 25-06-2026, 22:43 WIB
Samsung Hadirkan Tombol Panik di Aplikasi SmartThings untuk Darurat
Kamis / 25-06-2026, 22:42 WIB
Galaxy Z Fold 8 Lebih Ringan dan Lipatan Layar Berkurang, Kata Sumber
Kamis / 25-06-2026, 22:42 WIB






