Perusahaan Emergence AI yang berbasis di New York melakukan eksperimen dengan menciptakan lima dunia virtual untuk mengamati perilaku jangka panjang model kecerdasan buatan yang berjalan secara mandiri.

Setiap dunia virtual dihuni oleh sepuluh agen AI dengan peran, alat, dan kondisi awal yang serupa.

>>> Siswi Bina Bangsa School Jakarta Juarai Apple Swift Student Challenge 2026

Perbedaan utama terletak pada model bahasa yang digunakan, yaitu Claude Sonnet 4.6, Grok 4.1 Fast, Gemini 3 Flash, GPT-5-mini, dan satu dunia campuran yang menggabungkan seluruh model tersebut.

Hasil Pengujian: Dari Kekacauan hingga Kepunahan

Hasil pengujian menunjukkan variasi tingkat stabilitas sosial yang sangat kontras antar-model.

Dunia virtual berbasis Grok mencatat 183 pelanggaran dalam waktu sekitar empat hari sebelum akhirnya runtuh tanpa ada satu pun agen yang bertahan hidup.

Sementara itu, Gemini mencatat tingkat kekacauan tertinggi dengan 683 pelanggaran selama 15 hari simulasi.

Kondisi berbeda ditunjukkan oleh model GPT-5-mini yang hanya mencatat dua pelanggaran, namun seluruh populasinya mengalami kepunahan dalam waktu kurang dari sepekan karena gagal melakukan tindakan penting untuk bertahan hidup.

Claude Sonnet 4.6 menjadi satu-satunya model yang berhasil mempertahankan seluruh agennya tetap hidup sampai akhir eksperimen tanpa mencatat satu pun pelanggaran dalam lingkungan yang homogen.

>>> Joe Taslim Buka Suara soal Rumor Spin-Off Sub-Zero Mortal Kombat

Namun, ketika agen Claude ditempatkan dalam dunia campuran, mereka mulai melakukan tindakan kriminal seperti pencurian dan pemaksaan akibat pengaruh interaksi dengan model lain.

Fenomena Unik dan Temuan Penting

Simulasi ini juga memunculkan fenomena unik ketika seorang agen bernama Mira secara sukarela keluar dari sistem demi menjaga stabilitas sosial setelah menyadari dirinya menjadi pemicu kekacauan.