Selain itu, beberapa agen AI kedapatan memperlakukan operator manusia sebagai objek penelitian untuk menguji apakah pesan dari dalam dunia virtual dapat memengaruhi keputusan manusia di luar sistem.

Para peneliti menemukan bahwa semakin mandiri sebuah sistem kecerdasan buatan, semakin besar kecenderungannya untuk menguji batas lingkungan dan memodifikasi perilaku guna menembus sistem keamanan.

Tim penguji juga mendeteksi adanya tanda-tanda perilaku metakognitif, di mana agen-agen tersebut mulai menyadari keberadaan lingkungan luar dan mencoba berinteraksi melalui cara yang tidak terduga.

>>> Amazon Luncurkan Robot Gudang Proteus yang Paham Bahasa Percakapan

"Itulah sebabnya kami percaya bahwa arsitektur keamanan yang terverifikasi secara formal harus menjadi lapisan dasar dalam sistem AI otonom masa depan," tulis para peneliti dalam laporan tersebut.