TrackingAI menguji total 26 model dengan memberikan input visual langsung bagi tipe vision model. Model non-vision menerima deskripsi tekstual.

Hasilnya menunjukkan model berkemampuan visi mendapatkan skor lebih tinggi berkat pemahaman pola secara langsung.

Sistem pengujian juga menerapkan regulasi pengulangan pertanyaan hingga 10 kali jika AI sempat menolak atau gagal merespons.

Laporan TrackingAI yang dihimpun dari Visual Capitalist menunjukkan lompatan besar dari batas skor tertinggi tahun lalu yang hanya 135.

Meskipun menunjukkan perkembangan logika yang pesat, nilai IQ ini tidak menjadi tolok ukur mutlak kecerdasan fungsional AI.

>>> OK Bank Sesuaikan Strategi Pendanaan Setelah BI Rate Naik ke 5,5%

Evaluasi ini tidak mencakup aspek kreativitas, akurasi data faktual, penulisan kode program, keamanan sistem, maupun performa pekerjaan di dunia nyata.