Xiaomi kembali mengguncang industri kecerdasan buatan dengan pencapaian baru dalam inferensi model AI.

Perusahaan asal Tiongkok itu berhasil menembus kecepatan lebih dari 1.000 token per detik hanya menggunakan server komoditas 8-GPU standar.

>>> Trailer The Bear Season 5 Tampilkan Carmy Kembali ke Restoran

Pencapaian ini terwujud berkat kolaborasi dengan TileRT melalui peluncuran MiMo-V2.5-Pro.

Model terbaru dari rumpun Mi Mixture-of-experts (MiMo) ini mampu menyentuh performa puncak hingga 1.200 token per detik dalam demonstrasi internal.

MiMo-V2.5-Pro menjadi model pertama di dunia yang melewati ambang 1.000 token per detik pada skala triliunan parameter.

Sistem ini bekerja tanpa bergantung pada perangkat keras proprietary seperti Google TPU atau NVIDIA Blackwell khusus.

Performa MiMo-V2.5-Pro jauh melampaui standar model AI terkemuka saat ini.

Sebagai perbandingan, Claude Opus 4.6 beroperasi pada kecepatan sekitar 71 token per detik, sementara Claude Haiku menghasilkan sekitar 98 token per detik.

Model lain seperti Gemini Flash mampu menyentuh angka kisaran 192 token per detik.

Melalui mode UltraSpeed, MiMo-V2.5-Pro berjalan 5 hingga 14 kali lebih cepat dibandingkan para kompetitor terdekat.

Akselerasi ekstrem ini membuka peluang bagi aplikasi AI waktu nyata yang sebelumnya terkendala batasan latensi di bawah 100 milidetik.

Sistem kini dapat diterapkan untuk deteksi penipuan transaksi keuangan real-time serta analisis pasar mikrodetik pada perdagangan otomatis.

Kecepatan tinggi ini juga memungkinkan jalannya rantai penalaran paralel untuk simulasi kompleks. Pengembang kini dapat mengimplementasikan loop multi-agent AI yang saling berinteraksi secara instan tanpa kendala waktu respons.

Tiga Inovasi Teknis Utama Xiaomi dan TileRT

Rahasia performa MiMo-V2.5-Pro terletak pada kombinasi tiga lapisan optimasi teknis yang saling terintegrasi.