Kesepakatan itu menjadi sinyal penting bahwa perusahaan AI besar mulai mendiversifikasi ketergantungan dari ekosistem NVIDIA.

Persaingan Bergeser ke Inference

Selama beberapa tahun terakhir, NVIDIA mendominasi pasar karena GPU mereka unggul untuk training model AI skala besar.

>>> GitLab Berencana PHK Karyawan sebagai Bagian Restrukturisasi Bisnis

Namun pada 2026, fokus industri mulai bergeser ke inferensi, yaitu proses menjalankan model AI yang sudah dilatih untuk melayani pengguna secara real-time.

Cerebras memosisikan diri kuat di area ini.

Perusahaan menjelaskan bahwa arsitektur GPU tradisional kurang efisien untuk beban inferensi modern karena satu chip harus menangani beberapa proses sekaligus.

Cerebras juga menyoroti konsep "disaggregated inference", yaitu pemisahan proses AI agar lebih efisien dan hemat latensi. NVIDIA pun disebut mulai mengadopsi pendekatan serupa dalam strategi terbaru mereka.

Penelitian akademik terbaru menunjukkan potensi arsitektur wafer-scale untuk komputasi AI.

Studi di arXiv pada Mei 2026 menunjukkan WSE-3 mampu mencapai percepatan hingga 342 kali dibanding GPU tertentu pada workload scientific computing.

Penelitian lain menyebut performa WSE-3 dapat melampaui klaster 128 GPU NVIDIA A100 dalam beberapa skenario komputasi stencil dan HPC.

NVIDIA Masih Dominan, Pasar Mulai Terbuka

Meski begitu, NVIDIA masih menjadi pemain terbesar di industri AI accelerator global.

Ekosistem CUDA, jaringan mitra cloud, serta dominasi perangkat keras dan perangkat lunak masih menjadi kekuatan utama perusahaan tersebut.

Beberapa analis menilai Cerebras masih menghadapi tantangan besar, termasuk biaya produksi, efisiensi operasional, dan ketergantungan terhadap pelanggan tertentu.

Reuters mencatat sebagian besar pendapatan Cerebras sebelumnya berasal dari klien di Uni Emirat Arab sebelum memperluas kerja sama dengan OpenAI dan penyedia cloud lain.

Penelitian dari arXiv juga menunjukkan accelerator alternatif seperti Cerebras memiliki konsumsi daya idle lebih tinggi dibanding GPU NVIDIA dan AMD.

Efisiensinya sangat bergantung pada tingkat utilisasi sistem.

Meski demikian, kemunculan Cerebras memperlihatkan bahwa pasar AI accelerator mulai bergerak menuju model persaingan baru.

>>> Karyawan Kontrak SpaceX Tewas Jatuh di Fasilitas Starbase Texas

Industri tidak lagi hanya mengandalkan GPU general-purpose, tetapi mulai mempertimbangkan chip khusus yang dioptimalkan untuk inferensi AI skala besar dan latensi rendah.