Google Rilis DiffusionGemma, Model AI Open Source dengan Generasi Teks 4x Lebih Cepat
Angka kinerja yang dibagikan Google dan NVIDIA mencakup lebih dari 1.000 token per detik pada satu GPU NVIDIA H100, lebih dari 700 token per detik pada NVIDIA GeForce RTX 5090, sekitar 150 token per detik pada NVIDIA DGX Spark, hingga 2.000 token per detik pada NVIDIA DGX Station.
Secara keseluruhan, model ini menawarkan generasi teks hingga 4 kali lebih cepat dibandingkan model autoregresif yang sebanding dalam skenario inferensi lokal.
Google mencatat bahwa keuntungan ini terutama dirancang untuk inferensi lokal dengan konkurensi rendah.
Di lingkungan cloud dengan QPS tinggi, model autoregresif dapat memanfaatkan perangkat keras secara efisien melalui batching, yang dapat mengurangi keunggulan decoding paralel berbasis difusi dan berpotensi meningkatkan biaya serving.
Keunggulan throughput paling kuat pada ukuran batch rendah hingga menengah di satu akselerator.
Fine-tuning dan Kasus Penggunaan
Google mengatakan DiffusionGemma dapat di-fine-tune untuk beban kerja domain spesifik.
>>> Trump Perketat Visa Suporter 9 Negara Jelang Piala Dunia 2026
Sebagai contoh, Unsloth melakukan fine-tuning model ini untuk memecahkan teka-teki Sudoku, tugas yang menantang bagi model autoregresif karena prediksi sering bergantung pada token masa depan.
Perusahaan mengharapkan model ini berguna untuk chat interaktif, asisten AI lokal, loop agen, asisten perangkat yang dapat merencanakan dan bertindak, iterasi konten cepat, pengeditan inline, dan aplikasi AI sensitif latensi lainnya.
Meskipun DiffusionGemma mengutamakan kecepatan dan generasi paralel, Google mencatat bahwa kualitas output keseluruhannya masih lebih rendah dibandingkan model Gemma 4 standar.
Untuk aplikasi yang membutuhkan output produksi berkualitas tertinggi, perusahaan merekomendasikan menggunakan model Gemma 4 standar.
Optimasi NVIDIA dan Dukungan Platform
Update Terbaru
Timnas Indonesia Sapu Bersih Dua Laga FIFA Matchday Juni 2026
Kamis / 11-06-2026, 15:09 WIB
Suporter Thailand Kritis ke Hudson Usai Hasil Buruk di FIFA Matchday
Kamis / 11-06-2026, 15:09 WIB
Mathew Baker Gabung Timnas Indonesia U-19 Jelang Semifinal Piala AFF U-19 2026
Kamis / 11-06-2026, 15:09 WIB
Inspirasi Nama Bayi Laki-Laki Awalan Huruf T yang Penuh Makna
Kamis / 11-06-2026, 15:09 WIB
Buya Yahya Jelaskan Hukum Puasa Tasua dan Asyura bagi Pemilik Utang Ramadan
Kamis / 11-06-2026, 15:08 WIB
Kemenkop Usulkan Tambahan Anggaran Rp1,34 Triliun untuk Tahun 2027
Kamis / 11-06-2026, 15:08 WIB
Persijap Jepara Resmi Perpanjang Kontrak Pelatih Mario Lemos
Kamis / 11-06-2026, 15:08 WIB
Arsenal Pantau Federico Valverde Usai Insiden di Ruang Ganti Real Madrid
Kamis / 11-06-2026, 15:07 WIB
Adinda Thomas Ceritakan Transisi Kehamilan Trimester Awal
Kamis / 11-06-2026, 15:06 WIB
Akamai Raih Pendapatan Rp18 Triliun dan Fokus pada AI di Asia Pasifik
Kamis / 11-06-2026, 15:06 WIB
Adinda Thomas Ceritakan Transisi Kehamilan Trimester Awal yang Penuh Rasa Lelah
Kamis / 11-06-2026, 15:05 WIB
Inspirasi Nama Bayi Laki-Laki Keren Berawalan Huruf T
Kamis / 11-06-2026, 15:05 WIB
Demam Piala Dunia 2026, Jersey KW Tanah Abang Laris Manis
Kamis / 11-06-2026, 15:04 WIB
Bos BYD Targetkan Kalahkan Toyota dalam Lima Tahun
Kamis / 11-06-2026, 15:04 WIB






