Google meluncurkan model kecerdasan buatan open-source terbaru bernama Gemma 4 12B pada Rabu (3/6/2026).

Model ini dirancang untuk membawa kemampuan AI multimodal langsung ke perangkat pengguna tanpa memerlukan spesifikasi hardware tinggi.

>>> Betrand Peto Sarankan Pacar Sarwendah Bangunkan Rumah Baru

Keunggulan utama Gemma 4 12B adalah kemampuannya berjalan secara lokal dengan VRAM atau memori terpadu sebesar 16 GB.

Dengan spesifikasi tersebut, pengalaman AI multimodal dan agentic dapat beroperasi langsung di laptop atau komputer tanpa bergantung pada server cloud.

Kemampuan Multimodal Tanpa Encoder Terpisah

Model berukuran menengah ini mampu memahami berbagai jenis input, mulai dari teks, gambar, hingga audio.

Google menyebut bahwa Gemma 4 12B menjadi varian pertama di kelasnya yang mendukung input audio secara native.

Sistem ini tidak lagi memerlukan encoder terpisah untuk memproses gambar atau suara sebelum diteruskan ke model bahasa utama.

Input visual dan audio langsung diproses oleh fondasi LLM backbone, sehingga mengurangi waktu pemrosesan, penggunaan memori, serta latensi sistem.

>>> Telkom Resmi Luncurkan AIcosystem untuk Perkuat Transformasi Digital

Untuk pemrosesan gambar, vision encoder diganti dengan modul embedding ringan yang terdiri dari satu operasi perkalian matriks, positional embedding, dan normalisasi.

Sementara untuk audio, sinyal audio mentah langsung diproyeksikan ke ruang representasi yang sama dengan token teks.

Kemampuan pemrosesan audio secara native memungkinkan perangkat lunak ini menangani tugas audio kompleks seperti pengenalan suara, transkripsi audio, penerjemahan suara, pembuatan kode, hingga analisis video.

Menurut panduan pengembang yang dibagikan perusahaan, model ini mampu memahami video berdurasi lima menit dengan menganalisis frame gambar dan audio secara bersamaan.

Demonstrasi dilakukan menggunakan cuplikan presentasi Google I/O dengan memproses 313 frame video berkecepatan satu frame per detik.

Kehadiran Gemma 4 12B berfungsi sebagai jembatan antara model Gemma E4B untuk perangkat edge dan model Gemma 26B Mixture of Experts (MoE) yang memiliki performa lebih bertenaga.

>>> Ariston Andris 3: Water Heater Cerdas untuk Kamar Mandi Modern

Model ini tersedia sebagai open-source, memberikan akses lebih luas bagi pengembang dan peneliti.