Teknologi

Google Luncurkan Gemma 4: Open Model AI Jalan di Smartphone

17
×

Google Luncurkan Gemma 4: Open Model AI Jalan di Smartphone

Sebarkan artikel ini
Google resmi meluncurkan Gemma 4 pada awal April 2026 — generasi terbaru dari keluarga model AI terbuka mereka yang diklaim sebagai open model paling cerdas di kelasnya sekaligus mampu berjalan langsung di perangkat smartphone tanpa bergantung penuh pada infrastruktur cloud.
Google resmi meluncurkan Gemma 4 pada awal April 2026 — generasi terbaru dari keluarga model AI terbuka mereka yang diklaim sebagai open model paling cerdas di kelasnya sekaligus mampu berjalan langsung di perangkat smartphone tanpa bergantung penuh pada infrastruktur cloud.

Google Luncurkan Gemma 4: Open Model AI Paling Cerdas yang Bisa Berjalan Langsung di Smartphone

XJABAR.COM – Google resmi meluncurkan Gemma 4 pada awal April 2026 — generasi terbaru dari keluarga model AI terbuka mereka yang diklaim sebagai open model paling cerdas di kelasnya sekaligus mampu berjalan langsung di perangkat smartphone tanpa bergantung penuh pada infrastruktur cloud. Peluncuran ini bukan sekadar pembaruan inkremental. Ia adalah pernyataan strategis Google dalam persaingan segmen open model yang kini semakin padat dan kompetitif.

Fondasi Teknologi: Dibangun dari DNA yang Sama dengan Gemini 3

Gemma 4 bukan produk yang lahir dari jalur pengembangan yang terpisah. Google secara eksplisit menyatakan bahwa model ini dibangun dari riset dan teknologi yang sama dengan Gemini 3 — model flagship Google yang menjadi tulang punggung produk AI konsumer mereka.

Namun Gemma 4 diarahkan untuk peran yang berbeda: melengkapi ekosistem Gemini di kalangan pengembang, bukan bersaing dengannya. Ini adalah segmentasi yang disengaja — Gemini untuk produk end-user, Gemma untuk komunitas builder dan pengembang yang membutuhkan akses langsung ke model dengan kebebasan penuh.

Empat Varian untuk Empat Kebutuhan Berbeda

Salah satu keputusan desain paling signifikan dalam Gemma 4 adalah kehadiran empat varian model yang mencakup spektrum kebutuhan yang sangat lebar:

  • Effective 2B (E2B) — varian terkecil, dirancang khusus untuk perangkat edge dengan keterbatasan memori dan daya
  • Effective 4B (E4B) — satu tingkat di atas E2B, masih dalam kategori efisiensi tinggi untuk smartphone dan perangkat IoT
  • 26B Mixture of Experts — arsitektur hybrid yang mengaktifkan hanya sebagian parameter untuk setiap inferensi, memberikan efisiensi komputasi tinggi
  • 31B Dense — varian terbesar dan paling kapabel, yang menurut Google mampu menempati posisi teratas dalam jajaran open model global untuk ukuran kelasnya — bahkan diklaim mengungguli model lain yang memiliki parameter hingga 20 kali lebih besar

Klaim bahwa model 31B bisa melampaui model dengan parameter 20 kali lebih besar adalah angka yang signifikan dan akan menjadi bahan pengujian komunitas dalam waktu dekat.

Mobile-First AI: Pemrosesan Langsung di Perangkat

Google menyebut pendekatan Gemma 4 sebagai strategi “mobile-first” — sebuah pergeseran filosofis yang menempatkan perangkat edge, bukan pusat data, sebagai tempat inferensi AI berlangsung.

Model E2B dan E4B dirancang dengan konsumsi memori dan daya yang lebih rendah, memungkinkan keduanya berjalan di smartphone dan perangkat IoT tanpa membutuhkan koneksi cloud untuk setiap permintaan. Pemrosesan yang terjadi langsung di perangkat menghasilkan latensi yang jauh lebih rendah — sebuah keunggulan kritis untuk aplikasi real-time yang tidak bisa menoleransi jeda komunikasi dengan server.

Yang membuat varian edge ini tidak sekadar “model kecil yang dikurangi kemampuannya” adalah dukungan multimodal yang tetap hadir: kedua model ini mampu memproses gambar, video, dan audio secara langsung. Kemampuan multimodal di perangkat mobile tanpa cloud adalah proposisi yang belum banyak ditawarkan di segmen ini.

Penalaran Tingkat Lanjut dan Agentic Workflows

Di luar efisiensi hardware, Gemma 4 membawa peningkatan substansial pada kemampuan kognitif model. Google merancangnya untuk menangani tugas yang lebih kompleks dibanding generasi sebelumnya — khususnya dalam penalaran tingkat lanjut dan alur kerja berbasis agen (agentic workflows).

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *