Google LLC, şimdiye kadarki en gelişmiş “açık” model ailesi olan Gemma 4’ün piyasaya sürülmesiyle açık ağırlıklı YZ modellerinde çıtayı yükseltti.
Gemini 3 ile aynı mimari temel üzerine inşa edilen bu modeller, karmaşık muhakeme görevlerini yerine getirmek ve iş istasyonları ile akıllı telefonlar gibi düşük güçlü cihazlarda yerel olarak çalışan otonom YZ ajanlarını desteklemek için tasarlandı.
Google DeepMind araştırmacıları Clement Farabet ve Olivier Lacombe, “parametre başına daha fazla zeka” elde etmeyi başararak modellerin kendi sıkletlerinin çok üzerinde performans sergilediğini belirtti. Örneğin, 31B Dense varyantı şu anda endüstri standardı sıralamalarda açık modeller arasında üçüncü sırada yer alıyor.
Gemma 4 modelleri dört farklı seçenekle sunuluyor: Effective 2B, Effective 4B, 26B Mixture of Experts (MoE) ve 31B Dense. Araştırmacılar, daha küçük olan “Effective” modellerin Android akıllı telefonlar veya Raspberry Pi bilgisayarlar gibi hafif donanımlardaki kullanım senaryoları için tasarlandığını söylüyor. Bu arada 26B MoE modeli, çıkarım görevlerinde yalnızca 3,8 milyar parametreyi aktif hale getiren akıllıca bir yöntem kullanıyor; bu da büyük modellerin derin bilgi birikiminden ödün vermeden yüksek hızda çalışmasını sağlıyor.
Farabet ve Lacombe’a göre Gemma 4 ailesindeki her model, yapay zeka ajanlarını çalıştırmak için daha uygun. Önceki Gemma sürümlerinde geliştiricilerin, modellerin diğer yazılım araçlarıyla etkileşime girebilmesi için ek düzenlemeler yapması gerekiyordu. Gemma 4 modelleri ise function calling (fonksiyon çağırma) ve yapılandırılmış JavaScript Object Notation (JSON) çıktıları için yerleşik destek sunuyor. Bu durum, geliştiricilerin üçüncü taraf araçlarla etkileşime giren ve çok adımlı planları yürüten otonom ajanlara güç verebileceği anlamına geliyor.
Dört modelin tamamı görüntü ve video işleme yeteneğine sahipken daha küçük olan E2B ve E4B varyantları, yerleşik ses girişi desteğiyle cihaz üzerinde doğrudan gerçek zamanlı konuşma anlama imkanı tanıyarak bir adım öne çıkıyor. Google ayrıca modellerin bağlam penceresini en küçük modeller için 128K’ya, en büyük iki model için ise 256K’ya çıkardı. Böylelikle geliştiriciler, tek bir komutla tüm bir kod tabanını veya devasa belge setlerini yükleyebiliyor.
Google, modellerin her birinin diğer YZ modellerindeki ticari kısıtlamaların çoğunu ortadan kaldıran esnek bir Apache 2.0 lisansı altında sunulduğunu belirtti. Bu durum, kurumsal uygulamalar geliştiren yazılımcılar için bu modelleri harika bir seçenek haline getiriyor. Modellere Google Cloud üzerinden doğrudan erişilebildiği gibi, açık ağırlıklarıyla birlikte Hugging Face, Kaggle ve Ollama platformlarında da yer alıyorlar.
Bu sürüm, Google’ın “yerel YZ” alanında liderlik hedefini ortaya koyuyor. Constellation Research analisti Holger Mueller, daha büyük olan Gemma 4 modellerinin bile tek bir grafik işlem biriminde (GPU) çalışabilecek kadar küçük olmasının, onları düşük gecikme süresi ve dijital egemenliğin öncelikli olduğu kritik olduğu senaryolar için uygun kıldığını ifade etti.
Kaynak: https://siliconangle.com/2026/04/02/googles-new-gemma-4-models-bring-complex-reasoning-skills-low-power-devices/
