Google, açık ağırlıklı Gemma 3 modelini temel alan yeni bir açık çeviri modelleri serisini piyasaya sürdü. Teknoloji devi, seriyi “açık çeviri alanında ileriye doğru atılmış önemli bir adım” olarak nitelendiriyor. TranslateGemma adı verilen yeni koleksiyon, İspanyolca, Fransızca, Çince ve Hintçe gibi popüler diller dahil olmak üzere toplam 55 dile kadar işlem yapabiliyor.
Söz konusu duyuru, OpenAI’ın ChatGPT Translate sistemini yayınlamasından yalnızca birkaç saat sonra geldi. ChatGPT Translate, sadece kelimesi kelimesine bir değişim yapmaktan ziyade, doğru ton ve bağlamla çeviri yapmaya daha fazla odaklanıyor. Yapı, Google Çeviri gibi araçlara benzer şekilde, solda otomatik dil algılama ve sağda hedef dilin bulunduğu çift panelli bir arayüz sunuyor.
TranslateGemma, 4B, 12B ve 27B parametre boyutlarıyla erişime açıldı. Google tarafından paylaşılan verilere göre 12B modeli, WMT24++ kıyaslama testinde temel Gemma 3 27B modelini geride bırakıyor. Geliştiriciler açısından, parametre sayısının yarısından azıyla bu düzeyde performans elde etmek, doğruluktan ödün vermeden daha yüksek işlem kapasitesi ve daha düşük gecikme süresi anlamına geliyor.

Şirket, 4B modelinin mobil çıkarımlar için optimize edildiğini, 12B modelinin ise standart dizüstü bilgisayarlar için uygun olduğunu bildirdi ancak büyük olan 27B modeli, bulut ortamındaki tek bir NVIDIA H100 gibi daha yüksek işlem gücü gerektiriyor. Vistra görsel çeviri kıyaslamasındaki testler, TranslateGemma’nın görseller içindeki metinleri, özel bir ince ayar yapılmamış olsa dahi, daha başarılı bir şekilde çevirebildiğini gösterdi.

Google, söz konusu zeka yoğunluğuna iki aşamalı özel bir süreçle nasıl ulaştığını da açıkladı. İlk olarak, temel Gemma 3 modellerini insan çevirileri ve Gemini modelleri tarafından üretilen yüksek kaliteli sentetik verilerden oluşan bir karışımla eğiten Denetimli İnce Ayar yöntemi kullanıldı.
Ardından Takviyeli Öğrenme aşaması uygulandı. Söz konusu ikinci aşama, modelleri daha doğal ve bağlamsal olarak doğru çevirilere yönlendirmek amacıyla MetricX-QE ve AutoMQM gibi gelişmiş ölçütleri içeren bir grup ödül modelinden faydalandı.
TranslateGemma modelleri, deney yapmak veya üzerlerine yeni yapılar inşa etmek isteyen herkes için Kaggle ve Hugging Face platformlarında indirilmeye hazır durumda.
Kaynak: https://www.neowin.net/news/google-unveils-translategemma-a-new-family-of-translation-models-built-on-gemma/
