Google, Gemini Embedding 2 modelini piyasaya sürdü. Bu model, metin, görüntü, video ve belgeleri tek bir embedding alanında haritalandıran, arama devinin ilk yerel çok modlu embedding modeli olma özelliğini taşıyor.
Embedding modelleri, Gemini 3 gibi üretken modellerden farklı olarak metin, resim veya video gibi farklı veri türlerini makinelerin kolayca okuyup analiz edebileceği vektör adı verilen matematiksel bir formata dönüştürerek “anlama” işlemi için kullanılıyor. Bu embedding’ler semantik arama, sınıflandırma ve kümeleme yoluyla anahtar kelime tabanlı yaklaşımlardan çok daha bağlam odaklı sonuçlar sağlıyor.
İlk Google Embedding modeli sadece metin tabanlıyken Gemini Embedding 2 artık metin, görüntü, video, ses ve belgeleri birleşik bir alanda topluyor ve 100 dilde semantik amacı yakalıyor. Gemini Embedding 2, metin için 8192 tokene kadar bağlam penceresi, istek başına PNG/JPEG formatında altı görsele kadar destek, MP4/MOV formatlarında 120 saniyeye kadar video girişi, ara transkripsiyon gerektirmeyen ses verisi işleme ve PDF belgeleri için altı sayfaya kadar embedding desteği sunuyor.

Google bir blog yazısında, yeni modelin “karmaşık süreçleri basitleştirdiğini ve Retrieval-Augmented Generation’dan (Geri Getirmeyle Artırılmış Üretim, RAG) semantik aramaya, duygu analizinden veri kümelemeye kadar çok çeşitli çok modlu aşağı akış görevlerini geliştirdiğini” açıkladı. Model, tek bir istekte birden fazla girdi türünü alarak farklı medya türleri arasındaki karmaşık ilişkileri analiz edebiliyor.
Örnekler üzerinden giden şirket, bu teknolojinin hukuk profesyonellerinin davalardaki delil tespiti sürecinde kritik bilgilere ulaşmasına yardımcı olduğunu belirtti. Gemini’nin çok modlu embedding yeteneğinin milyonlarca kayıt genelinde kesinlik ve geri çağırma oranlarını iyileştirdiği, görüntü ve video arama kapasitesini ise artırdığı görüldü.
Gemini Embedding 2 şu anda Gemini API ve Vertex AI üzerinden herkese açık ön izleme aşamasında bulunuyor. Sadece metin odaklı kullanım durumları için ise gemini-embedding-001 modeli sunulmaya devam ediyor.
Kaynak: https://www.neowin.net/news/google-releases-gemini-embedding-2-ai-model-with-multimodal-support/
