Google, Gemini Omni adını verdiği büyük, yeni bir üretken YZ model ailesini duyurdu. İlk Omni modeli olan Omni Flash; metin, fotoğraf, video ve ses gibi farklı girdileri kullanarak YZ videoları üretebiliyor. Bir blog yazısına göre Google, gelecekte Omni’yi “herhangi bir girdiden her şeyi yaratabilen” bir yapı olarak hayal ediyor. Omni adı da buradan geliyor.
Şirket, Omni Flash’ı, geçen yıl kullanıma sunulmasından bu yana insanların 50 milyardan fazla görsel üretmek için kullandığı Nano Banana görsel üretim modelinin video versiyonu olarak konumlandırıyor. Örneğin, Omni Flash’tan kendi benzerliğinizi videolara yerleştirmesini isteyebileceksiniz.
Google DeepMind kıdemli araştırma direktörü Dumitru Erhan, The Verge’e, Gemini Omni Flash ile 10 saniyeye kadar uzunlukta video ve ses içeren klipler oluşturabileceğinizi söyledi. Şirket bu süreyi daha da uzatmak için çalışıyor.
Google’ın halihazırda Veo adında bir video üretim modeli bulunuyor ancak bu, metinden videoya bir üretim modeli; Omni Flash ise aksine, başka bir videonun yapılmasına yardımcı olmak için mevcut bir videoyu temel alabiliyor. Google DeepMind CTO’su ve Google baş YZ mimarı Koray Kavukçuoğlu’na göre Omni Flash, Gemini’ın eğitim verileri sayesinde Veo’dan “çok” daha fazla dünya bilgisine sahip.
Gemini Omni Flash, 19 Mayıs Salı günü itibarıyla Gemini uygulamasında, Google Flow’da ve YouTube Shorts’ta erişilebilir durumda.
Kaynak: https://www.theverge.com/tech/933552/google-gemini-ai-omni-flash-media-video-io-2026
