Çinli yapay zeka video girişimi Kling AI, Video 3.0, Video 3.0 Omni, Image 3.0 ve Image 3.0 Omni sürümlerini kapsayan Kling 3.0 model ailesini duyurdu. Yeni modeller, yapay zeka tabanlı video üretiminde daha güçlü anlatı kontrolü ve daha tutarlı çıktılar sunmayı hedefliyor. Model serisi, artırılmış tutarlılık, fotogerçekçi çıktı, 15 saniyeye kadar uzayan video süreleri ve çoklu dil ile aksan desteği bulunan yerel ses üretimi gibi güncellemeler içeriyor.
Birleşik bir eğitim altyapısı üzerine kurulan Kling 3.0 modelleri, metin, görsel, ses ve videoyu kapsayan tam çok modlu giriş ve çıkış desteği sağlıyor. Sistem, video anlama, üretme ve düzenleme süreçlerini tek bir iş akışında bir araya getiriyor. Metinden videoya, görselden videoya, referans tabanlı video üretimi ve video içi düzenleme gibi görevler, tek bir çok modlu mimari içinde sunuluyor.
Kling AI 3.0 modelleri şu anda Ultra abonelere erken erişimle açılmış durumda, genel erişimin ise ilerleyen dönemde sunulması planlanıyor.

Video 3.0: Sinematik Kalitede Video Üretimi
Video 3.0, öğe tutarlılığını artıran yapısıyla içerik üreticilerine daha fazla kontrol sunuyor. Kullanıcılar, referans videolar ve birden fazla görsel referans yükleyerek karakterlerin, nesnelerin ve sahnelerin kareler boyunca tutarlı kalmasını sağlayabiliyor.
Modelin öne çıkan özellikleri şunlar:
- Diller ve Aksanlar Arasında Yerel Ses Desteği: İngilizce, Çince, Japonca, Korece ve İspanyolca dillerinde konuşma üretimi destekleniyor. Amerikan, İngiliz ve Hint aksanları da sistem tarafından kullanılabiliyor. Çok karakterli sahnelerde, her karakter için farklı dil ve konuşma sırası tanımlanabiliyor.
- Genişletilmiş Video Süresi: Video 3.0, 15 saniyeye kadar video üretimini destekliyor. Daha uzun süre, çoklu sahneler ve daha karmaşık sekansların tek bir klip içinde oluşturulmasına imkan tanıyor.
- Çoklu Çekim Anlatımı: Sistem, çok sahneli ve çok çekimli talimatları anlayarak kamera açılarını ve çekimleri verilen yönergelere göre uyarlayabiliyor.
- Görsellerde Metin Tutarlılığı: Tabela, altyazı ve markalı öğeler video boyunca net ve okunabilir şekilde korunabiliyor. Bu özellik, özellikle e-ticaret ve reklam kullanım senaryoları için önem taşıyor.
- Fotogerçekçi Çıktı: Model, daha doğal hareketler ve gerçekçi karakterlerle fotogerçekçi videolar üretebiliyor.
Video 3.0 Omni: Gelişmiş Hikaye Panosu ve Referans Kullanımı
Video 3.0 Omni, önceki Kling Video O1 modelinde sunulan “Elements” yaklaşımını temel alarak referans tabanlı üretimi genişletiyor. Kullanıcılar bir referans video yükleyerek, bir karakterin görsel özelliklerinin ve ses niteliklerinin yeni sahnelere tutarlı şekilde aktarılmasını sağlayabiliyor.
Model ayrıca, çok çekimli bir hikaye panosu özelliği sunuyor. Kullanıcılar her bir çekim için süre, çekim ölçeği, perspektif, anlatı içeriği ve kamera hareketlerini ayrı ayrı belirleyebiliyor.
Image 3.0 Omni: Yüksek Çözünürlüklü Görsel Üretimi
Kling AI, video modellerine ek olarak Image 3.0 ve Image 3.0 Omni sürümlerini de tanıttı. Yeni görsel modeller, 2K ve 4K çözünürlükte çıktı desteği sunarak profesyonel kullanım senaryolarını hedefliyor. Sistem, dokuların, ışıklandırmanın ve malzeme detaylarının daha tutarlı biçimde korunmasını amaçlıyor.
Kling O1 ve 2.6 serilerinin üzerine inşa edilen 3.0 model ailesi, Çok Modlu Görsel Dil (MVL) yaklaşımını temel alıyor.
Şirketin paylaştığı bilgilere göre Kling AI, Haziran 2024’teki lansmanından bu yana dünya genelinde 60 milyondan fazla kullanıcıya ulaştı, 600 milyondan fazla video üretti ve 30.000’den fazla kurumsal müşteriyle çalıştı. Yeni modellerin, film, reklam ve dijital içerik üretim süreçlerinde kullanım alanını genişletmesi hedefleniyor.
Kaynak: https://www.prnewswire.com/news-releases/kling-ai-launches-3-0-model-ushering-in-an-era-where-everyone-can-be-a-director-302679944.html
