Kling AI, 3.0 Modelini Tanıttı: Daha Tutarlı Sahneler ve 15 Saniyeye Kadar Video Üretimi

Nuvem tarafından

5 ay önce 439 kez okundu Okuma süresi: 3dk, 12sn

Kling AI, 3.0 Modelini Tanıttı: Daha Tutarlı Sahneler ve 15 Saniyeye Kadar Video Üretimi

Çinli yapay zeka video girişimi Kling AI, Video 3.0, Video 3.0 Omni, Image 3.0 ve Image 3.0 Omni sürümlerini kapsayan Kling 3.0 model ailesini duyurdu. Yeni modeller, yapay zeka tabanlı video üretiminde daha güçlü anlatı kontrolü ve daha tutarlı çıktılar sunmayı hedefliyor. Model serisi, artırılmış tutarlılık, fotogerçekçi çıktı, 15 saniyeye kadar uzayan video süreleri ve çoklu dil ile aksan desteği bulunan yerel ses üretimi gibi güncellemeler içeriyor.

Birleşik bir eğitim altyapısı üzerine kurulan Kling 3.0 modelleri, metin, görsel, ses ve videoyu kapsayan tam çok modlu giriş ve çıkış desteği sağlıyor. Sistem, video anlama, üretme ve düzenleme süreçlerini tek bir iş akışında bir araya getiriyor. Metinden videoya, görselden videoya, referans tabanlı video üretimi ve video içi düzenleme gibi görevler, tek bir çok modlu mimari içinde sunuluyor.

Kling AI 3.0 modelleri şu anda Ultra abonelere erken erişimle açılmış durumda, genel erişimin ise ilerleyen dönemde sunulması planlanıyor.

Video 3.0: Sinematik Kalitede Video Üretimi

Video 3.0, öğe tutarlılığını artıran yapısıyla içerik üreticilerine daha fazla kontrol sunuyor. Kullanıcılar, referans videolar ve birden fazla görsel referans yükleyerek karakterlerin, nesnelerin ve sahnelerin kareler boyunca tutarlı kalmasını sağlayabiliyor.

Modelin öne çıkan özellikleri şunlar:

Diller ve Aksanlar Arasında Yerel Ses Desteği: İngilizce, Çince, Japonca, Korece ve İspanyolca dillerinde konuşma üretimi destekleniyor. Amerikan, İngiliz ve Hint aksanları da sistem tarafından kullanılabiliyor. Çok karakterli sahnelerde, her karakter için farklı dil ve konuşma sırası tanımlanabiliyor.
Genişletilmiş Video Süresi: Video 3.0, 15 saniyeye kadar video üretimini destekliyor. Daha uzun süre, çoklu sahneler ve daha karmaşık sekansların tek bir klip içinde oluşturulmasına imkan tanıyor.
Çoklu Çekim Anlatımı: Sistem, çok sahneli ve çok çekimli talimatları anlayarak kamera açılarını ve çekimleri verilen yönergelere göre uyarlayabiliyor.
Görsellerde Metin Tutarlılığı: Tabela, altyazı ve markalı öğeler video boyunca net ve okunabilir şekilde korunabiliyor. Bu özellik, özellikle e-ticaret ve reklam kullanım senaryoları için önem taşıyor.
Fotogerçekçi Çıktı: Model, daha doğal hareketler ve gerçekçi karakterlerle fotogerçekçi videolar üretebiliyor.

Video 3.0 Omni: Gelişmiş Hikaye Panosu ve Referans Kullanımı

Video 3.0 Omni, önceki Kling Video O1 modelinde sunulan “Elements” yaklaşımını temel alarak referans tabanlı üretimi genişletiyor. Kullanıcılar bir referans video yükleyerek, bir karakterin görsel özelliklerinin ve ses niteliklerinin yeni sahnelere tutarlı şekilde aktarılmasını sağlayabiliyor.

Model ayrıca, çok çekimli bir hikaye panosu özelliği sunuyor. Kullanıcılar her bir çekim için süre, çekim ölçeği, perspektif, anlatı içeriği ve kamera hareketlerini ayrı ayrı belirleyebiliyor.

Image 3.0 Omni: Yüksek Çözünürlüklü Görsel Üretimi

Kling AI, video modellerine ek olarak Image 3.0 ve Image 3.0 Omni sürümlerini de tanıttı. Yeni görsel modeller, 2K ve 4K çözünürlükte çıktı desteği sunarak profesyonel kullanım senaryolarını hedefliyor. Sistem, dokuların, ışıklandırmanın ve malzeme detaylarının daha tutarlı biçimde korunmasını amaçlıyor.

Kling O1 ve 2.6 serilerinin üzerine inşa edilen 3.0 model ailesi, Çok Modlu Görsel Dil (MVL) yaklaşımını temel alıyor.

Şirketin paylaştığı bilgilere göre Kling AI, Haziran 2024’teki lansmanından bu yana dünya genelinde 60 milyondan fazla kullanıcıya ulaştı, 600 milyondan fazla video üretti ve 30.000’den fazla kurumsal müşteriyle çalıştı. Yeni modellerin, film, reklam ve dijital içerik üretim süreçlerinde kullanım alanını genişletmesi hedefleniyor.

Kaynak: https://www.prnewswire.com/news-releases/kling-ai-launches-3-0-model-ushering-in-an-era-where-everyone-can-be-a-director-302679944.html

Post Views: 439

Bu Yazıya Tepkiniz Ne Oldu?

0

Beğendim
0

Alkışlıyorum
0

Eğlendim
0

Düşünceliyim
0

İğrendim
0

Sevdim
0

Çok Kızdım

Nuvem

Yazarın Profili

Kling AI, 3.0 Modelini Tanıttı: Daha Tutarlı Sahneler ve 15 Saniyeye Kadar Video Üretimi

Video 3.0: Sinematik Kalitede Video Üretimi

Video 3.0 Omni: Gelişmiş Hikaye Panosu ve Referans Kullanımı

Image 3.0 Omni: Yüksek Çözünürlüklü Görsel Üretimi

Yorum Yap İptal

Siber Saldırıda ChatGPT Kullanan 15 Yaşındaki Genç Tutuklandı: İşte Yaşananlar

Gürültüsüz, Yumuşak ve Sevimli: Uçan Robot Arkadaş

Elon Musk Geri Adım Attı: “Anthropic Konusunda Yanılmışım”

TSMC Talebin Altında Ezildi: Intel ve Rakiplere Gün Doğdu!

Çin, Dünyanın En Büyük Hibrit Güneş Santralini Devreye Aldı: Erimiş Tuzla Gece de Elektrik Üretiyor

Yapay Zeka Dedektörü, 1776 Tarihli ABD Bağımsızlık Bildirgesi’ni “Yapay Zeka Tarafından Yazılmış” Olarak Tanımladı

Yerli Yapay Zeka Kumru, Hatalı Cevaplarıyla Sosyal Medyada Gündem Oldu

Instagram, Sürekli Reels İzleyenler için Otomatik Kaydırma Özelliğini Test Ediyor

Yapay Zekaya Güvenmeyi Bırak, Yönetim Kurulunu Kur

X, Grok ile Etkileşimi Genişletiyor

Kling AI, 3.0 Modelini Tanıttı: Daha Tutarlı Sahneler ve 15 Saniyeye Kadar Video Üretimi

Video 3.0: Sinematik Kalitede Video Üretimi

Video 3.0 Omni: Gelişmiş Hikaye Panosu ve Referans Kullanımı

Image 3.0 Omni: Yüksek Çözünürlüklü Görsel Üretimi

Benzer Yazılar

Yorum Yap İptal