Yapay Zeka
Thursday, August 1, 2024
Önde gelen yapay zeka görüntü oluşturma platformu Midjourney, çekirdek modeline sürpriz bir güncelleme yaptı. Sürüm 6.1'de insan derisi daha doğal görünüyor ve işlenen metin de daha okunaklı.
Şirketin bu yaz bir noktada v6.5'i yayınlayacağına dair bazı spekülasyonlar vardı, ancak önümüzdeki haftalarda yayınlanacak v6.2 ile daha yinelemeli bir yaklaşım benimsemiş gibi görünüyorlar.
En büyük değişiklikler insanlar üzerinde. Özellikle kolların, bacakların, ellerin ve vücutların tasvirini nasıl ele aldığı. Doku eşlemesi de yeni cilt dokuları sunacak şekilde yükseltildi.
Genel olarak modelin her alanında değişiklikler var. Her alanda yapılan ince yükseltmeler, piksel artefaktlarının sayısını azaltarak, dokuları geliştirerek ve 8bit ve retro tasarımlar gibi belirli stilleri işleme şeklini geliştirerek görüntü kalitesini artırıyor.
Midjourney, yeni modelin standart bir işi çalıştırırken %25 daha hızlı olduğunu ve kişiselleştirme modelindeki yükseltmelerin v6'ya göre daha fazla nüans, sürpriz ve doğruluk sağladığını söylüyor.
Şirket X'te şunları yazdı: "V6.1 görüntü kalitesini, tutarlılığı, metni büyük ölçüde geliştiriyor ve yepyeni yükseltme ve kişiselleştirme modelleriyle birlikte geliyor" ve "daha akıllı, daha hızlı, daha net ve daha güzel" diye ekledi. Şimdiye kadarki en iyi modelimizi beğeneceğinizi umuyoruz."
Yeni değişikliklerden biri, genel görünümü ve hissi iyileştirmek için daha iyi görüntü ve doku kalitesi sunan upscale'in çalışma şeklindedir. Çok daha uzun süren ancak görüntünün gerçekçiliğini daha da artırmak için daha fazla doku ekleyen yeni bir -q 2 modu var.
Ayrıca gözler, küçük yüzler ve uzaktaki eller için mükemmel olan daha hassas, ayrıntılı ve doğru küçük görüntü özellikleri de var.
Beni en çok heyecanlandıran özellik ise geliştirilmiş metin doğruluğu. Bu, tüm yapay zeka modellerinin zorlandığı bir konu ancak Midjourney, bir soruna tırnak içinde kelimeler koyarsanız, bu kelimeleri görüntü üzerinde doğru bir şekilde oluşturacağını söylüyor.
Midjourney v6.1'i kullanmak için komut isteminizin sonuna -v 6.1 eklemeniz yeterlidir. Bu web ve Discord sürümlerinde çalışır ve kullandığınız modeli değiştirir. Birkaç test yaptım ve en belirgin değişiklikler dış görünüm ve metin oluşturmada.
İlk test için şu komutu verdim: "Kedileri uzay giysileri içinde ayda gösteren "Kediler Uzayda" adlı bir filmin afişi." Bu, modeli yönlendirecek kadar detaylıydı ve metin gereksinimlerini de içeriyordu.
Poster beklediğimden daha iyi çıktı, ancak sadece iki versiyon doğru stile sahipti ve bunlardan birinde başlık ve alt başlık doğru bir şekilde oluşturulmuştu.
Daha sonra "Bir tren istasyonunda halka açık ücretsiz bir piyano çalan bir kadının geniş çekimi "ni göstermesini istedim. Bu, aşağıdaki komut istemi kapalı olsaydı tuhaf bir şey verecek kadar belirsizdi, ancak öyle olmadı, bir versiyonda neredeyse rayların üzerinde olmasına rağmen tam olarak umduğum şeyi elde ettim.
Son olarak, Midjourney v6.1'den bir kadın görüntüsü oluşturmasını ve etkileyici yeni Runway Gen-3 Alpha görüntüden videoya işlevselliğini kullanarak canlandırmasını istedim ve bugüne kadar oluşturduğum en gerçek görünümlü AI görüntülerinden ve videolarından biri oldu.
Genel olarak bunun Midjourney için kayda değer bir gelişme olduğunu, temel modelin zorlandığı alanlarda ince ama önemli değişiklikler sunduğunu ve v7'de neler olacağına dair harika bir işaret olduğunu düşünüyorum.