Yapay Zeka
Friday, June 14, 2024
Stable Diffusion, Stability AI'nın metinden görüntüye üretim yetenekleri sağlayan amiral gemisi modelidir. İlk Stable Diffusion 3 sürümünün önizlemesi 22 Şubat'ta yapıldı ve 17 Nisan'da bir API aracılığıyla herkese açık olarak kullanıma sunuldu.
Yeni Stable Diffusion Medium, tüketici sınıfı GPU'larda çalışabilen daha küçük ancak çok yetenekli bir model olarak tasarlanmıştır. Yeni orta ölçekli model, Stable Diffusion 3'ü son derece yetenekli bir görüntü oluşturma teknolojisi çalıştırmak isteyen kaynak kısıtlamaları olan kullanıcılar ve kuruluşlar için daha da cazip bir seçenek haline getirecek.
Stable Diffusion Medium, kullanıcıların API aracılığıyla ve Discord aracılığıyla Stable Artisan hizmetinde denemeleri için bugün kullanıma sunuldu. Model ağırlıkları ayrıca Hugging Face'te ticari olmayan kullanım için de mevcut olacak.
Yeni Stable Diffusion Medium, tüketici sınıfı GPU'larda çalışabilen daha küçük ancak çok yetenekli bir model olarak tasarlanmıştır. Yeni orta ölçekli model, Stable Diffusion 3'ü son derece yetenekli bir görüntü oluşturma teknolojisi çalıştırmak isteyen kaynak kısıtlamaları olan kullanıcılar ve kuruluşlar için daha da cazip bir seçenek haline getirecek.
Stable Diffusion Medium, kullanıcıların API aracılığıyla ve Discord aracılığıyla Stable Artisan hizmetinde denemeleri için bugün kullanıma sunuldu. Model ağırlıkları ayrıca Hugging Face'te ticari olmayan kullanım için de mevcut olacak.
Yeni sürümle birlikte Stable Diffusion'ın ilk sürümü artık Stable Diffusion 3 (SD3) Large olarak biliniyor. Stability AI eş CEO'su Christian Laforte VentureBeat'e SD3 Large'ın 8 milyar parametreye sahip olduğunu söyledi. Buna karşılık SD3 Medium sadece 2 milyar parametreye sahip.
Laforte, "SD3 Large'ın aksine, SD3 Medium daha küçüktür ve tüketici donanımında verimli bir şekilde çalışacaktır" dedi.
Stable Diffusion da dahil olmak üzere birçok üretken yapay zeka iş yükü uzun süredir güçlü Nvidia GPU'lara dayanırken, yeni Stability AI modeli paradigmayı değiştiriyor.
Stable Diffusion Medium'u çalıştırmak için minimum gereksinim yalnızca 5GB GPU VRAM'dir. Bu seviyede, model çok çeşitli tüketici bilgisayarlarının yanı sıra üst düzey dizüstü bilgisayarlarda da çalışacaktır. Adil olmak gerekirse, minimum gereksinim hala sadece minimumdur. Stability AI 16GB GPU VRAM öneriyor ki bu çoğu dizüstü bilgisayar için biraz fazla olabilir ama yine de mantıksız bir miktar değil.
Stability AI, daha küçük parametre sayısıyla bile SD3 Medium'un SD3 Large ile bir dizi özellik açısından karşılaştırılabilir, olağanüstü yüksek bir kalite düzeyi sağladığını iddia ediyor.
Laforte'ye göre SD3 Medium, SD3 Large'ın bir parçası olan bir dizi aynı yetenekle öne çıkacak. Fotogerçekçilik, hızlı bağlılık, tipografi, kaynak verimliliği ve ince ayar gibi özelliklerin tümü daha küçük modelin bir parçası.
Laforte, "SD3 Medium, bahsedilen tüm yeteneklerde üstündür ve bugün severek kullandığınız SD3 Large API'nin mevcut sürümüyle karşılaştırılabilir" dedi.
Larforte, kullanıcıların SD3'ten son derece gerçekçi görüntü çıktıları bekleyebileceklerini belirtti. Larforte, 16 kanallı VAE (Variational Autoencoder) sayesinde SD3 Medium'un megapiksel başına önceki tüm modellerden daha fazla ayrıntı sunduğunu açıkladı.
Hızlı bağlılık söz konusu olduğunda, SD3'ün doğal dilde kayda değer derecede hızlı anlama yeteneğine sahip olduğunu söyledi. Bu, bir görüntüdeki öğelerin konumlandırılması gibi öğelerin uzamsal olarak anlaşılmasını da içeriyor.
Laforte'ye göre küçük model ince ayar konusunda da başarılı. Modelin son derece uyarlanabilir olduğunu ve ince ayar veri kümelerinden ayrıntıları verimli bir şekilde yakaladığını belirtti.