Yapay Zeka
Friday, July 5, 2024
Ses klonlama, metinden sese ve konuşmadan sese modelleriyle tanınan yapay zeka ses girişimi ElevenLabs, ürün portföyüne yeni bir araç ekledi: Yapay Zeka Ses İzolatörü.
ElevenLabs platformunda bugünden itibaren kullanıma sunulan bu araç, içerik oluşturucuların bir filmden podcast'e veya YouTube videosuna kadar sahip oldukları herhangi bir içerikten istenmeyen ortam gürültüsünü ve sesleri çıkarmasına olanak tanıyor.
Şirketin Okuyucu uygulamasının piyasaya sürülmesinden sadece birkaç gün sonra geliyor ve kullanımı ücretsiz (bazı sınırlamalarla). Ancak kullanıcılar bu özelliğin pazarda tamamen yeni bir şey olmadığını da unutmamalıdır. Adobe dahil olmak üzere diğer birçok yaratıcı çözüm sağlayıcısı, içerikteki konuşma kalitesini artırmak için araçlar sunuyor. Görülmesi gereken tek şey, Voice Isolator'ın bunlara kıyasla ne kadar etkili olduğu.
Film, podcast veya röportaj gibi içerikleri kaydederken, içerik oluşturucular genellikle istenmeyen seslerin içeriğe karıştığı arka plan gürültüsü sorunuyla karşılaşırlar (rastgele konuşan insanları, esen rüzgarı veya yoldan geçen bir aracı düşünün). Bu sesler çekim sırasında fark edilmeyebilir ancak nihai çıktının kalitesini etkileyebilir - özellikle de zaman zaman konuşmacının sesini bastırabilir.
Bunu çözmek için çoğu kişi, kayıt aşamasında arka plan gürültüsünü ortadan kaldıran ortam gürültüsü engelleme özellikli mikrofonlar kullanma eğilimindedir. İşlerini görüyorlar ama çoğu durumda, özellikle de sınırlı kaynaklara sahip erken aşamadaki içerik oluşturucular için erişilebilir olmayabiliyorlar. İşte bu noktada ElevenLabs'ın yeni Ses İzolatörü gibi yapay zeka tabanlı araçlar devreye giriyor.
Ürün özünde, kullanıcının geliştirmek istediği içeriği yüklemesi gereken post-prodüksiyon aşamasında çalışıyor. Dosya yüklendikten sonra, altta yatan modeller onu işliyor, istenmeyen gürültüyü tespit edip kaldırıyor ve çıktı olarak net diyaloglar çıkarıyor.
ElevenLabs, ürünün bir stüdyoda kaydedilen içeriğe benzer bir kalite seviyesinde konuşma çıkardığını söylüyor. Şirketin tasarım müdürü Ammaar Reshi, aracın bir yaprak üfleyicinin gürültüsünü gidererek konuşmacının kristal netliğinde konuşmasını çıkardığının görüldüğü bir demo da paylaştı.
Ses izolatörünün gerçek dünyada uygulanabilirliğini denemek için üç test gerçekleştirdik. İlkinde, her biri arka planda farklı seslerle bozulmuş üç ayrı cümle konuştuk, diğer ikisinde ise rastgele noktalarda düzensiz olarak meydana gelen farklı seslerin karışımı olan üç cümle vardı.
Tüm durumlarda, araç sesi birkaç saniye içinde işleyebildi. En önemlisi, kapıların açılıp kapanması ve masaya vurulmasından el çırpma ve ev eşyalarının hareket etmesine kadar hemen hemen tüm durumlarda gürültüleri ortadan kaldırdı ve herhangi bir bozulma olmadan net bir konuşma çıkardı. Tanıyamadığı ve çıkaramadığı sadece birkaç ses duvara vurma ve parmak şıklatma sesleriydi.
Şirkette büyümeyle ilgilenen Sam Sklar, bu aşamada müzik vokalleri üzerinde çalışmadığını, ancak kullanıcıların bu kullanım durumunda deneyebileceğini ve bazı şarkılarda başarılı olabileceğini söyledi.