Yapay Zeka

Thursday, November 14, 2024

DeepL, Gerçek Zamanlı Sesli Çeviri Hizmeti Başlattı.

DeepL, Google'ın sunduğu hizmetlerden daha incelikli ve hassas olduğunu iddia ettiği çevrimiçi metin çevirisiyle adından söz ettirdi - bu da Alman girişimini 2 milyar dolarlık bir değerlemeye ve 100.000'den fazla ödeme yapan müşteriye ulaştırdı.
Şimdi, yapay zeka hizmetlerine yönelik heyecan artmaya devam ederken, DeepL platforma başka bir mod ekliyor: ses. Kullanıcılar artık DeepL Voice'u kullanarak bir dilde konuşan birini dinleyebilecek ve bunu gerçek zamanlı olarak otomatik olarak başka bir dile çevirebilecek.
İngilizce, Almanca, Japonca, Korece, İsveççe, Hollandaca, Fransızca, Türkçe, Lehçe, Portekizce, Rusça, İspanyolca ve İtalyanca bugün DeepL'un “duyabildiği” diller. Çevrilmiş altyazılar şu anda DeepL Translator tarafından desteklenen 33 dilin tamamı için mevcuttur.

DeepL Voice şu anda sonucu bir ses veya video dosyası olarak sunmaktan kaçınıyor: Hizmet gerçek zamanlı, canlı konuşmaları ve video konferansı hedefliyor ve ses olarak değil metin olarak geliyor.
Bunlardan ilkinde, çevirilerinizi bir akıllı telefonda “ayna” olarak görünecek şekilde ayarlayabilirsiniz - fikir, her iki tarafın da çevrilen kelimeleri görmesi için telefonu bir toplantı masasına koymanızdır - veya biriyle yan yana paylaştığınız bir transkripsiyon olarak. Video konferans hizmeti, çevirilerin altyazı olarak göründüğünü görüyor.
Şirketin kurucusu ve CEO'su Jarek Kutylowski (yukarıdaki resimde) bir röportajda bunun zamanla değişebileceğini ima etti. Bu DeepL'un sese yönelik ilk ürünü, ancak son ürünü olması pek olası değil. Kutylowski, “[Ses] önümüzdeki yıl çevirinin öne çıkacağı alan olacak,” diye ekledi.

Bu ifadeyi destekleyen başka kanıtlar da var. DeepL'un en büyük rakiplerinden biri olan Google da Meet video konferans hizmetine gerçek zamanlı çevrilmiş altyazıları dahil etmeye başladı. Ayrıca, yapay zeka ses uzmanı ElevenLabs (ElevenLabs Dubbing) ve "deepfake" sesler ve sesle eşleşen video kullanarak çeviriler oluşturan Panjaya gibi sesli çeviri hizmetleri geliştiren çok sayıda yapay zeka girişimi var.

İkincisi ElevenLabs'ın API'sini kullanıyor ve Kutylowski'ye göre ElevenLabs'ın kendisi de çeviri hizmetini güçlendirmek için DeepL adresindeki teknolojiyi kullanıyor.
Ses çıkışı henüz piyasaya sürülmemiş tek özellik değil.
Ses ürünü için de şu anda bir API yok. DeepL'un ana işi B2B'ye odaklanmış durumda ve Kutylowski şirketin doğrudan iş ortakları ve müşterilerle çalıştığını söyledi.
Geniş bir entegrasyon seçeneği de yok: Kutylowski, şu anda DeepL'un altyazılarını destekleyen tek görüntülü arama hizmetinin “müşterilerimizin çoğunu kapsayan” Teams olduğunu söyledi. Zoom ya da Google Meet'in DeepL Voice'u ne zaman ya da ne şekilde bünyesine katacağına dair bir bilgi yok.