Yapay Zeka
Thursday, November 14, 2024
DeepL Voice şu anda sonucu bir ses veya video dosyası olarak sunmaktan kaçınıyor: Hizmet gerçek zamanlı, canlı konuşmaları ve video konferansı hedefliyor ve ses olarak değil metin olarak geliyor.
Bunlardan ilkinde, çevirilerinizi bir akıllı telefonda “ayna” olarak görünecek şekilde ayarlayabilirsiniz - fikir, her iki tarafın da çevrilen kelimeleri görmesi için telefonu bir toplantı masasına koymanızdır - veya biriyle yan yana paylaştığınız bir transkripsiyon olarak. Video konferans hizmeti, çevirilerin altyazı olarak göründüğünü görüyor.
Şirketin kurucusu ve CEO'su Jarek Kutylowski (yukarıdaki resimde) bir röportajda bunun zamanla değişebileceğini ima etti. Bu DeepL'un sese yönelik ilk ürünü, ancak son ürünü olması pek olası değil. Kutylowski, “[Ses] önümüzdeki yıl çevirinin öne çıkacağı alan olacak,” diye ekledi.
Bu ifadeyi destekleyen başka kanıtlar da var. DeepL'un en büyük rakiplerinden biri olan Google da Meet video konferans hizmetine gerçek zamanlı çevrilmiş altyazıları dahil etmeye başladı. Ayrıca, yapay zeka ses uzmanı ElevenLabs (ElevenLabs Dubbing) ve "deepfake" sesler ve sesle eşleşen video kullanarak çeviriler oluşturan Panjaya gibi sesli çeviri hizmetleri geliştiren çok sayıda yapay zeka girişimi var.
İkincisi ElevenLabs'ın API'sini kullanıyor ve Kutylowski'ye göre ElevenLabs'ın kendisi de çeviri hizmetini güçlendirmek için DeepL adresindeki teknolojiyi kullanıyor.
Ses çıkışı henüz piyasaya sürülmemiş tek özellik değil.
Ses ürünü için de şu anda bir API yok. DeepL'un ana işi B2B'ye odaklanmış durumda ve Kutylowski şirketin doğrudan iş ortakları ve müşterilerle çalıştığını söyledi.
Geniş bir entegrasyon seçeneği de yok: Kutylowski, şu anda DeepL'un altyazılarını destekleyen tek görüntülü arama hizmetinin “müşterilerimizin çoğunu kapsayan” Teams olduğunu söyledi. Zoom ya da Google Meet'in DeepL Voice'u ne zaman ya da ne şekilde bünyesine katacağına dair bir bilgi yok.