Yapay Zeka

Wednesday, July 31, 2024

OpenAI, ChatGPT'nin hiper gerçekçi sesini ödeme yapan bazı kullanıcılara sunuyor.

OpenAI, Salı günü ChatGPT'nin Gelişmiş Ses Modunu kullanıma sunarak kullanıcılara GPT-4o'nun hiper gerçekçi ses yanıtlarına ilk erişimlerini sağladı. Alfa sürümü bugün küçük bir grup ChatGPT Plus kullanıcısına sunulacak ve OpenAI, özelliğin 2024 sonbaharında kademeli olarak tüm Plus kullanıcılarına sunulacağını söylüyor.

OpenAI Mayıs ayında GPT-4o'nun sesini ilk kez sergilediğinde, özellik hızlı yanıtları ve gerçek bir insan sesine -özellikle bir tanesine- olan esrarengiz benzerliği ile izleyicileri şok etmişti. Sky adlı ses, “Her” filmindeki yapay asistanın arkasındaki aktris Scarlett Johansson'un sesine benziyordu. OpenAI'nin demosundan kısa bir süre sonra Johansson, CEO Sam Altman'ın sesini kullanması için yaptığı çok sayıda talebi reddettiğini ve GPT-4o'nun demosunu gördükten sonra benzerliğini savunmak için yasal danışman tuttuğunu söyledi. OpenAI Johansson'un sesini kullandığını reddetti, ancak daha sonra demosunda gösterilen sesi kaldırdı. Haziran ayında OpenAI, güvenlik önlemlerini iyileştirmek için Gelişmiş Ses Modu'nun yayınlanmasını erteleyeceğini söyledi.

Bir ay sonra bekleyiş sona erdi (bir nevi). OpenAI, Bahar Güncellemesi sırasında sergilenen video ve ekran paylaşımı özelliklerinin bu alfanın bir parçası olmayacağını ve “daha sonraki bir tarihte” piyasaya sürüleceğini söylüyor. Şimdilik, herkesi şaşkına çeviren GPT-4o demosu hala sadece bir demo, ancak bazı premium kullanıcılar artık ChatGPT'nin orada gösterilen ses özelliğine erişebilecek.

ChatGPT'de şu anda mevcut olan Ses Modunu zaten denemiş olabilirsiniz, ancak OpenAI Gelişmiş Ses Modunun farklı olduğunu söylüyor. ChatGPT'nin eski ses çözümü üç ayrı model kullanıyordu: biri sesinizi metne dönüştürmek için, GPT-4 isteminizi işlemek için ve ardından ChatGPT'nin metnini sese dönüştürmek için üçüncü bir model. Ancak GPT-4o çok modludur, bu görevleri yardımcı modellerin yardımı olmadan işleyebilir ve önemli ölçüde daha düşük gecikmeli konuşmalar yaratabilir. OpenAI ayrıca GPT-4o'nun sesinizdeki üzüntü, heyecan veya şarkı söyleme gibi duygusal tonlamaları algılayabildiğini iddia ediyor.

Bu pilot uygulamada ChatGPT Plus kullanıcıları OpenAI'nin Gelişmiş Ses Modunun gerçekte ne kadar hiper gerçekçi olduğunu ilk elden görebilecekler. TechCrunch bu makaleyi yayınlamadan önce özelliği test edemedi, ancak erişimimiz olduğunda inceleyeceğiz.

OpenAI, ChatGPT'nin yeni sesini, kullanımını yakından izlemek için kademeli olarak yayınladığını söylüyor. Alfa grubundaki kişiler ChatGPT uygulamasında bir uyarı alacak ve ardından nasıl kullanılacağına dair talimatlar içeren bir e-posta alacaklar.

OpenAI'nin demosundan bu yana geçen aylar içinde şirket, GPT-4o'nun ses yeteneklerini 45 farklı dil konuşan 100'den fazla harici kırmızı ekip üyesiyle test ettiğini söylüyor. OpenAI, bu güvenlik çabalarına ilişkin bir raporun Ağustos ayı başında yayınlanacağını söylüyor.

Şirket, Gelişmiş Ses Modunun ChatGPT'nin ücretli seslendirme sanatçılarıyla işbirliği içinde yapılan Juniper, Breeze, Cove ve Ember olmak üzere önceden ayarlanmış dört sesle sınırlı olacağını söylüyor. OpenAI'nin Mayıs demosunda gösterilen Sky sesi artık ChatGPT'de mevcut değil. OpenAI sözcüsü Lindsay McCallum, “ChatGPT, hem bireyler hem de tanınmış kişiler olmak üzere başkalarının seslerini taklit edemez ve bu önceden ayarlanmış seslerden birinden farklı olan çıktıları engelleyecektir” diyor.

OpenAI deepfake tartışmalarından kaçınmaya çalışıyor. Ocak ayında, yapay zeka girişimi ElevenLabs'ın ses klonlama teknolojisi Başkan Biden'ı taklit etmek için kullanılmış ve New Hampshire'daki önseçim seçmenlerini kandırmıştı.

OpenAI ayrıca, müzik veya diğer telif hakkıyla korunan seslerin üretilmesine yönelik belirli talepleri engellemek için yeni filtreler getirdiğini söylüyor. Geçtiğimiz yıl, yapay zeka şirketleri telif hakkı ihlali nedeniyle başlarını yasal belaya soktu ve GPT-4o gibi ses modelleri, şikayette bulunabilecek yepyeni bir şirket kategorisini ortaya çıkardı. Özellikle de davacı bir geçmişe sahip olan ve halihazırda yapay zeka ile şarkı üreten Suno ve Udio'ya dava açmış olan plak şirketleri.