En Son Haberler
Wednesday, December 4, 2024
New York merkezli bir yapay zeka (AI) firması olan Hume, Pazartesi günü kullanıcıların AI seslerini özelleştirmelerine olanak tanıyacak yeni bir araç tanıttı. Voice Control olarak adlandırılan yeni özellik, geliştiricilerin bu sesleri sohbet botlarına ve diğer yapay zeka tabanlı uygulamalarına entegre etmelerine yardımcı olmayı amaçlıyor. Şirket, geniş bir ses yelpazesi sunmak yerine, seslerin 10 farklı boyutu üzerinde ayrıntılı kontrol sunuyor. Her bir boyutta istenen parametreleri seçerek, kullanıcılar uygulamaları için benzersiz sesler oluşturabilirler.
Şirket yeni yapay zeka aracını bir blog yazısında detaylandırdı. Hume, işletmelerin marka kimliklerine uygun doğru yapay zeka sesini bulma sorununu çözmeye çalıştığını belirtti. Bu özellik sayesinde kullanıcılar ses algısının farklı yönlerini özelleştirebiliyor ve geliştiricilerin yapay zeka tabanlı uygulamalar için daha iddialı, rahat veya canlı bir ses oluşturmasına olanak tanıyor.
Hume'un Sesli Kontrolü şu anda beta aşamasında ancak platforma kayıtlı herkes tarafından erişilebiliyor. Gadgets 360 çalışanları araca erişebildi ve özelliği test edebildi. Geliştiricilerin ayarlayabileceği 10 farklı boyut var: cinsiyet, iddialılık, canlılık, güven, coşku, nazalite, rahatlık, pürüzsüzlük, ılıklık ve gerginlik.
Şirket, istem tabanlı bir özelleştirme eklemek yerine, her bir metrik için -100'den +100'e kadar giden bir kaydırıcı ekledi. Şirket bu yaklaşımın, bir sesin metinsel tanımıyla ilişkili belirsizliği ortadan kaldırmak ve diller üzerinde ayrıntılı kontrol sunmak için benimsendiğini belirtti.
Testlerimizde, on boyuttan herhangi birini değiştirmenin yapay zeka sesinde duyulabilir bir fark yarattığını ve aracın farklı boyutları doğru bir şekilde ayırabildiğini gördük. YZ firması bunun, belirli parametreler değiştirildiğinde her bir temel sesin çoğu özelliğini koruyan yeni bir “denetimsiz yaklaşım” geliştirilerek başarıldığını iddia etti. Hume'un temin edilen verilerin kaynağını ayrıntılı olarak açıklamaması dikkat çekicidir.
Özellikle, bir yapay zeka sesi oluşturduktan sonra, geliştiricilerin Empatik Ses Arayüzü (EVI) yapay zeka modelini yapılandırarak uygulamaya yerleştirmeleri gerekecek. Şirket belirtmese de, bu deneysel özellik için muhtemelen EVI-2 modeli kullanıldı.