Yapay Zeka

Tuesday, October 29, 2024

Meta, Google'ın podcast oluşturucusunun 'açık' bir sürümünü yayınladı.

Meta, Google'ın NotebookLM'sindeki viral bir podcast oluşturma özelliğinin "açık" bir uygulamasını yayınladı.
NotebookLlama olarak adlandırılan proje, şaşırtıcı olmayan bir şekilde, işlemlerin çoğu için Meta'nın kendi Llama modellerini kullanıyor. NotebookLM gibi, kendisine yüklenen metin dosyalarının podcast tarzı özetlerini ileri geri oluşturabilir.
NotebookLlama önce bir dosyadan (örneğin bir haber makalesinin ya da blog yazısının PDF'si) bir transkript oluşturuyor. Daha sonra transkripti açık metin-konuşma modellerine beslemeden önce “daha fazla dramatizasyon” ve kesintiler ekler.

Sonuçlar NotebookLM kadar iyi değil. Dinlediğim NotebookLlama örneklerinde, sesler çok belirgin bir robotik kaliteye sahip ve garip noktalarda birbirlerinin üzerinden konuşma eğiliminde.
Ancak projenin arkasındaki Meta araştırmacıları, kalitenin daha güçlü modellerle geliştirilebileceğini söylüyor.
NotebookLlama'nın GitHub sayfasında “[Metinden sese] model, bunun ne kadar doğal ses çıkaracağının sınırıdır” diye yazdılar. “[Ayrıca,] podcast'i yazmanın bir başka yaklaşımı da iki ajanın ilgilenilen konuyu tartışması ve podcast taslağını yazması olabilir. Şu anda podcast taslağını yazmak için tek bir model kullanıyoruz.”
NotebookLlama, NotebookLM'in podcast özelliğini kopyalamaya yönelik ilk girişim değil. Bazı projeler diğerlerinden daha başarılı oldu. Ancak hiçbiri - NotebookLM'nin kendisi bile - tüm YZ'yi zorlayan halüsinasyon sorununu çözmeyi başaramadı. Yani, yapay zeka tarafından üretilen podcast'lerin bazı uydurma şeyler içermesi kaçınılmaz.