OpenAI, API’sine Yeni Sesli Zeka Özellikleri Ekledi

Nuvem tarafından

2 ay önce 151 kez okundu Okuma süresi: 2dk, 6sn

OpenAI, API’sine Yeni Sesli Zeka Özellikleri Ekledi

OpenAI Perşembe günü yaptığı açıklamada, API’sinin artık geliştiricilerin kullanıcılarla konuşabilen, konuşmaları yazıya dökebilen ve çevirebilen uygulamalar oluşturmasına yardımcı olmak üzere tasarlanan bir dizi yeni sesli zeka özelliği içereceğini duyurdu.

Şirketin yeni GPT-Realtime-2 modeli, kullanıcılarla etkileşim kurabilen gerçekçi bir ses simülasyonu oluşturmak üzere geliştirilen bir başka ses modeli olarak sunuluyor ancak selefi GPT-Realtime-1.5’ten farklı olarak bu model, OpenAI’ın kullanıcıların daha karmaşık taleplerini karşılamak için geliştirdiğini söylediği GPT-5 sınıfı akıl yürütme yeteneğiyle donatıldı.

Şirket ayrıca, adından da anlaşılacağı gibi, kullanıcıyla konuşma sırasında “ayak uyduran” gerçek zamanlı çeviri hizmetleri sağlamak üzere tasarlanan GPT-Realtime-Translate özelliğini kullanıma sunuyor. Bu özellik, sistemin anlayabildiği 70’ten fazla giriş dilini ve konuşmacıya aktarabildiği 13 çıkış dilini kapsıyor.

Son olarak şirket, etkileşimler gerçekleştikçe yakalanan canlı konuşmadan metne dönüştürme yeteneği sağlayan yeni bir deşifre özelliği olan GPT-Realtime-Whisper‘ı başlattı.

Şirket, “Piyasaya sürdüğümüz modeller, gerçek zamanlı sesi basit bir soru-cevap mantığından çıkarıp gerçekten iş yapabilen sesli arayüzlere dönüştürüyor: dinliyor, akıl yürütüyor, çeviriyor, yazıya döküyor ve konuşma ilerledikçe harekete geçiyor.” açıklamasında bulundu.

Peki bu güncellemeler kimlerin işine yarayacak? Müşteri hizmetleri kapasitesini genişletmek isteyen şirketler en belirgin hedef kitleyi oluşturuyor. Bununla birlikte OpenAI; yeni özelliklerin eğitim, medya, etkinlikler ve içerik üretici platformları başta olmak üzere pek çok alanda yardımcı olacağını belirtiyor.

Söz konusu araçlar kurumsal açıdan ne kadar kullanışlı görünse de kötüye kullanım riski de taşıyor. Şirket, yeni özelliklerin spam, dolandırıcılık veya diğer çevrimiçi suistimaller için kullanılmasını engellemek amacıyla güvenlik bariyerleri oluşturduğunu ifade etti. OpenAI, “konuşmaların zararlı içerik yönergelerini ihlal ettiği tespit edilirse durdurulabilmesi” için sisteme belirli tetikleyiciler yerleştirdi.

Yeni ses modellerinin tamamı OpenAI’ın Realtime API‘sine dahil edildi. Translate ve Whisper dakika üzerinden, GPT-Realtime-2 ise jeton tüketimi üzerinden faturalandırılıyor.

Kaynak: https://techcrunch.com/2026/05/07/openai-launches-new-voice-intelligence-features-in-its-api/

Post Views: 151

Bu Yazıya Tepkiniz Ne Oldu?

0

Beğendim
0

Alkışlıyorum
0

Eğlendim
0

Düşünceliyim
0

İğrendim
0

Sevdim
0

Çok Kızdım

Nuvem

Yazarın Profili

OpenAI, API’sine Yeni Sesli Zeka Özellikleri Ekledi

Yorum Yap İptal

GTA 6’nın Fiyatı Nihayet Belli Oldu

Devletlerin ve Şirketlerin Savunmasını Çökertebilecek Yapay Zeka Destekli Siber Saldırılara Aylar Kalmış Olabilir

Meta, Çalışanların Hassas Verileri Tüm Şirkete Açılınca Takip Programını Durdurdu

Trump Yönetimi, Meta’ya Yapay Zeka Modellerini “Gönüllü İncelemeye” Sunması için Baskı Yapıyor

Meta, İlk Meta Markalı Akıllı Gözlük Serisini Tanıttı

Yapay Zeka Dedektörü, 1776 Tarihli ABD Bağımsızlık Bildirgesi’ni “Yapay Zeka Tarafından Yazılmış” Olarak Tanımladı

Instagram, Sürekli Reels İzleyenler için Otomatik Kaydırma Özelliğini Test Ediyor

Yapay Zekaya Güvenmeyi Bırak, Yönetim Kurulunu Kur

Seedance 2.0 Sonunda Geldi! – Nasıl Kullanılır?

X, Grok ile Etkileşimi Genişletiyor

OpenAI, API’sine Yeni Sesli Zeka Özellikleri Ekledi

Benzer Yazılar

Yorum Yap İptal