1. Anasayfa
  2. Öne Çıkanlar

GPT-5.4 Tanıtıldı: Daha Az Hata, Daha Güçlü Akıl Yürütme

GPT-5.4 Tanıtıldı: Daha Az Hata, Daha Güçlü Akıl Yürütme
0

Perşembe günü OpenAI, “profesyonel çalışmalar için en yetenekli ve verimli öncü modeli” olarak tanımladığı yeni temel modeli GPT-5.4’ü yayınladı ve kademeli olarak kullanıcılara sunulmaya başlandı. Standart sürümün yanında GPT-5.4, akıl yürütme odaklı GPT-5.4 Thinking veya yüksek performans için optimize edilen GPT-5.4 Pro seçenekleriyle geldi.

Modelin API sürümü, OpenAI tarafından bugüne kadar sağlanan en geniş kapsam olan 1 milyon token‘lık bağlam penceresiyle kullanılabiliyor. OpenAI ayrıca token verimliliğinin arttığını vurgulayarak, GPT-5.4’ün önceki modeline kıyasla aynı problemleri çok daha az token kullanarak çözdüğünü belirtti.

Yeni model, OSWorld-Verified ve WebArena Verified gibi bilgisayar kullanımı kıyaslamalarında rekor puanlar alarak önemli ölçüde iyileşmiş test sonuçları sergiliyor. Ayrıca bilgi odaklı iş görevlerini ölçen GDPval testinde %83‘lük bir başarı yakaladı.

Mercor CEO’su Brendan Foody yaptığı açıklamada, GPT-5.4’ün hukuk ve finans alanındaki profesyonel becerileri test eden APEX-Agents kıyaslamasında da liderliği ele geçirdiğini duyurdu. Foody, “[GPT-5.4], sunum dosyaları, finansal modeller ve hukuki analizler gibi uzun vadeli projeler oluşturmada mükemmel sonuçlar veriyor.” diyerek modelin rakiplerine göre daha hızlı ve düşük maliyetli çalıştığını ekledi.

GPT-5.4, şirketin halüsinasyonları ve olgusal hataları sınırlama çabalarını sürdürüyor. OpenAI, yeni modelin bireysel iddialarda hata yapma olasılığının GPT 5.2’ye göre %33 azaldığını, genel yanıtlarda ise hata oranının %18 düştüğünü açıkladı.

Lansmanın bir parçası olarak OpenAI, API sürümünün araç çağırma yönetimini Tool Search adlı yeni bir sistemle yeniden yapılandırdı. Eskiden sistem komutları, model çağrılırken mevcut tüm araçların tanımlarını sunuyordu; bu da araç sayısı arttıkça yüksek token tüketimine neden oluyordu. Yeni sistem, modellerin araç tanımlarına ihtiyaç duydukça bakmasına olanak tanıyarak çok sayıda araca sahip sistemlerde daha hızlı ve ucuz işlemler sağlıyor.

OpenAI ayrıca modellerin çok aşamalı görevlerdeki düşünce süreçlerini gösteren düşünce zincirini test etmek için yeni bir güvenlik değerlendirmesi hazırladı. YZ güvenliği araştırmacıları, akıl yürütme modellerinin düşünce zincirlerini yanlış yansıtabileceğinden uzun süredir endişe ediyordu; testler bunun uygun koşullarda yaşanabileceğini gösteriyor.

OpenAI tarafından yapılan yeni testler, GPT-5.4 Thinking sürümünün bir sonuca ulaşırken arka planda izlediği mantık yolunu kullanıcıdan saklama veya bu süreci olduğundan farklı göstererek aldatma ihtimalinin oldukça düşük olduğunu ortaya koydu. Bu durum, “modelin akıl yürütme sürecini gizleme yeteneğinden yoksun olduğunu ve düşünce zinciri izlemesinin etkili bir güvenlik aracı olmaya devam ettiğini” kanıtlıyor.

Kaynak: https://techcrunch.com/2026/03/05/openai-launches-gpt-5-4-with-pro-and-thinking-versions/
Bu Yazıya Tepkiniz Ne Oldu?
  • 1
    be_endim
    Beğendim
  • 0
    alk_l_yorum
    Alkışlıyorum
  • 0
    e_lendim
    Eğlendim
  • 0
    d_nceliyim
    Düşünceliyim
  • 0
    _rendim
    İğrendim
  • 0
    sevdim
    Sevdim
  • 0
    _ok_k_zd_m
    Çok Kızdım

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir