Büyük YZ modeli geliştiren şirketler için ajan tabanlı yetenekler sunmak artık standart bir zorunluluk haline gelirken Anthropic, laboratuvarın orta ölçekli modelinin daha güçlü ve daha çok ajan tabanlı bir versiyonu olan Claude Sonnet 5’i piyasaya sürdü.
Anthropic, paylaştığı bir blog yazısında şu ifadelere yer verdi: “Planlar yapabiliyor, tarayıcılar ve terminaller gibi araçları kullanabiliyor ve daha birkaç ay öncesine kadar daha büyük ve daha pahalı modelleri gerektiren bir seviyede otonom olarak çalışabiliyor.”
Bu yaklaşım, OpenAI ve Google’ın kendi son sürümleri hakkında söyledikleriyle örtüşüyor. Geçen hafta önizleme sürümü sunulan OpenAI imzalı GPT-5.6 Sol, uzun otonom görevleri alt ajanlara bölebilme yeteneğiyle şirketin şimdiye kadarki en gelişmiş ajan tabanlı modeli konumunda. Mayıs ayında çıkan Google Gemini 3.5 Flash ise basit bir sohbet robotundan, minimum insan girdisiyle planlama yapan, inşa eden ve gerçek iş süreçlerini yürüten ajan tabanlı bir araca geçişin sinyalini vermişti.
Sonnet 5’in bu tanıtımı, ajan tabanlı yeteneklerin artık her fiyat kademesinde yeni taban beklentiye dönüştüğünü kanıtlıyor. Artık ayrışma noktası bu işleri kimin en iyi yapabildiği değil, insan denetimi olmadan bunu ne kadar ucuza ve ne kadar güvenilir şekilde gerçekleştirebildiği olacak.

Sonnet 5, Opus 4.8’e yakın bir performans vaat ederken maliyetleri ciddi oranda düşürüyor. Salı gününden itibaren Claude Sonnet 5, ücretsiz ve Pro planların varsayılan modeli oldu ve tüm abonelik paketlerinde kullanılabiliyor.
Model, lansman dönemine özel olarak 31 Ağustos’a kadar bir milyon girdi tokenı başına 2 dolar, bir milyon çıktı tokenı başına ise 10 dolar olarak fiyatlandırılıyor. Bu tarihten sonra fiyatlar sırasıyla 3 dolar ve 15 dolara yükselecek. Fiyat politikası Sonnet 5’i, Opus 4.8’in yanı sıra OpenAI’ın GPT-5.5 ve Google’ın Gemini 3.1 Pro modellerinden daha ucuz hale getiriyor (Ancak Gemini 3.5 Flash modelinden hala daha pahalı).
Anthropic, yeni modelin akıl yürütme, araç kullanımı, yazılım kodlama ve bilgi odaklı görevler gibi ajan tabanlı performans alanlarında Şubat ayında çıkan selefi Sonnet 4.6’ya kıyasla çok daha yüksek bir performans gösterdiğini belirtiyor.
Örneğin bir performans testinde Sonnet 5, ajan tabanlı kodlamada %63,2 puan alırken, bu oran Opus 4.8 için %69,2 ve Sonnet 4.6 için %58,1 seviyesinde kalıyor. Bilgi odaklı görevleri ölçen bir benchmark’ta ise Sonnet 5; hassas kararlar alma ve derin araştırma gibi en zorlu problemleri çözmesiyle tanınan Opus 4.8’i az farkla da olsa geride bırakmayı başarıyor.
Anthropic şöyle diyor: “Opus 4.8, bu görevlerde daha yüksek doğruluk için hâlâ tercih edilen model, ancak Sonnet 5 geliştiricilere daha önce mevcut olan seçeneklerden çok daha yüksek kaliteli ve daha düşük fiyatlı alternatifler sunuyor. Kullanıcılar, Sonnet 5 ile Opus 4.8 arasında efor seviyesini değiştirerek maliyet ve performans dengesini kendileri ayarlayabilir.”
Blog yazısında görüşlerine yer verilen test kullanıcıları, Sonnet 5’in önceki sürümlerin yarıda bırakacağı karmaşık görevleri tamamlama konusunda mükemmel olduğunu ve “açıkça talep edilmeden kendi çıktısını kontrol ettiğini” vurguluyor.
Zapier kıdemli mühendisi Daniel Shepard yaptığı açıklamada şunları söyledi: “Claude Sonnet 5’e iki aşamalı bir görev verdik; Salesforce hesap kademelerini güncellemesini ve kurumsal kişilere lansman duyurusu göndermesini istedik. İşi uçtan uca eksiksiz tamamladı. Bu süreç eskiden yarı yolda tıkanırdı. Günlük otomasyon işleri için kesinlikle tartışmasız bir seçenek.”
Güvenlik başlığında ise Sonnet 5, kötüye kullanıma zemin hazırlama veya aldatma gibi “istenmeyen davranışlar” sergileme konusunda selefine kıyasla daha temiz bir sicile sahip. Bu da modeli ajan tabanlı bağlamlarda kullanmayı çok daha güvenli kılıyor. Model, kötü niyetli komutları reddetmede ve “prompt-injection” (komut yerleştirme) saldırılarını savuşturmada daha başarılı. Ayrıca Sonnet 4.6’ya kıyasla daha az halüsinasyon üretiyor ve kullanıcıyı gereğinden fazla onaylama eğilimini daha düşük oranda.
Tabii ki konu hizalamadan sapan davranışlar olduğunda henüz Opus 4.8 veya Claude Mythos Preview seviyesinde değil. Paylaşılan yazıda, “Değerlendirmeler, bu modelin tehlikeli siber güvenlik görevlerini gerçekleştirme yeteneğinin mevcut Opus modellerimize kıyasla çok daha düşük olduğunu gösteriyor.” ifadesi yer alıyor.
Lovable kurucu ortağı Fabian Hedin yaptığı açıklamada, Claude Sonnet 5’in “güvensiz istekleri net ve tutarlı bir biçimde reddettiğini” belirtti.
Kaynak: https://techcrunch.com/2026/06/30/anthropic-launches-claude-sonnet-5-as-a-cheaper-way-to-run-agents/
