Anthropic, Perşembe günü son YZ modeli Claude Opus 4.7’yi piyasaya sürdüğünü duyurdu. Şirket bu yeni sürümü, Opus 4.6’ya kıyasla “kayda değer bir gelişme” olarak tanımlıyor ancak henüz yayınlanamayacak kadar tehlikeli görülen Opus Mythos Preview’dan “daha az kapsamlı” olduğunu belirtiyor.
Claude Opus 4.7, Anthropic modellerinin halihazırda güçlü olduğu alanlardaki kabiliyetlerini pekiştiriyor. Şirkete göre, amiral gemisi seçeneğinin bu son versiyonu kodlama, mühendislik ve çok aşamalı görevlerde önemli performans artışlarıyla geliyor. Zorlu işlerde daha kapsamlı ve tutarlı olduğu iddia edilen model, profesyonel bilgi gerektiren çalışmalarda daha iyi sonuçlar veriyor.
Her yeni model sürümünde olduğu gibi, bu sürüm de yeteneklerini kanıtlamak için yeni benchmark testleri sunuldu. Claude Opus 4.7, karmaşık mühendislik görevlerini yerine getirme becerisini ölçen SWE-bench Pro ve SWE-bench Verified testlerinde %64,3 puan alarak, halka açık modeller arasında ajan tabanlı kodlama (agentic coding) alanında yeniden zirveye yerleşti. Model ayrıca, bir işletim sisteminde görevleri tamamlamak için otonom şekilde gezinmek anlamına gelen ajan tabanlı bilgisayar kullanımı (agentic computer use) ve lisansüstü düzeyde akıl yürütme gibi kategorilerde 4.6 sürümünün standartlarını geliştirdi.

İlginç bir şekilde Claude Opus 4.7, siber güvenlik açığı üretme konusunda Claude Opus 4.6’ya kıyasla bir miktar gerileme gösterdi. Yeni model testlerde %73,1 puan alırken, önceki sürüm %73,8 puan elde etmişti. Anthropic, yeni modelin yasaklanmış veya yüksek riskli siber güvenlik kullanımlarını otomatik olarak tespit edip engelleyen güvenlik önlemleri içerdiğini, performansın bu nedenle biraz düşmüş olabileceğini ifade etti.
Claude Opus 4.7’nin yayınlanma şekli, aslında şirketin sadece belirli kuruluşları davet ettiği çok güçlü modeli Claude Mythos Preview için bir tanıtım niteliği taşıyor. Kıyaslama testleri, Mythos’un dahil olduğu hemen her testte diğer tüm büyük modelleri geride bıraktığını gösteriyor. Anthropic, son sürümünü anlatırken bile her şeyi onunla kıyaslamaktan geri duramıyor.
Şirket, model güncellemesi için paylaştığı blog yazısında şu ifadelere yer verdi: “Claude Mythos Preview’un sürümünü sınırlı tutacağımızı ve yeni siber güvenlik önlemlerini önce daha düşük kapasiteli modellerde test edeceğimizi belirtmiştik. Opus 4.7 bu türdeki ilk model: siber yetenekleri Mythos Preview kadar gelişmiş değil.” Şirket başka bir noktada ise Opus 4.7’yi, “en güçlü modelimiz Claude Mythos Preview’dan daha az geniş kapsamlı” olarak nitelendiriyor.
Anthropic tarafından yapılan açıklamaya göre Claude Opus 4.7, tüm Claude ürünlerinde ve şirketin API’sı üzerinden erişime açıldı. Üstelik önceki modellerle kıyaslandığında fiyatta bir değişiklik yapılmadı. Dolayısıyla, Anthropic’in asıl öne çıkarmak istediği modelin daha sınırlı bir versiyonunu denemek isteyenler için Opus 4.7 şu anda kullanıma açık.
Kaynak: https://gizmodo.com/anthropic-releases-claude-opus-4-7-to-remind-everyone-how-great-mythos-is-2000747469
