Claude Opus 4.7 Yayınlandı: Mythos’un Daha Sınırlı Versiyonu

Nuvem tarafından

3 ay önce 467 kez okundu Okuma süresi: 2dk, 37sn

Claude Opus 4.7 Yayınlandı: Mythos’un Daha Sınırlı Versiyonu

Anthropic, Perşembe günü son YZ modeli Claude Opus 4.7’yi piyasaya sürdüğünü duyurdu. Şirket bu yeni sürümü, Opus 4.6’ya kıyasla “kayda değer bir gelişme” olarak tanımlıyor ancak henüz yayınlanamayacak kadar tehlikeli görülen Opus Mythos Preview’dan “daha az kapsamlı” olduğunu belirtiyor.

Claude Opus 4.7, Anthropic modellerinin halihazırda güçlü olduğu alanlardaki kabiliyetlerini pekiştiriyor. Şirkete göre, amiral gemisi seçeneğinin bu son versiyonu kodlama, mühendislik ve çok aşamalı görevlerde önemli performans artışlarıyla geliyor. Zorlu işlerde daha kapsamlı ve tutarlı olduğu iddia edilen model, profesyonel bilgi gerektiren çalışmalarda daha iyi sonuçlar veriyor.

Her yeni model sürümünde olduğu gibi, bu sürüm de yeteneklerini kanıtlamak için yeni benchmark testleri sunuldu. Claude Opus 4.7, karmaşık mühendislik görevlerini yerine getirme becerisini ölçen SWE-bench Pro ve SWE-bench Verified testlerinde %64,3 puan alarak, halka açık modeller arasında ajan tabanlı kodlama (agentic coding) alanında yeniden zirveye yerleşti. Model ayrıca, bir işletim sisteminde görevleri tamamlamak için otonom şekilde gezinmek anlamına gelen ajan tabanlı bilgisayar kullanımı (agentic computer use) ve lisansüstü düzeyde akıl yürütme gibi kategorilerde 4.6 sürümünün standartlarını geliştirdi.

İlginç bir şekilde Claude Opus 4.7, siber güvenlik açığı üretme konusunda Claude Opus 4.6’ya kıyasla bir miktar gerileme gösterdi. Yeni model testlerde %73,1 puan alırken, önceki sürüm %73,8 puan elde etmişti. Anthropic, yeni modelin yasaklanmış veya yüksek riskli siber güvenlik kullanımlarını otomatik olarak tespit edip engelleyen güvenlik önlemleri içerdiğini, performansın bu nedenle biraz düşmüş olabileceğini ifade etti.

Claude Opus 4.7’nin yayınlanma şekli, aslında şirketin sadece belirli kuruluşları davet ettiği çok güçlü modeli Claude Mythos Preview için bir tanıtım niteliği taşıyor. Kıyaslama testleri, Mythos’un dahil olduğu hemen her testte diğer tüm büyük modelleri geride bıraktığını gösteriyor. Anthropic, son sürümünü anlatırken bile her şeyi onunla kıyaslamaktan geri duramıyor.

Şirket, model güncellemesi için paylaştığı blog yazısında şu ifadelere yer verdi: “Claude Mythos Preview’un sürümünü sınırlı tutacağımızı ve yeni siber güvenlik önlemlerini önce daha düşük kapasiteli modellerde test edeceğimizi belirtmiştik. Opus 4.7 bu türdeki ilk model: siber yetenekleri Mythos Preview kadar gelişmiş değil.” Şirket başka bir noktada ise Opus 4.7’yi, “en güçlü modelimiz Claude Mythos Preview’dan daha az geniş kapsamlı” olarak nitelendiriyor.

Anthropic tarafından yapılan açıklamaya göre Claude Opus 4.7, tüm Claude ürünlerinde ve şirketin API’sı üzerinden erişime açıldı. Üstelik önceki modellerle kıyaslandığında fiyatta bir değişiklik yapılmadı. Dolayısıyla, Anthropic’in asıl öne çıkarmak istediği modelin daha sınırlı bir versiyonunu denemek isteyenler için Opus 4.7 şu anda kullanıma açık.

Kaynak: https://gizmodo.com/anthropic-releases-claude-opus-4-7-to-remind-everyone-how-great-mythos-is-2000747469

Post Views: 467

Bu Yazıya Tepkiniz Ne Oldu?

1

Beğendim
0

Alkışlıyorum
0

Eğlendim
0

Düşünceliyim
0

İğrendim
0

Sevdim
0

Çok Kızdım

Nuvem

Yazarın Profili

Claude Opus 4.7 Yayınlandı: Mythos’un Daha Sınırlı Versiyonu

Yorum Yap İptal

Recursive Superintelligence, Amazon ile 410 Milyon Dolarlık İşlem Gücü Anlaşması İmzaladı

50 Milyon Dolarlık Hipersonik Tesis Erken Tamamlandı: ABD Mach 5+ Yarışında Gaza Bastı

Dünyanın İlk “Yapay Zeka Yargıcı” Geliyor: Abu Dabi Yargıda Yeni Bir Dönem Başlatıyor

Yapay Zeka Şurupla Çöp Kutusunu Karıştırınca Fişi Çekildi: Starbucks’ın 9 Aylık Deneyi Çöktü

Donald Trump Yönetimi Çin’den İnsansı Robot İthalatını Yasakladı

Yapay Zeka Dedektörü, 1776 Tarihli ABD Bağımsızlık Bildirgesi’ni “Yapay Zeka Tarafından Yazılmış” Olarak Tanımladı

Grok’ta Cinselleştirilmiş İçerikler Nedeniyle Görsel Oluşturma Kısıtlandı

Yerli Yapay Zeka Kumru, Hatalı Cevaplarıyla Sosyal Medyada Gündem Oldu

Instagram, Sürekli Reels İzleyenler için Otomatik Kaydırma Özelliğini Test Ediyor

Yapay Zekaya Güvenmeyi Bırak, Yönetim Kurulunu Kur

Claude Opus 4.7 Yayınlandı: Mythos’un Daha Sınırlı Versiyonu

Benzer Yazılar

Yorum Yap İptal