Birleşik Krallık’taki AI Security Institute, Anthropic bünyesindeki Claude Mythos Preview sürümünü, iddia edilen ileri düzey siber güvenlik yeteneklerini ölçmek için değerlendirdi. Enstitü, YZ modelinin karmaşık siber saldırıları eşi görülmemiş başarı oranlarıyla otonom şekilde gerçekleştirebildiğini saptadı.
Claude Mythos’un varlığı, ilk olarak Mart ayının sonlarında bir web sitesi sızıntısıyla ortaya çıktı. Anthropic, bu güçlü yeni nesil modelin siber güvenlik açıklarını bulma ve kullanma konusunda daha önce hiçbir YZ modelinde görülmemiş bir seviyeye ulaştığını açıkladı. Modelin, mevcut web tarayıcılarında ve işletim sistemlerinde ciddi güvenlik açıkları bulduğu iddia ediliyor.
Anthropic, modeli halka açmak yerine, düzinelerce güvenlik araştırma firmasına kısıtlı erişim imkanı sağladı. Geçtiğimiz hafta, ABD Hazine Bakanı Scott Bessent ve Federal Rezerv Başkanı Jerome Powell’ın, banka yöneticilerini Claude Mythos’un oluşturduğu güvenlik tehdidi konusunda uyardığı bildirildi.
AI Security Institute tarafından Pazartesi günü açıklanan test sonuçları, oluşturulan beklentinin arkasında gerçek bir güç olduğunu gösteriyor. Değerlendirmeye göre Mythos Preview, uzman düzeyindeki capture-the-flag (bayrağı yakala, CTF) görevlerinde %73 oranında başarı sağladı; bu görevlerin Nisan 2025’ten önce hiçbir model tarafından tamamlanamadığı belirtiliyor.
Söz konusu tehdit oldukça kapsamlı olabilir ancak teknoloji, açıkları sadece suistimal etmek için değil, onları bulup düzeltmek için de kullanılabilir. Kripto altyapı operatörleri için bu gelişmiş yetenekler, ağ zafiyetlerini bağımsızca araştırıp kullanabilmesi nedeniyle yeni bir güvenlik tehdidi kategorisini temsil ediyor.
Mythos Preview, “The Last Ones” (TLO) simülasyonunu tamamlayan ilk YZ modeli oldu. Enstitüye göre, insanların bitirmesi normalde 20 saat süren bu 32 adımlı kurumsal ağ saldırısı simülasyonunda model, 10 denemenin üçünde başarıya ulaştı ve tüm denemelerde ortalama 22 adımı tamamladı.
İlk keşif aşamasından ağın tamamen ele geçirilmesine kadar uzanan simülasyon, gerçek dünya saldırılarını taklit ediyor. Bir sonraki en iyi performansı sergileyen model olan Claude Opus 4.6, ortalama 16 adımda kaldı. Birleşik Krallık merkezli enstitü, Mythos Preview’un performansının artan bilgi işlem kaynaklarıyla ölçeklenmeye devam ettiğini ve her değerlendirme çalışmasında 100 milyon token kullandığını kaydetti.
Kontrollü testlerde, modele açıkça yönlendirme verilip ağ erişimi sağlandığında, insan rehberliği olmadan çok aşamalı saldırılar gerçekleştirebildiği ve güvenlik açıklarını tespit edebildiği görüldü.
Bu gelişme, modellerin temel siber güvenlik egzersizlerinde bile zorlandığı sadece iki yıl öncesine kıyasla çarpıcı bir tırmanış. 2023’ten bu yana bu yetenekleri izleyen AI Safety Institute, sistemlerin başlangıç seviyesinden uzman düzeyde otonom saldırılara hızlı geçişini belgeledi.
Kripto ekosistemi açısından bakıldığında, akıllı sözleşme açıkları ve borsa saldırılarının zaten her yıl milyarlarca dolarlık kayba yol açtığı bir ortamda, yapay zeka destekli saldırılar mevcut riskleri artırabilir. Karmaşık ve birbirine bağlı sistemlere dayanan DeFi (merkeziyetsiz finans) protokolleri, birden fazla vektörü aynı anda analiz edip saldırabilen bu otomatik girişimlere karşı özellikle savunmasız kalabilir.
Kaynak: https://decrypt.co/364141/anthropic-claude-mythos-serious-threat-overhyped-ai-security-institute
