Yapay Zeka Uygulamaları
25/2/2025
Anthropic, Claude 3.7 Sonnet adını verdiği yeni nesil bir yapay zeka modelini piyasaya sürdü. Bu modelin en dikkat çekici özelliği, kullanıcıların sorularına verilen cevabın ne kadar süre "düşünüleceğini" seçebilmelerine olanak tanıması.
Anthropic, Claude 3.7 Sonnet'i endüstrideki ilk "hibrid YZ mantık yürütme modeli" olarak tanımlıyor. Tek bir model hem anlık cevaplar verebilir hem de daha ayrıntılı ve "düşünülmüş" yanıtlar sunabilir. Kullanıcılar, Claude 3.7 Sonnet'in "mantık yürütme" yeteneğini etkinleştirerek yapay zekanın daha kısa veya daha uzun süre düşünmesini sağlayabilir.
Model, Anthropic'in yapay zeka ürünlerinin kullanıcı deneyimini basitleştirme çabasının bir parçasını oluşturuyor. Bugün pek çok yapay zeka sohbet botu, kullanıcıları farklı maliyet ve yeteneklere sahip modeller arasından bir seçim yapmaya zorluyor. Anthropic ise bu süreci ortadan kaldırmayı amaçlıyor: Tek bir model, bütün ihtiyaçları karşılayabilmeli.
Claude 3.7 Sonnet, Anthropic tarafından yapılan açıklamaya göre pazartesi günü tüm kullanıcılar ve geliştiriciler için kullanıma sunulacak ancak yalnızca Anthropic'in üretken yapay zeka sohbet botunun ücretli aboneleri modelin "mantık yürütme" özelliğini kullanabilecek. Öte yandan, ücretsiz Claude kullanıcıları, Claude 3.5 Sonnet'e göre daha gelişmiş olduğu iddia edilen ancak mantık yürütme yeteneği devre dışı bırakılmış versiyonunu kullanacak. (Anthropic, sürüm numaraları arasında 3.6'yı atlamaya karar verdi.)
Claude 3.7 Sonnet'in maliyeti 1 milyon girdi belirteci için 3 dolar, 1 milyon çıktı belirteci için ise 15 dolar olarak belirlendi. Bu fiyat, OpenAI'nin o3-mini modelinden (1 milyon girdi belirteci için 1.10 dolar, 1 milyon çıktı belirteci için 4.40 dolar) ve DeepSeek'in R1 modelinden (1 milyon girdi belirteci için 0.55 dolar, 1 milyon çıktı belirteci için 2.19 dolar) daha yüksek fakat o3-mini ve R1 modellerinin yalnızca mantık yürütme odaklı çalıştığını ve Claude 3.7 Sonnet gibi hibrit bir model olmadığını belirtmek gerekiyor.
Mantık yürütme, YZ laboratuvarlarının geleneksel performans artırma yöntemlerinin sınırlarına ulaşmasıyla öne çıkan bir teknik oldu. Google'ın Gemini 2.0 Flash Thinking modeli, xAI'nın Grok 3 (Think) modeli ve OpenAI'nin o3-mini modeli gibi yapay zekalar, cevap vermeden önce daha uzun süre düşünüp hesaplama gücünü daha verimli kullanarak daha doğru yanıtlar sunabiliyor. Bu sistemler, insan mantığı gibi gerçek anlamda "düşünmese" de düşünme sürecini adım adım geliştirerek yanıtların doğruluğunu artırıyor.
Anthropic'in ürün ve araştırma lideri Dianne Penn, TechCrunch'a verdiği röportajda, "Claude'un bir süre sonra kullanıcıdan giriş almadan, ne kadar düşünmesi gerektiğini kendisinin belirleyebilmesini istiyoruz." dedi.
Anthropic, Claude 3.7 Sonnet'in düşünme sürecini bir "görünür çizim defteri" (visible scratch pad) üzerinden kullanıcılara göstereceğini belirtiyor. Penn'e göre, çoğu girdi için Claude'un düşünme sürecinin tamamı görüntülenebilecek ancak bazı kısımlar güvenlik ve etik nedenlerle sansürlenebilir.
Claude 3.7 Sonnet, gerçek dünya problemlerine odaklanarak geliştirildi. Bu model, zorlayıcı kodlama sorunları veya ajan tabanlı görevler gibi çeşitli alanlarda performans gösterebilecek. Geliştiriciler, API aracılığıyla Claude'un düşünme sürecini kontrol edebilir ve doğruluk ile maliyet arasındaki dengeyi ayarlayabilir.
Bunun yanı sıra, Anthropic, Claude Code adında yeni bir aracı da duyurdu. Söz konusu araç, geliştiricilerin Claude ile doğrudan terminal üzerinden çalışmasını sağlıyor. Kullanıcılar, "Bu projenin yapısını açıkla" gibi basit komutlarla kodları analiz edebilir, değişiklik yapabilir ve hata ayıklayabilir.
Anthropic, Claude 3.7 Sonnet ile yapay zeka yarışında liderliği ele geçirmek istiyor fakat OpenAI'nin de benzer bir hibrit YZ modelini yakın zamanda piyasaya süreceği söyleniyor. Sam Altman, bu modelin "birkaç ay içinde" çıkacağını açıkladı.
Kaynak: https://techcrunch.com/2025/02/24/anthropic-launches-a-new-ai-model-that-thinks-as-long-as-you-want/