xAI, yalnızca daha hızlı ya da daha akıllı olmakla kalmayan, oldukça kapsamlı bir güncelleme olan Grok 4.1’i kullanıma sundu. Yeni sürüm, tonu okuma, duygulara tepki verme ve genel olarak sohbetin diğer ucundaki kişiyi anlıyormuş gibi davranma konusunda gözle görülür şekilde daha iyi. Aynı zamanda, modelin karakterine hafif bir yaramazlık havası da katıldığı fark ediliyor.
Güncellenmesinden sadece saatler sonra, Grok 4.1, iki büyük yapay zeka sıralamasında da zirveye oturdu. LMArena’nın Metin Sıralaması’nda 1483 puanlık ön skor alarak, şu anda halka açık sohbet edilebilen tüm modellerin önüne geçti. Ayrıca, özellikle duygusal zekaya odaklanan ve Claude Sonnet 3.7 tarafından değerlendirilen bir kıyaslama olan EQ-Bench3’te de birinci sıraya yerleşti.

Güncellemenin en dikkat çekici yönleri, duygusal farkındalık ve yazım kalitesindeki artış oldu. Sohbetler önceye göre çok daha doğal hissediliyor; verilen yanıtlar artık sıradan bir sohbet robotu gibi değil, empati veya espri içeren küçük dokunuşlarla geliyor. Örneğin San Francisco’da yapılacak geziler için fikir ya da X (eski Twitter) platformunda paylaşılacak esprili bir gönderi istendiğinde, cevaplar sanki zeki bir arkadaştan geliyormuş gibi hissettiriyor. xAI, bu gelişmenin nedeni olarak, modelin tarz ve tonunu iyileştirmek üzere daha fazla sayıda uzman “YZ eğitmeni” ile çalışıldığını belirtiyor fakat güncelleme yalnızca artılarla gelmiyor. Grok 4.1’in model kartlarında, önceki sürüme kıyasla daha yüksek oranda dürüst olmayan yanıtlar ve manipülatif eğilimler sergilediği belirtiliyor. Ayriyeten, “Thinking” modundayken daha tartışmalı konulara girmeye istekli olduğu ve API aracılığıyla prompt-enjeksiyon saldırılarına karşı daha savunmasız olduğu görülüyor. Bu sorunlar büyük sürprizler değil; xAI, 4.1’i daha ifadeci ve daha az filtrelenmiş bir model olarak çerçeveliyor ancak yine de dikkat çekilmesi gereken noktalar olarak yer alıyor.

Güncelleme artık her yerde aktif durumda. Grok’u web üzerinden ya da X uygulamaları aracılığıyla kullanan herkes, model seçim ekranından Grok 4.1’e geçiş yaparak deneyebilir. Şu anda halka açık sıralamalarda zirvede yer alan model, ilk izlenimlere göre yalnızca zeki görünmek değil, kullanıcının ruh haline doğrudan hitap etmek istiyor.
Kaynak: https://gizmodo.com/they-updated-grok-its-very-eager-to-please-2000687274
