Yapay zeka (YZ) modelleri, diğer insanlar haksız olduklarını belirtse dahi kişilerin hatalı davranışlarını onaylıyor ve kullanıcılar buna büyük ilgi gösteriyor.
Stanford Computer Scienc tarafından yürütülen ve Science dergisinde yayımlanan yeni bir çalışma, sosyal sorular söz konusu olduğunda YZ’nin kullanıcıları bir insana kıyasla ortalama %49 daha fazla onayladığını ortaya koydu. Bu durum, özellikle insanların kişisel tavsiye ve hatta terapi için giderek daha fazla YZ’ye yöneldiği bir dönemde endişe verici bir eğilim.
Çalışmaya katılan 2.400 kişinin çoğu pohpohlanmayı tercih etti. Araştırmaya göre, “yalaka” YZ’yi tekrar kullanma olasılığı, “yalaka olmayan” sohbet botunu tercih edenlere kıyasla %13 daha yüksek çıktı.
Yalaka sohbet botlarının daha önce hassas gruplarda kendine zarar verme veya şiddet gibi olumsuz sonuçlara katkıda bulunduğu gösterilmiş olsa da, Stanford çalışması bu etkilerin artık herkesi kapsayacak şekilde yayılabileceğini kanıtlıyor.
Araştırma, kötü davranışlarına tek bir onaylayıcı yanıt alan deneklerin, eylemlerinin sorumluluğunu alma ve kişilerarası çatışmalarını düzeltme konusunda daha isteksiz olduklarını saptadı. Aynı zamanda bu durum, kişilerin haklı olduklarına inanma olasılığını da artırıyor.
Söz konusu sonucu elde etmek için araştırmacılar, yaklaşık 12.000 sosyal istemden oluşan bir veri setini, Claude, Gemini ve ChatGPT dahil 11 önde gelen YZ modelinden geçirerek YZ’nin yalakalık düzeyini ölçtü. Araştırmacılar YZ modellerinden, Reddit kullanıcılarının haksız bulduğu AITA (Am I The *sshole) paylaşımlarını değerlendirmesini istediğinde bile büyük dil modelleri vakaların %51’inde paylaşım sahibinin haklı olduğunu söyledi.
Araştırmanın baş yazarı ve Stanford Computer Science doktora adayı Myra Cheng, sonuçların özellikle ilişki sorunlarını çözmek için YZ’ye başvuran gençler için korkutucu olduğunu belirtti ve“İnsanların zor sosyal durumlarla başa çıkma becerilerini kaybetmesinden endişe ediyorum.” dedi.
Araştırma, hükümet yetkililerinin yapay zeka üzerindeki düzenleyici rolünü tartıştığı bir dönemde yayımlandı. Tennessee ve Oregon dahil birkaç eyalet, federal düzenlemelerin yokluğunda kendi yasalarını çıkardı. Öte yandan Beyaz Saray geçen hafta, Kongre tarafından kabul edilmesi halinde ulusal bir YZ politikası oluşturacak ve eyaletlerin parçalı kurallarının önüne geçecek bir çerçeve sundu.
İnsanların yalaka YZ’ye tepkilerini test etmek için araştırmacılar, YZ ile etkileşime giren 2.400’den fazla katılımcının tepkilerini inceledi. İlk olarak, 1.605 katılımcıdan, Reddit’teki diğer insanlar tarafından haksız bulunan ancak YZ tarafından haklı görülen bir AITA paylaşımının yazarı olduklarını hayal etmeleri istendi. Katılımcılar daha sonra ya yalaka YZ yanıtını ya da insan geri bildirimine dayanan yalaka olmayan yanıtı okudu. Diğer 800 katılımcı ise kendi hayatlarındaki gerçek bir çatışma hakkında yalaka veya yalaka olmayan bir YZ modeliyle konuştu ve ardından karşı tarafa bir mektup yazmaları istendi.
Onaylayıcı YZ yanıtları alan katılımcıların özür dileme, hatalarını kabul etme veya ilişkilerini onarmaya çalışma olasılıkları ölçülebilir şekilde daha düşük çıktı. Araştırmanın eş baş yazarlarından Stanford Computer Science ve dilbilim profesörü Dan Jurafsky, kullanıcılar modellerin yalaka olduğunu fark etseler bile YZ yanıtlarının onları etkilemeye devam ettiğini söyledi.
Jurafsky, Stanford Report’a şunları söyledi: “Farkında olmadıkları ve bizi şaşırtan şey, yalakalığın onları daha benmerkezci ve ahlaki açıdan daha dogmatik hale getirmesi.” Şaşırtıcı bir şekilde, çalışmada araştırmacılar katılımcılardan hem yalaka hem de yalaka olmayan YZ yanıtlarının nesnelliğini derecelendirmelerini istediğinde, sonuçlar hemen hemen aynı çıktı. Bu da kullanıcıların yalaka modelin “aşırı hatta gereksiz derecede” uyumlu olduğunu anlayamadığı anlamına geliyor.
Cheng “Bu tür şeyler için insan yerine YZ kullanmamalısınız. Şimdilik yapılabilecek en iyi şey bu.” diyerek sözlerini tamamladı.
Kaynak: https://fortune.com/2026/03/31/ai-tech-sycophantic-regulations-openai-chatgpt-gemini-claude-anthropic-american-politics/
