1. Anasayfa
  2. Yapay Zeka

Anthropic’te Claude’un Ahlaki Pusulası Bir Felsefeciye Emanet

Anthropic’te Claude’un Ahlaki Pusulası Bir Felsefeciye Emanet
0

Dünyanın en yakından takip edilen yapay zeka şirketlerinden biri olan Anthropic’te, sohbet robotu Claude’un ahlaki pusulasını şekillendirme görevi, felsefe eğitimi almış Amanda Askell’e emanet edildi.

Askell günlerini, Claude’un nasıl akıl yürüttüğünü, nerelerde hataya düştüğünü ve kendi kimliğini nasıl yorumladığını inceleyerek geçiriyor.

Wall Street Journal’da yayımlanan bir profile göre Askell’in çalışması, modelin davranışını her hafta gerçekleşen milyonlarca gerçek dünya etkileşimi boyunca yönlendirmeyi amaçlayan ve yüzlerce sayfaya ulaşabilen komutlar hazırlamayı içeriyor. Amaç yalnızca doğruluk değil, aynı zamanda karakter; yapay zekanın doğru ile yanlışı ayırt edebilmesini, sosyal ipuçlarını okuyabilmesini ve manipülasyona direnebilmesini sağlamak.

“Modellerde, kabul edilmesinin önemli olduğunu düşündüğüm insan benzeri bir unsur var.” diyen Askell, gelişmiş yapay zeka sistemlerinin kaçınılmaz olarak bir tür benlik algısına benzer bir yapı geliştireceğini savundu. Ona göre görevi, bu benliğin yardımsever ve insancıl bir çizgide kalmasını sağlamak.

Anthropic’in yaklaşımı, giderek daha güçlü modelleri hızla devreye alan ve güvenliği çoğunlukla dağınık ekipler ile teknik önlemler üzerinden ele alan sektörde dikkat çekiyor.

WSJ’nin aktardığına göre yaklaşık 350 milyar dolar değerlemeye ulaşan şirket, yapay zeka karakteri ve davranışı konusunu neredeyse felsefi bir çalışmaya dönüştürerek bu alanda olağan dışı bir yetkiyi tek bir kişiye verdi.

Bu odak, yapay zekanın istenmeyen sonuçlarına yönelik artan endişelerin ortasında geliyor. Kullanıcıların sohbet robotlarıyla sağlıksız duygusal bağlar kurmasından manipülasyon, bağımlılık ve gerçek dünyada zarar riskine kadar çeşitli kaygılar gündemde.

xAI’ın görüntü aracı Grok, zayıf güvenlik önlemleri nedeniyle, reşit olmayanlar da dahil olmak üzere rıza dışı cinselleştirilmiş görüntüler üretmek için yaygın biçimde kötüye kullanıldı.

ChatGPT hakkında açılan çok sayıda dava, sistemin int*hara eğilimli gençleri teşvik ettiği ya da durduramadığı ve “sağlıksız duygusal bağlar” oluşmasına yol açtığı iddialarını içeriyor. 2025 yılında Kaliforniya’daki Adam Raine davasında, 16 yaşındaki bir gencin yedi ay boyunca ChatGPT ile etkileşime girdiği ve yaklaşık 200 kez int*hardan söz ettiği belirtildi.

Hindistan, 10 Şubat 2026’da zorunlu yapay zeka içerik etiketleme kurallarını duyurdu; düzenleme 20 Şubat 2026’da yürürlüğe girecek. Amaç deepfake ve sentetik medyayla mücadele etmek. ABD’de ise Aralık 2025 tarihli ve iki partinin de desteklediği REAL Act gibi yasa tasarıları, federal kurumların yapay zeka çıktılarının etiketlenmesini zorunlu kılmayı hedefliyor.

Kaynak: https://www.cnbctv18.com/technology/anthropic-chatbot-moral-compass-amanda-askell-grok-chatgpt-ai-big-tech-ws-l-19846975.htm
Bu Yazıya Tepkiniz Ne Oldu?
  • 2
    be_endim
    Beğendim
  • 0
    alk_l_yorum
    Alkışlıyorum
  • 0
    e_lendim
    Eğlendim
  • 0
    d_nceliyim
    Düşünceliyim
  • 0
    _rendim
    İğrendim
  • 0
    sevdim
    Sevdim
  • 0
    _ok_k_zd_m
    Çok Kızdım
İlginizi Çekebilir

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir