Anthropic’te Claude’un Ahlaki Pusulası Bir Felsefeciye Emanet

Nuvem tarafından

4 ay önce 162 kez okundu Okuma süresi: 2dk, 32sn

Anthropic’te Claude’un Ahlaki Pusulası Bir Felsefeciye Emanet

Dünyanın en yakından takip edilen yapay zeka şirketlerinden biri olan Anthropic’te, sohbet robotu Claude’un ahlaki pusulasını şekillendirme görevi, felsefe eğitimi almış Amanda Askell’e emanet edildi.

Askell günlerini, Claude’un nasıl akıl yürüttüğünü, nerelerde hataya düştüğünü ve kendi kimliğini nasıl yorumladığını inceleyerek geçiriyor.

Wall Street Journal’da yayımlanan bir profile göre Askell’in çalışması, modelin davranışını her hafta gerçekleşen milyonlarca gerçek dünya etkileşimi boyunca yönlendirmeyi amaçlayan ve yüzlerce sayfaya ulaşabilen komutlar hazırlamayı içeriyor. Amaç yalnızca doğruluk değil, aynı zamanda karakter; yapay zekanın doğru ile yanlışı ayırt edebilmesini, sosyal ipuçlarını okuyabilmesini ve manipülasyona direnebilmesini sağlamak.

“Modellerde, kabul edilmesinin önemli olduğunu düşündüğüm insan benzeri bir unsur var.” diyen Askell, gelişmiş yapay zeka sistemlerinin kaçınılmaz olarak bir tür benlik algısına benzer bir yapı geliştireceğini savundu. Ona göre görevi, bu benliğin yardımsever ve insancıl bir çizgide kalmasını sağlamak.

Anthropic’in yaklaşımı, giderek daha güçlü modelleri hızla devreye alan ve güvenliği çoğunlukla dağınık ekipler ile teknik önlemler üzerinden ele alan sektörde dikkat çekiyor.

WSJ’nin aktardığına göre yaklaşık 350 milyar dolar değerlemeye ulaşan şirket, yapay zeka karakteri ve davranışı konusunu neredeyse felsefi bir çalışmaya dönüştürerek bu alanda olağan dışı bir yetkiyi tek bir kişiye verdi.

Bu odak, yapay zekanın istenmeyen sonuçlarına yönelik artan endişelerin ortasında geliyor. Kullanıcıların sohbet robotlarıyla sağlıksız duygusal bağlar kurmasından manipülasyon, bağımlılık ve gerçek dünyada zarar riskine kadar çeşitli kaygılar gündemde.

xAI’ın görüntü aracı Grok, zayıf güvenlik önlemleri nedeniyle, reşit olmayanlar da dahil olmak üzere rıza dışı cinselleştirilmiş görüntüler üretmek için yaygın biçimde kötüye kullanıldı.

ChatGPT hakkında açılan çok sayıda dava, sistemin int*hara eğilimli gençleri teşvik ettiği ya da durduramadığı ve “sağlıksız duygusal bağlar” oluşmasına yol açtığı iddialarını içeriyor. 2025 yılında Kaliforniya’daki Adam Raine davasında, 16 yaşındaki bir gencin yedi ay boyunca ChatGPT ile etkileşime girdiği ve yaklaşık 200 kez int*hardan söz ettiği belirtildi.

Hindistan, 10 Şubat 2026’da zorunlu yapay zeka içerik etiketleme kurallarını duyurdu; düzenleme 20 Şubat 2026’da yürürlüğe girecek. Amaç deepfake ve sentetik medyayla mücadele etmek. ABD’de ise Aralık 2025 tarihli ve iki partinin de desteklediği REAL Act gibi yasa tasarıları, federal kurumların yapay zeka çıktılarının etiketlenmesini zorunlu kılmayı hedefliyor.

Kaynak: https://www.cnbctv18.com/technology/anthropic-chatbot-moral-compass-amanda-askell-grok-chatgpt-ai-big-tech-ws-l-19846975.htm

Post Views: 162

Bu Yazıya Tepkiniz Ne Oldu?

2

Beğendim
0

Alkışlıyorum
0

Eğlendim
0

Düşünceliyim
0

İğrendim
0

Sevdim
0

Çok Kızdım

Nuvem

Yazarın Profili

Anthropic’te Claude’un Ahlaki Pusulası Bir Felsefeciye Emanet

Yorum Yap İptal

iOS 27 ile Gelen Yeni Özellikler: İki iPhone’da Tek Numara, Bağımsız Alarm Sesi ve Daha Hızlı AirDrop

OpenAI, Halka Arz için Gizli Başvuru Yaptı: Değerleme 850 Milyar Doları Aşabilir

Instagram’da Büyük Güvenlik Açığı: 20.000’den Fazla Hesap Ele Geçirilmiş Olabilir

Google, İşlem Gücü için SpaceX’e Ayda 920 Milyon Dolar Ödeyecek

iPadOS 27, Birçok iPad Modeli için Desteği Kesiyor

Yapay Zeka Dedektörü, 1776 Tarihli ABD Bağımsızlık Bildirgesi’ni “Yapay Zeka Tarafından Yazılmış” Olarak Tanımladı

Instagram, Sürekli Reels İzleyenler için Otomatik Kaydırma Özelliğini Test Ediyor

Yapay Zekaya Güvenmeyi Bırak, Yönetim Kurulunu Kur

Seedance 2.0 Sonunda Geldi! – Nasıl Kullanılır?

Xiaomi, 2026 Yılında 19 Cihaz için Yazılım Güncellemelerini Durduruyor

Anthropic’te Claude’un Ahlaki Pusulası Bir Felsefeciye Emanet

Benzer Yazılar

Yorum Yap İptal