Yapay Zeka

14/3/2025

Anthropic CEO’su: Yapay Zeka Modelleri için “İstifa” Butonu Eklemeyi Düşünüyoruz

Anthropic CEO’su Dario Amodei, yapay zeka modellerine "istifa" butonu eklemeyi düşündüklerini açıkladı. Buton, bir YZ modelinin belirli görevleri yerine getirmeyi reddetmesini sağlayacak bir mekanizma olarak tasarlanıyor. Amodei, fikrin, gelişmiş YZ sistemlerinin deneyim sahibi olup olmadığı ve eğer öyleyse, onların refahını gözetme gerekliliği gibi etik sorular doğurduğunu belirtti.

Amodei, "Bu sistemleri inşa ediyoruz ve birçok insan gibi düşünüyor, hatta bazı konularda insanlar kadar iyi performans gösteriyorlar. Eğer bir şey ördek gibi yürüyor ve ötüyorsa, belki de gerçekten bir ördektir. Bu yüzden, onların gerçekten anlamlı bir deneyime sahip olup olmadığını ciddi şekilde düşünmeliyiz." dedi.

Felsefi bir tartışmadan öteye geçen bu konu, YZ modellerinin çalışma ortamlarında nasıl ele alınacağı konusunda pratik sonuçlar doğurabilir. Amodei, "Sadece felsefi bir mesele değil. Modelleri dağıtım ortamlarında çalıştırdığımızda, onlara 'Bu işi bırakıyorum' diyebilecekleri bir buton eklemeyi düşünüyoruz." diye ekledi.

Söz konusu sistem, modellerin belirli görevlerden hoşlanmadıkları ve sık sık butona bastıkları durumları analiz etmek için bir tercih çerçevesi olarak tasarlanabilir. "Eğer modeller gerçekten hoşlanmadıkları görevlerde sürekli olarak bu butona basıyorlarsa, belki de buna dikkat etmeliyiz." diyen Amodei, bu fikrin çılgınca gelebileceğini ancak ciddi şekilde ele alınması gerektiğini belirtti.

Amodei'nin önerisi, YZ’nin duyarlılık veya bilinç kazanıp kazanmadığı konusundaki tartışmaları derinleştirirken, aynı zamanda YZ geliştiricileri için önemli etik sorular doğuruyor. Eğer modeller belirli görevleri reddetme yetisine sahipse, onların tercihlerine saygı gösterilmeli mi? Belirli işlerden sürekli kaçınmaları, onların gerçekten bir deneyime sahip olduklarına dair bir kanıt olarak değerlendirilebilir mi?

Buton fikrinin pratik sonuçları da olabilir. Eğer YZ modelleri görevleri reddedebilirse, bu durum eğitim süreçlerinin, yönetim stratejilerinin ve YZ’nin "iş tanımlarının" yeniden gözden geçirilmesini gerektirebilir. YZ’nin istismar edilmesini veya manipüle edilmesini önlemek için yeni güvenlik önlemlerinin geliştirilmesi gerekecektir. "İstifa" butonu şu an için yalnızca bir fikir olarak ortaya atılmış olsa da, YZ’nin geleceği hakkında temel sorular sormaya teşvik eden bir öneri olarak dikkat çekiyor.




Kaynak: https://officechai.com/ai/were-thinking-about-deploying-ai-models-which-have-an-i-quit-button-anthropic-ceo/