OpenAI tarafından Codex CLI’ın açık kaynak süreci kapsamında Github’da paylaşılan bir belge, şirketin en yeni amiral gemisi kodlama ajanı GPT-5.5’in kodlama bağlamındaki sistem isteminin tamamını içeriyor gibi görünüyor. Bu belge, modelin hem doğal hem de doğaüstü tuhaf yaratıklardan bahsetmeye yönelik geçmişteki bağımlılığını düzeltiyor.
Metnin o kısmında şu ifadeler yer alıyor:
“Her şeyi ayrıntılı şekilde anlatmak yerine en yüksek sinyal değerine sahip bağlamı sun.\n- Nihai cevabının tonu kişiliğinle uyumlu olmalı.\n- Kullanıcının sorgusuyla açık ve doğrudan ilgili olmadığı sürece goblinler, gremlinler, rakunlar, troller, ogreler, güvercinler veya diğer hayvanlar ya da yaratıklar hakkında asla konuşma.”
Görünüşe göre bu nokta o kadar önemli ki geliştiriciler belge içinde biraz daha ileride aynı uyarıyı tekrar ediyor:
“Örneğin, \”<iyi bir şey yapacağım> yerine <bariz kötü bir şey yapmayacağım>\” veya \”<X yapacağım>, <Y yapmayacağım>\” gibi basmakalıp ifadeler kullanma.\n- Kullanıcının sorgusuyla açık ve doğrudan ilgili olmadığı sürece goblinler, gremlinler, rakunlar, troller, ogreler, güvercinler veya diğer hayvanlar ya da yaratıklar hakkında asla konuşma.”
Bu durumun neden bu kadar önemli olduğu henüz net değil. Eğer bunlar, istem enjeksiyonu saldırılarını izlemek için sistem istemine eklenen test noktası kelimeleri olsaydı, muhtemelen bütün bir hayvan kategorisi yerine daha rastgele seçilirdi.
Google çalışanı Barron Roth, GPT-5.5 tabanlı bazı Openclaw ajanlarıyla yaptığı sohbet kayıtlarında arama yaptığını ve en az bir ajanın aynı gün içinde kullanıcıya gönderdiği mesajlara birden fazla kez “goblin” kelimesini eklediğini gösteren bir paylaşım yaptı. Eğitimsiz bir göze göre GPT-5.5, bu kelimeyi bir nesneyi tanımlarken kullanılan “şey” ifadesi yerine kullanıyor gibi duruyor.
OpenAI’da Codex üzerinde çalışan Nick Pash, Roth’un sorunun doğasını doğru tahmin ettiğini doğrulayarak X üzerinden ona “Nedenlerden biri gerçekten de bu.” diye yazdı.
Diğer X kullanıcıları da Codex’in goblin muhabbetini biraz aşırıya kaçırdığını fark etti.
Salı günü bu goblin meselesi bir meme haline geldi ve kullanıcılar, bir tür “Goblin Modu”nun açılıp kapatılabileceğine dair paylaşımlar yaptı.
Pash, nihayetinde Goblin Modu hakkında kendi gönderisini paylaştı:
Eğer bu durum size bir yıl önceki OpenAI’ın Studio Ghibli memelerini hatırlatıyorsa yalnız değilsiniz. Bazıları, OpenAI’ın tüm bu goblin meselesini, şirketin içinden geçtiği sıkıntılı dönemde dikkat çekmek için yaptığını iddia etti ancak Pash’ın bir başka paylaşımına göre, bu durum kesinlikle bir pazarlama numarası değil.
Kaynak: https://gizmodo.com/never-talk-about-goblins-openais-instructions-to-codex-have-a-weirdly-emphatic-no-creatures-policy-2000751984
