En Son Haberler
Monday, November 25, 2024
Anthropic, istemleri iyileştirmek için bir özellik ekleyerek ve örnek yanıtların Anthropic Console içinde yönetilmesine izin vererek geliştiricilerin istem mühendisliğinin en iyi uygulamalarından yararlanmasını kolaylaştırıyor.
Anthropic'e göre, istem kalitesi önemli olmakla birlikte, en iyi uygulamaları uygulamak zaman alıcı olabilir ve bu en iyi uygulamalar farklı model sağlayıcıları arasında da farklılık gösterebilir. Bu yeni istem geliştirici özelliği ile Anthropic, geliştiricilere mevcut istemleri (yeni olanlar veya diğer modeller için yazılmış önceki istemler) alma ve Claude kullanarak bunları iyileştirme olanağı veriyor.
Bilgi istemi geliştirici, Claude'un yanıt vermeden önce bilgi istemleri üzerinde sistematik olarak düşünebileceği özel bir bölüm ekleyen düşünce zinciri muhakemesi; örneklerin genel tutarlılık için XML biçimine dönüştürüldüğü örnek standartlaştırma; mevcut örneklerin düşünce zinciri muhakemesi kullanılarak artırıldığı örnek zenginleştirme; dilbilgisi sorunlarını düzeltmek için bilgi istemlerinin yeniden yazılması ve Claude'un eylemlerini yönlendirmek ve belirli bir çıktı biçimini zorunlu kılmak için Asistan mesajının önceden doldurulduğu ön doldurma ekleme gibi bilgi istemlerini geliştirmek için çeşitli yöntemler kullanır.
Claude yeni komut istemini oluşturduktan sonra kullanıcı da özellikle neyin işe yarayıp yaramadığı konusunda geri bildirimde bulunabiliyor ve bu da komut istemini daha da geliştiriyor.
Anthropic'in ilk testleri, istem geliştiricinin çok etiketli bir sınıflandırma görevinde doğruluğu %30 artırdığını ve bir özetleme görevinde kelime sayısına bağlılığı %100'e çıkardığını göstermiştir.
Buna ek olarak, geliştiriciler artık Workbench'te çıktı örneklerini yönetebiliyor, bu da yanıt kalitesinin iyileştirilebilmesinin bir başka yolu. Anthropic bir yazısında, “Bu sayede net girdi/çıktı çiftlerine sahip yeni örnekler eklemek ya da yanıt kalitesini iyileştirmek için mevcut örnekleri düzenlemek daha kolay hale geliyor” dedi.
Geliştiriciler, geliştirilmiş istemlerin farklı senaryolar altında nasıl performans gösterdiğini belirlemek için istem değerlendiricisini de kullanabilirler. Şirket şimdi, geliştiricilerin çıktıları 5 puanlık bir ölçekte değerlendirmelerine yardımcı olmak için Değerlendirmeler sekmelerine bir “ideal çıktı” sütunu ekledi.
Anthropic, “Bu özellikler, bilgi istemi mühendisliğinin en iyi uygulamalarından yararlanmayı ve daha güvenilir yapay zeka uygulamaları oluşturmayı kolaylaştırıyor” diye yazdı.