En Son Haberler
Friday, December 20, 2024
Google, yeni bir “akıl yürütme” yapay zeka modeli olarak adlandırdığı modeli yayınladı - ancak bu model henüz test aşamasında.
Gemini 2.0 Flash Thinking Experimental olarak adlandırılan yeni model, Google'ın AI prototipleme platformu AI Studio'da mevcut. Bir model kartı bu modeli “çok modlu anlama, akıl yürütme ve kodlama için en iyisi” olarak tanımlıyor ve programlama, matematik ve fizik gibi alanlarda “en karmaşık problemler üzerinde akıl yürütme” yeteneğine sahip olduğunu belirtiyor.
Yapay Zeka Stüdyosu'nun ürün yöneticisi Logan Kilpatrick, X'te yayınlanan bir yazısında Gemini 2.0 Flash Thinking Experimental'ı “[Google'ın] akıl yürütme yolculuğunun ilk adımı” olarak nitelendirdi. Google'ın yapay zeka araştırma bölümü Google DeepMind'ın baş bilim adamı Jeff Dean de kendi paylaşımında Gemini 2.0 Flash Thinking Experimental'ın “muhakemesini güçlendirmek için düşünceleri kullanmak üzere eğitildiğini” söyledi.
Dean, bir soruyu değerlendirirken modeli “çalıştırmak” için kullanılan hesaplama miktarına atıfta bulunarak, “Çıkarım süresi hesaplamasını artırdığımızda umut verici sonuçlar görüyoruz” dedi.
Google'ın kısa süre önce duyurduğu Gemini 2.0 Flash modeli üzerine inşa edilen Gemini 2.0 Flash Thinking Experimental, tasarım olarak OpenAI'ın o1 ve diğer sözde muhakeme modellerine benziyor. Çoğu yapay zekanın aksine, muhakeme modelleri kendilerini etkin bir şekilde kontrol eder, bu da normalde yapay zeka modellerini tuzağa düşüren bazı tuzaklardan kaçınmalarına yardımcı olur.
Bir dezavantaj olarak, muhakeme modellerinin çözümlere ulaşması genellikle daha uzun sürer - genellikle saniyeler ila dakikalar daha uzun.
Bir istem verildiğinde, Gemini 2.0 Flash Thinking Experimental yanıt vermeden önce duraklar, bir dizi ilgili istemi değerlendirir ve yol boyunca muhakemesini “açıklar”. Bir süre sonra model, en doğru cevap olarak gördüğü şeyi özetler.
o1'in piyasaya sürülmesinin ardından, sadece Google değil, rakip yapay zeka laboratuvarlarından da akıl yürütme modellerinde bir patlama yaşandı. Kasım ayı başlarında, quant trader'lar tarafından finanse edilen bir yapay zeka araştırma şirketi olan DeepSeek, ilk muhakeme modeli olan DeepSeek-R1'in ön izlemesini başlattı. Aynı ay, Alibaba'nın Qwen ekibi, o1'e ilk “açık” rakip olduğunu iddia ettiği modeli tanıttı.
Bloomberg Ekim ayında Google'ın muhakeme modelleri geliştiren birkaç ekibi olduğunu bildirdi. Kasım ayında The Information tarafından yapılan müteakip haber, şirketin bu teknolojiye odaklanan en az 200 araştırmacısı olduğunu ortaya koydu.
Herkes muhakeme modellerinin ileriye dönük en iyi yol olduğuna ikna olmuş değil. Öncelikle, onları çalıştırmak için gereken büyük miktarda bilgi işlem gücü sayesinde pahalı olma eğilimindedirler. Ve şimdiye kadar kıyaslamalarda iyi performans göstermiş olsalar da, muhakeme modellerinin bu ilerleme hızını koruyup koruyamayacağı net değil.