1. Anasayfa
  2. Öne Çıkanlar

Google, Karmaşık Problem Çözmede Daha İyi Olduğunu Söylediği Gemini 3.1 Pro Modelini Duyurdu

Google, Karmaşık Problem Çözmede Daha İyi Olduğunu Söylediği Gemini 3.1 Pro Modelini Duyurdu
0

Google son zamanlarda yeni YZ araçlarını ardı ardına piyasaya sürüyor; daha Kasım ayında Gemini 3 modelini yayınlamıştı. Bugün ise amiral gemisi modelini 3.1 sürümüne yükseltti. Geliştiriciler ve tüketiciler için bugün ön izleme aşamasında sunulan yeni Gemini 3.1 Pro, daha iyi problem çözme ve akıl yürütme yetenekleri vaat ediyor.

Google geçtiğimiz hafta Deep Think aracındaki iyileştirmeleri duyurmuştu ve görünüşe göre bu güncellemenin arkasındaki “asıl zeka” Gemini 3.1 Pro idi. Her zamanki gibi Google’ın son model duyurusu, çoğunlukla mütevazı iyileştirmeler gösteren bir dizi benchmark ile geldi. İleri düzey uzmanlık bilgisini ölçen popüler Humanity’s Last Exam testinde Gemini 3.1 Pro, %44,4 puan alarak rekor kırdı. Gemini 3 Pro %37,5, OpenAI üretimi GPT 5.2 ise %34,5 puan alabildi.

Google ayrıca modelin, yapay zeka modellerinin doğrudan eğitilemediği yeni mantık problemlerini içeren ARC-AGI-2 testindeki gelişimine dikkat çekiyor. Gemini 3, rakiplerinin %50 ve %60 bandındaki puanlarına karşılık %31,1 puan alarak bu değerlendirmede biraz geride kalmıştı. Gemini 3.1 Pro ise Google’ın skorunu iki katından fazla artırarak %77,1 gibi yüksek bir seviyeye ulaştırdı.

Google yeni model yayınladığında genellikle Arena (eski adıyla LM Arena) liderlik tablosunda zirveye yerleşmesiyle övünür ancak bu kez durum öyle değil. Metin kategorisinde Claude Opus 4.6, 1504 puanla yeni Gemini modelini dört puan geride bırakıyor. Kodlama alanında ise Opus 4.6, Opus 4.5 ve GPT 5.2 High modellerinin tamamı Gemini 3.1 Pro’nun biraz önünde yer alıyor. Yine de Arena liderlik tablosunun “vibes” (hissiyat) üzerinden işlediğini belirtmekte fayda var. Kullanıcılar en çok beğendikleri çıktılara oy veriyor; bu da doğru olup olmadığından bağımsız olarak doğru görünen çıktıların ödüllendirilmesine yol açabiliyor.

Google, Gemini 3.1 Pro’daki iyileştirmeleri kanıtlamak için modelin grafik ve simülasyon oluşturma becerisine odaklandı. Karşılaştırma videosunda gösterilen SVG örnekleri görsel olarak çok daha estetik ve başarılı duruyor fakat bunlar Google’ın sergilemek için seçtiği örnekler. 

Yüksek benchmark rakamları ve özenle seçilmiş demolar iyi hoş ama modeli kullanırken herhangi bir fark hissedecek misiniz? Eğer soyut sorular soruyor ve detaylı, incelikli cevaplar bekliyorsanız; Gemini 3.1 Pro muhtemelen 3.0 sürümünden daha iyi sonuçlar üretecektir. Otonom iş akışları oluşturmak için Gemini kullanan geliştiriciler muhtemelen bir iyileşme görecek çünkü Gemini 3.1 Pro, APEX-Agents testindeki puanını neredeyse iki katına çıkardı.

Güncellenen model AI Studio ve Antigravity IDE üzerinden ön izlemeye açıldı. Kurumsal kullanıcılar 3.1 Pro sürümünü Vertex AI ve Gemini Enterprise içinde görecek. Standart kullanıcılar için ise Gemini 3.1 Pro hem Gemini uygulaması hem de NotebookLM için erişime açıldı. Geliştiriciler için API maliyeti (1 milyon token başına 2 dolar giriş ve 12 dolar çıkış) ve bağlam penceresi (1 milyon giriş ve 64 bin çıkış tokenı) değişmedi. 

Eğer Google’ın alışılagelmiş düzeni sürerse, yakın gelecekte daha hızlı ve ucuz olan Flash modeli için de bir 3.1 güncellemesi gelecektir.

Kaynak: https://arstechnica.com/google/2026/02/google-announces-gemini-3-1-pro-says-its-better-at-complex-problem-solving/
Bu Yazıya Tepkiniz Ne Oldu?
  • 0
    be_endim
    Beğendim
  • 0
    alk_l_yorum
    Alkışlıyorum
  • 0
    e_lendim
    Eğlendim
  • 0
    d_nceliyim
    Düşünceliyim
  • 1
    _rendim
    İğrendim
  • 0
    sevdim
    Sevdim
  • 0
    _ok_k_zd_m
    Çok Kızdım

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir