Google, Karmaşık Problem Çözmede Daha İyi Olduğunu Söylediği Gemini 3.1 Pro Modelini Duyurdu

Nuvem tarafından

3 saat önce 15 kez okundu Okuma süresi: 2dk, 49sn

Google, Karmaşık Problem Çözmede Daha İyi Olduğunu Söylediği Gemini 3.1 Pro Modelini Duyurdu

Google son zamanlarda yeni YZ araçlarını ardı ardına piyasaya sürüyor; daha Kasım ayında Gemini 3 modelini yayınlamıştı. Bugün ise amiral gemisi modelini 3.1 sürümüne yükseltti. Geliştiriciler ve tüketiciler için bugün ön izleme aşamasında sunulan yeni Gemini 3.1 Pro, daha iyi problem çözme ve akıl yürütme yetenekleri vaat ediyor.

Google geçtiğimiz hafta Deep Think aracındaki iyileştirmeleri duyurmuştu ve görünüşe göre bu güncellemenin arkasındaki “asıl zeka” Gemini 3.1 Pro idi. Her zamanki gibi Google’ın son model duyurusu, çoğunlukla mütevazı iyileştirmeler gösteren bir dizi benchmark ile geldi. İleri düzey uzmanlık bilgisini ölçen popüler Humanity’s Last Exam testinde Gemini 3.1 Pro, %44,4 puan alarak rekor kırdı. Gemini 3 Pro %37,5, OpenAI üretimi GPT 5.2 ise %34,5 puan alabildi.

Google ayrıca modelin, yapay zeka modellerinin doğrudan eğitilemediği yeni mantık problemlerini içeren ARC-AGI-2 testindeki gelişimine dikkat çekiyor. Gemini 3, rakiplerinin %50 ve %60 bandındaki puanlarına karşılık %31,1 puan alarak bu değerlendirmede biraz geride kalmıştı. Gemini 3.1 Pro ise Google’ın skorunu iki katından fazla artırarak %77,1 gibi yüksek bir seviyeye ulaştırdı.

Google yeni model yayınladığında genellikle Arena (eski adıyla LM Arena) liderlik tablosunda zirveye yerleşmesiyle övünür ancak bu kez durum öyle değil. Metin kategorisinde Claude Opus 4.6, 1504 puanla yeni Gemini modelini dört puan geride bırakıyor. Kodlama alanında ise Opus 4.6, Opus 4.5 ve GPT 5.2 High modellerinin tamamı Gemini 3.1 Pro’nun biraz önünde yer alıyor. Yine de Arena liderlik tablosunun “vibes” (hissiyat) üzerinden işlediğini belirtmekte fayda var. Kullanıcılar en çok beğendikleri çıktılara oy veriyor; bu da doğru olup olmadığından bağımsız olarak doğru görünen çıktıların ödüllendirilmesine yol açabiliyor.

Google, Gemini 3.1 Pro’daki iyileştirmeleri kanıtlamak için modelin grafik ve simülasyon oluşturma becerisine odaklandı. Karşılaştırma videosunda gösterilen SVG örnekleri görsel olarak çok daha estetik ve başarılı duruyor fakat bunlar Google’ın sergilemek için seçtiği örnekler.

Yüksek benchmark rakamları ve özenle seçilmiş demolar iyi hoş ama modeli kullanırken herhangi bir fark hissedecek misiniz? Eğer soyut sorular soruyor ve detaylı, incelikli cevaplar bekliyorsanız; Gemini 3.1 Pro muhtemelen 3.0 sürümünden daha iyi sonuçlar üretecektir. Otonom iş akışları oluşturmak için Gemini kullanan geliştiriciler muhtemelen bir iyileşme görecek çünkü Gemini 3.1 Pro, APEX-Agents testindeki puanını neredeyse iki katına çıkardı.

Güncellenen model AI Studio ve Antigravity IDE üzerinden ön izlemeye açıldı. Kurumsal kullanıcılar 3.1 Pro sürümünü Vertex AI ve Gemini Enterprise içinde görecek. Standart kullanıcılar için ise Gemini 3.1 Pro hem Gemini uygulaması hem de NotebookLM için erişime açıldı. Geliştiriciler için API maliyeti (1 milyon token başına 2 dolar giriş ve 12 dolar çıkış) ve bağlam penceresi (1 milyon giriş ve 64 bin çıkış tokenı) değişmedi.

Eğer Google’ın alışılagelmiş düzeni sürerse, yakın gelecekte daha hızlı ve ucuz olan Flash modeli için de bir 3.1 güncellemesi gelecektir.

Kaynak: https://arstechnica.com/google/2026/02/google-announces-gemini-3-1-pro-says-its-better-at-complex-problem-solving/

Post Views: 15

Bu Yazıya Tepkiniz Ne Oldu?

0

Beğendim
0

Alkışlıyorum
0

Eğlendim
0

Düşünceliyim
1

İğrendim
0

Sevdim
0

Çok Kızdım

Nuvem

Yazarın Profili

Google, Karmaşık Problem Çözmede Daha İyi Olduğunu Söylediği Gemini 3.1 Pro Modelini Duyurdu

Yorum Yap İptal

X-Humanoid Daha Fazla Açık Mimari Sunan Embodied Tien Kung 3.0’ı Tanıttı

Microsoft Raporu: Yapay Zeka İçeriklerini Tespit Etmenin Güvenilir Bir Yolu Yok

Honda’nın Pilot Projesi: Araçlar Çukurları ve Hasarlı Tabelaları Gerçek Zamanlı Tespit Etti

Google’ın Yeni Yapay Zeka Aracı Ürün Fotoğraflarını Stüdyo Kalitesine Taşıyor

Tarihte İlk: Levitasyonlu Süper İletken Mıknatısla Plazma Hapsedildi

Instagram, Sürekli Reels İzleyenler için Otomatik Kaydırma Özelliğini Test Ediyor

2026 Halkalı Güneş Tutulması: 17 Şubat’ta Geliyor!

Moflin: Japonya’da Satış Rekorları Kıran Sevimli 400 Dolarlık Yapay Zeka Destekli Robot Evcil Hayvan

Google’a Göre Gemini’nin Bir Komutu Yalnızca 5 Damla Su Harcıyor, Uzmanlar İtiraz Ediyor

Yerli Yapay Zeka Kumru, Hatalı Cevaplarıyla Sosyal Medyada Gündem Oldu

Google, Karmaşık Problem Çözmede Daha İyi Olduğunu Söylediği Gemini 3.1 Pro Modelini Duyurdu

Benzer Yazılar

Yorum Yap İptal