Yapay Zeka

20/2/2025

DeepMind’in AlphaGeometry2 Modelini Duyurdu: Uluslararası Matematik Olimpiyatı Geometri Sorularının %84’ünü Çözerek Altın Madalyalı Yarışmacıları Geride Bıraktı

Google’ın önde gelen yapay zeka araştırma laboratuvarı DeepMind, geliştirdiği yapay zeka sistemi AlphaGeometry2’nin, Uluslararası Matematik Olimpiyatı’nda (IMO) altın madalya kazananların ortalama performansını aştığını duyurdu.

AlphaGeometry2, DeepMind’in geçen yıl duyurduğu AlphaGeometry sisteminin geliştirilmiş bir versiyonu. DeepMind araştırmacıları tarafından yayımlanan yeni bir çalışmaya göre, AlphaGeometry2, son 25 yıl içinde IMO’da yer alan geometri problemlerinin %84’ünü çözdü. Bu başarı, sistemin insan matematikçilerle kıyaslandığında oldukça yüksek bir performans sergilediğini gösteriyor.

DeepMind’in bu olimpiyat düzeyindeki matematik yarışmalarıyla ilgilenmesinin temel sebebi, yapay zekanın daha ileri problem çözme yetenekleri geliştirebilmesi için geometri gibi karmaşık problemlere yeni çözümler üretmenin kritik bir yol olabileceğine inanması.

AlphaGeometry2’nin Çalışma Mekanizması

Matematiksel teoremlerin ispat edilmesi, yani bir teoremin (örneğin Pisagor teoremi) neden doğru olduğunu mantıklı bir şekilde açıklamak, hem güçlü bir muhakeme yeteneği hem de çözüm sürecinde doğru adımları seçme becerisi gerektiriyor. DeepMind’e göre, bu problem çözme yetenekleri gelecekte genel amaçlı yapay zeka modelleri için önemli bir bileşen olabilir.

AlphaGeometry2, Google’ın Gemini AI modelinden ve “sembolik motor” adı verilen bir sistemden oluşuyor. Gemini modeli, sembolik motorun problemleri çözerken kullanabileceği olası çözümleri tahmin ediyor ve bu tahminler doğrultusunda en uygun teoremleri seçerek ispat yapıyor.

Uluslararası Matematik Olimpiyatı’ndaki geometri soruları genellikle çözülebilmesi için belirli ek çizimler (doğrular, noktalar veya çemberler) eklenmesi gereken diyagramlara dayanıyor. AlphaGeometry2’nin Gemini modeli, hangi ek yapıların problemi çözmek için faydalı olabileceğini tahmin ediyor ve bu tahminler, sembolik motor tarafından değerlendiriliyor.

Sistem, bir problemi çözüldü olarak kabul etmek için, Gemini modelinin önerdiği adımların sembolik motorun matematik kurallarıyla tutarlı bir ispat oluşturduğunda birleşmesini esas alıyor. Bu süreci hızlandırmak için, AlphaGeometry2 aynı anda birden fazla çözüm yolu deneyerek, farklı yaklaşımlardan elde ettiği bulguları ortak bir bilgi havuzunda saklıyor fakat yapay zekanın geometri problemlerini öğrenmesi için gereken uygun eğitim verisinin eksikliği, DeepMind araştırmacılarını kendi sentetik eğitim verilerini üretmeye yönlendirdi. AlphaGeometry2’yi eğitmek için, 300 milyondan fazla teorem ve ispat içeren bir veri kümesi oluşturuldu.

Bir IMO sınavında tipik bir geometri problem şeması.

DeepMind ekibi, 2000-2024 yılları arasında IMO’da sorulmuş 45 geometri problemini analiz ederek bunları 50 ayrı probleme dönüştürdü. Sistem, 50 sorunun 42’sini başarıyla çözerken, olimpiyatlarda altın madalya kazananların ortalama puanı olan 40.9’un üzerine çıktı.

Sınırlamalar ve Geleceğe Dair İpuçları

Buna rağmen, AlphaGeometry2’nin belirli sınırlamaları bulunuyor. Sistem, değişken sayıda noktaya sahip problemleri, doğrusal olmayan denklemleri ve eşitsizlik içeren soruları çözmekte zorluk yaşıyor. Ayrıca, IMO’da kullanılan problemlerin daha zor bir alt kümesine uygulandığında, performansı düşüş gösterdi.

DeepMind ekibi, henüz olimpiyatlarda kullanılmamış ancak uzman matematikçiler tarafından aday gösterilmiş 29 zor problemi AlphaGeometry2 ile test etti. Bu testlerde, sistem yalnızca 20 problemi çözebildi.

Yine de, bu sonuçlar yapay zekanın matematik problemleri çözme yeteneği konusundaki büyük ilerlemeleri gösteriyor ve sembolik hesaplama ile yapay sinir ağlarını birleştiren hibrit sistemlerin gelecek vaat ettiğini ortaya koyuyor.

Sembolik YZ ve Sinir Ağları Arasındaki Tartışma

AlphaGeometry2, sembolik hesaplamayı yapay sinir ağlarıyla birleştiren hibrit bir yaklaşım kullanıyor. Gemini modeli sinir ağı tabanlı bir yapıya sahipken, sembolik motor belirli kurallara dayalı bir problem çözme yaklaşımı benimsiyor.

Bu durum, yapay zeka topluluğundaki “sembolik hesaplama mı, yoksa sinir ağları mı daha üstün?” tartışmasını daha da alevlendirebilir.

Sinir ağlarının destekçileri, konuşma tanımadan görüntü oluşturma modellerine kadar pek çok alanda akıllı davranışların yalnızca büyük veri kümeleri ve hesaplama gücüyle ortaya çıkabileceğini savunuyor. Öte yandan, sembolik yapay zeka savunucuları, bu tür sistemlerin dünyadaki bilgiyi daha verimli kodlayabileceğini ve problem çözerken izlediği mantık zincirini açıklayarak daha güvenilir sonuçlar sunabileceğini iddia ediyor. Örneğin, OpenAI’nin o1 modeli büyük bir sinir ağı tabanlı yapıya sahip olmasına rağmen, DeepMind’in yayımladığı çalışmaya göre, AlphaGeometry2’nin çözebildiği IMO problemlerinin hiçbirini çözemedi.

Bununla birlikte, bu durumun kalıcı olmayabileceği de belirtiliyor. DeepMind araştırmacıları, AlphaGeometry2’nin dil modelinin bazen sembolik motora ihtiyaç duymadan da kısmi çözümler üretebildiğini gösteren ön kanıtlar bulduklarını ifade etti.

DeepMind ekibi, çalışmada “Bu sonuçlar, büyük dil modellerinin harici araçlara bağımlı olmadan da kendi başlarına problem çözebileceğine işaret ediyor. Ancak, modelin hızının artırılması ve yanlış sonuçlar üretme eğiliminin (halüsinasyon) tamamen ortadan kaldırılması gerekiyor. Bu sorunlar çözülene kadar sembolik motorlar matematik uygulamalarında önemli bir araç olmaya devam edecek.” ifadelerine yer verdi.



Kaynak: https://techcrunch.com/2025/02/07/deepmind-claims-its-ai-performs-better-than-international-mathematical-olympiad-gold-medalists/