1. Anasayfa
  2. Yapay Zeka Uygulamaları

Samsung’un Küçük Yapay Zeka Modeli, Gemini 2.5 Pro Gibi Büyük Dil Modellerini Akıl Yürütme Testlerinde Geride Bıraktı

Samsung’un Küçük Yapay Zeka Modeli, Gemini 2.5 Pro Gibi Büyük Dil Modellerini Akıl Yürütme Testlerinde Geride Bıraktı
0

Samsung’un kamera bölümü son dönemde kayda değer bir yenilik sunamasa da, aynı şeyi yapay zeka çalışmaları için söylemek mümkün değil. Şirketin en son yapay zeka modeli, kendisinden yaklaşık 10.000 kat daha büyük olan bazı büyük dil modellerini (LLM) geride bıraktı.

Samsung’un Yeni Küçük Özyinelemeli Modeli

Samsung, “Less is More: Recursive Reasoning with Tiny Networks” başlıklı makalesinde yeni Tiny Recursive Model (TRM) mimarisini tanıttı.

  • TRM son derece küçük: sadece 7 milyon parametreye sahip; bu sayı milyarlarca parametreye sahip büyük LLM’lerle kıyaslandığında çok düşük.
  • Model, kendi çıktısını bir sonraki adımlarını belirlemek için kullanıyor ve bu sayede kendini geliştiren bir geri bildirim döngüsü oluşturuyor.
  • Her çıktıyı yinelemeli akıl yürütmeden geçirerek, yüksek bellek veya işlem maliyeti olmadan çok daha derin bir mimariyi simüle edebiliyor.
  • Her özyineleme döngüsünde model daha iyi tahminler ve sonuçlar üretiyor.

Samsung’un yaklaşımı, bir kişinin kendi taslağını tekrar tekrar okuyup her seferinde hataları düzeltmesine benzetiliyor. Geleneksel LLM’lerde bir adımda hata olduğunda tüm akıl yürütme zinciri çökerken, TRM’in yinelemeli yöntemi daha dayanıklı sonuçlar veriyor. Zincirleme düşünme (chain-of-thought) yöntemleri kısmen yardımcı olsa da kırılgan kalabiliyor.

__wf_reserved_inherit

Daha Az Katman, Daha Çok Yineleme

Samsung, modelin katman sayısını artırmayı denedi ancak bunun aşırı uyum nedeniyle genelleme kabiliyetini azalttığını gördü. Katman sayısını azaltıp yineleme sayısını artırmak ise TRM’in genel performansını yükseltti.

Sonuçlar

TRM, yapılan testlerde dikkat çekici başarılar elde etti:

  • Sudoku-Extreme: %87,4 doğruluk (Hiyerarşik Akıl Yürütme Modelleri yalnızca %55).
  • Maze-Hard bulmacaları: %85 doğruluk.
  • ARC-AGI-1: %45 doğruluk.
  • ARC-AGI-2: %8 doğruluk.

En önemlisi, TRM’in performansı; DeepSeek R1, Google Gemini 2.5 Pro ve OpenAI o3-mini gibi modelleri ya geçti ya da onlara çok yaklaştı. Üstelik bunu yalnızca çok küçük bir parametre sayısıyla başardı.

Kaynak: 

https://wccftech.com/samsungs-tiny-ai-model-outperforms-huge-llms-like-gemini-2-5-pro-on-arc-agi-puzzles/

Bu Yazıya Tepkiniz Ne Oldu?
  • 0
    be_endim
    Beğendim
  • 0
    alk_l_yorum
    Alkışlıyorum
  • 0
    e_lendim
    Eğlendim
  • 0
    d_nceliyim
    Düşünceliyim
  • 0
    _rendim
    İğrendim
  • 0
    sevdim
    Sevdim
  • 0
    _ok_k_zd_m
    Çok Kızdım

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir