Samsung’un Küçük Yapay Zeka Modeli, Gemini 2.5 Pro Gibi Büyük Dil Modellerini Akıl Yürütme Testlerinde Geride Bıraktı

Nuvem tarafından

9 ay önce 167 kez okundu Okuma süresi: 1dk, 51sn

Samsung’un Küçük Yapay Zeka Modeli, Gemini 2.5 Pro Gibi Büyük Dil Modellerini Akıl Yürütme Testlerinde Geride Bıraktı

Samsung’un kamera bölümü son dönemde kayda değer bir yenilik sunamasa da, aynı şeyi yapay zeka çalışmaları için söylemek mümkün değil. Şirketin en son yapay zeka modeli, kendisinden yaklaşık 10.000 kat daha büyük olan bazı büyük dil modellerini (LLM) geride bıraktı.

Samsung’un Yeni Küçük Özyinelemeli Modeli

Samsung, “Less is More: Recursive Reasoning with Tiny Networks” başlıklı makalesinde yeni Tiny Recursive Model (TRM) mimarisini tanıttı.

TRM son derece küçük: sadece 7 milyon parametreye sahip; bu sayı milyarlarca parametreye sahip büyük LLM’lerle kıyaslandığında çok düşük.
Model, kendi çıktısını bir sonraki adımlarını belirlemek için kullanıyor ve bu sayede kendini geliştiren bir geri bildirim döngüsü oluşturuyor.
Her çıktıyı yinelemeli akıl yürütmeden geçirerek, yüksek bellek veya işlem maliyeti olmadan çok daha derin bir mimariyi simüle edebiliyor.
Her özyineleme döngüsünde model daha iyi tahminler ve sonuçlar üretiyor.

Samsung’un yaklaşımı, bir kişinin kendi taslağını tekrar tekrar okuyup her seferinde hataları düzeltmesine benzetiliyor. Geleneksel LLM’lerde bir adımda hata olduğunda tüm akıl yürütme zinciri çökerken, TRM’in yinelemeli yöntemi daha dayanıklı sonuçlar veriyor. Zincirleme düşünme (chain-of-thought) yöntemleri kısmen yardımcı olsa da kırılgan kalabiliyor.

Daha Az Katman, Daha Çok Yineleme

Samsung, modelin katman sayısını artırmayı denedi ancak bunun aşırı uyum nedeniyle genelleme kabiliyetini azalttığını gördü. Katman sayısını azaltıp yineleme sayısını artırmak ise TRM’in genel performansını yükseltti.

Sonuçlar

TRM, yapılan testlerde dikkat çekici başarılar elde etti:

Sudoku-Extreme: %87,4 doğruluk (Hiyerarşik Akıl Yürütme Modelleri yalnızca %55).
Maze-Hard bulmacaları: %85 doğruluk.
ARC-AGI-1: %45 doğruluk.
ARC-AGI-2: %8 doğruluk.

En önemlisi, TRM’in performansı; DeepSeek R1, Google Gemini 2.5 Pro ve OpenAI o3-mini gibi modelleri ya geçti ya da onlara çok yaklaştı. Üstelik bunu yalnızca çok küçük bir parametre sayısıyla başardı.

‍

Kaynak:

https://wccftech.com/samsungs-tiny-ai-model-outperforms-huge-llms-like-gemini-2-5-pro-on-arc-agi-puzzles/

Post Views: 167

Bu Yazıya Tepkiniz Ne Oldu?