Yakında çıkacak Vera Rubin grafik işlem birimleri (GPU) hakkında bunca konuşma varken, Nvidia Corp. şirketinin sadece YZ donanımı sağlamadığını unutmak kolay oluyor.
Şirket kendi YZ modellerini de geliştiriyor ve şimdiye kadarki en yetenekli modelini kullanıma sunduğunu duyurdu. Şirket, Nemotron Super 3 modelinin karmaşık otonom YZ sistemlerini büyük ölçekte çalıştırmayı hedeflediğini belirtti. Bu model, yüksek doğruluk gerektiren görevleri verimli bir şekilde yerine getirmek için gelişmiş muhakeme becerilerini hızlı işlem kapasitesiyle birleştiriyor.
Nemotron Super 3, hibrit bir uzmanlar karışımı (mixture-of-experts) mimarisine dayanan 120 milyar parametreli açık bir model. Nvidia, modelin üç yeniliği birleştirerek önceki nesil Nemotron Super modeline kıyasla beş kat daha fazla veri akışı ve iki kat daha fazla doğruluk sunduğunu açıkladı.
Nvidia’ya göre Nemotron Super 3, kullanıcılar adına karmaşık görevleri otomatikleştirmeyi amaçlayan otonom YZ sistemlerinin karşılaştığı iki büyük engeli aşmak için tasarlandı. Bunların ilki, içerik miktarındaki aşırı artış. Çoklu ajan iş akışları, standart sohbet etkileşimlerine kıyasla genellikle 15 kat daha fazla token üretiyor çünkü kullanıcı her etkileşime girdiğinde modelin araç çıktılarını ve ara muhakeme süreçlerini içeren bağlamı tekrar göndermesi gerekiyor.
İkinci kısıtlama ise “düşünme maliyeti” olarak biliniyor. Karmaşık ajanlar, tamamladıkları bir görevin her adımında muhakeme yürütmek zorundadır. Bu durum çok daha büyük modellerin kullanımını kullanışsız hale getiriyor çünkü parametre sayısı arttıkça işlem maliyetleri de yükseliyor. Ayrıca büyük modeller, küçük modellere göre daha yavaş çalışıyor.
Nvidia, tüm bu sorunları çözmek için Nemotron Super 3 modelinin tam iş akışı durumunu bellekte tutan ve “hedef sapmasını” engelleyen 1 milyon tokenlik bir bağlam penceresine sahip olduğunu belirtti. Dahası, 120 milyar parametresinden yalnızca 12 milyarı çıkarım sürecinde, yani eğitilmiş modellerin yeni veriler üzerinde tahminler yürütmesi veya sonuçlar üretmesi işleminde aktif olarak kullanılıyor.
Nvidia, Nemotron Super 3’ün Blackwell GPU’lar üzerinde NVFP4 hassasiyetinde çalıştığını açıkladı. Böylelikle bellek gereksinimleri azalırken, çıkarım hızı önceki nesil Hopper platformuna göre dört kata kadar artıyor.
Nemotron Super 3, build.nvidia.com, OpenRouter ve Hugging Face üzerinden indirilebiliyor. Ayrıca YZ tabanlı arama motoru Perplexity Inc., modeli kendi arama motoruna ve “Computer” adlı otonom YZ ajan sistemine dahil ediyor. CodeRabbit, Factory ve Greptile gibi üretken YZ kodlama uygulamaları modeli portföylerine eklerken, Edison Scientific ve Lila Sciences gibi yaşam bilimleri kuruluşları da veri bilimi, derinlemesine literatür araştırması ve moleküler analizler için bu sistemi kullanıyor.
Amdocs, Palantir Technologies Inc., Cadence Design Systems Inc. ve Dassault Systèmes SA gibi şirketler, telekomünikasyon, siber güvenlik, yarı iletken tasarımı ve üretim alanlarındaki iş akışlarını otomatikleştirmek için Nemotron Super 3 kullanıyor. Son olarak Dell Technologies Inc. ve Hewlett Packard Enterprise Co. da kendi ajan merkezleri üzerinden modele erişim sağlayacak.
Kaynak: https://siliconangle.com/2026/03/11/nvidias-nemotron-super-3-model-agentic-systems-launches-five-times-higher-throughput/
