NVIDIA, yeni nesil veri merkezlerinin temelini oluşturacak Rubin yapay zeka platformunu resmen tanıttı. Blackwell mimarisine kıyasla 5 kata varan kapasite artışı sunan platform, şirketin büyük ölçekli yapay zeka altyapıları için geliştirdiği en kapsamlı sistemlerden biri olarak konumlandırılıyor.

GTC etkinliğinde bir güncelleme beklenmesine rağmen Rubin’in CES döneminde duyurulması sürpriz olarak değerlendirildi. Platform, üretim tesislerinden çıkmış ve laboratuvar ortamında test edilmeye başlanan toplam altı ayrı çipten oluşuyor. Sistem kapsamında 336 milyar transistöre sahip Rubin GPU, 227 milyar transistörlü Vera CPU, NVLink 6 ara bağlantı anahtarı, CX9 ve BF4 ağ modülleri ile silikon fotonik tabanlı Spectrum-X 102.4T CPO yer alıyor.

Tüm bileşenler, DGX, HGX ve MGX sistemleri üzerinden entegre şekilde çalışıyor. Her veri merkezi düğümünün merkezinde iki Rubin GPU, bir Vera CPU ve HBM4 ile LPDDR5x bellek yapılandırmalarını bir araya getiren NVIDIA Vera Rubin Superchip bulunuyor. Platform, 6. nesil NVLink ile 3,6 TB/s bağlantı hızı, Olympus çekirdek mimarisi ve 50 PFLOPs NVFP4 Transformer motoruyla öne çıkıyor. Sistem ayrıca 3. nesil güvenli bilgi işlem altyapısı ve kesintisiz çalışmayı hedefleyen 2. nesil RAS motoruyla donatılıyor.





Rubin GPU, yoğun hesaplama ve tensör işlemleri için tasarlanan çift kalıplı bir yapıya sahip. Yapay zeka iş yüklerine odaklanan mimari, Blackwell’e kıyasla çıkarım performansında 5 kat, eğitim tarafında ise 3,5 kat (35 PFLOPs) artış sağlıyor. HBM4 bellek desteği sayesinde çip başına 22 TB/s bant genişliğine ulaşılıyor.
Vera CPU tarafında NVIDIA, Olympus kod adlı özel Arm mimarisini kullanıyor. 88 çekirdek ve 176 izlek sunan işlemci, Grace modelinin üç katı olan 1,5 TB sistem belleğiyle geliyor ve veri işleme ile sıkıştırma performansını önceki nesle göre 2 kat artırıyor. Ağ altyapısında yer alan sıvı soğutmalı NVLink 6 anahtarları toplam 28,8 TB/s bant genişliği sağlarken, BlueField-4 önceki nesle kıyasla 6 kat daha yüksek hesaplama gücü sunuyor.




Tüm yenilikler, NVIDIA Vera Rubin NVL72 rack sistemi altında birleşiyor. 20,7 TB HBM4 ve 54 TB LPDDR5x kapasitesiyle donatılan bu sistem, Blackwell mimarisine göre çıkarım süreçlerinde token maliyetini 10 kat azaltıyor, MoE modellerinin eğitimi için gereken GPU sayısını da 4 kat düşürüyor. Spectrum-X çözümü ise silikon fotonik teknolojisiyle uygulama çalışma süresini 5 kat daha verimli hale getiriyor.
Platform şu anda tam üretim aşamasında bulunuyor ve müşterilerin ilk çiplere yılın sonlarına doğru erişmesi planlanıyor.
Kaynak: https://wccftech.com/nvidia-rubin-most-advanced-ai-platform-50-pflops-vera-cpu-5x-uplift-vs-blackwell/
