Nvidia Blackwell-opvolger Rubin verschijnt dit jaar: forse prestatieboost
In dit artikel:
Nvidia heeft tijdens CES het Rubin-platform onthuld: een geïntegreerde AI-infrastructuur van zes chips bedoeld om krachtige, betaalbare AI-supercomputers te leveren en de adoptie van large-scale AI te versnellen. Rubin combineert de Vera CPU, Rubin GPU, NVLink 6 Switch, ConnectX-9 SuperNIC, BlueField-4 DPU en Spectrum-6 Ethernet Switch in één systeem, genoemd naar astronoom Vera Rubin.
Volgens Nvidia levert Rubin grote efficiëntiewinsten voor zowel inferencing als training: tot 10× lagere kosten per token bij inferencing van mixture-of-experts (MoE)-modellen en training van MoE’s met ongeveer 4× minder GPU’s dan het Blackwell-platform. Technische hoogtepunten zijn onder meer NVLink 6 (3,6 TB/s per GPU; een volledig NVL72-rack zou 260 TB/s bieden), de Vera CPU met 88 aangepaste Olympus-cores (Armv9.2) gericht op agentic reasoning, en een Rubin GPU met een derde-generatie Transformer Engine en hardwareversnelde adaptieve compressie (50 petaflops NVFP4 voor inferencing).
Rubin introduceert ook rack-schaal Confidential Computing om data continu te beschermen, een tweede-generatie RAS Engine voor realtime gezondheidstoezicht en een modulair ontwerp dat volgens Nvidia de assemblagetijd sterk reduceert. Grote cloudproviders (AWS, Google Cloud, Microsoft, Oracle) en serverbouwers (Dell, HPE, Lenovo, Supermicro) ondersteunen het platform; AI-labs zoals OpenAI, Anthropic, Meta en xAI zeggen Rubin te zullen gebruiken voor grotere, multimodale en long‑context systemen.
Nvidia meldt dat Rubin volledig in productie is en dat partners Rubin-gebaseerde systemen in de tweede helft van 2026 beschikbaar gaan aanbieden.