Nvidia's plannen voor Vera Rubin, DGX Station, agents en robots

maandag, 1 juni 2026 (09:09) - Techzine

In dit artikel:

Nvidia heeft op GTC Taipei 2026 (tegelijk met Computex) een reeks grote hardware- en softwareupdates aangekondigd die gericht zijn op grootschalige, fysiek georiënteerde AI-toepassingen. Centraal staat het nieuwe vlaggenschipplatform Vera Rubin, dat nu in massaproductie gaat en het Grace Blackwell-platform opvolgt. Vera Rubin wordt gemaakt door meer dan 350 partners in 30 landen; fabrikanten als Dell, HPE, Lenovo en SuperMicro brengen later dit jaar systemen uit voor cloud- en zakelijke klanten. OpenAI en Anthropic zijn al aan de slag met de architectuur.

Het hart van Vera Rubin is de NVL72-rackopstelling: vloeistofgekoelde systemen met 72 Rubin‑GPU’s en 36 Vera‑CPU’s, verbonden via NVLink 6. Nvidia zegt dat dit platform mixture‑of‑experts‑modellen veel efficiënter kan trainen (met naar eigen zeggen een kwart van het aantal GPU’s vergeleken met Blackwell) en tienmaal hogere inferentiedoorvoer levert tegen een tiende van de kosten per token. De stack bevat ook een nieuwe Groq 3 LPU voor lage-latentie inferentie (een toevoeging die voortkomt uit de overname van Groq), de veelkernige Vera‑CPU (basis: Olympus-core, 88 kernen, 1,2 TB/s geheugenbandbreedte) voor agent‑workloads, Spectrum‑X optische netwerkswitches en BlueField‑4 DPU’s voor opslag-, netwerk‑ en beveiligingsfuncties.

Naast rackschaalinfrastructuur introduceert Nvidia de DGX Station voor Windows: een “deskside” AI‑supercomputer gebouwd rond de GB300 Grace Blackwell Ultra Desktop Superchip. Het systeem biedt tot 20 petaflops FP4‑prestaties en tot 748 GB geheugen, en kan volgens Nvidia lokale uitvoering van modellen tot ongeveer een biljoen parameters mogelijk maken. Doel is ontwikkelaars in enterprises in een vroeg stadium de cloud te laten vermijden. De DGX Station ondersteunt OpenShell secure runtime voor beveiligings- en privacybeleid op besturingssysteemniveau en wordt door OEM-partners als Dell, HP, ASUS, MSI en Super Micro verwacht vóór eind 2026 geleverd. Modules kunnen gekoppeld worden tot desktop‑clusters; er is een optionele RTX Pro 6000 Blackwell GPU voor fysieke AI‑workflows met ray‑tracing.

Voor agent‑ontwikkeling is er een vernieuwde Agent Toolkit rond NemoClaw – een open framework voor orchestration‑lagen – en het Nemotron 3 Ultra‑model (550 miljard parameters), bedoeld voor langlopende autonome agents. Nvidia claimt vijf keer snellere inferentie en 30% lagere kosten versus vergelijkbare modellen; lancering staat gepland op 4 juni. De OpenShell Secure Runtime (met Microsoft, Canonical en Red Hat) biedt sandboxing en beleidsafdwinging; early adopters zijn onder meer CrowdStrike, Palantir, Cadence en Siemens.

Op het terrein van fysieke AI presenteerde Nvidia Cosmos 3, een open wereldmodel dat visuele redenering, wereldgeneratie en actievoorspelling combineert; Cosmos 3 Super en Nano zijn vanaf nu beschikbaar via Hugging Face en Nvidia’s NIM‑microservices, met een Edge‑variant voor realtime inferentie op komst. Tot slot onthulde Nvidia het Isaac GR00T Reference Humanoid Robot‑ontwerp: een open referentie gebaseerd op Unitree H2 Plus, Sharpa Wave‑handen en Jetson AGX Thor‑rekenkracht — bijna twee meter, 75 vrijheidsgraden — bedoeld als gemeenschappelijk platform voor academisch onderzoek, met levering via Unitree verwacht eind 2026.

Kort samengevat zet Nvidia met Vera Rubin, DGX Station, vernieuwde agenttools, Cosmos 3 en een humanoïde referentie het spel naar grotere, meer geïntegreerde AI‑infrastructuren voor zowel cloud als lokaal gebruik en breidt het bedrijf zijn fysieke AI‑portfolio verder uit.

Lees het volledige artikel