Chris Wright: Metal-to-agent staat aan de basis van schaalbare enterprise AI

vrijdag, 19 juni 2026 (11:26) - Techzine

In dit artikel:

Red Hat herijkt zijn platformstrategie om bedrijven te wapenen voor de snelle verschuiving in enterprise AI, waar extreem stijgend tokenverbruik de kosten- en operationele dynamiek verandert. CTO Chris Wright betoogt dat dalende tokenprijzen door schaalvoordeel (tot 75–90% per eenheid) teniet worden gedaan door een jaarlijks volume‑explosie van meer dan 500%. Complexe reasoning‑modellen vergen 10–20x meer tokens en autonome AI‑agents kunnen dat verbruik nog eens vervijfvoudigen. Daardoor wordt langdurig leunen op externe frontier‑API’s op termijn onhoudbaar; organisaties moeten naar eigen infrastructuur en zelfgehoste modellen bewegen om kosten, controle en vendor‑lock‑in te beheersen.

Het antwoord van Red Hat is Red Hat AI Enterprise: een open source “metal‑to‑agent” stack die van hardware tot autonome agenten alle lagen integreert. Het platform bestaat uit twee herkenbare producten: Red Hat AI Inference — gericht op efficiënt en containerized draaien van modellen op Kubernetes/Linux — en het bredere AI Enterprise, dat daarbovenop enterprise‑functionaliteiten biedt zoals security, red teaming, Models‑as‑a‑Service (MaaS) en AgentOps voor grootschalig beheer van agents.

De architectuur rust op vijf samenhangende lagen:
- Infra: Red Hat Enterprise Linux en OpenShift vormen de basis met functies als strikte netwerkisolatie en dynamische GPU‑sharing om hardware beter te benutten en toegang tot datasets te beheersen.
- Inferencing: vLLM fungeert als belangrijkste open source fundament; daarbovenop orkestreert het door Red Hat ontwikkelde llm‑d queries over servers, wat volgens Red Hat tot 3x hogere token‑doorvoer en 10x snellere time‑to‑first‑byte leidt, en stabielere responstijden voor SLO’s.
- Model services en AI‑gateway: MaaS centraliseert modellen als gedeelde API‑resources. De gateway stelt IT in staat tokenquota, toegangsrechten en prioriteiten te beheren, en voorkomt dat kleinschalige experiments de hele infrastructuur verzadigen.
- Validatie & dataservices: een validated‑models‑programma keurt en optimaliseert open‑weight modellen (zoals IBM Granite en Mistral) en koppelt deze aan dataservices voor verrijking en specifieke fine‑tuning.
- Agent services: bovenaan staan agenten die continu monitoren en handelen. Red Hat promoot ‘bring your own agents’ maar alleen gecentraliseerd via AgentOps, met digitale identiteit, versiebeheer, automatische securitytests en volledige observability via OpenTelemetry om agent‑sprawl te beheersen.

Red Hat blijft hardware‑agnostisch (“any accelerator”) maar werkt intensief samen met leveranciers zoals Nvidia; de AI Factory‑implementaties ondersteunen Nvidia NIM’s en Blackwell‑GPU’s terwijl Red Hat als veilige uitvoeringslaag fungeert.

Wright wijst op praktische productie-uitdagingen: heldere use‑casedefinitie, betrouwbare en veilige datakoppeling (denk legacy ERP), en de transitie van laptop‑proof prototypes naar schaalbare, observeerbare en secure productieomgevingen. Tegelijk versnelt open source: nieuwe open modellen naderen proprietary prestaties steeds sneller, waardoor langdurige vendor‑lock‑ins risicovol worden.

Kort gezegd: Red Hat zet in op een open, gelaagde infrastructuur die bedrijven helpt controle te houden over tokenkosten, modelkeuze en governance terwijl ze opschalen naar agent‑gedreven enterprise AI.

BEKIJK OOK:

Vandaag Inside Oranje: Gesprek aan Vandaag Inside Oranje-tafel dwaalt volledig af: 'Hoe lang duurt dit programma nog?!'