Huawei verenigt storage en AI in vijflaagse infrastructuur
In dit artikel:
Tijdens het Innovative Data Infrastructure Forum 2026 in Parijs presenteerde Huawei zijn visie op hoe bedrijven hun infrastructuur moeten inrichten om de explosieve groei van AI-tokens en autonome agents praktisch te benutten. Yuan Yuan, President van Huawei’s Data Storage Product Line, legde uit dat de volume- en agentengroei enorme eisen stelt aan opslag, rekenkracht en dataarchitectuur: waar vorig jaar zo’n 6 miljard tokens per minuut werden verwerkt, verwacht Huawei dit jaar ongeveer 15 miljard. IDC-ramingen spreken daarnaast van bijna 30 miljoen actieve AI-agents eind vorig jaar en een sprong naar circa 2,2 miljard binnen vier jaar. (Tokens zijn korte input/output-eenheden voor grote taalmodellen; agents zijn autonome AI-processen die taken uitvoeren.)
Een concreet voorbeeld uit de gezondheidszorg illustreert de waarde van goede infrastructuur. In een groot Chinees ziekenhuis werden drie AI-modellen gecombineerd voor digitale pathologie (kankerdetectie, microscoop-emulatie en patiëntcommunicatie). De modellen werden getraind op een miljoen pancreasbeelden en kennis uit honderden medische naslagwerken, uitgevoerd op 16 GPU-kaarten. Resultaat: de tijd voor het opstellen van een pathologierapport daalde van 40 minuten naar 15 seconden.
Huawei pleit voor een vijflaagse AI-stack om zulke workloads veilig en efficiënt te draaien:
- Agent Framework: omgeving om agents te bouwen en uit te rollen, met beveiligde sandboxes.
- Modellen: tools voor finetuning, lokale aanpassing en parameterafstemming.
- Compute: gespecialiseerde hardware voor inferencing (GPU/NPUs). Vanwege geopolitieke beperkingen ontwikkelde Huawei eigen technologie: Arm-gebaseerde Kunpeng-processors voor server- en storagecontrollers en Ascend-NPU’s voor AI-workloads.
- AI Data Platform: knowledge base, een KV-cache voor snelle memory-toegang en een geheugenlaag die context en voortgang bewaart.
- Data Lake: centrale consolidatie van organisatiebrede data.
In de praktijk is zo’n gelaagde opzet volgens Huawei onmisbaar voor high-end toepassingen: autonoom rijden op level 5 vereist honderdterabytes aan sensordata per voertuig en ultrasnelle semantische zoekacties over enorme beeldarchieven; bij AI-ondersteunde softwareontwikkeling voorkomt een KV-cache herhaaldelijk compleet laden van context naar GPU’s en maakt een gedeeld geheugensysteem iteraties efficiënt en cumulatief beter.
Huawei koppelt concrete producten aan elke laag: OceanStor Pacific voor het data lake (schaalbaar tot 900.000 petabyte; 100 PB in een 2U-chassis, 25 W/TB) met cross-modale semantische zoekmogelijkheden; een 3+1 AI-dataplatform met een knowledge base (>95% retrieval-nauwkeurigheid), petabyte-klassen KV-cache die time-to-first-token met 45–90% verkort en Context Memory Storage (CMS) voor hyperscalers; modelengineering-tools die 30+ modellen ondersteunen; en Nexus, een grafische agentbuilder zonder programmeerkennis.
Security is door de hele stack verweven: Huawei adresseert risico’s op meerdere niveaus — ongewenste agentacties, model-poisoning, platformdata-manipulatie en ransomware op data lakes — en benadrukt certificeringen om Europese klanten vertrouwen te geven. Volgens Huawei kan een private AI-stack, boven alleen publieke cloudopties, beter privacy, compliance en het genereren van eigen waarde garanderen. Conclusie: zonder een gelaagde, veilige en op AI afgestemde infrastructuur blijven de kansen van tokens en agents voor ondernemingen grotendeels onbenut.