DeepSeek brengt V4-modellen uit die mogelijk zijn getraind op Huawei-hardware

vrijdag, 24 april 2026 (12:31) - Tweakers

In dit artikel:

DeepSeek heeft zijn nieuwe V4-taalmodellen gepresenteerd, die volgens het bedrijf vooral uitblinken in programmeren, redeneren en agentachtige taken. De modellen zijn als preview beschikbaar op Hugging Face. Het grootste model, V4-pro, telt 1,6 biljoen parameters; de kleinere V4-flash heeft 284 miljard. Beide ondersteunen een contextvenster van 1 miljoen tokens, tegen 128.000 in het vorige model, wat langere en complexere taken mogelijk maakt.

DeepSeek meldt dat V4-pro op wereldkennis, redeneren, programmeren en agentica beter presteert dan V3 en in benchmarks zoals SimpleQA en Codeforces gunstig scoort ten opzichte van sommige concurrenten (GPT-5.4, Claude Opus 4.6), al doet Gemini 3.1 Pro High het vaak beter. De modellen volgen een “open weight”-benadering en worden onder een MIT-licentie uitgebracht, zodat gebruikers parameters mogen aanpassen. Volgens The Information is V4 op Huawei-gpu’s getraind; DeepSeek noemt de chips niet, maar Huawei bevestigt samenwerking om Ascend-hardware te ondersteunen — relevant gezien exportbeperkingen op Nvidia-hardware.