DeepSeek V3.1 is uit: verdubbelt tokens en 2,5x sneller

donderdag, 21 augustus 2025 (10:26) - Techzine

In dit artikel:

DeepSeek heeft stilletjes versie 3.1 van zijn conversationele AI vrijgegeven. De Chinese ontwikkelaar biedt het model gratis aan via Hugging Face en in zijn WeChat-groep; gebruikers kunnen het ook meteen uitproberen op chat.deepseek.com na registratie. Er is geen grote marketinglancering geweest en officiële API-integraties (zoals via OpenRouter) zijn nog niet bijgewerkt.

V3.1 introduceert een hybride architectuur die automatisch schakelt tussen diep redeneren en snellere zoek-/reactiemodi, waardoor gebruikers niet handmatig hoeven te wisselen. Het model telt 685 miljard parameters, werkt tot 2,5 keer sneller dan de voorganger en heeft een flink groter contextvenster—van 64K naar 128K tokens—wat langere documenten en conversaties ondersteunt. DeepSeek meldt dat zijn kennis reikt tot juli 2024.

Op benchmarks scoort V3.1 opvallend: 53,1% op SVG Bench (boven enkele toonaangevende modellen zoals Gemini 2.5 Flash) en 71,6% op ADA. De coderingsprestaties zijn gemengd; bij complexe programmeertaken blijft het achter op modellen als Claude Opus 4.1 en Gemini.

Het model is open source te downloaden, en gevorderde gebruikers kunnen V3.1 lokaal draaien met tools zoals Lama en Browser Use Web UI om autonome taken op hun eigen machine uit te voeren. HTML-uitvoer kan direct worden bekeken of gedownload voor hosting (bijv. Netlify). De release sluit aan bij de bredere trend van toegankelijke, open AI-modellen, met voordelen voor privacy en aanpasbaarheid, maar ook wisselende resultaten afhankelijk van de taak.