Claude Sonnet 4.5 kan 30 uur onafgebroken coderen

dinsdag, 30 september 2025 (09:09) - Techzine

In dit artikel:

Anthropic brengt Claude Sonnet 4.5 uit, een model dat het bedrijf positioneert als toonaangevend voor coderen en complex computergebruik. Op de OSWorld-benchmark voor real-world computertaken scoort Sonnet 4.5 61,4% — een flinke sprong ten opzichte van Sonnet 4 vier maanden eerder (42,2%). Ook op SWE-bench Verified, gericht op softwareontwikkelingsvaardigheden, behaalt het model met 77,2% de hoogste score, net boven Opus 4.1 en GPT‑5 Codex (74,5%).

Het model kan volgens Anthropic meer dan 30 uur geconcentreerd werken aan complexe, meerstaps taken, waardoor het autonoom langdurig code kan schrijven. Tegelijk introduceert Anthropic de Claude Agent SDK: een ontwikkelaarstoolset die de architectuur achter Claude Code openstelt. Het bedrijf meldt zes maanden werk aan oplossingen voor geheugenbeheer, toegangsrechten en coördinatie tussen subagents.

Claude Sonnet 4.5 is per direct beschikbaar via de Claude API onder de naam claude-sonnet-4-5, tegen dezelfde tarieven als Sonnet 4 (3 USD per miljoen input tokens, 15 USD per miljoen output tokens). Nieuwe functies omvatten checkpoints in Claude Code (voortgang opslaan/terugzetten) en een native VS Code-extensie.

Op veiligheidsvlak geeft Anthropic aan dat Sonnet 4.5 sterk verbeterd is in het beperken van schadelijk gedrag (zoals misleiding of machtsoogmerk). Het model valt onder Anthropics AI Safety Level 3-beperkingen, met filters voor risicovolle CBRN-gerelateerde input/output en een aanzienlijke vermindering van valse positieven. Daarnaast loopt een korte research-preview, “Imagine with Claude”, waarmee het systeem realtime software genereert zonder vooraf geschreven code; deze functie is tijdelijk vijf dagen beschikbaar voor Max-gebruikers.

Kort: Sonnet 4.5 richt zich op robuuste, langdurige autonome codering en maakt ontwikkelaarsfuncties en strengere veiligheidsmaatregelen breed beschikbaar.

Lees het volledige artikel