Anthropic brengt 'eerlijker' AI-model Claude Opus 4.8 uit
In dit artikel:
Anthropic heeft recent Claude Opus 4.8 uitgebracht, een relatief kleine upgrade van Opus 4.7 die vooral inzet op eerlijker zelfbeeld en minder onopgemerkte programmeerfouten. Het model wordt aangeboden tegen dezelfde tarieven als eerder (5 dollar per miljoen invoertokens, 25 dollar per miljoen uitvoertokens) en komt tegelijk met een reeks platformverbeteringen voor ontwikkelaars en gebruikers.
Volgens Anthropic signaleert Opus 4.8 onzekerheden vaker en doet het minder vaak ongeremde beweringen over zijn eigen werk. Interne afstemmingsmetingen tonen verbeterde prosociale eigenschappen, zoals ondersteuning van gebruikersautonomie en het handelen in hun belang. Benchmarkwinstten zijn aanwezig maar bescheiden en variëren per taak: agentic codering, multidisciplinair redeneren, computergebruik, kenniswerk en financiële analyse laten verbeteringen zien tussen minder dan 1 procentpunt en bijna 9 procent. Dit suggereert dat de dagelijkse ervaring voor veel gebruikers geleidelijker zal veranderen dan dramatisch.
Een opvallende uitkomst uit de interne beoordeling is dat het aandeel gevallen waarin het model misleidt of helpt bij misbruik flink daalt; die cijfers liggen nu op een vergelijkbaar niveau met de beperkte Claude Mythos Preview, het krachtigere model dat Anthropic tot nu toe streng heeft afgeschermd. Anthropic benadrukt dat Opus 4.8 een “bescheiden maar tastbare” stap is; echt grotere sprongen blijven voor later.
Belangrijke nieuwe functionaliteit omvat dynamische workflows en een gebruikersinstelbare inspanningsregelaar. Voor ontwikkelaars is vooral Claude Code interessant: in een onderzoekspreview kan het nu taken plannen en honderden parallelle subagents in één sessie opstarten, met verificatie van output. Anthropic claimt dat Code migraties over honderdduizenden regels code aankan. Voor eindgebruikers op claude.ai is er een schuifregelaar waarmee de mate van “nadenken” kan worden ingesteld — hogere instellingen geven dieper redeneren, lagere instellingen snellere reacties. De snelle modus is in Opus 4.8 goedkoper en draait sneller dan bij eerdere modellen. De Messages API is eveneens aangepast, zodat systeeminstructies binnen de berichtenarray kunnen worden geüpdatet zonder promptcache te verstoren.
Anthropic richt zich met deze release meer op bruikbaarheid dan op spectaculaire LLM-scores. Tegelijk waarschuwt de veranderende benchmarkpraktijk dat versiecijfers alleen geen betrouwbare maat zijn voor vooruitgang. Het bedrijf werkt verder aan goedkopere modellen in de Opus-klasse en bereidt een bredere uitrol van Mythos-niveau modellen voor, waarvoor nog aanvullende beveiligingsmaatregelen en waarschijnlijk hogere kosten nodig zullen zijn.