Claude Opus 4.8 zegt heel eerlijk dat het iets niet weet, beweert Anthropic
In dit artikel:
Anthropic heeft het taalmodel Claude Opus 4.8 uitgebracht als opvolger van Opus 4.7 (uitgebracht vorige maand/april). Volgens het bedrijf scoort Opus 4.8 op de meeste benchmarks enkele procentpunten hoger, met de grootste winst bij het genereren van code in een terminalomgeving. Anthropic publiceerde benchmarks en een onderzoeksrapport ter onderbouwing.
Het belangrijkste verbeterpunt is volgens Anthropic de toegenomen “eerlijkheid”: het model zegt vaker dat het iets niet weet en doet minder ongefundeerde uitspraken. In het onderzoek stelt het bedrijf dat Opus 4.8 ongeveer vier keer minder geneigd is om fouten in code onopgemerkt te laten zonder daarover te waarschuwen. Daarnaast krijgt het model een snellere modus die ongeveer drie keer minder tokens verbruikt dan eerdere versies.
Opus 4.8 is beschikbaar via Claude Code, Claude.ai en de apps. Tegelijk introduceert Anthropic dynamische workflows in Claude Code, waarmee het model honderden subagents in één sessie kan inzetten — geschikt voor complexere taken zoals migraties van volledige codebases.