VS blokkeert Anthropic Claude Fable 5 en Mythos 5 vanwege zorgen jailbreak
In dit artikel:
Anthropic heeft zijn krachtige taalmodellen Claude Mythos 5 en de publieke spin‑off Fable 5 wereldwijd uitgeschakeld nadat de Amerikaanse overheid het bedrijf opdroeg buitenlandse toegang te blokkeren. Volgens Anthropic kreeg het de instructie rechtstreeks van de VS en besloot het de diensten voor alle gebruikers offline te halen om zeker te voldoen aan de juridische verplichting; de Amerikaanse autoriteiten hebben hun beweegredenen niet openbaar toegelicht.
Mythos is een zeer capabel model dat uitblinkt in programmeren en het opsporen van beveiligingslekken, en werd daarom alleen beperkt beschikbaar gesteld. Fable 5 is de eerste publiek toegankelijke variant met extra veiligheidslagen om misbruik te voorkomen. De Amerikaanse zaak draait om een vermeende kwetsbaarheid waardoor die veiligheidsmaatregelen omzeild zouden kunnen worden — in die opzet zou Fable zonder vangrails feitelijk Mythos worden. Anthropic beschrijft het probleem als een relatief kleine, eenvoudige exploit en stelt dat er geen universele jailbreak bestaat, maar erkent dat beperkte omzeiling bij elk model theoretisch mogelijk is.
Het bedrijf zegt vooraf samen te hebben gewerkt met Amerikaanse instanties om zwaktes te vinden, maar meldt dat de brief van de VS weinig concrete details bevat, waardoor onduidelijk blijft of dit een escalatie is van de al gespannen relatie tussen Anthropic en de Amerikaanse overheid. Die relatie kent al conflicten: de VS heeft Anthropic eerder bestempeld als veiligheidsrisico en het bedrijf staat op een zwarte lijst, plus er loopt een rechtszaak over die kwestie.
De maatregel illustreert de groeiende invloed van nationale veiligheidszorgen op de toegang tot geavanceerde AI-modellen: ontwikkelaars kunnen gedwongen worden diensten wereldwijd te beperken als regeringen risico’s signaleren, zelfs wanneer betrokken partijen menen dat het onderliggende probleem beperkt van aard is.