Claude Fable 5 en Mythos 5 geblokkeerd: is AI nu te gevaarlijk?
In dit artikel:
Aan het einde van de werkweek kreeg Anthropic uit Washington het bevel om de toegang tot twee van zijn nieuwste taalmodellen, Claude Fable 5 en Mythos 5, voor niet-Amerikaanse gebruikers af te sluiten. De Amerikaanse autoriteiten motiveren de maatregel met een vermeende “jailbreak” van deze modellen die nationale veiligheidsrisico’s zou opleveren; het rapport waarnaar wordt verwezen zou aantonen dat dezelfde exploit ook toepasbaar is op OpenAI’s GPT-5.5. Als gevolg daarvan geldt voorlopig een volledige blokkade van Fable 5 en Mythos 5 buiten de VS.
Wat er precies misgaat met de jailbreak blijft onduidelijk: publieke details ontbreken en Anthropic zegt dat de beschreven exploit moeilijker tegen Mythos- en Fable-varianten te misbruiken is. Wel bevestigt het patroon eerdere bevindingen dat de zogenaamde guardrails van grote taalmodellen fundamenteel kwetsbaar kunnen zijn. Zowel recent werk van OpenAI als van Anthropic zelf toonde al aan dat beperkingen om schadelijke output te weren vaak te omzeilen zijn.
Anthropic verzet zich tegen de beslissing. Het bedrijf stelt vooraf meerdere overheden te hebben geraadpleegd en zowel interne als externe testen te hebben uitgevoerd om de veiligheidsmaatregelen te valideren. In de praktijk zou gevoelige informatie — zoals details over cybersecurity of biologie — bij Fable 5 en Mythos 5 al snel door beveiligingen zijn geblokkeerd; als alternatief biedt Anthropic een minder capabel model (Opus 4.8) aan voor situaties met veiligheidsgevoelige vragen. Desondanks heeft het Pentagon en andere Amerikaanse beleidsmakers kennelijk anders geoordeeld, waardoor de regering ingreep.
De blokkade zet een nieuwe toon in AI-governance: voor het eerst beperkt een overheid direct de beschikbaarheid van state-of-the-art LLM’s, niet alleen de export van hardware of chiptechnologie. Tot nu toe richtten controles zich vooral op chips en lithografietechnieken (denk aan maatregelen tegen Nvidia en ASML); nu is de softwarekant van ‘frontier AI’ direct geraakt. De maatregel laat zien dat de VS de praktische macht heeft om verspreiding van geavanceerde modellen te stoppen — al oogt de stap ad hoc en zonder precedent in recente techgeschiedenis.
Economisch en strategisch heeft dit grote gevolgen. Anthropic staat op het punt naar de beurs te gaan; een langdurige blokkade kan de IPO uitstellen en miljarden aan ontwikkelkosten zonder opbrengst laten staan. Meer algemeen rammelt de investeringslogica: de markt rekent erop dat AI-capaciteit en -prestaties blijven groeien. Als beleidsingrepen die verwachting substantieel temperen, kan dat het sentiment op Wall Street raken.
Op de langere termijn zijn de effecten echter beperkt: eerdere voorbeelden tonen dat technische kennis verspreidt. In 2025 lekte of werd het model R-1 van het Chinese DeepSeek openlijk gedeeld, waardoor bijna-frontier AI door velen reproduceren werd. De snel groeiende open-sourcegemeenschap en andere labs met voldoende rekenkracht kunnen uiteindelijk vergelijkbare modellen bouwen, waardoor nationale restricties slechts tijdelijk remmend werken. Ook is het waarschijnlijk dat concurrerende spelers zoals OpenAI of Google op enig moment vergelijkbare capaciteiten bereiken, wat de effectiviteit van Amerikaanse beperkingen verder zou verminderen.
De zaak illustreert twee fundamentele dilemma’s: enerzijds de reële veiligheidszorgen rond misbruik (deepfakes, geautomatiseerde phishing, kwetsbare AI-gegenereerde code), anderzijds de grenzen van controle als kennis en modellen zich globaliseren. De Amerikaanse maatregel geeft invulling aan een door velen verlangde ‘pauze’ in frontier-AI, maar komt jaren nadat grootschalige verspreiding al heeft plaatsgevonden en nadat veel schadelijke toepassingen al wijdverbreid zijn.
Wat kan Anthropic doen om de modellen weer beschikbaar te krijgen? Mogelijke routes zijn intensieve technische fixes van de geïdentificeerde kwetsbaarheid, nauwere samenwerking en transparantie richting Amerikaanse toezichthouders, beperktere en streng gecontroleerde toegang (gevangenisachtige “walled garden”-deployments), of herontwerp van functies die als kwetsbaar worden gezien. Geen van die opties is gegarandeerd succes: het politieke oordeel en het bewijs rond de exploit blijven doorslaggevend.
Samengevat: de Amerikaanse blokkade van Fable 5 en Mythos 5 markeert een nieuw hoofdstuk in AI-regulering — een directe ingreep tegen geavanceerde LLM-distributie vanwege veiligheidszorgen. Op korte termijn schaadt het Anthropic financieel en zet het de discussie over ontwikkelpauzes en controle op scherp. Op middellange tot lange termijn blijft de kans groot dat vergelijkbare technologie elders opduikt en dat de spanningen tussen innovatie, marktbelangen en nationale veiligheid voortduren.