GPT-NL positioneert zich als alternatief in strijd om AI-data
In dit artikel:
GPT-NL is deze maand voor het eerst in gebruik genomen bij een kleine groep organisaties, precies op het moment dat in Nederland de strijd over het gebruik van teksten voor AI‑training en auteursrecht oplaait. Auteurs- en journalistenorganisaties eisen dat Meta stopt met het zonder toestemming en vergoeding inzetten van Nederlandse content; anders dreigt een rechtszaak. Die maatschappelijke discussie ligt aan de basis van GPT-NL: het model is opgezet als publiek verankerd, “soeverein” alternatief voor commerciële generatieve AI, met expliciete afspraken over datagebruik, herkomst en vergoedingen.
In het tweede voortgangsrapport, gepubliceerd op 26 februari, beschrijven productmanager Saskia Lensink en R&D‑manager Frank Brinkkemper hoe het project in twee jaar is opgebouwd met een startbudget van 13,5 miljoen euro. Door scherpe keuzes en strikte kwaliteits‑ en compliance-eisen wilde het team innovatie en privacy combineren en aantonen dat waardengedreven AI praktisch inzetbaar is. De eerste modellen draaien volledig op lokale infrastructuur bij zogenoemde launching customers — organisaties waar privacy, security en naleving cruciaal zijn, zoals overheden en kennisinstellingen.
Data‑afspraken vormen de kern van de aanpak. In plaats van losse transacties bouwde GPT-NL aan een ecosysteem met een Content Board waarin governance, rollen en afspraken gezamenlijk zijn vastgelegd. Het rapport erkent technische beperkingen — getrainde content is moeilijk uit een model te verwijderen — en beschrijft maatregelen voor het geval partijen zich terugtrekken, waaronder beperkingen op herkomst in output of het aanhouden van vergoedingen tot een nieuwe modelversie beschikbaar komt. Opvallend is de overeenkomst met NDP Nieuwsmedia: volgens het project het eerste wereldwijde initiatief waarin alle aangesloten uitgevers collectief regels en vergoeding voor AI‑training afstemmen. Daarmee wil GPT-NL laten zien dat AI‑ontwikkeling ook kan versterken in plaats van ondermijnen van de journalistiek.
Technisch is de pre‑training voltooid; het model scoort goed op Nederlandstalige taken zoals samenvatten, en de focus ligt op betrouwbaarheid en bruikbaarheid in concrete toepassingen, niet op het winnen van race naar schaal. Pilots lopen onder meer voor gemeentelijke chatbots, digitale overheidsassistenten, hulp bij begrijpelijke brieven, forensische analyse en intern kenniswerk. Het aantal launching customers groeit van vijf richting tien, met een mogelijke bredere uitrol via professionele licenties en hostingproviders in de tweede helft van 2026. Op korte termijn werkt het team aan verbeterde retrieval‑augmented generation en spreeksupport. De lopende discussie rond Meta onderstreept volgens betrokkenen dat de vraag niet alleen is wie de beste AI bouwt, maar onder welke voorwaarden dat gebeurt — een rol die GPT-NL voor zichzelf wil vervullen.