Arbor laat AI-agents leren van hun eigen fouten

maandag, 22 juni 2026 (11:55) - Techzine

In dit artikel:

Onderzoekers van Microsoft Research en de Renmin University of China hebben een nieuw framework ontwikkeld, Arbor, dat AI-agents beter moet maken in het optimaliseren van software en machine-learningmodellen. De techniek is bedoeld voor een hardnekkig probleem: systemen die in ontwikkeling goed lijken te werken, kunnen in productie alsnog foutjes maken of belangrijke voorwaarden missen.

Arbor pakt dat anders aan dan veel bestaande coding agents. In plaats van losse experimenten te laten verlopen zonder goed geheugen, gebruikt het systeem een centrale coördinator en meerdere agents die parallel testen uitvoeren in afgescheiden omgevingen. Alle hypotheses, resultaten en conclusies worden opgeslagen in een boomstructuur, zodat ook mislukte pogingen later als kennis kunnen worden hergebruikt.

Volgens de onderzoekers voorkomt dit dat dezelfde fouten steeds opnieuw worden gemaakt en maakt het bovendien duidelijk welke verandering echt effect heeft. In tests met onder meer GPT-5.5, Claude Opus 4.6 en Gemini-3-Flash presteerde Arbor beter dan Claude Code en Codex. Gemiddeld leverde het systeem ruim 2,5 keer zoveel verbetering op, en in een zoekbenchmark steeg de nauwkeurigheid van 45,3 naar 67,7 procent.

De aanpak lijkt vooral nuttig voor langdurige optimalisatietrajecten, zoals modeltraining, AI-pijplijnen en datasynthese. Wel kost Arbor relatief veel tokens, opslag en rekenkracht, en blijft het resultaat afhankelijk van de kwaliteit van de gekozen meetmethode.

Lees het volledige artikel

BEKIJK OOK:

Vandaag Inside Oranje: Weerman in Kansas City voorspelt kans op onderbreking van Nederland-Tunesië door noodweer