Google maakt doorbraak in efficiëntie voor AI-agents
In dit artikel:
Google-onderzoekers en onderzoekers van de University of California, Santa Barbara publiceerden recent een arXiv-paper — besproken door VentureBeat — waarin ze een nieuw framework voorstellen om AI-agents zuiniger en slimmer om te laten gaan met rekenkracht en externe tool-calls. Het onderzoek adresseert een groeiend probleem bij agentic AI: in praktische taken zoals websearch en documentanalyse bepalen het aantal externe acties en het vergrote contextvenster de kosten, latency en tokenverbruik, terwijl extra budget niet automatisch betere uitkomsten oplevert omdat agents vaak geen besef hebben van hun resterende middelen.
Als eerste maatregel introduceren de auteurs Budget Tracker, een lichte, prompt-gebaseerde module (geen hertraining nodig) die agents continu informeert over het beschikbare budget en gedragsrichtlijnen geeft voor verschillende budgetniveaus. In experimenten met ReAct-achtige zoekagents reduceert dit het aantal search-calls met ruim 40% en browse-calls met bijna 20%, met een totale kostenreductie van meer dan 30%, zonder prestatieverlies — en zelfs met betere schaalbaarheid bij hogere budgetten vergeleken met traditionele agents.
Daarnaast presenteren ze het bredere framework BATS (Budget Aware Test-time Scaling), dat planning, verificatie en budgetbewustzijn in een iteratief besluitvormingsproces integreert. Tests op benchmarks zoals BrowseComp en HLE-Search — onder meer met Gemini 2.5 Pro als backbone-model — tonen aan dat BATS hogere nauwkeurigheid behaalt tegen lagere kosten dan bestaande methoden. Voor organisaties die API-kosten, latency en contextgroei willen beheersen biedt dit werk een praktisch pad om agents efficiënter en doelgerichter te laten werken.