'De AI Overviews van Google liegen miljoenen keren: per uur'

Google introduceerde vorig jaar de AI Overzichten, ook wel AI Overviews. Het zorgt ervoor dat wat je zoekt op de zoekmachine al binnen Google wordt beantwoord op basis van artikelen die echte mensen hebben geschreven, maar waarvoor ze dan geen credit krijgen in de vorm van verkeer naar hun website. Dit nemen van informatie is echter niet het enige grote nadeel aan AI Overviews: ze blijken de boel alleen in een uur tijd al miljoenen keren bij elkaar te liegen.

AI Overviews

AI Overviews heeft het volgens onderzoek in 90 procent van de gevallen bij het rechte einde. Het onderzoek is verricht door The New York Times om te bekijken hoe accuraat die AI Overviews zijn. Het betekent dus dat van de 10 vragen die je stelt, 1 vraag verkeerd wordt beantwoord. Afhankelijk van wat je verder met dat antwoord doet kan dat problematisch zijn. Bovendien staat er wel Google boven, en verwacht je daarbij toch een bepaald betrouwbaarheid, waardoor je het antwoord waarschijnlijk eerder voor zoete koek slikt als wanneer het bijvoorbeeld van ChatGPT zou komen.

Polymarket Money

@PolymarketMoney

·Follow

An Oumi analysis found $GOOGL Gemini 3-powered AI Overviews were accurate about 91% of the time. But at Google search scale, even that error rate can still translate into tens of millions of wrong answers per hour.

12:52 PM · Apr 7, 2026

Read 4 replies

De New York Times verrichte zijn onderzoek met Oumi, een startup die AI-modellen ontwikkelt. Het gebruik AI-tools om allerlei vragen aan AI Overviews voor te leggen en te evalueren. Ook is SimpleQA gebruikt, een tool van OpenAI waarin meer dan 4.000 vragen zitten die je kunt checken met het antwoord van AI. Het heftige is dat dit dus een vrij standaard, trainbare vragenlijst is, maar ook daar bleek AI overviews niet zo accuraat te zijn. Tegelijkertijd is het ook belangrijk om rekening te houden met de schaal: het is al snel miljoenen als er elk uur over de hele wereld zoekopdrachten worden gedaan.

AI-overzichten op Google

Bij Gemini 2.5 was er nog 85 procent accuraatheid, maar inmiddels is dat dus niet heel veel beter geworden: ondanks dat Gemini 3 er nu is, komt er een accuraatheid van 91 procent uit. Wel wisselt AI Overviews tussen verschillende modellen, afhankelijk van de vraag die wordt gesteld. Maar volgens het onderzoek van de New York Times is in de paar minuten dat je dit artikel leest al honderdduizenden keren een verkeerd antwoord uit AI Overviews komen rollen. Niet dat Google overigens zegt dat zijn AI het altijd bij het rechte eind heeft: je moet altijd zelf kritisch blijven denken als je kunstmatige intelligentie gebruikt.

Emily Turrettini

@textually

·Follow

A New York Times analysis found Google's AI Overviews now answer questions correctly about 90% of the time, which might sound impressive until you realize that roughly 1 in 10 answers is wrong. arstechnica.com/google/2026/04…

5:57 AM · Apr 8, 2026