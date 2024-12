Maar hoe kan dat nou, als LLM’s op zoveel data worden getraind? Waarom is het op een gegeven moment teveel? Dat heeft er onder andere mee te maken dat er ook context mist voor LLM’s: juist veel belangrijke informatie is vertrouwelijk of afhankelijk van tijd, wat het niet zo geschikt maakt voor training. Eigenlijk zou je kunnen stellen dat op heel belangrijke punten AI niet goed genoeg is getraind. Bovendien kunnen mensen iets wat LLM’s tot nu toe weinig doen: nadenken over eerdere data. Het verwerkt vooral data, het is er verder mogelijk onvoldoende mee bezig. Wij mensen doen dat wel: we denken aan eerdere dingen die we hebben geleerd, we leggen verbanden, enzovoort.

Aandachtsmechnisme

Dit wordt wel al beter, namelijk door het zogeheten ‘aandachtsmechanisme’ te gebruiken waarbij een LLM bij nieuwe informatie een soort check terug doet op oudere informatie. Door dit systeem, ook bekend als transformator, kon de volledige verwerkingskracht van een GPU worden gebruikt en konden LLM’s aanzienlijk groeien. Echter, dat aandachtsmechanisme vraagt meer rekenkracht en dat wordt soms te veel. Een prompt met 10 tokens zou 414.720 aandachtsbewerkingen vergen, bij 10.000 tokens is dat 460 miljard. Dit is waarom tokens ook duur zijn in aanschaf: ze betekenen ook echt iets voor ‘het systeem’.

Er wordt nu gezocht naar een manier om dat aandachtsmechanisme te verbeteren. Transformers hebben als voordeel dat ze informatie goed kunnen oproepen omdat ze de context van elk token onthouden, maar zodra die context groter en groter wordt, beginnen ze te stikken. Je vergeet door het gemak van AI-chatbots soms hoeveel erg eigenlijk in de achtergrond gebeurt: reden om daar wat vaker bij stil te staan als je weer met een query komt, en goed te bedenken hoe je de AI -en uiteindelijk ook jezelf- het beste kunt helpen om snel met een goed antwoord te komen.