ChatGPT wordt getraind door goedkope arbeidskrachten

ChatGPT wordt getraind door goedkope arbeidskrachten

Vorig artikel Volgend artikel

De wereld, en dan met name techneuten, schrijvers, onderzoekers en wetenschappers, is er vol van. ChatGPT – en zijn concullegae zoals Bard – moeten het werk en de wereld makkelijker en beter maken. De zogenoemde AI-tesktgenerators kunnen in milliseconden putten uit miljoenen of, afhankelijk van het onderwerp, zelfs miljarden teksten en andere online bronnen om antwoord te geven op de meest ingewikkelde vragen, adviezen, teksten of hele boeken schrijven en helpen bij onderzoek. Dat gezegd hebbende: dit artikel is NIET tot stand gekomen met behulp van een AI-tekstgenerator.

De juiste vragen stellen

Natuurlijk, voor het gebruik van ChatGPT heb je zelf ook kennis van zaken nodig. De AI kan je alleen (goed) helpen als je de juiste vragen stelt. En, veel belangrijker nog, de AI-tesktgenerators moeten zelf ook getraind worden. Dat heet labelen en is grotendeels handwerk. Althans, het trainen van de AI-systemen om uiteindelijk zelf in staat te zijn de juiste, meest relevante, content te vinden en verwerken.

De ‘labelers’ zijn belast met het labelen van afbeeldingen of teksten. Door dit te doen, helpen de menselijke handjes de AI-tekstgenerators om betere en meer relevante antwoorden en teksten te genereren.

Dit handmatige labelen is dus vrij cruciaal voor het trainen van ChatGPT en de nauwkeurigheid, maar ook accuratesse, van de gegenereerde antwoorden en teksten. Je zou dus mogen verwachten dat dit door mensen met kennis van zaken, en de onderwerpen waarvoor de training bedoeld is, uitgevoerd wordt. Niets blijkt echter minder waar. Tenminste voor OpenAI, de eigenaar van ChatGPT.

Goedkope uitzendkrachten

NBC News heeft in de VS ontdekt dat OpenAI voor het trainen van ChatGPT, het zogenoemde labelen gebruik maakt van uitzendbureaus die hordes goedkope arbeidskrachten leveren. En daarvoor krijgen ze dan 15 dollar per uur. Ofwel, hoe goed ChatGPT – en wellicht ook andere AI-tesktgenerators – werken, hangt af van uitzendkrachten die maar fractioneel meer betaald krijgen dan ‘hamburgerflippers’ en magazijnmedewerkers.

Let wel, daarmee wil ik echt niet zeggen dat laagbetaald personeel per definitie ook slechter is hoor. Je mag er echter wel van uit gaan dat het niet allemaal hooggeschoolde medewerkers zijn. Dat kan natuurlijk, zeker bij het labelen van content voor ingewikkelde, wetenschappelijke, onderwerpen wel een issue zijn.

Toch noemt het NBC verslag het gebruik van uitzendkrachten uit de VS al een hele vooruitgang. Voorheen werd het labelen namelijk ook (deels) uitbesteed aan bedrijven in Afrika, die personeel inhuurden dat voor amper 2 dollar per uur dit handwerk moest doen. Die werden met name ingezet voor het labelen van aanstootgevende content zodat die teksten en beelden uit de systemen van OpenAI geweerd konden worden. Het verhaal gaat dat medewerkers daarvoor dagenlang door schermen met dergelijke content.

Wat is fake, en wat niet?

Nu maar hopen dat het artikel en de vondst van NBC nieuws niet fake is, afkomstig van een concurrent van ChatGPT. Dat is met de komst van AI en tools als ChatGPT immers een van de grootste uitdagingen voor alles wat je (online) ziet en leest. Een paar jaar geleden waren we al stomverbaasd over de video’s van Obame en Rutte waarin ze vreemde uitspraken deden. Die video’s bleken met behulp van AI gemaakt te zijn, en dus fake, maar dat was nauwelijks nog te zien.

Inmiddels moet je bijna alles wat je online ziet en leest – als je er zelf niet al bij was – standaard in twijfel trekken. Zeker als het om bijzonder, vreemd of spraakmakend nieuws gaat. Het is bijna niet meer te doen om zonder grondig onderzoek te bepalen of iets nu echt of fake is. Natuurlijk, we moeten er niet vanuit gaan dat alles en iedereen ons een loer probeert te draaien, want dan verzand je heel snel in de (meest onwaarschijnlijke) complot theorieën. Met fake nieuws, nog meer polarisatie en alle gevolgen van dien.

Maar, factchecken, en je afvragen – en daarvoor nader (laten) informeren - of iets al dan niet in de buurt van de waarheid ligt, wordt wel steeds meer een dingetje. En met de steeds beter wordende tools zoals ChatGPT en Bard dus ook steeds ingewikkelder.

Ron Smeets

Ron verdiende zijn sporen in de Telecom als Mobile Cowboy. Na bijna 15 jaar was hij toe aan een nieuwe uitdaging als zelfstandig freelance journalist,...