Media15.08.2023

NYT laat zich niet meer ‘misbruiken’ door AI-chatbots


ChatGPT, Bard en andere generatieve AI-chatbots zijn voor een groot deel afhankelijk van input die zowel handmatig als automatisch in hun ‘systemen’ gepompt wordt. Allemaal content die ze nodig hebben als training zodat ze zelf weer goede antwoorden, en content, kunnen leveren. Een groot deel van de ‘training’ gebeurt automatisch. De chatbots zuigen, simpel gezegd, als het ware hele sites en databases leeg om zo alwetend mogelijk te worden. Over dat ‘content zuigen’ is de afgelopen maanden al wat commotie ontstaan, vooral over privacygevoelige gegevens en data die op deze manier op straat komt te liggen.

AI-training met NYT content verboden

Kranten en andere nieuwssites zijn natuurlijk een hele waardevolle bron van informatie voor het trainen van generatieve AI-tools. Welnu, de New York Times heeft onlangs haar voorwaarden aangepast. De krant verbiedt nu het gebruik van haar content om AI-tools mee te trainen. Het is niet de eerste keer dat de media actie onderneemt tegen het ‘zomaar leegzuigen’ en gebruik van hun content.

In de nieuwe voorwaarden staat dat die gelden voor alle content, tekst, foto’s, afbeeldingen, illustraties, ontwerpen, audioclips, videoclips, “look and feel” en metadata. Daarnaast mogen van de NYT webcrawlers pagina’s niet meer indexeren zodat LLM’s of AI-tools deze kunnen gebruiken om hun systemen te trainen.

De krant dreigt bij overtreding van de nieuwe voorwaarden met boetes. Al is het nog niet duidelijk hoe ze overtredingen gaan opsporen. Webcrawlers, ook die van zoekmachines, indexeren pagina’s, maar daarmee kun je niet zien of dat voor een zoekmachine is, of voor het trainen van een AI-tool of LLM aan de hand van de content van de geïndexeerde pagina.

Chatbot bedrijven terughoudend

Hoe de verschillende chatbots van Google en OpenAI getraind worden, daar doen de bedrijven nogal geheimzinnig over. Ze willen natuurlijk, en begrijpelijk, niet te diep in hun keuken laten kijken.

Uit onderzoek van onder andere The Washington Post, is gebleken dat Google voor het trainen haar kleinere versie van de CommomCrawl dataset de inhoud van 15 miljoen websites gebruikt. Daar zit ook de New York Times bij. Die crawler wordt gebruikt om LLM’s zoals Meta’s LLaMAa en Google’s T5 te trainen – een open-source taalmodel dat ontwikkelaars helpt bij het bouwen van software voor vertaaltaken.

Ron Smeets

Ron verdiende zijn sporen in de Telecom als Mobile Cowboy. Na bijna 15 jaar was hij toe aan een nieuwe uitdaging als zelfstandig freelance journalist, blogger en tekstschrijver. Het bloed kruipt echter waar het niet gaan kan. De Mobile Cowboys is back! Met lasso en zweep in de aanslag om de ingeslapen telecommarkt weer eens goed wakker te schudden en met scherp te schieten!

Verder lezen over ChatGPT

AI is gearriveerd in gaming – hoe wordt de technologie gebruikt?

De AI-hype brak pas echt uit met modellen als ChatGPT. Kunstmatige intelligentie is echter geen nieuwe rage op de markt! In 1996 gebruikte de schaakcomputer “DeepBlue” bijvoorbeeld zijn veldstukken om de koning van toenmalig wereldkampioen Garry Kasparov schaakmat te zetten.

Gaming17.04.2024

AI is gearriveerd in gaming – hoe wordt de technologie gebruikt?

Dall-E en ChatGPT verenigen zich: beeld aanpassen in de chat

OpenAI heeft steeds meer tools waarmee je AI in je voordeel kunt gebruiken: er is Dall-E, ChatGPT en dan ook nog Sora. Die werken normaal allemaal naast elkaar, maar Dall-E en ChatGPT zoeken elkaar wat meer op. Dall-E is...

Online04.04.2024

Dall-E en ChatGPT verenigen zich: beeld aanpassen in de chat

Onverwachte wending: je kunt ChatGPT nu zonder account gebruiken

ChatGPT is nu te gebruiken zonder account. Waar OpenAI het eerst verplicht stelde dat je inlogde voordat je de AI-chatbot van een vragenvuur voorzag, is dat nu niet meer nodig. Je kunt als je nu naar chat.openai.com gaat...

Online02.04.2024

Onverwachte wending: je kunt ChatGPT nu zonder account gebruiken

​5 voorbeelden van OpenAI’s Sora die je zullen verwonderen

OpenAI heeft met Sora heel interessante AI gelanceerd, hoewel het nog niet voor iedereen beschikbaar is. OpenAI heeft het wel aan verschillende visuele artiesten en filmmakers gegeven om hun ding te doen. En hun ding ded...

Online26.03.2024

​5 voorbeelden van OpenAI’s Sora die je zullen verwonderen

AI in de keuken: koken met ChatGPT

Kunstmatige Intelligentie in de keuken. Come on, we weten toch zelf wel wat we willen koken? Daar hebben we ChatGPT toch niet voor nodig? Helemaal waar, je kunt zelfs niet koken en je avondeten bestellen via Thuisbezorgd...

Online06.03.2024

AI in de keuken: koken met ChatGPT

ChatGPT Read Aloud: je favoriete chatbot leert praten en antwoorden in 32 talen

Het is zover, ChatGPT begint te praten en dat opent een hele nieuwe generatie van mogelijkheden. OpenAI's nieuwe Read Aloud-functie voor ChatGPT biedt je als gebruiker de mogelijkheid om antwoorden hardop te laten voorle...

Online06.03.2024

ChatGPT Read Aloud: je favoriete chatbot leert praten en antwoorden in 32 talen

OpenAI’s nieuwe tool Sora maakt AI-video’s

Online16.02.2024

OpenAI’s nieuwe tool Sora maakt AI-video’s

​ChatGPT leert je straks steeds beter kennen: wil je dat?

ChatGPT was eerder een beetje een hersenloze AI. Of eigenlijk juist een stel hersens zonder enige vorm van opslag. Dat gaat veranderen. Straks leert de AI-chatbot je steeds beter kennen. De bedoeling is om daarmee een pe...

Online14.02.2024

​ChatGPT leert je straks steeds beter kennen: wil je dat?

Verder lezen over Kranten

Factcheck marathon van samenwerkende media

In de aanloop naar de verkiezingen voor de Provinciale Staten organiseren een aantal (regionale) kranten samen met Nieuwscheckers van de Universiteit Leiden en het actualiteitenprogramma Pointer van KRO-NCRV een factchec...

Media27.02.2023

Factcheck marathon van samenwerkende media

In aanloop naar de verkiezingen voor de Provinciale Staten
​Media klagen ChatGPT-maker aan vanwege trainingsmiddelen

Kunstmatige intelligentiehit ChatGPT heeft zich door zijn bijzondere kunnen flink in de schijnwerper gezet, maar hoge bomen vangen veel wind. Scholen zijn er niet blij mee, schrijvers maken zich zorgen en nu is er nog ee...

Online19.02.2023

​Media klagen ChatGPT-maker aan vanwege trainingsmiddelen

Wordle is nu een krantenpuzzel

Wie nog een papieren krant (gehad) heeft, die kent ze wel. De puzzels, sudoku’s en andere invulspelletjes, meestal op de tweede of derde pagina. Althans, zo herinner ik het mij. Tegenwoordig spelen we vooral op onze sm...

Gaming01.02.2022

Wordle is nu een krantenpuzzel

New York Times neemt de populaire game over voor 'zeven cijfers'
All-Inn Verspreidingen op overname pad

Zijn huis-aan-huis-kranten nog aan de orde van de dag? Ja, want ze staan vol met informatie van de gemeente die je nodig hebt. De kranten worden daarom veel gelezen en vaak met folders rondgebracht. All-Inn Verspreidinge...

DC Business03.11.2021

All-Inn Verspreidingen op overname pad

De nacht van 14 op 15 april 1912 was de nacht van de Titanic

Het is de avond van 14 april. Precies 109 jaar geleden vond rond deze tijd een van de grootste scheepsrampen uit de geschiedenis plaats. Ik denk dat iedereen wel weet welk schip ik bedoel dat die avond, net voor midderna...

Nieuws14.04.2021

De nacht van 14 op 15 april 1912 was de nacht van de Titanic

Het nieuws bereikte de wereld pas twee dagen later
Vanaf 1922 staat er elke ochtend een strip in de krant

Voor wie elke ochtend de krant leest is het vaste prik. Naast het nieuws even de strips achterin de krant checken. Vandaag in 1922 verscheen de eerste strip in een krant. Het Rotterdams Nieuwsblad (nu onderdeel van het...

Nieuws16.02.2021

Vanaf 1922 staat er elke ochtend een strip in de krant

Belgische krant De Morgen maakt uniek jaaroverzicht van 2020

Voor de meeste Nederlander boven de rivieren zal het Belgisch Nederlandstalige dagblad De Morgen de - ver weg van hun bed show – zijn. In Vlaanderen wordt De Morgen (ooit een linkse partijkrant) gezien als een kwalitei...

Media17.12.2020

Belgische krant De Morgen maakt uniek jaaroverzicht van 2020

De chaos van het afgelopen jaar
De LINDA ook naar Talpa, Linda de Mol creatief directeur Net5

John de Mol is nog lang niet klaar met overnames. Nadat zuslief de logische overstap al maakte naar het mediabedrijf van haar broer worden nu ook de andere belangen van Linda ondergebracht bij Talpa. Zojuist is bekend ge...

Nieuws14.02.2019

De LINDA ook naar Talpa, Linda de Mol creatief directeur Net5

Media-take-over Familie de Mol