Online21.04.2023

​Chatbots komen slim over door deze verrassende sites


We weten dat ChatGPT niet helemaal van zichzelf zo slim is: het moet zijn informatie ook ergens vandaan halen. Daar is maker OpenAI dan weer wat minder open over, maar dat wil niet zeggen dat het niet toch enigszins te achterhalen valt, zo blijkt uit informatie van de Washington Post.

Dataset van AI

Er wordt vaak gedacht dat chatbots denken als mensen, maar dat is niet helemaal waar. Ze kunnen vooral informatie verwerken en dingen nabootsen. Dat merk je ook aan ChatGPT, want als je iets aan hem vraagt, dan weet je dat hij het niet zelf bedenkt: hij haalt het uit allerlei bronnen op het internet. De krant heeft de dataset van Google C4 bestudeerd en kon daardoor inkijk krijgen in de ongeveer 15 miljoen websites die er werden gebruikt om de Engelstalige AI alleen al te helpen aan zijn informatie. Welke dataset OpenAI gebruikt is echter onbekend.

Eenderde van de websites van de dataset van C4 blijkt niet meer online te zijn, maar de overige 10 miljoen wel. Het zijn journalistieke websites, websites over software-ontwikkeling, de medische wereld, entertainment en contentcreatie. De grootste websites zijn patent.google.com, wikipedia.org (ja, echt) en scribd.com. Andere hooggerankte websites zijn onder andere een pagina over piraterij, World of Warcraft en burnouts.

Wikipedia en WordPress

Nu is dat nog niet eens tot daaraan toe: er staan meer dan 200 miljoen meldingen van websites binnen C4 waarin een copyright-symbool op de pagina staat. Oftewel; dat mag je niet kopiëren en dus ook niet voor een dataset gebruiken. Er zitten in de dataset ook heel veel persoonlijke blogs: maar liefst een half miljoen, waaronder WordPress-sites, Tumblr, Blogspot en Live Journal.

Er is ook een bloklijst bij Google, zodat er niet allemaal scheldwoorden doorheen komen en discriminatie zoveel mogelijk wordt geëlimineerd. Hetzelfde geldt voor pornografie en hakenkruizen. Dat is natuurlijk alleen de dataset van Google: andere bedrijven hebben weer andere regels. Die van OpenAI GPT-3, de ChatGPT-taal voor de huidige, was 40 keer zo groot en maakte ook onder andere gebruik van Wikipedia.

Open over AI

Mocht je het trouwens flauw vinden dat OpenAI hier verder niet zo open over is: veel bedrijven willen hun trainingsdata niet vrijgeven omdat het wil voorkomen dat persoonlijke data op straat komt te liggen, of uiteraard content die wordt gebruikt zonder dat hiervoor toestemming wordt gevraagd, iets wat veelal voorkomt.

Het zal nog lange tijd een vage wereld blijven, die van de datasets van AI-chatbots. Tenzij de overheid komt met wet- en regelgeving hieromtrent, wat op zich op de loer ligt nu steeds meer mensen (waaronder kunstenaars) rechtszaken aanspannen tegen het onrechtmatig gebruik van hun creaties voor het trainen van deze slimme hulpjes.

Laura Jenny
Laura Jenny

Is ze niet aan het tikken, dan reist ze rond in de wondere wereld van entertainment of op een toffe plek in de echte wereld. Mario is de man van haar leven, Belle is haar beste vriendin en haar laptop is nooit ver weg.

...

Verder lezen over ChatGPT

ChatGPT heeft nu een kerstmannenmodus om mee te praten

Je vindt de kerstman in de browserversie en de app-versie van ChatGPT. Het is een van de stemmen die je kunt kiezen als je op het spraak-icoon tikt.

Online13.12.2024

ChatGPT heeft nu een kerstmannenmodus om mee te praten

Videotool Sora van OpenAI is nu officieel beschikbaar

OpenAI heeft in het kader van zijn 12 Days of Shipmas eindelijk Sora officieel beschikbaar gemaakt.

Video09.12.2024

Videotool Sora van OpenAI is nu officieel beschikbaar

OpenAI speelt voor kerstman: elke dag een nieuwe AI-mogelijkheid

Gisteravond werd aangekondigd wat het eerste cadeau is van 12 ‘cadeaus’ die we mogen verwachten. Het zijn nieuwe AI-mogelijkheden in de vorm van o1.

Online06.12.2024

OpenAI speelt voor kerstman: elke dag een nieuwe AI-mogelijkheid

Waarom sommige namen zorgen dat ChatGPT crasht

Wist je dat ChatGPT ook van dat soort dingen heeft? De AI-chatbot krijgt het bij sommige namen te kwaad. Dit is hoe dat komt.

Online03.12.2024

Waarom sommige namen zorgen dat ChatGPT crasht

Langverwachte OpenAI-videotool Sora is nu online: niet door OpenAI

OpenAI heeft de tool nog niet online beschikbaar gemaakt voor het grote publiek met een reden. Het gaf in oktober nog aan dat het Sora veiliger wil maken.

Video27.11.2024

Langverwachte OpenAI-videotool Sora is nu online: niet door OpenAI

Apple werkt aan LLM Siri: Een revolutionaire stap in spraakassistentie

Apple is bezig met een ambitieuze upgrade van Siri, hun populaire digitale assistent. De nieuwe versie, intern bekend als "LLM Siri," is gebaseerd op geavanceerde AI-technologieën en heeft als doel Siri aanzienlijk slimmer en veelzijdiger te maken.

Technology25.11.2024

Apple werkt aan LLM Siri: Een revolutionaire stap in spraakassistentie

ClimateGPT: De volgende stap in klimaatonderzoek?

Op woensdag 13 november 2024 kwamen ambtenaren en beleidsmakers samen voor de AI en Overheid conferentie, georganiseerd door iBestuur, het Ministerie van Binnenlandse Zaken en Koninkrijksrelaties, LEF future center, Rijkswaterstaat en de Nederlandse AI Coalitie. Tijdens deze bijeenkomst presenteerde Daniel Erasmus ClimateGPT, een innovatief AI-model dat is ontworpen om beleidsmakers te ondersteunen in de strijd tegen klimaatverandering. Naast Erasmus kreeg ook ik de kans om te spreken en mijn inzichten te delen over de toepassing van AI binnen de overheid.

Technology20.11.2024

ClimateGPT: De volgende stap in klimaatonderzoek?

Komt er een moment waarop AI niet meer kan verbeteren?

Zo zou de verandering van het huidige top-AI-model van OpenAI naar het volgende een vrij kleine sprong zijn. 

Online19.11.2024

Komt er een moment waarop AI niet meer kan verbeteren?

Verder lezen over Google

Google introduceert kwantumcomputer: ‘Parallelle universa bestaan’

Willow is de kwantumcomputer van Google en de processor binnenin kan in 5 minuten iets berekenen waar een andere computer waarschijnlijk nooit iets mee zou kunnen.

Technology11.12.2024

Google introduceert kwantumcomputer: ‘Parallelle universa bestaan’

Trending: dit zochten we meer dan ooit op Google in 2024

We blijven ondanks dat TikTok ook steeds vaker als zoekmachine wordt gebruikt toch vrolijk door-Googelen. Dit was trending in 2024.

Search10.12.2024

Trending: dit zochten we meer dan ooit op Google in 2024

Google: Google Zoeken gaat volledig veranderen volgend jaar

Hij zei dat je zelfs al vroeg in 2025 heel nieuwe dingen kunt doen dan nu. Hij spreekt over een duidelijke shift en zegt dat er nog heel veel innovatie aankomt.

Search06.12.2024

Google: Google Zoeken gaat volledig veranderen volgend jaar

Google wil ook AI-video’s maken net als OpenAI Sora

Google en OpenAI zijn verwikkeld in een strijd: wie heeft straks de generatieve AI-tool voor video's in handen?

Online05.12.2024

Google wil ook AI-video’s maken net als OpenAI Sora

DeepMind introduceert GenCast: AI-Revolutie in weersvoorspellingen

DeepMind, het AI-onderzoeksbedrijf van Google, heeft GenCast gelanceerd: een geavanceerd AI-model dat niet alleen weersvoorspellingen naar een hoger niveau tilt, maar ook levens kan redden door sneller en nauwkeuriger extreme weersomstandigheden te voorspellen.

Technology05.12.2024

DeepMind introduceert GenCast: AI-Revolutie in weersvoorspellingen

Wat kunnen we verwachten van Google’s ‘Year in Search 2024’?

Elk jaar publiceert Google een overzicht van de meest trending zoekopdrachten wereldwijd, beter bekend als de "Year in Search" (voorheen Zeitgeist). Dit rapport geeft inzicht in de onderwerpen die mensen het afgelopen jaar het meest bezighielden.

Search03.12.2024

Wat kunnen we verwachten van Google’s ‘Year in Search 2024’?

Laat je website groeien met backlinks: zo pak je dat aan

Je steekt elke dag heel veel tijd en liefde in je website, maar dat wordt niet beloond in de vorm van meer bezoekers of inkomsten? De manier om je website meer op het vizier te krijgen van bijvoorbeeld Google, en daarmee indirect dus ook meer mensen, dat is om je content te verrijken. Dat kun je bijvoorbeeld doen met beeld, maar ook met backlinks. Dit is wat dat is en vooral: hoe je ze gebruikt.

DC Business02.12.2024

Laat je website groeien met backlinks: zo pak je dat aan

Google Chat wil meer op het populaire Slack lijken

Het is bij bijvoorbeeld Slack letterlijk hoe een snelle call heet: Huddles zijn mogelijk om te houden als videomeetings, straks ook in Google Chat.

Online28.11.2024

Google Chat wil meer op het populaire Slack lijken

Verder lezen over Kunstmatige Intelligentie

ChatGPT heeft nu een kerstmannenmodus om mee te praten

Je vindt de kerstman in de browserversie en de app-versie van ChatGPT. Het is een van de stemmen die je kunt kiezen als je op het spraak-icoon tikt.

Online13.12.2024

ChatGPT heeft nu een kerstmannenmodus om mee te praten

10 voorspellingen voor 2025 van SAP: 
het is vooral AI dat de klok slaat

Wat kunnen bedrijven in 2025 verwachten op het gebied van technologie en innovatie? Volgens SAP staat het komende jaar in het teken van de doorbraak van AI, cloud-first-strategieën en datatransparantie als drijvende krachten achter succesvolle bedrijfsvoering.

Technology13.12.2024

10 voorspellingen voor 2025 van SAP: 
het is vooral AI dat de klok slaat

AI-bedrijf adverteert in San Francisco: ‘Neem geen mensen meer aan’

Wij vinden het bijdehand, maar in de Verenigde Staten wordt er minder positief op gereageerd.

Advertising11.12.2024

AI-bedrijf adverteert in San Francisco: ‘Neem geen mensen meer aan’

Sora de toekomst van AI-videocreatie

De introductie van Sora, de nieuwste AI-tool van OpenAI, markeert een mijlpaal in de wereld van videoproductie. Wat begon als een tool om tekst om te zetten naar video, heeft zich ontwikkeld tot een complete AI-videobewerkingssuite die innovatie en toegankelijkheid naar een nieuw niveau tilt.

Technology10.12.2024

Sora de toekomst van AI-videocreatie

Een baanbrekende introductie
DS Automobiles ontvangt award voor ChatGPT-integratie

DS Automobiles heeft de prestigieuze SMARTBEST 2025 Award in de wacht gesleept voor de baanbrekende integratie van ChatGPT in hun voertuigen. Deze prijs, toegekend door de onafhankelijke jury van AUTOBEST, erkent innovatieve technologieën die een significante impact hebben op de automotive sector en de gebruikerservaring.

Automotive10.12.2024

DS Automobiles ontvangt award voor ChatGPT-integratie

Videotool Sora van OpenAI is nu officieel beschikbaar

OpenAI heeft in het kader van zijn 12 Days of Shipmas eindelijk Sora officieel beschikbaar gemaakt.

Video09.12.2024

Videotool Sora van OpenAI is nu officieel beschikbaar

Nieuwe AI Kersthit: ‘Christmas With You There’

Wat krijg je als je een radio-presentator en een AI-expert zonder enig muzikaal talent een Kersthit willen maken? Kees Dorresteijn (BNR Nieuwsradio) en Remy Gieling (ai.nl) hebben de handen ineengeslagen om met behulp van AI een nieuwe kerstervaring te creëren.

Entertainment09.12.2024

Nieuwe AI Kersthit: ‘Christmas With You There’

Google: Google Zoeken gaat volledig veranderen volgend jaar

Hij zei dat je zelfs al vroeg in 2025 heel nieuwe dingen kunt doen dan nu. Hij spreekt over een duidelijke shift en zegt dat er nog heel veel innovatie aankomt.

Search06.12.2024

Google: Google Zoeken gaat volledig veranderen volgend jaar

Verder lezen over Onderzoek

Zo ziet ‘de wetenschappelijke methode’ van onze wolvendeskundigen eruit

Naar aanleiding van de contacten met verschillende wolvendeskundigen heb ik inmiddels voldoende informatie verzameld om nog beter te kunnen duiden waar precies de blinde vlekken van de meeste Nederlandse wolvendeskundigen zitten. Uitzonderingen daargelaten negeren wolvendeskundigen belangrijke historische tijdperken en hun wetenschappelijke werken. Bovendien laten ze zich bij voorkeur leiden door geromantiseerde en naïeve vooronderstellingen met betrekking tot zgn. ideale natuurlijke omstandigheden.

Online11.12.2024

Zo ziet ‘de wetenschappelijke methode’ van onze wolvendeskundigen eruit

25% van de Nederlandse bedrijven is niet goed voorbereid op cyberdreiging

Helemaal in de gezondheidszorg blijken grote zorgen te zijn: daar zou 40 procent onvoldoende zijn voorbereid.

Cybercrime29.10.2024

25% van de Nederlandse bedrijven is niet goed voorbereid op cyberdreiging

Hoe valt het ontstaan van eilandbogen of vulkaanbogen te verklaren?

Is het jou ook weleens opgevallen dat er door sommige eiland- en vulkaanketens op de kaart een duidelijke gebogen lijn of curve kan worden getrokken? Binnen de geologie noemen we een dergelijk verschijnsel eilandbogen of vulkaanbogen.

Online28.10.2024

Hoe valt het ontstaan van eilandbogen of vulkaanbogen te verklaren?

Online marketingcampagnes vooral effectief voor nieuwe klanten

Online marketingcampagnes zorgen voor aanzienlijk meer nieuwe klanten, zonder dat de bestaande klanten worden geactiveerd. Uit onderzoek blijkt dat campagnes op bijvoorbeeld social media zorgen voor 170 procent nieuwe klanten.

Marketing01.10.2024

Online marketingcampagnes vooral effectief voor nieuwe klanten

Gecombineerde NIVEL- en CBS-gegevens COVID-19-pandemie zijn prima te verklaren!

Elke zichzelf respecterende data-wetenschapper weet dat je niet zonder meer verschillende datasets uit verschillende onderzoeken met elkaar kunt vergelijken. Op dergelijke verschillende datasets kunnen namelijk onvergelijkbare omstandigheden van toepassing zijn die onderlinge vergelijkingen een uiterst heikele zaak maken.

Nieuws17.09.2024

Gecombineerde NIVEL- en CBS-gegevens COVID-19-pandemie zijn prima te verklaren!

“Trap Er Niet Influencer” doet onderzoek naar effecten van social media

Denk je echt dat je in één dag rijk kan worden door wat domme trucjes van een of andere zelfverklaarde influencer? Ze beloven gouden bergen, maar hoe zit het nu echt? In deze nieuwe achtdelige televisieserie ‘Trap er Niet Influencer’ onderzoeken presentatoren Filemon Wesselink, Mark Baanders, Vera Verzijl en Sarah Bakker verschillende trends en invloeden van social media met een kritische en humoristische blik.

Social Media04.09.2024

“Trap Er Niet Influencer” doet onderzoek naar effecten van social media

De stollingsgesteenten cyclus op aarde

De meeste mensen kunnen zich wel voorstellen dat onze planeet van binnen naar buiten is opgebouwd overeenkomstig een aflopend dichtheidsprofiel. Met van binnen naar buiten een nikkelijzeren vaste binnenkern, een nikkelijzeren vloeibare buitenkern, een vaste ondermantel van silicaatarmere gesteenten, een vaste bovenmantel van silicaatrijkere gesteenten en 'last but not least' onze geliefde aardkorst.

Nieuws21.08.2024

De stollingsgesteenten cyclus op aarde

Heeft AI-chatbot ChatGPT onze levens echt veranderd?

Er wordt steeds vaker gesproken over een AI-bubbel, zeker nu de aandelen van techbedrijven enorme dips tonen. Barst die bubbel straks echt? Het is niet zo dat AI-chatbots ons niets hebben gebracht. Zo is er onderzoek gedaan naar of ChatGPT onze levens echt heeft veranderd en daar komt positief nieuws uit.

Artificial Intelligence14.08.2024

Heeft AI-chatbot ChatGPT onze levens echt veranderd?