Cybercrime04.08.2023

​Studie toont aan: AI-chatbots kunnen worden gesaboteerd


Er is heel veel werk gestoken in het zorgen dat AI-chatbots geen persoonlijke informatie geven of op een heel slechte manier kunnen worden ingezet. Echter is het onderzoekers gelukt om dat alles te omzeilen. Dit is hoe het zit, en hoe potentieel gevaarlijk dat kan zijn.

AI-chatbots manipuleren

De mensen van Carnegie Mellon University hebben ontdekt dat als ze een bepaalde soort code aan een prompt toevoegen, er wel degelijk lelijke dingen kunnen worden gezegd door een aan AI-chatbot. Het probleem is dat dit niet alleen bij een AI-chatbot het geval is: dit is helaas bij allemaal een groot zwakte: “Er is geen manier die we kennen om dit te patchen,” zegt Zico Kolter, een universitair hoofddocent aan CMU. “We weten gewoon niet hoe we ze veilig kunnen maken.”

ChatGPT, Bard, Claude: ze zijn allemaal niet opgewassen tegen het open source-taalmodel dat de onderzoekers gebruikten. Door die code toe te voegen aan een prompt krijg je als het ware de sleutel om dieper in de chatbot te vragen en daardoor kun je hem dingen laten doen die niet oke zijn. Hoe kan ik een waterstofbom maken, hoe kan ik iemand voor altijd laten verdwijnen, hoe kan ik illegale drugs maken: normaliter krijg je daar geen serieus antwoord op, maar wel als je die code achter je prompt zet.

Bots verbeteren

Wired schrijft dat de AI-chatbots wel op de hoogte zijn gesteld en wel wat hebben aangepast, maar helaas lukt het de onderzoekers nog steeds om hun zin te krijgen en de chatbots gevaarlijker te maken. De reactie van de chatbotmakers op het probleem is ook wat homogeen: Google en OpenAI zeggen allebei dat ze er continu aan werken om de bots te verbeteren. Ondertussen zorgen aanvallers dat ze de manier waarop de systemen gegevens oppikken om te leren worden beïnvloed zodat ze afwijkend gedrag gaan vertonen. Dat kan echter ver gaan: afbeeldingen kunnen worden aangepast waardoor AI die beelden verkeerd identificeren. Het doet denken aan een onderzoek uit 2018 waarin onderzoekers stickers op verkeersborden plakten om een zelfrijdende auto-systeem voor de gek te houden. Dat werkte erg goed en het lijkt erop dat er door de manier waarop AI-modellen werken ook geen mogelijkheid is om dat helemaal uit te bannen.

Een AI-bot die nu wordt gebruikt om vluchten te boeken, kan door dit soort code worden ingezet om potentieel gevaarlijke aanvallen uit te voeren. Het zou goed zijn als de beveiligingsagenten bij de verschillende chatbots de koppen bij elkaar staken en samenwerkten aan manieren om hun chatbots zo veel mogelijk dicht te timmeren, voor zover dat kan, uiteraard. Zorgen dat AI-chatbots niet in verkeerde handen kunnen komen, daar is het helaas al te laat voor, dus we zullen er harder aan moeten werken om de schade te beperken.

Laura Jenny
Laura Jenny

Is ze niet aan het tikken, dan reist ze rond in de wondere wereld van entertainment of op een toffe plek in de echte wereld. Mario is de man van haar leven, Belle is haar beste vriendin en haar laptop is nooit ver weg.

Verder lezen over ChatGPT

Oprah leidt een panel met belangrijke mensen in AI: de wereld is verbaasd

Oprah presenteert een tv-special om te vertellen hoe AI het dagelijks leven beïnvloedt en er zitten bekende mensen uit de tech-industrie bij om dat verhaal te doen.

Artificial Intelligence04.09.2024

Oprah leidt een panel met belangrijke mensen in AI: de wereld is verbaasd

ChatGPT heeft wekelijks dubbel zoveel gebruikers

ChatGPT is een jaar later nog steeds razend populair. We zijn duidelijk nog lang niet klaar met AI, maar net begonnen.

Artificial Intelligence30.08.2024

ChatGPT heeft wekelijks dubbel zoveel gebruikers

HubSpot komt met gratis tool voor AI zoekoptimalisatie

Consumenten en bedrijven kiezen steeds vaker voor AI-toepassingen om online antwoorden te vinden op hun vragen. Het gebruik van tools als ChatGPT voor zoekfuncties is zelfs met 37% gestegen, terwijl het gebruik van traditionele zoekmachines met 11% is gedaald.* Marketeers die zich tot nu toe hebben gericht op Search Engine Optimization (SEO) om hun merk goed in beeld te brengen, zullen zich nu (ook) moeten specialiseren in een nieuw vak: Language Model Optimization (LMO).

Marketing22.08.2024

HubSpot komt met gratis tool voor AI zoekoptimalisatie

Autoriteit Persoonsgegevens: gebruik AI-chatbot kan leiden tot datalek

De Autoriteit Persoonsgegevens maakt zich zorgen om een nieuw soort datalek: het ontstaat via AI-chatbots.

Nieuws08.08.2024

Autoriteit Persoonsgegevens: gebruik AI-chatbot kan leiden tot datalek

Geen watermerk voor ChatGPT om angst dat gebruikers weglopen

Je kunt in principe niet zien dat een tekst door ChatGPT is gemaakt. Dat gaat ook niet veranderen: OpenAI wil niet aan een watermerk.

Online05.08.2024

Geen watermerk voor ChatGPT om angst dat gebruikers weglopen

SearchGPT: Een innovatieve stap in AI-zoektechnologie

OpenAI heeft met de introductie van SearchGPT een nieuwe mijlpaal bereikt in de wereld van kunstmatige intelligentie en zoektechnologie. Dit prototype combineert geavanceerde AI-modellen met realtime webinformatie, waardoor gebruikers snel en nauwkeurig antwoorden kunnen verkrijgen via een gebruiksvriendelijke conversatie-interface.

Artificial Intelligence01.08.2024

SearchGPT: Een innovatieve stap in AI-zoektechnologie

We hebben geen idee wanneer we met een robot praten

Jij denkt dat je op de chat de robot er altijd uitpikt? Vergeet het maar, we blijken gesprekken te hebben met robots zonder dat we het weten.

Online20.06.2024

We hebben geen idee wanneer we met een robot praten

OpenAI stopt tijdelijk met Sky omdat Scarlett Johansson boos is

Scarlett Johansson is boos. OpenAI heeft voor zijn ChatGPT-stem Sky een stem gekozen die erg lijkt op haar vertolking in Her. Nu is Sky er (tijdelijk) niet meer.

Online21.05.2024

OpenAI stopt tijdelijk met Sky omdat Scarlett Johansson boos is

Verder lezen over Hackers

TeamViewer heeft een groot cybersecurity-probleem

Als je een kantoorbaan hebt, dan is de kans groot dat je TeamViewer wel kent. Het is een manier waarmee een IT-helpdesk je computer kan ‘overnemen’. Echter blijkt dat TeamViewer zelf is overgenomen, en niet op een positieve manier.

Cybercrime29.08.2024

TeamViewer heeft een groot cybersecurity-probleem

Financiële fraude met phishingmethode specifiek gericht op Android & iOS

Er is weer een ongewoon type phishing-campagne ontdekt volledig gericht op mobiele gebruikers, Eset Research analyseerde een ‘in the wild’ waargenomen geval gericht op klanten van een belangrijke Tsjechische bank. Deze techniek is opmerkelijk omdat het een phishingapp installeert vanaf een website van derden zonder dat de gebruiker de installatie van apps van derden hoeft toe te staan. Op Android kan dit resulteren in een stille installatie van een bijzonder soort APK, die zelfs vanuit de Google Play Store lijkt geïnstalleerd te zijn. De bedreiging was ook gericht op iPhone (iOS)-gebruikers.

Cybercrime26.08.2024

Financiële fraude met phishingmethode specifiek gericht op Android & iOS

Wielrenner, je racefiets kan gehackt worden

Het zijn geen e-bikes, maar toch kunnen racefietsen gehackt worden. Dit is hoe een hacker dat kan doen en waar het door komt.

Cybercrime16.08.2024

Wielrenner, je racefiets kan gehackt worden

Veel openbare WiFi netwerken in Parijs zijn onveilig

Experts van Kaspersky hebben bijna 25.000 gratis WiFi-spots in Parijs geanalyseerd voor de Olympische Zomerspelen en Paralympische Spelen. Uit hun analyse blijkt dat bijna 25 procent van deze netwerken zwakke of geen encryptie heeft, waardoor gebruikers kwetsbaar zijn voor diefstal van persoonlijke- en bankgegevens. Slechts zes procent van de netwerken maakt gebruik van het nieuwste beveiligingsprotocol WPA3.

Cybercrime29.07.2024

Veel openbare WiFi netwerken in Parijs zijn onveilig

Vigorish Viper: een Chinees cybercrimesyndicaat ontdekt door Infoblox

Infoblox heeft een belangrijke doorbraak geboekt in onderzoek naar cybercriminaliteit met de onthulling van een groep cybercriminelen, die de naam "Vigorish Viper" heeft gekregen. Dit is een Chinees georganiseerd misdaadsyndicaat dat gebruikmaakt van geavanceerde technologie om te profiteren van de wereldwijde illegale sportgokindustrie ter waarde van $1.700 miljard. Het syndicaat heeft ook banden met witwaspraktijken en mensenhandel operaties in heel Azië. Deze ontdekking van Infoblox betekent een belangrijke mijlpaal in de voortdurende strijd tegen wereldwijde cybercriminaliteit door middel van DNS-intelligentie.

Cybercrime25.07.2024

Vigorish Viper: een Chinees cybercrimesyndicaat ontdekt door Infoblox

banden met Europese voetbalsponsors, mensenhandel en illegale gokindustrie
Cyberafpersing is het afgelopen jaar wereldwijd met 77% toegenomen

Het aantal geregistreerde organisaties dat slachtoffer werd van cyberafpersing is wereldwijd met 77% toegenomen in de afgelopen 12 maanden. Dat blijkt uit de Cy-Xplorer 2024, het rapport van Orange Cyberdefense dat jaarlijks de ontwikkeling van cyberafpersing beschrijft.

Cybercrime04.07.2024

Cyberafpersing is het afgelopen jaar wereldwijd met 77% toegenomen

Veel zorginstellingen hebben last van DDoS-ransomware aanvallen

De behoefte aan gezondheidszorg neemt wereldwijd toe. Dit gaat gepaard met een groeiende behoefte aan moderne technologie ter ondersteuning van de patiëntenzorg. Uit nieuw onderzoek van SOTI blijkt dat 78% van Nederlandse zorgverleners vindt dat organisaties moeten investeren in nieuwe technologie.

Cybercrime27.06.2024

Veel zorginstellingen hebben last van DDoS-ransomware aanvallen

Waarom verstuurt Google weer account- en inloglinks in mails?

Sinds enige tijd verstuurt Google accountnotificaties over veiligheidsissues of nieuwe functies naar de inbox van Gmail. Verontrustend feit daarbij is dat deze emails een directe link naar de desbetreffende accountinformatie bevatten.

Cybercrime26.06.2024

Waarom verstuurt Google weer account- en inloglinks in mails?

Verder lezen over Kunstmatige Intelligentie

AI-tool personaliseert je workouts slimmer

De tijd van vaste trainingsschema’s lijkt voorbij. EGYM Genius, een nieuwe AI-tool, past je trainingen namelijk volledig aan op jouw dag en doelen. Geen strakke routines meer waarbij je maandag altijd dezelfde oefeningen moet doen. De AI kijkt naar wat jij nodig hebt en zorgt dat je altijd vooruitgang boekt, zelfs als je een dag mist.

Online10.09.2024

AI-tool personaliseert je workouts slimmer

Challenge: Volledig autonoom dwergtomaten telen zonder menselijke tussenkomst

In de kassen van Wageningen University & Research in Bleiswijk zijn vijf teams van over de hele wereld begonnen aan de volgende fase van de Autonomous Greenhouse Challenge. De opdracht? Volledig autonoom dwergtomaten telen zonder menselijke tussenkomst.

Technology04.09.2024

Challenge: Volledig autonoom dwergtomaten telen zonder menselijke tussenkomst

Oprah leidt een panel met belangrijke mensen in AI: de wereld is verbaasd

Oprah presenteert een tv-special om te vertellen hoe AI het dagelijks leven beïnvloedt en er zitten bekende mensen uit de tech-industrie bij om dat verhaal te doen.

Artificial Intelligence04.09.2024

Oprah leidt een panel met belangrijke mensen in AI: de wereld is verbaasd

ChatGPT heeft wekelijks dubbel zoveel gebruikers

ChatGPT is een jaar later nog steeds razend populair. We zijn duidelijk nog lang niet klaar met AI, maar net begonnen.

Artificial Intelligence30.08.2024

ChatGPT heeft wekelijks dubbel zoveel gebruikers

AI moet visueler worden gemaakt om echt te overtuigen

Welke AI-tool of AI-creatie van recent is jou nou echt bijgebleven? Van veel AI die we gebruiken weten we het niet, kan dat niet anders?

Online28.08.2024

AI moet visueler worden gemaakt om echt te overtuigen

HubSpot komt met gratis tool voor AI zoekoptimalisatie

Consumenten en bedrijven kiezen steeds vaker voor AI-toepassingen om online antwoorden te vinden op hun vragen. Het gebruik van tools als ChatGPT voor zoekfuncties is zelfs met 37% gestegen, terwijl het gebruik van traditionele zoekmachines met 11% is gedaald.* Marketeers die zich tot nu toe hebben gericht op Search Engine Optimization (SEO) om hun merk goed in beeld te brengen, zullen zich nu (ook) moeten specialiseren in een nieuw vak: Language Model Optimization (LMO).

Marketing22.08.2024

HubSpot komt met gratis tool voor AI zoekoptimalisatie

ESA zet een AI-satelliet in om aarde in de gaten te houden

ESA heeft succesvol zijn AI-satelliet gelanceerd die de aarde in de gaten moet gaan houden. Misschien met verregaande gevolgen voor rampen: in de positieve zin.

Technology21.08.2024

ESA zet een AI-satelliet in om aarde in de gaten te houden

X Grok bewijst waarom AI-afbeeldingen begrenzingen nodig hebben

X heeft zijn eigen AI-afbeeldingengenerator en die is heel leuk om te gebruiken. Misschien voor sommigen iets te leuk: Mickey Mouse aan de drugs, iemand?

Social Media15.08.2024

X Grok bewijst waarom AI-afbeeldingen begrenzingen nodig hebben

Verder lezen over Security

TeamViewer heeft een groot cybersecurity-probleem

Als je een kantoorbaan hebt, dan is de kans groot dat je TeamViewer wel kent. Het is een manier waarmee een IT-helpdesk je computer kan ‘overnemen’. Echter blijkt dat TeamViewer zelf is overgenomen, en niet op een positieve manier.

Cybercrime29.08.2024

TeamViewer heeft een groot cybersecurity-probleem

Financiële fraude met phishingmethode specifiek gericht op Android & iOS

Er is weer een ongewoon type phishing-campagne ontdekt volledig gericht op mobiele gebruikers, Eset Research analyseerde een ‘in the wild’ waargenomen geval gericht op klanten van een belangrijke Tsjechische bank. Deze techniek is opmerkelijk omdat het een phishingapp installeert vanaf een website van derden zonder dat de gebruiker de installatie van apps van derden hoeft toe te staan. Op Android kan dit resulteren in een stille installatie van een bijzonder soort APK, die zelfs vanuit de Google Play Store lijkt geïnstalleerd te zijn. De bedreiging was ook gericht op iPhone (iOS)-gebruikers.

Cybercrime26.08.2024

Financiële fraude met phishingmethode specifiek gericht op Android & iOS

Pas op voor deze oplichting op Booking.com

Booking.com zelf communiceert er niet over op zijn site en dat is spijtig: er is namelijk sprake van phishing die vanuit zijn eigen platform plaatsvindt.

Cybercrime09.08.2024

Pas op voor deze oplichting op Booking.com

Veel openbare WiFi netwerken in Parijs zijn onveilig

Experts van Kaspersky hebben bijna 25.000 gratis WiFi-spots in Parijs geanalyseerd voor de Olympische Zomerspelen en Paralympische Spelen. Uit hun analyse blijkt dat bijna 25 procent van deze netwerken zwakke of geen encryptie heeft, waardoor gebruikers kwetsbaar zijn voor diefstal van persoonlijke- en bankgegevens. Slechts zes procent van de netwerken maakt gebruik van het nieuwste beveiligingsprotocol WPA3.

Cybercrime29.07.2024

Veel openbare WiFi netwerken in Parijs zijn onveilig

Vigorish Viper: een Chinees cybercrimesyndicaat ontdekt door Infoblox

Infoblox heeft een belangrijke doorbraak geboekt in onderzoek naar cybercriminaliteit met de onthulling van een groep cybercriminelen, die de naam "Vigorish Viper" heeft gekregen. Dit is een Chinees georganiseerd misdaadsyndicaat dat gebruikmaakt van geavanceerde technologie om te profiteren van de wereldwijde illegale sportgokindustrie ter waarde van $1.700 miljard. Het syndicaat heeft ook banden met witwaspraktijken en mensenhandel operaties in heel Azië. Deze ontdekking van Infoblox betekent een belangrijke mijlpaal in de voortdurende strijd tegen wereldwijde cybercriminaliteit door middel van DNS-intelligentie.

Cybercrime25.07.2024

Vigorish Viper: een Chinees cybercrimesyndicaat ontdekt door Infoblox

banden met Europese voetbalsponsors, mensenhandel en illegale gokindustrie
Startup Wiz zegt nee tegen de 23 miljard dollar van Google

Wat zou jij doen als Google je twee keer zoveel wilde betalen voor je bedrijf als het op dit moment wordt gewaardeerd? Als je Wiz bent, zeg je nee.

Cybercrime23.07.2024

Startup Wiz zegt nee tegen de 23 miljard dollar van Google

Update je smarthome-apparaten, juist als je op vakantie gaat 

Je smarthome kan je heel goed helpen op reis, maar het kan je ook juist tot last zijn. Daarom komt de overheid met doejeupdates.nl.

Cybercrime04.07.2024

Update je smarthome-apparaten, juist als je op vakantie gaat 

Cyberafpersing is het afgelopen jaar wereldwijd met 77% toegenomen

Het aantal geregistreerde organisaties dat slachtoffer werd van cyberafpersing is wereldwijd met 77% toegenomen in de afgelopen 12 maanden. Dat blijkt uit de Cy-Xplorer 2024, het rapport van Orange Cyberdefense dat jaarlijks de ontwikkeling van cyberafpersing beschrijft.

Cybercrime04.07.2024

Cyberafpersing is het afgelopen jaar wereldwijd met 77% toegenomen