Senior Docent en Onderzoeker bij Fontys ICT in Eindhoven. Voorheen gewerkt bij Corendon, TradeDoubler en Prijsvrij.nl.
Alweer de 4e editie van de Big Data Expo in de Jaarbeurs in Utrecht. Het evenement wordt elkaar jaar bezocht door meer dan 5.000 bezoekers, en er staan 85 exposanten op de beurs. Ook zijn er meer dan 100 lezingen verdeeld over 2 dagen tijd. Hierbij een selectie van de lezingen.
Data is the fuel of hypothese
Booking.com was aanwezig met twee mensen. Deze lezing werd verzorgd door Jorden Lentze (Product Owner E-Commerce) en Anne Zuiker (Data Scientist). Bij booking zijn klantbehoeftes een belangrijke onderwerp. Toen Booking.com nog klein was, kwamen ze er achter dat er vaak vakanties werden gezocht naar de wintersportplaats Winterberg, echter hadden ze hier nog helemaal geen hotels die bij hun waren aangesloten. Ze hebben toen een team naar Winterberg gestuurd om hotels te overtuigen om zich bij Booking.com aan te sluiten. De week erna waren alle hotels in Winterberg uitverkocht door Booking.com.
Data is the fuel of hypothese, daar geloven ze in bij Booking.com. Om een hypothese te stellen heb je data nodig. Daarom heeft iedereen bij Booking.com ook toegang tot data, om zo voor hun eigen project ook zelf een hypothese te kunnen maken. Daarnaast wordt alles op atoomniveau getest en ontwikkeld. Dit wil zeggen dat alle veranderingen aan de website apart getest worden, en niet meerdere tegelijk, want anders kunnen de veranderingen elkaar beïnvloeden bij de resultaten.
Ook maakt het niet uit als een project faalt, ‘Embrace failure’. 9 van de 10 projecten zijn niet succesvol, maar daar gaat het ook niet om, het gaat erom wat je geleerd heb van de gefaalde projecten. Ze maken soms ook gebruik van de ‘Fail fast’ methode, waarbij ze wijzingen van de website voor een x-aantal minuten voor 100% van het verkeer aanzetten, waarbij ze dus al snel kunnen zien of het werkt of niet.
Privacy by Design
Een ander lezing was die van Jean Paul van Schoonhoven, partner bij Legal2Practice, een bedrijf wat zich onder andere specialiseert in het bewaren en het gebruik van Big Data, en daar ook trainingen over geeft.
Schoonhoven vertelde dat we digitale predestinatie moeten voorkomen. Dit wil zeggen dat we mensen niet moeten gaan profileren op basis van gegevens uit big data. Een voorbeeld wat gegeven werd is dat mensen die ongezond leven, meer moeten betalen voor hun zorgverzekering.
Legal2Practice is voorstander van het principe: ‘Privacy by Design’:
- Voorkomen is beter dan genezen
Denk vooraf na welke data je gaat opslaan, waarom je deze gaat gebruiken, en hoe je dit veilig kan doen.
- Privacy is de standaard
De diensten/producten die geleverd worden, moeten direct veilig zijn.
- Integreren van gegevensbescherming en beveiliging in het ontwerp
Tijdens de ontwikkeling van een product of dienst staat privacy centraal.
- Volledige functionaliteit
Privacy en beveiliging moeten hand in hand samenwerken, het een moet niet ten koste gaan van het ander.
- End-to-end beveiliging
Privacy wordt gedurdende de volledige product-lifecycle gewaardborgd, vanaf het opslaan tot het vernietigen ervan.
- Zichtbaarheid en transparantie
Transparantie wekt vertrouwen op bij de klant, en laat zien dat privacy ook voor jouw belangrijk is.
- Respect voor privacy van de betrokkene
De gebruiker/klant staat in de spotlight, en zij weten wat er met hun data gebeurd.
IBM – Roskilde Festival
IBM was de afgelopen jaren aanwezig op het Roskilde Festival in Denemarken, waar ze vanuit de organisatie de vraag hadden gekregen of ze met behulp van data nieuwe inzichten konden verkrijgen. Deze data hebben ze onder andere geanalyseerd:
- Voedselverkopen
- Populariteit van artiesten
- WC gebruik
- Menigtecontrole
Het voorspellen van de menigte gebeurde via de app die beschikbaar was tijdens het Roskilde Festival. Bijna 45.000 unieke gebruikers werden getracked tijdens het festival, om zo een goed beeld te krijgen hoe de festivalgangers zich over het terrein bewegen. Deze informatie was handig voor de organisatie zodat ze snel konden ingrijpen als er bepaalde plekken ’te vol’ dreigde te raken.
Ook heeft IBM gekeken naar de populariteit van artiesten. Ze hebben niet gekeken naar de hele grote acts, maar de kleinere acts waarbij het soms lastig in te schatten is welke grootte ze nodig hebben qua stage. Dit hebben ze onder andere gedaan door data van Spotify te scrapen, maar ook door middel van de GPS data van de app van de jaren daarvoor. Zo hebben ze de organisatie toch enkele keren kunnen adviseren om bepaalde bands groter of kleiner te laten spelen.
Als laatste hebben ze ook het WC gebruik geanalyseerd. Dit hebben ze gedaan door middel van 4 weegschalen onder een aantal Wc’s te monteren, verspreid over alle area’s van het festival. Door middel van de weegschalen konden ze dus zien hoe druk het was bij de Wc’s gedurende de dag, maar ook of ze al waren schoongemaakt of niet. Zo zagen ze bijvoorbeeld dat een WC in Area 1 steeds zwaarder werd, en dat er geen bezoekers meer naar die WC’s gingen. Dit hebben ze gemeld bij de organisatie, en wat bleek, door een fout in het schoonmaakschema waren ze die complete area vergeten schoon te maken.
AI en Big Data
Gerard Schouten, lector “Big Data” bij Fontys Hogeschool ICT en geeft naast onderwijs applied data science onderzoek vorm hield een lezing over AI en Big Data.
Er is een explosie van toepassingen van Neural Nets en Deep learning. Wat kunnen deze wel en wat kunnen ze niet. Elke organisatie beschikt tegenwoordig over steeds meer data. Dit roept de vraag op hoe uit deze data waarde voor de organisatie gecreëerd kan worden. Steeds meer bedrijven omarmen daarom AI en deep learning (neurale netwerken). Deep learning is erg “data hungry” en kan complexe taken die typisch menselijk handelen en denken vereisen (deels) uitvoeren. Hiermee kunnen patronen in data ontdekt worden. Bijvoorbeeld om gezichten en zelfs emoties te herkennen, fraude in administratie te detecteren of te voorspellen wanneer je proactief onderhoud zou moeten plegen.
In zijn lezing vroeg hij hoe een machine verschil tussen tussen zalm en zeebaars kan zien. TNO heeft een systeem ontwikkeld dat gebruik maakt van een speciale sonar aan boord om vissoorten te onderscheiden. Sonar zendt korte geluidspulsen uit en luistert naar de signalen die terugkomen. Hoewel de verschillen klein zijn, heeft elke vissoort zijn eigen akoestische eigenschappen.
Daarnaast ziet Gerard Schouten binnen afstudeer- en minoropdrachten dat er steeds meer vraag van bedrijven komen aan software engineers en business analisten die AI vorm geven.
Deze blogpost is geschreven samen met Melvin Achterhuis.
Verder lezen over Big Data
Technology28.10.2024
Air France-KLM legt fundament voor AI met sterk metadatamanagement
Technology12.09.2024
Last van datacenters? Dan bouwen we ze gewoon in zee
Technology04.07.2024
Provincie Noord-Brabant migreert SAP S/4HANA naar de cloud
Informatie nog sneller beschikbaarNieuws27.06.2024
Zo denken Nederlandse datacenters energie te kunnen besparen
Technology25.10.2023
Nieuwe versie van de Technologie Kieswijzer staat online
Technology11.05.2023
KNMI moderniseert datastrategie met AWS
Voor betere detectie en classificatie van seismische activiteitOnline21.10.2022
Wikidata bereikt grens van 100 miljoen data items
Marketing20.09.2022
8 tweets om de Big Data Expo van 2023 vast in je agenda te zetten
Verder lezen over Kunstmatige Intelligentie
Advertising11.12.2024
AI-bedrijf adverteert in San Francisco: ‘Neem geen mensen meer aan’
Technology10.12.2024
Sora de toekomst van AI-videocreatie
Een baanbrekende introductieAutomotive10.12.2024
DS Automobiles ontvangt award voor ChatGPT-integratie
Video09.12.2024
Videotool Sora van OpenAI is nu officieel beschikbaar
Entertainment09.12.2024
Nieuwe AI Kersthit: ‘Christmas With You There’
Search06.12.2024
Google: Google Zoeken gaat volledig veranderen volgend jaar
Online06.12.2024
OpenAI speelt voor kerstman: elke dag een nieuwe AI-mogelijkheid
Online05.12.2024