Online05.04.2013

De Waarde Van Data


de-waarde-van-data.jpg
de-waarde-van-data.jpg

Big data is overhyped en kan nu al bijna niet meer voldoen aan het verwachtingspatroon dat gecreëerd is door leveranciers en consultants. Maar wat is nu echt de waarde van (big) data? Hieronder een aantal voorbeelden waarin verschillende interpretaties van de waarde van data de hoofdrol spelen.

Apple – Goeie data, slecht resultaat. Afgelopen jaar kwam Apple op het idee zijn eigen Apple Maps te maken. Goed idee maar slechte uitvoering zo bleek. De kaartweergave leek op een aardbeving in San Francisco. Nadat eerst met het vingertje werd gewezen naar de data van Tom Tom, bleek dat de app gewoon niet deugde. Gevaarlijk, want de Australische politie had handen vol werk om in de woestijn verdwaalde reizigers te redden die op weg naar de stad waren.

Big Bang  – Signaal of ruis? Radio astronomen Wilson en Penzias waren maanden bezig met het kalibreren van hun radiotelescoop maar slaagden er niet in van een vreemde statische ruis af te komen en dachten aanvankelijk dat de apparatuur niet goed werkte. Uiteindelijk kwamen ze er achter dat de ruis een signaal uit het verleden was: de overblijfselen van de oerknal. Met big data krijgen we zowel meer ruis als signaal en het is niet altijd zonneklaar wat signaal en wat ruis is.

Chris Anderson – Data is alles. In tegenstelling tot 20ste eeuwse wetenschapsfilosoof Karl Popper vindt Chris Anderson, voormalig hoofdredacteur van Wired magazine, dat wetenschap overbodig is. Door de overvloed aan data zouden we meer tijd en moeite moeten besteden aan het bestuderen van data i.p.v. theorievorming. Of, zoals hij het in zijn artikel “The End of Theory” beschreef: “Correlation supersedes causation, and science can advance even without coherent models, unified theories, or really any mechanistic explanation at all.” Brute kracht wint van intellect en kan de wetenschap een enorme boost geven juist omdat data geen mening heeft.

Diederik Stapel – Data is ondergeschikt aan de uitkomst. Diederik Stapel geloofde als wetenschapper heel sterk in de kracht van data om maatschappelijke verschijnselen te verklaren. Zo onderbouwde hij de stelling dat vleeseters hufteriger zijn dan vegetariërs met onderzoeksdata. Om deze bewering te bewijzen verzon en masseerde hij onderzoeksdata net zo lang tot dat hij het gewenste resultaat had. Data en feiten zijn niet hetzelfde.

Jacko – Zonder data kan je toch winnen. Gorilla Jacko wist 12 jaar lang de beursprofessionals te verslaan. Pas in 2012 ging hij onderuit. Ook het clownsduo Franky en Milco kenden soortgelijke successen met stockpicking. De vraag dringt zich op of meer data en complexere modellen betere resultaten geven. Op de beurs win je door het beter te doen dan het gemiddelde. Als iedereen meer middelen er tegen aan gooit, zullen er toch altijd beurshandelaren zijn die verliezen. Hebben we het hier over een ‘race to the bottom’?

ICCP – Correlatie versus causaliteit. De mens is bijzonder goed in het herkennen van patronen. Probleem is dat men bij correlerende verschijnselen bijna automatische probeert een causaal verband te leggen. Klimatologen verbonden aan het ICCP probeerden het verband te leggen tussen de opwarming van de aarde en de groeiende impact van het menselijk handelen. Hoewel broeikasgassen als CO2 en methaan de eigenschap hebben warmte in de atmosfeer vast te houden en dus bijdragen aan de opwarming van de aarde is het vrijwel onmogelijk om een direct causaal verband te leggen met de toenemende intensiteit van menselijk gedrag in relatie tot de aarde. Juist de neiging naar een oorzakelijk verband toe te redeneren, zorgde voor zoveel commotie dat er ernstig getwijfeld werd aan de objectiviteit van de ICCP wetenschappers. Het gevolg was dat het debat over de opwarming van de aarde meteen aan relevantie en urgentie verloor.

Minority Report – Data is overbodig, de toekomst staat vast. In de film Minority Report, naar het gelijknamige verhaal van Philip K. Dick wordt er van uitgegaan dat de toekomst vastligt. De pre-cogs (waarzeggers) kunnen misdaad en dader voorspellen. Data was niet meer nodig. Uiteindelijk waren twee van de drie pre-cogs nep, zegde slechts één waarzegger waar en was het geheel een op angst gebaseerde methode om misdaad te onderdrukken. Wat ze in de film wel nodig hadden was heel veel data om uit te vinden waar de toekomstige crimineel zich bevond; dat wisten de pre-cogs schijnbaar niet.

Blue CRUSH – Data vertelt nooit het volledige verhaal. Het door de politie van Memphis Tennessee in gebruik genomen Blue CRUSH-systeem ( Crime Reduction Utilizing Statistical History) is een doorslaand succes. Althans zo werd door de politie naar de pers gecommuniceerd. Door misdaad in al zijn facetten te vast te leggen en met allerlei omgevingsinformatie te integreren en analyseren, weet men waar en wanneer en onder welke omstandigheden de kans op misdaad het grootste is. Vervolgens is het laten rijden van een extra patrouille wagen voldoende om de misdaad te voorkomen. Probleem is dat voor het plegen van een misdaad er meestal sprake is van motief, gelegenheid en middel. Alleen de gelegenheid tijdelijk wegnemen zal geen blijvende werking hebben. Het zal hooguit het tijdstip, de omstandigheden of plaats veranderen. Buiten dat werd er niet over online criminaliteit gerept. Als misdaad het geld volgt en 90% daarvan ergens online is, dan ligt groei van door geld gedreven criminaliteit via het internet voor de hand. Lastiger wordt het voor de Memphis Police Department om een patrouilleauto naar Oost Europa te sturen.

Robbert Dijkgraaf – Random data maakt toekomst onvoorspelbaar. Gedurende het college van Robbert Dijkgraaf over de kleinste bouwstenen van het universum was er een vraag uit het publiek die luidde: als we van de allerkleinste bouwstenen van ons universum weten wat de richting en snelheid is en we zouden hier krachtige algoritmen en computers op loslaten, kunnen we dan de toekomst voorspellen? Nee, zei Dijkgraaf en liet aan de hand van een geigerteller zien dat hoewel hij met zekerheid kon zeggen dat deze zou uitslaan als hij het boven de radonwijzerplaat van een oud horloge hield, hij toch niet kon voorspellen wat het patroon zou zijn. Dat blijft random. De toekomst ligt dus niet vast zo concludeerde hij.

Data is de nieuwe heilige graal. Het is niet moeilijk je voor te stellen dat het combineren van grotere, meer diverse en sneller verversende datasets een enorme potentie waarde vertegenwoordigt. Met de huidige rekenkracht en software kunnen we alles, hoe ongerijmd dan ook, analyseren en daarmee de waarde van data ontsluiten. Maar in tegenstelling tot het geloof in de mogelijkheden van data staat de data-wetenschap nog in de kinderschoenen en is het onnauwkeurig omgaan met data en het verkeerd interpreteren van data een typisch menselijke eigenschap. Daarnaast lijkt het nieuwe data-denken te verordonneren dat alles met data kan worden verklaard mits je over voldoende relevante data beschikt. Maar ja, “voldoende” en “relevant” zijn geen objectieve kwalificaties. Data mag dan de nieuwe pijler zijn van de wetenschap maar Popper kan nog niet worden afgevoerd. Integendeel, we zullen harder moeten nadenken dan ooit te voren.

Deze blogpost is geschreven door Marcel Warmerdam, principal analyst bij The METISfiles.

Verder lezen over Big Data

Nieuwe versie van de Technologie Kieswijzer staat online

Het zal niemand ontgaan dat we met zijn allen opnieuw naar de stembus moeten gaan. De vervroegde Tweede Kamerverkiezing vindt plaats op 22 november 2023. De laatste Tweede Kamerverkiezing vond plaats op 17 maart 2021. To...

Technology25.10.2023

Nieuwe versie van de Technologie Kieswijzer staat online

KNMI moderniseert datastrategie met AWS

Het KNMI heeft een nieuwe, moderne datastrategie geïmplementeerd met behulp van Amazon Web Services (AWS). Daarmee past het meteorologische instituut de mindset en processen van een datagedreven organisatie toe. Behalve...

Technology11.05.2023

KNMI moderniseert datastrategie met AWS

Voor betere detectie en classificatie van seismische activiteit
Wikidata bereikt grens van 100 miljoen data items

Wikipedia kennen we allemaal. Wikidata is wat minder bekend. Dit 'zusje' van Wikipedia heeft afgelopen week de mijlpaal van 100 miljoen items bereikt. Tien jaar geleden begon Wikidata als centrale opslagplaats voor gest...

Online21.10.2022

Wikidata bereikt grens van 100 miljoen data items

8 tweets om de Big Data Expo van 2023 vast in je agenda te zetten

De Big Data Expo is helaas afgelopen, maar je kunt nu alvast 13 en 14 september 2023 in je agenda noteren. Dan vindt in de Jaarbeurs namelijk de Big Data Expo 2023 plaats. Nieuwsgierig wat je daar zoal kunt verwachten? D...

Marketing20.09.2022

8 tweets om de Big Data Expo van 2023 vast in je agenda te zetten

​Big Data Expo: veelzijdig evenement dat iedereen aangaat

Of je nu een account neemt bij Adobe omdat je wil kunnen Photoshoppen of dat je je fulltime bezighoudt met de veiligheid van de data van duizenden klanten: data gaat iedereen aan. Dat is ook te merken tijdens de Big Data...

Technology14.09.2022

​Big Data Expo: veelzijdig evenement dat iedereen aangaat

​Volgende week: van Big Data naar Big Mac op de Big Data Expo

Volgende week woensdag en donderdag vindt de Big Data Expo samen. Alles wat je altijd al wilde weten over data, zoals het verwerken, beheren, maar vooral inzetten om belangrijke beslissingen te nemen in je bedrijf, vind...

Events09.09.2022

​Volgende week: van Big Data naar Big Mac op de Big Data Expo

​Drie keynote-sprekers die je moet zien op de Big Data Expo

De Big Data Expo komt er bijna aan en met 100 exposanten en 120 lezingen is er enorm veel te doen. Om je op weg te helpen, staan we stil bij drie keynote-sprekers die je zeker niet mag missen tijdens dit grote big data-e...

Marketing05.09.2022

​Drie keynote-sprekers die je moet zien op de Big Data Expo

​3 redenen om een bezoek te brengen aan de Big Data Expo

Over een paar weken is het zover, dan vindt de Big Data Expo plaats in de Jaarbeurs in Utrecht. Tijdens deze gratis toegankelijke Expo ontmoeten partijen op het gebied van data elkaar. Vraag en aanbod komen op 14 en 15 s...

Marketing23.08.2022

​3 redenen om een bezoek te brengen aan de Big Data Expo

Verder lezen over Data

​Zoveel datacenters: wat zijn de voors en tegens?

In Noord-Holland is Middenmeer een soort ultra-datacenterlocatie. Het is ook vaak uit die plaats dat er berichten komen over wat omwonenden ervan vinden (spoiler: het is niet positief), maar nu zelfs arbeiders die demons...

Online31.10.2023

​Zoveel datacenters: wat zijn de voors en tegens?

Doek valt definitief voor een datacenter in Zeewolde

Het was door alle commotie, bezwaren en andere randzaken al hoogst onwaarschijnlijk geworden dat het mega datacenter dat Meta wilde gaan bouwen in Zeewolde nog door zou gaan. Welnu, vandaag is het doek definitief gevalle...

Technology20.09.2023

Doek valt definitief voor een datacenter in Zeewolde

Er komen beperkingen op de cloudopslag van Dropbox

Terwijl WhatsApp het steeds makkelijker maakt om grote foto’s te versturen, besluit Dropbox niet om zijn diensten aantrekkelijker te maken, maar legt het ze juist aan banden. Dropbox, dat altijd een ongelimiteerde opti...

Online25.08.2023

Er komen beperkingen op de cloudopslag van Dropbox

Europa en Amerika gaan datadelen weer toestaan

Vroeger was er tussen Europa en de Verenigde Staten het Privacy Shield: een overeenkomst waardoor de data van Europese burgers in de Verenigde Staten kon worden opgeslagen, zonder dat het daarbij in handen kwam van de VS...

Online11.07.2023

Europa en Amerika gaan datadelen weer toestaan

Komt Threads dan nu wel naar Europa?
Nieuw onderzoek: datalekken in de zorgsector nemen nog steeds toe

Datalekken in de zorgsector in Nederland blijven toenemen. De Autoriteit Persoonsgegevens (AP) heeft recentelijk aangegeven dat Nederlandse burgers ervan uit moeten gaan dat hun persoonlijke gegevens waarschijnlijk al ge...

Cybercrime28.06.2023

Nieuw onderzoek: datalekken in de zorgsector nemen nog steeds toe

41% van de gezondheidszorgorganisaties sinds 2021 te maken heeft gehad met een datalek
Autoriteit Persoonsgegevens onderzoekt mogelijk datalek bij Tesla

Naar aanleiding van een tip van haar Duitse collega’s in Brandenburg is de Autoriteit Persoonsgegevens (AP) een onderzoek gestart naar een mogelijk datalek bij Tesla. Daarbij zouden, dat meldt de Duitse krant Handelsbl...

Cybercrime26.05.2023

Autoriteit Persoonsgegevens onderzoekt mogelijk datalek bij Tesla

Data recovery als snelle reactie bij gegevensverlies

Data recovery is het proces van het herstellen van verloren of beschadigde gegevens van een opslagapparaat. Je kunt terecht bij professionals die jou helpen met het redden van je data. Dit is super handig wanneer jij bel...

DC Business03.05.2023

Data recovery als snelle reactie bij gegevensverlies

We bellen en sms’en weer veel minder

De ACM heeft deze week de nieuwste versie van de Telecommonitor gepubliceerd. Het rapport over het gebruik van mobiele- en andere telecomdiensten in Nederland. Het zal niemand echt verbazen dat we, vergeleken met voorgaa...

Mobile12.04.2023

We bellen en sms’en weer veel minder

Voorraad 06-nummers nog steeds schaars