52.227 Project X Facebook posts en comments. Wat kun jij vinden?

Vorig artikel Volgend artikel

Op vrijdagavond 21 september 2012 vond Project X Haren plaats, u weet wel dat feestje dat gruwelijker uit de hand liep dan het uit de hand had moeten lopen. De feestgangers nodigden elkaar uit - vooral - via het Facebook event 'Project X - Haren'.

Op die event-page deelden ze veel met elkaar. Plaatjes, promo-filmpjes, nieuws, grappen, plannen, bedreigingen en berouw achteraf. Er waren andere plekken waar ze met elkaar spraken, zoals - natuurlijk - Twitter en 9GAG, maar ik besloot me te richten op Facebook en in het bijzonder hét Facebook event. Ik redeneerde: als het vanaf moment 0 een Facebook feestje wordt genoemd, dan moet je in elk geval op Facebook rondneuzen.

Ik vroeg de mannen van Clockwork en beepRoger om het Facebook-event als geheel te downloaden. Beide bedrijven slaagden erin. BeepRoger slingerde de hele dataset online. Clockwork stelde de data beschikbaar voor onderzoek. Ik kreeg als eerste toegang en op donderdag 4 oktober werd de hele dataset op de Project X Hackathon gedeeld met heel hackend en eigenlijk heel Project X geïnteresseerd Nederland. Op dat moment telde de set 52.227 Facebook posts en comments.

52.227 Project X Facebook posts en comments. Wat kun jij vinden?

Een enorme bak met enorm rijke data. Op 27 september schreef ik mijn eerste verwonderingen uit in deze blogpost op DC. Ondertussen heb ik doorgezocht en meer interessants gevonden - daarover later meer. Maar ook heb ik bedacht dat dat de hooiberg te groot is om met een paar man te doorzoeken. Daarom deel ik bij deze - uiteraard in overleg met de vrienden van Clockwork - de dataset met de rest van de wereld. Via Google Fusion Tables (inderdaad weer zo'n geweldig geintje uit de Google Labs stallen). Wellicht vinden we samen een naald in die hooiberg. En misschien rolt iemand eruit met een boerenmeid of vinden we samen iets anders waar we niet op durfden hopen. Hoe dan ook: bij deze de uitnodiging. 52.227 Project X Facebook posts en comments. Wat kun jij vinden?

Waarom is deze data-set zo interessant? We hebben posts en comments van 7 september tot en met 5 oktober. Je leest over hoe jongeren uitzien naar een mooi feest. Je leest dat jongeren plannen om samen te reizen. Je leest dat er grappen worden gemaakt over rellen zo hier en daar met serieuze inslag. Je leest over 'kabouters' en bij wie je pillen scoort. Je leest over de avond zelf. Je leest over het rouwen en dat er wordt gesproken over de schuldvraag. En je vindt links naar honderden nieuwsartikelen en andere interessante content. Met welke vraag je er ook induikt: in deze dataset vind je antwoorden of op zijn minst kapstokjes. Neus rond en verbaas je.

Goed om te weten:

  • De dataset is mogelijk niet volledig. We denken dat een aantal 'handige types' al in een vroeg stadium posts en comments heeft verwijderd. Die zijn helaas door ons niet terug te halen. Bovendien is er veel meer online gebeurd dan sec op deze event-page. Deze hooiberg is maar een puntje van de ijsberg. Er is ook veel gebruik gemaakt van Twitter, 9GAG en Facebook in het algemeen.
  • De dataset is tot stand gekomen door publiek beschikbare data te downloaden. Je had ook 'gewoon' het Facebook event naar beneden kunnen scrollen en alles kunnen lezen en turven :)
  • Er zitten nog wat kleine maar wel erg onhandige bugjes in Google Fusion Tables. Zo werken de filters om datums te filteren niet altijd. Waarom? Geen idee. Lijkt me een typisch gevalletje bug. Hoe dan ook: even scherp zijn, voordat je iets publiceert. Het blijft nog een tijdje een Google Labs product.

Leuk om te doen: geef even terug wat je op het spoor komt. Daar worden we met z'n allen wijzer van. En als je er over blogt of schrijft lijkt het me netjes dat je de mannen van Clockwork (en in het bijzonder Rienk Prinsen) even heel hartelijk bedankt. En van verwijzen naar deze blogpost word ik weer blij van.

Hoe werkt het?

  • Klik op deze link en doe alsof je thuis bent.
  • Bouw filters, aggregations en views. En dat klinkt moeilijker dan het is. Hier vind je alvast wat voorbeelden.
  • Deel je meest interessante filters, aggregations en views in dit Google Doc. Klik op 'share link' en knip en plak de link in het Google Doc op een plek dat jou zinnig lijkt. Voeg je twitter-account of mail adres even aan het veld toe als 'notitie'. Te moeilijk of geen zin in? Commenten mag ook - uiteraard.
  • Deel je inzichten, vragen of verwonderingen, bijvoorbeeld in een comment op deze blogpost.
  • Je mag de data-set downloaden :)

Vragen? Opmerkingen? Kom maar door. Samen komen we verder. Lekker crowdsourcen. Alvast fijn weekend.

Ritzo ten Cate

Loop m'n nieuwsgierigheid achterna, blog en geef er lezingen over. Wroet in de samenleving om't leuker, blijer mooier en beter te maken. @gewoonkoffie...

Reageren is uitgeschakeld omdat er geen cookies opgeslagen worden.

Cookies toestaan Meer informatie over cookies