Linked (Open) Data heeft de toekomst

Vorig artikel Volgend artikel

Vorige week vond in Amersfoort het slotevent van de Pilot Linked Open Data (piLOD) plaats. Dit onafhankelijke initiatief zet zich in om overheidsdata openbaar én linkbaar te maken. Tijdens het slotevent werden de conclusies van de pilot over Linked Open Data in Nederland gepresenteerd. Dat er nog veel te halen valt op dit gebied is een ding dat zeker is.

Linked (Open) Data heeft de toekomst

Hoewel Nederland al jaren bij de wereldtop van aantal internetaansluitingen hoort lijken onze overheden bijna net zo huiverig als de gemiddelde Nederlandse burger te zijn als het gaat om privacy en het openbaar maken van gegevens. Dit in tegenstelling tot bijvoorbeeld het Verenigd Koninkrijk of de Verenigde Staten.

Een veel gehoorde maar nog steeds onbeantwoorde vraag is dan ook of Open Data 'bottom-up' of 'top-down' geregeld moet worden. Dat laatste is weer typisch iets waar wij niet van houden in ons kikkerlandje, maar heeft wel degelijk gewerkt bij de eerder genoemde koplopers op dit gebied; in de VS heeft president Obama de overheid verplicht data openbaar te maken en in 2009 heeft de toenmalige Britse premier Brown zelfs Sir Tim Berners-Lee, de uitvinder van het World Wide Web en het semantisch web (in de volksmond ook wel Web 3.0 genoemd), hoogstpersoonlijk verantwoordelijk gemaakt voor de Linked Open Data architectuur van Britse overheidsinstellingen.

Linked Data
Hoewel het fenomeen 'Open Data' op zich enkel het vrijblijvend openbaar beschikbaar stellen van data is, gaat 'Linked Data' over de techniek om verspreide gegevensbronnen met elkaar te kunnen verbinden. De meest logische toepassing is dat deze 'datasets' zich op het Internet bevinden en daarnaast ook vrij toegankelijk zijn, waardoor je Linked Open Data krijgt, maar dat is niet per se nodig.

Oliver Bartlett van de BBC liet in Amersfoort zien hoe zij Linked Data inzetten om de enorme hoeveelheid aan nieuwsartikelen, videofragmenten, audiofragmenten, dossiers, sportstatistieken, etc. die de Britse publieke omroep elke dag publiceert werkbaar te maken voor de redactie. Door deze architectuur kan content eenvoudig verrijkt worden met interne en externe informatie. Zo kan de redactie van de BBC News website eenvoudig informatie aggregeren van de BBC Football website, maar ook van externe bronnen zoals de (open) data van Wikipedia via DBPedia.

Daarna liet John Walker van NXP Semiconductors zien hoe zij Linked Data gebruiken om alle verschillende productcatalogi, technische specificaties, handleidingen, etc. verspreid over verschillende afdelingen binnen het bedrijf aan elkaar te kunnen koppelen zonder dat er een interpretatieverschil van de data kan ontstaan, omdat Linked Data ervoor zorgt dat elk gegeven zichzelf beschrijft. Plan is bovendien om de data ook voor externe partijen (zoals resellers of fabrikanten) beschikbaar te stellen zodat deze altijd voorzien worden van de laatste informatie zoals deze door de bron (in dit geval NXP) beheerd wordt.

Bij zowel de BBC als de NXP leverde de implementatie van een Linked Data architectuur minder handwerk, minder foutgevoeligheid en daardoor consistentere data op. Daarnaast kan de data eenvoudig worden verrijkt door te linken met externe databronnen en kan de data op haar beurt weer externe databronnen verrijken door deze beschikbaar te stellen voor externe partijen. Voor overheden is het buzzwoord nu vooral 'Open', maar ik kan me voorstellen dat waardevolle data van bedrijven ook best tegen betaling 'Closed' wordt aangeboden.

Hoe dan ook biedt Linked Data veel perspectieven voor zowel commerciële als niet-commerciële partijen en ontstaat er in combinatie met Open Data een schat aan informatie waaruit allerlei nieuwe datasets gehaald kunnen worden. Met de opkomst van 'The Internet of Things' wordt er bovendien veel meer data gegenereerd en wordt het eenvoudig en betaalbaar om deze data te verzamelen. Als we dit allemaal op één hoop gooien krijg je een immense goudmijn aan informatie: Big Linked (Open) Data. Je kunt je voorstellen dat dit kansen biedt voor nieuwe bevindingen op het gebied van wetenschap en maatschappelijke dienstverlening, maar ook voor procesoptimalisatie, nieuwe business en verdienmodellen als bijvoorbeeld besloten wordt om een prijs te zetten op waardevolle Linked Data.

API's
Maar moesten we niet eerst massaal aan de API's? Moesten we niet zorgen dat onze data via 'RESTful JSON webservices' benaderbaar is voor externe partijen zodat verschillende devices kunnen 'praten' met onze data? Jazeker. Het leuke is dat Linked Data in principe één grote webservice is. Er is een uniforme taal (SPARQL) die apps en devices kan laten praten met deze gekoppelde datasets en er zijn zelfs al wat libraries voor ontwikkeld zodat je een app direct op deze 'endpoints' kan aansluiten.

Het formaat is echter anders dan anno 2013 gebruikelijk is. Net op het moment dat we in de development-community overeenstemming hebben bereikt over de te spreken taal en standaarden denk ik dat een verandering hierin op korte termijn een utopie is. Linked Data is in opmars, maar nog niet volwassen genoeg om massaal in gebruik genomen te worden door de community. Denk hierbij naast de afwijkende standaarden ook aan technische uitdagingen zoals de beschikbaarheid van externe servers en de snelheid van de requests. Daarnaast zijn er nog de functionele wensen. Vaak willen we nog bepaalde controle over de data hebben, zoals een redactieslag of het toevoegen van verschillende autorisatie-niveaus waarbij er bijvoorbeeld verdienmodellen hangen aan bepaalde requests.

Conclusie
In mijn ogen zou Linked Data voorlopig ondersteunend moeten zijn aan de 'traditionele' webservices zoals een RESTful JSON API. Zo houd je als data aanbieder controle over je data op een manier die developers gewend zijn en waar reeds veel (open source) ondersteuning voor beschikbaar is. En gebruik je Linked Data om de aangeboden data te verrijken en consistent te houden. Dan bundel je het beste van beide werelden en krijg je een volledige, laagdrempelige webservice die waardevolle consistente data teruggeeft door het gebruik van Linked Data.

Op den duur zullen beide werelden steeds verder naar elkaar toe groeien en is deze extra gelaagdheid niet meer nodig. Maar dan moet Linked Open Data zich wel blijven ontwikkelen en zal vooral ook de community hier op in moeten springen. Ik hoop middels deze post in ieder geval een kleine aanzet te geven en zal me de komende tijd ook namens Freshheads blijven inzetten voor deze ontwikkeling. Ik geloof er namelijk heilig in dat Linked (Open) Data de toekomst heeft.

Auteur: Dimitri van Hees (Technisch Architect en namens Freshheads betrokken bij PiLOD)

Reageren is uitgeschakeld omdat er geen cookies opgeslagen worden.

Cookies toestaan Meer informatie over cookies