Your SlideShare is downloading. ×
Afstudeeronderzoek linked open data   duurzaam voor de toekomst
Afstudeeronderzoek linked open data   duurzaam voor de toekomst
Afstudeeronderzoek linked open data   duurzaam voor de toekomst
Afstudeeronderzoek linked open data   duurzaam voor de toekomst
Afstudeeronderzoek linked open data   duurzaam voor de toekomst
Afstudeeronderzoek linked open data   duurzaam voor de toekomst
Afstudeeronderzoek linked open data   duurzaam voor de toekomst
Afstudeeronderzoek linked open data   duurzaam voor de toekomst
Afstudeeronderzoek linked open data   duurzaam voor de toekomst
Afstudeeronderzoek linked open data   duurzaam voor de toekomst
Afstudeeronderzoek linked open data   duurzaam voor de toekomst
Afstudeeronderzoek linked open data   duurzaam voor de toekomst
Afstudeeronderzoek linked open data   duurzaam voor de toekomst
Afstudeeronderzoek linked open data   duurzaam voor de toekomst
Afstudeeronderzoek linked open data   duurzaam voor de toekomst
Afstudeeronderzoek linked open data   duurzaam voor de toekomst
Afstudeeronderzoek linked open data   duurzaam voor de toekomst
Afstudeeronderzoek linked open data   duurzaam voor de toekomst
Afstudeeronderzoek linked open data   duurzaam voor de toekomst
Afstudeeronderzoek linked open data   duurzaam voor de toekomst
Afstudeeronderzoek linked open data   duurzaam voor de toekomst
Afstudeeronderzoek linked open data   duurzaam voor de toekomst
Afstudeeronderzoek linked open data   duurzaam voor de toekomst
Afstudeeronderzoek linked open data   duurzaam voor de toekomst
Afstudeeronderzoek linked open data   duurzaam voor de toekomst
Afstudeeronderzoek linked open data   duurzaam voor de toekomst
Afstudeeronderzoek linked open data   duurzaam voor de toekomst
Afstudeeronderzoek linked open data   duurzaam voor de toekomst
Afstudeeronderzoek linked open data   duurzaam voor de toekomst
Afstudeeronderzoek linked open data   duurzaam voor de toekomst
Afstudeeronderzoek linked open data   duurzaam voor de toekomst
Afstudeeronderzoek linked open data   duurzaam voor de toekomst
Afstudeeronderzoek linked open data   duurzaam voor de toekomst
Afstudeeronderzoek linked open data   duurzaam voor de toekomst
Afstudeeronderzoek linked open data   duurzaam voor de toekomst
Afstudeeronderzoek linked open data   duurzaam voor de toekomst
Afstudeeronderzoek linked open data   duurzaam voor de toekomst
Afstudeeronderzoek linked open data   duurzaam voor de toekomst
Afstudeeronderzoek linked open data   duurzaam voor de toekomst
Afstudeeronderzoek linked open data   duurzaam voor de toekomst
Afstudeeronderzoek linked open data   duurzaam voor de toekomst
Afstudeeronderzoek linked open data   duurzaam voor de toekomst
Afstudeeronderzoek linked open data   duurzaam voor de toekomst
Afstudeeronderzoek linked open data   duurzaam voor de toekomst
Afstudeeronderzoek linked open data   duurzaam voor de toekomst
Afstudeeronderzoek linked open data   duurzaam voor de toekomst
Afstudeeronderzoek linked open data   duurzaam voor de toekomst
Afstudeeronderzoek linked open data   duurzaam voor de toekomst
Afstudeeronderzoek linked open data   duurzaam voor de toekomst
Afstudeeronderzoek linked open data   duurzaam voor de toekomst
Afstudeeronderzoek linked open data   duurzaam voor de toekomst
Afstudeeronderzoek linked open data   duurzaam voor de toekomst
Afstudeeronderzoek linked open data   duurzaam voor de toekomst
Afstudeeronderzoek linked open data   duurzaam voor de toekomst
Afstudeeronderzoek linked open data   duurzaam voor de toekomst
Afstudeeronderzoek linked open data   duurzaam voor de toekomst
Afstudeeronderzoek linked open data   duurzaam voor de toekomst
Afstudeeronderzoek linked open data   duurzaam voor de toekomst
Afstudeeronderzoek linked open data   duurzaam voor de toekomst
Afstudeeronderzoek linked open data   duurzaam voor de toekomst
Afstudeeronderzoek linked open data   duurzaam voor de toekomst
Afstudeeronderzoek linked open data   duurzaam voor de toekomst
Afstudeeronderzoek linked open data   duurzaam voor de toekomst
Upcoming SlideShare
Loading in...5
×

Thanks for flagging this SlideShare!

Oops! An error has occurred.

×
Saving this for later? Get the SlideShare app to save on your phone or tablet. Read anywhere, anytime – even offline.
Text the download link to your phone
Standard text messaging rates apply

Afstudeeronderzoek linked open data duurzaam voor de toekomst

1,926

Published on

0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total Views
1,926
On Slideshare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
35
Comments
0
Likes
0
Embeds 0
No embeds

Report content
Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
No notes for slide

Transcript

  • 1. Linked Open DataDuurzaam voor de toekomst?Annette Allaart – AfstudeeronderzoekReinwardt Academie – Cultureel ErfgoedOktober 2011
  • 2. Colofon Dit werk is gelicenseerd onder een Creative Commons Naamsvermelding-NietCommercieel- GelijkDelen 3.0 Nederland. Bezoek http://creativecommons.org/licenses/by-nc-sa/3.0/nl/ om eenkopie te zien van de licentie of stuur een brief naar Creative Commons, 444 Castro Street, Suite 900, Mountain View, California, 94041, USA.Opleiding: Amsterdamse Hogeschool voor de KunstenFaculteit: Reinwardt AcademieBegeleider: Gerdie BorghuisTitel: Linked Data – Duurzaam voor de toekomst?Auteur: Annette AllaartStudiejaar: 2011Datum: 5 oktober 2011 2
  • 3. VoorwoordVoor u ligt een scriptie welke het resultaat is van een onderzoek naar de mogelijkheden van Linked(Open) Data, om duurzame toegang tot digitale erfgoedinformatie te bevorderen. Deze scriptievormt het einde van mijn studie Cultureel Erfgoed aan de Reinwardt Academie.Het schrijven van een scriptie zag en zie ik nog steeds als een hele uitdaging. Ik ben dan ook trots ophet eindresultaat. Trots vanwege de discipline die ik mijzelf heb moeten opleggen. Zelfstandigonderzoek doen betekent dat je geen stok achter de deur hebt in de vorm van een organisatie waarje het onderzoek uitvoert.Ik ben ook trots op het aantal pagina’s waaruit deze scriptie bestaat. Hieruit blijkt dat ik wel degelijk‘verhaaltjes’ kan schrijven. Iets wat ik tijdens het schrijven niet voor mogelijk hield. Ik schreef mijneerste hoofdstuk in steno..Bij deze wil ik daarom mijn begeleider vanuit de Reinwardt Academie, Gerdie Borghuis, bedanken. Zijheeft me geleerd hoe ik de lezer aan de hand moet nemen in mijn verhaal.Graag wil ik ook Enno Meijers en Inge Angevaare bedanken. Zij hebben mij met hun brede kennis vandigitale duurzaamheid, geholpen meer vorm aan mijn onderzoek te geven. Victor de Boer bedank ikvoor het overdragen van zijn kennis van het Semantisch Web en Linked (Open) Data aan mij. Judithvan Gent van het Amsterdam Museum bedank ik voor een kijkje in de praktijk. Zonder jullie was ikongetwijfeld nog steeds verdwaald in de enorme hoeveelheid ingewikkelde informatie die er tevinden is over digitale duurzaamheid en Linked (Open) Data.Een scriptie schrijven is een proces. Dit proces had ik niet kunnen volbrengen zonder de hulp ensteun van familie, vrienden en huisgenoten. Dank jullie wel! 3
  • 4. SamenvattingDigitale informatie is niet meer weg te denken uit onze kennissamenleving. In het hedendaagse levenkan men niet meer zonder. Digitale duurzaamheid staat echter nog steeds in de kinderschoenen.Duurzaamheid wordt voornamelijk gezien als veilige opslag van digitale objecten. Het duurzaamtoegankelijk houden van de digitale erfgoedinformatie wordt daarbij vergeten.Het streven naar duurzame toegang tot digitale erfgoedinformatie is een grote uitdaging omdat erdrie soorten bedreigingen zijn die de risico’s op verlies van digitale informatie vergroten.Deze afstudeerscriptie onderzoekt of het een mogelijkheid is de data in de collectiedatabase om tezetten naar een Linked Open dataset, om zodoende duurzame toegang tot digitale erfgoedinformatiete bevorderen.Daarnaast is het doel een beeld te creëren wat Linked (Open) Data voor culturele erfgoedinstellingenkan betekenen, hoe het werkt en wat het oplevert. Hierbij word het Amsterdam Museum als case-study gebruikt. Zij zijn het eerste museum dat haar data in de collectiedatabase heeft omgezet naareen Linked Open dataset.Om duurzame toegang tot digitale erfgoedinformatie te bieden gaat dit onderzoek uit van hetstrategische stappenmodel van Enno Meijers. Het stappenmodel bestaat uit drie delen. Het laatstedeel wordt gebruikt om de koppeling naar Linked (Open) Data te maken.Linked (Open) Data wordt als de praktijk van het Semantisch Web gezien. Het Semantisch Web draaitom interoperabiliteit van de Web-resources. Door digitale objecten inhoudelijk aan elkaar tekoppelen ontstaat een betekenisvolle relatie.Uit een analyse moet men tot de conclusie komen of Linked (Open) Data een mogelijkheid is omduurzame toegang tot digitale informatie te bevorderen, of niet. De analyse vergelijkt debeheersmaatregelen die worden geadviseerd in het derde deel van het stappenplan van EnnoMeijers met het Linked Data principe van Tim Berners-Lee.Uit de analyse is gebleken dat er wel degelijk overeenkomsten zijn tussen deze twee thema’s. Deovereenkomsten hebben vooral betrekking op het toepassen van open standaarden ten behoeve vanmetadata beheer en het signaleren van technologische veranderingen in de omgeving.De volgende aanbevelingen zijn gedaan: Maak gebruik van de open standaard XML. Gebruik RDF/XML als schrijfwijze van het RDF-datamodel. Nader onderzoek naar de praktijk van deze conclusie. 4
  • 5. SummaryDigital information has become part of our knowledge society. In daily life, we cannot live withoutdigital information anymore. Despite of this all, digital preservation is still a new market. It’s onlytwenty years old.Digital preservation is primarily seen as safe storage of digital objects. Sustainable access to thedigital information is something the heritage institutions don’t think of. To achieve sustainable accessto the digital information is a real challenge. There are three kinds of threats which will increase therisk to lose digital information.This thesis examines whether it’s a possibility to convert the collection data to Linked Open Data,thereby promote sustainable access to digital heritage information. Moreover it’s a purpose tocreate a picture of Linked (Open) Data. What do cultural heritage institutions have to do with? Howdoes Linked (Open) Data work? What does Linked (Open) Data bring the cultural heritageinstitutions?The Amsterdam Museum is the first museum in the Netherlands who converted their collection datato Linked Open Data. I will refer to The Amsterdam Museum as they are used as a case study.To offer sustainable access to the digital heritage information this examination studied the strategicmodel for digital preservation by Enno Meijers. This model consists of three parts. The last part willbe used to make the connection to Linked (Open) Data.Linked (Open) Data is called the more operative way of the Semantic Web. The Semantic Web is allabout interoperability of Web resources. By linking the digital objects with their inside the SemanticWeb creates meaningful relationships.An analysis should be to conclude Linked (Open) Data is an opportunity to promotesustainable access to digital information or not. The analysis compares the preservation toolsrecommended in the third part of the strategic preservation model by Enno Meijers to the principlesof Linked Data by Tim Berners-Lee.The analysis showed that there are indeed similarities between these two themes. The similarities inparticular related to the use of open standards for metadata management and the identificationof technological changes in the environment.The following recommendations were made: Use the Open Standard XML, Use RDF / XML as the serialisation of the RDF-data model, Make sure you evaluate. 5
  • 6. Inhoudsopgave1 Inleiding en afbakening……………………………………………………………………………………………………….............9 Aanleiding………………………………………………………………………………………..........................................9 Hypothese………………………………………………………………………………………………...............................10 Onderzoeksvraag…………………………………………………………………………………………………..................11 Doelstelling...............................................................................................................................11 Afbakening................................................................................................................................11 Methode....................................................................................................................................122 Digitale toegankelijkheid...................................................................................................................142.1 Wat is digitale toegankelijkheid..............................................................................................14 Digitale duurzaamheid............................................................................................................................142.2 Wat is het doel van digitale toegankelijkheid?.......................................................................152.3 Waarom is digitale toegankelijkheid belangrijk?....................................................................152.4 Obstakels en digitale toegankelijkheid...................................................................................16 2.4.1 Veranderingen in de technologie en technische oplossingen.....................................16 Migratie.....................................................................................................................................17 Emulatie....................................................................................................................................17 Normalisatie..............................................................................................................................18 2.4.2 Veranderingen in de omgeving, hoe verder?...............................................................18 Expertisecentrum DAVID...........................................................................................................18 2.4.3 Veranderingen in de organisatie dankzij nieuw beleid................................................19 De BASIS....................................................................................................................................20 PLATTER.....................................................................................................................................21 Business Model Innovation........................................................................................................22 OAIS-model...............................................................................................................................222.5 Strategisch stappenmodel.......................................................................................................24 Volwassenheidsmodel...............................................................................................................25 2.5.1 Opbouw van het stappenmodel..................................................................................25 2.5.2 Deel C: Duurzaam toegang bieden...............................................................................26 Stap 1: duurzame toegang.........................................................................................................26 Stap 2: beheer van metadata.....................................................................................................27 Stap 3: de veranderende omgeving...........................................................................................293 Veranderingen van het Web...........................................................................................................303.1 Wat is het Web?.....................................................................................................................30 Internet......................................................................................................................................30 Hoe is het World Wide Web ontstaan?.....................................................................................30 Standaarden World Wide Web..................................................................................................313.2 Het DNA van het Web............................................................................................................313.3 Het ‘Social Web’.....................................................................................................................32 Interactief..................................................................................................................................323.4 Het Semantisch Web..............................................................................................................33 Hoe werkt het?..........................................................................................................................34 Ontologie...................................................................................................................................35 6
  • 7. 4 Linked Open Data...............................................................................................................................374.1 Wat is Linked (Open) Data?.....................................................................................................374.2 Wat is de meerwaarde voor de erfgoedsector?......................................................................384.3 Hoe verhouden Linked (Open) Data en het Semantisch Web zich tot elkaar?......................394.4 Linked Data – Open Data – Linked Open Data........................................................................40 Linked Data...............................................................................................................................40 Open Data..................................................................................................................................40 Linked Open Data......................................................................................................................414.5 De technische aspecten van Linked (Open) Data....................................................................41 4.5.1 Syntactische transformatie..........................................................................................41 XML............................................................................................................................................41 Uniform Resource Identifier......................................................................................................42 HyperText Transfer Protocol......................................................................................................42 4.5.2 Semantische transformatie..........................................................................................42 Triple..........................................................................................................................................43 Resource Description Framework..............................................................................................434.6 Linked (Open) Data – wat nu?.................................................................................................45 Linked (Open) Data browser......................................................................................................45 Linked (Open) Data zoekmachines............................................................................................45 Linked (Open) Data applicaties..................................................................................................465 Linked Open Data in de praktijk........................................................................................................475.1 Aandacht voor Linked (Open) Data.........................................................................................475.2 Aan de slag...............................................................................................................................47 5.2.1 ‘The Linking Open Data Project’...................................................................................48 5.2.2 Amsterdam Museum als Linked Open Data.................................................................48 Wat levert het op?.....................................................................................................................49 Nadelen.....................................................................................................................................49 Europeana.................................................................................................................................50 Apps for Amsterdam..................................................................................................................50 Tot slot………………………………………………………………………………………………………………………………….50 5.2.3 MultimediaN N9C Eculture Project..............................................................................51 5.2.4 Europeana....................................................................................................................52 5.2.5 Apps for Amsterdam....................................................................................................526 Conclusie en aanbevelingen..............................................................................................................53 Hypothese.................................................................................................................................53 Aanalyse stappenmodel Enno Meijers en Linked Data principe Tim Berners-Lee....................53 Referentie metadata.................................................................................................................54 ‘Fixity’ en ‘provenance’.............................................................................................................54 Het leesbaar houden van de informatie....................................................................................54 De behoefte van de gebruiker...................................................................................................55 Aanbevelingen...........................................................................................................................557 Geraadpleegde bronnen....................................................................................................................578 Afbeeldingenlijst................................................................................................................................59A Strategisch Stappenmodel Enno Meijers..........................................................................................60B Linked Open Data Cloud Diagram.....................................................................................................61 7
  • 8. 1 Inleiding en afbakeningDeze scriptie behandelt de duurzame toegankelijkheid van digitale erfgoedinformatie en welke rolLinked Data hierin kan spelen. Dit zijn twee grote thema’s die met elkaar in verbinding zullen wordengebracht.AanleidingDigitale informatie is niet meer weg te denken uit onze kennissamenleving. In het hedendaagse levenkan men niet meer zonder. Het is een essentieel bestanddeel van onze kenniseconomie. In vrijwelelke sector, publiek en privaat, speelt digitale informatie een grote rol van betekenis.De instellingen binnen de culturele erfgoed sector zijn driftig aan de slag gegaan met digitaliserenvan hun collectie. Om mee te blijven doen in de kennissamenleving bieden zij laagdrempelig toegangtot hun digitale informatie. Hiervoor zijn een aantal redenen te noemen1: Internet vereenvoudigt deelname van andere partijen aan informatieverspreiding. De instellingen proberen op deze manier hun meerwaarde in de kennissamenleving te behouden. De verschuiving van informatieschaarste naar informatieovervloed maakt deze instellingen niet meer de autoriteit op het gebied van kennis, bovendien zijn zij niet langer de toegangspoort tot de informatie.Het digitaliseren staat dus wel degelijk hoog op de agenda. Digitale duurzaamheid staat echter nogsteeds in de kinderschoenen. Duurzaamheid wordt voornamelijk gezien als veilige opslag van digitaleobjecten.2Het streven naar duurzame toegang tot digitale erfgoedinformatie is dus een grote uitdaging, maarhet is ook een probleem dat nog geen twintig jaar oud is.Informatie op traditionele dragers van papier is zonder schadelijke invloeden van buitenaf jarenbruikbaar. Je moet alleen kunnen lezen en de taal begrijpen. Dit is niet het geval bij digitaleinformatie. Digitale informatie kent drie soorten bedreigingen die de risico’s op verlies van digitaleinformatie vergroten: Technologie Metadata OrganisatieIn zijn master thesis Stapsgewijs naar duurzame toegang heeft Enno Meijers een strategischstappenmodel ontwikkeld om stapsgewijs de risico’s op verlies van digitale informatie te verkleinen.1 Enno Meijers, Stapsgewijs naar duurzame toegang. Onderzoek naar een strategisch stappenmodel voorduurzame toegang tot digitale informatie in kleine en middelgrote erfgoedinstellingen. Thesis Master ofBusiness Informatics – Avans+ (Middelburg, april 2010), 11-12.2 Meijers, Stapsgewijs naar duurzame toegang, 38. 8
  • 9. Dit stappenplan is op te delen in drie delen waarin vijftien factoren worden beschreven om tot eenduurzame borging van digitale informatie te komen: Het bepalen van de ambitie van de organisatie. De digitale objecten veilig stellen. Het duurzaam toegang bieden.In mijn onderzoek ga ik in op het derde deel van het stappenplan: het duurzaam toegang bieden.Hierin komen de volgende factoren aan bod: Beschrijven van de doelen voor duurzame toegang. Metadata beheer. De veranderende omgeving.Enno Meijers beschrijft in dit derde deel, over duurzame toegang bieden, de behoefte aan openstandaarden en open source software. Het toepassen van open standaarden en open sourcesoftware zouden de beste overlevingskansen bieden voor het duurzaam toegankelijk houden vandigitale informatie.Hier haakt het tweede thema van deze scriptie op in. Linked (Open) Data is een nieuwe technologiedie een intelligenter Web ondersteunt, dat gebaseerd is op open standaarden. Het is eenontwikkeling die in 2011 meer bekendheid kreeg door de Europeana database en de aandacht die degrote instellingen als de Koninklijke Bibliotheek, Nationaal Archief, Digitaal Erfgoed Nederland enNationale Coalitie Digitale Duurzaamheid eraan gaven.Op 13 mei vond het Dutch Culture Linked Open Data Event plaats in Haarlem. Hier verzamelde heterfgoedveld van Nederland en België zich om meer over deze nieuwe technologie te weten te komenen het gebruik ervan te bevorderen. Ook ik was van de partij, dit vormde het startschot voor mijnscriptie.HypotheseLinked (Open) Data is een nieuwe praktijk van het Semantisch Web. Linked (Open) Data wordt ookwel gezien als een pragmatische manier om een praktische bijdrage te leveren aan het SemantischWeb.3 Praktisch vanwege de toepasbaarheid van Linked (Open) Data. In deze scriptie zie ik Linked(Open) Data als een technologische verandering in de omgeving. Ik wil ik deze toepasbaarheidkoppelen aan het duurzaam toegang bieden tot digitale erfgoedinformatie. Is dit mogelijk en wat ishiervoor nodig? Zijn er overeenkomsten tussen de Linked (Open) Data technologie en debeheersmaatregelen voor duurzame toegang tot digitale informatie? Mijn veronderstelling is dat erovereenkomsten zijn die het mogelijk maken de Linked (Open) Data technologie te gebruiken alsbeheersmaatregel voor duurzame toegang tot digitale informatie.3 http://www.den.nl/thema/129/ (Linked Open Data) (geraadpleegd: 09-06-2011) 9
  • 10. OnderzoeksvraagHet voorgaande resulteert in de volgende hoofdvraag:Is Linked (Open) Data, als toepassing van het semantisch web, een mogelijkheid om digitaleerfgoedinformatie duurzaam toegankelijk te maken?De bijbehorende deelvragen zullen het onderzoek meer diepte geven: Wat is digitale duurzaamheid? Wat is het maatschappelijk belang van het duurzaam toegankelijk maken van digitale (erfgoed) informatie? Welke mogelijkheden voor het duurzaam toegankelijk maken van digitale (erfgoed) informatie zijn er al? Wat is semantisch web? Welke ontwikkelingen zijn er vooraf gegaan aan het semantisch web? Wat is Linked Open Data (LOD)? Hoe verhouden LOD en het semantisch web zich tot elkaar? Door wie wordt deze toepassing van semantisch web al gebruikt? Wat zijn de voors/tegens van LOD als toepassing van semantisch web? Hoe werkt LOD? Welke stappen moeten doorlopen worden om van data LOD te maken? Is er een verschil tussen erfgoedinstellingen en niet-erfgoedinstellingen, in duurzaam toegankelijk maken van informatie?DoelstellingMijn doelstelling is de erfgoedprofessional een duidelijk beeld te geven wat Linked (Open) Data is enhoe het kan bijdragen aan duurzame toegankelijkheid van digitale erfgoedinformatie.AfbakeningAangezien duurzame toegankelijkheid even als Linked (Open) Data grote begrippen zijn, is het nodigeen afbakening te maken.Dit onderzoek heeft plaatsgevonden binnen de publieke sector. Hierin worden drie terreinenonderscheiden:4 Wetenschap Overheid Cultuur en mediaBinnen het cultuur en media terrein onderscheidt het ministerie van Onderwijs, Cultuur enWetenschap drie andere verdelingen: Media Letteren en bibliotheken Cultureel erfgoed4 Inge Angevaare ed., Toekomst voor ons digitaal geheugen. Duurzame toegang tot informatie in Nederland(Den Haag: Nationale Coalitie voor Digitale Duurzaamheid, juli 2009), 15. 10
  • 11. Cultureel erfgoed is het gemeengoed van de Reinwardt Academie. Het omvat de musea,monumenten, archeologie en archieven. Dit is ook het terrein waarin ik de duurzametoegankelijkheid van digitale informatie bestudeer.Na aangegeven te hebben welk terrein binnen de sector cultuur en media ik bestudeer, zal ik nuduidelijk maken wat ik onder digitale (erfgoed) informatie versta.Binnen de culturele erfgoedsector onderscheiden we drie verschillende soorten digitaal cultureelerfgoed: Born-digital erfgoed materiaal, dit zijn objecten die van origine digitaal zijn. Het zijn erfgoedobjecten die niet van analoge objecten zijn afgeleid. Hierbij kun je denken aan bouwtekeningen die gemaakt zijn met behulp van CAD/CAM-programmatuur, e- maildossiers, games, verrijkte publicaties, tweets en websites.5 Gedigitaliseerd erfgoed, hiervan kennen we twee soorten. 1. Gedigitaliseerd erfgoed dat het origineel heeft vervangen en nu als een digitaal substituut geldt. 2. Gedigitaliseerd erfgoed waarbij het fysieke origineel bewaard blijft.6 Digitale informatie over erfgoed, hieronder vallen bijvoorbeeld beschrijvingen die zijn vastgelegd in collectie-informatiesystemen.7In dit onderzoek laat ik born digital materiaal buiten beschouwing. Dit vanwege de complexiteit ende ‘nieuwheid’ van het materiaal.Wanneer ik het over digitale (erfgoed) informatie heb, bedoel ik hiermee gedigitaliseerd erfgoeden/of digitale informatie over erfgoed.MethodeIk heb geprobeerd meer grip te krijgen op de twee begrippen: duurzame toegankelijkheid en Linked(Open) Data, door eerst theoretisch onderzoek te doen, hierbij heb ik zowel literatuur als hetinternet geraadpleegd. De belangrijkste bronnen die ik gebruikt heb zijn: Meijers, E., Stapsgewijs naar duurzame toegang. Onderzoek naar een strategisch stappenmodel voor duurzame toegang tot digitale informatie in kleine en middelgrote erfgoedinstellingen. Thesis Master of Business Informatics – Avans+ (Middelburg, april 2010). Angevaare, I. ed., Toekomst voor ons digitaal geheugen. Duurzame toegang tot informatie in Nederland (Den Haag: Nationale Coalitie voor Digitale Duurzaamheid, juli 2009). www.den.nlDaarnaast heb ik met diverse mensen uit het werkveld gesproken. Ik heb ze gevraagd naar hunmening en ervaring met digitale toegankelijkheid en Linked (Open) Data. Zoals ik al aangaf wordtLinked (Open) Data als de ‘praktijk’ van het Semantisch Web gezien. Het Amsterdam Museum is deeerste Nederlandse culturele erfgoedinstelling die deze ‘praktijk’ ook daadwerkelijk in praktijk heeftgebracht. Zij hebben hun collectiedatabase als een Linked Open Dataset ontsloten. Ik ben bij hetAmsterdam Museum langs geweest om te weten te komen wat hun ervaringen zijn.5 M. Van der Graaf en G.J. Nauta, ‘Noodklok voor behoud van born-digital erfgoed’, Informatie Professional (04/ 2010), 12-15.6 http://www.den.nl/bericht/2283 (Digitaal duurzame bewaartermijnen?) (geraadpleegd: 22-09-2011)7 Ibidem. 11
  • 12. In veel van de gesprekken met experts op dit gebied kwam naar voren hoe ambitieus mijnonderwerp is. Het zijn twee grote thema’s die beide nog veel bestudeerd dienen te worden. Het wasdan ook erg moeilijk om me niet te verliezen in de complexiteit van voornamelijk het thema digitaletoegankelijkheid. Ik kom nog maar net kijken, terwijl sommige experts al tien jaar bezig zijn op ditterrein en nog steeds niet alles weten. Toch verwacht ik met deze scriptie de brug tussen de technicien de erfgoedprofessionals te slaan door op een begrijpelijke manier uit te leggen hoe digitaletoegankelijkheid en Linked (Open) Data met elkaar verweven zijn en wat zij voor elkaar kunnenbetekenen. 12
  • 13. 2 Digitale ToegankelijkheidDigitale toegankelijkheid gaat vanzelfsprekend samen met de komst van het digitale tijdperk.2.1 Wat is digitale toegankelijkheid?Met het ontstaan van het Internet in de jaren ’70, de komst van de eerste ‘personal computer’ in1981 van IBM en de komst van het Web van Tim Berners Lee in 1991 veranderde er niet alleen veelin positieve zin, maar ook in negatieve zin.Het Web bijvoorbeeld, is een handig middel om informatie sneller op te vragen en te verspreiden.Informatie sneller opvragen gebeurd door slimme ‘browsers’ op het Internet. Informatie verspreidengaat door webtoepassingen als virtuele tentoonstellingen. Deze voorbeelden kunnen allemaaldigitale technieken genoemd worden.In de jaren tachtig van de vorige eeuw realiseerde men zich dat de opkomende digitale techniekenook risico’s met zich mee brachten. Jeff Rothenberg benoemde de onderstaande technischeproblemen8: De dragers (cd, dvd, floppy disk) hebben een beperkte levensduur, vaak niet meer dan vijf jaar. De informatie bestaat uit een op zichzelf betekenisloze ‘bitstream’, alleen met behulp van de juiste hardware-/softwarecombinatie kan die informatie tot leven gewekt worden. De betekenis kan alleen achterhaald worden als aan de ‘bitstream’ zelf contextinformatie is toegevoegd.Deze risico’s vragen om oplossingen. Dit is echter niet eenvoudig. In tegenstelling tot papier dateeuwenlang in een constante (geklimatiseerde) omgeving bruikbaar kan worden gehouden, geldenvoor digitale informatie heel andere regels. Digitale informatie en haar dragers zijn nietvanzelfsprekend geschikt voor bewaring op de lange termijn.Met iedere nieuwe ontwikkeling van hard- en software zullen we de digitale informatie en hundragers moeten controleren of zij nog wel bruikbaar zijn. Dit gebeurd door de ‘bitstream’ tecontroleren. Blijkt de ‘bitstream’ niet meer toegankelijk te zijn, dan moet er een passende oplossinggevonden worden om de toegankelijkheid op de lange termijn te waarborgen. Deze controle van dedigitale informatie en haar dragers, vereist een continu proces van aandacht en zorg. We noemen diteen streven naar digitale duurzaamheid.9Digitale Duurzaamheid?Een streven naar digitale duurzaamheid dus. Wat is dan digitale toegankelijkheid?De Nationale Coalitie Digitale Duurzaamheid heeft in het rapportToekomst voor ons digitaalgeheugen aangegeven liever over duurzame toegang of duurzame toegankelijkheid te spreken dan8 Rothenburg, Jeff, ‘Ensuring the Longevity of Digital Information’, Scientific American, vol. 272, nr. 1 (1999) 24-29.9 Angevaare, Toekomst voor ons digitaal geheugen, 23. 13
  • 14. van digitale duurzaamheid. De reden die zij hiervoor geven is dat duurzame bewaring zondertoegankelijkheid geen zin heeft.10In mijn gesprek met Inge Angevaare (coördinator NCDD) gaf zij ook aan dat duurzametoegankelijkheid bestaat uit twee delen: Het bewaren van het object voor de toekomst, Het op de lange termijn beschikbaar houden voor de gebruiker.Ik sluit me aan bij de NCDD en zal in deze scriptie de term duurzame toegankelijkheid gebruiken.2.2 Wat is het doel van digitale toegankelijkheid?“Duurzaamheid opzich is nooit het doel” [Inge Angevaare, NCDD, 21-06-2011]11Het doel van digitale toegankelijkheid is het langdurig bewaren van digitale informatie enbeschikbaar houden voor de gebruikers, zodat de digitale informatie (her)gebruikt kan worden in detoekomst en men erop kan vertrouwen dat de informatie authentiek en betrouwbaar is.122.3 Waarom is digitale toegankelijkheid belangrijk?In het hedendaagse leven kan men niet meer zonder digitale informatie. Digitale informatie is eenessentieel bestandsdeel van onze kenniseconomie. In vrijwel elke sector publiek en/of privaat speeltinformatie een rol van betekenis. Tegenwoordig spreken we zelfs van een informatieovervloed inplaats van informatieschaarste. De publieke sector investeert in de productie en verwerving vandigitale informatie en wil deze langdurig toegankelijk houden.Binnen de culturele sector wordt het belang van deze taak benadrukt door de Raad van Cultuur. Zijwijzen op het belang van cultuurhistorie wat indirect het belang van digitale toegankelijkheid totdigitale erfgoedinformatie onderstreept. In het beleidsstuk Innoveren, Participeren!, zeggen zij: ‘Een samenleving die vooruit wil, doet er verstandig aan óók achterom te kijken. Het verleden moet niet worden vergeten, maar opgepoetst en gebruikt. Zonder continuïteit raken we op drift en koersen we van het ene incident naar het volgende. Ons collectieve geheugen, waarvan belangrijke delen zijn opgeslagen in archieven, musea en bibliotheken, schept een onmisbare basis voor die continuïteit.’ [Innoveren, Participeren!, 2007, p.12]De NCDD sluit zich hierbij aan door het volgende te zeggen: ‘Geschiedschrijving wordt in de toekomst onmogelijk als wij er anno 2008 niet voor zorgen dat digitale informatie over onze samenleving wordt bewaard.’1310 Ibidem, 13.11 Gesprek met Inge Angevaare, coördinator Nationale Coalitie Digitale Duurzaamheid, 21-06-2011.12 Ibidem, 12.13 http://www.ncdd.nl/digitaleduurzaamheid-inleiding.php (Inleiding in Digitale Duurzaamheid)(geraadpleegd:4-07-2011) 14
  • 15. Digitaal Erfgoed Nederland, Kennisland en het Ministerie van OCW benadrukken in het rapportBusiness Model Innovatie Cultureel Erfgoed juist de waardecreatie die toegang tot digitale collectiesbrengt: ‘De digitale collecties vertegenwoordigen een grote potentiële economische en maatschappelijke waarde, mits ze optimaal toegankelijke worden gemaakt.’14Naast deze redenen voor cultuurbesef en waardecreatie gelden er nog een aantal redenen dievoornamelijk van technologische en organisatorische aard zijn15: Erfgoedinstellingen investeren de laatste jaren fors in digitalisering van hun collecties. Duurzame toegankelijkheid van de digitale informatie waarborgt in zekere zin deze investering in digitalisering. Digitalisering van de collecties levert digitale reproducties van o.a. kwetsbare originelen. Deze hoeven dankzij de digitale reproductie niet vaak uit het depot gehaald te worden. Indirect zorgt duurzame toegankelijkheid van digitale informatie op deze manier ook voor duurzaamheid van het fysieke object.2.4 Obstakels en digitale toegankelijkheid?In paragraaf 1.1 zijn al kort de grootste risico’s die de toegankelijkheid tot digitale informatiebedreigen, uiteengezet. Er zijn echter drie soorten bedreigingen te noemen met elk hun eigenkenmerkende risico’s die de duurzame toegang tot digitale informatie in gevaar brengen. Hieronderde drie soorten bedreigingen16: Veranderingen in de technologie; Veranderingen in de omgeving; Veranderingen in de organisatie.Hoe vangen we deze risico’s en bedreigingen op en zorgen we ervoor dat de digitale informatie goedbewaard en beheerd wordt?Om de verschillende soorten bedreigingen van toegang tot digitale informatie te beperken kunnenverschillende beheersmaatregelen worden gehanteerd. Deze kunnen betrekking hebben op detechnologie en/of beleid en organisatie. We noemen dit ook wel bewaarstrategieën.Op de komende pagina’s worden de verschillende bedreigingen met hun bijbehorende (mogelijke)bewaarstrategieën beschreven.Deze beheersmaatregelen kunnen echter nog niet als DE oplossing worden gezien. De problematiekvan digitale toegankelijkheid tot digitale informatie is daarvoor nog te jong, nog geen twintig jaaroud. Deze beheersmaatregelen proberen de risico’s en bedreigingen tot een minimum te beperken.14 M. De Niet, L. Heijmans en H. Verwayen e.a., Business Model Innovatie Cultureel Erfgoed, (Ministerie OCW:z.pl. 2009), 6-7.15 http://www.den.nl/thema/16/digitale-duurzaamheid (Digitale Duurzaamheid) (geraadpleegd: 4-07-2011)16 Meijers, Stapsgewijs naar duurzame toegang, 13. 15
  • 16. 2.4.1 Veranderingen in de technologie en technische oplossingenVeranderingen in de technologie omvatte de risico’s die Jeff Rothenberg aangaf. Deze risico’s hebbenvoornamelijk betrekking op het bewaren van de digitale informatie.Digitale informatie bestaat uit enen en nullen (bitstream) die alleen betekenis krijgen wanneer dezewordt afgespeeld op dezelfde combinatie van hard- en software. Dit zou niet een heel grootprobleem moeten zijn mits de voortdurende ontwikkeling van nieuwe hard- en softwareproductenniet zo groot en snel was dat digitale informatie al na tien jaar onbruikbaar is. Wanneer een van detwee of beide verouderen en de informatie niet meer leesbaar is, moet een oplossing wordengevonden. Daarnaast speelt ook de beperkte houdbaarheid van digitale informatie dragers een rol.17Omdat dit een technische zaak betreft, vraagt dit om een technische beheersomgeving.Er zijn drie bekende technische bewaarstrategieën: Migratie, Emulatie, NormalisatieMigratieBestanden worden overgezet van de ene hardwareconfiguratie of softwareapplicatie naar de andere.Het bestand wordt dan niet meer als een bitstream opgeslagen maar in een formaat dat gangbaar engeschikt is voor de toekomst.Een goed voorbeeld is wanneer we een tekst hebben getypt op een computer met Windows 95software en deze willen openen op onze nieuwe computer met de software Windows 2007. Wezullen dan eerst het Windows 95 bestand moeten converteren naar een Windows 2007 bestand,voordat we het kunnen lezen. Anders kan de computer de bitstream niet meer ‘lezen’.Migratie is gericht op het behoud van data, er zijn echter toch een aantal nadelen. Migratie moetelke ± twee jaar herhaald worden om te voorkomen dat dit bestandsformaat ook niet verouderd enniet meer toegankelijk is. Het leidt vaak tot verlies van informatie. De nieuwe software kan hetbestand niet meer ‘lezen’ zoals het was. Er kunnen kenmerken als inhoud, structuur, uiterlijk ofgedrag verloren gaan. Het verlies van informatie leidt uiteindelijk tot aantasting van de authenticiteitvan het bestand.18EmulatieEen andere manier om je digitale informatie te behouden voor de toekomst is emulatie. Volgenssommige mensen is dit de enige mogelijkheid om de authenticiteit en integriteit van een digitaalbestand op de lange termijn te behouden.1917 Angevaare, Toekomst voor ons digitaal geheugen, 11.18 http://www.nationaalarchief.nl/informatiebeheer-archiefvorming/-digitaal-archiefmateriaal/bewaarstrategie%C3%ABn/migratie (Migratie) (geraadpleegd: 22-09-2011)19 http://www.nationaalarchief.nl/informatiebeheer-archiefvorming/-digitaal-archiefmateriaal/bewaarstrategie%C3%ABn/emulatie (Emulatie) (geraadpleegd: 22-09-2011) 16
  • 17. Bij emulatie blijft het oorspronkelijke bestand, bestaande uit het besturingssysteem en de softwarebehouden. De bitstream wordt, in tegenstelling tot bij migratie, niet veranderd. Er wordt als het wareeen software ontwikkeld die een nieuwe computer kan laten functioneren als een ouder model. Deoorspronkelijke omgeving wordt dus nagebootst op een nieuwe computer.2020 Ibidem. 17
  • 18. NormalisatieDit is een techniek met als doel alle digitale informatie te converteren naar een zelfdebestandsformaat. Deze methode wordt voornamelijk gebruikt wanneer er is besloten niet allebestandsformaten op te nemen in de digitale collectie.212.4.2 Veranderingen in de omgeving, hoe verder?Niet alleen het bewaren van digitale informatie is belangrijk. We moeten de digitale informatie alswe ze teruglezen ook in een context kunnen plaatsen, zodat we de betekenis van de inhoud kunnenbegrijpen.De ‘bitstream’ wordt pas informatie wanneer extra informatie over deze data beschikbaar is. Dezeextra informatie geeft betekenis aan de data. We noemen deze extra informatie: metadata. Op dezemanier wordt er context gecreëerd.Het beheren van de relevante metadata van digitale informatie is weer een extra uitdaging.22 Hierkomt ook de problematiek rondom het beheren van de relevante metadata voor duurzaamheid aanhet licht: De digitale objecten en de metadata worden beheerd in omgevingen waar in beperkte mate sprake is van professioneel IT-beheer. Het beheer van metadata richt zich vrijwel uitsluitend op de inhoud; het vastleggen van metadata noodzakelijk voor duurzaam beheer zoals het registeren van gebruikte formaten, herkomst- of referentie informatie of het vastleggen van een digitale ‘handtekening’ bij de objecten krijgt weinig aandacht.Dit deel van de problematiek van digitale toegankelijkheid is nog nauwelijks verkend. Enno Meijersgeeft aan dat de markt, om deze problematiek te verkleinen, nog niet ver genoeg ontwikkeld is. Hijsuggereert dat Digitaal Erfgoed Nederland deze markt kan ontwikkelen door hierin een sturende enstimulerende rol te spelen. Daarnaast geeft hij aan dat het beheren van de relevante metadata voorduurzaamheid ook op het terrein van inspelen op technologische veranderingen slaat.In België hebben ze in 2009 een product op de markt gebracht om de problematiek van metadatabeheer voor duurzaamheid te verkleinen. Dit stappenplan ontwikkeld door Expertisecentrum DAVIDuit Antwerpen, bevat een tiental praktische richtlijnen om de risico’s die duurzame toegankelijkheidvan digitale informatie met zich meebrengt te verkleinen. Het focust zich voornamelijk op juistsoftware gebruik en metadata beheer.Expertisecentrum DAVIDHet stappenplan van het expertisecentrum DAVID in Antwerpen is gebaseerd op de functionelevereisten van digitale archivering en de bijbehorende maatregelen voor risicobeheer.21 Angevaare, Toekomst voor ons digitaal geheugen, 25.22 Meijers, Stapsgewijs naar duurzame toegang, 14. 18
  • 19. Digitaal archiveren wordt als een risicovol en kwetsbaar reconstructieproces gezien. Bij het bouwenen beheren van een digitaal archief gelden daarom vijf terugkerende basisprincipes23:1. Vermijd (externe) afhankelijkheden.2. Vermijdt overbodige reconstructiestappen.3. Pas risicospreiding en –beheer toe.4. Pas normen en standaarden toe.5. Documenteer de implementatie en het beheer.Deze vijf basisprincipes vormen de basis voor de acties die voor elke stap worden uitgevoerd.Deze tien stappen zijn verdeeld in drie groepen: Groep 1 houdt zich bezig met de keuze en inrichtingvan de hard- en softwarearchitectuur. Groep 2 organiseert de functionaliteiten rondom leesbaarheid,authenticiteit en integriteit. De laatste groep documenteert het digitaal archiveringssysteem24. 1. Gebruik een betrouwbaar en beveiligd opslagsysteem en pas een adequaat beheer toe. 2. Bewaar de metadata op een digitaal duurzame wijze. 3. Voorzie een duurzame band tussen het document en zijn metadata. 4. Registreer voor elk digitaal object metadata. 5. Definieer en documenteer de essentiële eigenschappen van het originele document. 6. Bewaar de leesbaarheid van de digitale documenten. 7. Archiveer alle componenten die nodig zijn voor een getrouwe reconstructie van de documenten. 8. Documenteer het beheer van de digitale documenten. 9. Beschrijf de digitale documenten. 10. Documenteer het digitale archief.Dit stappenplan stelt iedere organisatie in staat een betrouwbaar digitaal archief op te stellen.2.4.3 Veranderingen in de organisatie dankzij nieuw beleidDe langetermijnzorg van digitale informatie vraagt om continue aandacht en zorg. De laatste jarengroeide het besef dat technische oplossingen niet voldoende zijn om de digitale risico’s die deduurzame toegang tot digitale informatie in gevaar brengen te beheersen. Om technischeoplossingen te kunnen ontwikkelen en te implementeren zijn beleidsmatige en organisatorischerandvoorwaarden nodig.25 Er moeten strategische keuzes binnen de organisatie worden gemaakt dieeen duurzaamheidstrategie implementeren. Deze strategische keuzes kunnen invloed hebben op dehele organisatiestructuur.2623 Filip Boudrez, Een digitaal archief in 10 stappen, (Antwerpen: Expertise Centrum DAVID vzw, 2009), 1.24 Boudrez, Een digitaal archief in 10 stappen, 2.25 Angevaare, Toekomst voor ons digitaal geheugen, 25.26 Meijers, Stapsgewijs naar duurzame toegang, 15. 19
  • 20. Er zijn diverse soorten beleidsmatige en organisatorische randvoorwaarden gedefinieerd. De volgende pagina’s beschrijven bestaande beheersmaatregelen die gebruikt zijn als instrument voor beleidsontwikkeling. Tot instrumenten voor beleidsontwikkeling behoren De BASIS van Digitaal Erfgoed Nederland, “Planning Tool for Trusted Electronic Repositories – PLATTER” door het project Digital Preservation Europe (DPE) en Business Model Innovatie ontwikkeld vanuit het Ministerie van OCW. De BASIS De culturele erfgoed sector vind deze randvoorwaarden voornamelijk in ‘de BASIS voor Duurzaamheid’ van DEN.27 Digitale toegankelijkheid op de lange termijn is een continu proces en begint al bij de creatie van het digitale bestand. De BASIS is een strategie waarin de technische- en ICT-infrastructuur beheersmaatregelen elkaar ontmoeten, die is gebaseerd op de kwaliteitscyclus van DEN en bestaat uit minimale eisen die elkaar in verschillende fasen opvolgen28.Fase 1: beleid ontwikkelenIedere erfgoedinstelling die digitale informatie produceert moet denken aan eenduurzaamheidstrategie. Bij het opstellen van een duurzaamheidbeleid moet rekening wordengehouden met vier aspecten:- Documentatie, het formuleren van een informatieplan.- Organisatie, de gehele organisatie is zich bewust van de betekenis van duurzaamheid- Middelen, er wordt budget gereserveerd.- Technische oplossing, welke systemen worden gebruikt? Eigen beheer ja/nee?Fase 2: plannen makenEr worden concrete plannen geformuleerd die gebaseerd zijn op het beleid om collecties tedigitaliseren en digitale informatie te beheren. Hieraan worden een aantal eisen gesteld:- Wat wordt bewaard? Er dienen selectiecriteria opgezet te worden.- Criteria voor bestandsformaten, welke bestandformaten worden opgenomen?- Uitvoerbare plannen, check-check-dubbel check.- Kennis van externe voorzieningen, kijk eens bij de buren, hoe doen zij het? 27 http://www.den.nl/pagina/217/standaarden_en_richtlijnen/ (DE BASIS voor digitale duurzaamheid) (geraadpleegd: 26-07-2011) 28 Ibidem. 20
  • 21. Fase 3: uitvoering Concrete oplossingen voor duurzame toegankelijkheid tot digitale informatie moet aan een aantal eisen voldoen: - Kennisuitwisseling, er dient een aanspreekpunt binnen de organisatie te zijn. - Referentiemodel, wanneer een eigen ‘repository’ wordt gemaakt dient die volgens het OAIS-model te zijn opgezet. Fase 4: evaluatie Wanneer een erfgoedinstelling duurzame toegang tot digitale informatie nastreeft dient een evaluatie plaats te vinden die aan een basiseis voldoet: - Toetsing van een eigen ‘repository’ dient plaats te vinden met TRAC.De BASIS voor Duurzaamheid bestaat nu twee jaar en zal in 2011 geëvalueerd worden en indien nogaangepast.PLATTEREen ander goed werkende beleidsstrategie die duurzame toegang tot digitale informatie nastreeft isde “Planning Tool for Trusted Electronic Repositories - PLATTER” [DPE, 2008].Dit is een instrument ontwikkeld door het project Digital Preservation Europe. Het heeft als doel tekomen tot het formuleren van concrete, meetbare doelstellingen voor het digitaal archief.29PLATTER richt zich op negen strategische plannen die samen een duurzaam beleid vormen tenopzichte van toegang tot digitale informatie die in verband worden gebracht met de tien CorePrinciples of Trust Repository Design30. 1. Business Plan – Financiële planning, monitoring en planning. 2. Acquistion Plan – Evaluatie beleid. Beheren van de relaties met aanbieders en andere leveranciers. 3. Staffing Plan – Aquisitie en onderhoud van relevante vaardigheden voor depotbeheer. 4. Acces Plan – Toegangsbeleid. Beheren van gebruikersrelaties. 5. Technical Plan – Doelen vaststellen voor hardware, software en netwerken. 6. Data Plan – Specificatie van data en metadata van objecten, formaten en structuren voor opname, opslag en verspreiding samen met de relevante transformaties en mappings. 7. Succession Plan – Beheren van contracten na verloop van het archief om digitale objecten te behouden voor de toekomst. 8. Disaster Plan – Reageren op veranderingen in het archiefsysteem. 9. Preservation Plan – Erop toezien dat de toegang en bruikbaarheid van de digitale objecten in29 Meijers, Stapsgewijs naar duurzame toegang, 32.30 Statsbiblioteket, HATII ed., Repository Planning Checklist and Guidance, (Glasgow: HATII, 2008), 9. 21
  • 22. Business Model InnovatieAls het om beleidsontwikkeling gaat, mag een Business Model niet vergeten worden. Ook niet bijontwikkeling van beleid voor duurzame toegankelijkheid tot digitale informatie. Het bieden vanduurzame toegang tot digitale informatie vraagt om financiële middelen. Voordat men investeert induurzame toegang moet duidelijk zijn wat de baten zijn van deze toekomstige investering.31Het Business Model dat besproken wordt in Business Model Innovatie, Cultureel Erfgoed van DEN,Kennisland en het Ministerie van OCW gaat uit van negen bouwstenen die in directe relatie tot elkaarstaan.32 1. Propositie – Onderscheidend vermogen organisatie. 2. Klant – Klant is koning. 3. Distributie – Bepaald communicatie en ervaring klant. 4. Relatie 5. Opbrengsten – Bereidheid betaling klant. Volgt uit 4 voorgaande bouwstenen. 6. Activiteiten – Om propositie te kunnen realiseren. 7. Resources – Door organisatie zelf uit te voeren activiteiten. 8. Partners – Uitbesteding activiteiten. 9. Kosten – Kostenstructuur organisatie. Volgt uit bouwstenen 6 t/m 8.In de vorige pagina’s hebben we stil gestaan bij beheersmaatregelen die betrekking hebben op het tevormen beleid en de technologie die nodig is om de risico’s die de duurzame toegang tot digitaleinformatie in gevaar brengen te verkleinen. Beleidsmatige- en technologische beheersmaatregelenontmoeten elkaar bij het inrichten van een stabiele interne infrastructuur. Het inrichten van eenstabiele interne infrastructuur is het derde aspect van duurzaam beheren. Dit derde aspect is nogniet eerder genoemd als duurzaam beheersaspect, maar het kan als het ware als een sausje over detechnologische- en beleidsmatige beheersmaatregelen worden gegoten.Duurzame toegang tot digitale informatie heeft o.a. te maken met interne infrastructuren. Wanneerdeze stabiel zijn, kan dit tot zo min mogelijk verlies van informatie leiden.33 Het voor vrijwel iedereenbekende OAIS-model biedt een manier om een dergelijke stabiele interne infrastructuur binnen eencollectiedatabase op te zetten.OAIS-modelHet “Open Archival Information System (OAIS) Reference Model” [CCSDS, 2009] is een model dat eenconceptueel begrippenkader introduceerde voor een architectuur voor duurzame toegang. Het isalgemeen geaccepteerd en wordt over de hele wereld gebruikt. Het werd in 2000 ontwikkeld door31 Meijers, Stapsgewijs naar duurzame toegang, 33.32 De Niet, Heijmans en Verwayen e.a., Business Model Innovatie Cultureel Erfgoed, 16-18.33 Meijers, Stapsgewijs naar duurzame toegang, 24. 22
  • 23. het Consultative Committee for Space Data Systems (CCSDS) van NASA. Tegenwoordig is het zelfseen ISO-standaard (ISO 14721 [Lavoie, 2004]).34Het OAIS-model draaitom het zogenaamde‘Archive InformationPackage’ (AIP).Een digitaal object wordtopgenomen in hetarchief.Alle digitale objectensamen vormen hetArchive InformationPackage.Het doel van het archiefis dit AIP duurzaamtoegankelijk te houden.Dit gebeurd aan de hand Figuur 1: OAIS Functioneel Modelvan de zes functies die infiguur 1 zijn gekaderd. Hieronder worden ze verder toegelicht35. ‘ingest’ Dit is het startpunt van het archiveringsproces. Het materiaal dat wordt aangeboden wordt beoordeeld op verschillende aspecten als kwaliteit, formaat en volledigheid die bepalen of het materiaal geschikt is voor opname in het archief. ‘storage’ Bij deze stap wordt gekeken naar de opslag van het digitale object en de bijbehorende metadata. Het is een continueproces waarbij veel aandacht is voor de conditie van de opslagomgeving en de opgeslagen gegevens. ‘data management’ De databeheer-functie zorgt voor de instrumenten voor het toekennen en onderhouden van alle metadata die nodig zijn voor het duurzaam beheer van het informatieobject. Dit gaat verder dan het alleen maar toekennen van metadata voor het ontsluiten; er is ook behoefte aan het vastleggen van formaattype, controlewaarden (‘fixity’), wijzigingshistorie (‘provenance’) en gebruiksvoorwaarden (‘access rights’). ‘access’ Dit wordt ook wel de raadpleeg functie genoemd. Hier wordt gezorgd voor de vindbaarheid en het toegang geven tot het digitale object. Hierbij worden wel de voorwaarden die bij de opname functie zijn vastgesteld aangehouden. ‘Access’ en ‘data management’ staan in nauw contact met elkaar.34 Angevaare, Toekomst voor ons digitaal geheugen, 25.35 Meijers, Stapsgewijs naar duurzame toegang, 26. 23
  • 24. ‘administration’ De zogenaamde coördinatie van het beheer is een veelomvattende taak. Het bevat o.a.: - bewaking van het opname proces, - configuratie management voor hard- en software, - proces monitoring, - documenteren en rapporteren over de opgeslagen objecten, - ontwikkelen en onderhouden archiveringsbeleid, - ondersteunen gebruikers. ‘preservation planning’ Deze functie verzorgt de evaluatie van het archief. Het speelt in op de veranderingen in technologie, of veranderingen van gebruikers en/of producenten. Op deze manier spoort men vroegtijdig eventuele risico’s op die kunnen optreden of kunnen de nodige aanpassingen aan het archief worden gemaakt.De introductie van het OAIS-model heeft veel invloed gehad op de manier waarop men omgaat metde problematiek rondom duurzame toegankelijkheid tot digitale informatie. Elke organisatie dienadenkt over duurzame toegankelijkheid tot de digitale informatie van haar instelling, wordt geachtde zes functies van het OAIS-model in haar beleid op te nemen.36Naast deze beheersmaatregelen- die gebaseerd zijn op de drie aspecten van duurzaam beheren:beleid, inrichting en technologie- zijn er natuurlijk nog tal van andere beheersmaatregelen. Dit zijnechter de meest gehanteerde. Bovendien vormen deze beheersmaatregelen de basis voor hetstappenmodel dat Enno Meijers in zijn master thesis heeft ontwikkeld. Dit wil ik graag gebruiken indeze scriptie om de koppeling naar het gebruik van Linked (Open) Data te leggen.2.5 Strategisch StappenmodelEnno Meijers heeft een stappenmodel ontwikkeld dat kleine- en middelgrote cultureleerfgoedinstellingen in staat stelt aan de slag te gaan met de problematiek van duurzametoegankelijkheid tot digitale informatie. Het stappenmodel kan gebruikt worden als eenondersteunend middel bij het opstellen van maatregelen om de risico’s van verlies van digitaleinformatie te beperken.37De maatregelen raken aan veel gebieden binnen de organisatie van de culturele erfgoedinstellingen: Ontwikkeling beleid, Inrichting ICT-infrastructuur, Beheersprocessen.36 Angevaare, Toekomst voor ons digitaal geheugen, 25.37 Meijers, Stapsgewijs naar duurzame toegang, 30. 24
  • 25. Om die reden zijn veel van de in paragraaf 2.4 besproken beheersmaatregelen verwerkt in hetstappenmodel. We zien PLATTER, het OAIS-model en het stappenplan van Expertisecentrum DAVIDterug in het stappenplan van Enno Meijers.“De toegevoegde waarde van het stappenmodel is het rangschikken van de stappen naar volgordevan urgentie met als leidraad de vijftien elementen uit het volwassenheidsmodel van Dollar.”38VolwassenheidsmodelHet stappenmodel is gebaseerd op het volwassenheidsmodel van Charles M. Dollar.Het volwassenheidsmodel van Dollar: “Digital Preservation Capability Maturity Model” is gebaseerdop het bekende Capability Maturity Model Integration uit de IT, waarvan de basis in 1990 isontwikkeld. Charles M. Dollar is een pionier op het gebied van duurzame toegankelijkheid.39Dit volwassenheidsmodel voor digitale duurzaamheid bestaat uit vijftien kernfactoren. Deze zijnverdeeld in twee groepen.De ene groep omvat de factoren die gaan over de infrastructuur van digitale duurzaamheid.De andere groep bevat de processen dienodig zijn om duurzameopslag van en toegang tot digitaleinformatie te realiseren.40De essentie van eenvolwassenheidsmodel is het inrichtenvan een cyclisch proces van verbeteringom op deze manier een steeds hogerkwaliteitsniveau te bereiken.In het volwassenheidsmodel worden vijfniveaus gedefinieerd voor het vermogenvoor duurzame toegang. De vijftienkernfactoren zijn vervolgens geordend Figuur 2: Digital Preservation Infrastructure and Processesnaar urgentie en afname van risico op (Dollar, 2010)verlies van digitale informatie dieverwerkt zijn in het strategischstappenmodel.412.5.1 Opbouw van het stappenmodelHet stappenmodel bestaat uit drie delen. Deel A: Het bepalen van de ambitie van de organisatie. Deel B: Het veiligstellen van de digitale objecten. Deel C: Het duurzaam toegang bieden tot digitale informatie.38 Meijers, Stapsgewijs naar duurzame toegang, 49.39 http://www.digitaalallemaal.nl/?p=2061, (Blog van DEN)(geraadpleegd: 24-09-2011).40 Meijers, Stapsgewijs naar duurzame toegang, 42.41 Ibidem, 90. 25
  • 26. Aangezien ik in mijn scriptieonderzoek juist dieper in ga op het duurzaam toegang bieden tot digitaleinformatie zal ik hier alleen stil staan bij Deel C van het stappenmodel. Het gehele stappenmodel is tezien in Bijlage 1.2.5.2 Deel C: Duurzaam toegang biedenIn deel A en deel B van het stappenmodel was het doel langdurig toegang te bieden tot digitaleinformatie. Om dit te bereiken moeten de gebruikers eenvoudig over de informatie kunnenbeschikken die voor hen relevant is. Bovendien moeten zij erop kunnen vertrouwen dat deinformatie die zij vinden, betrouwbaar is. Hierin spelen twee processen een belangrijke rol.Metadata van een digitaal object zijn nodig om het object te kunnen vinden, er toegang tot tekrijgen, het object betekenis te geven en de authenticiteit te kunnen bepalen.Veranderingen in de omgeving kunnen het digitale object in gevaar brengen als deze niet constant inde gaten worden gehouden, zodat men ziet of de digitale objecten of de collectiebeheerssystemenaangepast moeten worden.Bovenstaande is schematisch weergeven in figuur 3. Hierin zijn ook een aantal kernfactoren van hetvolwassenheidsmodel van Charles M. Dollar terug te zien.Figuur3: Deel C van het stappenmodel Enno Meijers.Stap 1 – duurzame toegangDe eerste stap in dit deel is bedoeld om planmatig vast te stellen op welke manier de gebruikersinformatie moeten kunnen vinden en gebruiken. Welke vorm van ‘ontsluiting’ is het meest geschiktvoor de beoogde doelgroep? Welke maatregelen zijn er nodig om de duurzaamheid tewaarborgen?42StrategyHet antwoord op deze vragen kan worden verkregen door een plan voor duurzame toegang op testellen dat als leidraad dient bij het verder concretiseren van de stappen om duurzame toegang totdigitale informatie te vergroten. Het ‘Acces Plan’, ‘Data Plan’ en ‘Preservation Plan’ van PLATTER kanhierbij gebruikt worden als voorbeeld van een dergelijk plan. Ook het stappenplan van42 Ibidem, 60. 26
  • 27. Expertisecentrum DAVID haakt hier op in.4343 Ibidem, 61. 27
  • 28. Designated CommunityVanuit het perspectief van de gebruiker is het aan te raden om de informatie aan te bieden op basisvan open standaarden, eenvoudig doorzoekbaar en met zo weinig mogelijk drempels.Gebruikers verwachten steeds sneller informatie te kunnen vinden. Zij gaan niet meer naar deinformatie op zoek, maar er wordt verwacht dat de informatie naar hen komt. Informatie moetbeschikbaar zijn op de plaatsen waar de gebruiker vaak komt. Google en allerlei verschillende ‘SocialMedia’ zijn hier een goed voorbeeld van.AccessDe aard van het object en het gebruikersdoel bepaald welke beschrijvende metadata aan het digitaleobject toegevoegd moeten worden. Naast de beschrijvende metadata zijn er nog een aantal anderesoorten metadata die belangrijk zijn voor duurzame toegang tot digitale informatie. Hierover meer instap 2: beheer van metadata.Open StandardsOm veranderingen in de technologie, in productieprocessen van producenten of veranderingen in decontext van de gebruikers op te vangen is het een goede keuze om open standaarden en open sourcesoftware toe te passen. Hierop wordt ingegaan in stap 3: de veranderende omgeving.44Stap 2 – Beheer van metadataHet beheer van metadata komt duidelijk terug in het OAIS-model. De data-beheer functie van hetmodel definieert vijf verschillende soorten metadata die een rol spelen bij duurzame opslag entoegang tot digitale informatie.45 Referentie metadata Context metadata Onveranderbaarheid (‘fixity’) Herkomst (‘provenance’) Toegang (‘access’)Wat is nu precies kenmerkend aan deze verschillende soorten metadata?ReferentiemetadataHet OAIS-model beschouwt ‘beschrijvende’ metadata als referentie metadata. Dit zijn metadata dieeen beschrijving geven van een bibliografie, object en/of archief.Onder dezelfde noemer schaart het OAIS-model ook de zogenaamde ‘persistent identifier’. Dit soortreferentie metadata zorgt voor duurzame adressering van het Archief Informatie Pakket (AIP).Verwijzingen kunnen op deze manier een lange tijd geldig blijven. Welke ‘persistent identifier’gebruikt dient te worden in de culturele erfgoedsector is nog een punt van discussie.De realisatie van een duurzame verbinding tussen het digitale object en haar beschrijvende metadatais niet eenvoudig. Het OAIS-model ziet deze twee elementen als onderdelen van het Archief44 Ibidem, 61.45 Ibidem. 28
  • 29. Informatie Pakket (AIP). De huidige collectiebeheerssystemen voorzien echter nog niet in dezedenkwijze dat er een ondeelbare koppeling is tussen het digitale object en haar beschrijvendemetadata. In afwachting van verdere ontwikkelingen in de komende jaren is het raadzaam om metperiodieke controles de vindbaarheid te bewaken van zowel de metadata als de objecten en van derelaties onderling daartussen.46Metadata ten behoeve van authenticiteitZoals men door de jaren heen wijs is geworden, zo weet men ook dat digitale informatie kwetsbaaren eenvoudig te manipuleren is. Men hecht daarom tegenwoordig veel waarde aan de authenticiteitvan het digitale object. Het aanbieden van openbare betrouwbare informatie sluit aan bij diebehoefte aan authenticiteit.47Voor het bewaren van de authenticiteit van het digitale object zijn twee aspecten belangrijk. Deonveranderbaarheid of te wel ‘fixity’ van het digitale object en herkomst (‘provenance’) van hetdigitale object.De ‘fixity’ van het digitale object geldt als een controle voor de authenticiteit. Om de authenticiteit tewaarborgen kan bijvoorbeeld een digitale ‘handtekening’ worden aangebracht. Deze wordt danregelmatig gecontroleerd op vervalsing.De ‘provenance’ van het digitale object vertelt meer over de wijzigingen aan het AIP in het verleden,die in het verleden hebben plaatsgevonden.Overige metadataEr zijn nog twee soorten metadata te benoemen. Een daarvan is in 2009 opgenomen in het OAIS-model.‘Context’ metadata worden door het Expertisecentrum DAVID als volgt omschreven: het beschrijvenvan de archiefvormer, het beschrijven van het werkproces waarbinnen het document een rol/functievervulde, en het documenteren van de relatie met archiefbestanddelen en andere documenten.48Een nieuwe soort metadata die in het OAIS-model benoemd wordt, is de ‘access rights’ metadata.Deze soort metadata beschrijft de voorwaarden waaronder het materiaal bewerkt mag worden voorduurzame opslag en opgevraagd mag worden door de gebruiker. Deze toegangsrechten wordenbepaald bij de opname van het digitale object in het AIP.49Zoals bij de ‘persistent identifier’ al duidelijk werd is er in veel collectiebeheerssystemen nog geenruimte om ook de bijbehorende metadata van het digitale object op te nemen. Het koppelen enbeheren van de metadata aan het digitale object is nog een lastige opgave, net als het bewaken vande authenticiteit. Dit vormt voor culturele erfgoedinstellingen een grote uitdaging. De juiste softwaredie in staat is de metadata en het digitale object te koppelen bestaat nog niet. De bestaandesoftwaresystemen zijn geënt op opslag en archivering. Het accent ligt niet op het bieden van toegangtot digitale informatie.46 Ibidem, 62.47 Ibidem, 63.48 Ibidem, 64.49 Ibidem. 29
  • 30. Toch dient de relatie tussen metadata en object behouden te worden. Desnoods in een aparteadministratie. De volgende ‘tips’ zouden kunnen bijdragen aan het beheren van de metadata. Eén mogelijkheid is het noteren van de metadata in XML-documenten. Dit gebeurt ook al met het digitale object. Dit zou het eenvoudiger maken de duurzame relaties tussen het digitale object en de bijbehorende metadata te beheren. Zorg ervoor dat de metadata van het digitale object onder dezelfde omstandigheden wordt opgeslagen en beheerd als het digitale object. Bij voorkeur worden deze twee ook in dezelfde opslagplaats beheerd. Tenslotte is het verstandig een collectiebeheersysteem te gebruiken dat in staat is om alle data in een open formaat te exporteren zonder tussenkomst van de leverancier. Zorg er in ieder geval voor dat de broncode van de software altijd beschikbaar blijft in de toekomst.Stap 3: de veranderende omgevingDe IT-technologie is voortdurend aan verandering onderhevig.Het belangrijkste doel van duurzame toegankelijkheid is het leesbaar houden van de informatie. Hetleesbaar kunnen houden van de digitale informatie is gekoppeld aan het bekend zijn met dedefinities van de gebruikte formaten.Om het risico te verkleinen dat binnen een organisatie niemandmeer bekend is met de gebruikte formaten en software, kanbesloten worden de digitale objecten tijdig te migreren naar eenander formaat. Hierbij gaat de voorkeur uit naar formaten diegebaseerd zijn op open standaarden. Zij hebben een duurzaamkarakter omdat de formaatdefinities algemeen beschikbaar zijn. Zeworden breder ondersteund en kunnen vaak door meerderesoftwareprogramma’s gelezen worden.50 Figuur 4: Open Standaarden,Een ander risico dat ingedekt kan worden is de kans dat een Open Sourcesoftwareleverancier failliet gaat en het collectiebeheerssysteemmet hem ten onder gaat. Wanneer men gebruik maakt van open source software zal de broncodevan de software altijd beschikbaar blijven en is de instelling niet afhankelijk van desoftwareleverancier. Een handig bijkomend element is dat open source software deformaatdefinities ook documenteert dankzij de broncode.Daarom is het voor de duurzame toegang tot digitale informatie wenselijk zo veel mogelijk gebruik temaken van open standaarden en open source software.Naast deze technische ontwikkelingen dient er ook rekening gehouden te worden met veranderingenbinnen de organisatie. Denk hierbij aan de doelgroep, maar ook aan de producenten van digitaleinformatie.5150 Ibidem, 65.51 Ibidem, 66. 30
  • 31. Tot zover Deel C: duurzaam toegang bieden. Dit deel van het stappenmodel van Enno Meijers vormteen aanleiding om Linked (Open) Data te introduceren als technologische verandering van deomgeving in hoofdstuk 4. Maar eerst zal ik de context waarin Linked (Open) Data thuis hoortscheppen in hoofdstuk 3.3 Ontwikkelingen van het WebIn de afgelopen twintig jaar heeft het Web een aantal grote ontwikkelingen doorgemaakt. Wekennen allemaal de termen: Internet, social media, web 1.0 en web 2.0. Deze woorden duidenallemaal op deze ontwikkelingen van het Web. De laatste ontwikkeling binnen het Web is hetSemantisch Web.3.1 Wat is het Web?Met het Web wordt het World Wide Web bedoeld. Dit is een applicatie of dienst die gebruik maaktvan het Internet. In tegenstelling tot wat veel mensen denken is het Web iets anders dan hetInternet.InternetHet internet is het mondiale netwerk van aan elkaar gekoppelde computers. Het wordt gebruikt voorhet versturen van informatie in pakketvorm (applicatie). Ieder netwerk bestaat uit computers dieverbonden zijn via kabel of radioverbindingen. 52 Op dit systeem draaien vele applicaties of diensten.Het World Wide Web is hier een van. Andere bekende applicaties zijn: 53 E-mail, VoIP, FTP, UseNetHet Internet bestond en werkte al in de jaren zeventig. Het Internet werkt volgens twee zogenaamdeInternetprotocollen. Internet Protocol (IP) en Transmission Control Protocol (TCP).Verschillendecomputers in diverse computernetwerken kunnen via de afspraken in deze Internetprotocollen metelkaar communiceren, waardoor een wereldwijd netwerk ontstaat.54Het Web is een dus een applicatie of dienst die via het Internet functioneert. Het is een collectie vangeschreven documenten en andere bronnen, die worden verbonden door hyperlinks en URL’s dieverzonden zijn door Web-browsers en Web-servers.Hoe is het World Wide Web ontstaan?Het World Wide Web zoals wij dat nu kennen vindt zijn oorsprong in 1990. Het werd ontwikkeld door52 Tim Berners-Lee, De wereld van het World Wide Web. Het oorspronkelijke ontwerp en de uiteindelijkebestemming van het World Wide Web, beschreven door zijn uitvinder, (Amsterdam: 2000), 18-19 + 222.53 http://nl.wikipedia.org/wiki/Internet (Internet) (geraadpleegd: 25-08-2011).54 Berners-Lee, De wereld van het World Wide Web, 18-19 + 222. 31
  • 32. Tim Berners-Lee. Het Web werd uitgevonden met de bedoeling om kennis en gegevens inzogenaamde datasets uit te wisselen tussen wetenschappers verspreid over de wereld.Tim Berners-Lee had de intentie om een Web te creëren dat vroeg om de participatie van haargebruikers. Hij verwachtte in drie maanden een Web te ontwikkelen waarin de gebruikers alleencontent konden afnemen en binnen acht maanden konden deze zelfde gebruikers ook zelf contenttoevoegen aan het Web.Dit gebeurde echter niet. Men kon alleen maar gelinkte documenten lezen. Het Web werd vrijeenzijdig gebruikt. Er werd informatie gepubliceerd die door gebruikers werd geconsumeerd. Menkon dus alleen lezen wat op dat moment beschikbaar was.Het Web waarin content werd aangeboden die enkel geconsumeerd kon worden ontwikkelde zichtien jaar voordat gebruikers hun content ook in het Web konden plaatsen. We hebben het hier danover gebruikers zonder technologische kennis.Standaarden World Wide WebTim Berners-Lee voegde twee al bestaande technologieën bij elkaar, namelijk: Internet, Hypertext.Internet is het overkoepelende netwerk van verschillende applicaties. En hypertext word gezien alseen document met verwijzingen naar andere documenten die in een klik van de muis ‘gevolgd’kunnen worden. Hieruit ontwikkelde hij drie essentiële technologieën. Hij bedacht het communicatieprotocol HTTP, de opmaaktaal HTML en het idee van een Web-adres URL. Alle drie deze standaardenworden tegenwoordig nog steeds gebruikt en vormen samen de ruggengraat van het Web. 553.2 Het DNA van het WebTegenwoordig heeft vrijwel iedereen toegang tot het Web. Doordat er zoveel gebruikers zijn is hetWeb zich gaan ontwikkelen. De ontwikkeling van het Web kent een aantal kenmerken.De ontwikkeling van het Web is grof in te delen in drie periodes van ± tien jaar, ook wel generatiesgenoemd: 1990-2000 World Wide Web 2000-2010 Social Web 2010-... Semantisch WebWat zijn nu de belangrijkste kenmerken van deze zogenaamde generaties van het Web? Door welkevaak innovatieve ontwikkelingen zijn zij ontstaan?55 Gesprek met Victor de Boer, postdoctoraal onderzoeker binnen de Web & Media Group aan de VrijeUniversiteit Amsterdam, 22-07-2011. 32
  • 33. Volgens Nova Spivack - een prominente denker in het toekomstige Internet (met name SemantischWeb)- kennen deze generaties twee drijfveren, namelijk:56 Technologische drijfveer, Sociaal-economische drijfveer.Met technologie wordt bedoeld dat voornamelijk professionals zoals programmeurs en ingenieurseen rol spelen in deze innovatieve ontwikkelingen van het Web. De gebruikers spelen hier geen rol.In de jaren negentig werd het ‘Web’ uitgevonden door Tim Berners-Lee. Dit is een van de bekendstevoorbeelden van een technologische drijfveer.Het sociaal-economische aspect als drijfveer draait veel meer om de participatie van de gebruiker bijhet aanleveren van content. Social media toepassingen als Facebook en Twitter zijn een perfectvoorbeeld van het sociale aspect, dat wordt ondersteund vanuit economisch opzicht. De gunstigeeconomie zorgt ervoor dat rond 2000 bijna heel Nederland thuis een computer heeft en zich op hetinternet begeeft. De professionals hebben op dat moment niet meer het alleenrecht op hetpubliceren van content op het Web.Technologie en het sociale-economie kunnen dus worden gezien als de twee basisstrengen van hetDNA van de innovatie van het Web. Deze twee zijn nooit los van elkaar te zien, maar zijn elkaarstegenhanger. Er is altijd sprakevan een directe wisselwerkingtussen beide DNA strengen. 57Deze heeft ervoor gezorgd dater een ware evolutie op hetinternet gaande is, die als eensoort golfbeweging isontwikkeld.De ontwikkeling van het Webwas dus een puurtechnologische ontwikkelingvan professionals op het gebiedvan ICT. Er kwamenvoornamelijk ingenieurs enprogrammeurs bij kijken. De Figuur 5: Het DNA van web innovatie.gebruikers consumeerde deinformatie die zij toegespeeld kregen. Zij konden helemaal niet mee beslissen welke informatie tothun kwam. Achteraf gezien benoemen we deze ontwikkeling ook wel met het buzzwoord: ‘web 1.0’.3.3 Het ‘Social Web’Rond het jaar 2007 is het wat men noemt: het ‘Social Web’ ontstaan. Het Web werd inmiddels door56 http://www.frankwatching.com/archive/2009/01/05/web-webber-webst-van-10-naar-30%E2%80%A6-en-verder/ (Onafhankelijk crossmedia platform)(geraadpleegd: 26-08-2011)57 http://www.frankwatching.com/archive/2009/01/05/web-webber-webst-van-10-naar-30%E2%80%A6-en-verder/ (Onafhankelijk crossmedia platform)(geraadpleegd: 26-08-2011) 33
  • 34. miljoenen mensen gebruikt. Al deze gebruikers van het Web creëerden een nieuw inzicht. Menontdekte dat de huidige infrastructuur van het internet ook gebruikt kon worden om iets van deconsument terug te krijgen.58InteractiefActief is het woord van het ‘Social Web’. De infrastuctuur van het Web verandert vaneenrichtingsverkeer naar tweerichtingsverkeer. De gebruiker kan interactief zijn met het Web.58 Ivo Zandhuis, ‘Fundamenten in verandering: archieven op het semantisch web’, Archievenblad, (mei 2010), 1. 34
  • 35. In de vorm van ‘Social Media’, wordt er interactief deelgenomen aan het Web: Social tagging, Weblogs, Delen van foto’s, Reageren op elkaars berichten/foto’s, Publiceren van content.De gebruiker consumeert nu niet alleen meer, maar produceert nu ook. Er ontstaat een zogenaamde‘prosumer’.In navolging van de technologische golfbeweging die de ontwikkeling van het Web was, speelt juisthet sociaal/economische aspect een rol bij de ontstaan van ‘het sociale Web’. Het ‘Social Web’ isgericht op de gebruiker, je ziet dat de technologie dan ook de functionaliteit volgt. Niet langer gaathet om de techniek van het Web, maar gaat het over een concept dat betrekking heeft op hetgebruik van webapplicaties door mensen. Het ‘Social Web’ is voor de zelfstandige activiteit van hetpubliek.59Toen het tweerichtingsverkeer eenmaal op gang was, verspreidde het ‘Social Web’ zich als eenlopend vuurtje. Verschillende zogenaamde ‘Social Media’ als Twitter, Facebook, Hyves etc. kwamenop en men nam hieraan deel. Het succes van het ‘Social Web’ is volgens Haustein en Pleumann tedanken aan twee factoren:60 Participeren op het Web was eenvoudig, De resultaten van de participatie op het Web werd direct zichtbaar voor de gebruiker.De drempel om te participeren binnen het ‘Social Web’ is erg laag. Participeren kan al door een kleinbeetje content te delen. Je kunt rustig de kat uit de boom kijken en later meer content toevoegen.Het gaat erom dat je participeert, dat je het tweerichtingsverkeer op gang houdt. Bovendien groeitde waarde van de content wanneer mensen content publiceren over datzelfe onderwerp.61 Hiergeldt het principe: the wisdom of the crowd. Al deze inspanningen op het Web zijn direct terug tezien en kunnen we als resultaat van onze inspanningen beschouwen. Dat zorgt voor een voldaangevoel. Jij draagt bij aan het Web.3.4 Het Semantisch WebDe term Semantisch Web is niet nieuw. Deze is al in de jaren ‘90 geïntroduceerd. In tegenstelling tot -wat men inmiddels aanduidt met de buzzwoorden web 1.0 en web 2.0, is het geen menselijkeinterface, waarbij het gaat om de presentatie van de informatie die gericht is op mensen en waarbijtekst, grafische vormgeving en usability van belang zijn.59 Zandhuis, ‘Fundamenten in verandering: archieven op het semantisch web’, 2.60 Seamus Ross, ‘Position Paper’, DigiCULT Thematic Issue 3 – Towards a Semantic Web for Heritage Resources,(Oostenrijk: 2003), 9.61 Ross, ‘Position Paper’, 10. 35
  • 36. Het Semantisch Web is een computerinterface. In 2007 beschreef Christine Karman het SemantischWeb als volgt: Web 3.0, het semantisch web, onderscheidt zich van het huidige www doordat er structuur in is aangebracht en doordat aan alle stukjes informatie meta-informatie is gekoppeld die automatische interpretatie mogelijk maakt. Het woordt semantiek wordt gebruikt omdat als het ware de betekenis van een woord, of van een stukje informatie, is mee-opgeslagen met het woord zelf. Dat maakt het navigeren op het web eenvoudiger, niet alleen voor ons mensen maar met name voor systemen. Informatiesystemen ‘begrijpen’ immers niet wat ze lezen, maar in het semantisch web wordt een deel van dat begrip als het ware meegeleverd, waardoor een systeem de informatie een beetje kan ‘begrijpen’.62Tim Berners-Lee had met de ontwikkeling van het World Wide Web eigenlijk een Semantisch Webvoor ogen. Hij wilde een datamodel ontwikkelen dat een informatiestructuur herbergt dat over degrenzen van de individuele instellingen heen gaat. Na ongeveer twintig jaar lijkt het er dan nu tochvan te komen. Ik zeg expliciet lijkt, want er zijn nog steeds een hoop ontwikkelingen gaande en nogniet iedereen is blij met het Semantisch Web zoals het nu is.Hoe werkt het?De sleutel tot het realiseren van de visie van het Semantisch Web is semantische interoperabiliteitvan de Web-resources.63 Om deze werkelijkheid te laten worden dient er een grote omslag plaats tevinden in de manier waarop data, informatie en kennis nu zijn gerepresenteerd op het Web.BegrippenkaderOm de visie van het Semantische Web te verduidelijken zal ik hier eerst de twee belangrijkstebegrippen beschrijven die deze visie ondersteunen. Semantiek se - man` tiek («Frans«Grieks) de -woord (vrouwelijk) taalkunde leer van de betekenis en betekenisveranderingen64 Interoperabiliteit is de eigenschap van systemen en software om data uit te wisselen met externe systemen via een gemeenschappelijke set procedures.65De huidige situatie op het Web laat te veel content zien die niet tot nauwelijks beschreven is om metelkaar in verband gebracht te kunnen worden. Hierdoor wordt deze content informatie nietgevonden en hergebruikt. Wanneer deze volgens de principes van het Semantisch Web zouden zijnontsloten, zouden geautomatiseerde gegevensverwerkingsprogramma’s de informatie kunnenvinden, interpreteren en hergebruiken.6662 www.sync.nl/web-30/, (Definitie Semantisch Web van Christine Karman)(geraadpleegd: 14-06-2011)63 Geser Guntram, ‘A Cultural Heritage Semantic Web Example & Primer’, DigiCULT Thematic Issue 3 – Towardsa Semantic Web for Heritage Resources, (Oostenrijk: 2003), 3.64 http://www.encyclo.nl/begrip/semantiek (Semantiek)(geraadpleegd: 27-09-2011)65 http://www.den.nl/thema/10/interoperabiliteit (Interoperabiliteit)(geraadpleegd: 27-09-2011)66 Ross, ‘Position Paper’, 7. 36
  • 37. Dit kan worden gerealiseerd door beschrijvende metadata aan de informatie en de resources toe tevoegen. Vervolgens dient de content en de metadata op een gestructureerde en consistente manieraangeboden te worden op het Web om een intelligenter Web te ondersteunen.67Het Semantisch Web wordt wel gepresenteerdals een zeer complexe en uitgebreide visie vaneen intelligent web. Dit is terug te zien in figuur 2.In de layer-cake is te zien hoe de meer semantischelagen van het Semantisch Web bouwen op mindersemantische.Het is zo complex vanwege de stappen die nodigzijn om een Semantisch Web mogelijk te maken.Elke stap kent haar eigen standaarden.Het transformeren van contentinformatieen metadata naar semantischeinteroperabiliteit gebeurd intwee fases.We onderscheiden desyntactische fase ende semantische fase. Figuur 6: Enabling technologies - layer cake.Het syntactische deel bestaat uit het onderste deel van de layer-cake. Het gaat hier om XML-documenten die een unieke naam en plaats hebben (URI).In de laag hierboven speelt het RDF-datamodel een rol. Het bouwt voort op XML en URI’s en bestaatuit subject-predicaat-objectrelaties (triples). Op deze manier wordt de layer-cake steeds meersemantisch. Standaarden die hier gebruikt worden zijn bijvoorbeeld Dublin Core, SKOS en FOAF.Het semantische deel begint bij het gebruiken van ontologieën. Ik sta hier wat langer stil bij hetbegrip ontologie vanwege het feit dat ontologieën zijn bedoeld om de betekenis, oftewel desemantiek, vast te leggen van de concepten van de triples. De ontologieën maken het Websemantisch.OntologieEen ontologie is een triple die is bedoeld om uit te leggen hoe de computer de informatie kangebruiken.68Het is te vergelijken met het RDF-datamodel of een metadataschema.Er zijn een aantal standaardontologieën: RDFS, OWL,67 Ibidem, 7.68 Zandhuis, ‘Fundamenten in verandering: archieven op het semantisch web’, 2. 37
  • 38. OWL2De ontologieën leggen steeds preciezer vast wat met de onderdelen van de triple wordt bedoeld. Erwordt bijvoorbeeld vastgelegd wat de relaties binnen een familie betekenen: De computer moet nu weten dat in een bepaalde stamboom de moeder niet altijd dezelfde persoon is. De moeder kan meerdere namen hebben. Dit is iets dat wij mensen weten, maar dat een computer ‘vertelt’ moet worden.Hier zijn de ontologieën o.a. voor, maar het wordt steeds complexer.Naarmate we ons meer in het bovenste deel van de layer-cake bevinden wordt de complexiteitgroter. Dit deel van de layer-cake omvat de visie van het Semantische Web. Omdat decomputerinterface steeds meer als een mens moet denken worden de betekenis systemen ooksteeds complexer. 69Door de complexiteit zijn er nog geen concrete goed functionerende praktijkvoorbeelden te noemendie de volledige Semantische Web visie dragen. Wat we wel zien in de praktijk is het Linked Dataprincipe van Tim Berners-Lee. Deze technologie is gebaseerd op de lagen van de layer-cake in figuur2, tot en met de ontologieën. Over Linked (Open) Data zal ik in hoofdstuk 4 meer vertellen.Er zijn dus drie web-generaties te onderscheiden. De drie generaties lopen als het ware parallel aanelkaar. Het ‘Social Web’ houdt niet op te bestaan na 2010. Het blijft parallel lopen met hetSemantisch Web. Ditzelfde geldt voor het World Wide Web, het is er nog steeds en kan niet als‘dood’ worden beschouwd nu het ‘Social Web’ en het Semantisch Web bestaan.7069 Gesprek met Victor de Boer, 08-09-2011.70 E-mailwisseling met Victor de Boer, 30-09-2011. 38
  • 39. 4 Linked Open DataLinked (Open) Data wordt ook wel de praktijk van het Semantisch Web genoemd. Linked (Open) Datais een pragmatische manier om een praktische bijdrage te leveren aan het Semantisch Web.71Praktisch vanwege de toepasbaarheid van Linked (Open) Data.In dit hoofdstuk meer over de toepasbaarheid van Linked (Open) Data en de overeenkomsten tussendeze technologie en de beheersmaatregelen voor duurzame toegang tot informatie, zoalsbeschreven in Deel C van het strategische stappenplan van Enno Meijers.De termen waaruit Linked Open Data bestaat sluiten perfect aan op de erfgoedsector.Om te beginnen Data. Data is onze digitale informatie. Informatie die al jaren doorerfgoedinstellingen wordt verzameld en die de erfgoedsector een autoriteit van kennis in desamenleving maken.Open wijst naar de huidige tendens in de samenleving dat informatie van publieke instellingenopenbaar moet zijn: de open access beweging. Nu alleen gegoten in een ander jasje. Niet fysiek,maar digitaal. Deze openheid stimuleert het hergebruik van data. De informatie die we al jarenverzamelen.Linked wijst op waardecreatie met als gevolg meer betekenis. Dankzij het hergebruik worden ernieuwe koppelingen gemaakt en ontstaat er meer context. Wat uiteindelijk zorgt voor meerbetekenis.724.1 Wat is Linked (Open) Data?Linked (Open) Data is een nieuwe technologie die een intelligenter web ondersteunt. Tot nu toewerden bij het koppelen van informatie standaarden gebruikt voor de verpakking van de informatie.Linked (Open) Data koppelt informatie door middel van standaarden die gebruikt worden voor deinhoud van de informatie.73 In plaats van de buitenkant, de binnenkant dus.Op het Web worden documenten gekoppeld door links. Deze links hebben geen betekenis. Ze latenniet zien wat de relatie is tussen de twee documenten die gekoppeld zijn. Alleen dat er een relatie is.Je moet dus zelf uitzoeken wat de relatie tussen die twee documenten is.Bij Linked (Open) Data geldt het principe dat de relatie tussen twee documenten betekenisvol moetzijn. Die betekenis ontstaat door elk woord uit het Webdocument als concept uniek te maken en tebeschrijven in subject-predicaat-objectrelaties (triples). Een woord als bijvoorbeeld de stadAmsterdam is dan een concept dat meerdere relaties kan krijgen met andere concepten. Het subject,predicaat en object zijn dan dus ook concepten. Elk concept wint aan betekenis naarmate er meerbeschrijvingen aan gekoppeld worden. Op deze manier worden webdocumenten betekenisvol enworden zoekresultaten nauwkeuriger.74 Dat is de kracht van Linked (Open) Data.71 http://www.den.nl/thema/129/ (Linked Open Data) (geraadpleegd: 09-06-2011)72 http://www.den.nl/blog/bericht/3027 (DCL11: Autoriteit, hergebruik en betekenis van linked data)(geraadpleegd: 22-06-2011)73 http://digitaalduurzaam.blogspot.com/ (‘Linked Data’ – wat is dat nu eigenlijk precies?’)(geraadpleegd: 28-07-2011)74 http://www.den.nl/thema/129/ (Linked Open Data) (geraadpleegd: 09-06-2011) 39
  • 40. Schematisch is dat als volgt weer te geven.75 X is de schilder van Y X is getrouwd met Z X is afkomstig uit WX, Y, Z en W zijn hierin de concepten. De relaties die tussen de concepten zijn beschreven zijnbetekenisvol, want ze vertellen hoe de concepten met elkaar verband houden.Om nauwkeurig te kunnen zoeken in de enorme hoeveelheid informatie op het Web is zoeken opbasis van betekenis onontkoombaar. Er is echter een probleem. De betekenis van mensen, dingen engebeurtenissen kan variëren. Mensen kunnen bedenken welke betekenis iets heeft, dankzij decontext. Computers kunnen dit echter niet. Linked (Open) Data is een techniek om machine-leesbarecontext te genereren.764.2 Wat is de meerwaarde voor de erfgoedsector?Wat is nu de meerwaarde van Linked (Open) Data en wat levert het op voor de erfgoedsector?Zoals hierboven al genoemd werd, koppelt Linked (Open) Data niet de verpakking, maar de inhoudaan elkaar.De belangrijkste meerwaarde van Linked (Open) Datavoor de erfgoedsector is voornamelijkinteroperabiliteit. Hiermee bedoelen we het kunnenkoppelen van objecten uit verschillende collecties enhet koppelen aan data die van buiten de culturelesector afkomstig zijn door middel van eengemeenschappelijke set procedures.77 De Europeanadatabase is hier een uitstekend voorbeeld van.Een andere meerwaarde is dat de zichtbaarheid van decollecties wordt vergroot. Voor zoekmachines geldt datzij beter in staat zijn de data te indexeren wanneerdata de Linked Data ‘standaard’ draagt. Er ontstaat demogelijkheid om met één zoekopdracht relevanteresultaten te vinden uit meerdere collecties, ook al isde informatie niet overal hetzelfde geschreven. Opdeze manier komt de informatie dus min of meer naarde gebruiker toe. De gebruiker hoeft niet meer zelfopzoek te gaan.78 Figuur 7: Logo Europeana.75 http://digitaalduurzaam.blogspot.com/ (‘Linked Data’ – wat is dat nu eigenlijk precies?’)(geraadpleegd: 28-07-2011)76 Ibidem.77 http://www.den.nl/thema/129/ (Linked Open Data) (geraadpleegd: 09-06-2011)78 http://digitaalduurzaam.blogspot.com/ (‘Linked Data’ – wat is dat nu eigenlijk precies?’)(geraadpleegd: 28-07-2011) 40
  • 41. Linked (Open) Data stimuleert het hergebruik van data doordat er zoveel mogelijk verwijzingen naarandere kennisbronnen worden gelegd. Maar dit geldt ook andersom, andere kennisbronnenverwijzen ook naar jouw data. Tweerichtingsverkeer dus.79Daarnaast haakt Linked (Open) Data aan bij een maatschappelijke tendens die nu speelt, namelijk datinformatie openbaar gemaakt moet worden.80 Het afgelopen jaar hebben er diverse initiatievenplaats gevonden die gebaseerd zijn op de ‘open access’ beweging. Een voorbeelden hiervan is deApps for Amsterdam wedstrijd waarbij de data van de Gemeente Amsterdam vrijgegeven was endeze (her)gebruikt kon worden om mash-ups te creëren die op het Web of als applicatie op desmartphone kon worden geraadpleegd.814.3 Hoe verhouden Linked (Open) Data en het Semantisch Web zich tot elkaar?Het Semantisch Web en Linked (Open) Data wordt vaak voor hetzelfde aangezien. Deze verwarringheeft veel te maken met het gebruik van verschillende termen door elkaar: Semantisch Web, Web of Data, Linked DataVeel mensen spreken van Linked (Open) Data als een nieuwe poging om het Semantisch Web onderde aandacht te brengen. Ik deel echter de mening van o.a. Tom Heath82 en James Hendler83:Het Semantisch Web is een Web of Data. Linked Data creëert als het ware het Web of Data. Daarmeeis Linked Data dus een onderdeel van het Semantisch Web. Je zou kunnen zeggen dat Linked (Open)Data mede mogelijk word gemaakt door het Semantisch Web.Zoals de eerste regel van dit hoofdstuk vertelt. Kan Linked (Open) Dataals de praktijk van de Semantische Web visie worden gezien.Dit kan nog eens verduidelijkt worden door terug te gaan naarhoofdstuk 3, waarin de ontwikkeling van het Web besproken wordt.De semantische layer-cake laat de complexe visie van het Semantisch Web zien. Het meerlaagse model waarinonderin het Linked (Open) Data principe huist, met daarbovensteeds meer semantiek. Met als top, de logica dieondersteund wordt door ontologieën. Het volledigemodel is moeilijk in praktijk te brengen.79 http://www.den.nl/thema/129/ (Linked Open Data) (geraadpleegd: 09-06-2011)80 http://digitaalduurzaam.blogspot.com/ (‘Linked Data’ – wat is dat nu eigenlijk precies?’)(geraadpleegd: 28-07-2011)81 http://www.appsforamsterdam.nl/ (Apps for Amsterdam)(geraadpleegd: 29-09-2011)82 http://tomheath.com/blog/2009/03/linked-data-web-of-data-semantic-web-wtf/ (‘Linked Data? Web ofData? Semantic Web? WTF?’)(geraadpleegd: 28-07-2011)83 http://blogs.nature.com/jhendler/2009/06/16/what-is-the-semantic-web-really-all-about (‘What is theSemantic Web really all about?’)(geraadpleegd: 28-07-2011) 41
  • 42. Jaren na de term Semantisch Webgelanceerd werd, is men tot het inzicht Figuur 8: Enabling technologies – layer cake.gekomen dat we eerst maar eens onzedata moeten koppelen aan elkaar. Daarna kunnen we daar nog eens logica aan verbinden. Op diemanier is Linked (Open) Data de praktijk van het Semantisch Web.4.4 Linked Data – Open Data – Linked Open DataData kan ‘linked’ zijn, maar niet ‘open’. Net als data ook ‘open’ kan zijn, maar niet ‘linked’.Wat is ‘linked data’, ‘open’ data? En wanneer spreken we van Linked Open Data?Linked DataData moet aan de vier principes van Tim Berners-Lee voldoen:84 1. URI’s om dingen te identificeren. 2. Gebruik HTTP URI’s zodat er naar deze dingen kan worden verwezen en dat ze kunnen worden opgezocht door zowel mensen als machines. 3. Leg de informatie over het concept vast in een ‘triple’ (subject-predicaat-objectrelatie) en leg die triple vast in RDF. 4. Neem links naar andere, gerelateerde, open data concepten op in de beschrijving om hetDit Linked Data principe is de set procedures die de interoperabiliteit mogelijk maakt tussenverschillende systemen en software.Open DataOpen Data komt ook in Nederland steeds vaker voor. Het ontsluiten van data die beschikbaar is bij(semi)overheidsinstellingen en in de privaatsector, zoals het bedrijfsleven, noemt men Open Data. Dedata die hier vrijgegeven zijn, zijn vaak: milieu- en demografische data, data over incidenten,mobiliteit, educatie, connectiviteit, infrastructuur en de planning en het gebruik van (publieke)ruimte. Het ontsluiten, combineren en visualiseren van Open Data stimuleert innovatie. Het komtechter nog steeds voor dat toegang tot, of hergebruik van deze data gecontroleerd wordt doorpublieke of private partijen. Daarom zijn er een aantal principes opgesteld die kenmerkend zijn voorOpen Data.85 1. Alle data waar geen restricties i.v.m. privacy, veiligheid of anderszins op rusten wordt ter beschikking gesteld; 2. Data wordt verzameld bij de bron, dus met de grootst mogelijke detaillering; 3. Data wordt zo snel mogelijk beschikbaar gesteld om de gebruikswaarde te behouden; 4. Data wordt beschikbaar gesteld voor een zo breed mogelijke groep mensen, en voor een zo breed mogelijk aantal toepassingen; 5. Data wordt beschikbaar gesteld in een formaat dat voldoende gestructureerd is om84 automatische verwering mogelijk te maken; http://tomheath.com/papers/bizer-heath-berners-lee-ijswis-linked-data.pdf (‘Linked Data – The story sofar’)(geraadpleegd:21-07-2011)85 6. Data wordt ter beschikking gesteld aan iedereen; http://www.appsforamsterdam.nl/wat-is-open-data (Wat is Open Data?) (geraadpleegd: 13-09-2011) 42
  • 43. Linked Open DataLinked Open Data zijn rechtenvrije Linked Data. 86 De Linked Data principes worden aangevuld met deprincipes voor Open Data. Het gebruik van ‘open’ datasets bevorderd op deze manier het hergebruikvan je data.4.5 De technische aspecten van Linked (Open) DataTom Heath zegt op zijn blog Linked Data? Semantic Web? WTF? [2 maart, 2009]87: “Linked Data is no more complex than this – connecting related data across the Web using URI’s, HTTP and RDF.”Met deze uitspraak zijn de belangrijkste technische aspecten van Linked Data genoemd. Uniform Resource Identifier, Hyper Text Transfer Protocol, Resource Description Framework.Om uit te leggen hoe Linked (Open) Data technisch in elkaar zit zal ik dit uitleggen aan de hand vanhet Linked Data principe van Tim Berners-Lee, waarin deze drie standaarden centraal staan.Met de data die betekenisvol aan elkaar wordt gekoppeld, worden de digitale objecten en debijbehorende metadata zoals beschreven in hoofdstuk 2 bedoeld.Het transformeren van metadata naar semantische interoperabiliteit gebeurt in twee fases88: fase 1 - syntactische transformatie; fase 2 - semantische transformatie.4.5.1 Syntactische transformatieZoals in hoofdstuk 2 is geadviseerd dienen allereerst zowel de digitale objecten zelf als debijbehorende metadata die afkomstig zijn uit de collectiedatabase omgezet te worden naar XMLdocumenten (veel databases en museumsystemen als Adlib laten het toe om hun inhoud als XML teexporteren89). Daarna kan men doorgaan met stap 1 van het Linked Data principe van Tim Berners-Lee.XMLXML is een mark-up taal om data te beschrijven. Het is in staat de structuur van een document tebeschrijven en daarmee beschrijft het dus het digitale object (of metadata). XML beschrijft dus alleenmaar. Het geeft bijvoorbeeld aan dat een bepaald onderdeel van een tekst de naam van de makerbetreft, of de datum dat de tekst geschreven is. De notatie van XML is als volgt:86 http://digitaalduurzaam.blogspot.com/ (‘Linked Data’ – wat is dat nu eigenlijk precies?’)(geraadpleegd: 28-07-2011)87 http://tomheath.com/blog/2009/03/linked-data-web-of-data-semantic-web-wtf/ (‘Linked Data? Web ofData? Semantic Web? WTF?’)(geraadpleegd: 28-07-2011)88 Guntram, ‘A Cultural Heritage Semantic Web Example & Primer’, 27-32.89 http://www.den.nl/art/uploads/files/Tutorial%20Linked%20Data%20Part%203b.pdf (Linked Data: stap voorstap, deel 3B)(geraadpleegd: 15-08-2011) 43
  • 44. <creator>Kazimir Malevich</creator>De XML-documenten zijn de concepten zoals al eerder beschreven.De reden dat we XML gebruiken is omdat het een universele standaard is. Het is een open standaarddie door elke software en elk systeem kan worden gebruikt. Daarnaast is het ook niet applicatieafhankelijk. Het kan dus ook gebruikt worden voor data uitwisseling en data harvesting of om eenwebsite te maken.90 Een XML document bestaat ook weer uit een bepaalde structuur, eenzogenaamde XML Schema.Elk concept krijgt een unieke naam: een Uniform Resource Identifier (URI). Naast de unieke naamkrijgt het concept ook nog een uniek adres. Dit bestaat uit informatie over de herkomst van de data(uit welke dataset is het concept afkomstig.)Uniform Resource IdentifierEen URI bestaat uit twee onderdelen; geeft een unieke plaats en naam aan een concept: URL; URN.De URL (Uniform Resource Locator) identificeert digitale objecten aan de hand van de plaatsing vanhet bestand op een netwerkserver. De locatie blijft op deze manier uniek, maar is tijdelijkopgeslagen.91De URN (Uniform Resource Name) verwijst niet naar de fysieke plaats van een bestand op de server,maar verwijst naar een tabel (‘name space’) waarin de instelling op een generieke wijze bijhoudtwelke bestanden zij beheert. Op deze manier krijgen we meer duidelijkheid over de afkomst van deinformatie. Uit welke dataset is deze afkomstig? Voor URN is het een vereiste dat elke naamruimte-aanduiding wereldwijd uniek is, waarmee ook iedere URN uniek is.Het gebruiken van URI’s om entiteiten(dingen) te identificeren zoals hierboven is uiteengezet is stap1 van het Linked Data principe van Tim Berners-Lee.Stap 2 is de URI’s vindbaar te maken door mensen en machines. Dit doen we door de URI’s in eenHTTP schema op te nemen.Hyper Text Transfer ProtocolHTTP is een belangrijk protocol voor de communicatie tussen de web cliënt en de webbrowser. Hethaalt de informatie als het ware op. Het is een protocol dat bestaat uit verschillende HTTP-requestsdie een web cliënt aan een server stelt. De server geeft vervolgens antwoordt terug aan de Webcliënt.924.5.2 Semantische transformatieEr is nog een proces nodig om de elementen van het XML document te interpreteren. Hier begint90 Guntram, ‘A Cultural Heritage Semantic Web Example & Primer’, 30.91 http://www.den.nl/standaard/266/ (Uniform Resource Identifier (URI))(geraadpleegd: 29-08-2011)92 http://nl.wikipedia.org/wiki/HTTP (Hypertext Transfer Protocol) (geraadpleegd: 28-08-2011) 44
  • 45. stap 3 van het Linked Data principe en gaat de syntactische transformatie over naar een semantischetransformatie.Leg de informatie over het concept vast in een ‘triple’ (subject-predicaat-objectrelatie) en leg dietriple vast in RDF.TripleDe XML-documenten bevatten nu gestructureerde data die door computers wordt begrepen. Dezegestructureerde data bestaat uit zogenaamde ‘triples’.Een triple bestaat uit drie concepten93: Subject – Waar het over gaat. Predicaat – Een eigenschap van het subject (de aard van de relatie). Object – De waarde van die eigenschap.Digitale informatie kan met behulp van triples worden gecodeerd en op deze manier kan je eengerichte vraag stellen op het Web. Triple:Resource Description Framework SUBJECT EIGENSCHAP WAARDEDe triples worden gecodeerd volgens het RDF- X is de schilder van Ydatamodel. RDF wordt ook wel de ruggengraat vanhet Semantisch Web genoemd. Het is een | | |standaardmodel voor het coderen van metadata [http://URI] [http://URI] [http://URI] herkomst: herkomst:op het Web.94 persoonsnamen- WikipediaRDF maakt het mogelijk om twee bronnen aan thesauruselkaar te linken terwijl deze afkomstig zijn uit twee Figuur 9: Schematische weergave van een triple.verschillende datasets. Daarin kan het subject vande RDF triple van de ene data set zijn, en het object van dezelfde RDF triple afkomstig uit een anderedata set.95 Het RDF-model stimuleert dus het hergebruik van data.Er zijn verschillende serialisaties voor de triples in het RDF-datamodel. De drie bekendste zijn: RDF/XML, Turtle, Ntriples.Deze zogenaamde standaardtaal beschrijft hoe een computerbestand eruitziet, waarin triples zijnvastgelegd. 9693 http://www.den.nl/art/uploads/files/Tutorial%20Linked%20Data%20Part%203.pdf (Linked Data: stap voorstap, deel 3) (geraadpleegd: 15-08-2011)94 Guntram, ‘A Cultural Heritage Semantic Web Example & Primer’, 32.95 http://tomheath.com/papers/bizer-heath-berners-lee-ijswis-linked-data.pdf (‘Linked Data – The story sofar’)(geraadpleegd:21-07-2011)96 Zandhuis, ‘Fundamenten in verandering: archieven op het semantisch web’, 8. 45
  • 46. Mijn voorkeur gaat uit naar RDF/XML.Dit is de oudste manier om RDF-triples te schrijven. Daarom werd het in eerste instantie ook gezienals DE standaard.Een andere reden waarom ik RDF/XML boven Turtle of Ntriples kies is dat XML ook buiten hetSemantisch Web een standaard is. Dit blijkt uit twee opmerkingen die al eerder genoemd zijn in ditscriptieonderzoek. Ten eerste hebben we de digitale informatie uit de collectiedatabase al overgezetnaar XML-documenten. Ten tweede, deze grijpt terug op de problematiek van duurzame toegang totdigitale informatie, is het eenvoudiger om de duurzame relaties tussen het digitale object en demetadata te beheren wanneer de metadata in een XML-document worden overgezet.Een derde reden is dat XML een universele standaard is. Als een open standaard wordt XML doorelke software en elk systeem gebruikt en blijft daardoor langer bruikbaar.Er zijn ook een paar kleine nadelen te noemen voor het gebruik van RDF/XML. In tegenstelling totTurtle en Ntriples leest deze standaard niet zo makkelijk. Een ander nadeel is dat RDF/XMLbestanden vaak nogal groot worden.97Stap 4 van het Linked Data principe van Tim Berners-Lee gaat over het koppelen naar andere,gerelateerde (open) data concepten.Je kunt verwijzen naar allerleientiteiten doordat iederconcept in relatie gebracht kanworden met een anderconcept. Een concept kan inverschillende contexten eenandere betekenis hebben. Deverbindingsmogelijkheden vanconcepten zijn eindeloos. Erwordt als het ware een webvan triples gemaakt. Figuur 5 iseen voorbeeld dat bestaat uitallemaal triples van eenentiteit, in dit geval een persoon, die allerlei relaties en Figuur 10: Web van RDF-triples.eigenschappen beschrijven van deze entiteit, maar inverschillende contexten.Om alle entiteiten te beschrijven, zijn er verschillende vocabularies in omgang. Veel verschillendeculturele erfgoedinstellingen hebben immers een andere manier van benoemen van hun entiteiten.In vocabularies zijn standaardpredicaten opgenomen. Je hoeft dus niet meer je eigen predicaat temaken, als er voor deze entiteit al een predicaat is. De bekendste vocabularies zijn98: FOAF, vooral predicaten die betrekking hebben op personen.97 http://www.den.nl/art/uploads/files/Tutorial%20Linked%20Data%20Part%203.pdf (Linked Data: stap voorstap, deel 3) (geraadpleegd: 15-08-2011)98 http://tomheath.com/papers/bizer-heath-berners-lee-ijswis-linked-data.pdf (‘Linked Data – The story sofar’)(geraadpleegd:21-07-2011) 46
  • 47. SKOS, (Simple Knowledge Organization System). SKOS wordt gebruikt voor het vastleggen van thesauri en andere woordsystemen als bijvoorbeeld de AAT. Dublin Core, is een van de belangrijkste standaardpredicaten. Het is wereldwijd bekend, en wordt door bijna elk systeem begrepen. Het bevat standaardpredicaten van beschrijvende metadata. OAI-ORE, bevat objecten voor hergebruik en wisselen van tekst, afbeeldingen, data en video.Nu we het Linked Data principe besproken hebben kunnen we eigenlijk wel zeggen dat het RDF-datamodel de gemeenschappelijke set procedures is die er voor zorgt dat er interoperabiliteitontstaat tussen de verschillende collecties van culturele erfgoedinstellingen.4.6 Linked (Open) Data - wat nu?Met de groei van het Linked (Open) Data netwerk op het Web ontstaan steeds meer Linked (Open)Data initiatieven. Deze zijn in drie categorieën te delen: De Linked (Open) Data browsers. De Linked (Open) Data zoekmachines. De Linked (Open) Data applicaties.Figuur 11: Growth of LOD Cloud.Linked (Open) Data browserDe Linked (Open) Data browser stelt gebruikers in staat om met behulp van links, weergeven in RDF-triples, tussen verschillende databronnen te navigeren op het Web. Dankzij de Linked Data principesvan Tim Berners-Lee kan men veel eenvoudiger informatie in verband brengen met de informatie uitandere contexten.99 Het Web of Data doet als het ware een suggestie een volgende databron tebestuderen.Linked (Open) Data zoekmachinesHet Linked Data principe maakt het mogelijkheid om met één zoekopdracht relevante resultaten tevinden uit meerdere collecties. Door de data en namen van velden onafhankelijk van hetcollectiebeheersysteem bij de archiefdienst vast te leggen en relaties te leggen met data en99 Ibidem. 47
  • 48. veldnamen op andere plaatsen op het Web is een heel nauwkeurig en volledig antwoordt op de‘query’ te krijgen. Het doet er dan ook niet toe welke standaardpredicaten zijn gebruikt in de RDF-triples. De betekenis van de subject-predicaat-objectrelaties zorgt voor de filtering van relevanteresultaten. Het levert een preciezer zoekresultaat op.Deze Linked (Open) Data zoekmachine haalt alle soorten triples (subject-predicaat-objectrelaties) opdie hij tegenkomt als antwoordt op zijn zoekvraag, mits ze aan de selectiecriteria van de zoekvraagvoldoen. Een ander woord voor zoekvraag is ‘query’. De standaard, de zogenaamde ‘querytaal’, vandeze zoekmachine, om een antwoordt te vinden dat aan de selectiecriteria voldoet, is SPARQL.100Linked (Open) Data applicatiesLinked (Open) Datasets lenen zich uitstekend voor het maken van ‘mash-ups’ Er dienen nieuwekoppelingen gelegd te worden tussen bestaande informatie. Deze bestaande data kan heel variërendzijn, zoals bijvoorbeeld foto’s van Flickr, video’s van YouTube, kaarten van Google, boeken ofmuziekbestanden. Deze mix van bestaande informatie werkt vervolgens als een nieuwe onlineservice.101In hoofdstuk 5: Linked Open Data in de praktijk, zal ik verder ingaan op browsers, zoekmachines enapplicaties die gebaseerd zijn op Linked (Open) Data.100 Zandhuis, ‘Fundamenten in verandering: archieven op het semantisch web’, 8.101 J. Grooten, M. De Niet, E.L. Rademaker ed., ABC-DE Woordenboek voor het Digitaal Erfgoed, (Rotterdam:Veenman Drukkers 2008), 133. 48
  • 49. 5 Linked Open Data in de praktijkDe groei van het Linked (Open) Data netwerk heeft invloed op de hoeveelheid en soort initiatievendie worden opgezet binnen de culturele erfgoedsector. Hoe staat het inmiddels met Linked (Open)Data in de praktijk? Welke culturele instellingen wagen de sprong en maken hun digitale informatiebeschikbaar met behulp van Linked (Open) Data? Welke categorieën die in hoofdstuk 4 zijnonderscheiden zien we terug? De volgende voorbeelden laten een beeld van de praktijk zien.5.1 Aandacht voor Linked (Open) DataSinds een aantal jaar heeft Linked (Open) Data zijn entree gemaakt in de culturele erfgoedsector. Eris steeds meer aandacht voor de manier waarop je Linked (Open) Data kunt maken en wat demeerwaarde van Linked (Open) Data voor de culturele erfgoedsector is. Digitaal Erfgoed Nederland ishet kenniscentrum voor digitaal erfgoed en maakt deze rol ook waar.Digitaal Erfgoed Nederland heeft hun online kennisdossier aangevuld met een pagina gewijd aanzowel Linked Open Data als het Semantisch Web. In het kennisdossier over Linked Open Data is een‘recept’ van Jacco van Ossenbruggen. Dit ‘recept’ is speciaal voor de culturele erfgoedinstellingen diewel eens gehoord hebben van Linked (Open) Data maar niet weten wat ze er precies mee moeten.Het is een praktische handleiding voor het creëren van Linked (Open) Data. Jacco van Ossenbruggenstaat stil bij het wat en waarom van Linked (Open) Data en geeft tips hoe Linked (Open) Data toe tepassen.102Voor degenen die daadwerkelijk een deel van hun collectie willen omzetten naar een Linked Opendataset hebben Paul Hermans en Henk Vanstappen een instructie gemaakt waarmee men aan deslag kan gaan.103 Er wordt stap voor stap besproken welke handelingen moeten worden uitgevoerdom een Linked Open dataset te maken van de collectie-informatie.In juni publiceert Digitaal Erfgoed Nederland binnen het DEN Lab online tutorials over Linked OpenData. Een keer in de twee weken wordt er een nieuwe tutorial gepubliceerd.Dit initiatief is voortbordurend op het Dutch Culture Linked Open Data Event dat in mei werd medegeorganiseerd in Haarlem.Naast Digitaal Erfgoed Nederland zijn er nog een hoop enthousiaste personen die over Linked (Open)Data schrijven en bloggen. Voorbeelden hiervan zijn: http://digitaalduurzaam.blogspot.com/ door Inge Angevaare, coördinator Nationale Coalitie Digitale Duurzaamheid. http://www.linkedin.com/groups/Open-Data-Nederland-3112848?trk=myg_ugrp_ovr Open Data Nederland, groep binnen LinkedIn.5. 2 Aan de slagAlle aandacht die aan Linked (Open) Data wordt besteed is heel goed, maar zijn er nu ookdaadwerkelijk Linked (Open) Data initiatieven?102 http://www.den.nl/bericht/2278 (Linked Data voor de erfgoedsector – een recept van Jacco vanOssenbruggen)(geraadpleegd: 23-06-2011)103 http://www.den.nl/art/uploads/files/LDpubliceren.pdf (Linked Data publiceren)(geraadpleegd: 20-09-2011) 49
  • 50. 5.2.1 ‘The Linking Open Data Project’Het meest bekende voorbeeld van Linked (Open) Data is ‘The Linking Open Data Project’.In januari 2007 heeft een groep gelijkgestemden dit project gestart. Het doel was het Web of Dataeen impuls te geven door data sets onder een open licentie vrij te geven en deze te converteren naarRDF volgens de Linked Data principes en deze vervolgens te publiceren op het web.Het project is in de jaren snel gegroeid, iedereen kan namelijk participeren door data te publicerenvolgens de Linked Data principes en te linken naar al bestaande Linked Data sets. Hieronder is eenLinking Open Data cloud diagram te zien dat een overzicht geeft van alle gepubliceerde data sets enhun relaties met andere data sets.104‘The Linking Open Data Project’ is de algemene initiatief waarbij iedereen, welke sector dan ook zichkan aansluiten. Het gaat hier tenslotte om het creëren van een web. Het is dus ook niet bij uitstekeen initiatief vanuit de culturele erfgoedsector. De meest recente versie van het Linked Open DataCloud laat echter wel een culturele erfgoedinstelling uit Nederland zien, namelijk: het AmsterdamMuseum.105Het Amsterdam Museum heeft als eerste museum inNederland haar collectie beschikbaar gemaakt als LinkedOpen Data.106 Om meer te weten te komen over hunervaringen en daarvan te leren had ik met Judith van Gent,teamleider Documentatie & Fotografie in het AmsterdamMuseum, een gesprek. Zij was als databeheerder actief Figuur 12: Logo Amsterdam Museum.betrokken bij dit project.5.2.2 Amsterdam Museum als Linked Open DataDe collectie van het Amsterdam Museum bevat 70.000 objecten. Sinds 2010 is de hele collectiedigitaal toegankelijk via ‘De Collectie Online’.107In het informatiebeleidsplan van het Amsterdam Museum staat dat zij de data beschikbaar stellen enkennis delen met mogelijke partners.108 Data beschikbaar stellen betekent ook dat de digitaleinformatie hergebruikt mag worden. Data en afbeeldingen worden aangeboden voor (her)gebruikmet een Creative Commons Attribution-Share licentie.De digitale collectie beschikbaar maken als een Linked Open dataset lag dan ook voor de hand. Hetpionieren met het ontsluiten van de digitale collectie zit in de genen van het museum.109 Dit was deVrije Universiteit van Amsterdam ook opgevallen. Zij hebben het Amsterdam Museum benaderd enhen gevraagd deel te nemen aan een experimenteel project dat Open Data en semantisch zoeken104 http://www.w3.org/wiki/SweoIG/TaskForces/CommunityProjects/LinkingOpenData (‘The Linking Open DataProject’) (geraadpleegd: 23-06-2011)105 Zie bijlagen: B.106 http://semanticweb.cs.vu.nl/lod/am/ (Amsterdam Museum in Europeana Data Model RDF)(geraadpleegd:23-06-2011)107 http://collectie.ahm.nl/ (AM Collectie Online)(geraadpleegd: 23-06-2011)108 http://digitalecollectie.nl/casestudies/amsterdam-museum-gesprek-met-judith-van-gent/ (Casestudy)(geraadpleegd: 19-09-2011)109 http://digitalecollectie.nl/casestudies/amsterdam-museum-gesprek-met-judith-van-gent/ (Casestudy)(geraadpleegd: 19-09-2011) 50
  • 51. onderzocht. Zij gebruiken de data die afkomstig is uit de collectiedatabase van Adlib, om teexperimenteren met open data en semantisch zoeken.De VU benaderde juist het Amsterdam Museum vanwege de grote hoeveelheid contextinformatiedie de collectiedatabase beheert. De collectiedatabase bevat niet alleen de digitale objecten, maarook zaalteksten, tentoonstellingsteksten en catalogusteksten. Al deze digitale informatie scheptcontext en dat is juist waar semantisch zoeken om draait.Wat levert het op?Ik vroeg Judith van Gent, wat deze Linked Open dataset het Amsterdam Museum nu heeftopgeleverd?Het is nu anderhalf jaar geleden dat er een Linked Open dataset van de collectiedatabase is gemaakt.Direct levert deze Linked Open dataset niet veel op. De Linked Open Data zijn bedoeld voor hetonderzoek naar Open Data en semantisch zoeken van de VU.In maart heeft de VU de Linked Open dataset van het Amsterdam Museum geconverteerd naar hetEuropeana Data Model. De data van het Amsterdam Museum zijn dan klaar voor de Europeanaportal. De data worden nu beheerd door ‘De Digitale Collectie Nederland’ en wachten daar tot zegeharvest kunnen worden door Europeana. Dan pas levert het Amsterdam Museum ook iets op.Tot die tijd is de Linked Open dataset van het museum voornamelijk een bevestiging van hetinnovatieve karakter van het Amsterdam Museum. Meewerken aan een onderzoek als dit van deVrije Universiteit, ten behoeve van kennis delen ligt bovendien ook in het straatje van hetAmsterdam Museum.Vanwege het onderzoek van de Vrije Universiteit zijn de problemen waar tegenaan gelopen werdvoornamelijk van technische aard. Het Amsterdam Museum had hier weinig mee te maken.NadelenWanneer ik Judith van Gent vraag naar de nadelen van de Linked Open dataset van het AmsterdamMuseum kom ik bij haar stokpaardje. Ze vindt het een groot nadeel dat de Linked Open dataset nietactueel is. Deze is anderhalf jaar oud. Maar de collectiedatabase die door Adlib gehost wordt, wordtelke twee weken geupdate. Er worden dan wijzigingen en aanpassingen doorgevoerd, trefwoordentoegevoegd of zelfs een nieuw object in de collectiedatabase toegevoegd. Dit is nu allemaal niet tezien in de Linked Open dataset. Deze is niet up-to-date.Dit is ook de reden dat tijdens de ‘Apps for Amsterdam’ wedstrijd gebruik gemaakt werd van deApplication Programming Interface (API) van de collectiedatabase in Adlib en niet van de LinkedOpen dataset. Deze API wordt net als de collectiedatabase in Adlib iedere twee weken geüpdate.Dat is volgens Judith van Gent een groot nadeel. De Linked Open dataset van het AmsterdamMuseum is niet live. Het harvesten van de data uit de collectiedatabase zou periodiek moetengebeuren, net zoals er iedere week een up-date van de collectiedatabase wordt gemaakt in Adlib.Er wordt nog maar even de nadruk gelegd op het experimentele karakter van de tot stand komingvan de Linked Open dataset van het Amsterdam Museum. De Linked Open dataset bevat dus hier endaar onvolledigheden. Dankzij het experimentele karakter is dit echter niet erg. Het is puur bedoeldvoor museaal onderzoek. 51
  • 52. EuropeanaVanwege het onderzoek van de VU naar semantisch zoeken en de relatie van de VU met Europeanais er in maart 2011 voor gekozen de Linked Open dataset van het Amsterdam Museum om te zettennaar het Europeana Data Model. Dit is een RDF-datamodel speciaal voor Europeana.Je zou kunnen zeggen dat het voor een stadsmuseum niet relevant is bij Europeana te willenaansluiten, maar de collectie van het Amsterdam Museum bevat veel deelcollecties die vaninternationaal belang zijn.110 Bovendien profiteer je door je aan te sluiten bij Europeana ook van detechnologische en inhoudelijke tools die Europeana ontwikkeld voor de digitale ontsluiting vancollecties.Wanneer in de loop van de tijd meer projecten worden geharvest door Europeana zal pas echtduidelijk worden wat Europeana zal betekenen voor culturele erfgoedinstellingen en hun digitaleinformatie.Judith van Gent verwacht door opgenomen te zijn in de Europeana, dat de collectie van hetAmsterdam Museum meer internationale bekendheid krijgt. Dit is nu al te merken aan de Luijkencollectie, er worden veel meer fotoverzoeken van deze schilder aangevraagd dan voor de toetredingtot de Europeana database. Daarnaast hoopt ze ook dat de zichtbaarheid van de gehele collectievergroot wordt.Apps for AmsterdamTijdens de ‘Apps for Amsterdam’ wedstrijd is dus geen gebruik gemaakt van de Linked Open dataset,maar van de API van de collectiedatabase in Adlib. De applicaties die ontwikkeld zijn gebruiken derecente data van het API van Adlib. Een API van Adlib is echter dubbelop als je een Linked Opendataset hebt. Maar een API beheert wel de actuele data, in tegenstelling tot de Linked Open dataset.Judith van Gent ziet dan ook graag dat de Linked Open Data technologie nog iets vind op hetstreamen van de live data. Maar deze ontwikkeling ligt nog in de toekomst.Er is dus ook geen applicatie gemaakt die bestaat uit data van de Linked Open dataset. Maar wel eenhele mooie die gebruikt maakt van de API van de collectiedatabase in Adlib. Zie de website van ‘Appsfor Amsterdam’ voor de ‘Amsterdam Time Machine’.Tot slotDe gebruiker is vanwege het experimentele karakter van het initiatief ook helemaal niet op dehoogte van het bestaan van de Linked Open dataset van het Amsterdam Museum. Waarom is hetdan belangrijk om de collectie te ontsluiten als Linked Open dataset? Wat is het belang van LinkedOpen Data voor de toekomst?Volgens Judith van Gent is het linken van de inhoud erg belangrijk. Door de inhoud van verschillendedata aan elkaar te koppelen geldt voor zoekmachines dat zij beter in staat zijn de data te indexerenwanneer data de Linked Data ‘standaard’ draagt. Op deze manier krijg je een completer en meernauwkeurig zoekresultaat.Het Amsterdam Museum is dus het eerste museum dat haar collectie beschikbaar stelt als LinkedOpen dataset. Als laatste vroeg ik Judith van Gent of zij nog tips hebben voor andere culturele110 http://digitalecollectie.nl/casestudies/amsterdam-museum-gesprek-met-judith-van-gent/ (Casestudy)(geraadpleegd: 19-09-2011) 52
  • 53. erfgoedinstellingen die overwegen dit ook te doen? Een echte tip heeft ze niet. Het AmsterdamMuseum moet eerst dit project evalueren, voordat het goed kan beoordelen wat dit initiatief nuprecies voor hen heeft betekent en opgeleverd. Helaas ligt iets dergelijks nog niet in het verschiet,vanwege het onderzoek van de VU dat nog steeds bezig is.Ze heeft echter wel nog een opmerking. Ze meent dat het Europeana Data Model te ingewikkeld isen pleit voor een lightversie van dit datamodel, zodat het toegankelijker in gebruik wordt en dit voormusea de drempel doet verlagen hun data beschikbaar te stellen als Linked Open Data.Naast deze casestudy van het Amsterdam Museum heb ik een aantal gesprekken gehad metpersonen die werkzaam zijn in de culturele erfgoedsector en zich bezig houden met de problematiekrond duurzame toegang tot digitale informatie en Linked (Open) Data. In de gesprekken die ik hadmet verschillende personen uit de culturele erfgoedsector noemde zij ook een aantal projecten eninitiatieven die met Linked (Open) Data of het Semantisch Web te maken hadden.5.2.3 MultimediaN N9C Eculture ProjectHet MultimediaN N9C Eculture Project is een voorbeeld van een semantische zoekmachine. Ditproject heeft een zoekmachine ontwikkeld die gebaseerd is op de Semantische Web technologie. Hetdemonstreert hoe de technologie van het Semantisch Web de zoekfunctie, het navigeren door decollectie en annoteren van informatie interactief kan maken met de collectiedata.111Aan dit project werkten meerdere culturele erfgoedinstellingen mee, o.a. het RijksmuseumAmsterdam, Digitaal Erfgoed Nederland, Rijksmuseum voor Volkenkunde Leiden, Instituut CollectieNederland en het Getty Research Institute. Figuur 13: MultimediaN N9C Eculture Project.111 http://e-culture.multimedian.nl/demo/www/faq.html#howitworks (MultimediaN N9C EcultureProject)(geraadpleegd: 22-07-2011) 53
  • 54. 5.2.4 EuropeanaSinds de start van Europeana in 2008, geeft het mensen toegang tot miljoenen gedigitaliseerdeobjecten uit Europa’s musea, bibliotheken, archieven en audiovisuele collecties. Europeana brengt jeniet in direct contact met de gedigitaliseerde objecten. Het is een database met de metadata van degedigitaliseerde objecten. Er wordt gelinked naar de website van de instelling waar het betreffendeobject is gedigitaliseerd. Europeana geeft alleen de beschrijving van het object en waar het objectzich bevindt.112Doordat Europeana de metadata van de digitale informatie beheerd, zijn zij een voorbeeld van deLinked (Open) Data praktijk. Helaas is de zoekfunctie van de Europeana database nog nietsemantisch.Meer dan 1500 culturele erfgoedinstellingen door heel Europa doen mee. De metadata wordtgeharvest bij de aggregatoren die de Linked (Open) datasets van culturele erfgoedinstellingen uit eenbepaald land verzamelen. In Nederland is ‘De Digitale Collectie’ een aggregator. Het AmsterdamMuseum heeft haar Linked Open dataset ook in beheer van ‘De Digitale Collectie’ gegeven inafwachting tot het geharvest wordt door Europeana.5.2.5 Apps for AmsterdamApps for Amsterdam is een initiatief om zoveel mogelijk data van de Gemeente Amsterdamtoegankelijk te maken voor iedereen. Ze hebben dit gedaan door Linked Open Data applicaties teontwikkelen met behulp van de Open Data van de instellingen die mee werkte.‘PLAY! Amsterdam’ is helaas niet met behulp van Linked (Open) Data van een cultureleerfgoedinstelling tot stand gekomen, maar is wel een erg mooi voorbeeld van een Linked Open Dataapplicatie.Figuur 14: Android App Play! Amsterdam.112 ttp://group.europeana.eu/web/guest/provide_content;jsessionid=8F0F9C690C75E95C7CE3C22102FD4CFE(Europeana)(geraadpleegd: 28-07-2011) 54
  • 55. 6 Conclusie en aanbevelingenHet streven naar duurzame toegang tot digitale erfgoedinformatie is dus een grote uitdaging voor deculturele erfgoedinstellingen. Digitale informatie kent drie soorten bedreigingen die de risico’s op hetverlies van digitale informatie vergroten: Technologie, Metadata, Organisatie.Het strategisch stappenmodel van Enno Meijers is een model dat stapsgewijs de risico’s op verliesvan digitale informatie verkleind. Hij onderscheidt daarin drie delen om tot duurzame borging vandigitale informatie te komen. A: Het bepalen van de ambitie van de organisatie. B: De digitale objecten veilig stellen. C: Het duurzaam toegang bieden.Het derde deel van dit stappenmodel, het duurzaam toegang bieden, gaat in op drie factoren: Beschrijven van de doelen van duurzame toegang, Metadata beheer, De veranderende omgeving.HypotheseIk onderzocht de maatregelen die de veranderende omgeving vroeg en stelde hierbij dat Linked(Open) Data een verandering in de omgeving is te noemen. Linked (Open) Data kan als eentechnologische verandering van de omgeving worden gezien.Aan de hand van het Semantisch Web werd duidelijk dat Linked (Open) Data als de eenvoudigtoepasbare praktijk van dit Semantisch Web wordt gezien. Linked (Open) Data is naar mijn meningdaarom een manier om de maatregelen voor duurzame toegankelijkheid tot digitale informatietegemoet te komen. In het bijzonder veranderingen in de omgeving.Analyse stappenmodel Enno Meijers en Linked Data principe Tim Berners-LeeDe literatuur vermeld dat om duurzame toegang tot digitale informatie te bereiken, gebruikerseenvoudiger over de informatie moeten kunnen beschikken op de lange termijn en dat dezeinformatie betrouwbaar dient te zijn. Om aan deze vraag te voldoen wordt de aandacht gevestigd ophet beheer van metadata en de veranderende omgeving.Er zijn vijf verschillende soorten metadata beheer te benoemen: Referentie metadata, Context metadata 55
  • 56. Onveranderbaarheid (‘fixity’) Herkomst (‘provenance’) Toegang (‘access’)Een aantal van deze metadata vertonen overeenkomsten met sommige stappen van het Linked Dataprincipe van Tim Berners-Lee.Referentie metadataVanuit het stappenmodel van Enno Meijers wordt de noodzaak van een duurzame relatie tussen hetdigitale object en de bijbehorende metadata benadrukt. Een oplossing die wordt aangedragen is debijbehorende metadata van het digitale object in een XML-document op te slaan. Dit is eenvoudigwant de digitale objecten worden al in XML-documenten opgeslagen dus de kennis om dit te doen isal aanwezig in een culturele erfgoedinstelling.De overeenkomst met het Linked Data principe van Tim Berners-Lee is die van het gekozen formaat,het XML-document. Voordat er een triple (subject-predicaat-objectrelatie) gemaakt kan wordendienen zowel de digitale objecten als de bijbehorende metadata te worden beschreven in een XML-document. Deze XML-documenten vormen later de concepten van een triple (subject-predicaat-objectrelatie).‘Fixity’ en ‘provenance’De manier waarop de authenticiteit van de digitale objecten en de bijbehorende metadata wordtgewaarborgd vertoond een overeenkomst met stap 1 van het Linked Data principe van Tim Berners-Lee.Zoals aangegeven in het stappenmodel van Enno Meijers worden de metadata ten behoeve van deauthenticiteit gewaarborgd door een digitale ‘handtekening’ aan te brengen die deonveranderbaarheid vast legt. Daarnaast wordt een wijzigingshistorie toegevoegd die de afkomstvastlegt.In stap 1 van het Linked Data principe gebeurt iets vergelijkbaars. Elk concept dat deel uitmaakt vaneen triple krijgt een URI toegewezen. Een URI geeft de triple een unieke naam en plaats. De uniekenaam wijst op de authenticiteit van het digitale object of de bijbehorende metadata. De uniekeplaats verwijst naar de afkomst van het digitale object of de bijbehorende metadata.Dat zijn dus twee overeenkomsten tussen beheersmaatregelen voor metadata beheer in hetstappenmodel van Enno Meijers en het Linked Data principe van Tim Berners-Lee.De veranderingen in de omgeving zouden volgens mijn hypothese ook overeenkomsten moetenvertonen met het Linked Data principe van Tim Berners-Lee.Het leesbaar houden van de informatieHet belangrijkste doel van duurzame toegankelijkheid is het leesbaar houden van de informatie. Hetleesbaar kunnen houden van de digitale informatie is gekoppeld aan het bekend zijn met dedefinities van de gebruikte formaten.In het stappenmodel van Enno Meijers wordt als oplossing voor dit probleem het gebruik vanformaten die gebaseerd zijn op open standaarden, aangedragen.Ook hier kan men verwijzen naar Linked (Open) Data. Net als bij de referentie metadata kan XML alsoplossing worden toegepast. XML is immers een open standaard die door elke software en elk 56
  • 57. systeem kan worden gebruikt. Ideaal dus om te gebruiken wanneer je bang bent de digitaleinformatie niet meer te kunnen lezen vanwege het feit dat er geen kennis meer binnen deorganisatie beschikbaar is over het bestandsformaat dat gebruikt is om dit digitale object op te slaan.Niet alleen technologische veranderingen zijn belangrijk om in de gaten te houden om de kans opverlies van digitale informatie te verkleinen. Ook de doelgroep moet in de gaten worden gehouden.De behoefte van de gebruikerDe gebruikers van dit moment verwachten dat informatie naar hen toekomt. Ze vinden huninformatie op de plaatsen waar zij zich het meest bevinden, online op ‘social media’ pagina’s ofwanneer zij gebruik maken van hun smartphone. Het stappenmodel van Enno Meijers raad daaromvanuit het perspectief van de gebruiker aan om open standaarden te gebruiken voor het duurzaamtoegankelijk houden van digitale informatie.Een ontwikkeling die gebaseerd is op het Linked Data principe van Tim Berners Lee, is de Linked(Open) Data applicatie. Het steeds grotere Linked (Open) Data netwerk dat ontstaat door steedsmeer Linked (Open) datasets, maakt het eenvoudig om een ‘mash-up’ te maken. Een ‘mash-up’speelt juist in op de behoefte van deze gebruiker door verschillende bestaande data te combinerentot een nieuwe online service. De online service komt wel naar de gebruiker toe via de ‘social media’of de smartphone.Aan de hand van deze analyse van de twee thema’s blijkt dat er genoeg overeenkomsten bestaantussen beheersmaatregelen voor duurzame toegankelijkheid tot digitale informatie en het LinkedData principe van Tim Berners-Lee om deze twee thema’s aan elkaar te koppelen. Dit ondersteuntmijn hypothese dus.We kunnen uit deze analyse opmaken dat Linked (Open) Data een technologische verandering van deomgeving is die beter metadata beheer stimuleert. Het raakt daarmee dus niet aan één maar aantwee aspecten van het bieden van duurzame toegang tot digitale informatie.De hoofdvraag:Is Linked (Open) Data, als toepassing van het semantisch web, een mogelijkheid om digitaleerfgoedinformatie duurzaam toegankelijk te maken?is door dit onderzoek dus positief beantwoordt.Met dit onderzoek had ik niet alleen voor ogen te onderzoeken of Linked (Open) Data de duurzametoegang tot digitale erfgoedinformatie bevorderd? Ik wilde ook een duidelijk beeld schetsen vanLinked (Open) Data. Wat is het? Wat levert het ons op? Wie maakt er al gebruik van Linked (Open)Data? Hoofdstuk 4 gaf veel technische informatie die ook gebruikt is in de analyse omovereenkomsten tussen beheersmaatregelen genoemd in het stappenmodel van Enno Meijers enhet Linked Data principe van Tim Berners-Lee te vinden.Hoofdstuk 5 gaf door de praktijkvoorbeelden meer een beeld hoe Linked (Open) Data nu preciesdoor de culturele erfgoedsector gebruikt kan worden.AanbevelingenWat is er nu precies nodig om deze conclusie te ondersteunen? 57
  • 58. Uit de analyse is gebleken dat XML gebruikt kan worden als open standaard.Om vervolgens een Linked (Open) dataset te kunnen maken van de data in de collectiedatabase vaneen erfgoedinstelling, dienen de data en bijbehorende metadata naar XML-documenten omgezet teworden.Vervolgens kunnen de RDF-triples gemaakt worden. De serialisatie die in het RDF-datamodel gebruiktwordt is dan vanzelfsprekend RDF/XML.Concreet kunnen we spreken van de volgende aanbevelingen: Voor het duurzaam opslaan van een digitaal object en de bijbehorende metadata dient een XML-document gebruikt te worden. Dit vanwege de open standaard die XML is. De RDF-triples dienen in RDF/XML geschreven te worden. Nader onderzoek naar de praktijk van deze conclusie. 58
  • 59. 7 Geraadpleegde bronnenGedrukte bronnenAngevaare, I. ed., Toekomst voor ons digitaal geheugen. Duurzame toegang tot informatie in Nederland (Den Haag: Nationale Coalitie voor Digitale Duurzaamheid, juli 2009).Boudrez, F., Een digitaal archief in 10 stappen, (Antwerpen: Expertise Centrum DAVID vzw, 2009).Graaf, M. Van der en G.J. Nauta, ‘Noodklok voor behoud van born-digital erfgoed’, Informatie Professional (04 / 2010).Grooten, J., Niet, M. de, Rademaker, E.L. ed., ABC-DE Woordenboek voor het Digitaal Erfgoed,(Rotterdam: Veenman Drukkers 2008).Guntram, G., ‘A Cultural Heritage Semantic Web Example & Primer’, DigiCULT Thematic Issue 3 – Towards a Semantic Web for Heritage Resources, (Oostenrijk: 2003).Meijers, E., Stapsgewijs naar duurzame toegang. Onderzoek naar een strategisch stappenmodel voor duurzame toegang tot digitale informatie in kleine en middelgrote erfgoedinstellingen. Thesis Master of Business Informatics – Avans+ (Middelburg, april 2010).Niet, M. de, Heijmans, L. en Verwayen, H. e.a., Business Model Innovatie Cultureel Erfgoed, (Ministerie OCW: z.pl. 2009.Rothenburg, J., ‘Ensuring the Longevity of Digital Information’, Scientific American, vol. 272, nr. 1(1999).Ross, S., ‘Position Paper’, DigiCULT Thematic Issue 3 – Towards a Semantic Web for Heritage Resources, (Oostenrijk: 2003).Statsbiblioteket, HATII ed., Repository Planning Checklist and Guidance, (Glasgow: HATII, 2008), 9.Tim Berners-Lee, De wereld van het World Wide Web. Het oorspronkelijke ontwerp en de uiteindelijke bestemming van het World Wide Web, beschreven door zijn uitvinder, (Amsterdam: 2000).Zandhuis, I., ‘Fundamenten in verandering: archieven op het semantisch web’, Archievenblad, (mei 2010).Internetbronnenhttp://blogs.nature.com/jhendler/2009/06/16/what-is-the-semantic-web-really-all-about (‘What is the Semantic Web really all about?’)(geraadpleegd: 28-07-2011)http://digitaalduurzaam.blogspot.com/ (‘Linked Data’ – wat is dat nu eigenlijk precies?’)(geraadpleegd: 28-07-2011)http://nl.wikipedia.org/wiki/HTTP (Hypertext Transfer Protocol) (geraadpleegd: 28-08-2011)http://nl.wikipedia.org/wiki/Internet (Internet) (geraadpleegd: 25-08-2011).www.sync.nl/web-30/, (Definitie Semantisch Web van Christine Karman)(geraadpleegd: 14-06-2011)http://tomheath.com/blog/2009/03/linked-data-web-of-data-semantic-web-wtf/ (‘Linked Data? Web of Data? Semantic Web? WTF?’)(geraadpleegd: 28-07-2011)http://tomheath.com/papers/bizer-heath-berners-lee-ijswis-linked-data.pdf (‘Linked Data – The story so far’)(geraadpleegd:21-07-2011)http://www.appsforamsterdam.nl/ (Apps for Amsterdam)(geraadpleegd: 29-09-2011)http://www.appsforamsterdam.nl/wat-is-open-data (Wat is Open Data?) (geraadpleegd: 13-09-2011)http://collectie.ahm.nl/ (AM Collectie Online)(geraadpleegd: 23-06-2011)http://www.den.nl/art/uploads/files/LDpubliceren.pdf (Linked Data publiceren)(geraadpleegd: 20-09-2011) 59
  • 60. http://www.den.nl/art/uploads/files/Tutorial%20Linked%20Data%20Part%203b.pdf (Linked Data: stap voor stap, deel 3B)(geraadpleegd: 15-08-2011)http://www.den.nl/art/uploads/files/Tutorial%20Linked%20Data%20Part%203.pdf (Linked Data: stap voor stap, deel 3) (geraadpleegd: 15-08-2011)http://www.den.nl/bericht/2283 (Digitaal duurzame bewaartermijnen?) (geraadpleegd: 22-09-2011)http://www.den.nl/blog/bericht/3027 (DCL11: Autoriteit, hergebruik en betekenis van linked data) (geraadpleegd: 22-06-2011)http://www.den.nl/bericht/2278 (Linked Data voor de erfgoedsector – een recept van Jacco vanOssenbruggen)(geraadpleegd: 23-06-2011)http://www.den.nl/pagina/217/standaarden_en_richtlijnen/ (DE BASIS voor digitale duurzaamheid) (geraadpleegd: 26-07-2011)http://www.den.nl/standaard/266/ (Uniform Resource Identifier (URI))(geraadpleegd: 29-08-2011)http://www.den.nl/thema/10/interoperabiliteit (Interoperabiliteit)(geraadpleegd: 27-09-2011)http://www.den.nl/thema/129/ (Linked Open Data) (geraadpleegd: 09-06-2011)http://www.den.nl/thema/16/digitale-duurzaamheid (Digitale Duurzaamheid) (geraadpleegd: 4-07- 2011)http://www.digitaalallemaal.nl/?p=2061, (Blog van DEN)(geraadpleegd: 24-09-2011).http://digitalecollectie.nl/casestudies/amsterdam-museum-gesprek-met-judith-van-gent/ (Casestudy)(geraadpleegd: 19-09-2011)http://e-culture.multimedian.nl/demo/www/faq.html#howitworks (MultimediaN N9C EcultureProject)(geraadpleegd: 22-07-2011)http://www.encyclo.nl/begrip/semantiek (Semantiek)(geraadpleegd: 27-09-2011)http://www.frankwatching.com/archive/2009/01/05/web-webber-webst-van-10-naar- 30%E2%80%A6-en-verder/ (Onafhankelijk crossmedia platform)(geraadpleegd: 26-08-2011)http://www.nationaalarchief.nl/informatiebeheer-archiefvorming/-digitaal- archiefmateriaal/bewaarstrategie%C3%ABn/emulatie (Emulatie) (geraadpleegd: 22-09-2011)http://www.nationaalarchief.nl/informatiebeheer-archiefvorming/-digitaal-archiefmateriaal/bewaarstrategie%C3%ABn/migratie (Migratie) (geraadpleegd: 22-09-2011)http://www.ncdd.nl/digitaleduurzaamheid-inleiding.php (Inleiding in Digitale Duurzaamheid)(geraadpleegd: 4-07-2011)http://semanticweb.cs.vu.nl/lod/am/ (Amsterdam Museum in Europeana Data ModelRDF)(geraadpleegd: 23-06-2011)http://www.w3.org/wiki/SweoIG/TaskForces/CommunityProjects/LinkingOpenData (‘The LinkingOpen Data Project’) (geraadpleegd: 23-06-2011)ttp://group.europeana.eu/web/guest/provide_content;jsessionid=8F0F9C690C75E95C7CE3C22102FD4CFE (Europeana)(geraadpleegd: 28-07-2011)Geïnterviewde personenInge Angevaare, coordinator Nationale Coalitie Digitale Duurzaamheid.Victor de Boer, postdoctoraal onderzoeker binnen de Web & Media Group aan de Vrije Universiteit Amsterdam.Judith van Gent, teamleider afdeling Documentatie & Fotografie in het Amsterdam Museum. 60
  • 61. 8 AfbeeldingenlijstFiguur 1: OAIS Functioneel model. http://public.ccsds.org/publications/archive/650x0b1.PDFFiguur 2: Digital Preservation Infrastructure and Processes. Meijers, Enno, Stapsgewijs naar duurzame toegang. Onderzoek naar een strategisch stappenmodel voor duurzame toegang tot digitale informatie in kleine en middelgrote erfgoedinstellingen. Thesis Master of Business Informatics – Avans+ (Middelburg, april 2010)Figuur 3: Deel C van het stappenmodel Enno Meijers. Meijers, Enno, Stapsgewijs naar duurzame toegang. Onderzoek naar een strategisch stappenmodel voor duurzame toegang tot digitale informatie in kleine en middelgrote erfgoedinstellingen. Thesis Master of Business Informatics – Avans+ (Middelburg, april 2010)Figuur 4: Open Standaarden, Open Source. http://goo.gl/yqm0DFiguur 5: Het DNA van web innovatie. http://www.frankwatching.com/archive/2009/01/05/web-webber-webst-van-10-naar-30%E2%80%A6-en-verder/Figuur 6: Enabling technologies – layer cake. http://www.w3.org/2002/Talks/www2002-w3ct-swintro-em/slide9-0.htmlFiguur 7: Logo Europeana. http://www.europeana.eu/portal/aboutus_press.htmlFiguur 8: Enabling technologies – layer cake. http://www.w3.org/2002/Talks/www2002-w3ct-swintro-em/slide9-0.htmlFiguur 9: Schematische weergave van een triple. http://digitaalduurzaam.blogspot.com/ (‘Linked Data- wat is dat nu eigenlijk precies?’)Figuur 10: Web van RDF-triples. http://goo.gl/Svu0NFiguur 11: Growth of LOD Cloud. http://goo.gl/7ppK1Figuur 12: Logo Amsterdam Museum. http://www.ahm.nl/nl/Amsterdam-Museum/algemeen/pers/ahm-huisstijlFiguur 13: MultimediaN N9C Eculture Project. http://e-culture.multimedian.nl/demo/session/searchFiguur 14: Android App PLAY! Amsterdam. http://www.playamsterdam.nl/android.html 61
  • 62. Bijlage A Strategisch Stappenmodel Enno Meijers 62
  • 63. Bijlage B Linked Open Data Cloud Diagram 63

×