Successfully reported this slideshow.

Afstudeeronderzoek linked open data duurzaam voor de toekomst

2,525 views

Published on

  • Be the first to comment

  • Be the first to like this

Afstudeeronderzoek linked open data duurzaam voor de toekomst

  1. 1. Linked Open DataDuurzaam voor de toekomst?Annette Allaart – AfstudeeronderzoekReinwardt Academie – Cultureel ErfgoedOktober 2011
  2. 2. Colofon Dit werk is gelicenseerd onder een Creative Commons Naamsvermelding-NietCommercieel- GelijkDelen 3.0 Nederland. Bezoek http://creativecommons.org/licenses/by-nc-sa/3.0/nl/ om eenkopie te zien van de licentie of stuur een brief naar Creative Commons, 444 Castro Street, Suite 900, Mountain View, California, 94041, USA.Opleiding: Amsterdamse Hogeschool voor de KunstenFaculteit: Reinwardt AcademieBegeleider: Gerdie BorghuisTitel: Linked Data – Duurzaam voor de toekomst?Auteur: Annette AllaartStudiejaar: 2011Datum: 5 oktober 2011 2
  3. 3. VoorwoordVoor u ligt een scriptie welke het resultaat is van een onderzoek naar de mogelijkheden van Linked(Open) Data, om duurzame toegang tot digitale erfgoedinformatie te bevorderen. Deze scriptievormt het einde van mijn studie Cultureel Erfgoed aan de Reinwardt Academie.Het schrijven van een scriptie zag en zie ik nog steeds als een hele uitdaging. Ik ben dan ook trots ophet eindresultaat. Trots vanwege de discipline die ik mijzelf heb moeten opleggen. Zelfstandigonderzoek doen betekent dat je geen stok achter de deur hebt in de vorm van een organisatie waarje het onderzoek uitvoert.Ik ben ook trots op het aantal pagina’s waaruit deze scriptie bestaat. Hieruit blijkt dat ik wel degelijk‘verhaaltjes’ kan schrijven. Iets wat ik tijdens het schrijven niet voor mogelijk hield. Ik schreef mijneerste hoofdstuk in steno..Bij deze wil ik daarom mijn begeleider vanuit de Reinwardt Academie, Gerdie Borghuis, bedanken. Zijheeft me geleerd hoe ik de lezer aan de hand moet nemen in mijn verhaal.Graag wil ik ook Enno Meijers en Inge Angevaare bedanken. Zij hebben mij met hun brede kennis vandigitale duurzaamheid, geholpen meer vorm aan mijn onderzoek te geven. Victor de Boer bedank ikvoor het overdragen van zijn kennis van het Semantisch Web en Linked (Open) Data aan mij. Judithvan Gent van het Amsterdam Museum bedank ik voor een kijkje in de praktijk. Zonder jullie was ikongetwijfeld nog steeds verdwaald in de enorme hoeveelheid ingewikkelde informatie die er tevinden is over digitale duurzaamheid en Linked (Open) Data.Een scriptie schrijven is een proces. Dit proces had ik niet kunnen volbrengen zonder de hulp ensteun van familie, vrienden en huisgenoten. Dank jullie wel! 3
  4. 4. SamenvattingDigitale informatie is niet meer weg te denken uit onze kennissamenleving. In het hedendaagse levenkan men niet meer zonder. Digitale duurzaamheid staat echter nog steeds in de kinderschoenen.Duurzaamheid wordt voornamelijk gezien als veilige opslag van digitale objecten. Het duurzaamtoegankelijk houden van de digitale erfgoedinformatie wordt daarbij vergeten.Het streven naar duurzame toegang tot digitale erfgoedinformatie is een grote uitdaging omdat erdrie soorten bedreigingen zijn die de risico’s op verlies van digitale informatie vergroten.Deze afstudeerscriptie onderzoekt of het een mogelijkheid is de data in de collectiedatabase om tezetten naar een Linked Open dataset, om zodoende duurzame toegang tot digitale erfgoedinformatiete bevorderen.Daarnaast is het doel een beeld te creëren wat Linked (Open) Data voor culturele erfgoedinstellingenkan betekenen, hoe het werkt en wat het oplevert. Hierbij word het Amsterdam Museum als case-study gebruikt. Zij zijn het eerste museum dat haar data in de collectiedatabase heeft omgezet naareen Linked Open dataset.Om duurzame toegang tot digitale erfgoedinformatie te bieden gaat dit onderzoek uit van hetstrategische stappenmodel van Enno Meijers. Het stappenmodel bestaat uit drie delen. Het laatstedeel wordt gebruikt om de koppeling naar Linked (Open) Data te maken.Linked (Open) Data wordt als de praktijk van het Semantisch Web gezien. Het Semantisch Web draaitom interoperabiliteit van de Web-resources. Door digitale objecten inhoudelijk aan elkaar tekoppelen ontstaat een betekenisvolle relatie.Uit een analyse moet men tot de conclusie komen of Linked (Open) Data een mogelijkheid is omduurzame toegang tot digitale informatie te bevorderen, of niet. De analyse vergelijkt debeheersmaatregelen die worden geadviseerd in het derde deel van het stappenplan van EnnoMeijers met het Linked Data principe van Tim Berners-Lee.Uit de analyse is gebleken dat er wel degelijk overeenkomsten zijn tussen deze twee thema’s. Deovereenkomsten hebben vooral betrekking op het toepassen van open standaarden ten behoeve vanmetadata beheer en het signaleren van technologische veranderingen in de omgeving.De volgende aanbevelingen zijn gedaan: Maak gebruik van de open standaard XML. Gebruik RDF/XML als schrijfwijze van het RDF-datamodel. Nader onderzoek naar de praktijk van deze conclusie. 4
  5. 5. SummaryDigital information has become part of our knowledge society. In daily life, we cannot live withoutdigital information anymore. Despite of this all, digital preservation is still a new market. It’s onlytwenty years old.Digital preservation is primarily seen as safe storage of digital objects. Sustainable access to thedigital information is something the heritage institutions don’t think of. To achieve sustainable accessto the digital information is a real challenge. There are three kinds of threats which will increase therisk to lose digital information.This thesis examines whether it’s a possibility to convert the collection data to Linked Open Data,thereby promote sustainable access to digital heritage information. Moreover it’s a purpose tocreate a picture of Linked (Open) Data. What do cultural heritage institutions have to do with? Howdoes Linked (Open) Data work? What does Linked (Open) Data bring the cultural heritageinstitutions?The Amsterdam Museum is the first museum in the Netherlands who converted their collection datato Linked Open Data. I will refer to The Amsterdam Museum as they are used as a case study.To offer sustainable access to the digital heritage information this examination studied the strategicmodel for digital preservation by Enno Meijers. This model consists of three parts. The last part willbe used to make the connection to Linked (Open) Data.Linked (Open) Data is called the more operative way of the Semantic Web. The Semantic Web is allabout interoperability of Web resources. By linking the digital objects with their inside the SemanticWeb creates meaningful relationships.An analysis should be to conclude Linked (Open) Data is an opportunity to promotesustainable access to digital information or not. The analysis compares the preservation toolsrecommended in the third part of the strategic preservation model by Enno Meijers to the principlesof Linked Data by Tim Berners-Lee.The analysis showed that there are indeed similarities between these two themes. The similarities inparticular related to the use of open standards for metadata management and the identificationof technological changes in the environment.The following recommendations were made: Use the Open Standard XML, Use RDF / XML as the serialisation of the RDF-data model, Make sure you evaluate. 5
  6. 6. Inhoudsopgave1 Inleiding en afbakening……………………………………………………………………………………………………….............9 Aanleiding………………………………………………………………………………………..........................................9 Hypothese………………………………………………………………………………………………...............................10 Onderzoeksvraag…………………………………………………………………………………………………..................11 Doelstelling...............................................................................................................................11 Afbakening................................................................................................................................11 Methode....................................................................................................................................122 Digitale toegankelijkheid...................................................................................................................142.1 Wat is digitale toegankelijkheid..............................................................................................14 Digitale duurzaamheid............................................................................................................................142.2 Wat is het doel van digitale toegankelijkheid?.......................................................................152.3 Waarom is digitale toegankelijkheid belangrijk?....................................................................152.4 Obstakels en digitale toegankelijkheid...................................................................................16 2.4.1 Veranderingen in de technologie en technische oplossingen.....................................16 Migratie.....................................................................................................................................17 Emulatie....................................................................................................................................17 Normalisatie..............................................................................................................................18 2.4.2 Veranderingen in de omgeving, hoe verder?...............................................................18 Expertisecentrum DAVID...........................................................................................................18 2.4.3 Veranderingen in de organisatie dankzij nieuw beleid................................................19 De BASIS....................................................................................................................................20 PLATTER.....................................................................................................................................21 Business Model Innovation........................................................................................................22 OAIS-model...............................................................................................................................222.5 Strategisch stappenmodel.......................................................................................................24 Volwassenheidsmodel...............................................................................................................25 2.5.1 Opbouw van het stappenmodel..................................................................................25 2.5.2 Deel C: Duurzaam toegang bieden...............................................................................26 Stap 1: duurzame toegang.........................................................................................................26 Stap 2: beheer van metadata.....................................................................................................27 Stap 3: de veranderende omgeving...........................................................................................293 Veranderingen van het Web...........................................................................................................303.1 Wat is het Web?.....................................................................................................................30 Internet......................................................................................................................................30 Hoe is het World Wide Web ontstaan?.....................................................................................30 Standaarden World Wide Web..................................................................................................313.2 Het DNA van het Web............................................................................................................313.3 Het ‘Social Web’.....................................................................................................................32 Interactief..................................................................................................................................323.4 Het Semantisch Web..............................................................................................................33 Hoe werkt het?..........................................................................................................................34 Ontologie...................................................................................................................................35 6
  7. 7. 4 Linked Open Data...............................................................................................................................374.1 Wat is Linked (Open) Data?.....................................................................................................374.2 Wat is de meerwaarde voor de erfgoedsector?......................................................................384.3 Hoe verhouden Linked (Open) Data en het Semantisch Web zich tot elkaar?......................394.4 Linked Data – Open Data – Linked Open Data........................................................................40 Linked Data...............................................................................................................................40 Open Data..................................................................................................................................40 Linked Open Data......................................................................................................................414.5 De technische aspecten van Linked (Open) Data....................................................................41 4.5.1 Syntactische transformatie..........................................................................................41 XML............................................................................................................................................41 Uniform Resource Identifier......................................................................................................42 HyperText Transfer Protocol......................................................................................................42 4.5.2 Semantische transformatie..........................................................................................42 Triple..........................................................................................................................................43 Resource Description Framework..............................................................................................434.6 Linked (Open) Data – wat nu?.................................................................................................45 Linked (Open) Data browser......................................................................................................45 Linked (Open) Data zoekmachines............................................................................................45 Linked (Open) Data applicaties..................................................................................................465 Linked Open Data in de praktijk........................................................................................................475.1 Aandacht voor Linked (Open) Data.........................................................................................475.2 Aan de slag...............................................................................................................................47 5.2.1 ‘The Linking Open Data Project’...................................................................................48 5.2.2 Amsterdam Museum als Linked Open Data.................................................................48 Wat levert het op?.....................................................................................................................49 Nadelen.....................................................................................................................................49 Europeana.................................................................................................................................50 Apps for Amsterdam..................................................................................................................50 Tot slot………………………………………………………………………………………………………………………………….50 5.2.3 MultimediaN N9C Eculture Project..............................................................................51 5.2.4 Europeana....................................................................................................................52 5.2.5 Apps for Amsterdam....................................................................................................526 Conclusie en aanbevelingen..............................................................................................................53 Hypothese.................................................................................................................................53 Aanalyse stappenmodel Enno Meijers en Linked Data principe Tim Berners-Lee....................53 Referentie metadata.................................................................................................................54 ‘Fixity’ en ‘provenance’.............................................................................................................54 Het leesbaar houden van de informatie....................................................................................54 De behoefte van de gebruiker...................................................................................................55 Aanbevelingen...........................................................................................................................557 Geraadpleegde bronnen....................................................................................................................578 Afbeeldingenlijst................................................................................................................................59A Strategisch Stappenmodel Enno Meijers..........................................................................................60B Linked Open Data Cloud Diagram.....................................................................................................61 7
  8. 8. 1 Inleiding en afbakeningDeze scriptie behandelt de duurzame toegankelijkheid van digitale erfgoedinformatie en welke rolLinked Data hierin kan spelen. Dit zijn twee grote thema’s die met elkaar in verbinding zullen wordengebracht.AanleidingDigitale informatie is niet meer weg te denken uit onze kennissamenleving. In het hedendaagse levenkan men niet meer zonder. Het is een essentieel bestanddeel van onze kenniseconomie. In vrijwelelke sector, publiek en privaat, speelt digitale informatie een grote rol van betekenis.De instellingen binnen de culturele erfgoed sector zijn driftig aan de slag gegaan met digitaliserenvan hun collectie. Om mee te blijven doen in de kennissamenleving bieden zij laagdrempelig toegangtot hun digitale informatie. Hiervoor zijn een aantal redenen te noemen1: Internet vereenvoudigt deelname van andere partijen aan informatieverspreiding. De instellingen proberen op deze manier hun meerwaarde in de kennissamenleving te behouden. De verschuiving van informatieschaarste naar informatieovervloed maakt deze instellingen niet meer de autoriteit op het gebied van kennis, bovendien zijn zij niet langer de toegangspoort tot de informatie.Het digitaliseren staat dus wel degelijk hoog op de agenda. Digitale duurzaamheid staat echter nogsteeds in de kinderschoenen. Duurzaamheid wordt voornamelijk gezien als veilige opslag van digitaleobjecten.2Het streven naar duurzame toegang tot digitale erfgoedinformatie is dus een grote uitdaging, maarhet is ook een probleem dat nog geen twintig jaar oud is.Informatie op traditionele dragers van papier is zonder schadelijke invloeden van buitenaf jarenbruikbaar. Je moet alleen kunnen lezen en de taal begrijpen. Dit is niet het geval bij digitaleinformatie. Digitale informatie kent drie soorten bedreigingen die de risico’s op verlies van digitaleinformatie vergroten: Technologie Metadata OrganisatieIn zijn master thesis Stapsgewijs naar duurzame toegang heeft Enno Meijers een strategischstappenmodel ontwikkeld om stapsgewijs de risico’s op verlies van digitale informatie te verkleinen.1 Enno Meijers, Stapsgewijs naar duurzame toegang. Onderzoek naar een strategisch stappenmodel voorduurzame toegang tot digitale informatie in kleine en middelgrote erfgoedinstellingen. Thesis Master ofBusiness Informatics – Avans+ (Middelburg, april 2010), 11-12.2 Meijers, Stapsgewijs naar duurzame toegang, 38. 8
  9. 9. Dit stappenplan is op te delen in drie delen waarin vijftien factoren worden beschreven om tot eenduurzame borging van digitale informatie te komen: Het bepalen van de ambitie van de organisatie. De digitale objecten veilig stellen. Het duurzaam toegang bieden.In mijn onderzoek ga ik in op het derde deel van het stappenplan: het duurzaam toegang bieden.Hierin komen de volgende factoren aan bod: Beschrijven van de doelen voor duurzame toegang. Metadata beheer. De veranderende omgeving.Enno Meijers beschrijft in dit derde deel, over duurzame toegang bieden, de behoefte aan openstandaarden en open source software. Het toepassen van open standaarden en open sourcesoftware zouden de beste overlevingskansen bieden voor het duurzaam toegankelijk houden vandigitale informatie.Hier haakt het tweede thema van deze scriptie op in. Linked (Open) Data is een nieuwe technologiedie een intelligenter Web ondersteunt, dat gebaseerd is op open standaarden. Het is eenontwikkeling die in 2011 meer bekendheid kreeg door de Europeana database en de aandacht die degrote instellingen als de Koninklijke Bibliotheek, Nationaal Archief, Digitaal Erfgoed Nederland enNationale Coalitie Digitale Duurzaamheid eraan gaven.Op 13 mei vond het Dutch Culture Linked Open Data Event plaats in Haarlem. Hier verzamelde heterfgoedveld van Nederland en België zich om meer over deze nieuwe technologie te weten te komenen het gebruik ervan te bevorderen. Ook ik was van de partij, dit vormde het startschot voor mijnscriptie.HypotheseLinked (Open) Data is een nieuwe praktijk van het Semantisch Web. Linked (Open) Data wordt ookwel gezien als een pragmatische manier om een praktische bijdrage te leveren aan het SemantischWeb.3 Praktisch vanwege de toepasbaarheid van Linked (Open) Data. In deze scriptie zie ik Linked(Open) Data als een technologische verandering in de omgeving. Ik wil ik deze toepasbaarheidkoppelen aan het duurzaam toegang bieden tot digitale erfgoedinformatie. Is dit mogelijk en wat ishiervoor nodig? Zijn er overeenkomsten tussen de Linked (Open) Data technologie en debeheersmaatregelen voor duurzame toegang tot digitale informatie? Mijn veronderstelling is dat erovereenkomsten zijn die het mogelijk maken de Linked (Open) Data technologie te gebruiken alsbeheersmaatregel voor duurzame toegang tot digitale informatie.3 http://www.den.nl/thema/129/ (Linked Open Data) (geraadpleegd: 09-06-2011) 9
  10. 10. OnderzoeksvraagHet voorgaande resulteert in de volgende hoofdvraag:Is Linked (Open) Data, als toepassing van het semantisch web, een mogelijkheid om digitaleerfgoedinformatie duurzaam toegankelijk te maken?De bijbehorende deelvragen zullen het onderzoek meer diepte geven: Wat is digitale duurzaamheid? Wat is het maatschappelijk belang van het duurzaam toegankelijk maken van digitale (erfgoed) informatie? Welke mogelijkheden voor het duurzaam toegankelijk maken van digitale (erfgoed) informatie zijn er al? Wat is semantisch web? Welke ontwikkelingen zijn er vooraf gegaan aan het semantisch web? Wat is Linked Open Data (LOD)? Hoe verhouden LOD en het semantisch web zich tot elkaar? Door wie wordt deze toepassing van semantisch web al gebruikt? Wat zijn de voors/tegens van LOD als toepassing van semantisch web? Hoe werkt LOD? Welke stappen moeten doorlopen worden om van data LOD te maken? Is er een verschil tussen erfgoedinstellingen en niet-erfgoedinstellingen, in duurzaam toegankelijk maken van informatie?DoelstellingMijn doelstelling is de erfgoedprofessional een duidelijk beeld te geven wat Linked (Open) Data is enhoe het kan bijdragen aan duurzame toegankelijkheid van digitale erfgoedinformatie.AfbakeningAangezien duurzame toegankelijkheid even als Linked (Open) Data grote begrippen zijn, is het nodigeen afbakening te maken.Dit onderzoek heeft plaatsgevonden binnen de publieke sector. Hierin worden drie terreinenonderscheiden:4 Wetenschap Overheid Cultuur en mediaBinnen het cultuur en media terrein onderscheidt het ministerie van Onderwijs, Cultuur enWetenschap drie andere verdelingen: Media Letteren en bibliotheken Cultureel erfgoed4 Inge Angevaare ed., Toekomst voor ons digitaal geheugen. Duurzame toegang tot informatie in Nederland(Den Haag: Nationale Coalitie voor Digitale Duurzaamheid, juli 2009), 15. 10
  11. 11. Cultureel erfgoed is het gemeengoed van de Reinwardt Academie. Het omvat de musea,monumenten, archeologie en archieven. Dit is ook het terrein waarin ik de duurzametoegankelijkheid van digitale informatie bestudeer.Na aangegeven te hebben welk terrein binnen de sector cultuur en media ik bestudeer, zal ik nuduidelijk maken wat ik onder digitale (erfgoed) informatie versta.Binnen de culturele erfgoedsector onderscheiden we drie verschillende soorten digitaal cultureelerfgoed: Born-digital erfgoed materiaal, dit zijn objecten die van origine digitaal zijn. Het zijn erfgoedobjecten die niet van analoge objecten zijn afgeleid. Hierbij kun je denken aan bouwtekeningen die gemaakt zijn met behulp van CAD/CAM-programmatuur, e- maildossiers, games, verrijkte publicaties, tweets en websites.5 Gedigitaliseerd erfgoed, hiervan kennen we twee soorten. 1. Gedigitaliseerd erfgoed dat het origineel heeft vervangen en nu als een digitaal substituut geldt. 2. Gedigitaliseerd erfgoed waarbij het fysieke origineel bewaard blijft.6 Digitale informatie over erfgoed, hieronder vallen bijvoorbeeld beschrijvingen die zijn vastgelegd in collectie-informatiesystemen.7In dit onderzoek laat ik born digital materiaal buiten beschouwing. Dit vanwege de complexiteit ende ‘nieuwheid’ van het materiaal.Wanneer ik het over digitale (erfgoed) informatie heb, bedoel ik hiermee gedigitaliseerd erfgoeden/of digitale informatie over erfgoed.MethodeIk heb geprobeerd meer grip te krijgen op de twee begrippen: duurzame toegankelijkheid en Linked(Open) Data, door eerst theoretisch onderzoek te doen, hierbij heb ik zowel literatuur als hetinternet geraadpleegd. De belangrijkste bronnen die ik gebruikt heb zijn: Meijers, E., Stapsgewijs naar duurzame toegang. Onderzoek naar een strategisch stappenmodel voor duurzame toegang tot digitale informatie in kleine en middelgrote erfgoedinstellingen. Thesis Master of Business Informatics – Avans+ (Middelburg, april 2010). Angevaare, I. ed., Toekomst voor ons digitaal geheugen. Duurzame toegang tot informatie in Nederland (Den Haag: Nationale Coalitie voor Digitale Duurzaamheid, juli 2009). www.den.nlDaarnaast heb ik met diverse mensen uit het werkveld gesproken. Ik heb ze gevraagd naar hunmening en ervaring met digitale toegankelijkheid en Linked (Open) Data. Zoals ik al aangaf wordtLinked (Open) Data als de ‘praktijk’ van het Semantisch Web gezien. Het Amsterdam Museum is deeerste Nederlandse culturele erfgoedinstelling die deze ‘praktijk’ ook daadwerkelijk in praktijk heeftgebracht. Zij hebben hun collectiedatabase als een Linked Open Dataset ontsloten. Ik ben bij hetAmsterdam Museum langs geweest om te weten te komen wat hun ervaringen zijn.5 M. Van der Graaf en G.J. Nauta, ‘Noodklok voor behoud van born-digital erfgoed’, Informatie Professional (04/ 2010), 12-15.6 http://www.den.nl/bericht/2283 (Digitaal duurzame bewaartermijnen?) (geraadpleegd: 22-09-2011)7 Ibidem. 11
  12. 12. In veel van de gesprekken met experts op dit gebied kwam naar voren hoe ambitieus mijnonderwerp is. Het zijn twee grote thema’s die beide nog veel bestudeerd dienen te worden. Het wasdan ook erg moeilijk om me niet te verliezen in de complexiteit van voornamelijk het thema digitaletoegankelijkheid. Ik kom nog maar net kijken, terwijl sommige experts al tien jaar bezig zijn op ditterrein en nog steeds niet alles weten. Toch verwacht ik met deze scriptie de brug tussen de technicien de erfgoedprofessionals te slaan door op een begrijpelijke manier uit te leggen hoe digitaletoegankelijkheid en Linked (Open) Data met elkaar verweven zijn en wat zij voor elkaar kunnenbetekenen. 12
  13. 13. 2 Digitale ToegankelijkheidDigitale toegankelijkheid gaat vanzelfsprekend samen met de komst van het digitale tijdperk.2.1 Wat is digitale toegankelijkheid?Met het ontstaan van het Internet in de jaren ’70, de komst van de eerste ‘personal computer’ in1981 van IBM en de komst van het Web van Tim Berners Lee in 1991 veranderde er niet alleen veelin positieve zin, maar ook in negatieve zin.Het Web bijvoorbeeld, is een handig middel om informatie sneller op te vragen en te verspreiden.Informatie sneller opvragen gebeurd door slimme ‘browsers’ op het Internet. Informatie verspreidengaat door webtoepassingen als virtuele tentoonstellingen. Deze voorbeelden kunnen allemaaldigitale technieken genoemd worden.In de jaren tachtig van de vorige eeuw realiseerde men zich dat de opkomende digitale techniekenook risico’s met zich mee brachten. Jeff Rothenberg benoemde de onderstaande technischeproblemen8: De dragers (cd, dvd, floppy disk) hebben een beperkte levensduur, vaak niet meer dan vijf jaar. De informatie bestaat uit een op zichzelf betekenisloze ‘bitstream’, alleen met behulp van de juiste hardware-/softwarecombinatie kan die informatie tot leven gewekt worden. De betekenis kan alleen achterhaald worden als aan de ‘bitstream’ zelf contextinformatie is toegevoegd.Deze risico’s vragen om oplossingen. Dit is echter niet eenvoudig. In tegenstelling tot papier dateeuwenlang in een constante (geklimatiseerde) omgeving bruikbaar kan worden gehouden, geldenvoor digitale informatie heel andere regels. Digitale informatie en haar dragers zijn nietvanzelfsprekend geschikt voor bewaring op de lange termijn.Met iedere nieuwe ontwikkeling van hard- en software zullen we de digitale informatie en hundragers moeten controleren of zij nog wel bruikbaar zijn. Dit gebeurd door de ‘bitstream’ tecontroleren. Blijkt de ‘bitstream’ niet meer toegankelijk te zijn, dan moet er een passende oplossinggevonden worden om de toegankelijkheid op de lange termijn te waarborgen. Deze controle van dedigitale informatie en haar dragers, vereist een continu proces van aandacht en zorg. We noemen diteen streven naar digitale duurzaamheid.9Digitale Duurzaamheid?Een streven naar digitale duurzaamheid dus. Wat is dan digitale toegankelijkheid?De Nationale Coalitie Digitale Duurzaamheid heeft in het rapportToekomst voor ons digitaalgeheugen aangegeven liever over duurzame toegang of duurzame toegankelijkheid te spreken dan8 Rothenburg, Jeff, ‘Ensuring the Longevity of Digital Information’, Scientific American, vol. 272, nr. 1 (1999) 24-29.9 Angevaare, Toekomst voor ons digitaal geheugen, 23. 13
  14. 14. van digitale duurzaamheid. De reden die zij hiervoor geven is dat duurzame bewaring zondertoegankelijkheid geen zin heeft.10In mijn gesprek met Inge Angevaare (coördinator NCDD) gaf zij ook aan dat duurzametoegankelijkheid bestaat uit twee delen: Het bewaren van het object voor de toekomst, Het op de lange termijn beschikbaar houden voor de gebruiker.Ik sluit me aan bij de NCDD en zal in deze scriptie de term duurzame toegankelijkheid gebruiken.2.2 Wat is het doel van digitale toegankelijkheid?“Duurzaamheid opzich is nooit het doel” [Inge Angevaare, NCDD, 21-06-2011]11Het doel van digitale toegankelijkheid is het langdurig bewaren van digitale informatie enbeschikbaar houden voor de gebruikers, zodat de digitale informatie (her)gebruikt kan worden in detoekomst en men erop kan vertrouwen dat de informatie authentiek en betrouwbaar is.122.3 Waarom is digitale toegankelijkheid belangrijk?In het hedendaagse leven kan men niet meer zonder digitale informatie. Digitale informatie is eenessentieel bestandsdeel van onze kenniseconomie. In vrijwel elke sector publiek en/of privaat speeltinformatie een rol van betekenis. Tegenwoordig spreken we zelfs van een informatieovervloed inplaats van informatieschaarste. De publieke sector investeert in de productie en verwerving vandigitale informatie en wil deze langdurig toegankelijk houden.Binnen de culturele sector wordt het belang van deze taak benadrukt door de Raad van Cultuur. Zijwijzen op het belang van cultuurhistorie wat indirect het belang van digitale toegankelijkheid totdigitale erfgoedinformatie onderstreept. In het beleidsstuk Innoveren, Participeren!, zeggen zij: ‘Een samenleving die vooruit wil, doet er verstandig aan óók achterom te kijken. Het verleden moet niet worden vergeten, maar opgepoetst en gebruikt. Zonder continuïteit raken we op drift en koersen we van het ene incident naar het volgende. Ons collectieve geheugen, waarvan belangrijke delen zijn opgeslagen in archieven, musea en bibliotheken, schept een onmisbare basis voor die continuïteit.’ [Innoveren, Participeren!, 2007, p.12]De NCDD sluit zich hierbij aan door het volgende te zeggen: ‘Geschiedschrijving wordt in de toekomst onmogelijk als wij er anno 2008 niet voor zorgen dat digitale informatie over onze samenleving wordt bewaard.’1310 Ibidem, 13.11 Gesprek met Inge Angevaare, coördinator Nationale Coalitie Digitale Duurzaamheid, 21-06-2011.12 Ibidem, 12.13 http://www.ncdd.nl/digitaleduurzaamheid-inleiding.php (Inleiding in Digitale Duurzaamheid)(geraadpleegd:4-07-2011) 14
  15. 15. Digitaal Erfgoed Nederland, Kennisland en het Ministerie van OCW benadrukken in het rapportBusiness Model Innovatie Cultureel Erfgoed juist de waardecreatie die toegang tot digitale collectiesbrengt: ‘De digitale collecties vertegenwoordigen een grote potentiële economische en maatschappelijke waarde, mits ze optimaal toegankelijke worden gemaakt.’14Naast deze redenen voor cultuurbesef en waardecreatie gelden er nog een aantal redenen dievoornamelijk van technologische en organisatorische aard zijn15: Erfgoedinstellingen investeren de laatste jaren fors in digitalisering van hun collecties. Duurzame toegankelijkheid van de digitale informatie waarborgt in zekere zin deze investering in digitalisering. Digitalisering van de collecties levert digitale reproducties van o.a. kwetsbare originelen. Deze hoeven dankzij de digitale reproductie niet vaak uit het depot gehaald te worden. Indirect zorgt duurzame toegankelijkheid van digitale informatie op deze manier ook voor duurzaamheid van het fysieke object.2.4 Obstakels en digitale toegankelijkheid?In paragraaf 1.1 zijn al kort de grootste risico’s die de toegankelijkheid tot digitale informatiebedreigen, uiteengezet. Er zijn echter drie soorten bedreigingen te noemen met elk hun eigenkenmerkende risico’s die de duurzame toegang tot digitale informatie in gevaar brengen. Hieronderde drie soorten bedreigingen16: Veranderingen in de technologie; Veranderingen in de omgeving; Veranderingen in de organisatie.Hoe vangen we deze risico’s en bedreigingen op en zorgen we ervoor dat de digitale informatie goedbewaard en beheerd wordt?Om de verschillende soorten bedreigingen van toegang tot digitale informatie te beperken kunnenverschillende beheersmaatregelen worden gehanteerd. Deze kunnen betrekking hebben op detechnologie en/of beleid en organisatie. We noemen dit ook wel bewaarstrategieën.Op de komende pagina’s worden de verschillende bedreigingen met hun bijbehorende (mogelijke)bewaarstrategieën beschreven.Deze beheersmaatregelen kunnen echter nog niet als DE oplossing worden gezien. De problematiekvan digitale toegankelijkheid tot digitale informatie is daarvoor nog te jong, nog geen twintig jaaroud. Deze beheersmaatregelen proberen de risico’s en bedreigingen tot een minimum te beperken.14 M. De Niet, L. Heijmans en H. Verwayen e.a., Business Model Innovatie Cultureel Erfgoed, (Ministerie OCW:z.pl. 2009), 6-7.15 http://www.den.nl/thema/16/digitale-duurzaamheid (Digitale Duurzaamheid) (geraadpleegd: 4-07-2011)16 Meijers, Stapsgewijs naar duurzame toegang, 13. 15
  16. 16. 2.4.1 Veranderingen in de technologie en technische oplossingenVeranderingen in de technologie omvatte de risico’s die Jeff Rothenberg aangaf. Deze risico’s hebbenvoornamelijk betrekking op het bewaren van de digitale informatie.Digitale informatie bestaat uit enen en nullen (bitstream) die alleen betekenis krijgen wanneer dezewordt afgespeeld op dezelfde combinatie van hard- en software. Dit zou niet een heel grootprobleem moeten zijn mits de voortdurende ontwikkeling van nieuwe hard- en softwareproductenniet zo groot en snel was dat digitale informatie al na tien jaar onbruikbaar is. Wanneer een van detwee of beide verouderen en de informatie niet meer leesbaar is, moet een oplossing wordengevonden. Daarnaast speelt ook de beperkte houdbaarheid van digitale informatie dragers een rol.17Omdat dit een technische zaak betreft, vraagt dit om een technische beheersomgeving.Er zijn drie bekende technische bewaarstrategieën: Migratie, Emulatie, NormalisatieMigratieBestanden worden overgezet van de ene hardwareconfiguratie of softwareapplicatie naar de andere.Het bestand wordt dan niet meer als een bitstream opgeslagen maar in een formaat dat gangbaar engeschikt is voor de toekomst.Een goed voorbeeld is wanneer we een tekst hebben getypt op een computer met Windows 95software en deze willen openen op onze nieuwe computer met de software Windows 2007. Wezullen dan eerst het Windows 95 bestand moeten converteren naar een Windows 2007 bestand,voordat we het kunnen lezen. Anders kan de computer de bitstream niet meer ‘lezen’.Migratie is gericht op het behoud van data, er zijn echter toch een aantal nadelen. Migratie moetelke ± twee jaar herhaald worden om te voorkomen dat dit bestandsformaat ook niet verouderd enniet meer toegankelijk is. Het leidt vaak tot verlies van informatie. De nieuwe software kan hetbestand niet meer ‘lezen’ zoals het was. Er kunnen kenmerken als inhoud, structuur, uiterlijk ofgedrag verloren gaan. Het verlies van informatie leidt uiteindelijk tot aantasting van de authenticiteitvan het bestand.18EmulatieEen andere manier om je digitale informatie te behouden voor de toekomst is emulatie. Volgenssommige mensen is dit de enige mogelijkheid om de authenticiteit en integriteit van een digitaalbestand op de lange termijn te behouden.1917 Angevaare, Toekomst voor ons digitaal geheugen, 11.18 http://www.nationaalarchief.nl/informatiebeheer-archiefvorming/-digitaal-archiefmateriaal/bewaarstrategie%C3%ABn/migratie (Migratie) (geraadpleegd: 22-09-2011)19 http://www.nationaalarchief.nl/informatiebeheer-archiefvorming/-digitaal-archiefmateriaal/bewaarstrategie%C3%ABn/emulatie (Emulatie) (geraadpleegd: 22-09-2011) 16
  17. 17. Bij emulatie blijft het oorspronkelijke bestand, bestaande uit het besturingssysteem en de softwarebehouden. De bitstream wordt, in tegenstelling tot bij migratie, niet veranderd. Er wordt als het wareeen software ontwikkeld die een nieuwe computer kan laten functioneren als een ouder model. Deoorspronkelijke omgeving wordt dus nagebootst op een nieuwe computer.2020 Ibidem. 17
  18. 18. NormalisatieDit is een techniek met als doel alle digitale informatie te converteren naar een zelfdebestandsformaat. Deze methode wordt voornamelijk gebruikt wanneer er is besloten niet allebestandsformaten op te nemen in de digitale collectie.212.4.2 Veranderingen in de omgeving, hoe verder?Niet alleen het bewaren van digitale informatie is belangrijk. We moeten de digitale informatie alswe ze teruglezen ook in een context kunnen plaatsen, zodat we de betekenis van de inhoud kunnenbegrijpen.De ‘bitstream’ wordt pas informatie wanneer extra informatie over deze data beschikbaar is. Dezeextra informatie geeft betekenis aan de data. We noemen deze extra informatie: metadata. Op dezemanier wordt er context gecreëerd.Het beheren van de relevante metadata van digitale informatie is weer een extra uitdaging.22 Hierkomt ook de problematiek rondom het beheren van de relevante metadata voor duurzaamheid aanhet licht: De digitale objecten en de metadata worden beheerd in omgevingen waar in beperkte mate sprake is van professioneel IT-beheer. Het beheer van metadata richt zich vrijwel uitsluitend op de inhoud; het vastleggen van metadata noodzakelijk voor duurzaam beheer zoals het registeren van gebruikte formaten, herkomst- of referentie informatie of het vastleggen van een digitale ‘handtekening’ bij de objecten krijgt weinig aandacht.Dit deel van de problematiek van digitale toegankelijkheid is nog nauwelijks verkend. Enno Meijersgeeft aan dat de markt, om deze problematiek te verkleinen, nog niet ver genoeg ontwikkeld is. Hijsuggereert dat Digitaal Erfgoed Nederland deze markt kan ontwikkelen door hierin een sturende enstimulerende rol te spelen. Daarnaast geeft hij aan dat het beheren van de relevante metadata voorduurzaamheid ook op het terrein van inspelen op technologische veranderingen slaat.In België hebben ze in 2009 een product op de markt gebracht om de problematiek van metadatabeheer voor duurzaamheid te verkleinen. Dit stappenplan ontwikkeld door Expertisecentrum DAVIDuit Antwerpen, bevat een tiental praktische richtlijnen om de risico’s die duurzame toegankelijkheidvan digitale informatie met zich meebrengt te verkleinen. Het focust zich voornamelijk op juistsoftware gebruik en metadata beheer.Expertisecentrum DAVIDHet stappenplan van het expertisecentrum DAVID in Antwerpen is gebaseerd op de functionelevereisten van digitale archivering en de bijbehorende maatregelen voor risicobeheer.21 Angevaare, Toekomst voor ons digitaal geheugen, 25.22 Meijers, Stapsgewijs naar duurzame toegang, 14. 18
  19. 19. Digitaal archiveren wordt als een risicovol en kwetsbaar reconstructieproces gezien. Bij het bouwenen beheren van een digitaal archief gelden daarom vijf terugkerende basisprincipes23:1. Vermijd (externe) afhankelijkheden.2. Vermijdt overbodige reconstructiestappen.3. Pas risicospreiding en –beheer toe.4. Pas normen en standaarden toe.5. Documenteer de implementatie en het beheer.Deze vijf basisprincipes vormen de basis voor de acties die voor elke stap worden uitgevoerd.Deze tien stappen zijn verdeeld in drie groepen: Groep 1 houdt zich bezig met de keuze en inrichtingvan de hard- en softwarearchitectuur. Groep 2 organiseert de functionaliteiten rondom leesbaarheid,authenticiteit en integriteit. De laatste groep documenteert het digitaal archiveringssysteem24. 1. Gebruik een betrouwbaar en beveiligd opslagsysteem en pas een adequaat beheer toe. 2. Bewaar de metadata op een digitaal duurzame wijze. 3. Voorzie een duurzame band tussen het document en zijn metadata. 4. Registreer voor elk digitaal object metadata. 5. Definieer en documenteer de essentiële eigenschappen van het originele document. 6. Bewaar de leesbaarheid van de digitale documenten. 7. Archiveer alle componenten die nodig zijn voor een getrouwe reconstructie van de documenten. 8. Documenteer het beheer van de digitale documenten. 9. Beschrijf de digitale documenten. 10. Documenteer het digitale archief.Dit stappenplan stelt iedere organisatie in staat een betrouwbaar digitaal archief op te stellen.2.4.3 Veranderingen in de organisatie dankzij nieuw beleidDe langetermijnzorg van digitale informatie vraagt om continue aandacht en zorg. De laatste jarengroeide het besef dat technische oplossingen niet voldoende zijn om de digitale risico’s die deduurzame toegang tot digitale informatie in gevaar brengen te beheersen. Om technischeoplossingen te kunnen ontwikkelen en te implementeren zijn beleidsmatige en organisatorischerandvoorwaarden nodig.25 Er moeten strategische keuzes binnen de organisatie worden gemaakt dieeen duurzaamheidstrategie implementeren. Deze strategische keuzes kunnen invloed hebben op dehele organisatiestructuur.2623 Filip Boudrez, Een digitaal archief in 10 stappen, (Antwerpen: Expertise Centrum DAVID vzw, 2009), 1.24 Boudrez, Een digitaal archief in 10 stappen, 2.25 Angevaare, Toekomst voor ons digitaal geheugen, 25.26 Meijers, Stapsgewijs naar duurzame toegang, 15. 19
  20. 20. Er zijn diverse soorten beleidsmatige en organisatorische randvoorwaarden gedefinieerd. De volgende pagina’s beschrijven bestaande beheersmaatregelen die gebruikt zijn als instrument voor beleidsontwikkeling. Tot instrumenten voor beleidsontwikkeling behoren De BASIS van Digitaal Erfgoed Nederland, “Planning Tool for Trusted Electronic Repositories – PLATTER” door het project Digital Preservation Europe (DPE) en Business Model Innovatie ontwikkeld vanuit het Ministerie van OCW. De BASIS De culturele erfgoed sector vind deze randvoorwaarden voornamelijk in ‘de BASIS voor Duurzaamheid’ van DEN.27 Digitale toegankelijkheid op de lange termijn is een continu proces en begint al bij de creatie van het digitale bestand. De BASIS is een strategie waarin de technische- en ICT-infrastructuur beheersmaatregelen elkaar ontmoeten, die is gebaseerd op de kwaliteitscyclus van DEN en bestaat uit minimale eisen die elkaar in verschillende fasen opvolgen28.Fase 1: beleid ontwikkelenIedere erfgoedinstelling die digitale informatie produceert moet denken aan eenduurzaamheidstrategie. Bij het opstellen van een duurzaamheidbeleid moet rekening wordengehouden met vier aspecten:- Documentatie, het formuleren van een informatieplan.- Organisatie, de gehele organisatie is zich bewust van de betekenis van duurzaamheid- Middelen, er wordt budget gereserveerd.- Technische oplossing, welke systemen worden gebruikt? Eigen beheer ja/nee?Fase 2: plannen makenEr worden concrete plannen geformuleerd die gebaseerd zijn op het beleid om collecties tedigitaliseren en digitale informatie te beheren. Hieraan worden een aantal eisen gesteld:- Wat wordt bewaard? Er dienen selectiecriteria opgezet te worden.- Criteria voor bestandsformaten, welke bestandformaten worden opgenomen?- Uitvoerbare plannen, check-check-dubbel check.- Kennis van externe voorzieningen, kijk eens bij de buren, hoe doen zij het? 27 http://www.den.nl/pagina/217/standaarden_en_richtlijnen/ (DE BASIS voor digitale duurzaamheid) (geraadpleegd: 26-07-2011) 28 Ibidem. 20
  21. 21. Fase 3: uitvoering Concrete oplossingen voor duurzame toegankelijkheid tot digitale informatie moet aan een aantal eisen voldoen: - Kennisuitwisseling, er dient een aanspreekpunt binnen de organisatie te zijn. - Referentiemodel, wanneer een eigen ‘repository’ wordt gemaakt dient die volgens het OAIS-model te zijn opgezet. Fase 4: evaluatie Wanneer een erfgoedinstelling duurzame toegang tot digitale informatie nastreeft dient een evaluatie plaats te vinden die aan een basiseis voldoet: - Toetsing van een eigen ‘repository’ dient plaats te vinden met TRAC.De BASIS voor Duurzaamheid bestaat nu twee jaar en zal in 2011 geëvalueerd worden en indien nogaangepast.PLATTEREen ander goed werkende beleidsstrategie die duurzame toegang tot digitale informatie nastreeft isde “Planning Tool for Trusted Electronic Repositories - PLATTER” [DPE, 2008].Dit is een instrument ontwikkeld door het project Digital Preservation Europe. Het heeft als doel tekomen tot het formuleren van concrete, meetbare doelstellingen voor het digitaal archief.29PLATTER richt zich op negen strategische plannen die samen een duurzaam beleid vormen tenopzichte van toegang tot digitale informatie die in verband worden gebracht met de tien CorePrinciples of Trust Repository Design30. 1. Business Plan – Financiële planning, monitoring en planning. 2. Acquistion Plan – Evaluatie beleid. Beheren van de relaties met aanbieders en andere leveranciers. 3. Staffing Plan – Aquisitie en onderhoud van relevante vaardigheden voor depotbeheer. 4. Acces Plan – Toegangsbeleid. Beheren van gebruikersrelaties. 5. Technical Plan – Doelen vaststellen voor hardware, software en netwerken. 6. Data Plan – Specificatie van data en metadata van objecten, formaten en structuren voor opname, opslag en verspreiding samen met de relevante transformaties en mappings. 7. Succession Plan – Beheren van contracten na verloop van het archief om digitale objecten te behouden voor de toekomst. 8. Disaster Plan – Reageren op veranderingen in het archiefsysteem. 9. Preservation Plan – Erop toezien dat de toegang en bruikbaarheid van de digitale objecten in29 Meijers, Stapsgewijs naar duurzame toegang, 32.30 Statsbiblioteket, HATII ed., Repository Planning Checklist and Guidance, (Glasgow: HATII, 2008), 9. 21
  22. 22. Business Model InnovatieAls het om beleidsontwikkeling gaat, mag een Business Model niet vergeten worden. Ook niet bijontwikkeling van beleid voor duurzame toegankelijkheid tot digitale informatie. Het bieden vanduurzame toegang tot digitale informatie vraagt om financiële middelen. Voordat men investeert induurzame toegang moet duidelijk zijn wat de baten zijn van deze toekomstige investering.31Het Business Model dat besproken wordt in Business Model Innovatie, Cultureel Erfgoed van DEN,Kennisland en het Ministerie van OCW gaat uit van negen bouwstenen die in directe relatie tot elkaarstaan.32 1. Propositie – Onderscheidend vermogen organisatie. 2. Klant – Klant is koning. 3. Distributie – Bepaald communicatie en ervaring klant. 4. Relatie 5. Opbrengsten – Bereidheid betaling klant. Volgt uit 4 voorgaande bouwstenen. 6. Activiteiten – Om propositie te kunnen realiseren. 7. Resources – Door organisatie zelf uit te voeren activiteiten. 8. Partners – Uitbesteding activiteiten. 9. Kosten – Kostenstructuur organisatie. Volgt uit bouwstenen 6 t/m 8.In de vorige pagina’s hebben we stil gestaan bij beheersmaatregelen die betrekking hebben op het tevormen beleid en de technologie die nodig is om de risico’s die de duurzame toegang tot digitaleinformatie in gevaar brengen te verkleinen. Beleidsmatige- en technologische beheersmaatregelenontmoeten elkaar bij het inrichten van een stabiele interne infrastructuur. Het inrichten van eenstabiele interne infrastructuur is het derde aspect van duurzaam beheren. Dit derde aspect is nogniet eerder genoemd als duurzaam beheersaspect, maar het kan als het ware als een sausje over detechnologische- en beleidsmatige beheersmaatregelen worden gegoten.Duurzame toegang tot digitale informatie heeft o.a. te maken met interne infrastructuren. Wanneerdeze stabiel zijn, kan dit tot zo min mogelijk verlies van informatie leiden.33 Het voor vrijwel iedereenbekende OAIS-model biedt een manier om een dergelijke stabiele interne infrastructuur binnen eencollectiedatabase op te zetten.OAIS-modelHet “Open Archival Information System (OAIS) Reference Model” [CCSDS, 2009] is een model dat eenconceptueel begrippenkader introduceerde voor een architectuur voor duurzame toegang. Het isalgemeen geaccepteerd en wordt over de hele wereld gebruikt. Het werd in 2000 ontwikkeld door31 Meijers, Stapsgewijs naar duurzame toegang, 33.32 De Niet, Heijmans en Verwayen e.a., Business Model Innovatie Cultureel Erfgoed, 16-18.33 Meijers, Stapsgewijs naar duurzame toegang, 24. 22
  23. 23. het Consultative Committee for Space Data Systems (CCSDS) van NASA. Tegenwoordig is het zelfseen ISO-standaard (ISO 14721 [Lavoie, 2004]).34Het OAIS-model draaitom het zogenaamde‘Archive InformationPackage’ (AIP).Een digitaal object wordtopgenomen in hetarchief.Alle digitale objectensamen vormen hetArchive InformationPackage.Het doel van het archiefis dit AIP duurzaamtoegankelijk te houden.Dit gebeurd aan de hand Figuur 1: OAIS Functioneel Modelvan de zes functies die infiguur 1 zijn gekaderd. Hieronder worden ze verder toegelicht35. ‘ingest’ Dit is het startpunt van het archiveringsproces. Het materiaal dat wordt aangeboden wordt beoordeeld op verschillende aspecten als kwaliteit, formaat en volledigheid die bepalen of het materiaal geschikt is voor opname in het archief. ‘storage’ Bij deze stap wordt gekeken naar de opslag van het digitale object en de bijbehorende metadata. Het is een continueproces waarbij veel aandacht is voor de conditie van de opslagomgeving en de opgeslagen gegevens. ‘data management’ De databeheer-functie zorgt voor de instrumenten voor het toekennen en onderhouden van alle metadata die nodig zijn voor het duurzaam beheer van het informatieobject. Dit gaat verder dan het alleen maar toekennen van metadata voor het ontsluiten; er is ook behoefte aan het vastleggen van formaattype, controlewaarden (‘fixity’), wijzigingshistorie (‘provenance’) en gebruiksvoorwaarden (‘access rights’). ‘access’ Dit wordt ook wel de raadpleeg functie genoemd. Hier wordt gezorgd voor de vindbaarheid en het toegang geven tot het digitale object. Hierbij worden wel de voorwaarden die bij de opname functie zijn vastgesteld aangehouden. ‘Access’ en ‘data management’ staan in nauw contact met elkaar.34 Angevaare, Toekomst voor ons digitaal geheugen, 25.35 Meijers, Stapsgewijs naar duurzame toegang, 26. 23
  24. 24. ‘administration’ De zogenaamde coördinatie van het beheer is een veelomvattende taak. Het bevat o.a.: - bewaking van het opname proces, - configuratie management voor hard- en software, - proces monitoring, - documenteren en rapporteren over de opgeslagen objecten, - ontwikkelen en onderhouden archiveringsbeleid, - ondersteunen gebruikers. ‘preservation planning’ Deze functie verzorgt de evaluatie van het archief. Het speelt in op de veranderingen in technologie, of veranderingen van gebruikers en/of producenten. Op deze manier spoort men vroegtijdig eventuele risico’s op die kunnen optreden of kunnen de nodige aanpassingen aan het archief worden gemaakt.De introductie van het OAIS-model heeft veel invloed gehad op de manier waarop men omgaat metde problematiek rondom duurzame toegankelijkheid tot digitale informatie. Elke organisatie dienadenkt over duurzame toegankelijkheid tot de digitale informatie van haar instelling, wordt geachtde zes functies van het OAIS-model in haar beleid op te nemen.36Naast deze beheersmaatregelen- die gebaseerd zijn op de drie aspecten van duurzaam beheren:beleid, inrichting en technologie- zijn er natuurlijk nog tal van andere beheersmaatregelen. Dit zijnechter de meest gehanteerde. Bovendien vormen deze beheersmaatregelen de basis voor hetstappenmodel dat Enno Meijers in zijn master thesis heeft ontwikkeld. Dit wil ik graag gebruiken indeze scriptie om de koppeling naar het gebruik van Linked (Open) Data te leggen.2.5 Strategisch StappenmodelEnno Meijers heeft een stappenmodel ontwikkeld dat kleine- en middelgrote cultureleerfgoedinstellingen in staat stelt aan de slag te gaan met de problematiek van duurzametoegankelijkheid tot digitale informatie. Het stappenmodel kan gebruikt worden als eenondersteunend middel bij het opstellen van maatregelen om de risico’s van verlies van digitaleinformatie te beperken.37De maatregelen raken aan veel gebieden binnen de organisatie van de culturele erfgoedinstellingen: Ontwikkeling beleid, Inrichting ICT-infrastructuur, Beheersprocessen.36 Angevaare, Toekomst voor ons digitaal geheugen, 25.37 Meijers, Stapsgewijs naar duurzame toegang, 30. 24
  25. 25. Om die reden zijn veel van de in paragraaf 2.4 besproken beheersmaatregelen verwerkt in hetstappenmodel. We zien PLATTER, het OAIS-model en het stappenplan van Expertisecentrum DAVIDterug in het stappenplan van Enno Meijers.“De toegevoegde waarde van het stappenmodel is het rangschikken van de stappen naar volgordevan urgentie met als leidraad de vijftien elementen uit het volwassenheidsmodel van Dollar.”38VolwassenheidsmodelHet stappenmodel is gebaseerd op het volwassenheidsmodel van Charles M. Dollar.Het volwassenheidsmodel van Dollar: “Digital Preservation Capability Maturity Model” is gebaseerdop het bekende Capability Maturity Model Integration uit de IT, waarvan de basis in 1990 isontwikkeld. Charles M. Dollar is een pionier op het gebied van duurzame toegankelijkheid.39Dit volwassenheidsmodel voor digitale duurzaamheid bestaat uit vijftien kernfactoren. Deze zijnverdeeld in twee groepen.De ene groep omvat de factoren die gaan over de infrastructuur van digitale duurzaamheid.De andere groep bevat de processen dienodig zijn om duurzameopslag van en toegang tot digitaleinformatie te realiseren.40De essentie van eenvolwassenheidsmodel is het inrichtenvan een cyclisch proces van verbeteringom op deze manier een steeds hogerkwaliteitsniveau te bereiken.In het volwassenheidsmodel worden vijfniveaus gedefinieerd voor het vermogenvoor duurzame toegang. De vijftienkernfactoren zijn vervolgens geordend Figuur 2: Digital Preservation Infrastructure and Processesnaar urgentie en afname van risico op (Dollar, 2010)verlies van digitale informatie dieverwerkt zijn in het strategischstappenmodel.412.5.1 Opbouw van het stappenmodelHet stappenmodel bestaat uit drie delen. Deel A: Het bepalen van de ambitie van de organisatie. Deel B: Het veiligstellen van de digitale objecten. Deel C: Het duurzaam toegang bieden tot digitale informatie.38 Meijers, Stapsgewijs naar duurzame toegang, 49.39 http://www.digitaalallemaal.nl/?p=2061, (Blog van DEN)(geraadpleegd: 24-09-2011).40 Meijers, Stapsgewijs naar duurzame toegang, 42.41 Ibidem, 90. 25
  26. 26. Aangezien ik in mijn scriptieonderzoek juist dieper in ga op het duurzaam toegang bieden tot digitaleinformatie zal ik hier alleen stil staan bij Deel C van het stappenmodel. Het gehele stappenmodel is tezien in Bijlage 1.2.5.2 Deel C: Duurzaam toegang biedenIn deel A en deel B van het stappenmodel was het doel langdurig toegang te bieden tot digitaleinformatie. Om dit te bereiken moeten de gebruikers eenvoudig over de informatie kunnenbeschikken die voor hen relevant is. Bovendien moeten zij erop kunnen vertrouwen dat deinformatie die zij vinden, betrouwbaar is. Hierin spelen twee processen een belangrijke rol.Metadata van een digitaal object zijn nodig om het object te kunnen vinden, er toegang tot tekrijgen, het object betekenis te geven en de authenticiteit te kunnen bepalen.Veranderingen in de omgeving kunnen het digitale object in gevaar brengen als deze niet constant inde gaten worden gehouden, zodat men ziet of de digitale objecten of de collectiebeheerssystemenaangepast moeten worden.Bovenstaande is schematisch weergeven in figuur 3. Hierin zijn ook een aantal kernfactoren van hetvolwassenheidsmodel van Charles M. Dollar terug te zien.Figuur3: Deel C van het stappenmodel Enno Meijers.Stap 1 – duurzame toegangDe eerste stap in dit deel is bedoeld om planmatig vast te stellen op welke manier de gebruikersinformatie moeten kunnen vinden en gebruiken. Welke vorm van ‘ontsluiting’ is het meest geschiktvoor de beoogde doelgroep? Welke maatregelen zijn er nodig om de duurzaamheid tewaarborgen?42StrategyHet antwoord op deze vragen kan worden verkregen door een plan voor duurzame toegang op testellen dat als leidraad dient bij het verder concretiseren van de stappen om duurzame toegang totdigitale informatie te vergroten. Het ‘Acces Plan’, ‘Data Plan’ en ‘Preservation Plan’ van PLATTER kanhierbij gebruikt worden als voorbeeld van een dergelijk plan. Ook het stappenplan van42 Ibidem, 60. 26
  27. 27. Expertisecentrum DAVID haakt hier op in.4343 Ibidem, 61. 27
  28. 28. Designated CommunityVanuit het perspectief van de gebruiker is het aan te raden om de informatie aan te bieden op basisvan open standaarden, eenvoudig doorzoekbaar en met zo weinig mogelijk drempels.Gebruikers verwachten steeds sneller informatie te kunnen vinden. Zij gaan niet meer naar deinformatie op zoek, maar er wordt verwacht dat de informatie naar hen komt. Informatie moetbeschikbaar zijn op de plaatsen waar de gebruiker vaak komt. Google en allerlei verschillende ‘SocialMedia’ zijn hier een goed voorbeeld van.AccessDe aard van het object en het gebruikersdoel bepaald welke beschrijvende metadata aan het digitaleobject toegevoegd moeten worden. Naast de beschrijvende metadata zijn er nog een aantal anderesoorten metadata die belangrijk zijn voor duurzame toegang tot digitale informatie. Hierover meer instap 2: beheer van metadata.Open StandardsOm veranderingen in de technologie, in productieprocessen van producenten of veranderingen in decontext van de gebruikers op te vangen is het een goede keuze om open standaarden en open sourcesoftware toe te passen. Hierop wordt ingegaan in stap 3: de veranderende omgeving.44Stap 2 – Beheer van metadataHet beheer van metadata komt duidelijk terug in het OAIS-model. De data-beheer functie van hetmodel definieert vijf verschillende soorten metadata die een rol spelen bij duurzame opslag entoegang tot digitale informatie.45 Referentie metadata Context metadata Onveranderbaarheid (‘fixity’) Herkomst (‘provenance’) Toegang (‘access’)Wat is nu precies kenmerkend aan deze verschillende soorten metadata?ReferentiemetadataHet OAIS-model beschouwt ‘beschrijvende’ metadata als referentie metadata. Dit zijn metadata dieeen beschrijving geven van een bibliografie, object en/of archief.Onder dezelfde noemer schaart het OAIS-model ook de zogenaamde ‘persistent identifier’. Dit soortreferentie metadata zorgt voor duurzame adressering van het Archief Informatie Pakket (AIP).Verwijzingen kunnen op deze manier een lange tijd geldig blijven. Welke ‘persistent identifier’gebruikt dient te worden in de culturele erfgoedsector is nog een punt van discussie.De realisatie van een duurzame verbinding tussen het digitale object en haar beschrijvende metadatais niet eenvoudig. Het OAIS-model ziet deze twee elementen als onderdelen van het Archief44 Ibidem, 61.45 Ibidem. 28
  29. 29. Informatie Pakket (AIP). De huidige collectiebeheerssystemen voorzien echter nog niet in dezedenkwijze dat er een ondeelbare koppeling is tussen het digitale object en haar beschrijvendemetadata. In afwachting van verdere ontwikkelingen in de komende jaren is het raadzaam om metperiodieke controles de vindbaarheid te bewaken van zowel de metadata als de objecten en van derelaties onderling daartussen.46Metadata ten behoeve van authenticiteitZoals men door de jaren heen wijs is geworden, zo weet men ook dat digitale informatie kwetsbaaren eenvoudig te manipuleren is. Men hecht daarom tegenwoordig veel waarde aan de authenticiteitvan het digitale object. Het aanbieden van openbare betrouwbare informatie sluit aan bij diebehoefte aan authenticiteit.47Voor het bewaren van de authenticiteit van het digitale object zijn twee aspecten belangrijk. Deonveranderbaarheid of te wel ‘fixity’ van het digitale object en herkomst (‘provenance’) van hetdigitale object.De ‘fixity’ van het digitale object geldt als een controle voor de authenticiteit. Om de authenticiteit tewaarborgen kan bijvoorbeeld een digitale ‘handtekening’ worden aangebracht. Deze wordt danregelmatig gecontroleerd op vervalsing.De ‘provenance’ van het digitale object vertelt meer over de wijzigingen aan het AIP in het verleden,die in het verleden hebben plaatsgevonden.Overige metadataEr zijn nog twee soorten metadata te benoemen. Een daarvan is in 2009 opgenomen in het OAIS-model.‘Context’ metadata worden door het Expertisecentrum DAVID als volgt omschreven: het beschrijvenvan de archiefvormer, het beschrijven van het werkproces waarbinnen het document een rol/functievervulde, en het documenteren van de relatie met archiefbestanddelen en andere documenten.48Een nieuwe soort metadata die in het OAIS-model benoemd wordt, is de ‘access rights’ metadata.Deze soort metadata beschrijft de voorwaarden waaronder het materiaal bewerkt mag worden voorduurzame opslag en opgevraagd mag worden door de gebruiker. Deze toegangsrechten wordenbepaald bij de opname van het digitale object in het AIP.49Zoals bij de ‘persistent identifier’ al duidelijk werd is er in veel collectiebeheerssystemen nog geenruimte om ook de bijbehorende metadata van het digitale object op te nemen. Het koppelen enbeheren van de metadata aan het digitale object is nog een lastige opgave, net als het bewaken vande authenticiteit. Dit vormt voor culturele erfgoedinstellingen een grote uitdaging. De juiste softwaredie in staat is de metadata en het digitale object te koppelen bestaat nog niet. De bestaandesoftwaresystemen zijn geënt op opslag en archivering. Het accent ligt niet op het bieden van toegangtot digitale informatie.46 Ibidem, 62.47 Ibidem, 63.48 Ibidem, 64.49 Ibidem. 29
  30. 30. Toch dient de relatie tussen metadata en object behouden te worden. Desnoods in een aparteadministratie. De volgende ‘tips’ zouden kunnen bijdragen aan het beheren van de metadata. Eén mogelijkheid is het noteren van de metadata in XML-documenten. Dit gebeurt ook al met het digitale object. Dit zou het eenvoudiger maken de duurzame relaties tussen het digitale object en de bijbehorende metadata te beheren. Zorg ervoor dat de metadata van het digitale object onder dezelfde omstandigheden wordt opgeslagen en beheerd als het digitale object. Bij voorkeur worden deze twee ook in dezelfde opslagplaats beheerd. Tenslotte is het verstandig een collectiebeheersysteem te gebruiken dat in staat is om alle data in een open formaat te exporteren zonder tussenkomst van de leverancier. Zorg er in ieder geval voor dat de broncode van de software altijd beschikbaar blijft in de toekomst.Stap 3: de veranderende omgevingDe IT-technologie is voortdurend aan verandering onderhevig.Het belangrijkste doel van duurzame toegankelijkheid is het leesbaar houden van de informatie. Hetleesbaar kunnen houden van de digitale informatie is gekoppeld aan het bekend zijn met dedefinities van de gebruikte formaten.Om het risico te verkleinen dat binnen een organisatie niemandmeer bekend is met de gebruikte formaten en software, kanbesloten worden de digitale objecten tijdig te migreren naar eenander formaat. Hierbij gaat de voorkeur uit naar formaten diegebaseerd zijn op open standaarden. Zij hebben een duurzaamkarakter omdat de formaatdefinities algemeen beschikbaar zijn. Zeworden breder ondersteund en kunnen vaak door meerderesoftwareprogramma’s gelezen worden.50 Figuur 4: Open Standaarden,Een ander risico dat ingedekt kan worden is de kans dat een Open Sourcesoftwareleverancier failliet gaat en het collectiebeheerssysteemmet hem ten onder gaat. Wanneer men gebruik maakt van open source software zal de broncodevan de software altijd beschikbaar blijven en is de instelling niet afhankelijk van desoftwareleverancier. Een handig bijkomend element is dat open source software deformaatdefinities ook documenteert dankzij de broncode.Daarom is het voor de duurzame toegang tot digitale informatie wenselijk zo veel mogelijk gebruik temaken van open standaarden en open source software.Naast deze technische ontwikkelingen dient er ook rekening gehouden te worden met veranderingenbinnen de organisatie. Denk hierbij aan de doelgroep, maar ook aan de producenten van digitaleinformatie.5150 Ibidem, 65.51 Ibidem, 66. 30
  31. 31. Tot zover Deel C: duurzaam toegang bieden. Dit deel van het stappenmodel van Enno Meijers vormteen aanleiding om Linked (Open) Data te introduceren als technologische verandering van deomgeving in hoofdstuk 4. Maar eerst zal ik de context waarin Linked (Open) Data thuis hoortscheppen in hoofdstuk 3.3 Ontwikkelingen van het WebIn de afgelopen twintig jaar heeft het Web een aantal grote ontwikkelingen doorgemaakt. Wekennen allemaal de termen: Internet, social media, web 1.0 en web 2.0. Deze woorden duidenallemaal op deze ontwikkelingen van het Web. De laatste ontwikkeling binnen het Web is hetSemantisch Web.3.1 Wat is het Web?Met het Web wordt het World Wide Web bedoeld. Dit is een applicatie of dienst die gebruik maaktvan het Internet. In tegenstelling tot wat veel mensen denken is het Web iets anders dan hetInternet.InternetHet internet is het mondiale netwerk van aan elkaar gekoppelde computers. Het wordt gebruikt voorhet versturen van informatie in pakketvorm (applicatie). Ieder netwerk bestaat uit computers dieverbonden zijn via kabel of radioverbindingen. 52 Op dit systeem draaien vele applicaties of diensten.Het World Wide Web is hier een van. Andere bekende applicaties zijn: 53 E-mail, VoIP, FTP, UseNetHet Internet bestond en werkte al in de jaren zeventig. Het Internet werkt volgens twee zogenaamdeInternetprotocollen. Internet Protocol (IP) en Transmission Control Protocol (TCP).Verschillendecomputers in diverse computernetwerken kunnen via de afspraken in deze Internetprotocollen metelkaar communiceren, waardoor een wereldwijd netwerk ontstaat.54Het Web is een dus een applicatie of dienst die via het Internet functioneert. Het is een collectie vangeschreven documenten en andere bronnen, die worden verbonden door hyperlinks en URL’s dieverzonden zijn door Web-browsers en Web-servers.Hoe is het World Wide Web ontstaan?Het World Wide Web zoals wij dat nu kennen vindt zijn oorsprong in 1990. Het werd ontwikkeld door52 Tim Berners-Lee, De wereld van het World Wide Web. Het oorspronkelijke ontwerp en de uiteindelijkebestemming van het World Wide Web, beschreven door zijn uitvinder, (Amsterdam: 2000), 18-19 + 222.53 http://nl.wikipedia.org/wiki/Internet (Internet) (geraadpleegd: 25-08-2011).54 Berners-Lee, De wereld van het World Wide Web, 18-19 + 222. 31
  32. 32. Tim Berners-Lee. Het Web werd uitgevonden met de bedoeling om kennis en gegevens inzogenaamde datasets uit te wisselen tussen wetenschappers verspreid over de wereld.Tim Berners-Lee had de intentie om een Web te creëren dat vroeg om de participatie van haargebruikers. Hij verwachtte in drie maanden een Web te ontwikkelen waarin de gebruikers alleencontent konden afnemen en binnen acht maanden konden deze zelfde gebruikers ook zelf contenttoevoegen aan het Web.Dit gebeurde echter niet. Men kon alleen maar gelinkte documenten lezen. Het Web werd vrijeenzijdig gebruikt. Er werd informatie gepubliceerd die door gebruikers werd geconsumeerd. Menkon dus alleen lezen wat op dat moment beschikbaar was.Het Web waarin content werd aangeboden die enkel geconsumeerd kon worden ontwikkelde zichtien jaar voordat gebruikers hun content ook in het Web konden plaatsen. We hebben het hier danover gebruikers zonder technologische kennis.Standaarden World Wide WebTim Berners-Lee voegde twee al bestaande technologieën bij elkaar, namelijk: Internet, Hypertext.Internet is het overkoepelende netwerk van verschillende applicaties. En hypertext word gezien alseen document met verwijzingen naar andere documenten die in een klik van de muis ‘gevolgd’kunnen worden. Hieruit ontwikkelde hij drie essentiële technologieën. Hij bedacht het communicatieprotocol HTTP, de opmaaktaal HTML en het idee van een Web-adres URL. Alle drie deze standaardenworden tegenwoordig nog steeds gebruikt en vormen samen de ruggengraat van het Web. 553.2 Het DNA van het WebTegenwoordig heeft vrijwel iedereen toegang tot het Web. Doordat er zoveel gebruikers zijn is hetWeb zich gaan ontwikkelen. De ontwikkeling van het Web kent een aantal kenmerken.De ontwikkeling van het Web is grof in te delen in drie periodes van ± tien jaar, ook wel generatiesgenoemd: 1990-2000 World Wide Web 2000-2010 Social Web 2010-... Semantisch WebWat zijn nu de belangrijkste kenmerken van deze zogenaamde generaties van het Web? Door welkevaak innovatieve ontwikkelingen zijn zij ontstaan?55 Gesprek met Victor de Boer, postdoctoraal onderzoeker binnen de Web & Media Group aan de VrijeUniversiteit Amsterdam, 22-07-2011. 32
  33. 33. Volgens Nova Spivack - een prominente denker in het toekomstige Internet (met name SemantischWeb)- kennen deze generaties twee drijfveren, namelijk:56 Technologische drijfveer, Sociaal-economische drijfveer.Met technologie wordt bedoeld dat voornamelijk professionals zoals programmeurs en ingenieurseen rol spelen in deze innovatieve ontwikkelingen van het Web. De gebruikers spelen hier geen rol.In de jaren negentig werd het ‘Web’ uitgevonden door Tim Berners-Lee. Dit is een van de bekendstevoorbeelden van een technologische drijfveer.Het sociaal-economische aspect als drijfveer draait veel meer om de participatie van de gebruiker bijhet aanleveren van content. Social media toepassingen als Facebook en Twitter zijn een perfectvoorbeeld van het sociale aspect, dat wordt ondersteund vanuit economisch opzicht. De gunstigeeconomie zorgt ervoor dat rond 2000 bijna heel Nederland thuis een computer heeft en zich op hetinternet begeeft. De professionals hebben op dat moment niet meer het alleenrecht op hetpubliceren van content op het Web.Technologie en het sociale-economie kunnen dus worden gezien als de twee basisstrengen van hetDNA van de innovatie van het Web. Deze twee zijn nooit los van elkaar te zien, maar zijn elkaarstegenhanger. Er is altijd sprakevan een directe wisselwerkingtussen beide DNA strengen. 57Deze heeft ervoor gezorgd dater een ware evolutie op hetinternet gaande is, die als eensoort golfbeweging isontwikkeld.De ontwikkeling van het Webwas dus een puurtechnologische ontwikkelingvan professionals op het gebiedvan ICT. Er kwamenvoornamelijk ingenieurs enprogrammeurs bij kijken. De Figuur 5: Het DNA van web innovatie.gebruikers consumeerde deinformatie die zij toegespeeld kregen. Zij konden helemaal niet mee beslissen welke informatie tothun kwam. Achteraf gezien benoemen we deze ontwikkeling ook wel met het buzzwoord: ‘web 1.0’.3.3 Het ‘Social Web’Rond het jaar 2007 is het wat men noemt: het ‘Social Web’ ontstaan. Het Web werd inmiddels door56 http://www.frankwatching.com/archive/2009/01/05/web-webber-webst-van-10-naar-30%E2%80%A6-en-verder/ (Onafhankelijk crossmedia platform)(geraadpleegd: 26-08-2011)57 http://www.frankwatching.com/archive/2009/01/05/web-webber-webst-van-10-naar-30%E2%80%A6-en-verder/ (Onafhankelijk crossmedia platform)(geraadpleegd: 26-08-2011) 33
  34. 34. miljoenen mensen gebruikt. Al deze gebruikers van het Web creëerden een nieuw inzicht. Menontdekte dat de huidige infrastructuur van het internet ook gebruikt kon worden om iets van deconsument terug te krijgen.58InteractiefActief is het woord van het ‘Social Web’. De infrastuctuur van het Web verandert vaneenrichtingsverkeer naar tweerichtingsverkeer. De gebruiker kan interactief zijn met het Web.58 Ivo Zandhuis, ‘Fundamenten in verandering: archieven op het semantisch web’, Archievenblad, (mei 2010), 1. 34
  35. 35. In de vorm van ‘Social Media’, wordt er interactief deelgenomen aan het Web: Social tagging, Weblogs, Delen van foto’s, Reageren op elkaars berichten/foto’s, Publiceren van content.De gebruiker consumeert nu niet alleen meer, maar produceert nu ook. Er ontstaat een zogenaamde‘prosumer’.In navolging van de technologische golfbeweging die de ontwikkeling van het Web was, speelt juisthet sociaal/economische aspect een rol bij de ontstaan van ‘het sociale Web’. Het ‘Social Web’ isgericht op de gebruiker, je ziet dat de technologie dan ook de functionaliteit volgt. Niet langer gaathet om de techniek van het Web, maar gaat het over een concept dat betrekking heeft op hetgebruik van webapplicaties door mensen. Het ‘Social Web’ is voor de zelfstandige activiteit van hetpubliek.59Toen het tweerichtingsverkeer eenmaal op gang was, verspreidde het ‘Social Web’ zich als eenlopend vuurtje. Verschillende zogenaamde ‘Social Media’ als Twitter, Facebook, Hyves etc. kwamenop en men nam hieraan deel. Het succes van het ‘Social Web’ is volgens Haustein en Pleumann tedanken aan twee factoren:60 Participeren op het Web was eenvoudig, De resultaten van de participatie op het Web werd direct zichtbaar voor de gebruiker.De drempel om te participeren binnen het ‘Social Web’ is erg laag. Participeren kan al door een kleinbeetje content te delen. Je kunt rustig de kat uit de boom kijken en later meer content toevoegen.Het gaat erom dat je participeert, dat je het tweerichtingsverkeer op gang houdt. Bovendien groeitde waarde van de content wanneer mensen content publiceren over datzelfe onderwerp.61 Hiergeldt het principe: the wisdom of the crowd. Al deze inspanningen op het Web zijn direct terug tezien en kunnen we als resultaat van onze inspanningen beschouwen. Dat zorgt voor een voldaangevoel. Jij draagt bij aan het Web.3.4 Het Semantisch WebDe term Semantisch Web is niet nieuw. Deze is al in de jaren ‘90 geïntroduceerd. In tegenstelling tot -wat men inmiddels aanduidt met de buzzwoorden web 1.0 en web 2.0, is het geen menselijkeinterface, waarbij het gaat om de presentatie van de informatie die gericht is op mensen en waarbijtekst, grafische vormgeving en usability van belang zijn.59 Zandhuis, ‘Fundamenten in verandering: archieven op het semantisch web’, 2.60 Seamus Ross, ‘Position Paper’, DigiCULT Thematic Issue 3 – Towards a Semantic Web for Heritage Resources,(Oostenrijk: 2003), 9.61 Ross, ‘Position Paper’, 10. 35
  36. 36. Het Semantisch Web is een computerinterface. In 2007 beschreef Christine Karman het SemantischWeb als volgt: Web 3.0, het semantisch web, onderscheidt zich van het huidige www doordat er structuur in is aangebracht en doordat aan alle stukjes informatie meta-informatie is gekoppeld die automatische interpretatie mogelijk maakt. Het woordt semantiek wordt gebruikt omdat als het ware de betekenis van een woord, of van een stukje informatie, is mee-opgeslagen met het woord zelf. Dat maakt het navigeren op het web eenvoudiger, niet alleen voor ons mensen maar met name voor systemen. Informatiesystemen ‘begrijpen’ immers niet wat ze lezen, maar in het semantisch web wordt een deel van dat begrip als het ware meegeleverd, waardoor een systeem de informatie een beetje kan ‘begrijpen’.62Tim Berners-Lee had met de ontwikkeling van het World Wide Web eigenlijk een Semantisch Webvoor ogen. Hij wilde een datamodel ontwikkelen dat een informatiestructuur herbergt dat over degrenzen van de individuele instellingen heen gaat. Na ongeveer twintig jaar lijkt het er dan nu tochvan te komen. Ik zeg expliciet lijkt, want er zijn nog steeds een hoop ontwikkelingen gaande en nogniet iedereen is blij met het Semantisch Web zoals het nu is.Hoe werkt het?De sleutel tot het realiseren van de visie van het Semantisch Web is semantische interoperabiliteitvan de Web-resources.63 Om deze werkelijkheid te laten worden dient er een grote omslag plaats tevinden in de manier waarop data, informatie en kennis nu zijn gerepresenteerd op het Web.BegrippenkaderOm de visie van het Semantische Web te verduidelijken zal ik hier eerst de twee belangrijkstebegrippen beschrijven die deze visie ondersteunen. Semantiek se - man` tiek («Frans«Grieks) de -woord (vrouwelijk) taalkunde leer van de betekenis en betekenisveranderingen64 Interoperabiliteit is de eigenschap van systemen en software om data uit te wisselen met externe systemen via een gemeenschappelijke set procedures.65De huidige situatie op het Web laat te veel content zien die niet tot nauwelijks beschreven is om metelkaar in verband gebracht te kunnen worden. Hierdoor wordt deze content informatie nietgevonden en hergebruikt. Wanneer deze volgens de principes van het Semantisch Web zouden zijnontsloten, zouden geautomatiseerde gegevensverwerkingsprogramma’s de informatie kunnenvinden, interpreteren en hergebruiken.6662 www.sync.nl/web-30/, (Definitie Semantisch Web van Christine Karman)(geraadpleegd: 14-06-2011)63 Geser Guntram, ‘A Cultural Heritage Semantic Web Example & Primer’, DigiCULT Thematic Issue 3 – Towardsa Semantic Web for Heritage Resources, (Oostenrijk: 2003), 3.64 http://www.encyclo.nl/begrip/semantiek (Semantiek)(geraadpleegd: 27-09-2011)65 http://www.den.nl/thema/10/interoperabiliteit (Interoperabiliteit)(geraadpleegd: 27-09-2011)66 Ross, ‘Position Paper’, 7. 36
  37. 37. Dit kan worden gerealiseerd door beschrijvende metadata aan de informatie en de resources toe tevoegen. Vervolgens dient de content en de metadata op een gestructureerde en consistente manieraangeboden te worden op het Web om een intelligenter Web te ondersteunen.67Het Semantisch Web wordt wel gepresenteerdals een zeer complexe en uitgebreide visie vaneen intelligent web. Dit is terug te zien in figuur 2.In de layer-cake is te zien hoe de meer semantischelagen van het Semantisch Web bouwen op mindersemantische.Het is zo complex vanwege de stappen die nodigzijn om een Semantisch Web mogelijk te maken.Elke stap kent haar eigen standaarden.Het transformeren van contentinformatieen metadata naar semantischeinteroperabiliteit gebeurd intwee fases.We onderscheiden desyntactische fase ende semantische fase. Figuur 6: Enabling technologies - layer cake.Het syntactische deel bestaat uit het onderste deel van de layer-cake. Het gaat hier om XML-documenten die een unieke naam en plaats hebben (URI).In de laag hierboven speelt het RDF-datamodel een rol. Het bouwt voort op XML en URI’s en bestaatuit subject-predicaat-objectrelaties (triples). Op deze manier wordt de layer-cake steeds meersemantisch. Standaarden die hier gebruikt worden zijn bijvoorbeeld Dublin Core, SKOS en FOAF.Het semantische deel begint bij het gebruiken van ontologieën. Ik sta hier wat langer stil bij hetbegrip ontologie vanwege het feit dat ontologieën zijn bedoeld om de betekenis, oftewel desemantiek, vast te leggen van de concepten van de triples. De ontologieën maken het Websemantisch.OntologieEen ontologie is een triple die is bedoeld om uit te leggen hoe de computer de informatie kangebruiken.68Het is te vergelijken met het RDF-datamodel of een metadataschema.Er zijn een aantal standaardontologieën: RDFS, OWL,67 Ibidem, 7.68 Zandhuis, ‘Fundamenten in verandering: archieven op het semantisch web’, 2. 37
  38. 38. OWL2De ontologieën leggen steeds preciezer vast wat met de onderdelen van de triple wordt bedoeld. Erwordt bijvoorbeeld vastgelegd wat de relaties binnen een familie betekenen: De computer moet nu weten dat in een bepaalde stamboom de moeder niet altijd dezelfde persoon is. De moeder kan meerdere namen hebben. Dit is iets dat wij mensen weten, maar dat een computer ‘vertelt’ moet worden.Hier zijn de ontologieën o.a. voor, maar het wordt steeds complexer.Naarmate we ons meer in het bovenste deel van de layer-cake bevinden wordt de complexiteitgroter. Dit deel van de layer-cake omvat de visie van het Semantische Web. Omdat decomputerinterface steeds meer als een mens moet denken worden de betekenis systemen ooksteeds complexer. 69Door de complexiteit zijn er nog geen concrete goed functionerende praktijkvoorbeelden te noemendie de volledige Semantische Web visie dragen. Wat we wel zien in de praktijk is het Linked Dataprincipe van Tim Berners-Lee. Deze technologie is gebaseerd op de lagen van de layer-cake in figuur2, tot en met de ontologieën. Over Linked (Open) Data zal ik in hoofdstuk 4 meer vertellen.Er zijn dus drie web-generaties te onderscheiden. De drie generaties lopen als het ware parallel aanelkaar. Het ‘Social Web’ houdt niet op te bestaan na 2010. Het blijft parallel lopen met hetSemantisch Web. Ditzelfde geldt voor het World Wide Web, het is er nog steeds en kan niet als‘dood’ worden beschouwd nu het ‘Social Web’ en het Semantisch Web bestaan.7069 Gesprek met Victor de Boer, 08-09-2011.70 E-mailwisseling met Victor de Boer, 30-09-2011. 38
  39. 39. 4 Linked Open DataLinked (Open) Data wordt ook wel de praktijk van het Semantisch Web genoemd. Linked (Open) Datais een pragmatische manier om een praktische bijdrage te leveren aan het Semantisch Web.71Praktisch vanwege de toepasbaarheid van Linked (Open) Data.In dit hoofdstuk meer over de toepasbaarheid van Linked (Open) Data en de overeenkomsten tussendeze technologie en de beheersmaatregelen voor duurzame toegang tot informatie, zoalsbeschreven in Deel C van het strategische stappenplan van Enno Meijers.De termen waaruit Linked Open Data bestaat sluiten perfect aan op de erfgoedsector.Om te beginnen Data. Data is onze digitale informatie. Informatie die al jaren doorerfgoedinstellingen wordt verzameld en die de erfgoedsector een autoriteit van kennis in desamenleving maken.Open wijst naar de huidige tendens in de samenleving dat informatie van publieke instellingenopenbaar moet zijn: de open access beweging. Nu alleen gegoten in een ander jasje. Niet fysiek,maar digitaal. Deze openheid stimuleert het hergebruik van data. De informatie die we al jarenverzamelen.Linked wijst op waardecreatie met als gevolg meer betekenis. Dankzij het hergebruik worden ernieuwe koppelingen gemaakt en ontstaat er meer context. Wat uiteindelijk zorgt voor meerbetekenis.724.1 Wat is Linked (Open) Data?Linked (Open) Data is een nieuwe technologie die een intelligenter web ondersteunt. Tot nu toewerden bij het koppelen van informatie standaarden gebruikt voor de verpakking van de informatie.Linked (Open) Data koppelt informatie door middel van standaarden die gebruikt worden voor deinhoud van de informatie.73 In plaats van de buitenkant, de binnenkant dus.Op het Web worden documenten gekoppeld door links. Deze links hebben geen betekenis. Ze latenniet zien wat de relatie is tussen de twee documenten die gekoppeld zijn. Alleen dat er een relatie is.Je moet dus zelf uitzoeken wat de relatie tussen die twee documenten is.Bij Linked (Open) Data geldt het principe dat de relatie tussen twee documenten betekenisvol moetzijn. Die betekenis ontstaat door elk woord uit het Webdocument als concept uniek te maken en tebeschrijven in subject-predicaat-objectrelaties (triples). Een woord als bijvoorbeeld de stadAmsterdam is dan een concept dat meerdere relaties kan krijgen met andere concepten. Het subject,predicaat en object zijn dan dus ook concepten. Elk concept wint aan betekenis naarmate er meerbeschrijvingen aan gekoppeld worden. Op deze manier worden webdocumenten betekenisvol enworden zoekresultaten nauwkeuriger.74 Dat is de kracht van Linked (Open) Data.71 http://www.den.nl/thema/129/ (Linked Open Data) (geraadpleegd: 09-06-2011)72 http://www.den.nl/blog/bericht/3027 (DCL11: Autoriteit, hergebruik en betekenis van linked data)(geraadpleegd: 22-06-2011)73 http://digitaalduurzaam.blogspot.com/ (‘Linked Data’ – wat is dat nu eigenlijk precies?’)(geraadpleegd: 28-07-2011)74 http://www.den.nl/thema/129/ (Linked Open Data) (geraadpleegd: 09-06-2011) 39
  40. 40. Schematisch is dat als volgt weer te geven.75 X is de schilder van Y X is getrouwd met Z X is afkomstig uit WX, Y, Z en W zijn hierin de concepten. De relaties die tussen de concepten zijn beschreven zijnbetekenisvol, want ze vertellen hoe de concepten met elkaar verband houden.Om nauwkeurig te kunnen zoeken in de enorme hoeveelheid informatie op het Web is zoeken opbasis van betekenis onontkoombaar. Er is echter een probleem. De betekenis van mensen, dingen engebeurtenissen kan variëren. Mensen kunnen bedenken welke betekenis iets heeft, dankzij decontext. Computers kunnen dit echter niet. Linked (Open) Data is een techniek om machine-leesbarecontext te genereren.764.2 Wat is de meerwaarde voor de erfgoedsector?Wat is nu de meerwaarde van Linked (Open) Data en wat levert het op voor de erfgoedsector?Zoals hierboven al genoemd werd, koppelt Linked (Open) Data niet de verpakking, maar de inhoudaan elkaar.De belangrijkste meerwaarde van Linked (Open) Datavoor de erfgoedsector is voornamelijkinteroperabiliteit. Hiermee bedoelen we het kunnenkoppelen van objecten uit verschillende collecties enhet koppelen aan data die van buiten de culturelesector afkomstig zijn door middel van eengemeenschappelijke set procedures.77 De Europeanadatabase is hier een uitstekend voorbeeld van.Een andere meerwaarde is dat de zichtbaarheid van decollecties wordt vergroot. Voor zoekmachines geldt datzij beter in staat zijn de data te indexeren wanneerdata de Linked Data ‘standaard’ draagt. Er ontstaat demogelijkheid om met één zoekopdracht relevanteresultaten te vinden uit meerdere collecties, ook al isde informatie niet overal hetzelfde geschreven. Opdeze manier komt de informatie dus min of meer naarde gebruiker toe. De gebruiker hoeft niet meer zelfopzoek te gaan.78 Figuur 7: Logo Europeana.75 http://digitaalduurzaam.blogspot.com/ (‘Linked Data’ – wat is dat nu eigenlijk precies?’)(geraadpleegd: 28-07-2011)76 Ibidem.77 http://www.den.nl/thema/129/ (Linked Open Data) (geraadpleegd: 09-06-2011)78 http://digitaalduurzaam.blogspot.com/ (‘Linked Data’ – wat is dat nu eigenlijk precies?’)(geraadpleegd: 28-07-2011) 40

×