SlideShare a Scribd company logo
1 of 63
Download to read offline
Linked Open Data
Duurzaam voor de toekomst?




Annette Allaart – Afstudeeronderzoek

Reinwardt Academie – Cultureel Erfgoed

Oktober 2011
Colofon




    Dit werk is gelicenseerd onder een Creative Commons Naamsvermelding-NietCommercieel-
 GelijkDelen 3.0 Nederland. Bezoek http://creativecommons.org/licenses/by-nc-sa/3.0/nl/ om een
kopie te zien van de licentie of stuur een brief naar Creative Commons, 444 Castro Street, Suite 900,
                                Mountain View, California, 94041, USA.




Opleiding:                                                Amsterdamse Hogeschool voor de Kunsten
Faculteit:                                                                  Reinwardt Academie
Begeleider:                                                                      Gerdie Borghuis

Titel:                                                   Linked Data – Duurzaam voor de toekomst?
Auteur:                                                                            Annette Allaart
Studiejaar:                                                                                  2011
Datum:                                                                             5 oktober 2011



                                                                                                    2
Voorwoord
Voor u ligt een scriptie welke het resultaat is van een onderzoek naar de mogelijkheden van Linked
(Open) Data, om duurzame toegang tot digitale erfgoedinformatie te bevorderen. Deze scriptie
vormt het einde van mijn studie Cultureel Erfgoed aan de Reinwardt Academie.

Het schrijven van een scriptie zag en zie ik nog steeds als een hele uitdaging. Ik ben dan ook trots op
het eindresultaat. Trots vanwege de discipline die ik mijzelf heb moeten opleggen. Zelfstandig
onderzoek doen betekent dat je geen stok achter de deur hebt in de vorm van een organisatie waar
je het onderzoek uitvoert.
Ik ben ook trots op het aantal pagina’s waaruit deze scriptie bestaat. Hieruit blijkt dat ik wel degelijk
‘verhaaltjes’ kan schrijven. Iets wat ik tijdens het schrijven niet voor mogelijk hield. Ik schreef mijn
eerste hoofdstuk in steno..

Bij deze wil ik daarom mijn begeleider vanuit de Reinwardt Academie, Gerdie Borghuis, bedanken. Zij
heeft me geleerd hoe ik de lezer aan de hand moet nemen in mijn verhaal.
Graag wil ik ook Enno Meijers en Inge Angevaare bedanken. Zij hebben mij met hun brede kennis van
digitale duurzaamheid, geholpen meer vorm aan mijn onderzoek te geven. Victor de Boer bedank ik
voor het overdragen van zijn kennis van het Semantisch Web en Linked (Open) Data aan mij. Judith
van Gent van het Amsterdam Museum bedank ik voor een kijkje in de praktijk. Zonder jullie was ik
ongetwijfeld nog steeds verdwaald in de enorme hoeveelheid ingewikkelde informatie die er te
vinden is over digitale duurzaamheid en Linked (Open) Data.

Een scriptie schrijven is een proces. Dit proces had ik niet kunnen volbrengen zonder de hulp en
steun van familie, vrienden en huisgenoten. Dank jullie wel!




                                                                                                            3
Samenvatting
Digitale informatie is niet meer weg te denken uit onze kennissamenleving. In het hedendaagse leven
kan men niet meer zonder. Digitale duurzaamheid staat echter nog steeds in de kinderschoenen.

Duurzaamheid wordt voornamelijk gezien als veilige opslag van digitale objecten. Het duurzaam
toegankelijk houden van de digitale erfgoedinformatie wordt daarbij vergeten.

Het streven naar duurzame toegang tot digitale erfgoedinformatie is een grote uitdaging omdat er
drie soorten bedreigingen zijn die de risico’s op verlies van digitale informatie vergroten.

Deze afstudeerscriptie onderzoekt of het een mogelijkheid is de data in de collectiedatabase om te
zetten naar een Linked Open dataset, om zodoende duurzame toegang tot digitale erfgoedinformatie
te bevorderen.

Daarnaast is het doel een beeld te creëren wat Linked (Open) Data voor culturele erfgoedinstellingen
kan betekenen, hoe het werkt en wat het oplevert. Hierbij word het Amsterdam Museum als case-
study gebruikt. Zij zijn het eerste museum dat haar data in de collectiedatabase heeft omgezet naar
een Linked Open dataset.

Om duurzame toegang tot digitale erfgoedinformatie te bieden gaat dit onderzoek uit van het
strategische stappenmodel van Enno Meijers. Het stappenmodel bestaat uit drie delen. Het laatste
deel wordt gebruikt om de koppeling naar Linked (Open) Data te maken.

Linked (Open) Data wordt als de praktijk van het Semantisch Web gezien. Het Semantisch Web draait
om interoperabiliteit van de Web-resources. Door digitale objecten inhoudelijk aan elkaar te
koppelen ontstaat een betekenisvolle relatie.

Uit een analyse moet men tot de conclusie komen of Linked (Open) Data een mogelijkheid is om
duurzame toegang tot digitale informatie te bevorderen, of niet. De analyse vergelijkt de
beheersmaatregelen die worden geadviseerd in het derde deel van het stappenplan van Enno
Meijers met het Linked Data principe van Tim Berners-Lee.

Uit de analyse is gebleken dat er wel degelijk overeenkomsten zijn tussen deze twee thema’s. De
overeenkomsten hebben vooral betrekking op het toepassen van open standaarden ten behoeve van
metadata beheer en het signaleren van technologische veranderingen in de omgeving.

De volgende aanbevelingen zijn gedaan:

       Maak gebruik van de open standaard XML.

       Gebruik RDF/XML als schrijfwijze van het RDF-datamodel.

       Nader onderzoek naar de praktijk van deze conclusie.




                                                                                                   4
Summary

Digital information has become part of our knowledge society. In daily life, we cannot live without
digital information anymore. Despite of this all, digital preservation is still a new market. It’s only
twenty years old.

Digital preservation is primarily seen as safe storage of digital objects. Sustainable access to the
digital information is something the heritage institutions don’t think of. To achieve sustainable access
to the digital information is a real challenge. There are three kinds of threats which will increase the
risk to lose digital information.

This thesis examines whether it’s a possibility to convert the collection data to Linked Open Data,
thereby promote sustainable access to digital heritage information. Moreover it’s a purpose to
create a picture of Linked (Open) Data. What do cultural heritage institutions have to do with? How
does Linked (Open) Data work? What does Linked (Open) Data bring the cultural heritage
institutions?

The Amsterdam Museum is the first museum in the Netherlands who converted their collection data
to Linked Open Data. I will refer to The Amsterdam Museum as they are used as a case study.

To offer sustainable access to the digital heritage information this examination studied the strategic
model for digital preservation by Enno Meijers. This model consists of three parts. The last part will
be used to make the connection to Linked (Open) Data.

Linked (Open) Data is called the more operative way of the Semantic Web. The Semantic Web is all
about interoperability of Web resources. By linking the digital objects with their inside the Semantic
Web creates meaningful relationships.

An analysis should be to conclude Linked (Open) Data is an opportunity to promote
sustainable access to digital information or not. The analysis compares the preservation tools
recommended in the third part of the strategic preservation model by Enno Meijers to the principles
of Linked Data by Tim Berners-Lee.

The analysis showed that there are indeed similarities between these two themes. The similarities in
particular related to the use of open standards for metadata management and the identification
of technological changes in the environment.

The following recommendations were made:

        Use the Open Standard XML,

        Use RDF / XML as the serialisation of the RDF-data model,

        Make sure you evaluate.




                                                                                                          5
Inhoudsopgave

1 Inleiding en afbakening……………………………………………………………………………………………………….............9
                       Aanleiding………………………………………………………………………………………..........................................9
                       Hypothese………………………………………………………………………………………………...............................10
                       Onderzoeksvraag…………………………………………………………………………………………………..................11
                       Doelstelling...............................................................................................................................11
                       Afbakening................................................................................................................................11
                       Methode....................................................................................................................................12
2 Digitale toegankelijkheid...................................................................................................................14
2.1     Wat is digitale toegankelijkheid..............................................................................................14
           Digitale duurzaamheid............................................................................................................................14
2.2        Wat is het doel van digitale toegankelijkheid?.......................................................................15
2.3        Waarom is digitale toegankelijkheid belangrijk?....................................................................15
2.4        Obstakels en digitale toegankelijkheid...................................................................................16
           2.4.1 Veranderingen in de technologie en technische oplossingen.....................................16
                       Migratie.....................................................................................................................................17
                       Emulatie....................................................................................................................................17
                       Normalisatie..............................................................................................................................18
           2.4.2       Veranderingen in de omgeving, hoe verder?...............................................................18
                       Expertisecentrum DAVID...........................................................................................................18
           2.4.3       Veranderingen in de organisatie dankzij nieuw beleid................................................19
                       De BASIS....................................................................................................................................20
                       PLATTER.....................................................................................................................................21
                       Business Model Innovation........................................................................................................22
                       OAIS-model...............................................................................................................................22
2.5        Strategisch stappenmodel.......................................................................................................24
                       Volwassenheidsmodel...............................................................................................................25
           2.5.1       Opbouw van het stappenmodel..................................................................................25
           2.5.2       Deel C: Duurzaam toegang bieden...............................................................................26
                       Stap 1: duurzame toegang.........................................................................................................26
                       Stap 2: beheer van metadata.....................................................................................................27
                       Stap 3: de veranderende omgeving...........................................................................................29
3 Veranderingen van het Web...........................................................................................................30
3.1    Wat is het Web?.....................................................................................................................30
                       Internet......................................................................................................................................30
                       Hoe is het World Wide Web ontstaan?.....................................................................................30
                       Standaarden World Wide Web..................................................................................................31
3.2        Het DNA van het Web............................................................................................................31
3.3        Het ‘Social Web’.....................................................................................................................32
                       Interactief..................................................................................................................................32
3.4        Het Semantisch Web..............................................................................................................33
                       Hoe werkt het?..........................................................................................................................34
                       Ontologie...................................................................................................................................35


                                                                                                                                                                     6
4 Linked Open Data...............................................................................................................................37
4.1     Wat is Linked (Open) Data?.....................................................................................................37
4.2     Wat is de meerwaarde voor de erfgoedsector?......................................................................38
4.3     Hoe verhouden Linked (Open) Data en het Semantisch Web zich tot elkaar?......................39
4.4     Linked Data – Open Data – Linked Open Data........................................................................40
                       Linked Data...............................................................................................................................40
                       Open Data..................................................................................................................................40
                       Linked Open Data......................................................................................................................41
4.5        De technische aspecten van Linked (Open) Data....................................................................41
           4.5.1 Syntactische transformatie..........................................................................................41
                       XML............................................................................................................................................41
                       Uniform Resource Identifier......................................................................................................42
                       HyperText Transfer Protocol......................................................................................................42
           4.5.2       Semantische transformatie..........................................................................................42
                       Triple..........................................................................................................................................43
                       Resource Description Framework..............................................................................................43
4.6        Linked (Open) Data – wat nu?.................................................................................................45
                       Linked (Open) Data browser......................................................................................................45
                       Linked (Open) Data zoekmachines............................................................................................45
                       Linked (Open) Data applicaties..................................................................................................46
5 Linked Open Data in de praktijk........................................................................................................47
5.1     Aandacht voor Linked (Open) Data.........................................................................................47
5.2     Aan de slag...............................................................................................................................47
        5.2.1 ‘The Linking Open Data Project’...................................................................................48
        5.2.2 Amsterdam Museum als Linked Open Data.................................................................48
                      Wat levert het op?.....................................................................................................................49
                      Nadelen.....................................................................................................................................49
                      Europeana.................................................................................................................................50
                      Apps for Amsterdam..................................................................................................................50
                      Tot slot………………………………………………………………………………………………………………………………….50
       5.2.3 MultimediaN N9C Eculture Project..............................................................................51
       5.2.4 Europeana....................................................................................................................52
       5.2.5 Apps for Amsterdam....................................................................................................52
6 Conclusie en aanbevelingen..............................................................................................................53
                       Hypothese.................................................................................................................................53
                       Aanalyse stappenmodel Enno Meijers en Linked Data principe Tim Berners-Lee....................53
                       Referentie metadata.................................................................................................................54
                       ‘Fixity’ en ‘provenance’.............................................................................................................54
                       Het leesbaar houden van de informatie....................................................................................54
                       De behoefte van de gebruiker...................................................................................................55
                       Aanbevelingen...........................................................................................................................55
7 Geraadpleegde bronnen....................................................................................................................57
8 Afbeeldingenlijst................................................................................................................................59
A Strategisch Stappenmodel Enno Meijers..........................................................................................60
B Linked Open Data Cloud Diagram.....................................................................................................61




                                                                                                                                                                       7
1       Inleiding en afbakening
Deze scriptie behandelt de duurzame toegankelijkheid van digitale erfgoedinformatie en welke rol
Linked Data hierin kan spelen. Dit zijn twee grote thema’s die met elkaar in verbinding zullen worden
gebracht.

Aanleiding
Digitale informatie is niet meer weg te denken uit onze kennissamenleving. In het hedendaagse leven
kan men niet meer zonder. Het is een essentieel bestanddeel van onze kenniseconomie. In vrijwel
elke sector, publiek en privaat, speelt digitale informatie een grote rol van betekenis.

De instellingen binnen de culturele erfgoed sector zijn driftig aan de slag gegaan met digitaliseren
van hun collectie. Om mee te blijven doen in de kennissamenleving bieden zij laagdrempelig toegang
tot hun digitale informatie. Hiervoor zijn een aantal redenen te noemen1:

        Internet vereenvoudigt deelname van andere partijen aan informatieverspreiding.

        De instellingen proberen op deze manier hun meerwaarde in de kennissamenleving te
        behouden.

        De verschuiving van informatieschaarste naar informatieovervloed maakt deze instellingen
        niet meer de autoriteit op het gebied van kennis, bovendien zijn zij niet langer de
        toegangspoort tot de informatie.

Het digitaliseren staat dus wel degelijk hoog op de agenda. Digitale duurzaamheid staat echter nog
steeds in de kinderschoenen. Duurzaamheid wordt voornamelijk gezien als veilige opslag van digitale
objecten.2

Het streven naar duurzame toegang tot digitale erfgoedinformatie is dus een grote uitdaging, maar
het is ook een probleem dat nog geen twintig jaar oud is.
Informatie op traditionele dragers van papier is zonder schadelijke invloeden van buitenaf jaren
bruikbaar. Je moet alleen kunnen lezen en de taal begrijpen. Dit is niet het geval bij digitale
informatie. Digitale informatie kent drie soorten bedreigingen die de risico’s op verlies van digitale
informatie vergroten:

        Technologie

        Metadata

        Organisatie

In zijn master thesis Stapsgewijs naar duurzame toegang heeft Enno Meijers een strategisch
stappenmodel ontwikkeld om stapsgewijs de risico’s op verlies van digitale informatie te verkleinen.




1
  Enno Meijers, Stapsgewijs naar duurzame toegang. Onderzoek naar een strategisch stappenmodel voor
duurzame toegang tot digitale informatie in kleine en middelgrote erfgoedinstellingen. Thesis Master of
Business Informatics – Avans+ (Middelburg, april 2010), 11-12.
2
  Meijers, Stapsgewijs naar duurzame toegang, 38.

                                                                                                          8
Dit stappenplan is op te delen in drie delen waarin vijftien factoren worden beschreven om tot een
duurzame borging van digitale informatie te komen:

          Het bepalen van de ambitie van de organisatie.
          De digitale objecten veilig stellen.

          Het duurzaam toegang bieden.

In mijn onderzoek ga ik in op het derde deel van het stappenplan: het duurzaam toegang bieden.
Hierin komen de volgende factoren aan bod:

          Beschrijven van de doelen voor duurzame toegang.

          Metadata beheer.

          De veranderende omgeving.

Enno Meijers beschrijft in dit derde deel, over duurzame toegang bieden, de behoefte aan open
standaarden en open source software. Het toepassen van open standaarden en open source
software zouden de beste overlevingskansen bieden voor het duurzaam toegankelijk houden van
digitale informatie.

Hier haakt het tweede thema van deze scriptie op in. Linked (Open) Data is een nieuwe technologie
die een intelligenter Web ondersteunt, dat gebaseerd is op open standaarden. Het is een
ontwikkeling die in 2011 meer bekendheid kreeg door de Europeana database en de aandacht die de
grote instellingen als de Koninklijke Bibliotheek, Nationaal Archief, Digitaal Erfgoed Nederland en
Nationale Coalitie Digitale Duurzaamheid eraan gaven.

Op 13 mei vond het Dutch Culture Linked Open Data Event plaats in Haarlem. Hier verzamelde het
erfgoedveld van Nederland en België zich om meer over deze nieuwe technologie te weten te komen
en het gebruik ervan te bevorderen. Ook ik was van de partij, dit vormde het startschot voor mijn
scriptie.

Hypothese
Linked (Open) Data is een nieuwe praktijk van het Semantisch Web. Linked (Open) Data wordt ook
wel gezien als een pragmatische manier om een praktische bijdrage te leveren aan het Semantisch
Web.3 Praktisch vanwege de toepasbaarheid van Linked (Open) Data. In deze scriptie zie ik Linked
(Open) Data als een technologische verandering in de omgeving. Ik wil ik deze toepasbaarheid
koppelen aan het duurzaam toegang bieden tot digitale erfgoedinformatie. Is dit mogelijk en wat is
hiervoor nodig? Zijn er overeenkomsten tussen de Linked (Open) Data technologie en de
beheersmaatregelen voor duurzame toegang tot digitale informatie? Mijn veronderstelling is dat er
overeenkomsten zijn die het mogelijk maken de Linked (Open) Data technologie te gebruiken als
beheersmaatregel voor duurzame toegang tot digitale informatie.




3
    http://www.den.nl/thema/129/ (Linked Open Data) (geraadpleegd: 09-06-2011)

                                                                                                     9
Onderzoeksvraag
Het voorgaande resulteert in de volgende hoofdvraag:

Is Linked (Open) Data, als toepassing van het semantisch web, een mogelijkheid om digitale
erfgoedinformatie duurzaam toegankelijk te maken?

De bijbehorende deelvragen zullen het onderzoek meer diepte geven:

        Wat is digitale duurzaamheid?
        Wat is het maatschappelijk belang van het duurzaam toegankelijk maken van digitale
        (erfgoed) informatie?
        Welke mogelijkheden voor het duurzaam toegankelijk maken van digitale (erfgoed)
        informatie zijn er al?
        Wat is semantisch web?
        Welke ontwikkelingen zijn er vooraf gegaan aan het semantisch web?
        Wat is Linked Open Data (LOD)?
        Hoe verhouden LOD en het semantisch web zich tot elkaar?
        Door wie wordt deze toepassing van semantisch web al gebruikt?
        Wat zijn de voors/tegens van LOD als toepassing van semantisch web?
        Hoe werkt LOD?
        Welke stappen moeten doorlopen worden om van data LOD te maken?
        Is er een verschil tussen erfgoedinstellingen en niet-erfgoedinstellingen, in duurzaam
        toegankelijk maken van informatie?

Doelstelling
Mijn doelstelling is de erfgoedprofessional een duidelijk beeld te geven wat Linked (Open) Data is en
hoe het kan bijdragen aan duurzame toegankelijkheid van digitale erfgoedinformatie.

Afbakening
Aangezien duurzame toegankelijkheid even als Linked (Open) Data grote begrippen zijn, is het nodig
een afbakening te maken.

Dit onderzoek heeft plaatsgevonden binnen de publieke sector. Hierin worden drie terreinen
onderscheiden:4

        Wetenschap
        Overheid
        Cultuur en media

Binnen het cultuur en media terrein onderscheidt het ministerie van Onderwijs, Cultuur en
Wetenschap drie andere verdelingen:

        Media
        Letteren en bibliotheken
        Cultureel erfgoed


4
 Inge Angevaare ed., Toekomst voor ons digitaal geheugen. Duurzame toegang tot informatie in Nederland
(Den Haag: Nationale Coalitie voor Digitale Duurzaamheid, juli 2009), 15.

                                                                                                         10
Cultureel erfgoed is het gemeengoed van de Reinwardt Academie. Het omvat de musea,
monumenten, archeologie en archieven. Dit is ook het terrein waarin ik de duurzame
toegankelijkheid van digitale informatie bestudeer.

Na aangegeven te hebben welk terrein binnen de sector cultuur en media ik bestudeer, zal ik nu
duidelijk maken wat ik onder digitale (erfgoed) informatie versta.

Binnen de culturele erfgoedsector onderscheiden we drie verschillende soorten digitaal cultureel
erfgoed:

        Born-digital erfgoed materiaal, dit zijn objecten die van origine digitaal zijn. Het zijn
        erfgoedobjecten die niet van analoge objecten zijn afgeleid. Hierbij kun je denken aan
        bouwtekeningen die gemaakt zijn met behulp van CAD/CAM-programmatuur, e-
        maildossiers, games, verrijkte publicaties, tweets en websites.5
        Gedigitaliseerd erfgoed, hiervan kennen we twee soorten. 1. Gedigitaliseerd erfgoed dat het
        origineel heeft vervangen en nu als een digitaal substituut geldt. 2. Gedigitaliseerd erfgoed
        waarbij het fysieke origineel bewaard blijft.6
        Digitale informatie over erfgoed, hieronder vallen bijvoorbeeld beschrijvingen die zijn
        vastgelegd in collectie-informatiesystemen.7

In dit onderzoek laat ik born digital materiaal buiten beschouwing. Dit vanwege de complexiteit en
de ‘nieuwheid’ van het materiaal.
Wanneer ik het over digitale (erfgoed) informatie heb, bedoel ik hiermee gedigitaliseerd erfgoed
en/of digitale informatie over erfgoed.

Methode
Ik heb geprobeerd meer grip te krijgen op de twee begrippen: duurzame toegankelijkheid en Linked
(Open) Data, door eerst theoretisch onderzoek te doen, hierbij heb ik zowel literatuur als het
internet geraadpleegd. De belangrijkste bronnen die ik gebruikt heb zijn:

        Meijers, E., Stapsgewijs naar duurzame toegang. Onderzoek naar een strategisch
        stappenmodel voor duurzame toegang tot digitale informatie in kleine en middelgrote
        erfgoedinstellingen. Thesis Master of Business Informatics – Avans+ (Middelburg, april 2010).
        Angevaare, I. ed., Toekomst voor ons digitaal geheugen. Duurzame toegang tot informatie in
        Nederland (Den Haag: Nationale Coalitie voor Digitale Duurzaamheid, juli 2009).
        www.den.nl

Daarnaast heb ik met diverse mensen uit het werkveld gesproken. Ik heb ze gevraagd naar hun
mening en ervaring met digitale toegankelijkheid en Linked (Open) Data. Zoals ik al aangaf wordt
Linked (Open) Data als de ‘praktijk’ van het Semantisch Web gezien. Het Amsterdam Museum is de
eerste Nederlandse culturele erfgoedinstelling die deze ‘praktijk’ ook daadwerkelijk in praktijk heeft
gebracht. Zij hebben hun collectiedatabase als een Linked Open Dataset ontsloten. Ik ben bij het
Amsterdam Museum langs geweest om te weten te komen wat hun ervaringen zijn.




5
  M. Van der Graaf en G.J. Nauta, ‘Noodklok voor behoud van born-digital erfgoed’, Informatie Professional (04
/ 2010), 12-15.
6
  http://www.den.nl/bericht/2283 (Digitaal duurzame bewaartermijnen?) (geraadpleegd: 22-09-2011)
7
  Ibidem.

                                                                                                            11
In veel van de gesprekken met experts op dit gebied kwam naar voren hoe ambitieus mijn
onderwerp is. Het zijn twee grote thema’s die beide nog veel bestudeerd dienen te worden. Het was
dan ook erg moeilijk om me niet te verliezen in de complexiteit van voornamelijk het thema digitale
toegankelijkheid. Ik kom nog maar net kijken, terwijl sommige experts al tien jaar bezig zijn op dit
terrein en nog steeds niet alles weten. Toch verwacht ik met deze scriptie de brug tussen de technici
en de erfgoedprofessionals te slaan door op een begrijpelijke manier uit te leggen hoe digitale
toegankelijkheid en Linked (Open) Data met elkaar verweven zijn en wat zij voor elkaar kunnen
betekenen.




                                                                                                   12
2        Digitale Toegankelijkheid

Digitale toegankelijkheid gaat vanzelfsprekend samen met de komst van het digitale tijdperk.

2.1 Wat is digitale toegankelijkheid?

Met het ontstaan van het Internet in de jaren ’70, de komst van de eerste ‘personal computer’ in
1981 van IBM en de komst van het Web van Tim Berners Lee in 1991 veranderde er niet alleen veel
in positieve zin, maar ook in negatieve zin.
Het Web bijvoorbeeld, is een handig middel om informatie sneller op te vragen en te verspreiden.
Informatie sneller opvragen gebeurd door slimme ‘browsers’ op het Internet. Informatie verspreiden
gaat door webtoepassingen als virtuele tentoonstellingen. Deze voorbeelden kunnen allemaal
digitale technieken genoemd worden.

In de jaren tachtig van de vorige eeuw realiseerde men zich dat de opkomende digitale technieken
ook risico’s met zich mee brachten. Jeff Rothenberg benoemde de onderstaande technische
problemen8:

         De dragers (cd, dvd, floppy disk) hebben een beperkte levensduur, vaak niet meer dan vijf
         jaar.

         De informatie bestaat uit een op zichzelf betekenisloze ‘bitstream’, alleen met behulp van de
         juiste hardware-/softwarecombinatie kan die informatie tot leven gewekt worden.

         De betekenis kan alleen achterhaald worden als aan de ‘bitstream’ zelf contextinformatie is
         toegevoegd.

Deze risico’s vragen om oplossingen. Dit is echter niet eenvoudig. In tegenstelling tot papier dat
eeuwenlang in een constante (geklimatiseerde) omgeving bruikbaar kan worden gehouden, gelden
voor digitale informatie heel andere regels. Digitale informatie en haar dragers zijn niet
vanzelfsprekend geschikt voor bewaring op de lange termijn.

Met iedere nieuwe ontwikkeling van hard- en software zullen we de digitale informatie en hun
dragers moeten controleren of zij nog wel bruikbaar zijn. Dit gebeurd door de ‘bitstream’ te
controleren. Blijkt de ‘bitstream’ niet meer toegankelijk te zijn, dan moet er een passende oplossing
gevonden worden om de toegankelijkheid op de lange termijn te waarborgen. Deze controle van de
digitale informatie en haar dragers, vereist een continu proces van aandacht en zorg. We noemen dit
een streven naar digitale duurzaamheid.9

Digitale Duurzaamheid?
Een streven naar digitale duurzaamheid dus. Wat is dan digitale toegankelijkheid?
De Nationale Coalitie Digitale Duurzaamheid heeft in het rapportToekomst voor ons digitaal
geheugen aangegeven liever over duurzame toegang of duurzame toegankelijkheid te spreken dan


8
  Rothenburg, Jeff, ‘Ensuring the Longevity of Digital Information’, Scientific American, vol. 272, nr. 1 (1999) 24-
29.
9
  Angevaare, Toekomst voor ons digitaal geheugen, 23.

                                                                                                                 13
van digitale duurzaamheid. De reden die zij hiervoor geven is dat duurzame bewaring zonder
toegankelijkheid geen zin heeft.10

In mijn gesprek met Inge Angevaare (coördinator NCDD) gaf zij ook aan dat duurzame
toegankelijkheid bestaat uit twee delen:

        Het bewaren van het object voor de toekomst,

        Het op de lange termijn beschikbaar houden voor de gebruiker.

Ik sluit me aan bij de NCDD en zal in deze scriptie de term duurzame toegankelijkheid gebruiken.

2.2     Wat is het doel van digitale toegankelijkheid?

“Duurzaamheid opzich is nooit het doel” [Inge Angevaare, NCDD, 21-06-2011]11

Het doel van digitale toegankelijkheid is het langdurig bewaren van digitale informatie en
beschikbaar houden voor de gebruikers, zodat de digitale informatie (her)gebruikt kan worden in de
toekomst en men erop kan vertrouwen dat de informatie authentiek en betrouwbaar is.12

2.3     Waarom is digitale toegankelijkheid belangrijk?

In het hedendaagse leven kan men niet meer zonder digitale informatie. Digitale informatie is een
essentieel bestandsdeel van onze kenniseconomie. In vrijwel elke sector publiek en/of privaat speelt
informatie een rol van betekenis. Tegenwoordig spreken we zelfs van een informatieovervloed in
plaats van informatieschaarste. De publieke sector investeert in de productie en verwerving van
digitale informatie en wil deze langdurig toegankelijk houden.

Binnen de culturele sector wordt het belang van deze taak benadrukt door de Raad van Cultuur. Zij
wijzen op het belang van cultuurhistorie wat indirect het belang van digitale toegankelijkheid tot
digitale erfgoedinformatie onderstreept. In het beleidsstuk Innoveren, Participeren!, zeggen zij:

        ‘Een samenleving die vooruit wil, doet er verstandig aan óók achterom te kijken. Het verleden
        moet niet worden vergeten, maar opgepoetst en gebruikt. Zonder continuïteit raken we op
        drift en koersen we van het ene incident naar het volgende. Ons collectieve geheugen,
        waarvan belangrijke delen zijn opgeslagen in archieven, musea en bibliotheken, schept een
        onmisbare basis voor die continuïteit.’ [Innoveren, Participeren!, 2007, p.12]

De NCDD sluit zich hierbij aan door het volgende te zeggen:

        ‘Geschiedschrijving wordt in de toekomst onmogelijk als wij er anno 2008 niet voor zorgen
        dat digitale informatie over onze samenleving wordt bewaard.’13




10
    Ibidem, 13.
11
    Gesprek met Inge Angevaare, coördinator Nationale Coalitie Digitale Duurzaamheid, 21-06-2011.
12
   Ibidem, 12.
13
    http://www.ncdd.nl/digitaleduurzaamheid-inleiding.php (Inleiding in Digitale Duurzaamheid)(geraadpleegd:
4-07-2011)

                                                                                                          14
Digitaal Erfgoed Nederland, Kennisland en het Ministerie van OCW benadrukken in het rapport
Business Model Innovatie Cultureel Erfgoed juist de waardecreatie die toegang tot digitale collecties
brengt:

        ‘De digitale collecties vertegenwoordigen een grote potentiële economische                         en
        maatschappelijke waarde, mits ze optimaal toegankelijke worden gemaakt.’14

Naast deze redenen voor cultuurbesef en waardecreatie gelden er nog een aantal redenen die
voornamelijk van technologische en organisatorische aard zijn15:

        Erfgoedinstellingen investeren de laatste jaren fors in digitalisering van hun collecties.
        Duurzame toegankelijkheid van de digitale informatie waarborgt in zekere zin deze
        investering in digitalisering.

        Digitalisering van de collecties levert digitale reproducties van o.a. kwetsbare originelen.
        Deze hoeven dankzij de digitale reproductie niet vaak uit het depot gehaald te worden.
        Indirect zorgt duurzame toegankelijkheid van digitale informatie op deze manier ook voor
        duurzaamheid van het fysieke object.

2.4     Obstakels en digitale toegankelijkheid?

In paragraaf 1.1 zijn al kort de grootste risico’s die de toegankelijkheid tot digitale informatie
bedreigen, uiteengezet. Er zijn echter drie soorten bedreigingen te noemen met elk hun eigen
kenmerkende risico’s die de duurzame toegang tot digitale informatie in gevaar brengen. Hieronder
de drie soorten bedreigingen16:

        Veranderingen in de technologie;

        Veranderingen in de omgeving;

        Veranderingen in de organisatie.

Hoe vangen we deze risico’s en bedreigingen op en zorgen we ervoor dat de digitale informatie goed
bewaard en beheerd wordt?
Om de verschillende soorten bedreigingen van toegang tot digitale informatie te beperken kunnen
verschillende beheersmaatregelen worden gehanteerd. Deze kunnen betrekking hebben op de
technologie en/of beleid en organisatie. We noemen dit ook wel bewaarstrategieën.

Op de komende pagina’s worden de verschillende bedreigingen met hun bijbehorende (mogelijke)
bewaarstrategieën beschreven.

Deze beheersmaatregelen kunnen echter nog niet als DE oplossing worden gezien. De problematiek
van digitale toegankelijkheid tot digitale informatie is daarvoor nog te jong, nog geen twintig jaar
oud. Deze beheersmaatregelen proberen de risico’s en bedreigingen tot een minimum te beperken.



14
   M. De Niet, L. Heijmans en H. Verwayen e.a., Business Model Innovatie Cultureel Erfgoed, (Ministerie OCW:
z.pl. 2009), 6-7.
15
   http://www.den.nl/thema/16/digitale-duurzaamheid (Digitale Duurzaamheid) (geraadpleegd: 4-07-2011)
16
   Meijers, Stapsgewijs naar duurzame toegang, 13.

                                                                                                           15
2.4.1 Veranderingen in de technologie en technische oplossingen
Veranderingen in de technologie omvatte de risico’s die Jeff Rothenberg aangaf. Deze risico’s hebben
voornamelijk betrekking op het bewaren van de digitale informatie.

Digitale informatie bestaat uit enen en nullen (bitstream) die alleen betekenis krijgen wanneer deze
wordt afgespeeld op dezelfde combinatie van hard- en software. Dit zou niet een heel groot
probleem moeten zijn mits de voortdurende ontwikkeling van nieuwe hard- en softwareproducten
niet zo groot en snel was dat digitale informatie al na tien jaar onbruikbaar is. Wanneer een van de
twee of beide verouderen en de informatie niet meer leesbaar is, moet een oplossing worden
gevonden. Daarnaast speelt ook de beperkte houdbaarheid van digitale informatie dragers een rol.17

Omdat dit een technische zaak betreft, vraagt dit om een technische beheersomgeving.

Er zijn drie bekende technische bewaarstrategieën:

        Migratie,

        Emulatie,

        Normalisatie

Migratie
Bestanden worden overgezet van de ene hardwareconfiguratie of softwareapplicatie naar de andere.
Het bestand wordt dan niet meer als een bitstream opgeslagen maar in een formaat dat gangbaar en
geschikt is voor de toekomst.

Een goed voorbeeld is wanneer we een tekst hebben getypt op een computer met Windows 95
software en deze willen openen op onze nieuwe computer met de software Windows 2007. We
zullen dan eerst het Windows 95 bestand moeten converteren naar een Windows 2007 bestand,
voordat we het kunnen lezen. Anders kan de computer de bitstream niet meer ‘lezen’.

Migratie is gericht op het behoud van data, er zijn echter toch een aantal nadelen. Migratie moet
elke ± twee jaar herhaald worden om te voorkomen dat dit bestandsformaat ook niet verouderd en
niet meer toegankelijk is. Het leidt vaak tot verlies van informatie. De nieuwe software kan het
bestand niet meer ‘lezen’ zoals het was. Er kunnen kenmerken als inhoud, structuur, uiterlijk of
gedrag verloren gaan. Het verlies van informatie leidt uiteindelijk tot aantasting van de authenticiteit
van het bestand.18

Emulatie
Een andere manier om je digitale informatie te behouden voor de toekomst is emulatie. Volgens
sommige mensen is dit de enige mogelijkheid om de authenticiteit en integriteit van een digitaal
bestand op de lange termijn te behouden.19



17
   Angevaare, Toekomst voor ons digitaal geheugen, 11.
18
   http://www.nationaalarchief.nl/informatiebeheer-archiefvorming/-digitaal-
archiefmateriaal/bewaarstrategie%C3%ABn/migratie (Migratie) (geraadpleegd: 22-09-2011)
19
   http://www.nationaalarchief.nl/informatiebeheer-archiefvorming/-digitaal-
archiefmateriaal/bewaarstrategie%C3%ABn/emulatie (Emulatie) (geraadpleegd: 22-09-2011)

                                                                                                      16
Bij emulatie blijft het oorspronkelijke bestand, bestaande uit het besturingssysteem en de software
behouden. De bitstream wordt, in tegenstelling tot bij migratie, niet veranderd. Er wordt als het ware
een software ontwikkeld die een nieuwe computer kan laten functioneren als een ouder model. De
oorspronkelijke omgeving wordt dus nagebootst op een nieuwe computer.20




20
     Ibidem.

                                                                                                   17
Normalisatie
Dit is een techniek met als doel alle digitale informatie te converteren naar een zelfde
bestandsformaat. Deze methode wordt voornamelijk gebruikt wanneer er is besloten niet alle
bestandsformaten op te nemen in de digitale collectie.21

2.4.2 Veranderingen in de omgeving, hoe verder?
Niet alleen het bewaren van digitale informatie is belangrijk. We moeten de digitale informatie als
we ze teruglezen ook in een context kunnen plaatsen, zodat we de betekenis van de inhoud kunnen
begrijpen.

De ‘bitstream’ wordt pas informatie wanneer extra informatie over deze data beschikbaar is. Deze
extra informatie geeft betekenis aan de data. We noemen deze extra informatie: metadata. Op deze
manier wordt er context gecreëerd.

Het beheren van de relevante metadata van digitale informatie is weer een extra uitdaging.22 Hier
komt ook de problematiek rondom het beheren van de relevante metadata voor duurzaamheid aan
het licht:

           De digitale objecten en de metadata worden beheerd in omgevingen waar in beperkte mate
           sprake is van professioneel IT-beheer.

           Het beheer van metadata richt zich vrijwel uitsluitend op de inhoud; het vastleggen van
           metadata noodzakelijk voor duurzaam beheer zoals het registeren van gebruikte formaten,
           herkomst- of referentie informatie of het vastleggen van een digitale ‘handtekening’ bij de
           objecten krijgt weinig aandacht.

Dit deel van de problematiek van digitale toegankelijkheid is nog nauwelijks verkend. Enno Meijers
geeft aan dat de markt, om deze problematiek te verkleinen, nog niet ver genoeg ontwikkeld is. Hij
suggereert dat Digitaal Erfgoed Nederland deze markt kan ontwikkelen door hierin een sturende en
stimulerende rol te spelen. Daarnaast geeft hij aan dat het beheren van de relevante metadata voor
duurzaamheid ook op het terrein van inspelen op technologische veranderingen slaat.

In België hebben ze in 2009 een product op de markt gebracht om de problematiek van metadata
beheer voor duurzaamheid te verkleinen. Dit stappenplan ontwikkeld door Expertisecentrum DAVID
uit Antwerpen, bevat een tiental praktische richtlijnen om de risico’s die duurzame toegankelijkheid
van digitale informatie met zich meebrengt te verkleinen. Het focust zich voornamelijk op juist
software gebruik en metadata beheer.

Expertisecentrum DAVID
Het stappenplan van het expertisecentrum DAVID in Antwerpen is gebaseerd op de functionele
vereisten van digitale archivering en de bijbehorende maatregelen voor risicobeheer.




21
     Angevaare, Toekomst voor ons digitaal geheugen, 25.
22
     Meijers, Stapsgewijs naar duurzame toegang, 14.

                                                                                                     18
Digitaal archiveren wordt als een risicovol en kwetsbaar reconstructieproces gezien. Bij het bouwen
en beheren van een digitaal archief gelden daarom vijf terugkerende basisprincipes23:

1. Vermijd (externe) afhankelijkheden.
2. Vermijdt overbodige reconstructiestappen.
3. Pas risicospreiding en –beheer toe.
4. Pas normen en standaarden toe.
5. Documenteer de implementatie en het beheer.

Deze vijf basisprincipes vormen de basis voor de acties die voor elke stap worden uitgevoerd.

Deze tien stappen zijn verdeeld in drie groepen: Groep 1 houdt zich bezig met de keuze en inrichting
van de hard- en softwarearchitectuur. Groep 2 organiseert de functionaliteiten rondom leesbaarheid,
authenticiteit en integriteit. De laatste groep documenteert het digitaal archiveringssysteem24.


     1. Gebruik een betrouwbaar en beveiligd opslagsysteem en pas een adequaat beheer toe.
     2. Bewaar de metadata op een digitaal duurzame wijze.
     3. Voorzie een duurzame band tussen het document en zijn metadata.

     4. Registreer voor elk digitaal object metadata.
     5. Definieer en documenteer de essentiële eigenschappen van het originele document.
     6. Bewaar de leesbaarheid van de digitale documenten.
     7. Archiveer alle componenten die nodig zijn voor een getrouwe reconstructie van de
        documenten.
     8. Documenteer het beheer van de digitale documenten.
     9. Beschrijf de digitale documenten.

     10. Documenteer het digitale archief.


Dit stappenplan stelt iedere organisatie in staat een betrouwbaar digitaal archief op te stellen.

2.4.3 Veranderingen in de organisatie dankzij nieuw beleid
De langetermijnzorg van digitale informatie vraagt om continue aandacht en zorg. De laatste jaren
groeide het besef dat technische oplossingen niet voldoende zijn om de digitale risico’s die de
duurzame toegang tot digitale informatie in gevaar brengen te beheersen. Om technische
oplossingen te kunnen ontwikkelen en te implementeren zijn beleidsmatige en organisatorische
randvoorwaarden nodig.25 Er moeten strategische keuzes binnen de organisatie worden gemaakt die
een duurzaamheidstrategie implementeren. Deze strategische keuzes kunnen invloed hebben op de
hele organisatiestructuur.26




23
   Filip Boudrez, Een digitaal archief in 10 stappen, (Antwerpen: Expertise Centrum DAVID vzw, 2009), 1.
24
   Boudrez, Een digitaal archief in 10 stappen, 2.
25
   Angevaare, Toekomst voor ons digitaal geheugen, 25.
26
   Meijers, Stapsgewijs naar duurzame toegang, 15.

                                                                                                           19
Er zijn diverse soorten beleidsmatige en organisatorische randvoorwaarden gedefinieerd. De
    volgende pagina’s beschrijven bestaande beheersmaatregelen die gebruikt zijn als instrument voor
    beleidsontwikkeling.

    Tot instrumenten voor beleidsontwikkeling behoren De BASIS van Digitaal Erfgoed Nederland,
    “Planning Tool for Trusted Electronic Repositories – PLATTER” door het project Digital Preservation
    Europe (DPE) en Business Model Innovatie ontwikkeld vanuit het Ministerie van OCW.

    De BASIS
    De culturele erfgoed sector vind deze randvoorwaarden voornamelijk in ‘de BASIS voor
    Duurzaamheid’ van DEN.27

    Digitale toegankelijkheid op de lange termijn is een continu proces en begint al bij de creatie van het
    digitale bestand. De BASIS is een strategie waarin de technische- en ICT-infrastructuur
    beheersmaatregelen elkaar ontmoeten, die is gebaseerd op de kwaliteitscyclus van DEN en bestaat
    uit minimale eisen die elkaar in verschillende fasen opvolgen28.


Fase 1: beleid ontwikkelen
Iedere erfgoedinstelling die digitale informatie produceert moet denken aan een
duurzaamheidstrategie. Bij het opstellen van een duurzaamheidbeleid moet rekening worden
gehouden met vier aspecten:

-          Documentatie, het formuleren van een informatieplan.
-          Organisatie, de gehele organisatie is zich bewust van de betekenis van
           duurzaamheid
-          Middelen, er wordt budget gereserveerd.
-          Technische oplossing, welke systemen worden gebruikt? Eigen beheer ja/nee?

Fase 2: plannen maken
Er worden concrete plannen geformuleerd die gebaseerd zijn op het beleid om collecties te
digitaliseren en digitale informatie te beheren. Hieraan worden een aantal eisen gesteld:

-          Wat wordt bewaard? Er dienen selectiecriteria opgezet te worden.
-          Criteria voor bestandsformaten, welke bestandformaten worden opgenomen?
-          Uitvoerbare plannen, check-check-dubbel check.
-          Kennis van externe voorzieningen, kijk eens bij de buren, hoe doen zij het?




    27
       http://www.den.nl/pagina/217/standaarden_en_richtlijnen/ (DE BASIS voor digitale duurzaamheid)
    (geraadpleegd: 26-07-2011)
    28
       Ibidem.

                                                                                                          20
Fase 3: uitvoering
     Concrete oplossingen voor duurzame toegankelijkheid tot digitale informatie moet aan een
     aantal eisen voldoen:

     -       Kennisuitwisseling, er dient een aanspreekpunt binnen de organisatie te zijn.
     -       Referentiemodel, wanneer een eigen ‘repository’ wordt gemaakt dient die volgens het
             OAIS-model te zijn opgezet.

     Fase 4: evaluatie
     Wanneer een erfgoedinstelling duurzame toegang tot digitale informatie nastreeft dient een
     evaluatie plaats te vinden die aan een basiseis voldoet:

     -       Toetsing van een eigen ‘repository’ dient plaats te vinden met TRAC.


De BASIS voor Duurzaamheid bestaat nu twee jaar en zal in 2011 geëvalueerd worden en indien nog
aangepast.

PLATTER
Een ander goed werkende beleidsstrategie die duurzame toegang tot digitale informatie nastreeft is
de “Planning Tool for Trusted Electronic Repositories - PLATTER” [DPE, 2008].

Dit is een instrument ontwikkeld door het project Digital Preservation Europe. Het heeft als doel te
komen tot het formuleren van concrete, meetbare doelstellingen voor het digitaal archief.29

PLATTER richt zich op negen strategische plannen die samen een duurzaam beleid vormen ten
opzichte van toegang tot digitale informatie die in verband worden gebracht met de tien Core
Principles of Trust Repository Design30.


     1. Business Plan – Financiële planning, monitoring en planning.
     2. Acquistion Plan – Evaluatie beleid. Beheren van de relaties met aanbieders en andere
                          leveranciers.
     3. Staffing Plan – Aquisitie en onderhoud van relevante vaardigheden voor depotbeheer.
     4. Acces Plan – Toegangsbeleid. Beheren van gebruikersrelaties.
     5. Technical Plan – Doelen vaststellen voor hardware, software en netwerken.
     6. Data Plan – Specificatie van data en metadata van objecten, formaten en structuren voor
                    opname, opslag en verspreiding samen met de relevante transformaties en
                    mappings.
     7. Succession Plan – Beheren van contracten na verloop van het archief om digitale objecten te
                           behouden voor de toekomst.
     8. Disaster Plan – Reageren op veranderingen in het archiefsysteem.
     9. Preservation Plan – Erop toezien dat de toegang en bruikbaarheid van de digitale objecten in




29
     Meijers, Stapsgewijs naar duurzame toegang, 32.
30
     Statsbiblioteket, HATII ed., Repository Planning Checklist and Guidance, (Glasgow: HATII, 2008), 9.

                                                                                                           21
Business Model Innovatie
Als het om beleidsontwikkeling gaat, mag een Business Model niet vergeten worden. Ook niet bij
ontwikkeling van beleid voor duurzame toegankelijkheid tot digitale informatie. Het bieden van
duurzame toegang tot digitale informatie vraagt om financiële middelen. Voordat men investeert in
duurzame toegang moet duidelijk zijn wat de baten zijn van deze toekomstige investering.31

Het Business Model dat besproken wordt in Business Model Innovatie, Cultureel Erfgoed van DEN,
Kennisland en het Ministerie van OCW gaat uit van negen bouwstenen die in directe relatie tot elkaar
staan.32

     1. Propositie – Onderscheidend vermogen organisatie.
     2. Klant – Klant is koning.
     3. Distributie – Bepaald communicatie en ervaring klant.
     4. Relatie

     5. Opbrengsten – Bereidheid betaling klant. Volgt uit 4 voorgaande bouwstenen.

     6. Activiteiten – Om propositie te kunnen realiseren.
     7. Resources – Door organisatie zelf uit te voeren activiteiten.
     8. Partners – Uitbesteding activiteiten.

     9. Kosten – Kostenstructuur organisatie. Volgt uit bouwstenen 6 t/m 8.



In de vorige pagina’s hebben we stil gestaan bij beheersmaatregelen die betrekking hebben op het te
vormen beleid en de technologie die nodig is om de risico’s die de duurzame toegang tot digitale
informatie in gevaar brengen te verkleinen. Beleidsmatige- en technologische beheersmaatregelen
ontmoeten elkaar bij het inrichten van een stabiele interne infrastructuur. Het inrichten van een
stabiele interne infrastructuur is het derde aspect van duurzaam beheren. Dit derde aspect is nog
niet eerder genoemd als duurzaam beheersaspect, maar het kan als het ware als een sausje over de
technologische- en beleidsmatige beheersmaatregelen worden gegoten.

Duurzame toegang tot digitale informatie heeft o.a. te maken met interne infrastructuren. Wanneer
deze stabiel zijn, kan dit tot zo min mogelijk verlies van informatie leiden.33 Het voor vrijwel iedereen
bekende OAIS-model biedt een manier om een dergelijke stabiele interne infrastructuur binnen een
collectiedatabase op te zetten.

OAIS-model
Het “Open Archival Information System (OAIS) Reference Model” [CCSDS, 2009] is een model dat een
conceptueel begrippenkader introduceerde voor een architectuur voor duurzame toegang. Het is
algemeen geaccepteerd en wordt over de hele wereld gebruikt. Het werd in 2000 ontwikkeld door




31
   Meijers, Stapsgewijs naar duurzame toegang, 33.
32
   De Niet, Heijmans en Verwayen e.a., Business Model Innovatie Cultureel Erfgoed, 16-18.
33
   Meijers, Stapsgewijs naar duurzame toegang, 24.

                                                                                                       22
het Consultative Committee for Space Data Systems (CCSDS) van NASA. Tegenwoordig is het zelfs
een ISO-standaard (ISO 14721 [Lavoie, 2004]).34

Het OAIS-model draait
om het zogenaamde
‘Archive Information
Package’ (AIP).
Een digitaal object wordt
opgenomen in het
archief.
Alle digitale objecten
samen vormen het
Archive Information
Package.
Het doel van het archief
is dit AIP duurzaam
toegankelijk te houden.
Dit gebeurd aan de hand           Figuur 1: OAIS Functioneel Model
van de zes functies die in
figuur 1 zijn gekaderd. Hieronder worden ze verder toegelicht35.


     ‘ingest’
     Dit is het startpunt van het archiveringsproces. Het materiaal dat wordt aangeboden wordt
     beoordeeld op verschillende aspecten als kwaliteit, formaat en volledigheid die bepalen of
     het materiaal geschikt is voor opname in het archief.

     ‘storage’
     Bij deze stap wordt gekeken naar de opslag van het digitale object en de bijbehorende
     metadata. Het is een continueproces waarbij veel aandacht is voor de conditie van de
     opslagomgeving en de opgeslagen gegevens.

     ‘data management’
     De databeheer-functie zorgt voor de instrumenten voor het toekennen en onderhouden van
     alle metadata die nodig zijn voor het duurzaam beheer van het informatieobject. Dit gaat
     verder dan het alleen maar toekennen van metadata voor het ontsluiten; er is ook behoefte
     aan het vastleggen van formaattype, controlewaarden (‘fixity’), wijzigingshistorie
     (‘provenance’) en gebruiksvoorwaarden (‘access rights’).

     ‘access’
     Dit wordt ook wel de raadpleeg functie genoemd. Hier wordt gezorgd voor de vindbaarheid
     en het toegang geven tot het digitale object. Hierbij worden wel de voorwaarden die bij de
     opname functie zijn vastgesteld aangehouden. ‘Access’ en ‘data management’ staan in nauw
     contact met elkaar.


34
     Angevaare, Toekomst voor ons digitaal geheugen, 25.
35
     Meijers, Stapsgewijs naar duurzame toegang, 26.

                                                                                                  23
‘administration’
     De zogenaamde coördinatie van het beheer is een veelomvattende taak. Het bevat o.a.:
     -      bewaking van het opname proces,
     -      configuratie management voor hard- en software,
     -      proces monitoring,
     -      documenteren en rapporteren over de opgeslagen objecten,
     -      ontwikkelen en onderhouden archiveringsbeleid,
     -      ondersteunen gebruikers.

     ‘preservation planning’
     Deze functie verzorgt de evaluatie van het archief. Het speelt in op de veranderingen in
     technologie, of veranderingen van gebruikers en/of producenten. Op deze manier spoort men
     vroegtijdig eventuele risico’s op die kunnen optreden of kunnen de nodige aanpassingen aan
     het archief worden gemaakt.



De introductie van het OAIS-model heeft veel invloed gehad op de manier waarop men omgaat met
de problematiek rondom duurzame toegankelijkheid tot digitale informatie. Elke organisatie die
nadenkt over duurzame toegankelijkheid tot de digitale informatie van haar instelling, wordt geacht
de zes functies van het OAIS-model in haar beleid op te nemen.36

Naast deze beheersmaatregelen- die gebaseerd zijn op de drie aspecten van duurzaam beheren:
beleid, inrichting en technologie- zijn er natuurlijk nog tal van andere beheersmaatregelen. Dit zijn
echter de meest gehanteerde. Bovendien vormen deze beheersmaatregelen de basis voor het
stappenmodel dat Enno Meijers in zijn master thesis heeft ontwikkeld. Dit wil ik graag gebruiken in
deze scriptie om de koppeling naar het gebruik van Linked (Open) Data te leggen.

2.5        Strategisch Stappenmodel

Enno Meijers heeft een stappenmodel ontwikkeld dat kleine- en middelgrote culturele
erfgoedinstellingen in staat stelt aan de slag te gaan met de problematiek van duurzame
toegankelijkheid tot digitale informatie. Het stappenmodel kan gebruikt worden als een
ondersteunend middel bij het opstellen van maatregelen om de risico’s van verlies van digitale
informatie te beperken.37

De maatregelen raken aan veel gebieden binnen de organisatie van de culturele erfgoedinstellingen:

           Ontwikkeling beleid,

           Inrichting ICT-infrastructuur,

           Beheersprocessen.




36
     Angevaare, Toekomst voor ons digitaal geheugen, 25.
37
     Meijers, Stapsgewijs naar duurzame toegang, 30.

                                                                                                        24
Om die reden zijn veel van de in paragraaf 2.4 besproken beheersmaatregelen verwerkt in het
stappenmodel. We zien PLATTER, het OAIS-model en het stappenplan van Expertisecentrum DAVID
terug in het stappenplan van Enno Meijers.

“De toegevoegde waarde van het stappenmodel is het rangschikken van de stappen naar volgorde
van urgentie met als leidraad de vijftien elementen uit het volwassenheidsmodel van Dollar.”38

Volwassenheidsmodel
Het stappenmodel is gebaseerd op het volwassenheidsmodel van Charles M. Dollar.

Het volwassenheidsmodel van Dollar: “Digital Preservation Capability Maturity Model” is gebaseerd
op het bekende Capability Maturity Model Integration uit de IT, waarvan de basis in 1990 is
ontwikkeld. Charles M. Dollar is een pionier op het gebied van duurzame toegankelijkheid.39

Dit volwassenheidsmodel voor digitale duurzaamheid bestaat uit vijftien kernfactoren. Deze zijn
verdeeld in twee groepen.
De ene groep omvat de factoren die gaan over de infrastructuur van digitale duurzaamheid.
De andere groep bevat de processen die
nodig zijn om duurzame
opslag van en toegang tot digitale
informatie te realiseren.40

De essentie van een
volwassenheidsmodel is het inrichten
van een cyclisch proces van verbetering
om op deze manier een steeds hoger
kwaliteitsniveau te bereiken.

In het volwassenheidsmodel worden vijf
niveaus gedefinieerd voor het vermogen
voor duurzame toegang. De vijftien
kernfactoren zijn vervolgens geordend
                                             Figuur 2: Digital Preservation Infrastructure and Processes
naar urgentie en afname van risico op
                                             (Dollar, 2010)
verlies van digitale informatie die
verwerkt zijn in het strategisch
stappenmodel.41

2.5.1 Opbouw van het stappenmodel
Het stappenmodel bestaat uit drie delen.

        Deel A: Het bepalen van de ambitie van de organisatie.

        Deel B: Het veiligstellen van de digitale objecten.

        Deel C: Het duurzaam toegang bieden tot digitale informatie.
38
   Meijers, Stapsgewijs naar duurzame toegang, 49.
39
   http://www.digitaalallemaal.nl/?p=2061, (Blog van DEN)(geraadpleegd: 24-09-2011).
40
   Meijers, Stapsgewijs naar duurzame toegang, 42.
41
   Ibidem, 90.

                                                                                                           25
Aangezien ik in mijn scriptieonderzoek juist dieper in ga op het duurzaam toegang bieden tot digitale
informatie zal ik hier alleen stil staan bij Deel C van het stappenmodel. Het gehele stappenmodel is te
zien in Bijlage 1.

2.5.2 Deel C: Duurzaam toegang bieden
In deel A en deel B van het stappenmodel was het doel langdurig toegang te bieden tot digitale
informatie. Om dit te bereiken moeten de gebruikers eenvoudig over de informatie kunnen
beschikken die voor hen relevant is. Bovendien moeten zij erop kunnen vertrouwen dat de
informatie die zij vinden, betrouwbaar is. Hierin spelen twee processen een belangrijke rol.

Metadata van een digitaal object zijn nodig om het object te kunnen vinden, er toegang tot te
krijgen, het object betekenis te geven en de authenticiteit te kunnen bepalen.

Veranderingen in de omgeving kunnen het digitale object in gevaar brengen als deze niet constant in
de gaten worden gehouden, zodat men ziet of de digitale objecten of de collectiebeheerssystemen
aangepast moeten worden.

Bovenstaande is schematisch weergeven in figuur 3. Hierin zijn ook een aantal kernfactoren van het
volwassenheidsmodel van Charles M. Dollar terug te zien.




Figuur3: Deel C van het stappenmodel Enno Meijers.

Stap 1 – duurzame toegang
De eerste stap in dit deel is bedoeld om planmatig vast te stellen op welke manier de gebruikers
informatie moeten kunnen vinden en gebruiken. Welke vorm van ‘ontsluiting’ is het meest geschikt
voor de beoogde doelgroep? Welke maatregelen zijn er nodig om de duurzaamheid te
waarborgen?42

Strategy
Het antwoord op deze vragen kan worden verkregen door een plan voor duurzame toegang op te
stellen dat als leidraad dient bij het verder concretiseren van de stappen om duurzame toegang tot
digitale informatie te vergroten. Het ‘Acces Plan’, ‘Data Plan’ en ‘Preservation Plan’ van PLATTER kan
hierbij gebruikt worden als voorbeeld van een dergelijk plan. Ook het stappenplan van

42
     Ibidem, 60.

                                                                                                    26
Expertisecentrum DAVID haakt hier op in.43




43
     Ibidem, 61.

                                             27
Designated Community
Vanuit het perspectief van de gebruiker is het aan te raden om de informatie aan te bieden op basis
van open standaarden, eenvoudig doorzoekbaar en met zo weinig mogelijk drempels.
Gebruikers verwachten steeds sneller informatie te kunnen vinden. Zij gaan niet meer naar de
informatie op zoek, maar er wordt verwacht dat de informatie naar hen komt. Informatie moet
beschikbaar zijn op de plaatsen waar de gebruiker vaak komt. Google en allerlei verschillende ‘Social
Media’ zijn hier een goed voorbeeld van.

Access
De aard van het object en het gebruikersdoel bepaald welke beschrijvende metadata aan het digitale
object toegevoegd moeten worden. Naast de beschrijvende metadata zijn er nog een aantal andere
soorten metadata die belangrijk zijn voor duurzame toegang tot digitale informatie. Hierover meer in
stap 2: beheer van metadata.

Open Standards
Om veranderingen in de technologie, in productieprocessen van producenten of veranderingen in de
context van de gebruikers op te vangen is het een goede keuze om open standaarden en open source
software toe te passen. Hierop wordt ingegaan in stap 3: de veranderende omgeving.44

Stap 2 – Beheer van metadata
Het beheer van metadata komt duidelijk terug in het OAIS-model. De data-beheer functie van het
model definieert vijf verschillende soorten metadata die een rol spelen bij duurzame opslag en
toegang tot digitale informatie.45

           Referentie metadata

           Context metadata

           Onveranderbaarheid (‘fixity’)

           Herkomst (‘provenance’)

           Toegang (‘access’)

Wat is nu precies kenmerkend aan deze verschillende soorten metadata?

Referentiemetadata
Het OAIS-model beschouwt ‘beschrijvende’ metadata als referentie metadata. Dit zijn metadata die
een beschrijving geven van een bibliografie, object en/of archief.

Onder dezelfde noemer schaart het OAIS-model ook de zogenaamde ‘persistent identifier’. Dit soort
referentie metadata zorgt voor duurzame adressering van het Archief Informatie Pakket (AIP).
Verwijzingen kunnen op deze manier een lange tijd geldig blijven. Welke ‘persistent identifier’
gebruikt dient te worden in de culturele erfgoedsector is nog een punt van discussie.

De realisatie van een duurzame verbinding tussen het digitale object en haar beschrijvende metadata
is niet eenvoudig. Het OAIS-model ziet deze twee elementen als onderdelen van het Archief

44
     Ibidem, 61.
45
     Ibidem.

                                                                                                   28
Informatie Pakket (AIP). De huidige collectiebeheerssystemen voorzien echter nog niet in deze
denkwijze dat er een ondeelbare koppeling is tussen het digitale object en haar beschrijvende
metadata. In afwachting van verdere ontwikkelingen in de komende jaren is het raadzaam om met
periodieke controles de vindbaarheid te bewaken van zowel de metadata als de objecten en van de
relaties onderling daartussen.46

Metadata ten behoeve van authenticiteit
Zoals men door de jaren heen wijs is geworden, zo weet men ook dat digitale informatie kwetsbaar
en eenvoudig te manipuleren is. Men hecht daarom tegenwoordig veel waarde aan de authenticiteit
van het digitale object. Het aanbieden van openbare betrouwbare informatie sluit aan bij die
behoefte aan authenticiteit.47

Voor het bewaren van de authenticiteit van het digitale object zijn twee aspecten belangrijk. De
onveranderbaarheid of te wel ‘fixity’ van het digitale object en herkomst (‘provenance’) van het
digitale object.

De ‘fixity’ van het digitale object geldt als een controle voor de authenticiteit. Om de authenticiteit te
waarborgen kan bijvoorbeeld een digitale ‘handtekening’ worden aangebracht. Deze wordt dan
regelmatig gecontroleerd op vervalsing.
De ‘provenance’ van het digitale object vertelt meer over de wijzigingen aan het AIP in het verleden,
die in het verleden hebben plaatsgevonden.

Overige metadata
Er zijn nog twee soorten metadata te benoemen. Een daarvan is in 2009 opgenomen in het OAIS-
model.

‘Context’ metadata worden door het Expertisecentrum DAVID als volgt omschreven: het beschrijven
van de archiefvormer, het beschrijven van het werkproces waarbinnen het document een rol/functie
vervulde, en het documenteren van de relatie met archiefbestanddelen en andere documenten.48

Een nieuwe soort metadata die in het OAIS-model benoemd wordt, is de ‘access rights’ metadata.
Deze soort metadata beschrijft de voorwaarden waaronder het materiaal bewerkt mag worden voor
duurzame opslag en opgevraagd mag worden door de gebruiker. Deze toegangsrechten worden
bepaald bij de opname van het digitale object in het AIP.49

Zoals bij de ‘persistent identifier’ al duidelijk werd is er in veel collectiebeheerssystemen nog geen
ruimte om ook de bijbehorende metadata van het digitale object op te nemen. Het koppelen en
beheren van de metadata aan het digitale object is nog een lastige opgave, net als het bewaken van
de authenticiteit. Dit vormt voor culturele erfgoedinstellingen een grote uitdaging. De juiste software
die in staat is de metadata en het digitale object te koppelen bestaat nog niet. De bestaande
softwaresystemen zijn geënt op opslag en archivering. Het accent ligt niet op het bieden van toegang
tot digitale informatie.



46
   Ibidem, 62.
47
   Ibidem, 63.
48
   Ibidem, 64.
49
   Ibidem.

                                                                                                       29
Toch dient de relatie tussen metadata en object behouden te worden. Desnoods in een aparte
administratie. De volgende ‘tips’ zouden kunnen bijdragen aan het beheren van de metadata.

           Eén mogelijkheid is het noteren van de metadata in XML-documenten. Dit gebeurt ook al
           met het digitale object. Dit zou het eenvoudiger maken de duurzame relaties tussen het
           digitale object en de bijbehorende metadata te beheren.

           Zorg ervoor dat de metadata van het digitale object onder dezelfde omstandigheden wordt
           opgeslagen en beheerd als het digitale object. Bij voorkeur worden deze twee ook in
           dezelfde opslagplaats beheerd.

           Tenslotte is het verstandig een collectiebeheersysteem te gebruiken dat in staat is om alle
           data in een open formaat te exporteren zonder tussenkomst van de leverancier. Zorg er in
           ieder geval voor dat de broncode van de software altijd beschikbaar blijft in de toekomst.

Stap 3: de veranderende omgeving
De IT-technologie is voortdurend aan verandering onderhevig.

Het belangrijkste doel van duurzame toegankelijkheid is het leesbaar houden van de informatie. Het
leesbaar kunnen houden van de digitale informatie is gekoppeld aan het bekend zijn met de
definities van de gebruikte formaten.

Om het risico te verkleinen dat binnen een organisatie niemand
meer bekend is met de gebruikte formaten en software, kan
besloten worden de digitale objecten tijdig te migreren naar een
ander formaat. Hierbij gaat de voorkeur uit naar formaten die
gebaseerd zijn op open standaarden. Zij hebben een duurzaam
karakter omdat de formaatdefinities algemeen beschikbaar zijn. Ze
worden breder ondersteund en kunnen vaak door meerdere
softwareprogramma’s gelezen worden.50
                                                                        Figuur 4: Open Standaarden,
Een ander risico dat ingedekt kan worden is de kans dat een              Open Source
softwareleverancier failliet gaat en het collectiebeheerssysteem
met hem ten onder gaat. Wanneer men gebruik maakt van open source software zal de broncode
van de software altijd beschikbaar blijven en is de instelling niet afhankelijk van de
softwareleverancier. Een handig bijkomend element is dat open source software de
formaatdefinities ook documenteert dankzij de broncode.

Daarom is het voor de duurzame toegang tot digitale informatie wenselijk zo veel mogelijk gebruik te
maken van open standaarden en open source software.

Naast deze technische ontwikkelingen dient er ook rekening gehouden te worden met veranderingen
binnen de organisatie. Denk hierbij aan de doelgroep, maar ook aan de producenten van digitale
informatie.51



50
     Ibidem, 65.
51
     Ibidem, 66.

                                                                                                         30
Tot zover Deel C: duurzaam toegang bieden. Dit deel van het stappenmodel van Enno Meijers vormt
een aanleiding om Linked (Open) Data te introduceren als technologische verandering van de
omgeving in hoofdstuk 4. Maar eerst zal ik de context waarin Linked (Open) Data thuis hoort
scheppen in hoofdstuk 3.

3       Ontwikkelingen van het Web

In de afgelopen twintig jaar heeft het Web een aantal grote ontwikkelingen doorgemaakt. We
kennen allemaal de termen: Internet, social media, web 1.0 en web 2.0. Deze woorden duiden
allemaal op deze ontwikkelingen van het Web. De laatste ontwikkeling binnen het Web is het
Semantisch Web.

3.1     Wat is het Web?
Met het Web wordt het World Wide Web bedoeld. Dit is een applicatie of dienst die gebruik maakt
van het Internet. In tegenstelling tot wat veel mensen denken is het Web iets anders dan het
Internet.

Internet
Het internet is het mondiale netwerk van aan elkaar gekoppelde computers. Het wordt gebruikt voor
het versturen van informatie in pakketvorm (applicatie). Ieder netwerk bestaat uit computers die
verbonden zijn via kabel of radioverbindingen. 52 Op dit systeem draaien vele applicaties of diensten.
Het World Wide Web is hier een van. Andere bekende applicaties zijn: 53

        E-mail,

        VoIP,

        FTP,

        UseNet

Het Internet bestond en werkte al in de jaren zeventig. Het Internet werkt volgens twee zogenaamde
Internetprotocollen. Internet Protocol (IP) en Transmission Control Protocol (TCP).Verschillende
computers in diverse computernetwerken kunnen via de afspraken in deze Internetprotocollen met
elkaar communiceren, waardoor een wereldwijd netwerk ontstaat.54

Het Web is een dus een applicatie of dienst die via het Internet functioneert. Het is een collectie van
geschreven documenten en andere bronnen, die worden verbonden door hyperlinks en URL’s die
verzonden zijn door Web-browsers en Web-servers.

Hoe is het World Wide Web ontstaan?
Het World Wide Web zoals wij dat nu kennen vindt zijn oorsprong in 1990. Het werd ontwikkeld door


52
   Tim Berners-Lee, De wereld van het World Wide Web. Het oorspronkelijke ontwerp en de uiteindelijke
bestemming van het World Wide Web, beschreven door zijn uitvinder, (Amsterdam: 2000), 18-19 + 222.
53
   http://nl.wikipedia.org/wiki/Internet (Internet) (geraadpleegd: 25-08-2011).
54
   Berners-Lee, De wereld van het World Wide Web, 18-19 + 222.


                                                                                                        31
Tim Berners-Lee. Het Web werd uitgevonden met de bedoeling om kennis en gegevens in
zogenaamde datasets uit te wisselen tussen wetenschappers verspreid over de wereld.

Tim Berners-Lee had de intentie om een Web te creëren dat vroeg om de participatie van haar
gebruikers. Hij verwachtte in drie maanden een Web te ontwikkelen waarin de gebruikers alleen
content konden afnemen en binnen acht maanden konden deze zelfde gebruikers ook zelf content
toevoegen aan het Web.

Dit gebeurde echter niet. Men kon alleen maar gelinkte documenten lezen. Het Web werd vrij
eenzijdig gebruikt. Er werd informatie gepubliceerd die door gebruikers werd geconsumeerd. Men
kon dus alleen lezen wat op dat moment beschikbaar was.

Het Web waarin content werd aangeboden die enkel geconsumeerd kon worden ontwikkelde zich
tien jaar voordat gebruikers hun content ook in het Web konden plaatsen. We hebben het hier dan
over gebruikers zonder technologische kennis.

Standaarden World Wide Web
Tim Berners-Lee voegde twee al bestaande technologieën bij elkaar, namelijk:

        Internet,

        Hypertext.

Internet is het overkoepelende netwerk van verschillende applicaties. En hypertext word gezien als
een document met verwijzingen naar andere documenten die in een klik van de muis ‘gevolgd’
kunnen worden. Hieruit ontwikkelde hij drie essentiële technologieën. Hij bedacht het communicatie
protocol HTTP, de opmaaktaal HTML en het idee van een Web-adres URL. Alle drie deze standaarden
worden tegenwoordig nog steeds gebruikt en vormen samen de ruggengraat van het Web. 55

3.2    Het DNA van het Web
Tegenwoordig heeft vrijwel iedereen toegang tot het Web. Doordat er zoveel gebruikers zijn is het
Web zich gaan ontwikkelen. De ontwikkeling van het Web kent een aantal kenmerken.

De ontwikkeling van het Web is grof in te delen in drie periodes van ± tien jaar, ook wel generaties
genoemd:

        1990-2000       World Wide Web

        2000-2010       Social Web

        2010-...        Semantisch Web

Wat zijn nu de belangrijkste kenmerken van deze zogenaamde generaties van het Web? Door welke
vaak innovatieve ontwikkelingen zijn zij ontstaan?




55
 Gesprek met Victor de Boer, postdoctoraal onderzoeker binnen de Web & Media Group aan de Vrije
Universiteit Amsterdam, 22-07-2011.

                                                                                                       32
Volgens Nova Spivack - een prominente denker in het toekomstige Internet (met name Semantisch
Web)- kennen deze generaties twee drijfveren, namelijk:56

        Technologische drijfveer,

        Sociaal-economische drijfveer.

Met technologie wordt bedoeld dat voornamelijk professionals zoals programmeurs en ingenieurs
een rol spelen in deze innovatieve ontwikkelingen van het Web. De gebruikers spelen hier geen rol.
In de jaren negentig werd het ‘Web’ uitgevonden door Tim Berners-Lee. Dit is een van de bekendste
voorbeelden van een technologische drijfveer.

Het sociaal-economische aspect als drijfveer draait veel meer om de participatie van de gebruiker bij
het aanleveren van content. Social media toepassingen als Facebook en Twitter zijn een perfect
voorbeeld van het sociale aspect, dat wordt ondersteund vanuit economisch opzicht. De gunstige
economie zorgt ervoor dat rond 2000 bijna heel Nederland thuis een computer heeft en zich op het
internet begeeft. De professionals hebben op dat moment niet meer het alleenrecht op het
publiceren van content op het Web.

Technologie en het sociale-economie kunnen dus worden gezien als de twee basisstrengen van het
DNA van de innovatie van het Web. Deze twee zijn nooit los van elkaar te zien, maar zijn elkaars
tegenhanger. Er is altijd sprake
van een directe wisselwerking
tussen beide DNA strengen. 57

Deze heeft ervoor gezorgd dat
er een ware evolutie op het
internet gaande is, die als een
soort golfbeweging is
ontwikkeld.

De ontwikkeling van het Web
was dus een puur
technologische ontwikkeling
van professionals op het gebied
van ICT. Er kwamen
voornamelijk ingenieurs en
programmeurs bij kijken. De
                                         Figuur 5: Het DNA van web innovatie.
gebruikers consumeerde de
informatie die zij toegespeeld kregen. Zij konden helemaal niet mee beslissen welke informatie tot
hun kwam. Achteraf gezien benoemen we deze ontwikkeling ook wel met het buzzwoord: ‘web 1.0’.

3.3    Het ‘Social Web’
Rond het jaar 2007 is het wat men noemt: het ‘Social Web’ ontstaan. Het Web werd inmiddels door

56
   http://www.frankwatching.com/archive/2009/01/05/web-webber-webst-van-10-naar-30%E2%80%A6-en-
verder/ (Onafhankelijk crossmedia platform)(geraadpleegd: 26-08-2011)
57
   http://www.frankwatching.com/archive/2009/01/05/web-webber-webst-van-10-naar-30%E2%80%A6-en-
verder/ (Onafhankelijk crossmedia platform)(geraadpleegd: 26-08-2011)

                                                                                                   33
miljoenen mensen gebruikt. Al deze gebruikers van het Web creëerden een nieuw inzicht. Men
ontdekte dat de huidige infrastructuur van het internet ook gebruikt kon worden om iets van de
consument terug te krijgen.58

Interactief
Actief is het woord van het ‘Social Web’. De infrastuctuur van het Web verandert van
eenrichtingsverkeer naar tweerichtingsverkeer. De gebruiker kan interactief zijn met het Web.




58
     Ivo Zandhuis, ‘Fundamenten in verandering: archieven op het semantisch web’, Archievenblad, (mei 2010), 1.

                                                                                                            34
In de vorm van ‘Social Media’, wordt er interactief deelgenomen aan het Web:

        Social tagging,

        Weblogs,

        Delen van foto’s,

        Reageren op elkaars berichten/foto’s,

        Publiceren van content.

De gebruiker consumeert nu niet alleen meer, maar produceert nu ook. Er ontstaat een zogenaamde
‘prosumer’.

In navolging van de technologische golfbeweging die de ontwikkeling van het Web was, speelt juist
het sociaal/economische aspect een rol bij de ontstaan van ‘het sociale Web’. Het ‘Social Web’ is
gericht op de gebruiker, je ziet dat de technologie dan ook de functionaliteit volgt. Niet langer gaat
het om de techniek van het Web, maar gaat het over een concept dat betrekking heeft op het
gebruik van webapplicaties door mensen. Het ‘Social Web’ is voor de zelfstandige activiteit van het
publiek.59

Toen het tweerichtingsverkeer eenmaal op gang was, verspreidde het ‘Social Web’ zich als een
lopend vuurtje. Verschillende zogenaamde ‘Social Media’ als Twitter, Facebook, Hyves etc. kwamen
op en men nam hieraan deel. Het succes van het ‘Social Web’ is volgens Haustein en Pleumann te
danken aan twee factoren:60

        Participeren op het Web was eenvoudig,

        De resultaten van de participatie op het Web werd direct zichtbaar voor de gebruiker.

De drempel om te participeren binnen het ‘Social Web’ is erg laag. Participeren kan al door een klein
beetje content te delen. Je kunt rustig de kat uit de boom kijken en later meer content toevoegen.
Het gaat erom dat je participeert, dat je het tweerichtingsverkeer op gang houdt. Bovendien groeit
de waarde van de content wanneer mensen content publiceren over datzelfe onderwerp.61 Hier
geldt het principe: the wisdom of the crowd. Al deze inspanningen op het Web zijn direct terug te
zien en kunnen we als resultaat van onze inspanningen beschouwen. Dat zorgt voor een voldaan
gevoel. Jij draagt bij aan het Web.

3.4     Het Semantisch Web

De term Semantisch Web is niet nieuw. Deze is al in de jaren ‘90 geïntroduceerd. In tegenstelling tot -
wat men inmiddels aanduidt met de buzzwoorden web 1.0 en web 2.0, is het geen menselijke
interface, waarbij het gaat om de presentatie van de informatie die gericht is op mensen en waarbij
tekst, grafische vormgeving en usability van belang zijn.


59
   Zandhuis, ‘Fundamenten in verandering: archieven op het semantisch web’, 2.
60
   Seamus Ross, ‘Position Paper’, DigiCULT Thematic Issue 3 – Towards a Semantic Web for Heritage Resources,
(Oostenrijk: 2003), 9.
61
   Ross, ‘Position Paper’, 10.

                                                                                                          35
Het Semantisch Web is een computerinterface. In 2007 beschreef Christine Karman het Semantisch
Web als volgt:

        Web 3.0, het semantisch web, onderscheidt zich van het huidige www doordat er structuur in
        is aangebracht en doordat aan alle stukjes informatie meta-informatie is gekoppeld die
        automatische interpretatie mogelijk maakt. Het woordt semantiek wordt gebruikt omdat als
        het ware de betekenis van een woord, of van een stukje informatie, is mee-opgeslagen met
        het woord zelf. Dat maakt het navigeren op het web eenvoudiger, niet alleen voor ons
        mensen maar met name voor systemen. Informatiesystemen ‘begrijpen’ immers niet wat ze
        lezen, maar in het semantisch web wordt een deel van dat begrip als het ware meegeleverd,
        waardoor een systeem de informatie een beetje kan ‘begrijpen’.62

Tim Berners-Lee had met de ontwikkeling van het World Wide Web eigenlijk een Semantisch Web
voor ogen. Hij wilde een datamodel ontwikkelen dat een informatiestructuur herbergt dat over de
grenzen van de individuele instellingen heen gaat. Na ongeveer twintig jaar lijkt het er dan nu toch
van te komen. Ik zeg expliciet lijkt, want er zijn nog steeds een hoop ontwikkelingen gaande en nog
niet iedereen is blij met het Semantisch Web zoals het nu is.

Hoe werkt het?
De sleutel tot het realiseren van de visie van het Semantisch Web is semantische interoperabiliteit
van de Web-resources.63 Om deze werkelijkheid te laten worden dient er een grote omslag plaats te
vinden in de manier waarop data, informatie en kennis nu zijn gerepresenteerd op het Web.

Begrippenkader
Om de visie van het Semantische Web te verduidelijken zal ik hier eerst de twee belangrijkste
begrippen beschrijven die deze visie ondersteunen.

        Semantiek se - man` tiek («Frans«Grieks) de -woord (vrouwelijk) taalkunde leer van de
        betekenis en betekenisveranderingen64

        Interoperabiliteit is de eigenschap van systemen en software om data uit te wisselen met
        externe systemen via een gemeenschappelijke set procedures.65

De huidige situatie op het Web laat te veel content zien die niet tot nauwelijks beschreven is om met
elkaar in verband gebracht te kunnen worden. Hierdoor wordt deze content informatie niet
gevonden en hergebruikt. Wanneer deze volgens de principes van het Semantisch Web zouden zijn
ontsloten, zouden geautomatiseerde gegevensverwerkingsprogramma’s de informatie kunnen
vinden, interpreteren en hergebruiken.66




62
   www.sync.nl/web-30/, (Definitie Semantisch Web van Christine Karman)(geraadpleegd: 14-06-2011)
63
   Geser Guntram, ‘A Cultural Heritage Semantic Web Example & Primer’, DigiCULT Thematic Issue 3 – Towards
a Semantic Web for Heritage Resources, (Oostenrijk: 2003), 3.
64
   http://www.encyclo.nl/begrip/semantiek (Semantiek)(geraadpleegd: 27-09-2011)
65
   http://www.den.nl/thema/10/interoperabiliteit (Interoperabiliteit)(geraadpleegd: 27-09-2011)
66
   Ross, ‘Position Paper’, 7.

                                                                                                        36
Dit kan worden gerealiseerd door beschrijvende metadata aan de informatie en de resources toe te
voegen. Vervolgens dient de content en de metadata op een gestructureerde en consistente manier
aangeboden te worden op het Web om een intelligenter Web te ondersteunen.67

Het Semantisch Web wordt wel gepresenteerd
als een zeer complexe en uitgebreide visie van
een intelligent web. Dit is terug te zien in figuur 2.
In de layer-cake is te zien hoe de meer semantische
lagen van het Semantisch Web bouwen op minder
semantische.

Het is zo complex vanwege de stappen die nodig
zijn om een Semantisch Web mogelijk te maken.
Elke stap kent haar eigen standaarden.

Het transformeren van contentinformatie
en metadata naar semantische
interoperabiliteit gebeurd in
twee fases.

We onderscheiden de
syntactische fase en
de semantische fase.                                     Figuur 6: Enabling technologies - layer cake.

Het syntactische deel bestaat uit het onderste deel van de layer-cake. Het gaat hier om XML-
documenten die een unieke naam en plaats hebben (URI).

In de laag hierboven speelt het RDF-datamodel een rol. Het bouwt voort op XML en URI’s en bestaat
uit subject-predicaat-objectrelaties (triples). Op deze manier wordt de layer-cake steeds meer
semantisch. Standaarden die hier gebruikt worden zijn bijvoorbeeld Dublin Core, SKOS en FOAF.

Het semantische deel begint bij het gebruiken van ontologieën. Ik sta hier wat langer stil bij het
begrip ontologie vanwege het feit dat ontologieën zijn bedoeld om de betekenis, oftewel de
semantiek, vast te leggen van de concepten van de triples. De ontologieën maken het Web
semantisch.

Ontologie
Een ontologie is een triple die is bedoeld om uit te leggen hoe de computer de informatie kan
gebruiken.68

Het is te vergelijken met het RDF-datamodel of een metadataschema.
Er zijn een aantal standaardontologieën:

           RDFS,

           OWL,

67
     Ibidem, 7.
68
     Zandhuis, ‘Fundamenten in verandering: archieven op het semantisch web’, 2.


                                                                                                         37
OWL2

De ontologieën leggen steeds preciezer vast wat met de onderdelen van de triple wordt bedoeld. Er
wordt bijvoorbeeld vastgelegd wat de relaties binnen een familie betekenen:

           De computer moet nu weten dat in een bepaalde stamboom de moeder niet
           altijd dezelfde persoon is. De moeder kan meerdere namen hebben. Dit is iets
           dat wij mensen weten, maar dat een computer ‘vertelt’ moet worden.

Hier zijn de ontologieën o.a. voor, maar het wordt steeds complexer.

Naarmate we ons meer in het bovenste deel van de layer-cake bevinden wordt de complexiteit
groter. Dit deel van de layer-cake omvat de visie van het Semantische Web. Omdat de
computerinterface steeds meer als een mens moet denken worden de betekenis systemen ook
steeds complexer. 69

Door de complexiteit zijn er nog geen concrete goed functionerende praktijkvoorbeelden te noemen
die de volledige Semantische Web visie dragen. Wat we wel zien in de praktijk is het Linked Data
principe van Tim Berners-Lee. Deze technologie is gebaseerd op de lagen van de layer-cake in figuur
2, tot en met de ontologieën. Over Linked (Open) Data zal ik in hoofdstuk 4 meer vertellen.

Er zijn dus drie web-generaties te onderscheiden. De drie generaties lopen als het ware parallel aan
elkaar. Het ‘Social Web’ houdt niet op te bestaan na 2010. Het blijft parallel lopen met het
Semantisch Web. Ditzelfde geldt voor het World Wide Web, het is er nog steeds en kan niet als
‘dood’ worden beschouwd nu het ‘Social Web’ en het Semantisch Web bestaan.70




69
     Gesprek met Victor de Boer, 08-09-2011.
70
     E-mailwisseling met Victor de Boer, 30-09-2011.

                                                                                                   38
4       Linked Open Data

Linked (Open) Data wordt ook wel de praktijk van het Semantisch Web genoemd. Linked (Open) Data
is een pragmatische manier om een praktische bijdrage te leveren aan het Semantisch Web.71
Praktisch vanwege de toepasbaarheid van Linked (Open) Data.
In dit hoofdstuk meer over de toepasbaarheid van Linked (Open) Data en de overeenkomsten tussen
deze technologie en de beheersmaatregelen voor duurzame toegang tot informatie, zoals
beschreven in Deel C van het strategische stappenplan van Enno Meijers.

De termen waaruit Linked Open Data bestaat sluiten perfect aan op de erfgoedsector.
Om te beginnen Data. Data is onze digitale informatie. Informatie die al jaren door
erfgoedinstellingen wordt verzameld en die de erfgoedsector een autoriteit van kennis in de
samenleving maken.
Open wijst naar de huidige tendens in de samenleving dat informatie van publieke instellingen
openbaar moet zijn: de open access beweging. Nu alleen gegoten in een ander jasje. Niet fysiek,
maar digitaal. Deze openheid stimuleert het hergebruik van data. De informatie die we al jaren
verzamelen.
Linked wijst op waardecreatie met als gevolg meer betekenis. Dankzij het hergebruik worden er
nieuwe koppelingen gemaakt en ontstaat er meer context. Wat uiteindelijk zorgt voor meer
betekenis.72

4.1     Wat is Linked (Open) Data?
Linked (Open) Data is een nieuwe technologie die een intelligenter web ondersteunt. Tot nu toe
werden bij het koppelen van informatie standaarden gebruikt voor de verpakking van de informatie.
Linked (Open) Data koppelt informatie door middel van standaarden die gebruikt worden voor de
inhoud van de informatie.73 In plaats van de buitenkant, de binnenkant dus.

Op het Web worden documenten gekoppeld door links. Deze links hebben geen betekenis. Ze laten
niet zien wat de relatie is tussen de twee documenten die gekoppeld zijn. Alleen dat er een relatie is.
Je moet dus zelf uitzoeken wat de relatie tussen die twee documenten is.

Bij Linked (Open) Data geldt het principe dat de relatie tussen twee documenten betekenisvol moet
zijn. Die betekenis ontstaat door elk woord uit het Webdocument als concept uniek te maken en te
beschrijven in subject-predicaat-objectrelaties (triples). Een woord als bijvoorbeeld de stad
Amsterdam is dan een concept dat meerdere relaties kan krijgen met andere concepten. Het subject,
predicaat en object zijn dan dus ook concepten. Elk concept wint aan betekenis naarmate er meer
beschrijvingen aan gekoppeld worden. Op deze manier worden webdocumenten betekenisvol en
worden zoekresultaten nauwkeuriger.74 Dat is de kracht van Linked (Open) Data.



71
   http://www.den.nl/thema/129/ (Linked Open Data) (geraadpleegd: 09-06-2011)
72
   http://www.den.nl/blog/bericht/3027 (DCL11: Autoriteit, hergebruik en betekenis van linked data)
(geraadpleegd: 22-06-2011)
73
   http://digitaalduurzaam.blogspot.com/ (‘Linked Data’ – wat is dat nu eigenlijk precies?’)(geraadpleegd: 28-
07-2011)
74
   http://www.den.nl/thema/129/ (Linked Open Data) (geraadpleegd: 09-06-2011)

                                                                                                             39
Schematisch is dat als volgt weer te geven.75
    X      is de schilder van       Y
    X       is getrouwd met         Z
    X        is afkomstig uit      W

X, Y, Z en W zijn hierin de concepten. De relaties die tussen de concepten zijn beschreven zijn
betekenisvol, want ze vertellen hoe de concepten met elkaar verband houden.

Om nauwkeurig te kunnen zoeken in de enorme hoeveelheid informatie op het Web is zoeken op
basis van betekenis onontkoombaar. Er is echter een probleem. De betekenis van mensen, dingen en
gebeurtenissen kan variëren. Mensen kunnen bedenken welke betekenis iets heeft, dankzij de
context. Computers kunnen dit echter niet. Linked (Open) Data is een techniek om machine-leesbare
context te genereren.76

4.2     Wat is de meerwaarde voor de erfgoedsector?
Wat is nu de meerwaarde van Linked (Open) Data en wat levert het op voor de erfgoedsector?
Zoals hierboven al genoemd werd, koppelt Linked (Open) Data niet de verpakking, maar de inhoud
aan elkaar.

De belangrijkste meerwaarde van Linked (Open) Data
voor de erfgoedsector is voornamelijk
interoperabiliteit. Hiermee bedoelen we het kunnen
koppelen van objecten uit verschillende collecties en
het koppelen aan data die van buiten de culturele
sector afkomstig zijn door middel van een
gemeenschappelijke set procedures.77 De Europeana
database is hier een uitstekend voorbeeld van.

Een andere meerwaarde is dat de zichtbaarheid van de
collecties wordt vergroot. Voor zoekmachines geldt dat
zij beter in staat zijn de data te indexeren wanneer
data de Linked Data ‘standaard’ draagt. Er ontstaat de
mogelijkheid om met één zoekopdracht relevante
resultaten te vinden uit meerdere collecties, ook al is
de informatie niet overal hetzelfde geschreven. Op
deze manier komt de informatie dus min of meer naar
de gebruiker toe. De gebruiker hoeft niet meer zelf
opzoek te gaan.78                                                 Figuur 7: Logo Europeana.




75
   http://digitaalduurzaam.blogspot.com/ (‘Linked Data’ – wat is dat nu eigenlijk precies?’)(geraadpleegd: 28-
07-2011)
76
   Ibidem.
77
   http://www.den.nl/thema/129/ (Linked Open Data) (geraadpleegd: 09-06-2011)
78
   http://digitaalduurzaam.blogspot.com/ (‘Linked Data’ – wat is dat nu eigenlijk precies?’)(geraadpleegd: 28-
07-2011)


                                                                                                             40
Afstudeeronderzoek linked open data   duurzaam voor de toekomst
Afstudeeronderzoek linked open data   duurzaam voor de toekomst
Afstudeeronderzoek linked open data   duurzaam voor de toekomst
Afstudeeronderzoek linked open data   duurzaam voor de toekomst
Afstudeeronderzoek linked open data   duurzaam voor de toekomst
Afstudeeronderzoek linked open data   duurzaam voor de toekomst
Afstudeeronderzoek linked open data   duurzaam voor de toekomst
Afstudeeronderzoek linked open data   duurzaam voor de toekomst
Afstudeeronderzoek linked open data   duurzaam voor de toekomst
Afstudeeronderzoek linked open data   duurzaam voor de toekomst
Afstudeeronderzoek linked open data   duurzaam voor de toekomst
Afstudeeronderzoek linked open data   duurzaam voor de toekomst
Afstudeeronderzoek linked open data   duurzaam voor de toekomst
Afstudeeronderzoek linked open data   duurzaam voor de toekomst
Afstudeeronderzoek linked open data   duurzaam voor de toekomst
Afstudeeronderzoek linked open data   duurzaam voor de toekomst
Afstudeeronderzoek linked open data   duurzaam voor de toekomst
Afstudeeronderzoek linked open data   duurzaam voor de toekomst
Afstudeeronderzoek linked open data   duurzaam voor de toekomst
Afstudeeronderzoek linked open data   duurzaam voor de toekomst
Afstudeeronderzoek linked open data   duurzaam voor de toekomst
Afstudeeronderzoek linked open data   duurzaam voor de toekomst
Afstudeeronderzoek linked open data   duurzaam voor de toekomst

More Related Content

What's hot

Archieven Portaal Europa
Archieven Portaal EuropaArchieven Portaal Europa
Archieven Portaal EuropaKVANdagen
 
Viaa presentatie bootcamp 2019 Matthias Priem
Viaa presentatie bootcamp 2019 Matthias PriemViaa presentatie bootcamp 2019 Matthias Priem
Viaa presentatie bootcamp 2019 Matthias PriemPACKED vzw
 
Alina Saenko: Persistente URI's
Alina Saenko: Persistente URI'sAlina Saenko: Persistente URI's
Alina Saenko: Persistente URI'sPACKED vzw
 
Bert Lemmens - VKC ecosysteem
Bert Lemmens - VKC ecosysteemBert Lemmens - VKC ecosysteem
Bert Lemmens - VKC ecosysteemPACKED
 
Museumcollecties en Wikimedia #digimus2016
Museumcollecties en Wikimedia #digimus2016Museumcollecties en Wikimedia #digimus2016
Museumcollecties en Wikimedia #digimus2016Sandra Fauconnier
 
20190207_collectieontsluiting op_wikimedia_platformen
20190207_collectieontsluiting op_wikimedia_platformen20190207_collectieontsluiting op_wikimedia_platformen
20190207_collectieontsluiting op_wikimedia_platformenPACKED vzw
 
20191017 presentatie opendatabootcamp KMSKA
20191017 presentatie opendatabootcamp KMSKA20191017 presentatie opendatabootcamp KMSKA
20191017 presentatie opendatabootcamp KMSKAPACKED vzw
 
Datahub voor museale collecties. Xplore Bruges 03.03.2016
Datahub voor museale collecties. Xplore Bruges 03.03.2016Datahub voor museale collecties. Xplore Bruges 03.03.2016
Datahub voor museale collecties. Xplore Bruges 03.03.2016Vlaamse Kunstcollectie
 
20190920 informatie aanzee_contentdonatie_aan_wikimedia_commons
20190920 informatie aanzee_contentdonatie_aan_wikimedia_commons20190920 informatie aanzee_contentdonatie_aan_wikimedia_commons
20190920 informatie aanzee_contentdonatie_aan_wikimedia_commonsPACKED vzw
 
Sandra Fauconnier - Museumcollecties en Wikimedia
Sandra Fauconnier - Museumcollecties en WikimediaSandra Fauconnier - Museumcollecties en Wikimedia
Sandra Fauconnier - Museumcollecties en WikimediaPACKED
 
Sessie 'Onderduikkaarten online' | Hans Laagland | Noordelijke Netwerkdag Oor...
Sessie 'Onderduikkaarten online' | Hans Laagland | Noordelijke Netwerkdag Oor...Sessie 'Onderduikkaarten online' | Hans Laagland | Noordelijke Netwerkdag Oor...
Sessie 'Onderduikkaarten online' | Hans Laagland | Noordelijke Netwerkdag Oor...Netwerk Oorlogsbronnen
 

What's hot (20)

Hoe ISNI en Linked Open Data cultureel erfgoed helpen beheren en ontsluiten
Hoe ISNI en Linked Open Data cultureel erfgoed helpen beheren en ontsluitenHoe ISNI en Linked Open Data cultureel erfgoed helpen beheren en ontsluiten
Hoe ISNI en Linked Open Data cultureel erfgoed helpen beheren en ontsluiten
 
Invulboek objecten
Invulboek objectenInvulboek objecten
Invulboek objecten
 
Archieven Portaal Europa
Archieven Portaal EuropaArchieven Portaal Europa
Archieven Portaal Europa
 
Viaa presentatie bootcamp 2019 Matthias Priem
Viaa presentatie bootcamp 2019 Matthias PriemViaa presentatie bootcamp 2019 Matthias Priem
Viaa presentatie bootcamp 2019 Matthias Priem
 
Digitaal mobiel-genetwerkt - workshop
Digitaal mobiel-genetwerkt - workshopDigitaal mobiel-genetwerkt - workshop
Digitaal mobiel-genetwerkt - workshop
 
Alina Saenko: Persistente URI's
Alina Saenko: Persistente URI'sAlina Saenko: Persistente URI's
Alina Saenko: Persistente URI's
 
Digitale strategie en digitale participatie in de Brugse musea
Digitale strategie en digitale participatie in de Brugse museaDigitale strategie en digitale participatie in de Brugse musea
Digitale strategie en digitale participatie in de Brugse musea
 
Bert Lemmens - VKC ecosysteem
Bert Lemmens - VKC ecosysteemBert Lemmens - VKC ecosysteem
Bert Lemmens - VKC ecosysteem
 
Museumcollecties en Wikimedia #digimus2016
Museumcollecties en Wikimedia #digimus2016Museumcollecties en Wikimedia #digimus2016
Museumcollecties en Wikimedia #digimus2016
 
Cinematek presentation open data bootcamp
Cinematek presentation open data bootcampCinematek presentation open data bootcamp
Cinematek presentation open data bootcamp
 
20190207_collectieontsluiting op_wikimedia_platformen
20190207_collectieontsluiting op_wikimedia_platformen20190207_collectieontsluiting op_wikimedia_platformen
20190207_collectieontsluiting op_wikimedia_platformen
 
20191017 presentatie opendatabootcamp KMSKA
20191017 presentatie opendatabootcamp KMSKA20191017 presentatie opendatabootcamp KMSKA
20191017 presentatie opendatabootcamp KMSKA
 
Open leermiddelen: de (toekomstige) verbinding tussen bibliotheek en onderwijs
Open leermiddelen: de (toekomstige) verbinding tussen bibliotheek en onderwijs  Open leermiddelen: de (toekomstige) verbinding tussen bibliotheek en onderwijs
Open leermiddelen: de (toekomstige) verbinding tussen bibliotheek en onderwijs
 
Datahub voor museale collecties. Xplore Bruges 03.03.2016
Datahub voor museale collecties. Xplore Bruges 03.03.2016Datahub voor museale collecties. Xplore Bruges 03.03.2016
Datahub voor museale collecties. Xplore Bruges 03.03.2016
 
20190920 informatie aanzee contentdonatie aan wikimedia commons
20190920 informatie aanzee contentdonatie aan wikimedia commons20190920 informatie aanzee contentdonatie aan wikimedia commons
20190920 informatie aanzee contentdonatie aan wikimedia commons
 
20190920 informatie aanzee_contentdonatie_aan_wikimedia_commons
20190920 informatie aanzee_contentdonatie_aan_wikimedia_commons20190920 informatie aanzee_contentdonatie_aan_wikimedia_commons
20190920 informatie aanzee_contentdonatie_aan_wikimedia_commons
 
Sandra Fauconnier - Museumcollecties en Wikimedia
Sandra Fauconnier - Museumcollecties en WikimediaSandra Fauconnier - Museumcollecties en Wikimedia
Sandra Fauconnier - Museumcollecties en Wikimedia
 
De Datahub
De DatahubDe Datahub
De Datahub
 
Sessie 'Onderduikkaarten online' | Hans Laagland | Noordelijke Netwerkdag Oor...
Sessie 'Onderduikkaarten online' | Hans Laagland | Noordelijke Netwerkdag Oor...Sessie 'Onderduikkaarten online' | Hans Laagland | Noordelijke Netwerkdag Oor...
Sessie 'Onderduikkaarten online' | Hans Laagland | Noordelijke Netwerkdag Oor...
 
Het beheer van wetenschappelijke informatie in het Zuiden
Het beheer van wetenschappelijke informatie in het ZuidenHet beheer van wetenschappelijke informatie in het Zuiden
Het beheer van wetenschappelijke informatie in het Zuiden
 

Viewers also liked

Een semantisch Web voor archieven: bouw bruggen, geen muren
Een semantisch Web voor archieven:bouw bruggen, geen muren Een semantisch Web voor archieven:bouw bruggen, geen muren
Een semantisch Web voor archieven: bouw bruggen, geen muren Jacco van Ossenbruggen
 
Ma thesis f_pansters_museumcollecties online_def
Ma thesis f_pansters_museumcollecties online_defMa thesis f_pansters_museumcollecties online_def
Ma thesis f_pansters_museumcollecties online_defErfgoed 2.0
 
Toekomst van Open Overheid - in een netwerksamenleving - Van ontsluiten naar ...
Toekomst van Open Overheid - in een netwerksamenleving - Van ontsluiten naar ...Toekomst van Open Overheid - in een netwerksamenleving - Van ontsluiten naar ...
Toekomst van Open Overheid - in een netwerksamenleving - Van ontsluiten naar ...Harrie Kuipers
 
Big, Linked en/of Open Data; en nu?
Big, Linked en/of Open Data; en nu?Big, Linked en/of Open Data; en nu?
Big, Linked en/of Open Data; en nu?freshheads
 
Open data algemeen Paul Suijkerbuijk
Open data algemeen Paul SuijkerbuijkOpen data algemeen Paul Suijkerbuijk
Open data algemeen Paul SuijkerbuijkOpen Data
 
Ton zijlstra lunchlezing BZK 26 november
Ton zijlstra lunchlezing BZK 26 novemberTon zijlstra lunchlezing BZK 26 november
Ton zijlstra lunchlezing BZK 26 novemberOpen Data
 
2014 06-19 workshop open overheid - actieve openbaarheid
2014 06-19 workshop open overheid - actieve openbaarheid2014 06-19 workshop open overheid - actieve openbaarheid
2014 06-19 workshop open overheid - actieve openbaarheidMariekeSchenk
 
Big en open data, Cascadis jaarcongres 2014
Big en open data, Cascadis jaarcongres 2014Big en open data, Cascadis jaarcongres 2014
Big en open data, Cascadis jaarcongres 2014Robbert Jellinek
 
How to Become a Thought Leader in Your Niche
How to Become a Thought Leader in Your NicheHow to Become a Thought Leader in Your Niche
How to Become a Thought Leader in Your NicheLeslie Samuel
 

Viewers also liked (9)

Een semantisch Web voor archieven: bouw bruggen, geen muren
Een semantisch Web voor archieven:bouw bruggen, geen muren Een semantisch Web voor archieven:bouw bruggen, geen muren
Een semantisch Web voor archieven: bouw bruggen, geen muren
 
Ma thesis f_pansters_museumcollecties online_def
Ma thesis f_pansters_museumcollecties online_defMa thesis f_pansters_museumcollecties online_def
Ma thesis f_pansters_museumcollecties online_def
 
Toekomst van Open Overheid - in een netwerksamenleving - Van ontsluiten naar ...
Toekomst van Open Overheid - in een netwerksamenleving - Van ontsluiten naar ...Toekomst van Open Overheid - in een netwerksamenleving - Van ontsluiten naar ...
Toekomst van Open Overheid - in een netwerksamenleving - Van ontsluiten naar ...
 
Big, Linked en/of Open Data; en nu?
Big, Linked en/of Open Data; en nu?Big, Linked en/of Open Data; en nu?
Big, Linked en/of Open Data; en nu?
 
Open data algemeen Paul Suijkerbuijk
Open data algemeen Paul SuijkerbuijkOpen data algemeen Paul Suijkerbuijk
Open data algemeen Paul Suijkerbuijk
 
Ton zijlstra lunchlezing BZK 26 november
Ton zijlstra lunchlezing BZK 26 novemberTon zijlstra lunchlezing BZK 26 november
Ton zijlstra lunchlezing BZK 26 november
 
2014 06-19 workshop open overheid - actieve openbaarheid
2014 06-19 workshop open overheid - actieve openbaarheid2014 06-19 workshop open overheid - actieve openbaarheid
2014 06-19 workshop open overheid - actieve openbaarheid
 
Big en open data, Cascadis jaarcongres 2014
Big en open data, Cascadis jaarcongres 2014Big en open data, Cascadis jaarcongres 2014
Big en open data, Cascadis jaarcongres 2014
 
How to Become a Thought Leader in Your Niche
How to Become a Thought Leader in Your NicheHow to Become a Thought Leader in Your Niche
How to Become a Thought Leader in Your Niche
 

Similar to Afstudeeronderzoek linked open data duurzaam voor de toekomst

Design rationale pb_fase2_team3_v1.6
Design rationale pb_fase2_team3_v1.6Design rationale pb_fase2_team3_v1.6
Design rationale pb_fase2_team3_v1.6MitchKappen
 
KVAN-dagen 2013 - Kiezen! - Programma
KVAN-dagen 2013 - Kiezen! - ProgrammaKVAN-dagen 2013 - Kiezen! - Programma
KVAN-dagen 2013 - Kiezen! - ProgrammaKVANdagen
 
Wat wikileaks ons leert over bibliotheken
Wat wikileaks ons leert over bibliothekenWat wikileaks ons leert over bibliotheken
Wat wikileaks ons leert over bibliothekenLIBER Europe
 
Essay Kennisnet Internet Is Een Fantastische Leeromgeving!
Essay Kennisnet   Internet Is Een Fantastische Leeromgeving!Essay Kennisnet   Internet Is Een Fantastische Leeromgeving!
Essay Kennisnet Internet Is Een Fantastische Leeromgeving!Homozappiens
 
'Internet is een fantastische leeromgeving' - Essay voor Stichting Kennisnet
'Internet is een fantastische leeromgeving' - Essay voor Stichting Kennisnet'Internet is een fantastische leeromgeving' - Essay voor Stichting Kennisnet
'Internet is een fantastische leeromgeving' - Essay voor Stichting KennisnetRinkweijs
 
'Internet is een fantastische leeromgeving' - Essay voor Stichting Kennisnet
'Internet is een fantastische leeromgeving' - Essay voor Stichting Kennisnet'Internet is een fantastische leeromgeving' - Essay voor Stichting Kennisnet
'Internet is een fantastische leeromgeving' - Essay voor Stichting KennisnetProven Partners
 
Presentatie ICT-dag
Presentatie ICT-dagPresentatie ICT-dag
Presentatie ICT-dagbarcus
 
Erika Hokke: Stichting Archief Publicaties Annual
Erika Hokke: Stichting Archief Publicaties AnnualErika Hokke: Stichting Archief Publicaties Annual
Erika Hokke: Stichting Archief Publicaties AnnualNetwerk Digitaal Erfgoed
 
Open onderzoeks data dag mei 2011 amsterdam
Open onderzoeks data dag mei 2011 amsterdamOpen onderzoeks data dag mei 2011 amsterdam
Open onderzoeks data dag mei 2011 amsterdampkdoorn
 
Masterscriptie Taalontwikkeling Bij Kinderen En Volwassenen (Opleiding) R...
Masterscriptie   Taalontwikkeling Bij Kinderen En Volwassenen (Opleiding)   R...Masterscriptie   Taalontwikkeling Bij Kinderen En Volwassenen (Opleiding)   R...
Masterscriptie Taalontwikkeling Bij Kinderen En Volwassenen (Opleiding) R...roymingelers
 
Masterclass technology enhanced learning
Masterclass technology enhanced learning Masterclass technology enhanced learning
Masterclass technology enhanced learning WilfredRubens.com
 
Sociale Netwerken (Social Networks & Libraries)
Sociale Netwerken (Social Networks & Libraries)Sociale Netwerken (Social Networks & Libraries)
Sociale Netwerken (Social Networks & Libraries)Guus van den Brekel
 
Open data = duurzame data?
Open data = duurzame data?Open data = duurzame data?
Open data = duurzame data?Judith van Gent
 
Gastcollege e learning trends fontys 2014
Gastcollege e learning trends fontys 2014Gastcollege e learning trends fontys 2014
Gastcollege e learning trends fontys 2014WilfredRubens.com
 
Icto kurt de belder
Icto kurt de belderIcto kurt de belder
Icto kurt de belderICTOlei2011
 
20090424 Ncddbomvl
20090424 Ncddbomvl20090424 Ncddbomvl
20090424 NcddbomvlFARO
 

Similar to Afstudeeronderzoek linked open data duurzaam voor de toekomst (20)

Open Data
Open Data Open Data
Open Data
 
Design rationale pb_fase2_team3_v1.6
Design rationale pb_fase2_team3_v1.6Design rationale pb_fase2_team3_v1.6
Design rationale pb_fase2_team3_v1.6
 
KVAN-dagen 2013 - Kiezen! - Programma
KVAN-dagen 2013 - Kiezen! - ProgrammaKVAN-dagen 2013 - Kiezen! - Programma
KVAN-dagen 2013 - Kiezen! - Programma
 
Wat wikileaks ons leert over bibliotheken
Wat wikileaks ons leert over bibliothekenWat wikileaks ons leert over bibliotheken
Wat wikileaks ons leert over bibliotheken
 
Essay Kennisnet Internet Is Een Fantastische Leeromgeving!
Essay Kennisnet   Internet Is Een Fantastische Leeromgeving!Essay Kennisnet   Internet Is Een Fantastische Leeromgeving!
Essay Kennisnet Internet Is Een Fantastische Leeromgeving!
 
'Internet is een fantastische leeromgeving' - Essay voor Stichting Kennisnet
'Internet is een fantastische leeromgeving' - Essay voor Stichting Kennisnet'Internet is een fantastische leeromgeving' - Essay voor Stichting Kennisnet
'Internet is een fantastische leeromgeving' - Essay voor Stichting Kennisnet
 
'Internet is een fantastische leeromgeving' - Essay voor Stichting Kennisnet
'Internet is een fantastische leeromgeving' - Essay voor Stichting Kennisnet'Internet is een fantastische leeromgeving' - Essay voor Stichting Kennisnet
'Internet is een fantastische leeromgeving' - Essay voor Stichting Kennisnet
 
Presentatie ICT-dag
Presentatie ICT-dagPresentatie ICT-dag
Presentatie ICT-dag
 
Erika Hokke: Stichting Archief Publicaties Annual
Erika Hokke: Stichting Archief Publicaties AnnualErika Hokke: Stichting Archief Publicaties Annual
Erika Hokke: Stichting Archief Publicaties Annual
 
Open onderzoeks data dag mei 2011 amsterdam
Open onderzoeks data dag mei 2011 amsterdamOpen onderzoeks data dag mei 2011 amsterdam
Open onderzoeks data dag mei 2011 amsterdam
 
Wat Wikileaks ons leert over bibliotheken
Wat Wikileaks ons leert over bibliothekenWat Wikileaks ons leert over bibliotheken
Wat Wikileaks ons leert over bibliotheken
 
Masterscriptie Taalontwikkeling Bij Kinderen En Volwassenen (Opleiding) R...
Masterscriptie   Taalontwikkeling Bij Kinderen En Volwassenen (Opleiding)   R...Masterscriptie   Taalontwikkeling Bij Kinderen En Volwassenen (Opleiding)   R...
Masterscriptie Taalontwikkeling Bij Kinderen En Volwassenen (Opleiding) R...
 
Masterclass technology enhanced learning
Masterclass technology enhanced learning Masterclass technology enhanced learning
Masterclass technology enhanced learning
 
Sociale Netwerken (Social Networks & Libraries)
Sociale Netwerken (Social Networks & Libraries)Sociale Netwerken (Social Networks & Libraries)
Sociale Netwerken (Social Networks & Libraries)
 
Open data = duurzame data?
Open data = duurzame data?Open data = duurzame data?
Open data = duurzame data?
 
Gastcollege e learning trends fontys 2014
Gastcollege e learning trends fontys 2014Gastcollege e learning trends fontys 2014
Gastcollege e learning trends fontys 2014
 
Icto kurt de belder
Icto kurt de belderIcto kurt de belder
Icto kurt de belder
 
20191114 ECP Jaarcongres 2019 - PLDN en Linked Data Intro
20191114 ECP Jaarcongres 2019 -  PLDN en Linked Data Intro20191114 ECP Jaarcongres 2019 -  PLDN en Linked Data Intro
20191114 ECP Jaarcongres 2019 - PLDN en Linked Data Intro
 
20090424 Ncddbomvl
20090424 Ncddbomvl20090424 Ncddbomvl
20090424 Ncddbomvl
 
Flyer Links-Up Dutch
Flyer Links-Up DutchFlyer Links-Up Dutch
Flyer Links-Up Dutch
 

More from Erfgoed 2.0

Nom storytelling-icomrus
Nom storytelling-icomrusNom storytelling-icomrus
Nom storytelling-icomrusErfgoed 2.0
 
Sustainable Development Goals and Values for Museum
Sustainable Development Goals and Values for MuseumSustainable Development Goals and Values for Museum
Sustainable Development Goals and Values for MuseumErfgoed 2.0
 
8 digitale en sociale vaardigheden die kinderen moeten meekrijgen
8 digitale en sociale vaardigheden die kinderen moeten meekrijgen8 digitale en sociale vaardigheden die kinderen moeten meekrijgen
8 digitale en sociale vaardigheden die kinderen moeten meekrijgenErfgoed 2.0
 
Storytelling workshop - den13042017
Storytelling workshop - den13042017Storytelling workshop - den13042017
Storytelling workshop - den13042017Erfgoed 2.0
 
Storytelling museumstudies-vs2
Storytelling museumstudies-vs2Storytelling museumstudies-vs2
Storytelling museumstudies-vs2Erfgoed 2.0
 
Storytelling at Museum Siam
Storytelling at Museum SiamStorytelling at Museum Siam
Storytelling at Museum SiamErfgoed 2.0
 
Postgraduaat cocreatie-erfgoedzaak2
Postgraduaat cocreatie-erfgoedzaak2Postgraduaat cocreatie-erfgoedzaak2
Postgraduaat cocreatie-erfgoedzaak2Erfgoed 2.0
 
Postgraduaat cocreatie-erfgoedzaak-1
Postgraduaat cocreatie-erfgoedzaak-1Postgraduaat cocreatie-erfgoedzaak-1
Postgraduaat cocreatie-erfgoedzaak-1Erfgoed 2.0
 
Wikipedia in de openbare bibliotheek - Erasmus
Wikipedia in de openbare bibliotheek - ErasmusWikipedia in de openbare bibliotheek - Erasmus
Wikipedia in de openbare bibliotheek - ErasmusErfgoed 2.0
 
Co-creatie, Vrijwillige fotografen project
Co-creatie, Vrijwillige fotografen projectCo-creatie, Vrijwillige fotografen project
Co-creatie, Vrijwillige fotografen projectErfgoed 2.0
 
Haagse Herinneringen, van verhalentafel tot Digi-Tale
Haagse Herinneringen, van verhalentafel tot Digi-TaleHaagse Herinneringen, van verhalentafel tot Digi-Tale
Haagse Herinneringen, van verhalentafel tot Digi-TaleErfgoed 2.0
 
Spelen met het verleden? Digitale games en (stedelijk) cultureel erfgoed
Spelen met het verleden? Digitale games en (stedelijk) cultureel erfgoedSpelen met het verleden? Digitale games en (stedelijk) cultureel erfgoed
Spelen met het verleden? Digitale games en (stedelijk) cultureel erfgoedErfgoed 2.0
 
Dit is mijn museum!
Dit is mijn museum!Dit is mijn museum!
Dit is mijn museum!Erfgoed 2.0
 
digitaal herinneren in de stad - Kelly Mostert
digitaal herinneren in de stad - Kelly Mostertdigitaal herinneren in de stad - Kelly Mostert
digitaal herinneren in de stad - Kelly MostertErfgoed 2.0
 
Digitaal herinneren in de stad
Digitaal herinneren in de stadDigitaal herinneren in de stad
Digitaal herinneren in de stadErfgoed 2.0
 
Minor pm nwstmedia
Minor pm nwstmediaMinor pm nwstmedia
Minor pm nwstmediaErfgoed 2.0
 
Actie interactie
Actie   interactieActie   interactie
Actie interactieErfgoed 2.0
 

More from Erfgoed 2.0 (20)

Nom storytelling-icomrus
Nom storytelling-icomrusNom storytelling-icomrus
Nom storytelling-icomrus
 
Sustainable Development Goals and Values for Museum
Sustainable Development Goals and Values for MuseumSustainable Development Goals and Values for Museum
Sustainable Development Goals and Values for Museum
 
Flevoland
Flevoland Flevoland
Flevoland
 
Give board13
Give board13Give board13
Give board13
 
GIVE model
GIVE modelGIVE model
GIVE model
 
8 digitale en sociale vaardigheden die kinderen moeten meekrijgen
8 digitale en sociale vaardigheden die kinderen moeten meekrijgen8 digitale en sociale vaardigheden die kinderen moeten meekrijgen
8 digitale en sociale vaardigheden die kinderen moeten meekrijgen
 
Storytelling workshop - den13042017
Storytelling workshop - den13042017Storytelling workshop - den13042017
Storytelling workshop - den13042017
 
Storytelling museumstudies-vs2
Storytelling museumstudies-vs2Storytelling museumstudies-vs2
Storytelling museumstudies-vs2
 
Storytelling at Museum Siam
Storytelling at Museum SiamStorytelling at Museum Siam
Storytelling at Museum Siam
 
Postgraduaat cocreatie-erfgoedzaak2
Postgraduaat cocreatie-erfgoedzaak2Postgraduaat cocreatie-erfgoedzaak2
Postgraduaat cocreatie-erfgoedzaak2
 
Postgraduaat cocreatie-erfgoedzaak-1
Postgraduaat cocreatie-erfgoedzaak-1Postgraduaat cocreatie-erfgoedzaak-1
Postgraduaat cocreatie-erfgoedzaak-1
 
Wikipedia in de openbare bibliotheek - Erasmus
Wikipedia in de openbare bibliotheek - ErasmusWikipedia in de openbare bibliotheek - Erasmus
Wikipedia in de openbare bibliotheek - Erasmus
 
Co-creatie, Vrijwillige fotografen project
Co-creatie, Vrijwillige fotografen projectCo-creatie, Vrijwillige fotografen project
Co-creatie, Vrijwillige fotografen project
 
Haagse Herinneringen, van verhalentafel tot Digi-Tale
Haagse Herinneringen, van verhalentafel tot Digi-TaleHaagse Herinneringen, van verhalentafel tot Digi-Tale
Haagse Herinneringen, van verhalentafel tot Digi-Tale
 
Spelen met het verleden? Digitale games en (stedelijk) cultureel erfgoed
Spelen met het verleden? Digitale games en (stedelijk) cultureel erfgoedSpelen met het verleden? Digitale games en (stedelijk) cultureel erfgoed
Spelen met het verleden? Digitale games en (stedelijk) cultureel erfgoed
 
Dit is mijn museum!
Dit is mijn museum!Dit is mijn museum!
Dit is mijn museum!
 
digitaal herinneren in de stad - Kelly Mostert
digitaal herinneren in de stad - Kelly Mostertdigitaal herinneren in de stad - Kelly Mostert
digitaal herinneren in de stad - Kelly Mostert
 
Digitaal herinneren in de stad
Digitaal herinneren in de stadDigitaal herinneren in de stad
Digitaal herinneren in de stad
 
Minor pm nwstmedia
Minor pm nwstmediaMinor pm nwstmedia
Minor pm nwstmedia
 
Actie interactie
Actie   interactieActie   interactie
Actie interactie
 

Afstudeeronderzoek linked open data duurzaam voor de toekomst

  • 1. Linked Open Data Duurzaam voor de toekomst? Annette Allaart – Afstudeeronderzoek Reinwardt Academie – Cultureel Erfgoed Oktober 2011
  • 2. Colofon Dit werk is gelicenseerd onder een Creative Commons Naamsvermelding-NietCommercieel- GelijkDelen 3.0 Nederland. Bezoek http://creativecommons.org/licenses/by-nc-sa/3.0/nl/ om een kopie te zien van de licentie of stuur een brief naar Creative Commons, 444 Castro Street, Suite 900, Mountain View, California, 94041, USA. Opleiding: Amsterdamse Hogeschool voor de Kunsten Faculteit: Reinwardt Academie Begeleider: Gerdie Borghuis Titel: Linked Data – Duurzaam voor de toekomst? Auteur: Annette Allaart Studiejaar: 2011 Datum: 5 oktober 2011 2
  • 3. Voorwoord Voor u ligt een scriptie welke het resultaat is van een onderzoek naar de mogelijkheden van Linked (Open) Data, om duurzame toegang tot digitale erfgoedinformatie te bevorderen. Deze scriptie vormt het einde van mijn studie Cultureel Erfgoed aan de Reinwardt Academie. Het schrijven van een scriptie zag en zie ik nog steeds als een hele uitdaging. Ik ben dan ook trots op het eindresultaat. Trots vanwege de discipline die ik mijzelf heb moeten opleggen. Zelfstandig onderzoek doen betekent dat je geen stok achter de deur hebt in de vorm van een organisatie waar je het onderzoek uitvoert. Ik ben ook trots op het aantal pagina’s waaruit deze scriptie bestaat. Hieruit blijkt dat ik wel degelijk ‘verhaaltjes’ kan schrijven. Iets wat ik tijdens het schrijven niet voor mogelijk hield. Ik schreef mijn eerste hoofdstuk in steno.. Bij deze wil ik daarom mijn begeleider vanuit de Reinwardt Academie, Gerdie Borghuis, bedanken. Zij heeft me geleerd hoe ik de lezer aan de hand moet nemen in mijn verhaal. Graag wil ik ook Enno Meijers en Inge Angevaare bedanken. Zij hebben mij met hun brede kennis van digitale duurzaamheid, geholpen meer vorm aan mijn onderzoek te geven. Victor de Boer bedank ik voor het overdragen van zijn kennis van het Semantisch Web en Linked (Open) Data aan mij. Judith van Gent van het Amsterdam Museum bedank ik voor een kijkje in de praktijk. Zonder jullie was ik ongetwijfeld nog steeds verdwaald in de enorme hoeveelheid ingewikkelde informatie die er te vinden is over digitale duurzaamheid en Linked (Open) Data. Een scriptie schrijven is een proces. Dit proces had ik niet kunnen volbrengen zonder de hulp en steun van familie, vrienden en huisgenoten. Dank jullie wel! 3
  • 4. Samenvatting Digitale informatie is niet meer weg te denken uit onze kennissamenleving. In het hedendaagse leven kan men niet meer zonder. Digitale duurzaamheid staat echter nog steeds in de kinderschoenen. Duurzaamheid wordt voornamelijk gezien als veilige opslag van digitale objecten. Het duurzaam toegankelijk houden van de digitale erfgoedinformatie wordt daarbij vergeten. Het streven naar duurzame toegang tot digitale erfgoedinformatie is een grote uitdaging omdat er drie soorten bedreigingen zijn die de risico’s op verlies van digitale informatie vergroten. Deze afstudeerscriptie onderzoekt of het een mogelijkheid is de data in de collectiedatabase om te zetten naar een Linked Open dataset, om zodoende duurzame toegang tot digitale erfgoedinformatie te bevorderen. Daarnaast is het doel een beeld te creëren wat Linked (Open) Data voor culturele erfgoedinstellingen kan betekenen, hoe het werkt en wat het oplevert. Hierbij word het Amsterdam Museum als case- study gebruikt. Zij zijn het eerste museum dat haar data in de collectiedatabase heeft omgezet naar een Linked Open dataset. Om duurzame toegang tot digitale erfgoedinformatie te bieden gaat dit onderzoek uit van het strategische stappenmodel van Enno Meijers. Het stappenmodel bestaat uit drie delen. Het laatste deel wordt gebruikt om de koppeling naar Linked (Open) Data te maken. Linked (Open) Data wordt als de praktijk van het Semantisch Web gezien. Het Semantisch Web draait om interoperabiliteit van de Web-resources. Door digitale objecten inhoudelijk aan elkaar te koppelen ontstaat een betekenisvolle relatie. Uit een analyse moet men tot de conclusie komen of Linked (Open) Data een mogelijkheid is om duurzame toegang tot digitale informatie te bevorderen, of niet. De analyse vergelijkt de beheersmaatregelen die worden geadviseerd in het derde deel van het stappenplan van Enno Meijers met het Linked Data principe van Tim Berners-Lee. Uit de analyse is gebleken dat er wel degelijk overeenkomsten zijn tussen deze twee thema’s. De overeenkomsten hebben vooral betrekking op het toepassen van open standaarden ten behoeve van metadata beheer en het signaleren van technologische veranderingen in de omgeving. De volgende aanbevelingen zijn gedaan: Maak gebruik van de open standaard XML. Gebruik RDF/XML als schrijfwijze van het RDF-datamodel. Nader onderzoek naar de praktijk van deze conclusie. 4
  • 5. Summary Digital information has become part of our knowledge society. In daily life, we cannot live without digital information anymore. Despite of this all, digital preservation is still a new market. It’s only twenty years old. Digital preservation is primarily seen as safe storage of digital objects. Sustainable access to the digital information is something the heritage institutions don’t think of. To achieve sustainable access to the digital information is a real challenge. There are three kinds of threats which will increase the risk to lose digital information. This thesis examines whether it’s a possibility to convert the collection data to Linked Open Data, thereby promote sustainable access to digital heritage information. Moreover it’s a purpose to create a picture of Linked (Open) Data. What do cultural heritage institutions have to do with? How does Linked (Open) Data work? What does Linked (Open) Data bring the cultural heritage institutions? The Amsterdam Museum is the first museum in the Netherlands who converted their collection data to Linked Open Data. I will refer to The Amsterdam Museum as they are used as a case study. To offer sustainable access to the digital heritage information this examination studied the strategic model for digital preservation by Enno Meijers. This model consists of three parts. The last part will be used to make the connection to Linked (Open) Data. Linked (Open) Data is called the more operative way of the Semantic Web. The Semantic Web is all about interoperability of Web resources. By linking the digital objects with their inside the Semantic Web creates meaningful relationships. An analysis should be to conclude Linked (Open) Data is an opportunity to promote sustainable access to digital information or not. The analysis compares the preservation tools recommended in the third part of the strategic preservation model by Enno Meijers to the principles of Linked Data by Tim Berners-Lee. The analysis showed that there are indeed similarities between these two themes. The similarities in particular related to the use of open standards for metadata management and the identification of technological changes in the environment. The following recommendations were made: Use the Open Standard XML, Use RDF / XML as the serialisation of the RDF-data model, Make sure you evaluate. 5
  • 6. Inhoudsopgave 1 Inleiding en afbakening……………………………………………………………………………………………………….............9 Aanleiding………………………………………………………………………………………..........................................9 Hypothese………………………………………………………………………………………………...............................10 Onderzoeksvraag…………………………………………………………………………………………………..................11 Doelstelling...............................................................................................................................11 Afbakening................................................................................................................................11 Methode....................................................................................................................................12 2 Digitale toegankelijkheid...................................................................................................................14 2.1 Wat is digitale toegankelijkheid..............................................................................................14 Digitale duurzaamheid............................................................................................................................14 2.2 Wat is het doel van digitale toegankelijkheid?.......................................................................15 2.3 Waarom is digitale toegankelijkheid belangrijk?....................................................................15 2.4 Obstakels en digitale toegankelijkheid...................................................................................16 2.4.1 Veranderingen in de technologie en technische oplossingen.....................................16 Migratie.....................................................................................................................................17 Emulatie....................................................................................................................................17 Normalisatie..............................................................................................................................18 2.4.2 Veranderingen in de omgeving, hoe verder?...............................................................18 Expertisecentrum DAVID...........................................................................................................18 2.4.3 Veranderingen in de organisatie dankzij nieuw beleid................................................19 De BASIS....................................................................................................................................20 PLATTER.....................................................................................................................................21 Business Model Innovation........................................................................................................22 OAIS-model...............................................................................................................................22 2.5 Strategisch stappenmodel.......................................................................................................24 Volwassenheidsmodel...............................................................................................................25 2.5.1 Opbouw van het stappenmodel..................................................................................25 2.5.2 Deel C: Duurzaam toegang bieden...............................................................................26 Stap 1: duurzame toegang.........................................................................................................26 Stap 2: beheer van metadata.....................................................................................................27 Stap 3: de veranderende omgeving...........................................................................................29 3 Veranderingen van het Web...........................................................................................................30 3.1 Wat is het Web?.....................................................................................................................30 Internet......................................................................................................................................30 Hoe is het World Wide Web ontstaan?.....................................................................................30 Standaarden World Wide Web..................................................................................................31 3.2 Het DNA van het Web............................................................................................................31 3.3 Het ‘Social Web’.....................................................................................................................32 Interactief..................................................................................................................................32 3.4 Het Semantisch Web..............................................................................................................33 Hoe werkt het?..........................................................................................................................34 Ontologie...................................................................................................................................35 6
  • 7. 4 Linked Open Data...............................................................................................................................37 4.1 Wat is Linked (Open) Data?.....................................................................................................37 4.2 Wat is de meerwaarde voor de erfgoedsector?......................................................................38 4.3 Hoe verhouden Linked (Open) Data en het Semantisch Web zich tot elkaar?......................39 4.4 Linked Data – Open Data – Linked Open Data........................................................................40 Linked Data...............................................................................................................................40 Open Data..................................................................................................................................40 Linked Open Data......................................................................................................................41 4.5 De technische aspecten van Linked (Open) Data....................................................................41 4.5.1 Syntactische transformatie..........................................................................................41 XML............................................................................................................................................41 Uniform Resource Identifier......................................................................................................42 HyperText Transfer Protocol......................................................................................................42 4.5.2 Semantische transformatie..........................................................................................42 Triple..........................................................................................................................................43 Resource Description Framework..............................................................................................43 4.6 Linked (Open) Data – wat nu?.................................................................................................45 Linked (Open) Data browser......................................................................................................45 Linked (Open) Data zoekmachines............................................................................................45 Linked (Open) Data applicaties..................................................................................................46 5 Linked Open Data in de praktijk........................................................................................................47 5.1 Aandacht voor Linked (Open) Data.........................................................................................47 5.2 Aan de slag...............................................................................................................................47 5.2.1 ‘The Linking Open Data Project’...................................................................................48 5.2.2 Amsterdam Museum als Linked Open Data.................................................................48 Wat levert het op?.....................................................................................................................49 Nadelen.....................................................................................................................................49 Europeana.................................................................................................................................50 Apps for Amsterdam..................................................................................................................50 Tot slot………………………………………………………………………………………………………………………………….50 5.2.3 MultimediaN N9C Eculture Project..............................................................................51 5.2.4 Europeana....................................................................................................................52 5.2.5 Apps for Amsterdam....................................................................................................52 6 Conclusie en aanbevelingen..............................................................................................................53 Hypothese.................................................................................................................................53 Aanalyse stappenmodel Enno Meijers en Linked Data principe Tim Berners-Lee....................53 Referentie metadata.................................................................................................................54 ‘Fixity’ en ‘provenance’.............................................................................................................54 Het leesbaar houden van de informatie....................................................................................54 De behoefte van de gebruiker...................................................................................................55 Aanbevelingen...........................................................................................................................55 7 Geraadpleegde bronnen....................................................................................................................57 8 Afbeeldingenlijst................................................................................................................................59 A Strategisch Stappenmodel Enno Meijers..........................................................................................60 B Linked Open Data Cloud Diagram.....................................................................................................61 7
  • 8. 1 Inleiding en afbakening Deze scriptie behandelt de duurzame toegankelijkheid van digitale erfgoedinformatie en welke rol Linked Data hierin kan spelen. Dit zijn twee grote thema’s die met elkaar in verbinding zullen worden gebracht. Aanleiding Digitale informatie is niet meer weg te denken uit onze kennissamenleving. In het hedendaagse leven kan men niet meer zonder. Het is een essentieel bestanddeel van onze kenniseconomie. In vrijwel elke sector, publiek en privaat, speelt digitale informatie een grote rol van betekenis. De instellingen binnen de culturele erfgoed sector zijn driftig aan de slag gegaan met digitaliseren van hun collectie. Om mee te blijven doen in de kennissamenleving bieden zij laagdrempelig toegang tot hun digitale informatie. Hiervoor zijn een aantal redenen te noemen1: Internet vereenvoudigt deelname van andere partijen aan informatieverspreiding. De instellingen proberen op deze manier hun meerwaarde in de kennissamenleving te behouden. De verschuiving van informatieschaarste naar informatieovervloed maakt deze instellingen niet meer de autoriteit op het gebied van kennis, bovendien zijn zij niet langer de toegangspoort tot de informatie. Het digitaliseren staat dus wel degelijk hoog op de agenda. Digitale duurzaamheid staat echter nog steeds in de kinderschoenen. Duurzaamheid wordt voornamelijk gezien als veilige opslag van digitale objecten.2 Het streven naar duurzame toegang tot digitale erfgoedinformatie is dus een grote uitdaging, maar het is ook een probleem dat nog geen twintig jaar oud is. Informatie op traditionele dragers van papier is zonder schadelijke invloeden van buitenaf jaren bruikbaar. Je moet alleen kunnen lezen en de taal begrijpen. Dit is niet het geval bij digitale informatie. Digitale informatie kent drie soorten bedreigingen die de risico’s op verlies van digitale informatie vergroten: Technologie Metadata Organisatie In zijn master thesis Stapsgewijs naar duurzame toegang heeft Enno Meijers een strategisch stappenmodel ontwikkeld om stapsgewijs de risico’s op verlies van digitale informatie te verkleinen. 1 Enno Meijers, Stapsgewijs naar duurzame toegang. Onderzoek naar een strategisch stappenmodel voor duurzame toegang tot digitale informatie in kleine en middelgrote erfgoedinstellingen. Thesis Master of Business Informatics – Avans+ (Middelburg, april 2010), 11-12. 2 Meijers, Stapsgewijs naar duurzame toegang, 38. 8
  • 9. Dit stappenplan is op te delen in drie delen waarin vijftien factoren worden beschreven om tot een duurzame borging van digitale informatie te komen: Het bepalen van de ambitie van de organisatie. De digitale objecten veilig stellen. Het duurzaam toegang bieden. In mijn onderzoek ga ik in op het derde deel van het stappenplan: het duurzaam toegang bieden. Hierin komen de volgende factoren aan bod: Beschrijven van de doelen voor duurzame toegang. Metadata beheer. De veranderende omgeving. Enno Meijers beschrijft in dit derde deel, over duurzame toegang bieden, de behoefte aan open standaarden en open source software. Het toepassen van open standaarden en open source software zouden de beste overlevingskansen bieden voor het duurzaam toegankelijk houden van digitale informatie. Hier haakt het tweede thema van deze scriptie op in. Linked (Open) Data is een nieuwe technologie die een intelligenter Web ondersteunt, dat gebaseerd is op open standaarden. Het is een ontwikkeling die in 2011 meer bekendheid kreeg door de Europeana database en de aandacht die de grote instellingen als de Koninklijke Bibliotheek, Nationaal Archief, Digitaal Erfgoed Nederland en Nationale Coalitie Digitale Duurzaamheid eraan gaven. Op 13 mei vond het Dutch Culture Linked Open Data Event plaats in Haarlem. Hier verzamelde het erfgoedveld van Nederland en België zich om meer over deze nieuwe technologie te weten te komen en het gebruik ervan te bevorderen. Ook ik was van de partij, dit vormde het startschot voor mijn scriptie. Hypothese Linked (Open) Data is een nieuwe praktijk van het Semantisch Web. Linked (Open) Data wordt ook wel gezien als een pragmatische manier om een praktische bijdrage te leveren aan het Semantisch Web.3 Praktisch vanwege de toepasbaarheid van Linked (Open) Data. In deze scriptie zie ik Linked (Open) Data als een technologische verandering in de omgeving. Ik wil ik deze toepasbaarheid koppelen aan het duurzaam toegang bieden tot digitale erfgoedinformatie. Is dit mogelijk en wat is hiervoor nodig? Zijn er overeenkomsten tussen de Linked (Open) Data technologie en de beheersmaatregelen voor duurzame toegang tot digitale informatie? Mijn veronderstelling is dat er overeenkomsten zijn die het mogelijk maken de Linked (Open) Data technologie te gebruiken als beheersmaatregel voor duurzame toegang tot digitale informatie. 3 http://www.den.nl/thema/129/ (Linked Open Data) (geraadpleegd: 09-06-2011) 9
  • 10. Onderzoeksvraag Het voorgaande resulteert in de volgende hoofdvraag: Is Linked (Open) Data, als toepassing van het semantisch web, een mogelijkheid om digitale erfgoedinformatie duurzaam toegankelijk te maken? De bijbehorende deelvragen zullen het onderzoek meer diepte geven: Wat is digitale duurzaamheid? Wat is het maatschappelijk belang van het duurzaam toegankelijk maken van digitale (erfgoed) informatie? Welke mogelijkheden voor het duurzaam toegankelijk maken van digitale (erfgoed) informatie zijn er al? Wat is semantisch web? Welke ontwikkelingen zijn er vooraf gegaan aan het semantisch web? Wat is Linked Open Data (LOD)? Hoe verhouden LOD en het semantisch web zich tot elkaar? Door wie wordt deze toepassing van semantisch web al gebruikt? Wat zijn de voors/tegens van LOD als toepassing van semantisch web? Hoe werkt LOD? Welke stappen moeten doorlopen worden om van data LOD te maken? Is er een verschil tussen erfgoedinstellingen en niet-erfgoedinstellingen, in duurzaam toegankelijk maken van informatie? Doelstelling Mijn doelstelling is de erfgoedprofessional een duidelijk beeld te geven wat Linked (Open) Data is en hoe het kan bijdragen aan duurzame toegankelijkheid van digitale erfgoedinformatie. Afbakening Aangezien duurzame toegankelijkheid even als Linked (Open) Data grote begrippen zijn, is het nodig een afbakening te maken. Dit onderzoek heeft plaatsgevonden binnen de publieke sector. Hierin worden drie terreinen onderscheiden:4 Wetenschap Overheid Cultuur en media Binnen het cultuur en media terrein onderscheidt het ministerie van Onderwijs, Cultuur en Wetenschap drie andere verdelingen: Media Letteren en bibliotheken Cultureel erfgoed 4 Inge Angevaare ed., Toekomst voor ons digitaal geheugen. Duurzame toegang tot informatie in Nederland (Den Haag: Nationale Coalitie voor Digitale Duurzaamheid, juli 2009), 15. 10
  • 11. Cultureel erfgoed is het gemeengoed van de Reinwardt Academie. Het omvat de musea, monumenten, archeologie en archieven. Dit is ook het terrein waarin ik de duurzame toegankelijkheid van digitale informatie bestudeer. Na aangegeven te hebben welk terrein binnen de sector cultuur en media ik bestudeer, zal ik nu duidelijk maken wat ik onder digitale (erfgoed) informatie versta. Binnen de culturele erfgoedsector onderscheiden we drie verschillende soorten digitaal cultureel erfgoed: Born-digital erfgoed materiaal, dit zijn objecten die van origine digitaal zijn. Het zijn erfgoedobjecten die niet van analoge objecten zijn afgeleid. Hierbij kun je denken aan bouwtekeningen die gemaakt zijn met behulp van CAD/CAM-programmatuur, e- maildossiers, games, verrijkte publicaties, tweets en websites.5 Gedigitaliseerd erfgoed, hiervan kennen we twee soorten. 1. Gedigitaliseerd erfgoed dat het origineel heeft vervangen en nu als een digitaal substituut geldt. 2. Gedigitaliseerd erfgoed waarbij het fysieke origineel bewaard blijft.6 Digitale informatie over erfgoed, hieronder vallen bijvoorbeeld beschrijvingen die zijn vastgelegd in collectie-informatiesystemen.7 In dit onderzoek laat ik born digital materiaal buiten beschouwing. Dit vanwege de complexiteit en de ‘nieuwheid’ van het materiaal. Wanneer ik het over digitale (erfgoed) informatie heb, bedoel ik hiermee gedigitaliseerd erfgoed en/of digitale informatie over erfgoed. Methode Ik heb geprobeerd meer grip te krijgen op de twee begrippen: duurzame toegankelijkheid en Linked (Open) Data, door eerst theoretisch onderzoek te doen, hierbij heb ik zowel literatuur als het internet geraadpleegd. De belangrijkste bronnen die ik gebruikt heb zijn: Meijers, E., Stapsgewijs naar duurzame toegang. Onderzoek naar een strategisch stappenmodel voor duurzame toegang tot digitale informatie in kleine en middelgrote erfgoedinstellingen. Thesis Master of Business Informatics – Avans+ (Middelburg, april 2010). Angevaare, I. ed., Toekomst voor ons digitaal geheugen. Duurzame toegang tot informatie in Nederland (Den Haag: Nationale Coalitie voor Digitale Duurzaamheid, juli 2009). www.den.nl Daarnaast heb ik met diverse mensen uit het werkveld gesproken. Ik heb ze gevraagd naar hun mening en ervaring met digitale toegankelijkheid en Linked (Open) Data. Zoals ik al aangaf wordt Linked (Open) Data als de ‘praktijk’ van het Semantisch Web gezien. Het Amsterdam Museum is de eerste Nederlandse culturele erfgoedinstelling die deze ‘praktijk’ ook daadwerkelijk in praktijk heeft gebracht. Zij hebben hun collectiedatabase als een Linked Open Dataset ontsloten. Ik ben bij het Amsterdam Museum langs geweest om te weten te komen wat hun ervaringen zijn. 5 M. Van der Graaf en G.J. Nauta, ‘Noodklok voor behoud van born-digital erfgoed’, Informatie Professional (04 / 2010), 12-15. 6 http://www.den.nl/bericht/2283 (Digitaal duurzame bewaartermijnen?) (geraadpleegd: 22-09-2011) 7 Ibidem. 11
  • 12. In veel van de gesprekken met experts op dit gebied kwam naar voren hoe ambitieus mijn onderwerp is. Het zijn twee grote thema’s die beide nog veel bestudeerd dienen te worden. Het was dan ook erg moeilijk om me niet te verliezen in de complexiteit van voornamelijk het thema digitale toegankelijkheid. Ik kom nog maar net kijken, terwijl sommige experts al tien jaar bezig zijn op dit terrein en nog steeds niet alles weten. Toch verwacht ik met deze scriptie de brug tussen de technici en de erfgoedprofessionals te slaan door op een begrijpelijke manier uit te leggen hoe digitale toegankelijkheid en Linked (Open) Data met elkaar verweven zijn en wat zij voor elkaar kunnen betekenen. 12
  • 13. 2 Digitale Toegankelijkheid Digitale toegankelijkheid gaat vanzelfsprekend samen met de komst van het digitale tijdperk. 2.1 Wat is digitale toegankelijkheid? Met het ontstaan van het Internet in de jaren ’70, de komst van de eerste ‘personal computer’ in 1981 van IBM en de komst van het Web van Tim Berners Lee in 1991 veranderde er niet alleen veel in positieve zin, maar ook in negatieve zin. Het Web bijvoorbeeld, is een handig middel om informatie sneller op te vragen en te verspreiden. Informatie sneller opvragen gebeurd door slimme ‘browsers’ op het Internet. Informatie verspreiden gaat door webtoepassingen als virtuele tentoonstellingen. Deze voorbeelden kunnen allemaal digitale technieken genoemd worden. In de jaren tachtig van de vorige eeuw realiseerde men zich dat de opkomende digitale technieken ook risico’s met zich mee brachten. Jeff Rothenberg benoemde de onderstaande technische problemen8: De dragers (cd, dvd, floppy disk) hebben een beperkte levensduur, vaak niet meer dan vijf jaar. De informatie bestaat uit een op zichzelf betekenisloze ‘bitstream’, alleen met behulp van de juiste hardware-/softwarecombinatie kan die informatie tot leven gewekt worden. De betekenis kan alleen achterhaald worden als aan de ‘bitstream’ zelf contextinformatie is toegevoegd. Deze risico’s vragen om oplossingen. Dit is echter niet eenvoudig. In tegenstelling tot papier dat eeuwenlang in een constante (geklimatiseerde) omgeving bruikbaar kan worden gehouden, gelden voor digitale informatie heel andere regels. Digitale informatie en haar dragers zijn niet vanzelfsprekend geschikt voor bewaring op de lange termijn. Met iedere nieuwe ontwikkeling van hard- en software zullen we de digitale informatie en hun dragers moeten controleren of zij nog wel bruikbaar zijn. Dit gebeurd door de ‘bitstream’ te controleren. Blijkt de ‘bitstream’ niet meer toegankelijk te zijn, dan moet er een passende oplossing gevonden worden om de toegankelijkheid op de lange termijn te waarborgen. Deze controle van de digitale informatie en haar dragers, vereist een continu proces van aandacht en zorg. We noemen dit een streven naar digitale duurzaamheid.9 Digitale Duurzaamheid? Een streven naar digitale duurzaamheid dus. Wat is dan digitale toegankelijkheid? De Nationale Coalitie Digitale Duurzaamheid heeft in het rapportToekomst voor ons digitaal geheugen aangegeven liever over duurzame toegang of duurzame toegankelijkheid te spreken dan 8 Rothenburg, Jeff, ‘Ensuring the Longevity of Digital Information’, Scientific American, vol. 272, nr. 1 (1999) 24- 29. 9 Angevaare, Toekomst voor ons digitaal geheugen, 23. 13
  • 14. van digitale duurzaamheid. De reden die zij hiervoor geven is dat duurzame bewaring zonder toegankelijkheid geen zin heeft.10 In mijn gesprek met Inge Angevaare (coördinator NCDD) gaf zij ook aan dat duurzame toegankelijkheid bestaat uit twee delen: Het bewaren van het object voor de toekomst, Het op de lange termijn beschikbaar houden voor de gebruiker. Ik sluit me aan bij de NCDD en zal in deze scriptie de term duurzame toegankelijkheid gebruiken. 2.2 Wat is het doel van digitale toegankelijkheid? “Duurzaamheid opzich is nooit het doel” [Inge Angevaare, NCDD, 21-06-2011]11 Het doel van digitale toegankelijkheid is het langdurig bewaren van digitale informatie en beschikbaar houden voor de gebruikers, zodat de digitale informatie (her)gebruikt kan worden in de toekomst en men erop kan vertrouwen dat de informatie authentiek en betrouwbaar is.12 2.3 Waarom is digitale toegankelijkheid belangrijk? In het hedendaagse leven kan men niet meer zonder digitale informatie. Digitale informatie is een essentieel bestandsdeel van onze kenniseconomie. In vrijwel elke sector publiek en/of privaat speelt informatie een rol van betekenis. Tegenwoordig spreken we zelfs van een informatieovervloed in plaats van informatieschaarste. De publieke sector investeert in de productie en verwerving van digitale informatie en wil deze langdurig toegankelijk houden. Binnen de culturele sector wordt het belang van deze taak benadrukt door de Raad van Cultuur. Zij wijzen op het belang van cultuurhistorie wat indirect het belang van digitale toegankelijkheid tot digitale erfgoedinformatie onderstreept. In het beleidsstuk Innoveren, Participeren!, zeggen zij: ‘Een samenleving die vooruit wil, doet er verstandig aan óók achterom te kijken. Het verleden moet niet worden vergeten, maar opgepoetst en gebruikt. Zonder continuïteit raken we op drift en koersen we van het ene incident naar het volgende. Ons collectieve geheugen, waarvan belangrijke delen zijn opgeslagen in archieven, musea en bibliotheken, schept een onmisbare basis voor die continuïteit.’ [Innoveren, Participeren!, 2007, p.12] De NCDD sluit zich hierbij aan door het volgende te zeggen: ‘Geschiedschrijving wordt in de toekomst onmogelijk als wij er anno 2008 niet voor zorgen dat digitale informatie over onze samenleving wordt bewaard.’13 10 Ibidem, 13. 11 Gesprek met Inge Angevaare, coördinator Nationale Coalitie Digitale Duurzaamheid, 21-06-2011. 12 Ibidem, 12. 13 http://www.ncdd.nl/digitaleduurzaamheid-inleiding.php (Inleiding in Digitale Duurzaamheid)(geraadpleegd: 4-07-2011) 14
  • 15. Digitaal Erfgoed Nederland, Kennisland en het Ministerie van OCW benadrukken in het rapport Business Model Innovatie Cultureel Erfgoed juist de waardecreatie die toegang tot digitale collecties brengt: ‘De digitale collecties vertegenwoordigen een grote potentiële economische en maatschappelijke waarde, mits ze optimaal toegankelijke worden gemaakt.’14 Naast deze redenen voor cultuurbesef en waardecreatie gelden er nog een aantal redenen die voornamelijk van technologische en organisatorische aard zijn15: Erfgoedinstellingen investeren de laatste jaren fors in digitalisering van hun collecties. Duurzame toegankelijkheid van de digitale informatie waarborgt in zekere zin deze investering in digitalisering. Digitalisering van de collecties levert digitale reproducties van o.a. kwetsbare originelen. Deze hoeven dankzij de digitale reproductie niet vaak uit het depot gehaald te worden. Indirect zorgt duurzame toegankelijkheid van digitale informatie op deze manier ook voor duurzaamheid van het fysieke object. 2.4 Obstakels en digitale toegankelijkheid? In paragraaf 1.1 zijn al kort de grootste risico’s die de toegankelijkheid tot digitale informatie bedreigen, uiteengezet. Er zijn echter drie soorten bedreigingen te noemen met elk hun eigen kenmerkende risico’s die de duurzame toegang tot digitale informatie in gevaar brengen. Hieronder de drie soorten bedreigingen16: Veranderingen in de technologie; Veranderingen in de omgeving; Veranderingen in de organisatie. Hoe vangen we deze risico’s en bedreigingen op en zorgen we ervoor dat de digitale informatie goed bewaard en beheerd wordt? Om de verschillende soorten bedreigingen van toegang tot digitale informatie te beperken kunnen verschillende beheersmaatregelen worden gehanteerd. Deze kunnen betrekking hebben op de technologie en/of beleid en organisatie. We noemen dit ook wel bewaarstrategieën. Op de komende pagina’s worden de verschillende bedreigingen met hun bijbehorende (mogelijke) bewaarstrategieën beschreven. Deze beheersmaatregelen kunnen echter nog niet als DE oplossing worden gezien. De problematiek van digitale toegankelijkheid tot digitale informatie is daarvoor nog te jong, nog geen twintig jaar oud. Deze beheersmaatregelen proberen de risico’s en bedreigingen tot een minimum te beperken. 14 M. De Niet, L. Heijmans en H. Verwayen e.a., Business Model Innovatie Cultureel Erfgoed, (Ministerie OCW: z.pl. 2009), 6-7. 15 http://www.den.nl/thema/16/digitale-duurzaamheid (Digitale Duurzaamheid) (geraadpleegd: 4-07-2011) 16 Meijers, Stapsgewijs naar duurzame toegang, 13. 15
  • 16. 2.4.1 Veranderingen in de technologie en technische oplossingen Veranderingen in de technologie omvatte de risico’s die Jeff Rothenberg aangaf. Deze risico’s hebben voornamelijk betrekking op het bewaren van de digitale informatie. Digitale informatie bestaat uit enen en nullen (bitstream) die alleen betekenis krijgen wanneer deze wordt afgespeeld op dezelfde combinatie van hard- en software. Dit zou niet een heel groot probleem moeten zijn mits de voortdurende ontwikkeling van nieuwe hard- en softwareproducten niet zo groot en snel was dat digitale informatie al na tien jaar onbruikbaar is. Wanneer een van de twee of beide verouderen en de informatie niet meer leesbaar is, moet een oplossing worden gevonden. Daarnaast speelt ook de beperkte houdbaarheid van digitale informatie dragers een rol.17 Omdat dit een technische zaak betreft, vraagt dit om een technische beheersomgeving. Er zijn drie bekende technische bewaarstrategieën: Migratie, Emulatie, Normalisatie Migratie Bestanden worden overgezet van de ene hardwareconfiguratie of softwareapplicatie naar de andere. Het bestand wordt dan niet meer als een bitstream opgeslagen maar in een formaat dat gangbaar en geschikt is voor de toekomst. Een goed voorbeeld is wanneer we een tekst hebben getypt op een computer met Windows 95 software en deze willen openen op onze nieuwe computer met de software Windows 2007. We zullen dan eerst het Windows 95 bestand moeten converteren naar een Windows 2007 bestand, voordat we het kunnen lezen. Anders kan de computer de bitstream niet meer ‘lezen’. Migratie is gericht op het behoud van data, er zijn echter toch een aantal nadelen. Migratie moet elke ± twee jaar herhaald worden om te voorkomen dat dit bestandsformaat ook niet verouderd en niet meer toegankelijk is. Het leidt vaak tot verlies van informatie. De nieuwe software kan het bestand niet meer ‘lezen’ zoals het was. Er kunnen kenmerken als inhoud, structuur, uiterlijk of gedrag verloren gaan. Het verlies van informatie leidt uiteindelijk tot aantasting van de authenticiteit van het bestand.18 Emulatie Een andere manier om je digitale informatie te behouden voor de toekomst is emulatie. Volgens sommige mensen is dit de enige mogelijkheid om de authenticiteit en integriteit van een digitaal bestand op de lange termijn te behouden.19 17 Angevaare, Toekomst voor ons digitaal geheugen, 11. 18 http://www.nationaalarchief.nl/informatiebeheer-archiefvorming/-digitaal- archiefmateriaal/bewaarstrategie%C3%ABn/migratie (Migratie) (geraadpleegd: 22-09-2011) 19 http://www.nationaalarchief.nl/informatiebeheer-archiefvorming/-digitaal- archiefmateriaal/bewaarstrategie%C3%ABn/emulatie (Emulatie) (geraadpleegd: 22-09-2011) 16
  • 17. Bij emulatie blijft het oorspronkelijke bestand, bestaande uit het besturingssysteem en de software behouden. De bitstream wordt, in tegenstelling tot bij migratie, niet veranderd. Er wordt als het ware een software ontwikkeld die een nieuwe computer kan laten functioneren als een ouder model. De oorspronkelijke omgeving wordt dus nagebootst op een nieuwe computer.20 20 Ibidem. 17
  • 18. Normalisatie Dit is een techniek met als doel alle digitale informatie te converteren naar een zelfde bestandsformaat. Deze methode wordt voornamelijk gebruikt wanneer er is besloten niet alle bestandsformaten op te nemen in de digitale collectie.21 2.4.2 Veranderingen in de omgeving, hoe verder? Niet alleen het bewaren van digitale informatie is belangrijk. We moeten de digitale informatie als we ze teruglezen ook in een context kunnen plaatsen, zodat we de betekenis van de inhoud kunnen begrijpen. De ‘bitstream’ wordt pas informatie wanneer extra informatie over deze data beschikbaar is. Deze extra informatie geeft betekenis aan de data. We noemen deze extra informatie: metadata. Op deze manier wordt er context gecreëerd. Het beheren van de relevante metadata van digitale informatie is weer een extra uitdaging.22 Hier komt ook de problematiek rondom het beheren van de relevante metadata voor duurzaamheid aan het licht: De digitale objecten en de metadata worden beheerd in omgevingen waar in beperkte mate sprake is van professioneel IT-beheer. Het beheer van metadata richt zich vrijwel uitsluitend op de inhoud; het vastleggen van metadata noodzakelijk voor duurzaam beheer zoals het registeren van gebruikte formaten, herkomst- of referentie informatie of het vastleggen van een digitale ‘handtekening’ bij de objecten krijgt weinig aandacht. Dit deel van de problematiek van digitale toegankelijkheid is nog nauwelijks verkend. Enno Meijers geeft aan dat de markt, om deze problematiek te verkleinen, nog niet ver genoeg ontwikkeld is. Hij suggereert dat Digitaal Erfgoed Nederland deze markt kan ontwikkelen door hierin een sturende en stimulerende rol te spelen. Daarnaast geeft hij aan dat het beheren van de relevante metadata voor duurzaamheid ook op het terrein van inspelen op technologische veranderingen slaat. In België hebben ze in 2009 een product op de markt gebracht om de problematiek van metadata beheer voor duurzaamheid te verkleinen. Dit stappenplan ontwikkeld door Expertisecentrum DAVID uit Antwerpen, bevat een tiental praktische richtlijnen om de risico’s die duurzame toegankelijkheid van digitale informatie met zich meebrengt te verkleinen. Het focust zich voornamelijk op juist software gebruik en metadata beheer. Expertisecentrum DAVID Het stappenplan van het expertisecentrum DAVID in Antwerpen is gebaseerd op de functionele vereisten van digitale archivering en de bijbehorende maatregelen voor risicobeheer. 21 Angevaare, Toekomst voor ons digitaal geheugen, 25. 22 Meijers, Stapsgewijs naar duurzame toegang, 14. 18
  • 19. Digitaal archiveren wordt als een risicovol en kwetsbaar reconstructieproces gezien. Bij het bouwen en beheren van een digitaal archief gelden daarom vijf terugkerende basisprincipes23: 1. Vermijd (externe) afhankelijkheden. 2. Vermijdt overbodige reconstructiestappen. 3. Pas risicospreiding en –beheer toe. 4. Pas normen en standaarden toe. 5. Documenteer de implementatie en het beheer. Deze vijf basisprincipes vormen de basis voor de acties die voor elke stap worden uitgevoerd. Deze tien stappen zijn verdeeld in drie groepen: Groep 1 houdt zich bezig met de keuze en inrichting van de hard- en softwarearchitectuur. Groep 2 organiseert de functionaliteiten rondom leesbaarheid, authenticiteit en integriteit. De laatste groep documenteert het digitaal archiveringssysteem24. 1. Gebruik een betrouwbaar en beveiligd opslagsysteem en pas een adequaat beheer toe. 2. Bewaar de metadata op een digitaal duurzame wijze. 3. Voorzie een duurzame band tussen het document en zijn metadata. 4. Registreer voor elk digitaal object metadata. 5. Definieer en documenteer de essentiële eigenschappen van het originele document. 6. Bewaar de leesbaarheid van de digitale documenten. 7. Archiveer alle componenten die nodig zijn voor een getrouwe reconstructie van de documenten. 8. Documenteer het beheer van de digitale documenten. 9. Beschrijf de digitale documenten. 10. Documenteer het digitale archief. Dit stappenplan stelt iedere organisatie in staat een betrouwbaar digitaal archief op te stellen. 2.4.3 Veranderingen in de organisatie dankzij nieuw beleid De langetermijnzorg van digitale informatie vraagt om continue aandacht en zorg. De laatste jaren groeide het besef dat technische oplossingen niet voldoende zijn om de digitale risico’s die de duurzame toegang tot digitale informatie in gevaar brengen te beheersen. Om technische oplossingen te kunnen ontwikkelen en te implementeren zijn beleidsmatige en organisatorische randvoorwaarden nodig.25 Er moeten strategische keuzes binnen de organisatie worden gemaakt die een duurzaamheidstrategie implementeren. Deze strategische keuzes kunnen invloed hebben op de hele organisatiestructuur.26 23 Filip Boudrez, Een digitaal archief in 10 stappen, (Antwerpen: Expertise Centrum DAVID vzw, 2009), 1. 24 Boudrez, Een digitaal archief in 10 stappen, 2. 25 Angevaare, Toekomst voor ons digitaal geheugen, 25. 26 Meijers, Stapsgewijs naar duurzame toegang, 15. 19
  • 20. Er zijn diverse soorten beleidsmatige en organisatorische randvoorwaarden gedefinieerd. De volgende pagina’s beschrijven bestaande beheersmaatregelen die gebruikt zijn als instrument voor beleidsontwikkeling. Tot instrumenten voor beleidsontwikkeling behoren De BASIS van Digitaal Erfgoed Nederland, “Planning Tool for Trusted Electronic Repositories – PLATTER” door het project Digital Preservation Europe (DPE) en Business Model Innovatie ontwikkeld vanuit het Ministerie van OCW. De BASIS De culturele erfgoed sector vind deze randvoorwaarden voornamelijk in ‘de BASIS voor Duurzaamheid’ van DEN.27 Digitale toegankelijkheid op de lange termijn is een continu proces en begint al bij de creatie van het digitale bestand. De BASIS is een strategie waarin de technische- en ICT-infrastructuur beheersmaatregelen elkaar ontmoeten, die is gebaseerd op de kwaliteitscyclus van DEN en bestaat uit minimale eisen die elkaar in verschillende fasen opvolgen28. Fase 1: beleid ontwikkelen Iedere erfgoedinstelling die digitale informatie produceert moet denken aan een duurzaamheidstrategie. Bij het opstellen van een duurzaamheidbeleid moet rekening worden gehouden met vier aspecten: - Documentatie, het formuleren van een informatieplan. - Organisatie, de gehele organisatie is zich bewust van de betekenis van duurzaamheid - Middelen, er wordt budget gereserveerd. - Technische oplossing, welke systemen worden gebruikt? Eigen beheer ja/nee? Fase 2: plannen maken Er worden concrete plannen geformuleerd die gebaseerd zijn op het beleid om collecties te digitaliseren en digitale informatie te beheren. Hieraan worden een aantal eisen gesteld: - Wat wordt bewaard? Er dienen selectiecriteria opgezet te worden. - Criteria voor bestandsformaten, welke bestandformaten worden opgenomen? - Uitvoerbare plannen, check-check-dubbel check. - Kennis van externe voorzieningen, kijk eens bij de buren, hoe doen zij het? 27 http://www.den.nl/pagina/217/standaarden_en_richtlijnen/ (DE BASIS voor digitale duurzaamheid) (geraadpleegd: 26-07-2011) 28 Ibidem. 20
  • 21. Fase 3: uitvoering Concrete oplossingen voor duurzame toegankelijkheid tot digitale informatie moet aan een aantal eisen voldoen: - Kennisuitwisseling, er dient een aanspreekpunt binnen de organisatie te zijn. - Referentiemodel, wanneer een eigen ‘repository’ wordt gemaakt dient die volgens het OAIS-model te zijn opgezet. Fase 4: evaluatie Wanneer een erfgoedinstelling duurzame toegang tot digitale informatie nastreeft dient een evaluatie plaats te vinden die aan een basiseis voldoet: - Toetsing van een eigen ‘repository’ dient plaats te vinden met TRAC. De BASIS voor Duurzaamheid bestaat nu twee jaar en zal in 2011 geëvalueerd worden en indien nog aangepast. PLATTER Een ander goed werkende beleidsstrategie die duurzame toegang tot digitale informatie nastreeft is de “Planning Tool for Trusted Electronic Repositories - PLATTER” [DPE, 2008]. Dit is een instrument ontwikkeld door het project Digital Preservation Europe. Het heeft als doel te komen tot het formuleren van concrete, meetbare doelstellingen voor het digitaal archief.29 PLATTER richt zich op negen strategische plannen die samen een duurzaam beleid vormen ten opzichte van toegang tot digitale informatie die in verband worden gebracht met de tien Core Principles of Trust Repository Design30. 1. Business Plan – Financiële planning, monitoring en planning. 2. Acquistion Plan – Evaluatie beleid. Beheren van de relaties met aanbieders en andere leveranciers. 3. Staffing Plan – Aquisitie en onderhoud van relevante vaardigheden voor depotbeheer. 4. Acces Plan – Toegangsbeleid. Beheren van gebruikersrelaties. 5. Technical Plan – Doelen vaststellen voor hardware, software en netwerken. 6. Data Plan – Specificatie van data en metadata van objecten, formaten en structuren voor opname, opslag en verspreiding samen met de relevante transformaties en mappings. 7. Succession Plan – Beheren van contracten na verloop van het archief om digitale objecten te behouden voor de toekomst. 8. Disaster Plan – Reageren op veranderingen in het archiefsysteem. 9. Preservation Plan – Erop toezien dat de toegang en bruikbaarheid van de digitale objecten in 29 Meijers, Stapsgewijs naar duurzame toegang, 32. 30 Statsbiblioteket, HATII ed., Repository Planning Checklist and Guidance, (Glasgow: HATII, 2008), 9. 21
  • 22. Business Model Innovatie Als het om beleidsontwikkeling gaat, mag een Business Model niet vergeten worden. Ook niet bij ontwikkeling van beleid voor duurzame toegankelijkheid tot digitale informatie. Het bieden van duurzame toegang tot digitale informatie vraagt om financiële middelen. Voordat men investeert in duurzame toegang moet duidelijk zijn wat de baten zijn van deze toekomstige investering.31 Het Business Model dat besproken wordt in Business Model Innovatie, Cultureel Erfgoed van DEN, Kennisland en het Ministerie van OCW gaat uit van negen bouwstenen die in directe relatie tot elkaar staan.32 1. Propositie – Onderscheidend vermogen organisatie. 2. Klant – Klant is koning. 3. Distributie – Bepaald communicatie en ervaring klant. 4. Relatie 5. Opbrengsten – Bereidheid betaling klant. Volgt uit 4 voorgaande bouwstenen. 6. Activiteiten – Om propositie te kunnen realiseren. 7. Resources – Door organisatie zelf uit te voeren activiteiten. 8. Partners – Uitbesteding activiteiten. 9. Kosten – Kostenstructuur organisatie. Volgt uit bouwstenen 6 t/m 8. In de vorige pagina’s hebben we stil gestaan bij beheersmaatregelen die betrekking hebben op het te vormen beleid en de technologie die nodig is om de risico’s die de duurzame toegang tot digitale informatie in gevaar brengen te verkleinen. Beleidsmatige- en technologische beheersmaatregelen ontmoeten elkaar bij het inrichten van een stabiele interne infrastructuur. Het inrichten van een stabiele interne infrastructuur is het derde aspect van duurzaam beheren. Dit derde aspect is nog niet eerder genoemd als duurzaam beheersaspect, maar het kan als het ware als een sausje over de technologische- en beleidsmatige beheersmaatregelen worden gegoten. Duurzame toegang tot digitale informatie heeft o.a. te maken met interne infrastructuren. Wanneer deze stabiel zijn, kan dit tot zo min mogelijk verlies van informatie leiden.33 Het voor vrijwel iedereen bekende OAIS-model biedt een manier om een dergelijke stabiele interne infrastructuur binnen een collectiedatabase op te zetten. OAIS-model Het “Open Archival Information System (OAIS) Reference Model” [CCSDS, 2009] is een model dat een conceptueel begrippenkader introduceerde voor een architectuur voor duurzame toegang. Het is algemeen geaccepteerd en wordt over de hele wereld gebruikt. Het werd in 2000 ontwikkeld door 31 Meijers, Stapsgewijs naar duurzame toegang, 33. 32 De Niet, Heijmans en Verwayen e.a., Business Model Innovatie Cultureel Erfgoed, 16-18. 33 Meijers, Stapsgewijs naar duurzame toegang, 24. 22
  • 23. het Consultative Committee for Space Data Systems (CCSDS) van NASA. Tegenwoordig is het zelfs een ISO-standaard (ISO 14721 [Lavoie, 2004]).34 Het OAIS-model draait om het zogenaamde ‘Archive Information Package’ (AIP). Een digitaal object wordt opgenomen in het archief. Alle digitale objecten samen vormen het Archive Information Package. Het doel van het archief is dit AIP duurzaam toegankelijk te houden. Dit gebeurd aan de hand Figuur 1: OAIS Functioneel Model van de zes functies die in figuur 1 zijn gekaderd. Hieronder worden ze verder toegelicht35. ‘ingest’ Dit is het startpunt van het archiveringsproces. Het materiaal dat wordt aangeboden wordt beoordeeld op verschillende aspecten als kwaliteit, formaat en volledigheid die bepalen of het materiaal geschikt is voor opname in het archief. ‘storage’ Bij deze stap wordt gekeken naar de opslag van het digitale object en de bijbehorende metadata. Het is een continueproces waarbij veel aandacht is voor de conditie van de opslagomgeving en de opgeslagen gegevens. ‘data management’ De databeheer-functie zorgt voor de instrumenten voor het toekennen en onderhouden van alle metadata die nodig zijn voor het duurzaam beheer van het informatieobject. Dit gaat verder dan het alleen maar toekennen van metadata voor het ontsluiten; er is ook behoefte aan het vastleggen van formaattype, controlewaarden (‘fixity’), wijzigingshistorie (‘provenance’) en gebruiksvoorwaarden (‘access rights’). ‘access’ Dit wordt ook wel de raadpleeg functie genoemd. Hier wordt gezorgd voor de vindbaarheid en het toegang geven tot het digitale object. Hierbij worden wel de voorwaarden die bij de opname functie zijn vastgesteld aangehouden. ‘Access’ en ‘data management’ staan in nauw contact met elkaar. 34 Angevaare, Toekomst voor ons digitaal geheugen, 25. 35 Meijers, Stapsgewijs naar duurzame toegang, 26. 23
  • 24. ‘administration’ De zogenaamde coördinatie van het beheer is een veelomvattende taak. Het bevat o.a.: - bewaking van het opname proces, - configuratie management voor hard- en software, - proces monitoring, - documenteren en rapporteren over de opgeslagen objecten, - ontwikkelen en onderhouden archiveringsbeleid, - ondersteunen gebruikers. ‘preservation planning’ Deze functie verzorgt de evaluatie van het archief. Het speelt in op de veranderingen in technologie, of veranderingen van gebruikers en/of producenten. Op deze manier spoort men vroegtijdig eventuele risico’s op die kunnen optreden of kunnen de nodige aanpassingen aan het archief worden gemaakt. De introductie van het OAIS-model heeft veel invloed gehad op de manier waarop men omgaat met de problematiek rondom duurzame toegankelijkheid tot digitale informatie. Elke organisatie die nadenkt over duurzame toegankelijkheid tot de digitale informatie van haar instelling, wordt geacht de zes functies van het OAIS-model in haar beleid op te nemen.36 Naast deze beheersmaatregelen- die gebaseerd zijn op de drie aspecten van duurzaam beheren: beleid, inrichting en technologie- zijn er natuurlijk nog tal van andere beheersmaatregelen. Dit zijn echter de meest gehanteerde. Bovendien vormen deze beheersmaatregelen de basis voor het stappenmodel dat Enno Meijers in zijn master thesis heeft ontwikkeld. Dit wil ik graag gebruiken in deze scriptie om de koppeling naar het gebruik van Linked (Open) Data te leggen. 2.5 Strategisch Stappenmodel Enno Meijers heeft een stappenmodel ontwikkeld dat kleine- en middelgrote culturele erfgoedinstellingen in staat stelt aan de slag te gaan met de problematiek van duurzame toegankelijkheid tot digitale informatie. Het stappenmodel kan gebruikt worden als een ondersteunend middel bij het opstellen van maatregelen om de risico’s van verlies van digitale informatie te beperken.37 De maatregelen raken aan veel gebieden binnen de organisatie van de culturele erfgoedinstellingen: Ontwikkeling beleid, Inrichting ICT-infrastructuur, Beheersprocessen. 36 Angevaare, Toekomst voor ons digitaal geheugen, 25. 37 Meijers, Stapsgewijs naar duurzame toegang, 30. 24
  • 25. Om die reden zijn veel van de in paragraaf 2.4 besproken beheersmaatregelen verwerkt in het stappenmodel. We zien PLATTER, het OAIS-model en het stappenplan van Expertisecentrum DAVID terug in het stappenplan van Enno Meijers. “De toegevoegde waarde van het stappenmodel is het rangschikken van de stappen naar volgorde van urgentie met als leidraad de vijftien elementen uit het volwassenheidsmodel van Dollar.”38 Volwassenheidsmodel Het stappenmodel is gebaseerd op het volwassenheidsmodel van Charles M. Dollar. Het volwassenheidsmodel van Dollar: “Digital Preservation Capability Maturity Model” is gebaseerd op het bekende Capability Maturity Model Integration uit de IT, waarvan de basis in 1990 is ontwikkeld. Charles M. Dollar is een pionier op het gebied van duurzame toegankelijkheid.39 Dit volwassenheidsmodel voor digitale duurzaamheid bestaat uit vijftien kernfactoren. Deze zijn verdeeld in twee groepen. De ene groep omvat de factoren die gaan over de infrastructuur van digitale duurzaamheid. De andere groep bevat de processen die nodig zijn om duurzame opslag van en toegang tot digitale informatie te realiseren.40 De essentie van een volwassenheidsmodel is het inrichten van een cyclisch proces van verbetering om op deze manier een steeds hoger kwaliteitsniveau te bereiken. In het volwassenheidsmodel worden vijf niveaus gedefinieerd voor het vermogen voor duurzame toegang. De vijftien kernfactoren zijn vervolgens geordend Figuur 2: Digital Preservation Infrastructure and Processes naar urgentie en afname van risico op (Dollar, 2010) verlies van digitale informatie die verwerkt zijn in het strategisch stappenmodel.41 2.5.1 Opbouw van het stappenmodel Het stappenmodel bestaat uit drie delen. Deel A: Het bepalen van de ambitie van de organisatie. Deel B: Het veiligstellen van de digitale objecten. Deel C: Het duurzaam toegang bieden tot digitale informatie. 38 Meijers, Stapsgewijs naar duurzame toegang, 49. 39 http://www.digitaalallemaal.nl/?p=2061, (Blog van DEN)(geraadpleegd: 24-09-2011). 40 Meijers, Stapsgewijs naar duurzame toegang, 42. 41 Ibidem, 90. 25
  • 26. Aangezien ik in mijn scriptieonderzoek juist dieper in ga op het duurzaam toegang bieden tot digitale informatie zal ik hier alleen stil staan bij Deel C van het stappenmodel. Het gehele stappenmodel is te zien in Bijlage 1. 2.5.2 Deel C: Duurzaam toegang bieden In deel A en deel B van het stappenmodel was het doel langdurig toegang te bieden tot digitale informatie. Om dit te bereiken moeten de gebruikers eenvoudig over de informatie kunnen beschikken die voor hen relevant is. Bovendien moeten zij erop kunnen vertrouwen dat de informatie die zij vinden, betrouwbaar is. Hierin spelen twee processen een belangrijke rol. Metadata van een digitaal object zijn nodig om het object te kunnen vinden, er toegang tot te krijgen, het object betekenis te geven en de authenticiteit te kunnen bepalen. Veranderingen in de omgeving kunnen het digitale object in gevaar brengen als deze niet constant in de gaten worden gehouden, zodat men ziet of de digitale objecten of de collectiebeheerssystemen aangepast moeten worden. Bovenstaande is schematisch weergeven in figuur 3. Hierin zijn ook een aantal kernfactoren van het volwassenheidsmodel van Charles M. Dollar terug te zien. Figuur3: Deel C van het stappenmodel Enno Meijers. Stap 1 – duurzame toegang De eerste stap in dit deel is bedoeld om planmatig vast te stellen op welke manier de gebruikers informatie moeten kunnen vinden en gebruiken. Welke vorm van ‘ontsluiting’ is het meest geschikt voor de beoogde doelgroep? Welke maatregelen zijn er nodig om de duurzaamheid te waarborgen?42 Strategy Het antwoord op deze vragen kan worden verkregen door een plan voor duurzame toegang op te stellen dat als leidraad dient bij het verder concretiseren van de stappen om duurzame toegang tot digitale informatie te vergroten. Het ‘Acces Plan’, ‘Data Plan’ en ‘Preservation Plan’ van PLATTER kan hierbij gebruikt worden als voorbeeld van een dergelijk plan. Ook het stappenplan van 42 Ibidem, 60. 26
  • 27. Expertisecentrum DAVID haakt hier op in.43 43 Ibidem, 61. 27
  • 28. Designated Community Vanuit het perspectief van de gebruiker is het aan te raden om de informatie aan te bieden op basis van open standaarden, eenvoudig doorzoekbaar en met zo weinig mogelijk drempels. Gebruikers verwachten steeds sneller informatie te kunnen vinden. Zij gaan niet meer naar de informatie op zoek, maar er wordt verwacht dat de informatie naar hen komt. Informatie moet beschikbaar zijn op de plaatsen waar de gebruiker vaak komt. Google en allerlei verschillende ‘Social Media’ zijn hier een goed voorbeeld van. Access De aard van het object en het gebruikersdoel bepaald welke beschrijvende metadata aan het digitale object toegevoegd moeten worden. Naast de beschrijvende metadata zijn er nog een aantal andere soorten metadata die belangrijk zijn voor duurzame toegang tot digitale informatie. Hierover meer in stap 2: beheer van metadata. Open Standards Om veranderingen in de technologie, in productieprocessen van producenten of veranderingen in de context van de gebruikers op te vangen is het een goede keuze om open standaarden en open source software toe te passen. Hierop wordt ingegaan in stap 3: de veranderende omgeving.44 Stap 2 – Beheer van metadata Het beheer van metadata komt duidelijk terug in het OAIS-model. De data-beheer functie van het model definieert vijf verschillende soorten metadata die een rol spelen bij duurzame opslag en toegang tot digitale informatie.45 Referentie metadata Context metadata Onveranderbaarheid (‘fixity’) Herkomst (‘provenance’) Toegang (‘access’) Wat is nu precies kenmerkend aan deze verschillende soorten metadata? Referentiemetadata Het OAIS-model beschouwt ‘beschrijvende’ metadata als referentie metadata. Dit zijn metadata die een beschrijving geven van een bibliografie, object en/of archief. Onder dezelfde noemer schaart het OAIS-model ook de zogenaamde ‘persistent identifier’. Dit soort referentie metadata zorgt voor duurzame adressering van het Archief Informatie Pakket (AIP). Verwijzingen kunnen op deze manier een lange tijd geldig blijven. Welke ‘persistent identifier’ gebruikt dient te worden in de culturele erfgoedsector is nog een punt van discussie. De realisatie van een duurzame verbinding tussen het digitale object en haar beschrijvende metadata is niet eenvoudig. Het OAIS-model ziet deze twee elementen als onderdelen van het Archief 44 Ibidem, 61. 45 Ibidem. 28
  • 29. Informatie Pakket (AIP). De huidige collectiebeheerssystemen voorzien echter nog niet in deze denkwijze dat er een ondeelbare koppeling is tussen het digitale object en haar beschrijvende metadata. In afwachting van verdere ontwikkelingen in de komende jaren is het raadzaam om met periodieke controles de vindbaarheid te bewaken van zowel de metadata als de objecten en van de relaties onderling daartussen.46 Metadata ten behoeve van authenticiteit Zoals men door de jaren heen wijs is geworden, zo weet men ook dat digitale informatie kwetsbaar en eenvoudig te manipuleren is. Men hecht daarom tegenwoordig veel waarde aan de authenticiteit van het digitale object. Het aanbieden van openbare betrouwbare informatie sluit aan bij die behoefte aan authenticiteit.47 Voor het bewaren van de authenticiteit van het digitale object zijn twee aspecten belangrijk. De onveranderbaarheid of te wel ‘fixity’ van het digitale object en herkomst (‘provenance’) van het digitale object. De ‘fixity’ van het digitale object geldt als een controle voor de authenticiteit. Om de authenticiteit te waarborgen kan bijvoorbeeld een digitale ‘handtekening’ worden aangebracht. Deze wordt dan regelmatig gecontroleerd op vervalsing. De ‘provenance’ van het digitale object vertelt meer over de wijzigingen aan het AIP in het verleden, die in het verleden hebben plaatsgevonden. Overige metadata Er zijn nog twee soorten metadata te benoemen. Een daarvan is in 2009 opgenomen in het OAIS- model. ‘Context’ metadata worden door het Expertisecentrum DAVID als volgt omschreven: het beschrijven van de archiefvormer, het beschrijven van het werkproces waarbinnen het document een rol/functie vervulde, en het documenteren van de relatie met archiefbestanddelen en andere documenten.48 Een nieuwe soort metadata die in het OAIS-model benoemd wordt, is de ‘access rights’ metadata. Deze soort metadata beschrijft de voorwaarden waaronder het materiaal bewerkt mag worden voor duurzame opslag en opgevraagd mag worden door de gebruiker. Deze toegangsrechten worden bepaald bij de opname van het digitale object in het AIP.49 Zoals bij de ‘persistent identifier’ al duidelijk werd is er in veel collectiebeheerssystemen nog geen ruimte om ook de bijbehorende metadata van het digitale object op te nemen. Het koppelen en beheren van de metadata aan het digitale object is nog een lastige opgave, net als het bewaken van de authenticiteit. Dit vormt voor culturele erfgoedinstellingen een grote uitdaging. De juiste software die in staat is de metadata en het digitale object te koppelen bestaat nog niet. De bestaande softwaresystemen zijn geënt op opslag en archivering. Het accent ligt niet op het bieden van toegang tot digitale informatie. 46 Ibidem, 62. 47 Ibidem, 63. 48 Ibidem, 64. 49 Ibidem. 29
  • 30. Toch dient de relatie tussen metadata en object behouden te worden. Desnoods in een aparte administratie. De volgende ‘tips’ zouden kunnen bijdragen aan het beheren van de metadata. Eén mogelijkheid is het noteren van de metadata in XML-documenten. Dit gebeurt ook al met het digitale object. Dit zou het eenvoudiger maken de duurzame relaties tussen het digitale object en de bijbehorende metadata te beheren. Zorg ervoor dat de metadata van het digitale object onder dezelfde omstandigheden wordt opgeslagen en beheerd als het digitale object. Bij voorkeur worden deze twee ook in dezelfde opslagplaats beheerd. Tenslotte is het verstandig een collectiebeheersysteem te gebruiken dat in staat is om alle data in een open formaat te exporteren zonder tussenkomst van de leverancier. Zorg er in ieder geval voor dat de broncode van de software altijd beschikbaar blijft in de toekomst. Stap 3: de veranderende omgeving De IT-technologie is voortdurend aan verandering onderhevig. Het belangrijkste doel van duurzame toegankelijkheid is het leesbaar houden van de informatie. Het leesbaar kunnen houden van de digitale informatie is gekoppeld aan het bekend zijn met de definities van de gebruikte formaten. Om het risico te verkleinen dat binnen een organisatie niemand meer bekend is met de gebruikte formaten en software, kan besloten worden de digitale objecten tijdig te migreren naar een ander formaat. Hierbij gaat de voorkeur uit naar formaten die gebaseerd zijn op open standaarden. Zij hebben een duurzaam karakter omdat de formaatdefinities algemeen beschikbaar zijn. Ze worden breder ondersteund en kunnen vaak door meerdere softwareprogramma’s gelezen worden.50 Figuur 4: Open Standaarden, Een ander risico dat ingedekt kan worden is de kans dat een Open Source softwareleverancier failliet gaat en het collectiebeheerssysteem met hem ten onder gaat. Wanneer men gebruik maakt van open source software zal de broncode van de software altijd beschikbaar blijven en is de instelling niet afhankelijk van de softwareleverancier. Een handig bijkomend element is dat open source software de formaatdefinities ook documenteert dankzij de broncode. Daarom is het voor de duurzame toegang tot digitale informatie wenselijk zo veel mogelijk gebruik te maken van open standaarden en open source software. Naast deze technische ontwikkelingen dient er ook rekening gehouden te worden met veranderingen binnen de organisatie. Denk hierbij aan de doelgroep, maar ook aan de producenten van digitale informatie.51 50 Ibidem, 65. 51 Ibidem, 66. 30
  • 31. Tot zover Deel C: duurzaam toegang bieden. Dit deel van het stappenmodel van Enno Meijers vormt een aanleiding om Linked (Open) Data te introduceren als technologische verandering van de omgeving in hoofdstuk 4. Maar eerst zal ik de context waarin Linked (Open) Data thuis hoort scheppen in hoofdstuk 3. 3 Ontwikkelingen van het Web In de afgelopen twintig jaar heeft het Web een aantal grote ontwikkelingen doorgemaakt. We kennen allemaal de termen: Internet, social media, web 1.0 en web 2.0. Deze woorden duiden allemaal op deze ontwikkelingen van het Web. De laatste ontwikkeling binnen het Web is het Semantisch Web. 3.1 Wat is het Web? Met het Web wordt het World Wide Web bedoeld. Dit is een applicatie of dienst die gebruik maakt van het Internet. In tegenstelling tot wat veel mensen denken is het Web iets anders dan het Internet. Internet Het internet is het mondiale netwerk van aan elkaar gekoppelde computers. Het wordt gebruikt voor het versturen van informatie in pakketvorm (applicatie). Ieder netwerk bestaat uit computers die verbonden zijn via kabel of radioverbindingen. 52 Op dit systeem draaien vele applicaties of diensten. Het World Wide Web is hier een van. Andere bekende applicaties zijn: 53 E-mail, VoIP, FTP, UseNet Het Internet bestond en werkte al in de jaren zeventig. Het Internet werkt volgens twee zogenaamde Internetprotocollen. Internet Protocol (IP) en Transmission Control Protocol (TCP).Verschillende computers in diverse computernetwerken kunnen via de afspraken in deze Internetprotocollen met elkaar communiceren, waardoor een wereldwijd netwerk ontstaat.54 Het Web is een dus een applicatie of dienst die via het Internet functioneert. Het is een collectie van geschreven documenten en andere bronnen, die worden verbonden door hyperlinks en URL’s die verzonden zijn door Web-browsers en Web-servers. Hoe is het World Wide Web ontstaan? Het World Wide Web zoals wij dat nu kennen vindt zijn oorsprong in 1990. Het werd ontwikkeld door 52 Tim Berners-Lee, De wereld van het World Wide Web. Het oorspronkelijke ontwerp en de uiteindelijke bestemming van het World Wide Web, beschreven door zijn uitvinder, (Amsterdam: 2000), 18-19 + 222. 53 http://nl.wikipedia.org/wiki/Internet (Internet) (geraadpleegd: 25-08-2011). 54 Berners-Lee, De wereld van het World Wide Web, 18-19 + 222. 31
  • 32. Tim Berners-Lee. Het Web werd uitgevonden met de bedoeling om kennis en gegevens in zogenaamde datasets uit te wisselen tussen wetenschappers verspreid over de wereld. Tim Berners-Lee had de intentie om een Web te creëren dat vroeg om de participatie van haar gebruikers. Hij verwachtte in drie maanden een Web te ontwikkelen waarin de gebruikers alleen content konden afnemen en binnen acht maanden konden deze zelfde gebruikers ook zelf content toevoegen aan het Web. Dit gebeurde echter niet. Men kon alleen maar gelinkte documenten lezen. Het Web werd vrij eenzijdig gebruikt. Er werd informatie gepubliceerd die door gebruikers werd geconsumeerd. Men kon dus alleen lezen wat op dat moment beschikbaar was. Het Web waarin content werd aangeboden die enkel geconsumeerd kon worden ontwikkelde zich tien jaar voordat gebruikers hun content ook in het Web konden plaatsen. We hebben het hier dan over gebruikers zonder technologische kennis. Standaarden World Wide Web Tim Berners-Lee voegde twee al bestaande technologieën bij elkaar, namelijk: Internet, Hypertext. Internet is het overkoepelende netwerk van verschillende applicaties. En hypertext word gezien als een document met verwijzingen naar andere documenten die in een klik van de muis ‘gevolgd’ kunnen worden. Hieruit ontwikkelde hij drie essentiële technologieën. Hij bedacht het communicatie protocol HTTP, de opmaaktaal HTML en het idee van een Web-adres URL. Alle drie deze standaarden worden tegenwoordig nog steeds gebruikt en vormen samen de ruggengraat van het Web. 55 3.2 Het DNA van het Web Tegenwoordig heeft vrijwel iedereen toegang tot het Web. Doordat er zoveel gebruikers zijn is het Web zich gaan ontwikkelen. De ontwikkeling van het Web kent een aantal kenmerken. De ontwikkeling van het Web is grof in te delen in drie periodes van ± tien jaar, ook wel generaties genoemd: 1990-2000 World Wide Web 2000-2010 Social Web 2010-... Semantisch Web Wat zijn nu de belangrijkste kenmerken van deze zogenaamde generaties van het Web? Door welke vaak innovatieve ontwikkelingen zijn zij ontstaan? 55 Gesprek met Victor de Boer, postdoctoraal onderzoeker binnen de Web & Media Group aan de Vrije Universiteit Amsterdam, 22-07-2011. 32
  • 33. Volgens Nova Spivack - een prominente denker in het toekomstige Internet (met name Semantisch Web)- kennen deze generaties twee drijfveren, namelijk:56 Technologische drijfveer, Sociaal-economische drijfveer. Met technologie wordt bedoeld dat voornamelijk professionals zoals programmeurs en ingenieurs een rol spelen in deze innovatieve ontwikkelingen van het Web. De gebruikers spelen hier geen rol. In de jaren negentig werd het ‘Web’ uitgevonden door Tim Berners-Lee. Dit is een van de bekendste voorbeelden van een technologische drijfveer. Het sociaal-economische aspect als drijfveer draait veel meer om de participatie van de gebruiker bij het aanleveren van content. Social media toepassingen als Facebook en Twitter zijn een perfect voorbeeld van het sociale aspect, dat wordt ondersteund vanuit economisch opzicht. De gunstige economie zorgt ervoor dat rond 2000 bijna heel Nederland thuis een computer heeft en zich op het internet begeeft. De professionals hebben op dat moment niet meer het alleenrecht op het publiceren van content op het Web. Technologie en het sociale-economie kunnen dus worden gezien als de twee basisstrengen van het DNA van de innovatie van het Web. Deze twee zijn nooit los van elkaar te zien, maar zijn elkaars tegenhanger. Er is altijd sprake van een directe wisselwerking tussen beide DNA strengen. 57 Deze heeft ervoor gezorgd dat er een ware evolutie op het internet gaande is, die als een soort golfbeweging is ontwikkeld. De ontwikkeling van het Web was dus een puur technologische ontwikkeling van professionals op het gebied van ICT. Er kwamen voornamelijk ingenieurs en programmeurs bij kijken. De Figuur 5: Het DNA van web innovatie. gebruikers consumeerde de informatie die zij toegespeeld kregen. Zij konden helemaal niet mee beslissen welke informatie tot hun kwam. Achteraf gezien benoemen we deze ontwikkeling ook wel met het buzzwoord: ‘web 1.0’. 3.3 Het ‘Social Web’ Rond het jaar 2007 is het wat men noemt: het ‘Social Web’ ontstaan. Het Web werd inmiddels door 56 http://www.frankwatching.com/archive/2009/01/05/web-webber-webst-van-10-naar-30%E2%80%A6-en- verder/ (Onafhankelijk crossmedia platform)(geraadpleegd: 26-08-2011) 57 http://www.frankwatching.com/archive/2009/01/05/web-webber-webst-van-10-naar-30%E2%80%A6-en- verder/ (Onafhankelijk crossmedia platform)(geraadpleegd: 26-08-2011) 33
  • 34. miljoenen mensen gebruikt. Al deze gebruikers van het Web creëerden een nieuw inzicht. Men ontdekte dat de huidige infrastructuur van het internet ook gebruikt kon worden om iets van de consument terug te krijgen.58 Interactief Actief is het woord van het ‘Social Web’. De infrastuctuur van het Web verandert van eenrichtingsverkeer naar tweerichtingsverkeer. De gebruiker kan interactief zijn met het Web. 58 Ivo Zandhuis, ‘Fundamenten in verandering: archieven op het semantisch web’, Archievenblad, (mei 2010), 1. 34
  • 35. In de vorm van ‘Social Media’, wordt er interactief deelgenomen aan het Web: Social tagging, Weblogs, Delen van foto’s, Reageren op elkaars berichten/foto’s, Publiceren van content. De gebruiker consumeert nu niet alleen meer, maar produceert nu ook. Er ontstaat een zogenaamde ‘prosumer’. In navolging van de technologische golfbeweging die de ontwikkeling van het Web was, speelt juist het sociaal/economische aspect een rol bij de ontstaan van ‘het sociale Web’. Het ‘Social Web’ is gericht op de gebruiker, je ziet dat de technologie dan ook de functionaliteit volgt. Niet langer gaat het om de techniek van het Web, maar gaat het over een concept dat betrekking heeft op het gebruik van webapplicaties door mensen. Het ‘Social Web’ is voor de zelfstandige activiteit van het publiek.59 Toen het tweerichtingsverkeer eenmaal op gang was, verspreidde het ‘Social Web’ zich als een lopend vuurtje. Verschillende zogenaamde ‘Social Media’ als Twitter, Facebook, Hyves etc. kwamen op en men nam hieraan deel. Het succes van het ‘Social Web’ is volgens Haustein en Pleumann te danken aan twee factoren:60 Participeren op het Web was eenvoudig, De resultaten van de participatie op het Web werd direct zichtbaar voor de gebruiker. De drempel om te participeren binnen het ‘Social Web’ is erg laag. Participeren kan al door een klein beetje content te delen. Je kunt rustig de kat uit de boom kijken en later meer content toevoegen. Het gaat erom dat je participeert, dat je het tweerichtingsverkeer op gang houdt. Bovendien groeit de waarde van de content wanneer mensen content publiceren over datzelfe onderwerp.61 Hier geldt het principe: the wisdom of the crowd. Al deze inspanningen op het Web zijn direct terug te zien en kunnen we als resultaat van onze inspanningen beschouwen. Dat zorgt voor een voldaan gevoel. Jij draagt bij aan het Web. 3.4 Het Semantisch Web De term Semantisch Web is niet nieuw. Deze is al in de jaren ‘90 geïntroduceerd. In tegenstelling tot - wat men inmiddels aanduidt met de buzzwoorden web 1.0 en web 2.0, is het geen menselijke interface, waarbij het gaat om de presentatie van de informatie die gericht is op mensen en waarbij tekst, grafische vormgeving en usability van belang zijn. 59 Zandhuis, ‘Fundamenten in verandering: archieven op het semantisch web’, 2. 60 Seamus Ross, ‘Position Paper’, DigiCULT Thematic Issue 3 – Towards a Semantic Web for Heritage Resources, (Oostenrijk: 2003), 9. 61 Ross, ‘Position Paper’, 10. 35
  • 36. Het Semantisch Web is een computerinterface. In 2007 beschreef Christine Karman het Semantisch Web als volgt: Web 3.0, het semantisch web, onderscheidt zich van het huidige www doordat er structuur in is aangebracht en doordat aan alle stukjes informatie meta-informatie is gekoppeld die automatische interpretatie mogelijk maakt. Het woordt semantiek wordt gebruikt omdat als het ware de betekenis van een woord, of van een stukje informatie, is mee-opgeslagen met het woord zelf. Dat maakt het navigeren op het web eenvoudiger, niet alleen voor ons mensen maar met name voor systemen. Informatiesystemen ‘begrijpen’ immers niet wat ze lezen, maar in het semantisch web wordt een deel van dat begrip als het ware meegeleverd, waardoor een systeem de informatie een beetje kan ‘begrijpen’.62 Tim Berners-Lee had met de ontwikkeling van het World Wide Web eigenlijk een Semantisch Web voor ogen. Hij wilde een datamodel ontwikkelen dat een informatiestructuur herbergt dat over de grenzen van de individuele instellingen heen gaat. Na ongeveer twintig jaar lijkt het er dan nu toch van te komen. Ik zeg expliciet lijkt, want er zijn nog steeds een hoop ontwikkelingen gaande en nog niet iedereen is blij met het Semantisch Web zoals het nu is. Hoe werkt het? De sleutel tot het realiseren van de visie van het Semantisch Web is semantische interoperabiliteit van de Web-resources.63 Om deze werkelijkheid te laten worden dient er een grote omslag plaats te vinden in de manier waarop data, informatie en kennis nu zijn gerepresenteerd op het Web. Begrippenkader Om de visie van het Semantische Web te verduidelijken zal ik hier eerst de twee belangrijkste begrippen beschrijven die deze visie ondersteunen. Semantiek se - man` tiek («Frans«Grieks) de -woord (vrouwelijk) taalkunde leer van de betekenis en betekenisveranderingen64 Interoperabiliteit is de eigenschap van systemen en software om data uit te wisselen met externe systemen via een gemeenschappelijke set procedures.65 De huidige situatie op het Web laat te veel content zien die niet tot nauwelijks beschreven is om met elkaar in verband gebracht te kunnen worden. Hierdoor wordt deze content informatie niet gevonden en hergebruikt. Wanneer deze volgens de principes van het Semantisch Web zouden zijn ontsloten, zouden geautomatiseerde gegevensverwerkingsprogramma’s de informatie kunnen vinden, interpreteren en hergebruiken.66 62 www.sync.nl/web-30/, (Definitie Semantisch Web van Christine Karman)(geraadpleegd: 14-06-2011) 63 Geser Guntram, ‘A Cultural Heritage Semantic Web Example & Primer’, DigiCULT Thematic Issue 3 – Towards a Semantic Web for Heritage Resources, (Oostenrijk: 2003), 3. 64 http://www.encyclo.nl/begrip/semantiek (Semantiek)(geraadpleegd: 27-09-2011) 65 http://www.den.nl/thema/10/interoperabiliteit (Interoperabiliteit)(geraadpleegd: 27-09-2011) 66 Ross, ‘Position Paper’, 7. 36
  • 37. Dit kan worden gerealiseerd door beschrijvende metadata aan de informatie en de resources toe te voegen. Vervolgens dient de content en de metadata op een gestructureerde en consistente manier aangeboden te worden op het Web om een intelligenter Web te ondersteunen.67 Het Semantisch Web wordt wel gepresenteerd als een zeer complexe en uitgebreide visie van een intelligent web. Dit is terug te zien in figuur 2. In de layer-cake is te zien hoe de meer semantische lagen van het Semantisch Web bouwen op minder semantische. Het is zo complex vanwege de stappen die nodig zijn om een Semantisch Web mogelijk te maken. Elke stap kent haar eigen standaarden. Het transformeren van contentinformatie en metadata naar semantische interoperabiliteit gebeurd in twee fases. We onderscheiden de syntactische fase en de semantische fase. Figuur 6: Enabling technologies - layer cake. Het syntactische deel bestaat uit het onderste deel van de layer-cake. Het gaat hier om XML- documenten die een unieke naam en plaats hebben (URI). In de laag hierboven speelt het RDF-datamodel een rol. Het bouwt voort op XML en URI’s en bestaat uit subject-predicaat-objectrelaties (triples). Op deze manier wordt de layer-cake steeds meer semantisch. Standaarden die hier gebruikt worden zijn bijvoorbeeld Dublin Core, SKOS en FOAF. Het semantische deel begint bij het gebruiken van ontologieën. Ik sta hier wat langer stil bij het begrip ontologie vanwege het feit dat ontologieën zijn bedoeld om de betekenis, oftewel de semantiek, vast te leggen van de concepten van de triples. De ontologieën maken het Web semantisch. Ontologie Een ontologie is een triple die is bedoeld om uit te leggen hoe de computer de informatie kan gebruiken.68 Het is te vergelijken met het RDF-datamodel of een metadataschema. Er zijn een aantal standaardontologieën: RDFS, OWL, 67 Ibidem, 7. 68 Zandhuis, ‘Fundamenten in verandering: archieven op het semantisch web’, 2. 37
  • 38. OWL2 De ontologieën leggen steeds preciezer vast wat met de onderdelen van de triple wordt bedoeld. Er wordt bijvoorbeeld vastgelegd wat de relaties binnen een familie betekenen: De computer moet nu weten dat in een bepaalde stamboom de moeder niet altijd dezelfde persoon is. De moeder kan meerdere namen hebben. Dit is iets dat wij mensen weten, maar dat een computer ‘vertelt’ moet worden. Hier zijn de ontologieën o.a. voor, maar het wordt steeds complexer. Naarmate we ons meer in het bovenste deel van de layer-cake bevinden wordt de complexiteit groter. Dit deel van de layer-cake omvat de visie van het Semantische Web. Omdat de computerinterface steeds meer als een mens moet denken worden de betekenis systemen ook steeds complexer. 69 Door de complexiteit zijn er nog geen concrete goed functionerende praktijkvoorbeelden te noemen die de volledige Semantische Web visie dragen. Wat we wel zien in de praktijk is het Linked Data principe van Tim Berners-Lee. Deze technologie is gebaseerd op de lagen van de layer-cake in figuur 2, tot en met de ontologieën. Over Linked (Open) Data zal ik in hoofdstuk 4 meer vertellen. Er zijn dus drie web-generaties te onderscheiden. De drie generaties lopen als het ware parallel aan elkaar. Het ‘Social Web’ houdt niet op te bestaan na 2010. Het blijft parallel lopen met het Semantisch Web. Ditzelfde geldt voor het World Wide Web, het is er nog steeds en kan niet als ‘dood’ worden beschouwd nu het ‘Social Web’ en het Semantisch Web bestaan.70 69 Gesprek met Victor de Boer, 08-09-2011. 70 E-mailwisseling met Victor de Boer, 30-09-2011. 38
  • 39. 4 Linked Open Data Linked (Open) Data wordt ook wel de praktijk van het Semantisch Web genoemd. Linked (Open) Data is een pragmatische manier om een praktische bijdrage te leveren aan het Semantisch Web.71 Praktisch vanwege de toepasbaarheid van Linked (Open) Data. In dit hoofdstuk meer over de toepasbaarheid van Linked (Open) Data en de overeenkomsten tussen deze technologie en de beheersmaatregelen voor duurzame toegang tot informatie, zoals beschreven in Deel C van het strategische stappenplan van Enno Meijers. De termen waaruit Linked Open Data bestaat sluiten perfect aan op de erfgoedsector. Om te beginnen Data. Data is onze digitale informatie. Informatie die al jaren door erfgoedinstellingen wordt verzameld en die de erfgoedsector een autoriteit van kennis in de samenleving maken. Open wijst naar de huidige tendens in de samenleving dat informatie van publieke instellingen openbaar moet zijn: de open access beweging. Nu alleen gegoten in een ander jasje. Niet fysiek, maar digitaal. Deze openheid stimuleert het hergebruik van data. De informatie die we al jaren verzamelen. Linked wijst op waardecreatie met als gevolg meer betekenis. Dankzij het hergebruik worden er nieuwe koppelingen gemaakt en ontstaat er meer context. Wat uiteindelijk zorgt voor meer betekenis.72 4.1 Wat is Linked (Open) Data? Linked (Open) Data is een nieuwe technologie die een intelligenter web ondersteunt. Tot nu toe werden bij het koppelen van informatie standaarden gebruikt voor de verpakking van de informatie. Linked (Open) Data koppelt informatie door middel van standaarden die gebruikt worden voor de inhoud van de informatie.73 In plaats van de buitenkant, de binnenkant dus. Op het Web worden documenten gekoppeld door links. Deze links hebben geen betekenis. Ze laten niet zien wat de relatie is tussen de twee documenten die gekoppeld zijn. Alleen dat er een relatie is. Je moet dus zelf uitzoeken wat de relatie tussen die twee documenten is. Bij Linked (Open) Data geldt het principe dat de relatie tussen twee documenten betekenisvol moet zijn. Die betekenis ontstaat door elk woord uit het Webdocument als concept uniek te maken en te beschrijven in subject-predicaat-objectrelaties (triples). Een woord als bijvoorbeeld de stad Amsterdam is dan een concept dat meerdere relaties kan krijgen met andere concepten. Het subject, predicaat en object zijn dan dus ook concepten. Elk concept wint aan betekenis naarmate er meer beschrijvingen aan gekoppeld worden. Op deze manier worden webdocumenten betekenisvol en worden zoekresultaten nauwkeuriger.74 Dat is de kracht van Linked (Open) Data. 71 http://www.den.nl/thema/129/ (Linked Open Data) (geraadpleegd: 09-06-2011) 72 http://www.den.nl/blog/bericht/3027 (DCL11: Autoriteit, hergebruik en betekenis van linked data) (geraadpleegd: 22-06-2011) 73 http://digitaalduurzaam.blogspot.com/ (‘Linked Data’ – wat is dat nu eigenlijk precies?’)(geraadpleegd: 28- 07-2011) 74 http://www.den.nl/thema/129/ (Linked Open Data) (geraadpleegd: 09-06-2011) 39
  • 40. Schematisch is dat als volgt weer te geven.75 X is de schilder van Y X is getrouwd met Z X is afkomstig uit W X, Y, Z en W zijn hierin de concepten. De relaties die tussen de concepten zijn beschreven zijn betekenisvol, want ze vertellen hoe de concepten met elkaar verband houden. Om nauwkeurig te kunnen zoeken in de enorme hoeveelheid informatie op het Web is zoeken op basis van betekenis onontkoombaar. Er is echter een probleem. De betekenis van mensen, dingen en gebeurtenissen kan variëren. Mensen kunnen bedenken welke betekenis iets heeft, dankzij de context. Computers kunnen dit echter niet. Linked (Open) Data is een techniek om machine-leesbare context te genereren.76 4.2 Wat is de meerwaarde voor de erfgoedsector? Wat is nu de meerwaarde van Linked (Open) Data en wat levert het op voor de erfgoedsector? Zoals hierboven al genoemd werd, koppelt Linked (Open) Data niet de verpakking, maar de inhoud aan elkaar. De belangrijkste meerwaarde van Linked (Open) Data voor de erfgoedsector is voornamelijk interoperabiliteit. Hiermee bedoelen we het kunnen koppelen van objecten uit verschillende collecties en het koppelen aan data die van buiten de culturele sector afkomstig zijn door middel van een gemeenschappelijke set procedures.77 De Europeana database is hier een uitstekend voorbeeld van. Een andere meerwaarde is dat de zichtbaarheid van de collecties wordt vergroot. Voor zoekmachines geldt dat zij beter in staat zijn de data te indexeren wanneer data de Linked Data ‘standaard’ draagt. Er ontstaat de mogelijkheid om met één zoekopdracht relevante resultaten te vinden uit meerdere collecties, ook al is de informatie niet overal hetzelfde geschreven. Op deze manier komt de informatie dus min of meer naar de gebruiker toe. De gebruiker hoeft niet meer zelf opzoek te gaan.78 Figuur 7: Logo Europeana. 75 http://digitaalduurzaam.blogspot.com/ (‘Linked Data’ – wat is dat nu eigenlijk precies?’)(geraadpleegd: 28- 07-2011) 76 Ibidem. 77 http://www.den.nl/thema/129/ (Linked Open Data) (geraadpleegd: 09-06-2011) 78 http://digitaalduurzaam.blogspot.com/ (‘Linked Data’ – wat is dat nu eigenlijk precies?’)(geraadpleegd: 28- 07-2011) 40