Voorgoed vastgelegd? archiveren van websites
Upcoming SlideShare
Loading in...5
×
 

Voorgoed vastgelegd? archiveren van websites

on

  • 1,157 views

Presentation given at 30 november in Amersfoort at the Rijksdienst voor Cultureel Erfgoed

Presentation given at 30 november in Amersfoort at the Rijksdienst voor Cultureel Erfgoed

SIMIN/OKBN Najaarsdag
Born-digital: (hoe) bewaar je dat?

Statistics

Views

Total Views
1,157
Views on SlideShare
1,155
Embed Views
2

Actions

Likes
0
Downloads
4
Comments
0

1 Embed 2

http://www.slideshare.net 2

Accessibility

Upload Details

Uploaded via as Microsoft PowerPoint

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

Voorgoed vastgelegd? archiveren van websites Voorgoed vastgelegd? archiveren van websites Presentation Transcript

  • Voorgoed vastgelegd? Archiveren van websites Peter van Wijngaarden
  • Indeling
    • Wat is een website ??
    • Waarom zouden we websites willen bewaren…?
    • Hoe archiveren we websites en hoe bewaren we websites?
  • Wat is een website ?
    • Definitie in Van Dale groot woordenboek hedendaags Nederlands:
    • “ de plaats waar bepaalde informatie zich op het world wide web bevindt, aangeduid met een URL”.
  • Wat is een website ?
    • Statisch : de website is aanbodgericht, de pagina’s verschijnen altijd op dezelfde (door de ontwerper bepaalde) manier op het beeldscherm
    • Dynamisch : de pagina’s worden afhankelijk van de vraag van de bezoeker van de site opgebouwd . (‘ on the fly’)
  • Waarom zouden we websites willen bewaren ??
    • Overheidswebsites bieden online formulieren en e-loketfuncties
    • Organisaties communiceren via websites met de buitenwereld over hun beleid, bevoegdheden en dienstverlening
    • Privé personen en ook kleine organisaties beschikken over een eigen website en vooral deze websites bevatten vaak informatie die elders niet beschikbaar is en waarvan het nuttig is om te bewaren.
  • Waarom zouden we websites willen bewaren?
    • Het Unesco ‘Charter on the Preservation of the Digital Heritage’ rekent websites expliciet tot ons digitaal erfgoed.
    • Dit digitale erfgoed is van belang voor toekomstig onderzoek naar de ontwikkeling van het web en onze samenleving .
  • Webarchivering en Webharvesting
    • Webharvesting : het selecteren van relevante informatie (websites in dit geval) en het binnenhalen daarvan met behulp van speciale applicaties.
    • Webarchivering : het duurzaam opslaan, beheren en toegankelijk maken van de websites.
  • Selectie
    • Internet archive: Way Back Machine
    • http://www.archive.org/web/web.php
  • Selectie
    • Het collectieprofiel voor analoge documenten is bijna gelijk aan het collectieprofiel voor digitale documenten, incl. websites
    • Een website is slechts een verschijningsvorm van een informatiedrager
    • Als we de via de website aangeboden informatie ook zouden willen bewaren als deze wordt aangeboden op papier of een andere drager kan dat een reden zijn deze website te bewaren…
  • Hoe archiveren we websites ? 27 november 2009
  • Afbakenen
    • Bepalen wat een website maakt tot wat hij is, b.v. de functie die de website heeft in werkprocessen.
    • Is het een presentatiemedium, een portaal naar andere informatiebronnen of een transactiemedium?
    • Of is het gewoon een interessante site van een privé persoon
    • Daarna analyseren welke elementen van de website behouden moeten blijven om er voor te zorgen dat de authenticiteit overeind blijft .
  • De authenticiteit van een website wordt bepaald door :
    • Integriteit : de website is intact en niet zodanig veranderd of gecorrumpeerd dat de betekenis ervan niet meer duidelijk is. Wijzigingen zijn aanvaardbaar, zolang de oorspronkelijke betekenis of functie van het document er niet door wordt aangetast.
    • Verifieerbaarheid : Het is mogelijk vast te stellen dat de website is wat het beweert te zijn. Om dit mogelijk te maken is context informatie nodig. Deze informatie wordt later vastgelegd in metadata .
    27 november 2009 Voorgoed vastgelegd?
  • Plan van aanpak
    • In kaart brengen en selecteren van de te acquireren websites.
    • Contact leggen met de webmaster
    • Brief naar website eigenaar
    • Analyseren van de websites en opstellen van authenticiteits- en integriteitseisen per website
    • Verzamelen gegevens ten behoeve van metadata.
    27 november 2009
  • Problemen in overvloed
  • Frequentie van de snapshots
    • In principe wordt jaarlijks één snapshot van een website genomen.
    • Bij het nemen van meerdere snapshots per jaar rekening houden met de relevantie van de betreffende website.
    • Inmiddels zijn 268 verschillende websites gearchiveerd
  • Frequentie
    • De frequentie van de te nemen snapshots varieert: 
    • Per jaar                                               234
    • Per half jaar                                            3
    • Per kwartaal                                           1
    • Maandelijks                                            1
    • Wekelijks                                               1  
    • Eenmalig                                              6
    • Meerjaarlijks (politieke partijen)       22
    •                                                           
  • Opslagkosten
    • De opslagkosten per Gb (gigabyte) bedragen € 1,50 per jaar, inclusief backup en beheer.
    • Opslag van één Tb (terabyte) kost € 1500 per jaar
    • Voor duurzame opslag in een E-depot moet speciale software worden aangeschaft en dan kunnen de kosten aanzienlijk stijgen.
  • Maar dan…..! 27 november 2009
  • Digitale opslag
    • Een SIP is een pakketje digitaal materiaal met een XML bestand aan metadata.
    • Deze SIP’s worden opgeslagen in het E-depot als AIP (Archival Information Package).
  • Digitale opslag : AIP en DIP
    • Een AIP (Archive Information Package) is een digitaal informatie-object met de noodzakelijke toegevoegde metadata zoals die worden opgeslagen voor lange termijn bewaring in het depot.
    • Voor de beschikbaarstelling wordt een kopie gemaakt van de AIP, minus een aantal voor de gebruiker niet relevante metadata en dat noemen we dan een DIP (Dissemination Information Package)
  • Vragen …..
    • Voor wie behoeft heeft aan meer informatie:
    • [email_address]
    • 010 - 2672560