Webarchivering in de KB door René Voorburg
Upcoming SlideShare
Loading in...5
×
 

Webarchivering in de KB door René Voorburg

on

  • 1,418 views

Presentation given at 30 november in Amersfoort at the Rijksdienst voor Cultureel Erfgoed

Presentation given at 30 november in Amersfoort at the Rijksdienst voor Cultureel Erfgoed

SIMIN/OKBN Najaarsdag
Born-digital: (hoe) bewaar je dat?

Statistics

Views

Total Views
1,418
Views on SlideShare
1,415
Embed Views
3

Actions

Likes
0
Downloads
5
Comments
0

1 Embed 3

http://www.slideshare.net 3

Accessibility

Categories

Upload Details

Uploaded via as Microsoft PowerPoint

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

Webarchivering in de KB door René Voorburg Webarchivering in de KB door René Voorburg Presentation Transcript

  • Webarchivering op de KB René Voorburg [email_address]
  • Presentatie Webarchivering op de KB
    • Waarom: achtergrond webarchivering op de KB
    • Hoe & wat: de praktijk van webarchivering op de KB
    • Vragen?
  • Deel 1: Achtergrond webarchivering op de KB
  • KB en de nationale biografie
    • KB opgericht in 1798 als nationale bibliotheek
    • Vorming depot van publicaties om nationale erfgoed in gedrukte vorm te verzamelen, te bewaren en te beschrijven
    • Sinds 1974 wordt van iedere publicatie die in Nederland verschijnt één exemplaar verzameld voor permanente bewaring en beschikbaarstelling.
  • Publicaties Objecten in het internettijdperk
    • Publicaties steeds vaker digitaal, dikwijls zonder (equivalente) gedrukte variant
    • Traditionele onderscheid tussen drukwerk en audiovisuele uitingen steeds moeilijker vol te houden
    • Internet is hét publicatiemedium geworden van deze tijd.
  • Webarchivering
    • Internet is hét publicatiemedium, de cultuurdrager geworden van deze tijd, een unieke bron van informatie over praktisch iedere aspect van de samenleving
    • Het web groeit hard, maar sites en pagina´s verdwijnen ook snel. Gemiddelde pagina ´leeft´ 100 dagen
    • Linkrot is een alledaags, herkenbaar fenomeen
    • Wie neemt verantwoordelijkheid ?
  • De digitale bibliotheek
    • Sinds 2003 is het e-depot operationeel, voor bewaren en duurzaam toegankelijk maken digitale objecten
    • Sinds 2006 is de KB actief met archiveren van een selectie Nederlandse websites
    • Websites zullen duurzaam opgeslagen worden in het e-depot.
  • Het e-depot
    • Veilige en duurzame opslag
    • Registratie (metadata)
    • Hulpmiddelen voor duurzame toegang.
  • Deel 2: De praktijk van webarchivering op de KB
  • Proces webarchivering op de KB
    • i. Selectie
    • ii. Toestemming eigenaar via opt-out
    • iii. Harvesting
    • iv. Kwaliteitscontrole
    • v. Archivering (e-depot)
    • vi. Beschikbaarstellen (online webarchief).
  • i. Selectie 1/2
    • Basis collectiebeleid KB, “alles van en over Nederland”
    • maatschappelijk belang evident
    • kwaliteitseisen
    • iha geen sites individuen (ivm ‘hobbysfeer’)
    • geen puur commerciële sites
    • geen radicale of abjecte sites
    • geen databases
    • geen kranten
    • geen dubbelingen met Archipol, R’dam, I. v. Beeld & Geluid, Sinologie UBL.
  • i. Selectie 2/2
    • Selectie per vakgebied
    • Momenteel vooral (cultuur-) geschiedenis, overheids-administratie, literaire auteurs en rechten
    • Kunst op het web nu nog niet behandeld
    • Selectie is arbeidsintensief!
  • ii. Toestemming eigenaar
    • Per e-mail
    • Volgens opt-out principe
    • Deel reageert, voornamelijk (zeer) positief, een enkeling afwijzend.
  • iii. Harvesting
    • Configuratie en beschrijving via ‘Web Curator Tool’
    • titel
    • contactadres
    • seed URLs
    • UNESCO-code
    • schedule
    • eventuele annotaties
    • Harvesting door ‘Heritrix’.
  •  
  • iv. Kwaliteitscontrole
    • Wat kan er mis gaan:
    • Interactieve content afhankelijk van techniek niet altijd (goed) te archiveren (mn. serverinteracties zoals zoeken, AJAX, complexe javascripts, flash)
    • ‘ Oneindige’ websites door technische fouten of specifieke functionaliteit (bv.agenda)
    • Ontbrekende vormgeving of content door robots.txt
    • URLs die niet uniek zijn (mn. bij taalswitch)
    • Onvolledige configuratie van het pagina-domein
    • Te ruime configuratie van het pagina-domein.
  •  
  •  
  •  
  • v. Archivering in e-depot
    • Opslag als (W)ARC-bestanden
    • Samen met beschrijvende metadata & technische metadata (via METS.xml).
  • vi. Online webarchief
    • Beschikbaar begin 2010?
  •  
  •  
  •  
  •  
    • Vragen?
    • René Voorburg / [email_address]
    vragen? rene.voorburg @kb.nl