Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

0

Share

Download to read offline

Voorgoed vastgelegd? archiveren van websites

Download to read offline

Presentation given at 30 november in Amersfoort at the Rijksdienst voor Cultureel Erfgoed

SIMIN/OKBN Najaarsdag
Born-digital: (hoe) bewaar je dat?

 • Be the first to like this

Voorgoed vastgelegd? archiveren van websites

 1. 1. Voorgoed vastgelegd? Archiveren van websites Peter van Wijngaarden
 2. 2. Indeling <ul><li>Wat is een website ?? </li></ul><ul><li>Waarom zouden we websites willen bewaren…? </li></ul><ul><li>Hoe archiveren we websites en hoe bewaren we websites? </li></ul>
 3. 3. Wat is een website ? <ul><li>Definitie in Van Dale groot woordenboek hedendaags Nederlands: </li></ul><ul><li>“ de plaats waar bepaalde informatie zich op het world wide web bevindt, aangeduid met een URL”. </li></ul>
 4. 4. Wat is een website ? <ul><li>Statisch : de website is aanbodgericht, de pagina’s verschijnen altijd op dezelfde (door de ontwerper bepaalde) manier op het beeldscherm </li></ul><ul><li>Dynamisch : de pagina’s worden afhankelijk van de vraag van de bezoeker van de site opgebouwd . (‘ on the fly’) </li></ul>
 5. 5. Waarom zouden we websites willen bewaren ?? <ul><li>Overheidswebsites bieden online formulieren en e-loketfuncties </li></ul><ul><li>Organisaties communiceren via websites met de buitenwereld over hun beleid, bevoegdheden en dienstverlening </li></ul><ul><li>Privé personen en ook kleine organisaties beschikken over een eigen website en vooral deze websites bevatten vaak informatie die elders niet beschikbaar is en waarvan het nuttig is om te bewaren. </li></ul>
 6. 6. Waarom zouden we websites willen bewaren? <ul><li>Het Unesco ‘Charter on the Preservation of the Digital Heritage’ rekent websites expliciet tot ons digitaal erfgoed. </li></ul><ul><li>Dit digitale erfgoed is van belang voor toekomstig onderzoek naar de ontwikkeling van het web en onze samenleving . </li></ul>
 7. 7. Webarchivering en Webharvesting <ul><li>Webharvesting : het selecteren van relevante informatie (websites in dit geval) en het binnenhalen daarvan met behulp van speciale applicaties. </li></ul><ul><li>Webarchivering : het duurzaam opslaan, beheren en toegankelijk maken van de websites. </li></ul>
 8. 8. Selectie <ul><li>Internet archive: Way Back Machine </li></ul><ul><li>http://www.archive.org/web/web.php </li></ul>
 9. 9. Selectie <ul><li>Het collectieprofiel voor analoge documenten is bijna gelijk aan het collectieprofiel voor digitale documenten, incl. websites </li></ul><ul><li>Een website is slechts een verschijningsvorm van een informatiedrager </li></ul><ul><li>Als we de via de website aangeboden informatie ook zouden willen bewaren als deze wordt aangeboden op papier of een andere drager kan dat een reden zijn deze website te bewaren… </li></ul>
 10. 10. Hoe archiveren we websites ? 27 november 2009
 11. 11. Afbakenen <ul><li>Bepalen wat een website maakt tot wat hij is, b.v. de functie die de website heeft in werkprocessen. </li></ul><ul><li>Is het een presentatiemedium, een portaal naar andere informatiebronnen of een transactiemedium? </li></ul><ul><li>Of is het gewoon een interessante site van een privé persoon </li></ul><ul><li>Daarna analyseren welke elementen van de website behouden moeten blijven om er voor te zorgen dat de authenticiteit overeind blijft . </li></ul>
 12. 12. De authenticiteit van een website wordt bepaald door : <ul><li>Integriteit : de website is intact en niet zodanig veranderd of gecorrumpeerd dat de betekenis ervan niet meer duidelijk is. Wijzigingen zijn aanvaardbaar, zolang de oorspronkelijke betekenis of functie van het document er niet door wordt aangetast. </li></ul><ul><li>Verifieerbaarheid : Het is mogelijk vast te stellen dat de website is wat het beweert te zijn. Om dit mogelijk te maken is context informatie nodig. Deze informatie wordt later vastgelegd in metadata . </li></ul>27 november 2009 Voorgoed vastgelegd?
 13. 13. Plan van aanpak <ul><li>In kaart brengen en selecteren van de te acquireren websites. </li></ul><ul><li>Contact leggen met de webmaster </li></ul><ul><li>Brief naar website eigenaar </li></ul><ul><li>Analyseren van de websites en opstellen van authenticiteits- en integriteitseisen per website </li></ul><ul><li>Verzamelen gegevens ten behoeve van metadata. </li></ul>27 november 2009
 14. 14. Problemen in overvloed
 15. 15. Frequentie van de snapshots <ul><li>In principe wordt jaarlijks één snapshot van een website genomen. </li></ul><ul><li>Bij het nemen van meerdere snapshots per jaar rekening houden met de relevantie van de betreffende website. </li></ul><ul><li>Inmiddels zijn 268 verschillende websites gearchiveerd </li></ul>
 16. 16. Frequentie <ul><li>De frequentie van de te nemen snapshots varieert:  </li></ul><ul><li>Per jaar                                               234 </li></ul><ul><li>Per half jaar                                            3 </li></ul><ul><li>Per kwartaal                                           1 </li></ul><ul><li>Maandelijks                                            1 </li></ul><ul><li>Wekelijks                                               1   </li></ul><ul><li>Eenmalig                                              6 </li></ul><ul><li>Meerjaarlijks (politieke partijen)       22 </li></ul><ul><li>                                                           </li></ul>
 17. 17. Opslagkosten <ul><li>De opslagkosten per Gb (gigabyte) bedragen € 1,50 per jaar, inclusief backup en beheer. </li></ul><ul><li>Opslag van één Tb (terabyte) kost € 1500 per jaar </li></ul><ul><li>Voor duurzame opslag in een E-depot moet speciale software worden aangeschaft en dan kunnen de kosten aanzienlijk stijgen. </li></ul>
 18. 18. Maar dan…..! 27 november 2009
 19. 19. Digitale opslag <ul><li>Een SIP is een pakketje digitaal materiaal met een XML bestand aan metadata. </li></ul><ul><li>Deze SIP’s worden opgeslagen in het E-depot als AIP (Archival Information Package). </li></ul>
 20. 20. Digitale opslag : AIP en DIP <ul><li>Een AIP (Archive Information Package) is een digitaal informatie-object met de noodzakelijke toegevoegde metadata zoals die worden opgeslagen voor lange termijn bewaring in het depot. </li></ul><ul><li>Voor de beschikbaarstelling wordt een kopie gemaakt van de AIP, minus een aantal voor de gebruiker niet relevante metadata en dat noemen we dan een DIP (Dissemination Information Package) </li></ul>
 21. 21. Vragen ….. <ul><li>Voor wie behoeft heeft aan meer informatie: </li></ul><ul><li>[email_address] </li></ul><ul><li>010 - 2672560 </li></ul>

Presentation given at 30 november in Amersfoort at the Rijksdienst voor Cultureel Erfgoed SIMIN/OKBN Najaarsdag Born-digital: (hoe) bewaar je dat?

Views

Total views

941

On Slideshare

0

From embeds

0

Number of embeds

4

Actions

Downloads

8

Shares

0

Comments

0

Likes

0

×