Presentie duurzaam digitaal beheren

579 views

Published on

  • Be the first to comment

  • Be the first to like this

Presentie duurzaam digitaal beheren

  1. 1. DUURZAAMDIGITAAL BEHEREN:DIGITALISEREN & BEWARENBert Lemmens & Henk Vanstappen14 mei 2013 | Letterenhuis (Antwerpen)
  2. 2. PROGRAMMA• Inleiding: Duurzaam Digitaal Beheren• CEST Richtlijnen: Digitaliseren• Scoremodel Digitale Duurzaamheid
  3. 3. DUURZAAMDIGITAAL BEHEREN
  4. 4. DIGITAAL BEHEREN?“digitale representaties”“born-digital documenten”digitaliseren (overg.;digitaliseerde, h. gedigita-liseerd) in een digitalecode overbrengen
  5. 5. DUURZAAM DIGITAAL BEHEREN?“Langdurige toegankelijkheid van digitale data. […]Het duurzaam toegankelijk houden van data vergt zowelbeleidsmatige beslissingen in de vorm van eenduurzaamheidsstrategie, als praktische oplossingen voor beheeren behoud.(ABC Digitaal Erfgoed DEN)
  6. 6. BELEIDSBESLISSINGEN?• Willen?• Kunnen?• Mogen?toegang?preservering?geld?kennis?infrastructuur?auteursrechten?privacy?eigendomsrechten?
  7. 7. PRAKTISCHE OPLOSSINGEN?• Standaarden• Software• Best Practice
  8. 8. • Standaarden• Software• Best PracticePRAKTISCHE OPLOSSINGEN?
  9. 9. PRAKTISCHE OPLOSSINGEN?• Standaarden• Software• Best Practice
  10. 10. DIGITALISEREN & BEWAREN
  11. 11. CEST RICHTLIJNEN & SCOREMODEL
  12. 12. VOORSTELLING• Wie bent U?• Welke digitale collecties beheert U?• Wat bezorgt U kopbrekens?• Welke vraag wil U vandaag absoluut stellen?
  13. 13. CEST-RICHTLIJNENDIGITALISERENBert Lemmens & Henk Vanstappen(PACKED vzw)
  14. 14. DIGITALISEREN• Codering• Vindbaarheid• Kopieëndigitaliseren (overg.;digitaliseerde, h. gedigita-liseerd) in een digitalecode overbrengen
  15. 15. CODERING:ANALOOG → DIGITAAL
  16. 16. TEKST CODEREN
  17. 17. BEELD CODEREN
  18. 18. VIDEO CODEREN
  19. 19. GELUID CODEREN
  20. 20. COMPUTERBESTAND:CODERING + FORMAAT
  21. 21. BESTANDSFORMAAT:INTERNE STRUCTUUR
  22. 22. VINDBAARHEID: METADATA!• Descriptief: Wat is de inhoud van hetbestand?• Administratief: Hoe kan/mag ik het bestandgebruiken?• Structureel: Wat is het verband met anderebestanden?
  23. 23. KOPIEËN: MOEDERBESTAND“Een moederbestand is een digitale kopie waarvanverder kopieën worden afgeleid.”UF: preservation master, archiefkopie
  24. 24. KOPIEËN: ARCHIVERINGSBESTAND“Een archiveringsbestand is een digitale kopie van het oorspronkelijke(digitale of analoge) document in de hoogst mogelijke kwaliteit - bijvoorkeur voldoende hoog om het origineel in geval van vernietiging ofbeschadiging te vervangen.Archiveringsbestanden worden gemaakt wanneer het oorspronkelijkedocument te kwetsbaar is om het te kunnen raadplegen, of wanneer hetverloren dreigt te gaan.Ze worden bij voorkeur bewaard in een beveiligde opslagomgeving.”UF: preservation master
  25. 25. KOPIEËN: REPRODUCTIEBESTAND“Een reproductiebestand is een digitale kopie waarvan de kwaliteitvoldoende hoog is om de inhoud van het oorspronkelijke (digitale ofanaloge) document op een betekenisvolle manier toegankelijk te maken.Reproductiebestanden worden gebruikt als moederbestand voor het makenvan verschillende soorten raadplegingsbestanden.Reproductiebestanden worden bij voorkeur bewaard in een beveiligdeopslagomgeving en zijn doorgaans enkel ter beschikking via het intranetvan een bewaarinstelling.”UF: reproduction master, submaster, distributiekopie
  26. 26. KOPIEËN: RAADPLEGINGSBESTAND“Een raadplegingsbestand is een digitale kopie die gebruikt wordt omeen document digitaal ter beschikking te stellen.De kwaliteit van een raadplegingsbestand wordt bepaald door de aard vanhet gebruik. De kwaliteit is vaak veel lager om de opslagcapaciteit en debenodigde bandbreedte beperkt te houden en het document makkelijkerraadpleegbaar te maken.Een raadplegingsbestand worden enkel bewaard en beheerd voor determijn van het beoogde gebruik.UF: distribution copy, access copy, raadplegingskopie
  27. 27. BASISBEGRIPPEN• Codering• Vindbaarheid• Kopieëntekst-beeld-geluid-videobestandformaatdescriptieve metadataadministratieve metadatastructurele metadatamoederbestandarchiveringsbestandreproductiebestandraadplegingsbestand
  28. 28. CEST RICHTLIJNEN
  29. 29. ●Onzorgvuldig rechten klaren●Slechte e-depots●Onhandige websites●Slechte OCR●Arme metadataNRC 10/9/2011: DIGITALE DRAMA
  30. 30. “ De collectiebeherende cultureel-erfgoedorganisatie hanteert aanhet cultureel erfgoed aangepaste, algemeen aanvaarde standaardenen kwaliteitsvolle, dynamische werkvormen en –methoden. Voordigitaliseringsinitiatieven moet dit gebeuren volgens dealgemeen aanvaarde internationale en desgevallend door deVlaamse Regering opgelegde standaarden.”Handleiding bij het cultureel-erfgoeddecreet (juli 2011)ERFGOEDDECREET
  31. 31. ONDERZOEK ERFGOEDSTANDAARDEN (2010)● Bewustmaken● Expertise● Richtlijnen● Tools
  32. 32. BEGRIPPEN:
  33. 33. RICHTLIJN ?• Concrete use case• Do’s & don’ts• Minimum standaarden• Aanbevolen standaarden
  34. 34. RICHTLIJNEN DIGITALISEREN ?• Ik wil mijn fotocollectie digitaliseren• Ik wil tekstdocumenten digitaliseren• Ik wil geluidsopnames digitaliseren.• Ik wil video digitaliseren.
  35. 35. CONSENSUS !Comply-or-Explain!
  36. 36. 4 GEBODEN V/H DIGITALISEREN:• Beschrijf de collectie• Maak een moederbestand• Registreer administratieve metadata• Maak archiverings-, reproductie enraadplegingsbestanden
  37. 37. BEGRIPPEN:
  38. 38. 1STE GEBOD:BESCHRIJF DE COLLECTIEMinimum:• Beschrijft de (deel)collectie (COMETA)• Beschrijf het niveau waarop je ontsluit (reeks, stuk)Aanbevolen:• Beschrijf volgens het 1-op-1-principe (object, inhoud, representatie)• Beschrijf het niveau van het digitale bestand (reeks, stuk, onderdeel)• Beschrijf m.b.v. de standaarden voor:• het type collectie (musea, bibliotheek, archief)• het soort object (tekst, foto, geluid, video)
  39. 39. 2DE GEBOD:MAAK EEN MOEDERBESTANDAlgemeen:• Bewaar een onbewerkte versie van het moederbestand• Kwaliteitseisen  doelstellingen digitalisering• Toegang tot de inhoud?• Betrouwbare weergave?• Substitutie origineel?• Infrastructuur & kennis in huis?
  40. 40. 2DE GEBOD:MAAK EEN MOEDERBESTAND (TEKST)Minimum:• Open en goed gedocumenteerd formaat• Beeldformaat: TIFF of JPEG2000, soms JPG of PNG, geen PDF!• Resolutie: ‘punten’&‘openingen’ ↔ 300ppi• Bitdiepte: 8bit ↔ 24 bit; sRGB ↔ ECIRGB• Tekstformaat: UTF-8Aanbevolen:• TEI• METS
  41. 41. 2DE GEBOD:MAAK EEN MOEDERBESTAND (FOTO)Minimum:• Uncompressed Baseline IBM TIFF v6.0• Resolutie: 300ppi• Bitdiepte: 8bit ↔ 24 bit; ECIRGBAanbevolen:• JPEG2000, soms JPG, PNG of GIF, geen PDF!
  42. 42. 2DE GEBOD:MAAK EEN MOEDERBESTAND (GELUID)Minimum:• Magneetbanden reinigen en correct identificeren!• Vermijd subjectieve correcties!• Open en goed gedocumenteerd formaat• Linear Pulse Code Modulatie: 48kHz-96kHz; 24 bit• Geen compressie!Aanbevolen:• WAV, AIFF, FLAC
  43. 43. 2DE GEBOD:MAAK EEN MOEDERBESTAND (VIDEO)Minimum:• Magneetbanden reinigen en correct identificeren!• Vermijd subjectieve correcties!• Open en goed gedocumenteerd formaat• Bewaar beeldeigenschappen (frame rate, aspect ration, etc.)• Geen compressie!Aanbevolen:• MXF, AVI, MOV• MXF/MJPEG2000 codering
  44. 44. 2DE GEBOD:MAAK EEN MOEDERBESTAND(BESTANDSNAMEN)Minimum:• uniek!• letters• cijfers• liggend streepje ( _ )• koppelteken (-)Aanbevolen:• Betekenisloze namen (UUID)• Betekenisvolle namen (collectiecode / identificatienummer)
  45. 45. 2DE GEBOD:MAAK EEN MOEDERBESTAND (STRUCTUUR)Minimum:• gestructureerd tekstbestand (CSV, XML)• soms in de bestandsnaam (eenvoudige objecten)• geen mappen!Aanbevolen:• XML Schema’s:• MPEG DIDL• METS• PREMIS
  46. 46. 3DE GEBOD:REGISTREER ADMINISTRATIEVE METADATA‘Editievermelding’:• Wie heeft het bestand gemaakt en hoe? (technische data)• Welke beperkingen rusten op het gebruik ? (rechten data)• Hoe moet het bestand bewaard worden? (preserveringsdata)
  47. 47. 3DE GEBOD:REGISTREER ADMINISTRATIEVE METADATAMinimum:• Selecteer de elementen• Gestructureerd tekstbestand (CSV, XML)• Of in de headerAanbevolen:• PREMIS• Identificeer en valideer (DROID, JHOVE)
  48. 48. 4DE GEBOD:MAAK BESTANDEN:ARCHIVERING/REPRODUCTIEMinimum:• Archivering: Open• Reproductie: Open en goed ondersteundAanbevolen:• UTF-8• TIFF• JPEG2000• WAV/LPCM• AIFF/LPCM• FLAC• MXF/MJPEG2000
  49. 49. 4DE GEBOD:MAAK BESTANDEN: RAADPLEGINGMinimum:• Breed ondersteund• Gebruikt door je doelgroepAanbevolen:• JPEG2000• JPG• PNG• PDF• HTML• MP3• MPEG-2• MPEG-4
  50. 50. VRAGEN?
  51. 51. EEN SCOREMODELVOOR EDEPOTSHenk Vanstappen (PACKED)
  52. 52. Foto: THE Holy Hand Grenade! CC BY-SA 2.0
  53. 53. Foto: Wief70 CC BY-NC 2.0
  54. 54. Foto: portfolium CC BY-NC 2.0
  55. 55. DUURZAME BEWARING IS… Organisatiestructuur Mensen en middelen Opslagsystemen Standaarden Karakteriseren en valideren Checksums Archiverings- en raadplegingsformaten Migreren en normaliseren Preservation metadata Structural metadata Technology watch ….
  56. 56. NORMEN VOOR EDEPOTSTRAC Trustworthy Repositories Audit &Certification: Criteria and Checklist Door OCLC, NARA en CRL 94 pagina’s
  57. 57. NORMEN VOOR EDEPOTSDRAMBORA Digital Repository Audit Method Basedon Risk Assessment Door DCC en DPE 221 pagina’s (draft)
  58. 58. NORMEN VOOR EDEPOTSED3 Eisen Duurzaam Digitaal Depot Gebaseerd op TRAC V.2 op komst 39 p.Brongegevens:De combinatie van digitaal bronobject enrepresentatie informatie, die bewaardmoet blijven.
  59. 59. NORMEN VOOR EDEPOTSNESTOR Kriterienkatalog vertrauenswürdigedigitale Langzeitarchive nestor-Arbeitsgruppe VertrauenswürdigeArchive – Zertifizierung
  60. 60. NORMEN VOOR EDEPOTSCHARLES M. DOLLAR Digital Preservation Readiness Capability Maturity Model
  61. 61. NORMEN VOOR EDEPOTSOAIS BLUE BOOK Ontwikkeld door NASA ISO 14721:2003 148 pagina’sContent Information: The set of information that is theoriginal target of preservation. It is an InformationObject comprised of its Content Data Object and itsRepresentation Information. An example of ContentInformation could be a single table of numbersrepresenting, and understandable as, temperatures,but excluding the documentation that would explain itshistory and origin, how it relates to other observations,etc.RECOMMENDATION FOR SPACEDATA SYSTEM STANDARDSReference Model for anOpen Archival InformationSystem (OAIS)CCSDS 650.0-B-1BLUE BOOKJanuary 2002
  62. 62. NORMEN VOOR EDEPOTSOAIS MAGENTA BOOK Gebaseerd op TRAC ISO 14721:2003 77 pagina’s4.1.1 The repository shall identify the ContentInformation and the Information Properties that therepository will preserve.Supporting Text. This is necessary in order to make itclear to funders, depositors, and users whatresponsibilities the repository is taking on and whataspects are excluded. It is also a necessary step indefining the information which is needed from theinformation producers or depositors.Recommendation for Space Data System PracticesMAGENTA BOOKAUDIT ANDCERTIFICATION OFTRUSTWORTHY DIGITALREPOSITORIESRECOMMENDED PRACTICECCSDS 652.0-M-1September 2011
  63. 63. EEN GROEIMODEL VOOR EDEPOTSDOEL Risico-analyse tool Gebaseerd op normen Laagdrempelig Oplossingsgericht
  64. 64. EEN GROEIMODEL VOOR EDEPOTS60 EISEN Context Risico’s Voorbeeld Oplossingen
  65. 65. EEN GROEIMODEL VOOR EDEPOTSDRIE NIVEAUS: Hoog risico Matig risico Laag risico
  66. 66. EEN GROEIMODEL VOOR EDEPOTSZEVEN DOMEINEN: Beleid Strategie Kennis & organisatie Opslag Planning & controle Opname Toegang
  67. 67. EEN GROEIMODEL VOOR EDEPOTSRADAR Geeft score per domein Toont sterktes enzwaktes Enkel groene zoneis veilig demo
  68. 68. scoremodel.orgv0.8
  69. 69. SECTIE 1: MANDAAT EN BELEID1. Het duurzaam bewaren van de digitale objecten sluitaan bij de missie of doelstelling van de organisatie.(Risiconiveau hoog)5. De rechten en plichten met betrekking tot hetaanleveren, beheren en raadplegen van digitale objectenzijn afdoende vastgelegd. (Risiconiveau normaal)6. De intellectuele rechten die rusten op de digitaleobjecten worden gecontroleerd en nageleefd. Deauteursrechtelijke status van elk object wordt in demetadata vastgelegd. (Risiconiveau normaal)
  70. 70. SECTIE 2: BEWAARSTRATEGIE3. Voor elk digitaal object kan bepaald worden wat deessentiële eigenschappen (inhoud, vorm, gedrag,structuur) zijn die bewaard moeten worden. Daarbij wordtrekening gehouden met de eisen van de leveranciers enafnemers. (Risiconiveau hoog)4. Op basis van de essentiële eigenschappen kan bepaaldworden onder welk bestandsformaat een object moetworden bewaard en zo nodig moet worden gemigreerd.(Risiconiveau hoog)
  71. 71. SECTIE 2: BEWAARSTRATEGIE5. Bij de keuze van bestandformaten wordt zo veelmogelijk gekozen voor open, wijdverspreidearchiveringsformaten. (Risiconiveau normaal)11. De bewaarstrategie is schriftelijk vastgelegd in eenpreserveringsbeleidsplan dat regelmatig wordtgeactualiseerd. Dit plan bevat alle eerder genoemdepunten in deze sectie: d.w.z. punt 1 t/m 11. (Risiconiveaunormaal)
  72. 72. SECTIE 3: KENNIS EN ORGANISATIE3. De verantwoordelijken beschikken over de nodigetechnische expertise voor de uitvoering van hun taak.(Risiconiveau hoog)5. De organisatie beschikt over voldoende expertise om ophoofdlijnen de goede werking van de duurzame opslag tekunnen monitoren. (Risiconiveau normaal)
  73. 73. SECTIE 4: OPSLAGBEHEER1. De gearchiveerde digitale objecten zijn opgeslagen ineen opslagsysteem dat deel uitmaakt van eencomputernetwerk. (Risiconiveau normaal)7. De integriteit van de digitale objecten wordt regelmatiggecontroleerd. (Risiconiveau hoog)9. De noodkopie wordt bewaard op een fysiek anderelocatie. (Risiconiveau normaal)
  74. 74. SECTIE 5: OPNAME3. Er zijn tools of technologie actief om bestandsformatente kunnen karakteriseren (identificeren). (Risiconiveaunormaal)6. Het is bekend met welke applicaties je allebestandsformaten die je binnenkrijgt kan openen.(Risiconiveau normaal)
  75. 75. SECTIE 5: OPNAMERELEVANTE METADATA WORDEN VASTGELEGD:8. een onveranderlijke, unieke naam (identifier)9. de locatie (reference information)10. de context waarin het digitaal object is ontstaan11. de technische kenmerken van het digitaal object12. Structurele metadata13. minimale set van inhoudelijke gegevens (wie, wanneer,wat, waar)
  76. 76. SECTIE 6: PLANNING ENKWALITEITSCONTROLE2. De technische details van de migraties wordengedocumenteerd (in de preservation metadata).(Risiconiveau normaal)
  77. 77. SECTIE 7: TOEGANKELIJKHEID3. Elk digitaal object is bereikbaar met een persistenteURI. (Risiconiveau laag)4. De digitale objecten zijn voor de gebruiker beschikbaarin gangbare, zoveel mogelijk open formaten. (Risiconiveaunormaal)
  78. 78. VRAGEN?henk@packed.bebert@packed.bewww.packed.bewww.projectcest.bewww.scoremodel.org

×