Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Digitaliseren, archiveren en online publiceren voor lokale erfgoedbeheerders

606 views

Published on

Presentaties van sessie 5 & 6 van de reeks Aan de slag met archief en documentatie, georganiseerd door Heemkunde Vlaanderen ism PACKED vzw (Maasmechelen, maart 2014)

Published in: Technology
 • Be the first to comment

 • Be the first to like this

Digitaliseren, archiveren en online publiceren voor lokale erfgoedbeheerders

 1. 1. Digitaliseren, digitaal bewaren en online publiceren Henk Vanstappen (PACKED vzw)
 2. 2. PACKED VZW • EXPERTISECENTRUM DIGITAAL ERFGOED • OPDRACHT • “Expertise rond digitalisering en digitale archivering centraliseren en verspreiden” • DOELGROEPEN • collectiebeherende organisaties • andere actoren in het ergoedveld • MIDDELEN • Structurele werking Vlaamse Gemeenschap • Projectsubsidies • Onderaanneming
 3. 3. INHOUD Dag 1: DIGITALISEREN • Planning • Bestandsformaten en parameters • Hardware • Registreren Dag 2: ARCHIVEREN & PUBLICEREN • Scoremodel digitale duurzaamheid • Publiceren • Auteursrecht
 4. 4. Dag 1 DIGITALISEREN
 5. 5. DIGITALISEREN? • VAN ANALOOG NAAR BINAIR • beeld, audio, video, tekst • WERKPROCES • voorbereiding • uitvoering • kwaliteitscontrole • REGISTREREN (METADATA) • bestandsnaam • beschrijvende metadata • technische metadata
 6. 6. HARDWARE: SCANNERS scanner flatbed documentscanner transparant camera bookscanner
 7. 7. FLATBED • PRO • Goedkoop • Aanvaardbare kwaliteit • Compact • CONTRA • Traag • Schade aan origineel
 8. 8. DOCUMENT FEEDER • PRO • Zeer snel • Aanvaardbare kwaliteit • Aanvaardbare prijs • CONTRA • Enkel losse vellen • Schade aan origineel
 9. 9. DIA SCANNER • PRO • Aanvaardbare kwaliteit • Aanvaardbare prijs • CONTRA • Traag
 10. 10. BOEKSCANNER • PRO • Sneller • Conservering • Intelligente software • CONTRA • Duur • Geen transport
 11. 11. SELFMADE BOOKSCANNER
 12. 12. 3D SCANNERS
 13. 13. TEST TARGET IMAGE • TEST • kleurechtheid • scherpte • kleurgradaties • DELT.AE • web based controle tool: http://www.delt.ae
 14. 14. AUDIO CONVERTORS • PRO • goedkoop • eenvoudig gebruik • CONTRA • lage kwaliteit • exportformaten
 15. 15. VIDEO CONVERTORS • PRO • goedkoop • eenvoudig gebruik • CONTRA • lage kwaliteit • exportformaten
 16. 16. BEELDSCHERM • OPSTELLING • stabiele lichtomstandigheden • geen invallend licht • KALIBRATIE • colorimeter • spectrophotometer
 17. 17. WORKFLOW MANAGEMENT • SPREADSHEET • operator • datum creatie en controle • bestandsnaam • … • PRO SOFTWARE • Goobi (Open Source) • OmniScan • …
 18. 18. WORKFLOW MANAGEMENT SOFTWARE
 19. 19. PARAMETERS
 20. 20. TOOL: VUESCAN
 21. 21. RESOLUTIE • sample rate (“bemonsteringsfrequentie”) • uitgedrukt in PPI (beeld) of Hz (geluid) • bepalend voor bestandsgrootte: • Audio: sample rate x2  bestand x2 • 2D: resolutie x2  bestand x4
 22. 22. RESOLUTIE • BEELD • Pixels per Inch (PPI) • Let op met interpolatie! • VIDEO • lineaire pixels: 2K, 4K, 8K • originele frame rate • AUDIO • Sample frequency: 48 tot 96 kHz
 23. 23. RESOLUTIE: BEREKENEN • 1 inch = 2,56 cm • voorbeeld dia op A4: 21 cm x 300 dpi / 3,6 cm = 1750 ppi • voorbeeld poster op A4: 21 cm x 300 dpi / 70 cm = 90 ppi breedte gewenste afdruk x gewenste resolutie afdruk breedte origineel
 24. 24. RESOLUTIE: AANBEVELINGEN • BEELD • foto‟s, documenten: 300 ppi • dia‟s, negatieven: 300 ppi * reductiefactor (1200 ppi) • affiches: <300 ppi • tekst: punt van de i moet herkenbaar zijn • VIDEO • 16 en 35 mm film: 2K, resp. 4K • AUDIO • 48 KHz
 25. 25. KLEUR & KLEURDIEPTE RED GREEN BLUE 000000000000000000000000 000000000000000000000001 000000000000000000000010 … 111111111111111111111111 256 * 256 * 256 = 16,7 miljoen combinaties
 26. 26. KLEURDIEPTE • Aantal bits gebruikt om een kleur te bepalen • Bepalend voor grootte bestand
 27. 27. DYNAMISCH BEREIK (RANGE) • bepaald door bitdiepte en compressie
 28. 28. KLEURRUIMTE • sRGB (IEC 61966-2.1) • AdobeRGB • ECI-RGB • ProPhotoRGB • MelissaRGB
 29. 29. KLEUR: AANBEVELINGEN • KLEURDIEPTE • kleurorigineel: 24 bits of meer (nabewerking: 30 of 48 bits) • grijswaarden: 8 of 16 bit • zwartwit: 1 bit • KLEURRUIMTE • preserveringsdoeleinden: ECIRGB of AdobeRGB • raadpleging: sRGB
 30. 30. COMPRESSIE • Afhankelijk van bestandsformaat • Lossless: geen informatieverlies (bv. LZW, ZIP) • Lossy: artefacten, kleurverlies (JPEG)
 31. 31. BESTANDSFORMATEN
 32. 32. TYPES NAAR VORM • BITMAP IMAGE (RASTER) • VECTOR IMAGE • TEKST • AUDIO • VIDEO • … ARCHIEF, EXECUTABLE, DATA
 33. 33. TYPES NAAR FUNCTIE • PRE-PROCESSING • unprocessed, uncompressed • REPRODUCTIEBESTAND (MASTER) • hoogste vereiste kwaliteit • ongewijzigd • ARCHIVERINGSBESTAND • open formaat • in eDepot • RAADPLEGINGSBESTAND • webvriendelijk formaat
 34. 34. FORMATEN: AANBEVELINGEN • OPEN FORMATEN • publiek beschikbaar, beheerd door non profit organisatie • geen patenten • voldoende gebruikers en software • BEELD • Baseline TIFF v6 uncompressed, JPEG2000 • VIDEO • Container: MXF, AVI, MOV • Codec: MJPEG2000 • AUDIO • WAV, AIFF, FLAC
 35. 35. BESTANDSNAMEN • BETEKENISVOL OF BETEKENISLOOS • kans op fouten • arbeidsintensief • betere alternatieven voor informatieopslag • BASISREGELS: • Hou het simpel: max. 3 elementen • abcedfghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUV WXYZ1234567890_ • Gebruik punt enkel voor extensie
 36. 36. STRUCTUUR • VASTLEGGEN • documenten • collecties, verzamelingen • DON’T: • Multipage file format • Bestandsnaam • Mappenstructuur • DO: • Structurele metadata
 37. 37. TOOL: XNVIEW
 38. 38. TOOL: XNVIEW • FUNCTIES • Bestanden hernoemen • Bestandsformaten aanpassen • Bestanden wijzigen • Bestanden bewerken • ALTERNATIEVEN • IrfanView, Adobe Photoshop, GIMP (open source), Corel Photo paint…. • ReName
 39. 39. TOOL: VLC
 40. 40. TOOL: VLC • FUNCTIES • Bestanden transcoderen • Bestanden analyseren • Bestanden bewerken • ALTERNATIEVEN • FFMPEG, MPEG streamclip (video) • Audacity (geluid)
 41. 41. OCR
 42. 42. OCR: TEKSTHERKENNING Herkennen van tekst in beeld
 43. 43. OCR: KENMERKEN • NIVEAUS • tekst • paragrafen • documentopmaak • structuur • named entity recognition • TAAL • EXPORTFORMAAT • PDF, DOC • RTF • XML
 44. 44. OCR: PARAMETERS • ACCURAATHEID • nooit 100% • 99% correcte tekens = 95% correcte woorden • controle: crowdsourcing & recaptcha
 45. 45. OCR: TOOLS • PRO • Abby Finereader • Omnipage • Adobe Acrobat, NitroPDF (embedded text) • FREEWARE/OPEN SOURCE • PDF OCR X (demo) • FreeOCR • OCRFeeder • ON LINE • Google Drive, archive.org, PDFescape
 46. 46. TEKSTFORMATEN • TEKENCODERING • „Codetabel waarmee binaire code omgezet wordt naar tekens‟ • ASCII: 7 en 8 bits • aanbeveling: UTF-8 • TEKSTFORMATEN • basis: TXT, RTF • document: PDF, Word, ODF • tagged: XML, HTML • opmaak en inhoud: METS/ALTO
 47. 47. DIGITALISEREN: BELEID
 48. 48. WAAROM DIGITALISEREN? • VERVANGINGSKOPIE • origineel degradeert • origineel verloren of niet in bezit • VEILIGHEIDSKOPIE • manipulatie minimaliseren • RAADPLEGING • betere toegankelijkheid • doorzoekbaarheid • BEWERKEN • OCR: tekstherkenning • Aanpassen: kleur, contrast, croppen, monteren, …
 49. 49. WAT DIGITALISEREN? • RELEVANTIE • collectiebeleid • raadpleegfrequentie • PRIORITEITEN • kwestbaarheid • tijdelijk beschikbaar • RECHTEN • wat mag worden gedigitaliseerd • wat mag worden gepubliceerd
 50. 50. DIGITALISERINGSPLAN • WAAROM? • Consensus en referentiedocument • Projectplanning en opvolging • WAT? • Welke collecties • Hoe digitaliseren • HOE? • Werkproces • WIE? • Taken en verantwoordelijkheden
 51. 51. SELECTIE • DOORLICHTING COLLECTIE • aantallen • soorten • eigendom • prioriteit
 52. 52. SELECTIE • CRITERIA • onderwerp • materiaalsoort • prioriteit • beschikbaarheid (rechten!) • OVERZICHTSLIJST • naam set • lokatie • aantallen • prioriteit
 53. 53. WERKPROCES PLANNEN
 54. 54. VOORBEREIDING • FYSIEKE VOORBEREIDING • beschadigingen • uitvouwen, uitrollen • gebonden volumes losmaken • tape, nietjes…  goed plannen om vertragingen te vermijden
 55. 55. VOORBEREIDING • PILOT • Problemen opsporen • Benodigde tijd inschatten • Werkproces op punt stellen
 56. 56. ORGANISATIE • AFSPRAKEN VASTLEGGEN • Wie doet wat • Wanneer • Takenblad
 57. 57. KWALITEITSCONTROLE • VOLLEDIGHEID • Takenblad • KWALITEIT • Visuele controle • Test targets: controle via Deltae: delt.ae/ • VALIDATIE • Jhove: controle bestandsformaat, compressie, … • VLC: controle video-eigenschappen, codecs, …
 58. 58. JHOVE
 59. 59. TOOL: JHOVE • IDENTIFICEREN • is dit het juiste bestandsformaat? • KARAKTERISEREN • wat zijn de technische kenmerken van het bestand? • VALIDEREN • beantwoordt het aan de specificatie? • zijn er fouten die de leesbaarheid bedreigen?
 60. 60. OPSLAG • TIJDELIJKE KOPIE • interne of externe harde schijf • checksums creeren (zie deel 2) • zo snel mogelijk backup kopie • PERMANENTE OPSLAG • vooraf plannen! • zie deel 2. Archiveren
 61. 61. REGISTREREN
 62. 62. WAAROM REGISTREREN? • collectie vindbaar maken • collectie beheren • data hergebruiken • data uitwisselen • data publiceren • digitalisering plannen en uitvoeren
 63. 63. DATASTANDAARDEN
 64. 64. DATASTANDAARDEN • datastructuur: welke gegevens? • data value: welke waarden? • data content: hoe noteren?
 65. 65. DATA STRUCTUUR STANDAARDEN Een datastructuur legt een groep beschrijvingselementen vast die bij elkaar horen (schema).
 66. 66. DATA STRUCTURE STANDAARDEN • generiek: Dublin Core • collecties Cometa • archieven: EAD, ISAD(G) • museumobjecten: CDWA, CIDOC • locaties: KLM, WGS84 • personen: GEDCOM, ISAAR(CPF)
 67. 67. DUBLIN CORE METADATA SCHEMA element betekenis title titel creator vervaardiger subject onderwerp description beschrijving publisher uitgever contributor andere bijdrager date datum type objecttype format vorm of afmeting identifier unieke code source bron language taal van het object relation gerelateerde bron coverage plaats of tijd rights rechten
 68. 68. DATA VALUE STANDAARDEN Een data value standaard legt vast welke waarden binnen een beschrijvingselement kunnen worden gebruikt.
 69. 69. DATA VALUE STANDAARDEN 1 • generiek: Wikipedia • personen: ULAN, RKDArtist, ODIS, VIAF • concepten: AAT, Iconclass, LCSH, Plan Hoffman-Krayer, THB (Catteeuw) • locaties: TGN, Geonames, ISO 3166, CRAB • Talen: ISO 639-x
 70. 70. DATA CONTENT STANDAARDEN Een data content standaard legt vast hoe een waarde binnen een beschrijvingselement wordt genoteerd.
 71. 71. DATA CONTENT STANDAARDEN • publicaties: AACR2, RDA, VLACC • archiefcollecties: DACS • museumobjecten: CCO, MovE Invulboek • datum & tijd: ISO 8601
 72. 72. MOVE INVULBOEK
 73. 73. TOOLS: DIY • MAPPEN EN BESTANDSNAMEN • EMBEDDED METADATA • SPREADSHEET • Excel, LibreOffice Calc, … • DATABASE • MS Access, FileMaker, MySQL, …
 74. 74. TOOLS: REGISTRATIESOFTWARE • TYPES • commercieel of open source • objecten, archieven, digital assets, documenten • netwerk, standaloneof • VOORBEELDEN • Collective Access (OSS, museum) • Adlib Museum , Adlib Light • ICA-Atom (OSS, archieven) • ACDSee, XnView (fotocollecties) • CollectionSpace: (OSS DAM) • Colibreo: SAAS
 75. 75. TOOLS: ADLIB LIGHT
 76. 76. TOOLS: COLLECTIVE ACCESS
 77. 77. OEFENING
 78. 78. DATAPROFIELEN • ook: application profile • standaarddatastructuur + elementen uit andere schema‟s + standaardterminologie + beschrijvingsregels • terugwaarts compatibel • onmisbaar
 79. 79. DATAPROFIELEN
 80. 80. 4. BEWAREN
 81. 81. Foto: THE Holy Hand Grenade! CC BY-SA 2.0
 82. 82. Foto: portfolium CC BY-NC 2.0
 83. 83. BEWAARSTRATEGIE • MISSIE • doelstellingen van de organisatie • MIDDELEN • financiering • infrastructuur • MENSEN • expertise • verantwoordelijkheden • METHODEN • adequate procedures
 84. 84. BEWAREN: OPSLAG • OFF LINE • goedkoop • kwetsbaar • eigen beheer • beperkte beschikbaarheid • ON LINE • kwaliteit heeft prijs • betere beschikbaarheid • controle wordt uit handen gegeven
 85. 85. OFFLINE: CD, DVD • PRO • goedkoop • compact • CONTRA • zeer kwetsbaar • verouderde technologie • beperkte capaciteit
 86. 86. OFFLINE: SSD (SLC FLASH) • PRO • robuuster dan HD • eenvoudig in gebruik • CONTRA • geen netwerk • beperkt aantal schrijfacties • relatief duur
 87. 87. OFFLINE: USB FLASH (MLC) • PRO • goedkoop • compact • CONTRA • beperkte capaciteit • kwetsbaarder dan SLC
 88. 88. OFFLINE: EXTERNE HARDE SCHIJF • PRO • goedkoop • eenvoudig in gebruik • CONTRA • kwetsbaar • geen netwerk
 89. 89. OFFLINE: NAS • PRO • veiliger met RAID-X • netwerk • CONTRA • duurder • minder eenvoudig
 90. 90. ONLINE: CLOUD SERVICE • PRO • goedkoop/gratis • eenvoudig • integratie in besturingssysteem • CONTRA • beperkte capaciteit • beperkte aansprakelijkheid • VOORBEELDEN • Google drive, Amazon Cloud, Box, Dropbox, iCould, SugarSync, Skydrive
 91. 91. ON LINE: CLOUD STORAGE • PRO • relatief veilig • toegevoegde services • CONTRA • kostprijs • VOORBEELDEN • Amazon Simple Storage web service (S3) • Windows Azure • Google Cloud storage • Belgie: Nomadesk, Amplidata, … • ISP (inbegrepen in abonnement)
 92. 92. ONLINE: DATA CENTER • PRO • zeer veilig • hoog service level • CONTRA • kostprijs • complexe formules en contracten
 93. 93. BACKUP STRATEGIE • COURANTE, KWALITATIEVE DRAGERS • 3 KOPIEEN, WAARVAN 1 OP EXTERNE LOCATIE • INCREMENTEEL • VERSCHILLENDE TECHNOLOGIEEN • DOCUMENTEER PROCEDURE • CONTROLEER EN TEST • HOU REKENING MET RELEVANTIE
 94. 94. PRIORITEITEN STELLEN WELKE BESTANDEN BACK-UPPEN? gemakkelijk vervangbaar moeilijk vervangbaar uniek minder belangrijk gratis software verslagen foto’s evenement zeer belangrijk thumbnails op website eigen gedigitaliseerde collectie gedigitaliseer- de bruikleen
 95. 95. CHECKSUMS
 96. 96. 5. ON LINE PUBLICEREN
 97. 97. WEB HOSTING SERVICES • PRO • eenvoudig • goedkoop of gratis • ondersteuning voor digital assets • CONTRA • beperkte functionaliteit • VOORBEELDEN • Google sites • Wordpress • Blogspot
 98. 98. WEB HOSTING SERVICES: VOORBEELD BLOGSPOT
 99. 99. MULTIMEDIA HOSTING SERVICE • PRO • eenvoudig • goedkoop • embedding • CONTRA • functionaliteit beperkt • ondersteuning en continuiteit • geen archivering • VOORBEELDEN • Flickr, Picasa, YouTube, Vimeo, …
 100. 100. SAMENWERKINGSVERBANDEN • PRO • veel expertise • niet zelf ontwikkelen • meer zichtbaarheid • kostprijs • CONTRA • eigen vormgeving • volgens bestaand format • niet overal aanwezig
 101. 101. ERFGOEDINZICHT
 102. 102. ERFGOEDPLUS
 103. 103. EUROPEANA
 104. 104. ERFGOEDCEL WAASLAND
 105. 105. EIGEN WEBSITE MAKEN? • PRO • alle controle • database koppelen • CONTRA • complex • arbeidsintensief • VOORBEELDEN • CollectiveAccess • Omeka • Wordpress
 106. 106. TOOLS • bouwen website: Joomla, WordPress, Drupal • bezoek: Google Analytics • html-code: validator.w3.org • toegankelijkheid: Anysurfer.be
 107. 107. OPEN CULTUUR DATA
 108. 108. 6. RECHTEN
 109. 109. 6. RECHTEN • PRINCIPES AUTEURSRECHT • Auteursrecht is onvervreemdbaar • Auteursrecht ≠ eigendomsrecht • Claim geen rechten die je niet hebt • Geef geen rechten weg die je niet hebt • FAIR USE • PUBLIEK DOMEIN • 70 jaar na dood auteur • overlijden onbekend:  pre ± 1873
 110. 110. VERWEESDE WERKEN • DILIGENT SEARCH • voor gebruik • voor elk werk • publiek bekend • gedocumenteerd • alle relevante bronnen • EXTENDED COLLECTIVE LICENSING • vergoeding • rechtszekerheid
 111. 111. CREATIVE COMMONS LICENTIES • STANDAARD LICENTIES • OPEN LICENTIES • BEPERKINGEN • vermelding auteur • geen commercieel gebruik • geen afgeleiden • onder zelfde licentie verspreiden
 112. 112. RECHTEN
 113. 113. BIBLIOGRAFIE
 114. 114. henk@packed.be

×