Digitaliseren, digitaal
bewaren en online
publiceren
Henk Vanstappen
(PACKED vzw)
PACKED VZW
• EXPERTISECENTRUM DIGITAAL ERFGOED
• OPDRACHT
• “Expertise rond digitalisering en digitale archivering
central...
INHOUD
Dag 1: DIGITALISEREN
• Planning
• Bestandsformaten en parameters
• Hardware
• Registreren
Dag 2: ARCHIVEREN & PUBLI...
Dag 1
DIGITALISEREN
DIGITALISEREN?
• VAN ANALOOG NAAR BINAIR
• beeld, audio, video, tekst
• WERKPROCES
• voorbereiding
• uitvoering
• kwalitei...
HARDWARE: SCANNERS
scanner
flatbed
documentscanner
transparant
camera
bookscanner
FLATBED
• PRO
• Goedkoop
• Aanvaardbare kwaliteit
• Compact
• CONTRA
• Traag
• Schade aan origineel
DOCUMENT FEEDER
• PRO
• Zeer snel
• Aanvaardbare kwaliteit
• Aanvaardbare prijs
• CONTRA
• Enkel losse vellen
• Schade aan...
DIA SCANNER
• PRO
• Aanvaardbare kwaliteit
• Aanvaardbare prijs
• CONTRA
• Traag
BOEKSCANNER
• PRO
• Sneller
• Conservering
• Intelligente software
• CONTRA
• Duur
• Geen transport
SELFMADE BOOKSCANNER
3D SCANNERS
TEST TARGET IMAGE
• TEST
• kleurechtheid
• scherpte
• kleurgradaties
• DELT.AE
• web based controle tool: http://www.delt....
AUDIO CONVERTORS
• PRO
• goedkoop
• eenvoudig gebruik
• CONTRA
• lage kwaliteit
• exportformaten
VIDEO CONVERTORS
• PRO
• goedkoop
• eenvoudig gebruik
• CONTRA
• lage kwaliteit
• exportformaten
BEELDSCHERM
• OPSTELLING
• stabiele lichtomstandigheden
• geen invallend licht
• KALIBRATIE
• colorimeter
• spectrophotome...
WORKFLOW MANAGEMENT
• SPREADSHEET
• operator
• datum creatie en controle
• bestandsnaam
• …
• PRO SOFTWARE
• Goobi (Open S...
WORKFLOW MANAGEMENT
SOFTWARE
PARAMETERS
TOOL: VUESCAN
RESOLUTIE
• sample rate (“bemonsteringsfrequentie”)
• uitgedrukt in PPI (beeld) of Hz (geluid)
• bepalend voor bestandsgro...
RESOLUTIE
• BEELD
• Pixels per Inch (PPI)
• Let op met interpolatie!
• VIDEO
• lineaire pixels: 2K, 4K, 8K
• originele fra...
RESOLUTIE: BEREKENEN
• 1 inch = 2,56 cm
• voorbeeld dia op A4:
21 cm x 300 dpi / 3,6 cm = 1750 ppi
• voorbeeld poster op A...
RESOLUTIE: AANBEVELINGEN
• BEELD
• foto’s, documenten: 300 ppi
• dia’s, negatieven: 300 ppi * reductiefactor (1200 ppi)
• ...
KLEUR & KLEURDIEPTE
RED GREEN BLUE
000000000000000000000000
000000000000000000000001
000000000000000000000010
…
1111111111...
KLEURDIEPTE
• Aantal bits gebruikt om een kleur
te bepalen
• Bepalend voor grootte bestand
DYNAMISCH BEREIK (RANGE)
• bepaald door bitdiepte en compressie
KLEURRUIMTE
• sRGB (IEC 61966-2.1)
• AdobeRGB
• ECI-RGB
• ProPhotoRGB
• MelissaRGB
KLEUR: AANBEVELINGEN
• KLEURDIEPTE
• kleurorigineel: 24 bits of meer (nabewerking: 30 of 48 bits)
• grijswaarden: 8 of 16 ...
COMPRESSIE
• Afhankelijk van bestandsformaat
• Lossless: geen informatieverlies (bv. LZW, ZIP)
• Lossy: artefacten, kleurv...
BESTANDSFORMATEN
TYPES NAAR VORM
• BITMAP IMAGE (RASTER)
• VECTOR IMAGE
• TEKST
• AUDIO
• VIDEO
• … ARCHIEF, EXECUTABLE, DATA
TYPES NAAR FUNCTIE
• PRE-PROCESSING
• unprocessed, uncompressed
• REPRODUCTIEBESTAND (MASTER)
• hoogste vereiste kwaliteit...
FORMATEN: AANBEVELINGEN
• OPEN FORMATEN
• publiek beschikbaar, beheerd door non profit organisatie
• geen patenten
• voldo...
BESTANDSNAMEN
• BETEKENISVOL OF BETEKENISLOOS
• kans op fouten
• arbeidsintensief
• betere alternatieven voor informatieop...
STRUCTUUR
• VASTLEGGEN
• documenten
• collecties, verzamelingen
• DON’T:
• Multipage file format
• Bestandsnaam
• Mappenst...
TOOL: XNVIEW
TOOL: XNVIEW
• FUNCTIES
• Bestanden hernoemen
• Bestandsformaten aanpassen
• Bestanden wijzigen
• Bestanden bewerken
• ALT...
TOOL: VLC
TOOL: VLC
• FUNCTIES
• Bestanden transcoderen
• Bestanden analyseren
• Bestanden bewerken
• ALTERNATIEVEN
• FFMPEG, MPEG s...
OCR
OCR: TEKSTHERKENNING
Herkennen van tekst in beeld
OCR: KENMERKEN
• NIVEAUS
• tekst
• paragrafen
• documentopmaak
• structuur
• named entity recognition
• TAAL
• EXPORTFORMA...
OCR: PARAMETERS
• ACCURAATHEID
• nooit 100%
• 99% correcte tekens = 95% correcte woorden
• controle: crowdsourcing & recap...
OCR: TOOLS
• PRO
• Abby Finereader
• Omnipage
• Adobe Acrobat, NitroPDF (embedded text)
• FREEWARE/OPEN SOURCE
• PDF OCR X...
TEKSTFORMATEN
• TEKENCODERING
• ‘Codetabel waarmee binaire code omgezet wordt naar tekens’
• ASCII: 7 en 8 bits
• aanbevel...
DIGITALISEREN: BELEID
WAAROM DIGITALISEREN?
• VERVANGINGSKOPIE
• origineel degradeert
• origineel verloren of niet in bezit
• VEILIGHEIDSKOPIE
•...
WAT DIGITALISEREN?
• RELEVANTIE
• collectiebeleid
• raadpleegfrequentie
• PRIORITEITEN
• kwestbaarheid
• tijdelijk beschik...
DIGITALISERINGSPLAN
• WAAROM?
• Consensus en referentiedocument
• Projectplanning en opvolging
• WAT?
• Welke collecties
•...
SELECTIE
• DOORLICHTING COLLECTIE
• aantallen
• soorten
• eigendom
• prioriteit
SELECTIE
• CRITERIA
• onderwerp
• materiaalsoort
• prioriteit
• beschikbaarheid (rechten!)
• OVERZICHTSLIJST
• naam set
• ...
WERKPROCES PLANNEN
VOORBEREIDING
• FYSIEKE VOORBEREIDING
• beschadigingen
• uitvouwen, uitrollen
• gebonden volumes losmaken
• tape, nietjes…...
VOORBEREIDING
• PILOT
• Problemen opsporen
• Benodigde tijd inschatten
• Werkproces op punt stellen
ORGANISATIE
• AFSPRAKEN VASTLEGGEN
• Wie doet wat
• Wanneer
• Takenblad
KWALITEITSCONTROLE
• VOLLEDIGHEID
• Takenblad
• KWALITEIT
• Visuele controle
• Test targets: controle via Deltae: delt.ae/...
JHOVE
TOOL: JHOVE
• IDENTIFICEREN
• is dit het juiste bestandsformaat?
• KARAKTERISEREN
• wat zijn de technische kenmerken van h...
OPSLAG
• TIJDELIJKE KOPIE
• interne of externe harde schijf
• checksums creeren (zie deel 2)
• zo snel mogelijk backup kop...
REGISTREREN
WAAROM REGISTREREN?
• collectie vindbaar maken
• collectie beheren
• data hergebruiken
• data uitwisselen
• data publicere...
DATASTANDAARDEN
DATASTANDAARDEN
• datastructuur: welke gegevens?
• data value: welke waarden?
• data content: hoe noteren?
DATA STRUCTUUR STANDAARDEN
Een datastructuur legt een groep
beschrijvingselementen vast die bij
elkaar horen (schema).
DATA STRUCTURE STANDAARDEN
• generiek: Dublin Core
• collecties Cometa
• archieven: EAD, ISAD(G)
• museumobjecten: CDWA, C...
DUBLIN CORE METADATA SCHEMA
element betekenis
title titel
creator vervaardiger
subject onderwerp
description beschrijving
...
DATA VALUE STANDAARDEN
Een data value standaard legt vast
welke waarden binnen een
beschrijvingselement kunnen worden
gebr...
DATA VALUE STANDAARDEN 1
• generiek: Wikipedia
• personen: ULAN, RKDArtist, ODIS, VIAF
• concepten: AAT, Iconclass, LCSH, ...
DATA CONTENT STANDAARDEN
Een data content standaard legt vast
hoe een waarde binnen een
beschrijvingselement wordt genotee...
DATA CONTENT STANDAARDEN
• publicaties: AACR2, RDA, VLACC
• archiefcollecties: DACS
• museumobjecten: CCO, MovE Invulboek
...
MOVE INVULBOEK
TOOLS: DIY
• MAPPEN EN BESTANDSNAMEN
• EMBEDDED METADATA
• SPREADSHEET
• Excel, LibreOffice Calc, …
• DATABASE
• MS Access...
TOOLS: REGISTRATIESOFTWARE
• TYPES
• commercieel of open source
• objecten, archieven, digital assets, documenten
• netwer...
TOOLS: ADLIB LIGHT
TOOLS: COLLECTIVE ACCESS
OEFENING
DATAPROFIELEN
• ook: application profile
• standaarddatastructuur
+ elementen uit andere schema’s
+ standaardterminologie
...
DATAPROFIELEN
4. BEWAREN
Foto: THE Holy Hand Grenade! CC BY-SA 2.0
Foto: portfolium CC BY-NC 2.0
BEWAARSTRATEGIE
• MISSIE
• doelstellingen van de organisatie
• MIDDELEN
• financiering
• infrastructuur
• MENSEN
• experti...
BEWAREN: OPSLAG
• OFF LINE
• goedkoop
• kwetsbaar
• eigen beheer
• beperkte beschikbaarheid
• ON LINE
• kwaliteit heeft pr...
OFFLINE: CD, DVD
• PRO
• goedkoop
• compact
• CONTRA
• zeer kwetsbaar
• verouderde technologie
• beperkte capaciteit
OFFLINE: SSD (SLC FLASH)
• PRO
• robuuster dan HD
• eenvoudig in gebruik
• CONTRA
• geen netwerk
• beperkt aantal schrijfa...
OFFLINE: USB FLASH (MLC)
• PRO
• goedkoop
• compact
• CONTRA
• beperkte capaciteit
• kwetsbaarder dan SLC
OFFLINE: EXTERNE HARDE SCHIJF
• PRO
• goedkoop
• eenvoudig in gebruik
• CONTRA
• kwetsbaar
• geen netwerk
OFFLINE: NAS
• PRO
• veiliger met RAID-X
• netwerk
• CONTRA
• duurder
• minder eenvoudig
ONLINE: CLOUD SERVICE
• PRO
• goedkoop/gratis
• eenvoudig
• integratie in besturingssysteem
• CONTRA
• beperkte capaciteit...
ON LINE: CLOUD STORAGE
• PRO
• relatief veilig
• toegevoegde services
• CONTRA
• kostprijs
• VOORBEELDEN
• Amazon Simple S...
ONLINE: DATA CENTER
• PRO
• zeer veilig
• hoog service level
• CONTRA
• kostprijs
• complexe formules en
contracten
BACKUP STRATEGIE
• COURANTE, KWALITATIEVE DRAGERS
• 3 KOPIEEN, WAARVAN 1 OP EXTERNE LOCATIE
• INCREMENTEEL
• VERSCHILLENDE...
PRIORITEITEN STELLEN
WELKE BESTANDEN BACK-UPPEN?
gemakkelijk
vervangbaar
moeilijk
vervangbaar
uniek
minder
belangrijk
grat...
CHECKSUMS
5. ON LINE PUBLICEREN
WEB HOSTING SERVICES
• PRO
• eenvoudig
• goedkoop of gratis
• ondersteuning voor digital assets
• CONTRA
• beperkte functi...
WEB HOSTING SERVICES:
VOORBEELD BLOGSPOT
MULTIMEDIA HOSTING SERVICE
• PRO
• eenvoudig
• goedkoop
• embedding
• CONTRA
• functionaliteit beperkt
• ondersteuning en ...
SAMENWERKINGSVERBANDEN
• PRO
• veel expertise
• niet zelf ontwikkelen
• meer zichtbaarheid
• kostprijs
• CONTRA
• eigen vo...
ERFGOEDINZICHT
ERFGOEDPLUS
EUROPEANA
ERFGOEDCEL WAASLAND
EIGEN WEBSITE MAKEN?
• PRO
• alle controle
• database koppelen
• CONTRA
• complex
• arbeidsintensief
• VOORBEELDEN
• Colle...
TOOLS
• bouwen website: Joomla, WordPress, Drupal
• bezoek: Google Analytics
• html-code: validator.w3.org
• toegankelijkh...
OPEN CULTUUR DATA
6. RECHTEN
6. RECHTEN
• PRINCIPES AUTEURSRECHT
• Auteursrecht is onvervreemdbaar
• Auteursrecht ≠ eigendomsrecht
• Claim geen rechten...
VERWEESDE WERKEN
• DILIGENT SEARCH
• voor gebruik
• voor elk werk
• publiek bekend
• gedocumenteerd
• alle relevante bronn...
CREATIVE COMMONS LICENTIES
• STANDAARD LICENTIES
• OPEN LICENTIES
• BEPERKINGEN
• vermelding auteur
• geen commercieel geb...
RECHTEN
BIBLIOGRAFIE
Aan de slag met archief en documentatie: Digitaliseren
Aan de slag met archief en documentatie: Digitaliseren
Aan de slag met archief en documentatie: Digitaliseren
Aan de slag met archief en documentatie: Digitaliseren
Aan de slag met archief en documentatie: Digitaliseren
Aan de slag met archief en documentatie: Digitaliseren
Aan de slag met archief en documentatie: Digitaliseren
Aan de slag met archief en documentatie: Digitaliseren
Aan de slag met archief en documentatie: Digitaliseren
Aan de slag met archief en documentatie: Digitaliseren
Aan de slag met archief en documentatie: Digitaliseren
Aan de slag met archief en documentatie: Digitaliseren
Aan de slag met archief en documentatie: Digitaliseren
Aan de slag met archief en documentatie: Digitaliseren
Aan de slag met archief en documentatie: Digitaliseren
Upcoming SlideShare
Loading in …5
×

Aan de slag met archief en documentatie: Digitaliseren

498 views

Published on

Heel wat erfgoedverenigingen en erfgoedvrijwilligers zijn geïnteresseerd in de digitalisering van hun documentaire collectie. Maar hoe begin je aan zo’n digitaliseringproject? Welk materiaal is het best geschikt? In deze les vertellen we je hoe je documenten het best organiseert en waar je rekening mee moet houden. Om zelf te begrijpen waar je rekening mee moet houden, komt ook de technische kant aan bod. Een basiskennis in het gebruik van een computer is vereist voor het volgen van deze les. - See more at: http://www.heemkunde-vlaanderen.be/aan-de-slag-met-archief-en-documentatie-nieuwe-reeks-5/

Published in: Education
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
498
On SlideShare
0
From Embeds
0
Number of Embeds
7
Actions
Shares
0
Downloads
3
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Aan de slag met archief en documentatie: Digitaliseren

  1. 1. Digitaliseren, digitaal bewaren en online publiceren Henk Vanstappen (PACKED vzw)
  2. 2. PACKED VZW • EXPERTISECENTRUM DIGITAAL ERFGOED • OPDRACHT • “Expertise rond digitalisering en digitale archivering centraliseren en verspreiden” • DOELGROEPEN • collectiebeherende organisaties • andere actoren in het ergoedveld • MIDDELEN • Structurele werking Vlaamse Gemeenschap • Projectsubsidies • Onderaanneming
  3. 3. INHOUD Dag 1: DIGITALISEREN • Planning • Bestandsformaten en parameters • Hardware • Registreren Dag 2: ARCHIVEREN & PUBLICEREN • Scoremodel digitale duurzaamheid • Publiceren • Auteursrecht
  4. 4. Dag 1 DIGITALISEREN
  5. 5. DIGITALISEREN? • VAN ANALOOG NAAR BINAIR • beeld, audio, video, tekst • WERKPROCES • voorbereiding • uitvoering • kwaliteitscontrole • REGISTREREN (METADATA) • bestandsnaam • beschrijvende metadata • technische metadata
  6. 6. HARDWARE: SCANNERS scanner flatbed documentscanner transparant camera bookscanner
  7. 7. FLATBED • PRO • Goedkoop • Aanvaardbare kwaliteit • Compact • CONTRA • Traag • Schade aan origineel
  8. 8. DOCUMENT FEEDER • PRO • Zeer snel • Aanvaardbare kwaliteit • Aanvaardbare prijs • CONTRA • Enkel losse vellen • Schade aan origineel
  9. 9. DIA SCANNER • PRO • Aanvaardbare kwaliteit • Aanvaardbare prijs • CONTRA • Traag
  10. 10. BOEKSCANNER • PRO • Sneller • Conservering • Intelligente software • CONTRA • Duur • Geen transport
  11. 11. SELFMADE BOOKSCANNER
  12. 12. 3D SCANNERS
  13. 13. TEST TARGET IMAGE • TEST • kleurechtheid • scherpte • kleurgradaties • DELT.AE • web based controle tool: http://www.delt.ae
  14. 14. AUDIO CONVERTORS • PRO • goedkoop • eenvoudig gebruik • CONTRA • lage kwaliteit • exportformaten
  15. 15. VIDEO CONVERTORS • PRO • goedkoop • eenvoudig gebruik • CONTRA • lage kwaliteit • exportformaten
  16. 16. BEELDSCHERM • OPSTELLING • stabiele lichtomstandigheden • geen invallend licht • KALIBRATIE • colorimeter • spectrophotometer
  17. 17. WORKFLOW MANAGEMENT • SPREADSHEET • operator • datum creatie en controle • bestandsnaam • … • PRO SOFTWARE • Goobi (Open Source) • OmniScan • …
  18. 18. WORKFLOW MANAGEMENT SOFTWARE
  19. 19. PARAMETERS
  20. 20. TOOL: VUESCAN
  21. 21. RESOLUTIE • sample rate (“bemonsteringsfrequentie”) • uitgedrukt in PPI (beeld) of Hz (geluid) • bepalend voor bestandsgrootte: • Audio: sample rate x2  bestand x2 • 2D: resolutie x2  bestand x4
  22. 22. RESOLUTIE • BEELD • Pixels per Inch (PPI) • Let op met interpolatie! • VIDEO • lineaire pixels: 2K, 4K, 8K • originele frame rate • AUDIO • Sample frequency: 48 tot 96 kHz
  23. 23. RESOLUTIE: BEREKENEN • 1 inch = 2,56 cm • voorbeeld dia op A4: 21 cm x 300 dpi / 3,6 cm = 1750 ppi • voorbeeld poster op A4: 21 cm x 300 dpi / 70 cm = 90 ppi breedte gewenste afdruk x gewenste resolutie afdruk breedte origineel
  24. 24. RESOLUTIE: AANBEVELINGEN • BEELD • foto’s, documenten: 300 ppi • dia’s, negatieven: 300 ppi * reductiefactor (1200 ppi) • affiches: <300 ppi • tekst: punt van de i moet herkenbaar zijn • VIDEO • 16 en 35 mm film: 2K, resp. 4K • AUDIO • 48 KHz
  25. 25. KLEUR & KLEURDIEPTE RED GREEN BLUE 000000000000000000000000 000000000000000000000001 000000000000000000000010 … 111111111111111111111111 256 * 256 * 256 = 16,7 miljoen combinaties
  26. 26. KLEURDIEPTE • Aantal bits gebruikt om een kleur te bepalen • Bepalend voor grootte bestand
  27. 27. DYNAMISCH BEREIK (RANGE) • bepaald door bitdiepte en compressie
  28. 28. KLEURRUIMTE • sRGB (IEC 61966-2.1) • AdobeRGB • ECI-RGB • ProPhotoRGB • MelissaRGB
  29. 29. KLEUR: AANBEVELINGEN • KLEURDIEPTE • kleurorigineel: 24 bits of meer (nabewerking: 30 of 48 bits) • grijswaarden: 8 of 16 bit • zwartwit: 1 bit • KLEURRUIMTE • preserveringsdoeleinden: ECIRGB of AdobeRGB • raadpleging: sRGB
  30. 30. COMPRESSIE • Afhankelijk van bestandsformaat • Lossless: geen informatieverlies (bv. LZW, ZIP) • Lossy: artefacten, kleurverlies (JPEG)
  31. 31. BESTANDSFORMATEN
  32. 32. TYPES NAAR VORM • BITMAP IMAGE (RASTER) • VECTOR IMAGE • TEKST • AUDIO • VIDEO • … ARCHIEF, EXECUTABLE, DATA
  33. 33. TYPES NAAR FUNCTIE • PRE-PROCESSING • unprocessed, uncompressed • REPRODUCTIEBESTAND (MASTER) • hoogste vereiste kwaliteit • ongewijzigd • ARCHIVERINGSBESTAND • open formaat • in eDepot • RAADPLEGINGSBESTAND • webvriendelijk formaat
  34. 34. FORMATEN: AANBEVELINGEN • OPEN FORMATEN • publiek beschikbaar, beheerd door non profit organisatie • geen patenten • voldoende gebruikers en software • BEELD • Baseline TIFF v6 uncompressed, JPEG2000 • VIDEO • Container: MXF, AVI, MOV • Codec: MJPEG2000 • AUDIO • WAV, AIFF, FLAC
  35. 35. BESTANDSNAMEN • BETEKENISVOL OF BETEKENISLOOS • kans op fouten • arbeidsintensief • betere alternatieven voor informatieopslag • BASISREGELS: • Hou het simpel: max. 3 elementen • abcedfghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUV WXYZ1234567890_ • Gebruik punt enkel voor extensie
  36. 36. STRUCTUUR • VASTLEGGEN • documenten • collecties, verzamelingen • DON’T: • Multipage file format • Bestandsnaam • Mappenstructuur • DO: • Structurele metadata
  37. 37. TOOL: XNVIEW
  38. 38. TOOL: XNVIEW • FUNCTIES • Bestanden hernoemen • Bestandsformaten aanpassen • Bestanden wijzigen • Bestanden bewerken • ALTERNATIEVEN • IrfanView, Adobe Photoshop, GIMP (open source), Corel Photo paint…. • ReName
  39. 39. TOOL: VLC
  40. 40. TOOL: VLC • FUNCTIES • Bestanden transcoderen • Bestanden analyseren • Bestanden bewerken • ALTERNATIEVEN • FFMPEG, MPEG streamclip (video) • Audacity (geluid)
  41. 41. OCR
  42. 42. OCR: TEKSTHERKENNING Herkennen van tekst in beeld
  43. 43. OCR: KENMERKEN • NIVEAUS • tekst • paragrafen • documentopmaak • structuur • named entity recognition • TAAL • EXPORTFORMAAT • PDF, DOC • RTF • XML
  44. 44. OCR: PARAMETERS • ACCURAATHEID • nooit 100% • 99% correcte tekens = 95% correcte woorden • controle: crowdsourcing & recaptcha
  45. 45. OCR: TOOLS • PRO • Abby Finereader • Omnipage • Adobe Acrobat, NitroPDF (embedded text) • FREEWARE/OPEN SOURCE • PDF OCR X (demo) • FreeOCR • OCRFeeder • ON LINE • Google Drive, archive.org, PDFescape
  46. 46. TEKSTFORMATEN • TEKENCODERING • ‘Codetabel waarmee binaire code omgezet wordt naar tekens’ • ASCII: 7 en 8 bits • aanbeveling: UTF-8 • TEKSTFORMATEN • basis: TXT, RTF • document: PDF, Word, ODF • tagged: XML, HTML • opmaak en inhoud: METS/ALTO
  47. 47. DIGITALISEREN: BELEID
  48. 48. WAAROM DIGITALISEREN? • VERVANGINGSKOPIE • origineel degradeert • origineel verloren of niet in bezit • VEILIGHEIDSKOPIE • manipulatie minimaliseren • RAADPLEGING • betere toegankelijkheid • doorzoekbaarheid • BEWERKEN • OCR: tekstherkenning • Aanpassen: kleur, contrast, croppen, monteren, …
  49. 49. WAT DIGITALISEREN? • RELEVANTIE • collectiebeleid • raadpleegfrequentie • PRIORITEITEN • kwestbaarheid • tijdelijk beschikbaar • RECHTEN • wat mag worden gedigitaliseerd • wat mag worden gepubliceerd
  50. 50. DIGITALISERINGSPLAN • WAAROM? • Consensus en referentiedocument • Projectplanning en opvolging • WAT? • Welke collecties • Hoe digitaliseren • HOE? • Werkproces • WIE? • Taken en verantwoordelijkheden
  51. 51. SELECTIE • DOORLICHTING COLLECTIE • aantallen • soorten • eigendom • prioriteit
  52. 52. SELECTIE • CRITERIA • onderwerp • materiaalsoort • prioriteit • beschikbaarheid (rechten!) • OVERZICHTSLIJST • naam set • lokatie • aantallen • prioriteit
  53. 53. WERKPROCES PLANNEN
  54. 54. VOORBEREIDING • FYSIEKE VOORBEREIDING • beschadigingen • uitvouwen, uitrollen • gebonden volumes losmaken • tape, nietjes…  goed plannen om vertragingen te vermijden
  55. 55. VOORBEREIDING • PILOT • Problemen opsporen • Benodigde tijd inschatten • Werkproces op punt stellen
  56. 56. ORGANISATIE • AFSPRAKEN VASTLEGGEN • Wie doet wat • Wanneer • Takenblad
  57. 57. KWALITEITSCONTROLE • VOLLEDIGHEID • Takenblad • KWALITEIT • Visuele controle • Test targets: controle via Deltae: delt.ae/ • VALIDATIE • Jhove: controle bestandsformaat, compressie, … • VLC: controle video-eigenschappen, codecs, …
  58. 58. JHOVE
  59. 59. TOOL: JHOVE • IDENTIFICEREN • is dit het juiste bestandsformaat? • KARAKTERISEREN • wat zijn de technische kenmerken van het bestand? • VALIDEREN • beantwoordt het aan de specificatie? • zijn er fouten die de leesbaarheid bedreigen?
  60. 60. OPSLAG • TIJDELIJKE KOPIE • interne of externe harde schijf • checksums creeren (zie deel 2) • zo snel mogelijk backup kopie • PERMANENTE OPSLAG • vooraf plannen! • zie deel 2. Archiveren
  61. 61. REGISTREREN
  62. 62. WAAROM REGISTREREN? • collectie vindbaar maken • collectie beheren • data hergebruiken • data uitwisselen • data publiceren • digitalisering plannen en uitvoeren
  63. 63. DATASTANDAARDEN
  64. 64. DATASTANDAARDEN • datastructuur: welke gegevens? • data value: welke waarden? • data content: hoe noteren?
  65. 65. DATA STRUCTUUR STANDAARDEN Een datastructuur legt een groep beschrijvingselementen vast die bij elkaar horen (schema).
  66. 66. DATA STRUCTURE STANDAARDEN • generiek: Dublin Core • collecties Cometa • archieven: EAD, ISAD(G) • museumobjecten: CDWA, CIDOC • locaties: KLM, WGS84 • personen: GEDCOM, ISAAR(CPF)
  67. 67. DUBLIN CORE METADATA SCHEMA element betekenis title titel creator vervaardiger subject onderwerp description beschrijving publisher uitgever contributor andere bijdrager date datum type objecttype format vorm of afmeting identifier unieke code source bron language taal van het object relation gerelateerde bron coverage plaats of tijd rights rechten
  68. 68. DATA VALUE STANDAARDEN Een data value standaard legt vast welke waarden binnen een beschrijvingselement kunnen worden gebruikt.
  69. 69. DATA VALUE STANDAARDEN 1 • generiek: Wikipedia • personen: ULAN, RKDArtist, ODIS, VIAF • concepten: AAT, Iconclass, LCSH, Plan Hoffman-Krayer, THB (Catteeuw) • locaties: TGN, Geonames, ISO 3166, CRAB • Talen: ISO 639-x
  70. 70. DATA CONTENT STANDAARDEN Een data content standaard legt vast hoe een waarde binnen een beschrijvingselement wordt genoteerd.
  71. 71. DATA CONTENT STANDAARDEN • publicaties: AACR2, RDA, VLACC • archiefcollecties: DACS • museumobjecten: CCO, MovE Invulboek • datum & tijd: ISO 8601
  72. 72. MOVE INVULBOEK
  73. 73. TOOLS: DIY • MAPPEN EN BESTANDSNAMEN • EMBEDDED METADATA • SPREADSHEET • Excel, LibreOffice Calc, … • DATABASE • MS Access, FileMaker, MySQL, …
  74. 74. TOOLS: REGISTRATIESOFTWARE • TYPES • commercieel of open source • objecten, archieven, digital assets, documenten • netwerk, standaloneof • VOORBEELDEN • Collective Access (OSS, museum) • Adlib Museum , Adlib Light • ICA-Atom (OSS, archieven) • ACDSee, XnView (fotocollecties) • CollectionSpace: (OSS DAM) • Colibreo: SAAS
  75. 75. TOOLS: ADLIB LIGHT
  76. 76. TOOLS: COLLECTIVE ACCESS
  77. 77. OEFENING
  78. 78. DATAPROFIELEN • ook: application profile • standaarddatastructuur + elementen uit andere schema’s + standaardterminologie + beschrijvingsregels • terugwaarts compatibel • onmisbaar
  79. 79. DATAPROFIELEN
  80. 80. 4. BEWAREN
  81. 81. Foto: THE Holy Hand Grenade! CC BY-SA 2.0
  82. 82. Foto: portfolium CC BY-NC 2.0
  83. 83. BEWAARSTRATEGIE • MISSIE • doelstellingen van de organisatie • MIDDELEN • financiering • infrastructuur • MENSEN • expertise • verantwoordelijkheden • METHODEN • adequate procedures
  84. 84. BEWAREN: OPSLAG • OFF LINE • goedkoop • kwetsbaar • eigen beheer • beperkte beschikbaarheid • ON LINE • kwaliteit heeft prijs • betere beschikbaarheid • controle wordt uit handen gegeven
  85. 85. OFFLINE: CD, DVD • PRO • goedkoop • compact • CONTRA • zeer kwetsbaar • verouderde technologie • beperkte capaciteit
  86. 86. OFFLINE: SSD (SLC FLASH) • PRO • robuuster dan HD • eenvoudig in gebruik • CONTRA • geen netwerk • beperkt aantal schrijfacties • relatief duur
  87. 87. OFFLINE: USB FLASH (MLC) • PRO • goedkoop • compact • CONTRA • beperkte capaciteit • kwetsbaarder dan SLC
  88. 88. OFFLINE: EXTERNE HARDE SCHIJF • PRO • goedkoop • eenvoudig in gebruik • CONTRA • kwetsbaar • geen netwerk
  89. 89. OFFLINE: NAS • PRO • veiliger met RAID-X • netwerk • CONTRA • duurder • minder eenvoudig
  90. 90. ONLINE: CLOUD SERVICE • PRO • goedkoop/gratis • eenvoudig • integratie in besturingssysteem • CONTRA • beperkte capaciteit • beperkte aansprakelijkheid • VOORBEELDEN • Google drive, Amazon Cloud, Box, Dropbox, iCould, SugarSync, Skydrive
  91. 91. ON LINE: CLOUD STORAGE • PRO • relatief veilig • toegevoegde services • CONTRA • kostprijs • VOORBEELDEN • Amazon Simple Storage web service (S3) • Windows Azure • Google Cloud storage • Belgie: Nomadesk, Amplidata, … • ISP (inbegrepen in abonnement)
  92. 92. ONLINE: DATA CENTER • PRO • zeer veilig • hoog service level • CONTRA • kostprijs • complexe formules en contracten
  93. 93. BACKUP STRATEGIE • COURANTE, KWALITATIEVE DRAGERS • 3 KOPIEEN, WAARVAN 1 OP EXTERNE LOCATIE • INCREMENTEEL • VERSCHILLENDE TECHNOLOGIEEN • DOCUMENTEER PROCEDURE • CONTROLEER EN TEST • HOU REKENING MET RELEVANTIE
  94. 94. PRIORITEITEN STELLEN WELKE BESTANDEN BACK-UPPEN? gemakkelijk vervangbaar moeilijk vervangbaar uniek minder belangrijk gratis software verslagen foto’s evenement zeer belangrijk thumbnails op website eigen gedigitaliseerde collectie gedigitaliseer- de bruikleen
  95. 95. CHECKSUMS
  96. 96. 5. ON LINE PUBLICEREN
  97. 97. WEB HOSTING SERVICES • PRO • eenvoudig • goedkoop of gratis • ondersteuning voor digital assets • CONTRA • beperkte functionaliteit • VOORBEELDEN • Google sites • Wordpress • Blogspot
  98. 98. WEB HOSTING SERVICES: VOORBEELD BLOGSPOT
  99. 99. MULTIMEDIA HOSTING SERVICE • PRO • eenvoudig • goedkoop • embedding • CONTRA • functionaliteit beperkt • ondersteuning en continuiteit • geen archivering • VOORBEELDEN • Flickr, Picasa, YouTube, Vimeo, …
  100. 100. SAMENWERKINGSVERBANDEN • PRO • veel expertise • niet zelf ontwikkelen • meer zichtbaarheid • kostprijs • CONTRA • eigen vormgeving • volgens bestaand format • niet overal aanwezig
  101. 101. ERFGOEDINZICHT
  102. 102. ERFGOEDPLUS
  103. 103. EUROPEANA
  104. 104. ERFGOEDCEL WAASLAND
  105. 105. EIGEN WEBSITE MAKEN? • PRO • alle controle • database koppelen • CONTRA • complex • arbeidsintensief • VOORBEELDEN • CollectiveAccess • Omeka • Wordpress
  106. 106. TOOLS • bouwen website: Joomla, WordPress, Drupal • bezoek: Google Analytics • html-code: validator.w3.org • toegankelijkheid: Anysurfer.be
  107. 107. OPEN CULTUUR DATA
  108. 108. 6. RECHTEN
  109. 109. 6. RECHTEN • PRINCIPES AUTEURSRECHT • Auteursrecht is onvervreemdbaar • Auteursrecht ≠ eigendomsrecht • Claim geen rechten die je niet hebt • Geef geen rechten weg die je niet hebt • FAIR USE • PUBLIEK DOMEIN • 70 jaar na dood auteur • overlijden onbekend:  pre ± 1873
  110. 110. VERWEESDE WERKEN • DILIGENT SEARCH • voor gebruik • voor elk werk • publiek bekend • gedocumenteerd • alle relevante bronnen • EXTENDED COLLECTIVE LICENSING • vergoeding • rechtszekerheid
  111. 111. CREATIVE COMMONS LICENTIES • STANDAARD LICENTIES • OPEN LICENTIES • BEPERKINGEN • vermelding auteur • geen commercieel gebruik • geen afgeleiden • onder zelfde licentie verspreiden
  112. 112. RECHTEN
  113. 113. BIBLIOGRAFIE

×