De online erfgoedbibliotheek (2/3)
Upcoming SlideShare
Loading in...5
×
 

De online erfgoedbibliotheek (2/3)

on

  • 983 views

Deze presentatie behandelt wat er allemaal komt kijken bij het digitaliseren en online publiceren van erfgoedmateriaal, met de nadruk op bibliotheekerfgoed. En passant wordt ingegaan wat er in ...

Deze presentatie behandelt wat er allemaal komt kijken bij het digitaliseren en online publiceren van erfgoedmateriaal, met de nadruk op bibliotheekerfgoed. En passant wordt ingegaan wat er in Vlaanderen en België zoal beschikbaar is aan digitaal bibliotheekerfgoed. Bedoeling is een inleiding te geven en een theoretisch kader. Wie zelf wil digitaliseren vindt aan het begin van de presentatie enkele leestips.


PRESENTATIE 2 (van 3)
- Digitalisering van presentaties
--- Wat zijn publicaties? Vroeger en nu
--- ‘Born-digital’
- Waarom publicaties digitaliseren?
--- Conservering
--- Toegang erfgoedobjecten
--- Toegang informatie
- Hoe publicaties digitaliseren?
--- Digitale beelden maken
--- Optische tekenherkenning
--- Transcriberen

Statistics

Views

Total Views
983
Views on SlideShare
631
Embed Views
352

Actions

Likes
0
Downloads
0
Comments
0

2 Embeds 352

http://www.heemkunde-vlaanderen.be 250
http://www.vlaamse-erfgoedbibliotheek.be 102

Accessibility

Categories

Upload Details

Uploaded via as Microsoft PowerPoint

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

De online erfgoedbibliotheek (2/3) De online erfgoedbibliotheek (2/3) Presentation Transcript

  • De onlineerfgoedbibliotheek (2)David CoppoolseStafmedewerker ontsluiting en digitaliseringVlaamse ErfgoedbibliotheekVormingsreeks ‘Van heemkundige collectie totonline erfgoedbibliotheek’Heemkunde Vlaanderen | november 2011
  • Wat vooraf ging in presentatie 1 Zelf digitaliseren De vzw Vlaamse Erfgoedbibliotheek  Erfgoedbibliotheken Wat is digitalisering? Digitalisering van ‘ingangen’ op collecties  Catalogi  Netwerkcatalogi, Union Catalogs  Bibliografieën  Abraham, STCV  Collectiebeschrijvingen  Collectieregisters2011-11-30 2
  • Digitalisering van publicaties
  • Papieren publicaties Boeken  Manuscripten (‘handgeschreven boeken’)  Handgedrukte boeken (‘oude drukken’)  1455 – negentiende eeuw (1830)  Machinaal gedrukte boeken (‘moderne drukken’)  negentiende eeuw (1830) – nu2011-11-30 4
  • Papieren publicaties Periodieken  Kranten  Vanaf ca. 1620 – Abraham Verhoeven, Antwerpen  Tijdschriften  Vanaf tweede helft achttiende eeuw2011-11-30 5
  • De krant, toen en nu…2011-11-30 6
  • Elektronische publicaties e-Books Digitale periodieken  Kranten  Tijdschriften Websites Apps Games Databanken …2011-11-30 7
  • ‘Born digital’ = ‘Van oorsprong digitaal’ Digitale publicaties die nooit in papieren vorm bestaan hebben  Creatie, bewaring en raadpleging zijn volledig digitaal  Vaak is er nog wel een papieren pendant  Bewaring is speciale uitdaging! Eigenlijk ook: alle papieren publicaties anno 2011  Op basis van computerbestanden  Begonnen in de jaren 1970 met computergestuurd zetten2011-11-30 8
  • Waarom publicatiesdigitaliseren?
  • Waarom digitaliseren? Reden 1: Conservering (behoud informatie) Veel Weinig geraadpleegd geraadpleegd Kwetsbaar/ In slechte staat ++ + In goede staat + –2011-11-30 10
  • Groot probleem: Kranten2011-11-30 11
  • Alternatief voor microfilm? Microfilm:  Goede microfilm gaat meer dan 100 jaar mee  Met een vergrootglas kom je een heel eind Digitaal bestand:  Hoe lang gaat de drager, het bestand, de softwaretoepassing, het besturingssysteem, de hardware mee?  Digitale duurzaamheid2011-11-30 12
  • Waarom digitaliseren? Reden 2: Toegang erfgoedobjecten verbeteren  Bibliotheekerfgoed relatief moeilijk toegankelijk  Massaal bladeren door manuscripten, oude boeken, kranten etc. bedreigt voortbestaan  Topstukken liggen normaliter in de kluis2011-11-30 13
  • Gedemonteerde Bijbel van Anjou © Bruno Vandermeulen2011-11-30 14
  • Gedigitaliseerde Bijbel van Anjou2011-11-30 15
  • Waarom digitaliseren? Reden 3: Informatietoegang verbeteren  Toegang tot materiaal vereenvoudigen  Van achter het bureau van de gebruiker  ‘Overal ter wereld’  Nieuwe antwoorden en vragen mogelijk maken  Snel zoeken door grote corpora  Taalkundige analyse van grote hoeveelheden teksten2011-11-30 16
  • Problemen digitale toegang Digitaal materiaal opgeslagen  in heel veel afzonderlijke ‘silo’s’  met zeer verschillende manieren van toegang Gedigitaliseerd op  uiteenlopende kwaliteiten  volgens diverse standaarden Verbeterpunten voor de komende jaren!2011-11-30 17
  • Hoe publicatiesdigitaliseren?
  • Conversie van publicaties Optie 1: Maken van digitale beelden van papieren pagina’s  ‘Imaging’ met een scanner of een digitale fotocamera  Voordeel:  Ziet eruit zoals het origineel  Direct leesbaar voor mensen (soms beter dan origineel)  Is inhoudelijk foutloos  Nadeel:  Niet leesbaar voor computers  Bijv. zoeken, knippen+plakken niet mogelijk  Véél grotere bestanden dan gewone tekst2011-11-30 19
  • Eén pagina als tekstbestandMS Word 2003 Platte tekst2011-11-30 20
  • Eén pagina als beeldbestandTIFF - kleur, 300 dpi, ongecomprimeerd Alternatieven - kwaliteitsverlies  TIFF Grijstinten  8.513 kB (~8,3 MB)  TIFF Zwart/Wit  482 kB (~0,5 MB)  JPEG Kleur 90%  1.388 kB (~1,4 MB)2011-11-30 21
  • Waarom toch grote bestanden? We willen:  Een moederkopie die het origineel zo goed mogelijk benadert  In een zo eenvoudig mogelijk, duurzaam bestandsformaat Dus:  Kleur (of tenminste grijswaarden)  Hoge resolutie (veel beeldpunten per cm2)  Geen compressie met beeldverlies2011-11-30 22
  • Maken van beelden2011-11-30 23
  • Niet voor bibliotheekerfgoed2011-11-30 24
  • Boekscanners Lees- zaal- model2011-11-30 25
  • 2011-11-30 model Boekscanners  Professioneel 26Scanstudio Universiteit Gent | © Vlaamse Erfgoedbibliotheek – Foto: Stefan Tavernier
  • Boekscanners Volautomatisch model2011-11-30 27
  • 2011-11-30 Fotostudio Scanstudio Universiteit Gent | © Vlaamse Erfgoedbibliotheek – Foto: Stefan Tavernier28
  • Wat staat hier?2011-11-30 29
  • Wat staat hier?2011-11-30 30
  • Conversie van publicaties Optie 2: Interpreteren van de lettertekens van digitale beelden  ‘Optical Character Recognition’ (OCR)  Computer herkent patronen van beeldpunten als lettertekens Voordeel: Zoeken, kopiëren en andere computerbewerkingen worden mogelijk Nadeel: Foutenmarge2011-11-30 31
  • Stappen van OCRFysieke tekst Opname Verwerking Computertekst 2011-11-30 32
  • Optical Character RecognitionWat werkt quasi feilloos? Waarom? Alledaags  Eenvoudige kantoordocument tekststructuur Op laserprinter  Scherpe contrastrijke afgedrukt afdruk In een gangbaar  Gekende lettervormen, lettertype zonder ligaturen etc Met een lettergrootte van  Veel pixels per letter minimaal 10 pt In een moderne taal  Woordenlijsten beschikbaar ter controle2011-11-30 33
  • Uitdagingen tekstherkenning Handgeschreven tekst Complexe of ongebruikelijke lettertypes Kleine lettertypes Slecht drukwerk Beschadigde materialen Gebonden materialen Oude en onregelmatige spelling Pagina’s in kolommen2011-11-30 34
  • Handgeschreven tekst2011-11-30 35
  • Lastige lettertypes2011-11-30 36
  • Verschillende lettertypes2011-11-30 37
  • Lettervarianten2011-11-30 38
  • Beschadigde materialen2011-11-30 39
  • Gebonden materialen2011-11-30 40
  • Tekst in kolommen2011-11-30 41
  • Oplossingen OCR-problemen? Trainen, trainen, trainen van de software Herkenning van woordbeeld (i.p.v. losse letters) Woordenlijsten van specifieke periodes opstellen Taalkundige analyse verwerken in herkenningssoftware  Grammaticaal correct? Inhoudelijk correct? 100% foutloos wordt het waarschijnlijk nooit Voer voor onderzoekers: www.impact-project.eu2011-11-30 42
  • Conversie van publicaties Optie 3: Transcriberen van papieren teksten  Handmatige computerinvoer door menselijke lezers Nadeel: Arbeidsintensief Voordelen:  Lage foutenmarge (indien zorgvuldig uitgevoerd)  Tekststructuur kan mee worden getranscribeerd  Noodzakelijk voor bep. wetenschappelijk onderzoek  Sterke verbetering digitale ontsluitingsmogelijkheden2011-11-30 43
  • Codering van tekststructuur  ‘Platte tekst’  Eenvoudig, goedkoop  Informatieverlies (opmaak, tekststructuur)  ‘Tagged text’  Specialistisch, duur  Bevat ook info over opmaak of structuur2011-11-30 44
  • Vervolg in presentatie 3 Stappen in het digitaliseringsproces 1. Materiaalanalyse 2. Metadatering Optische Materiaalanalyse Beeldbewerking 3. Rechten klaren tekstherkenning 4. Preservering 5. Beeldbewerking Metadatering Scanning Duurzame opslag 6. Scannen 7. OCR Rechten klaren Preserverende Online publicatie handelingen 8. Duurzame opslag 9. Online publicatie Digitaliseringsprojecten Vlaams bibliotheekerfgoed2011-11-30 45
  • ContactgegevensDavid CoppoolseStafmedewerker Ontsluiting en Digitaliseringdavid@vlaamse-erfgoedbibliotheek.behttp://www.vlaamse-erfgoedbibliotheek.be