Digitalizace a dlouhodobá ochrana digitálních dokumentů

1,023 views

Published on

Digitalizace, digitální dokument
Digitalizační workflow,
Formáty dat a metadat, identifikátory,
Problematika dlouhodobého uchování digitálních dokumentů

0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
1,023
On SlideShare
0
From Embeds
0
Number of Embeds
481
Actions
Shares
0
Downloads
7
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Digitalizace a dlouhodobá ochrana digitálních dokumentů

  1. 1. Modul 3: Služby Ochrana knihovních fondů – Digitalizace a dlouhodobá ochrana digitálních dokumentů Tento projekt je financován z Evropského sociálního fondu prostřednictvím Operačního programu Lidské zdroje a zaměstnanost a ze státního rozpočtu ČR. Název projektu: Zvýšení adaptability zaměstnanců organizací působících v sekci kultura Název kurzu: Seminář pro knihovníky a informační pracovníky – Inovační knihovnický kurz
  2. 2. Digitalizace a dlouhodobá ochrana digitálních dokumentů Mgr. Pavla Švástová Moravská zemská knihovna 25.5.2011 Inovační knihovnický kurz, Brno
  3. 3. Obsah ● Digitalizace, digitální dokument ● Digitalizační workflow ● Formáty dat a metadat, identifikátory ● Problematika dlouhodobého uchování digitálních dokumentů
  4. 4. Moravská zemská knihovna Digitalizace ● převod fyzického dokumentu do digitální podoby ● jedna z metod ochrany knihovního fondu ● cesta ke zpřístupnění kulturního dědictví široké veřejnosti ● projekty v ČR ○ VISK6 Manuscriptorium a VISK7 Kramerius ○ Národní digitální knihovna, Norské fondy ○ Europeana Travel, GoogleBooks ○ WebArchiv
  5. 5. Moravská zemská knihovna http://www.manuscriptorium.com
  6. 6. Moravská zemská knihovna http://kramerius.nkp.cz
  7. 7. Moravská zemská knihovna http://kramerius4.mzk.cz
  8. 8. Moravská zemská knihovna http://www.europeana.eu
  9. 9. Moravská zemská knihovna http://books.google.com/books
  10. 10. Moravská zemská knihovna Vlastnosti digitálního dokumentu ● čím se liší od fyzického dokumentu? ● obsahové vlastnosti jsou stejné! ● formální vlastnosti se liší! ● digitální forma uložení – bit stream ● nezávislost na nosiči ● pro jeho zpracování a zobrazení potřebujeme počítač ● lze donekonečna kopírovat beze změny kvality (vznikají další originály) ● nové vlastnosti? lepší prohledávání, možnosti popisu...
  11. 11. Moravská zemská knihovna Co vzít v potaz, než začnu digitalizovat? ● co chci digitalizovat? ○ knihy, periodika, diplomové práce, grafiky, mapy, 3D objekty, obrazy, zvuk, video ● proč chci digitalizovat? ○ archivace a zpřístupnění poškozených nebo vzácných dokumentů, nedostupných nebo hodně využívaných dokumentů... ● jak chci digitalizovat? ● náklady na digitalizaci, výrobu metadat, archivaci, nákup HW a SW
  12. 12. Moravská zemská knihovna ● neustálý vývoj hardware ○ počítat s novými typy zařízení (e-readery, SmartPhone, tablety apod.) ○ ceny jdou dolů ● neustálý vývoj software ○ používat pouze rozšířené a standardizované formáty dat a metadat ○ hlídat zastarávájící data ● ? Co vzít v potaz, než začnu digitalizovat?
  13. 13. Moravská zemská knihovna Digitalizační workflow
  14. 14. Moravská zemská knihovna Digitalizační workflow ● proces výroby digitálního dokumentu, jeho zpracování, archivace a zpřístupnění ● příprava dokumentů ● skenování ● úprava obrazu ● výroba metadat a OCR ● archivace ● zpřístupnění
  15. 15. Moravská zemská knihovna Příprava dokumentů před skenováním ● vyhledání nejkvalitnější předlohy ● kompletace dokumentu (periodika) ● katalogizace a přidělení identifikátorů ● restaurování poškozených dokumentů ● analýza stavu dokumentu, vybrání vhodné techniky skenování ● příprava pracoviště (optimální a rovnoměrné nasvícení)
  16. 16. Moravská zemská knihovna Skenování aneb jak vyrobit obrázky? ● černobílé? škála šedi? barva? ● rozlišení (300-600 DPI) ● velikost obrázku (MB) ● (stránka monografie A5 x nejkvalitněji naskenovaná mapa) ● v jakém formátu uložit dokument? které formáty se hodí pro dlouhodobou ochranu? (tiff, jp2, jpg, djvu) ● kompletnost dokumentu (kontrola kvality) ● systém ukládání (adresářová struktura)
  17. 17. Moravská zemská knihovna Zpracování obrazu ● ořez ● narovnání ● barevná škála a kalibrace ● výroba náhledů z originálního obrázku ● konverze do různých formátů (z tiff do jp2)
  18. 18. Moravská zemská knihovna Výroba OCR ● optical character recognition ● převod obrazového textu do počítačem čitelné podoby ● FineReader ● kvalita OCR ● opravy OCR? ○ kolaborativni opravy (Národní australská knihovna), http://trove.nla.gov.au/newspaper ○ projekt IMPACT, http://www.impact-project.eu/
  19. 19. Moravská zemská knihovna Jak obrázky popsat aneb výroba metadat ● identifikátory ○ čísla z knihovního katalogu = provázání s fyzickou jednotkou (systémové číslo, signatura, čárový kód, ČNB, evidenční číslo) ○ identifikace celého dokumentu, ročníku novin, kapitoly knihy, každé stránky ● metadata ○ data, která uchovávájí informace o vzniku dokumentu, o jeho vlastnostech, struktuře atd.
  20. 20. Moravská zemská knihovna Metadata I. ● deskriptivní (=popisná) ○ obdobná těm z knihovního katalogu (autor, název...) ○ jediné popisují obsah dokumentu ○ MODS, DC, MARCXML ● strukturální ○ jak je dokument poskládán? ○ jak jdou stránky po sobě? jaká jsou jejich fyzická a logická čísla? ○ periodikum-ročník-číslo-článek ○ provázání různých kvalit téhož obrázku ○ METS, FOXML
  21. 21. Moravská zemská knihovna Metadata II. ● technická ● jaká je kvalita a velikost obrázků ● na jakém přístroji byly obrázky vyrobeny? ● kdy byly snímky pořízeny ● formát obrázků ● MIX, ALTO ● administrativní ● kdo je vlastníkem dokumentu? ● komu je možné dokument zpřístupnit a za jakých podmínek? ● zaznamenán životní cyklus dokumentu ● PREMIS
  22. 22. Moravská zemská knihovna Zpřístupnění digitálních dokumentů ● vystavení dokumentů online ○ v digitální knihovně ke čtení ○ ke stažení (e-books) ○ uložení na digitální nosič ● myslet na autorský zákon! ● uživatelská přívětivost prostředí ● dáváme dokumentům přidanou hodnotu (2.0 služby)
  23. 23. Moravská zemská knihovna Archivace digitálních dokumentů ● archivuje se nejlepší kvalita obrázku a veškerá příslušející metadata ● uložení na disky (operativnější a rychlejší) nebo na pásky (pomalejší, ale bezpečnější) ● zálohování! ● kontrola přístupů ● LTP systémy
  24. 24. Moravská zemská knihovna ● dlouhodobá? ○ 5 let? 100 let? trvale? ○ účel – dokdy má dokument význam pro uživatele ○ počítat s neustálým vývojem software a hardware ○ sledovat formáty dat a metadat ○ dodržovat kompatibilitu ● neustálé sledování trendů vývoje informačních technologií a budování strategií, které se se změnami dokáží vyrovnat Dlohodobá ochrana digitálních dat???
  25. 25. Moravská zemská knihovna ● co chráníme? ○ informaci, vložené finance, kulturní dědictví... ○ ochrana bit streamu X ochrana logiky dokumentu ● proč? ○ srozumitelnost ○ použitelnost ○ vyhledatelnost ○ dostupnost v budoucnu ● jak? ○ potřebujeme plán! ○ vše evidovat, ukládat kontrolní součy apod. ○ dodržovat standardy, OAIS Dlohodobá ochrana digitálních dat???
  26. 26. Moravská zemská knihovna Dlohodobá ochrana digitálních dat ● identifikace (co to je za formát?) a validace (opravdu je to ten formát) – jsou všechny soubory standardní? ● kontrolní součty (při přesunech a kopírování) ● kapacita – máme místo na discích na archivní data, data pro zpřístupnění a jejich zálohy? ● standardy, standardy, standardy! ● odhad risků – které formáty souborů zastarávají a jak je transformovat? ● zobrazení – jak zobrazím, otevřu soubor v určitém formátu
  27. 27. Moravská zemská knihovna Dlohodobá ochrana digitálních dat ● LTP systémy – softwarová ochrana ● bezpečná úložiště – hardwarová ochrana ● open source nástroje: ○ RODA, ARCHIVEMATICA, AIDA, MOPSEUS ● komerční řešení ○ Rosseta (ExLibris), SDB (Tessela),...
  28. 28. Moravská zemská knihovna v Brně www.mzk.cz Děkuji za pozornost Pavla Švástová pavla.svastova@gmail.com

×