Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Libor Coufal - Australská národní knihovna 2 - přednáška Praha 22.3.2017

931 views

Published on

2. část - Digitální uchovávání, digital preservation

Published in: Technology
  • Be the first to comment

  • Be the first to like this

Libor Coufal - Australská národní knihovna 2 - přednáška Praha 22.3.2017

  1. 1. DIGITÁLNÍ SBÍRKY A JEJICH DLOUHODOBÉ UCHOVÁVÁNÍ V NÁRODNÍ KNIHOVNĚ AUSTRÁLIE LIBOR COUFAL
  2. 2. Digitální uchovávání „vzhůru nohama“
  3. 3. Průkopnická léta • 80. léta – „elektronické“ materiály na PN • 1994 – pozice pro „elektronické uchovávání“ • 1996 – Pandora • 1997/98 – IT projekt „Digital Services“ – digitální úložiště (DOSS) – DCM
  4. 4. Průkopnická léta • 2006/7 – Australian Partnership for Sustainable repositories – Automated Obsolescence Notification System (AONS) • 2007/8 – interní projekty – Mediapedia, Prometheus, Configulator
  5. 5. Průkopnická léta • 2008 – interní hodnocení (DRAMBORA, TRAC) • 2009 – profilace digitálních fondů • 2010/11 – „preservation intents“ • 2012 – DLIR • 2016 – Preservica v provozu
  6. 6. Strategický plán 2015 - 19 • Strategické cíle, priority a implementační rámec • Typy digitálních materiálů: – Původní digitální • Publikovaný • Nepublikovaný – Digitalizovaný • Interně • Externě – Původní digitální vytvořený • Interně/na zakázku – Sklizený webový materiál
  7. 7. Hodnocení rizik • Faktory – Jedinečnost • Existuje ve fyzické podobě? – Charakteristiky • Jak/kým vytvořen? • Standardy, kontrola kvality? • Uniformita
  8. 8. TYPE CHARACTERISTICS Input – source item Output – digital item Preservation risk Born-digital – Internally-created or commissioned  No physical equivalent  Created to a defined standard  Agreed preservation format  Uniform format(s)  Quality assurance/control in place  Low – based on homogeneity and control over creation Born-digital – Published  No physical equivalent (often)  Creation outside NLA control  Various file formats (not necessarily ‘well-formed’)  Some container formats  Possibly complex objects  Quality assurance/control uncertain  Content may exist in multiple operating system versions  Prone to Technological Protection Measures (TPMs) such as encryption or password protection to inhibit access and copying  Preservation may be mandated by legislation (e.g. legal deposit) or there may be a reputational risk if we do not fulfil our preservation commitment  Possibly high - based on heterogeneity and lack of control over creation  Expected or known issues with specific file formats (e.g. RealMedia)  Preservation action likely to be required sooner in the lifecycle. No business decision has been taken on ‘normalising’ formats on ingest (i.e. ‘format shift’).
  9. 9. Hodnocení rizik Riziko pro digitální uchování Typ materiálu Vysoké Původní digitální – publikovaný Původní digitální – nepublikovaný Původní digitální – webový materiál Nízké Původní digitální – vytvořený interně/na zakázku Digitalizovaný – interně Digitalizovaný - externě
  10. 10. Strategický cíl 1 • Uložit na řízeném úložišti a zajistit uchování na úrovni bitů – Všechny digitální objekty uloženy na úložišti – Mnohonásobné kopie – Řízení úložiště pro případ havárie – Pravidelná migrace úložných médií – Zabezpečení úložiště – Procesy pro pravidelnou verifikaci kontrolních součtů
  11. 11. Strategický cíl 2 • Správa digitálních objektů v LTP systému – „Ingest“ do produkční verze LTP – Pravidelná analýza a vykazování složení a stavu digitálních sbírek – Monitorování rizik pro dlouhodobé uchovávání – Logická ochrana sbírek (např. formátová migrace) podle potřeby
  12. 12. Strategický cíl 3 • Digitální uchovávání je robustní, spolehlivé a škálovatelné – Integrace LTP s ostatními knihovními systémy – Digitální uchovávání jako součást běžných business procesů, po boku ostatních funkcí pro správu fondů
  13. 13. Strategická priorita 1 • Původní digitální materiál – Publikovaný – Nepublikovaný – Pandora • Plně implementovat strategické cíle 1 (bitová ochrana) + 2 (logická ochrana)
  14. 14. Strategická priorita 2 • Zvukový materiál – Digitalizovaný (interně + externě) – Původní digitální • Plná implementace strategického cíle 1 (bitová ochrana) • Ingest do LTP, zbytek logické ochrany po roce 2019
  15. 15. Strategická priorita 3 • Digitalizovaný materiál, původní digitální vytvořený interně, webový materiál (mimo Pandory) • Plná bitová ochrana (Priorita 1) • Správa v DCM • Logická ochrana mimo LTP (pokud potřeba) – Přehodnocení po 2019
  16. 16. Q3 Q4 Q1 Q2 Q3 Q4 Q1 Q2 Q3 Q4 Q1 Q2 Ebooks and E-serials Music Scores Maps Physical Carriers PANDORA Simple Unpublished Complex Unpublished Monthly Activity Reports Annual QA Audit Annual Report Monitor Level of Support Monitor Preservation Risks Format Obsolescence Watch Collection Health Reports Preservation Treatments Not Started In Progress Delayed BAU Bit-level Preservation Maintain Long-term Usability Digital Preservation Road Map 2016 - 2019 2016/17 2017/18 2018/19 Ingest into Preservica
  17. 17. Bitová ochrana Policy on bit-level preservation of digital collection material • Redundance a diverzifikace – Nejméně 3 kopie – Nejméně 2 typy úložných médií – Nejméně jedna kopie v jiné lokalitě
  18. 18. Bitová ochrana • Kontrola integrity – Všechny soubory musí mít • Kontrolní součet • Časové razítko vytvoření součtu – Kontrolní součty musí být chráněny proti • Ztrátě • Poškození • Úmyslné změně – Integrita všech souborů musí být pravidelně kontrolována
  19. 19. Bitová ochrana • Audit – Měsíční výkazy o aktivitě (IT, kontola DiP) • Počet nových souborů a kontrolních součtů • Počet zkontrolovaných souborů a výsledky • Podniklé kroky v případě nesrovnalostí – Roční audit na reprezentativním vzorku (DiP za asistence IT) – Roční zpráva (DiP, pro CSG) • Souhrn aktivit v průběhu roku • Výsledky ročního audit
  20. 20. Preservica • Integrace se systémem eDeposit • Ingest plně automatizován – Extrakce metadat a souborů přes API – Vytvoření SIP • Hierarchie • Mapování metadat do XIP + DC • Použití původního kontrolního součtu – Vyexportování SIP na síťový disk monitorovaný Preservicou • 1x týdně, zpoždění 3 měsíce • Flexibilní, konfigurovatelný rámec
  21. 21. Preservica • Funkční – e-knihy, e-seriály, e-hudebniny • Připravuje se – Synchronizace po ingestu (duben/květen 2017) – e-mapy (květen/červen 2017) – Digitální archivy (květen/červen 2017) • Integrace s ArchivesSpace – Publikace na pevných nosičích (červenec 2017) – Pandora (červen 2018) • Integrace s Pandas
  22. 22. Logická ochrana • Neidentifikované formáty – Vysoké riziko  akce • Nejednoznačně/nesprávně identifikované formáty – Potenciálně vysoké riziko  akce • (Interní) podpora pro souborové formáty – Schopnost „zobrazit“ soubory v daném formátu
  23. 23. Podpora souborových formátů • Světově unikátní empirický výzkum – Mapování podpory formátů v SW aplikacích – Empirické testování kvality • Hlavní součást znalostní báze NLA • Od 2012/13, 1 pracovník (60 – 70 % úvazku) • > 12 tis. Záznamů • Implementace – Pracovní verze Excel – Import dat do graph DB
  24. 24. Podpora souborových formátů • Proces – Prioritizace formátů podle typu • (Pravděpodobnost) zastoupení ve fondu – Výzkum a dokumentace formátu – Výběr a dokumentace aplikací – Mapování podpory formátů v dané aplikaci – Testování kvality podpory
  25. 25. Podpora souborových formátů • Využití – Obsolescence Watch – Collection Health Report – Indikace migračních možností • Data budou zveřejněna
  26. 26. Certifikace # Rok Proces 1 2018/19 Samo-hodnocení podle Data Seal of Approval 2 2018/19 Získání Data Seal of Approval 3 2022/23 Samo-hodnocení podle ISO 16363 4 2023/24 Úpravy na základě samo-hodnocení 5 2025/26 Akreditace

×