Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Andrea Miranda - Archivematica a standardy

1,037 views

Published on

Prezentace představuje základní standardy v oblasti LTP a certifikaci důvěryhodného digitálního úložiště a následně porovnává shodu systému Archivematicy s normou OAIS.

Published in: Technology
  • Be the first to comment

  • Be the first to like this

Andrea Miranda - Archivematica a standardy

  1. 1. Archivematica a standardy Andrea Miranda LTP-workshop Národní archiv ČR, 1.12.2015
  2. 2. WG Standardy OBSAH 1. Činnost WG Standardy 2. Výstupy pracovní skupiny 3. Standardy, audit a certifikace 4. Archivematica vs. OAIS
  3. 3. WG Standardy Činnost WG Standardy • spolupráce s jinými WG (WG Use Cases, WG kurátoři - praktické zkušenosti s Archivematicou, WG Publicita – výstupy) • zmapování standardů, které se přímo či nepřímo dotýkají úložišť • podrobná analýza ČSN ISO 14721:2012 ve vztahu k deklarovaným a testovaným funkcím systému Archivematica • překlad Technology Watch Reports od B.Lavoie: „The Open Archival Information System (OAIS) Reference Model: Introductory Guide“
  4. 4. WG Standardy Výstupy pracovní skupiny • Překlad studie B.Lavoie: „The Open Archival Information System (OAIS) Reference Model: Introductory Guide“ Digital Preservation Coalition – Technology Watch Reports • publikování jako oficiální český překlad (2016) • Seznam nejdůležitějších standardů, metodik a dokumentů pro LTP • Seznam kritérií ČSN ISO16363, které je možné podchytit LTP systémem • B4 Důvěryhodná dlouhodobá úložiště (časopis Knihovna – prosinec 2015) • B7 Orientace v terénu LTP a přehled standardů • C6 Archivematica z pohledy normy OAIS
  5. 5. 2.5 WG Standardy a normy Standardy, audit a certifikace • Evropský rámec pro audit a certifikaci repozitářů • Základní certifikace: dána repozitářům, jež splní podmínky auditu Data Seal of Approval (http://datasealofapproval.org/en/). • Rozšířená certifikace: splněna na základě pečetě Data Seal of Approval a interního „samo-auditu“ podle norem ISO 16363 nebo DIN 31644 (viz jejich popis níže v textu), přičemž o výsledcích tohoto „samo-auditu“ musí úložiště veřejně informovat. • Formální certifikace: naplněna v případě, kdy kromě základní certifikace získá úložiště i certifikaci na základě kompletního auditu (externími auditory) podle normy ISO 16363 nebo rovnocenné německé normy DIN 31644.
  6. 6. 2.5 WG Standardy a normy Standardy, audit a certifikace #2 • Data Seal of Approval • dostupné i v českém překladu na stránkách Univerzity Karlovy v Praze – http://dsa.cuni.cz • startovní bod pro dlouhodobou ochranu digitálních dokumentů • 16 kritérií; ve třech základních kategoriích - Producenti dat, Datový repozitář a Příjemci dat • Kategorie Producenti dat – odpovídá za kvalitu dat, kterou přímo ovlivňuje samotná hodnota výstupů vědeckého a akademického výzkumu; dokumentace v podobě metadat a dalších kontextuálních informací • Kategorie Datový repozitář – odpovídá za řádné uchování a dostupnost těchto dat v dlouhodobém měřítku (procesy a kvalita organizace; technická infrastruktura) • Kategorie Příjemci dat - řeší kvalitní využití dat cílovými skupinami v rámci stanoveného národního legislativního rámce a politiky přístupů
  7. 7. 2.5 WG Standardy a normy Standardy, audit a certifikace #3 • DIN 31644, nestor • pochází z německy mluvícího prostředí; rozsahem a účelem je možné jí zařadit na vyšší stupeň než DSA • DIN 31644 Information und Dokumentation – Kriterien für vertrauenswürdige digitale Langzeitarchive reprezentuje standardní rámec umožňující vyhodnocování důvěryhodnosti digitálního úložiště, z organizačního i technického hlediska • Norma vychází z katalogu Nestor – Network of Expertise in Long-Term Storage and Long-Term availability of Digital Resources in Germany • Hodnocení repozitářů je možné rozdělit do tří hlavních okruhů: • organizační rámec, správa objektů, infrastruktura a zabezpečení
  8. 8. 2.5 WG Standardy a normy Standardy, audit a certifikace #4 • ČSN ISO 16363 • Standard ČSN ISO 16363 (319621) – Audit a certifikace důvěryhodných digitálních úložišť - stanovuje doporučený postup pro posuzování důvěryhodnosti digitálních úložišť • Norma obsahuje celkem 108 kritérií (normativních metrik), rozdělených do tří základních kategorií: • A. organizační infrastruktura (Organizational Infrastructure) • B. správa digitálních objektů (Digital Object Management) • C. technologie, technická infrastruktura a bezpečnost (Technologies, Technical Infrastructure, & Security) • úložiště jako organizační celek se dotýká pracovníků na nejrůznějších úrovních • vedení a nižší management - část A.; systémoví administrátoři, síťoví správci a další techničtí pracovníci – část C; producenti a příjemci dat A a B.
  9. 9. 2.5 WG Standardy a normy Standardy, audit a certifikace #5 • proč? jednoznačnější (jednotná) úroveň pro důvěryhodná úložiště: • trvalá správa/ochrana digitálních objektů pro definovanou komunitu • organizační způsobilost a fiskální zodpovědnost • splnění smluvních a právních požadavků • získávání a zpracování dle stanovených pravidel • udržování dlouhodobé integrity, autenticity, použitelnosti objektů • archivace všech potřebných metadat • naplnit kritéria pro zpřístupňování • strategický plán pro dlouhodobou ochranu a odpovídající technická infrastruktura
  10. 10. 2.5 WG Standardy a normy Archivematica vs. OAIS • konformita se standardem publikována formou tabulkového přehledu • praktické zkušenosti - deklarovaná shoda s ISO 14721 (na webových stránkách projektu Archivematica) mnohdy neodpovídá realitě • příklady: administrativní metadata v METS • revize OAIS standardu (2017): • http://www.dpconline.org/newsroom/latest-news/1565-dpc-invites- members-to-review-oais • http://wiki.dpconline.org/index.php?title=OAIS_Community
  11. 11. 2.5 WG Standardy a normy Funkční entita Příjem • funkční prvek příjem vstupních dat: AV nabízí dodání SIPu offline, nebo on-line cestou; potvrzuje dodavateli převzetí/nepřevzetí balíčku (v GUI). • funkční prvek kontrola kvality: provádí kontrolu integrity SIP, případně generuje kontrolní součet, pokud není k SIP přiložen. Kontroluje na přítomnost malwaru, zabezpečuje jeho odstranění a kontroluje případné další nedostatky. • funkční prvek vytváření balíčku AIP: normalizuje/převádí formáty souborů při zachování těch původních. • funkční prvek vytváření popisných informací přidává informační obsah a PDI do AIP, dává informaci o uchování PDI do AIP, generuje popisné informace. • funkční prvek sladění aktualizací nese odpovědnost za přesun balíčků AIP do Archivního uložení. V první fázi žádá o přidělení místa na úložišti, pokud je požadavek schválený, přesune AIP do Archivního úložiště a úspěšné ne/přijetí i ne/uložení AIP oznámí.
  12. 12. 2.5 WG Standardy a normy
  13. 13. 2.5 WG Standardy a normy Funkční entita Archivní uložení • funkční prvek příjem dat • funkční entita Archivní uložení zašle požadavek na uložení AIP, vybere se vhodné zařízení či nosič a přesune AIP do Archival storage. Systém pošle potvrzení o uložení, případně akci zamítne. Zkontroluje integritu AIP, přidá informaci o umístění AIP na úložišti. Zkopíruje AIP na zálohovací média na fyzicky odděleném místě od originálních AIP. Informaci je poté součástí popisných informací, kdy prvek předá popisné informace do Data managementu a z Data managementu se vygeneruje příslušné potvrzení. • funkční prvek správy struktury úložiště – ano - připraví vhodný typ nebo jednotku datového úložiště a po úspěšném dokončení přenosu (příjem dat), zkontroluje integritu AIP. V případě poškození AIP, zasílá oznámení o této skutečnosti a AIP zamítne. Pokud je AIP v pořádku, nakopíruje ji do příslušný typ úložiště, opětovně zkontroluje integritu a odešle na zálohovací médium. Poté odešle oznámení o úspěšném uložení.
  14. 14. 2.5 WG Standardy a normy Funkční entita Archivní uložení #2 • funkční prvek nahrazení datových nosičů - tuto funkcionalitu AV nenabízí. • funkční prvek kontrola chyb - tento funkční prvek požaduje, aby veškerý HW a SW v archivu upozorňoval na případné chyby. AV má k dispozici kontrolu chyb všech kopií, není ale jasné v jaké frekvenci • funkční prvek poskytnutí dat - přijímá žádost o poskytnutí dat, zpracuje ji a pošle AIP funkčnímu celku zpřístupnění. • funkční prvek obnova po havárii - AV tento funkční prvek řeší tak, že přijímá žádost o zpřístupnění AIP. Kontroluje jejich integritu a použitelnost, vybírá nejvhodnější kopii, generuje AIP a přesouvá ji do správy uložení.
  15. 15. 2.5 WG Standardy a normy Funkční entita Správa dat • funkční prvek správa databáze - AV přijímá popisné informace, updatuje DB a potvrdí update a zálohuje příslušné updaty DB. • funkční prvek provádění dotazů - přijímá dotazy (z interních prvků systému nebo přímo od žadatele), zpracuje je a na výstupu nabízí výsledky dotazů nebo reporty. Následně žádosti a výsledky operace zapisuje do příslušných logů. • funkční prvek vytváření přehledů - tuto funkcionalitu AV nabízí (např. jako přehledy v základním GUI). • funkční prvek příjem aktualizací databáze - AV umožňuje aktualizace systému a aktualizace dat vztahující se k novým balíčkům AIP.
  16. 16. 2.5 WG Standardy a normy Funkční entita Správa • funkční prvek vyjednávání dohody o dodávání dat - tento funkční prvek AV s tvůrcem vyjednává dohodu o dodávání dat, včetně harmonogramu dodávání těchto dat. Dále zasílá šablony balíčků SIP a všechny přizpůsobené šablony balíčků AIP, aby mohly být následně využity funkčním celkem příjmu. Spravuje též kalendář očekávaných spojení pro dodávání dat, zasílá oznámení producentům. • funkční prvek správa nastavení systému - tento prvek se týká organizačně- systémového nastavení, nikoliv pouze AV jako systému. • funkční prvek aktualizace archivovaných informací - AV přijímá požadavky na změny a postupy a nástroje na provádění těchto změn. Provádí aktualizace, a to tím, že zasílá požadavky na DIPy, aktualizuje obsah výsledných balíčků DIP a opětovně je v podobě balíčků SIP dodává funkčnímu celku příjmu.
  17. 17. 2.5 WG Standardy a normy Funkční entita Správa #2 • funkční prvek řízení fyzického přístupu - tento prvek se týká organizačního zabezpečení, nikoliv AV jako systému. • funkční prvek stanovování standardů a pravidel - tento prvek se týká organizačního zabezpečení, nikoliv AV jako systému. • funkční prvek kontrola vstupních dat - tento prvek se týká organizačně-personálního zabezpečení, nikoliv AV jako systému. Srozumitelnost dat pro určenou komunitu provádí zaměstnanci repozitáře/archivu, AV “pouze” zodpovídá za kontrolu kvality SIP balíčků. • funkční prvek spouštění požadavků - udržuje záznamy o požadavcích založených na událostech, vytváří požadavek na šíření a vytváří objednávky, které jsou zaslány funkčnímu celku zpřístupnění. • funkční prvek služba zákazníkům - vytváří, udržuje a maže účty koncových uživatelů. Získávání fakturačních údajů, zasílání faktur a vybírání plateb není součástí AV.
  18. 18. 2.5 WG Standardy a normy Funkční entita Plánování uchovávání • funkční prvek sledování určené skupiny - tento prvek se týká organizačního zabezpečení repozitáře/archivu, nikoliv AV jako systému. • funkční prvek sledování technologií - AV pomocí mikroslužeb hlídá formáty, v ostatních záležitostech se tento prvek týká organizačního-technického zabezpečení repozitáře/archivu, nikoliv nutně AV jako systému. • funkční prvek tvorba strategií a standardů pro uchovávání - nese odpovědnost za tvorbu a doporučování strategií a standardů a za hodnocení rizik. V tomto kontextu AV podporuje strategii normalizaci formátů. Migrace není podporována. • funkční prvek tvorba šablon balíčků a plánů přesunů - AV neumí přesuny/převody AIP, i když podle deklarovaných plánů by to mělo být v dalších verzích. AIP umí exportovat do DIPu a ten pak přijmout jako SIP a tak provést potřebné změny. Kdy a co přesně se má provést, určuje archiv.
  19. 19. 2.5 WG Standardy a normy Funkční entita Zpřístupnění • funkční prvek sladění činností pro zpřístupnění AV splňuje. • funkční prvek vytváření balíčku DIP - AV tento funkční prvek v základu splňuje, ale tím, že je DIP vytvořen ve stejné chvíli jako AIP, tak není možné DIP upravit přidáním např. DRM, nebo odstraněním osobních údajů pro anonymizaci dat (jak se uvádí v OAIS str. 48). Nesplňuje “pouze” nepovinné části. • AV nemá propracované rozhraní pro dodávání balíčků koncovým uživatelům.
  20. 20. Andrea Miranda andrea.miranda@ruk.cuni.cz Děkuji za pozornost!

×