Marek Melichar
Brno, 6.3.2014
Setkání k projektu LTP pilot








Úvod - definice, cíle a terminologie „DP“
Kořeny „Digital preservation“ a první projekty
Standardy, komunita...






Funkční kontext (alternativy k tomu, jak DP
dělá Archivematica)
Časový kontext (Co předcházelo a kam to
směřuje)
...








Digital preservation
Long-term (digital) preservation
Long-term archiving
Long-term Preservation of Digital ...
Short Definition
Digital preservation combines policies, strategies and
actions that ensure access to digital content over...
Long Definition
Digital preservation combines policies, strategies and
actions to ensure the accurate rendering of authent...
Digital Preservation Refers to the series of
managed activities necessary to ensure
continued access to digital materials ...






Technologie: HW, SW,
sítě, technické
dovednosti
Organizace: Mandát,
strategie, plány
ochrany, sbírkové
plány, bez...
Digital curation involves maintaining, preserving and adding
value to digital research data throughout its lifecycle
DCC c...





HW – zastarávání
SW – zastarávání a s ním spojené zastarání
formátů
Běžné procesy





Rizika přenosu dat
Inte...


Pasivní DP
◦ Integrita souborů – uchování a dost
◦ zálohy
◦ Neřeší zpřístupnění v budoucnu



Aktivní DP
◦
◦
◦
◦
◦

Pa...
Technocentrický

Uchování
původního HW a SW
Obnova médií

Analytický
Digitální
archeologie
Digitální forenzní
věda

Inkrem...



HW muzeum bohužel nestačí
SW preservation:

◦ Když nelze oddělit SW od dat
◦ Pokud je SW výstupem výzkumné aktivity
◦...


Emulace
◦
◦
◦
◦
◦

Od začátku DP jedna z voleb
IBM koncept UVC
Projekt CAMiLEON
Rothenberg, Jeff 1995
EU Projekt KEEP h...








J.R. van der Hoeven – UVC
2009 – přednáška pro NDK v IBM.CZ
Souvisí s IBM Dias a výzkumem pro KB.NL
2005 – f...


Migrace
◦ Dominantní paradigma v oblasti systémů typu repozitář
◦ Migrace – OAIS zná víc typů: refreshment, replication...



Dnes především forenzní analýza
Mají obvykle jiné cíle než zachování dostupností dat

◦ Stejné nástroje a postupy pro...
H.M. Gladney
 2004 Řada článků a monografie
 Praktické aplikace?

SNIA a jejich „SIRF“ –
Self-contained Information
Ret...
Bit level preservation – ochrana
bitů
(zálohování, bitová replikace,
atd.)
- Pasivní ochrana (TNA supports digital preserv...


Více kopií, více technologií, replikace k
partnerům, udržování inventáře AIPů



Transfer dat do archivu jako kritické...
Situace v knihovnách (příklad – VISK):

Kopie AIP v NK
Kopie AIP lokálně (někdy, některé AIPy)
Rozpracované AIP (bez OCR, ...









OAIS: ISO 14721, Paimas: ISO 20652
Důvěryhodný dlouhodobý digitální repozitář
(ISO 16363)
ISO 27001, ISO 900...








Deskriptivní MD
(MODS, EAD, DC,
atd.)
Ochranná MD
(PREMIS)
Technická MD
(MIX, TextMD,
atd.)
Strukturální
(METS...
Informační model
• AIP, SIP, DIP
• Typy informací
Standardy pro balení:
METS,
MPEG-21 DIDL
XFDU
?
Ochranná md:
PREMIS
(XIP...


Funkční entity:
◦
◦
◦
◦
◦
◦
◦

Ingest
Archival storage
Data Management
Administration
Preservation Planning
Access
Comm...
Možnost rozložení odpovědnosti
◦ AIP může být pouze logický celek (jiné nakládání s
MD a soubory s obsahem)
◦ OAIS také mů...
Předmětem ochrany je:
 Informační obsah (data z měření, skenovaná data)
 Další informace nutná k porozumění, použití a
u...


Maximální přístup:

◦ http://www.jisc.ac.uk/uploaded_documents/oaismets.p
df
◦ TRAC, ISO 16363, NESTOR KK
◦ Převod OAIS...
3.1 Závazné povinnosti OAIS (podle překladu NK 2014)










Vyjednávat s producenty informací a přijímat od nich ...








Udržení dlouhodobé srozumitelnosti, použitelnosti
informace bude vyžadovat změny!
Informace musí zůstat srozum...
Mapování DP problematiky na risk management
přístupy
 Risk Management – Principles and GuideIines: ISO
31000
 Informatio...










POWRR (Preserving digital Object with Restricted Resources)
http://digitalpowrr.niu.edu/digital-preservati...










Ca. od roku 1960 data centra
Ca. od 1990 - digital preservation jako
reformátování do digitální podoby
199...
NDIIPP – 150 milionů USD (soukromé a veřejné finance)
 Loc.gov, NARA, NLM, NAL, RLG, CLIR a další nefederální
 2010 Nati...
NL Austrálie:




1996: Web PANDORA (Preserving and Accessing Networked
Documentary Resources of Australia)
1997: State...
Projekty finacované EU v posledních 15 letech
 http://www.erpanet.org
 http://www.delos.info
 Minerva (digitalizace)
 ...


Open source
◦
◦
◦
◦
◦
◦



Archivematica
RODA
Hoppla
Mopseus
DAITSS
….

Komerční
◦ Rosetta
◦ SDB
◦ …..




4C project http://www.4cproject.eu/
Life I-III
starší aktivity BL, Dánské NK, NA.NL
http://www.nationaalarchief.nl/...
Jak přesvědčit stakeholdery, že to má smysl?



Advokacie jako součást řízení DP projektů
Trvalá ochrana = trvalé financo...
Rozdílné chápání konceptu důvěryhodnosti
(Viz konference CNZ 2013 – střed dvou světů)

TRAC: “A trusted digital repository...
Tyllor and Cox v ČR
- Certifikace „SW“ podle ISO 16363:2012???
IBM Filenet, Datera…
◦ http://www.cnz.cz/ke-stazeni/2013/ko...






Základní certifikace (Basic certification) –
Data Seal of Approval (DSA).
Rozšířená certifikace (Extended
certifi...
Veřejně dostupná dokumentace k certifikace podle
TRAC
 HathiTrust
 Portico
 Chronopolis
 Scholars Portal
 CDA kultury...
Australský NA (Digital Preservation Software Platform)
http://www.aa.gov.au/collection/preserving/digitalrecords/index.asp...


DNB.de
◦
◦
◦
◦











velmi záhy DIAS, pak „přešlapuje“
NESTOR, řada EU projektů
Kolibri http://kopal.langze...
Open Planets Foundation
http://www.openplanetsfoundation.org/


Planets suite
◦ Preservation Planning Tool, Plato
(http:/...
SCAPE
◦ Repository API

 Report API
 Management API
 Data connector API (search,
access, modify files)
 Platform

◦ Pr...
SCAPE
http://wiki.opflabs.org/display/SP/Ho
me

RODA (2009-)
http://www.rodacommunity.org/
Keep-solutions.com
http://www.s...
SNIA

– SIRF: Selfcontained Information
Retention Format
◦Logical container of
„storage container“
◦Logical and physical
...


Archivace průmyslových informací
(Product and Manufacturing Information
(PMI) Working Group)
◦ http://www.lotar-interna...






iPres (2004-), Archiving, ANADP, PASIG
(http://www.preservationandarchivingsig.org)
APA, Personal digital archiv...


Formátové knihovny (PRONOM, UDFR, Loc.gov)
Seznamy nástrojů



Příklady policies atd.



◦ Library of Congress http:/...
„Digitální dokumenty je na rozdíl od mikrofilmu, mnohem
obtížnější uchovat ve zpřístupnitelné podobě v dlouhodobé časové
p...










DPE
LiWA
CASPAR (Langweilův model)
IIPC
SCAPE (VUT)
NDK
NDA
CDK
Nové role vědeckých knihoven
2011: REPORT ON INTEGRATION OF DATA AND PUBLICATIONS (KB.NL, BL, DNB,
LIBER, STM Publishers)
...









Availability
Findability
Interpretability
Re-usability
Citability
Curation
Preservation

ODE REPORT ON INT...






Small sciences vs Big sciences
Liší se v typech dat, způsobech zpracování
dat, rychlosti publikačního cyklu, rych...
Data z online vzdělávacích systémů – trendy:








3D Printing
MOOCs
Big Data
Digital Textbooks
Gamification
The ...


Galleries, Libraries, Archives, Muzeums
◦
◦
◦
◦

Větší integrace knihoven do heritages
Jednotné systémy pro správu meta...






Řeší tu jednodušší třetinu (technologie) –
nikoli organizaci a zdroje!
„Důvěryhodná“ ve smyslu ISO norem nemůže
b...




Nezapomenout na potřebu bit replikace
Význam projektu pro MUNI – další krok by
mělo být větší zapojení knihovny do a...
Nezapomenout na řízení a strategické
dokumenty - instituce, která není strategicky
řízená nemůže provozovat LTP systém
V n...
Děkuji
http://digital-preservation-cz.blogspot.cz/
LTP Pilot - Archivematica Projekt v CR
Upcoming SlideShare
Loading in …5
×

LTP Pilot - Archivematica Projekt v CR

1,176 views

Published on

Prezentace k projektu LTP Pilot, který má v ČR otestovat systém Archivematica. Projekt pořádá knihovna MUNI, MZK, a spolupracuje na něm i DU CESNET a možná i knihovna AV CR.

Cílem prezentace bylo podat přehledovou informaci o oblasti Digital preservation

Published in: Technology
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
1,176
On SlideShare
0
From Embeds
0
Number of Embeds
416
Actions
Shares
0
Downloads
5
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

LTP Pilot - Archivematica Projekt v CR

  1. 1. Marek Melichar Brno, 6.3.2014 Setkání k projektu LTP pilot
  2. 2.       Úvod - definice, cíle a terminologie „DP“ Kořeny „Digital preservation“ a první projekty Standardy, komunita, periodika, akce Současné možnosti, projekty, technologie Co si z toho vybrat? - Pragmatický přístup Důraz pro projekt LTP Pilot
  3. 3.    Funkční kontext (alternativy k tomu, jak DP dělá Archivematica) Časový kontext (Co předcházelo a kam to směřuje) Projekt LTP pilot v kontextu aktivit v ČR
  4. 4.       Digital preservation Long-term (digital) preservation Long-term archiving Long-term Preservation of Digital Information V češtině dlouhodobá ochrana, archivace, uchovávání, ukládání, preservace Terminologii by měl zavést český překlad norem OAIS (ISO 14721:2012) a ISO 16363:2012
  5. 5. Short Definition Digital preservation combines policies, strategies and actions that ensure access to digital content over time.  Medium Definition Digital preservation combines policies, strategies and actions to ensure access to reformatted and born digital content regardless of the challenges of media failure and technological change. The goal of digital preservation is the accurate rendering of authenticated content over time.  http://www.ala.org/alcts/resources/preserv/defdigpres0408
  6. 6. Long Definition Digital preservation combines policies, strategies and actions to ensure the accurate rendering of authenticated content over time, regardless of the challenges of media failure and technological change. Digital preservation applies to both born digital and reformatted content.  Digital preservation policies document an organization’s commitment to preserve digital content for future use; specify file formats to be preserved and the level of preservation to be provided; and ensure compliance with standards and best practices for responsible stewardship of digital information. Digital preservation strategies and actions address content creation, integrity and maintenance.
  7. 7. Digital Preservation Refers to the series of managed activities necessary to ensure continued access to digital materials for as long as necessary http://www.dpconline.org/advice/preservationhandbook/introd uction/definitions-and-concepts
  8. 8.    Technologie: HW, SW, sítě, technické dovednosti Organizace: Mandát, strategie, plány ochrany, sbírkové plány, bezpečnost Zdroje: Zaměstnanci a jejich kvalifikace, prostor, financování
  9. 9. Digital curation involves maintaining, preserving and adding value to digital research data throughout its lifecycle DCC curation model a další modely, mapování na konkrétní infrastrukturu            Conceptualize Create Access and Use Appraise and Select Destroy Ingest Preservation Action Reappraise Store Access and Reuse Transform
  10. 10.    HW – zastarávání SW – zastarávání a s ním spojené zastarání formátů Běžné procesy     Rizika přenosu dat Integrita dat Autenticita obsahu Mis-management, chyba
  11. 11.  Pasivní DP ◦ Integrita souborů – uchování a dost ◦ zálohy ◦ Neřeší zpřístupnění v budoucnu  Aktivní DP ◦ ◦ ◦ ◦ ◦ Pasivní je jejím předpokladem Identifikace formátů Validace formátů Extrakce metadat Identifikace rizik etc.
  12. 12. Technocentrický Uchování původního HW a SW Obnova médií Analytický Digitální archeologie Digitální forenzní věda Inkrementální Migrace (souborů, metadat, dat, kontextu) Emulace (SW, platformy) Trvalé digitální objekty
  13. 13.   HW muzeum bohužel nestačí SW preservation: ◦ Když nelze oddělit SW od dat ◦ Pokud je SW výstupem výzkumné aktivity ◦ Pokud má SW historickou hodnotu ◦ Viz současný projekt Preserving.exe http://www.fit.vutbr.cz/FIT/museum/
  14. 14.  Emulace ◦ ◦ ◦ ◦ ◦ Od začátku DP jedna z voleb IBM koncept UVC Projekt CAMiLEON Rothenberg, Jeff 1995 EU Projekt KEEP http://www.keep-project.eu/      Motivovalo Berlínské muzeum počítačových her 4 miliony euro, konec v roce 2012 Problémy s licencemi a ovladači, větší problémy právní Obtížné bez zapojení firem a uvolnění licencí starého SW Emulation framework: http://emuframework.sourceforge.net/ Avoiding Technological Quicksand: Finding a Viable Technical Foundation for Digital Preservation , Rothenberg, Jeff ISBN 1-887334-63-7, 1999
  15. 15.       J.R. van der Hoeven – UVC 2009 – přednáška pro NDK v IBM.CZ Souvisí s IBM Dias a výzkumem pro KB.NL 2005 – funkční prototyp UVC pro still images Koncept popsán na http://citeseerx.ist.psu.edu/viewdoc/downlo ad?doi=10.1.1.179.494&rep=rep1&type=pdf DIAS? – KB.NL má novou verzi svého edepotu. DNB.de údajně dále DIAS používá (v kombinaci s dalšími moduly, které si sama vyvinula) – ovšem jako „věčný“ pilot
  16. 16.  Migrace ◦ Dominantní paradigma v oblasti systémů typu repozitář ◦ Migrace – OAIS zná víc typů: refreshment, replication vs repackaging, transformation ◦ Nejčastěji se mluví o migraci formátů a migraci z HW na HW Všechny současné LTP systémy jsou zaměřeny na migraci jako metodu ochrany. Digital Migration is defined to be the transfer of digital information, while intending to preserve it, within the OAIS. OAIS ISO 14721:2012 str. 5-2
  17. 17.   Dnes především forenzní analýza Mají obvykle jiné cíle než zachování dostupností dat ◦ Stejné nástroje a postupy pro analýzu digitálních formátů (NZME, Jhove, Unix File, file signatures) jako DP ◦ Užitečné nástroje pro zpracování velkých transferů celých disků, sítí – bitcurator etc. ◦ Nástroje pro analýzu provenience, autenticity, odhalování metadat, verzí souborů, dočasných a smazaných souborů, skrytých souborů, detekci obfuskace apod. ◦ Nástroje pro analýzu a zpracování e-mailů, analýzu chování na webu a historie http://www.forensicswiki.org/wiki/Main_Page Directory Snoop: http://www.briggsoft.com/dsnoop.htm Foremost http://foremost.sourceforge.net/ Web Historian apod.
  18. 18. H.M. Gladney  2004 Řada článků a monografie  Praktické aplikace? SNIA a jejich „SIRF“ – Self-contained Information Retention Format 
  19. 19. Bit level preservation – ochrana bitů (zálohování, bitová replikace, atd.) - Pasivní ochrana (TNA supports digital preservation but does not engage with the digital records directly) Information preservation – ochrana informačního obsahu (OAIS) - Aktivní ochrana (TNA - Active preservation is any proactive action taken in the preservation of digital records) Procesy Software Context (PDI) Obsah Soubory Datasety
  20. 20.  Více kopií, více technologií, replikace k partnerům, udržování inventáře AIPů  Transfer dat do archivu jako kritické místo Komprese, kryptování, zálohování, fixity Převádění dat z lokace na lokaci  Projekty z poslední doby:     http://www.bitcurator.net/ BagIt, Bagger – právě pro transfer do loc.gov (využívá Archivematica)
  21. 21. Situace v knihovnách (příklad – VISK): Kopie AIP v NK Kopie AIP lokálně (někdy, některé AIPy) Rozpracované AIP (bez OCR, neúplné tituly apod.) Kopie u externího dodavatele digitalizace (neoficiálně, časově omezené ◦ Kopie na off-line nosičích (CD, DVD, UDO, Disky) ◦ AIPy jsou „zmrazené“ – nejsou updatovány, vytvoření a dost ◦ ◦ ◦ ◦ Neexistuje inventář všech instancí AIPů Neexistuje poskytovatel „třetí lokace“ Řešení: Replikace/zálohování do DÚ CESNETU • Nějaká obecná dohoda mezi UKR a CESNETEM? • Manuál pro knihovny?? • Co data pro zpřístupnění????
  22. 22.      OAIS: ISO 14721, Paimas: ISO 20652 Důvěryhodný dlouhodobý digitální repozitář (ISO 16363) ISO 27001, ISO 9001 Problém vyhovění OAIS (co je a co není compliant?) > selfaudit a certifikace DRAMBORA, DSA, TRAC, ISO 16363
  23. 23.     Deskriptivní MD (MODS, EAD, DC, atd.) Ochranná MD (PREMIS) Technická MD (MIX, TextMD, atd.) Strukturální (METS)
  24. 24. Informační model • AIP, SIP, DIP • Typy informací Standardy pro balení: METS, MPEG-21 DIDL XFDU ? Ochranná md: PREMIS (XIP, DNX,…)
  25. 25.  Funkční entity: ◦ ◦ ◦ ◦ ◦ ◦ ◦ Ingest Archival storage Data Management Administration Preservation Planning Access Common Services
  26. 26. Možnost rozložení odpovědnosti ◦ AIP může být pouze logický celek (jiné nakládání s MD a soubory s obsahem) ◦ OAIS také může být pouze logický celek (oddělení funkčního modulu) ◦ Outsoursování „archival storage“ funkcí, hostování celého systému – při auditu je ale třeba mít dost dokumentace od všech zúčastněných organizací a o všech systémech ◦ Část informací vyžadovaných OAIS nemusí být v archivu přímo, stačí na ně odkazovat do jiného systému (deskriptivní MD)
  27. 27. Předmětem ochrany je:  Informační obsah (data z měření, skenovaná data)  Další informace nutná k porozumění, použití a uchování informačního obsahu ◦ Informace o způsobu vytvoření ◦ Informace o nastavení zařízení, osobách, předlohách, ◦ Informace o zpracování dat (kódování, komprese, způsob zpracování vědeckých dat, filtrování, převážení atd.) ◦ kompletní informace o procesu, ve kterém data vznikla ◦ Informace o procesech a sw ◦ Interpretace, OCR, překlad…. Rozsah dalších informací, které je nutné uchovat, závisí na znalostech/možnostech uživatelů a jejich technických možnostech – a v čase se mění…
  28. 28.  Maximální přístup: ◦ http://www.jisc.ac.uk/uploaded_documents/oaismets.p df ◦ TRAC, ISO 16363, NESTOR KK ◦ Převod OAIS na funkční požadavky ◦ Jak informační model tak funkce ◦ Snaha o maximální automatizaci procesů správy dat ◦ Reorganizace procesů instituce  Minimální přístup ◦ Naplnit 6 OAIS „mandatory requirements“ ◦ Informační model a funkce v podstatě formálně ◦ Omezené možnosti automatizace procesů správy dat
  29. 29. 3.1 Závazné povinnosti OAIS (podle překladu NK 2014)       Vyjednávat s producenty informací a přijímat od nich příslušné informace. Získat dostatečná práva k nakládání s poskytnutými informacemi tak, aby bylo možné zajistit dlouhodobé uchování. Určovat (ať již samostatně nebo ve spolupráci s ostatními stranami), které komunity by se měly stát cílovými komunitami, a tudíž by měly být schopny porozumět poskytovaným informacím. Tím je definována znalostní základna dané komunity, Zajišťovat, aby informace určené k uchovávání byly pro cílovou komunitu nezávisle srozumitelné. Cílová komunita by měla být schopna informacím porozumět bez potřeby využití speciálních zdrojů , například bez rady expertů, kteří informace vytvořili. Dodržovat dokumentovaná pravidla a postupy, které zajistí, že informace budou chráněny před všemi reálně myslitelnými nepředvídatelnými událostmi (včetně zániku archivu), a zajistit, že informace nebudou nikdy smazány (s výjimkou případu, kdy jejich smazání bude součástí schválené strategie). Nemělo by docházet k žádnému jednorázovému smazávání dat. Zpřístupňovat uchovávané informace cílové komunitě a umožnit distribuci informací v podobě kopií původních dodaných datových objektů s dokumentací podporující jejich autenticitu nebo v takové podobě, aby bylo možné zjistit, ke kterým původním dodaným datovým objektům se vztahují.
  30. 30.     Udržení dlouhodobé srozumitelnosti, použitelnosti informace bude vyžadovat změny! Informace musí zůstat srozumitelná, autentická a musí mít prokazatelný původ tj. Cílem je ochrana informace, nikoli konkrétního bitstreamu Interní datový model a způsob fungování archivu musí umožnit záznam změn dat i metadat
  31. 31. Mapování DP problematiky na risk management přístupy  Risk Management – Principles and GuideIines: ISO 31000  Information Assurance Maturity Model IAMM Identifikace oblastí, typů rizik, dopadů rizik,… Nástroje:  DRAMBORA (The Digital Repository Audit Method Based On Risk Assessment)  TIMBUS project: ERM (Enterprise Risk Management) nástroje rozšířeny do oblasti DP  TRAC
  32. 32.       POWRR (Preserving digital Object with Restricted Resources) http://digitalpowrr.niu.edu/digital-preservation-101/ Digital Preservation Handbook http://www.dpconline.org/advice/preservationhandbook Digital preservation management tutorial http://www.dpworkshop.org/dpm-eng/eng_index.html ROSENTHAL, Colin a kol. Průvodce plánem důvěryhodného digitálního repozitáře (PLATTER). 1. vyd. Praha: Národní knihovna České republiky, 2009. 51 s. ISBN 978-80-7050-569-4. Online zde: http://www.ndk.cz/platter-cz CUBR, Ladislav. Dlouhodobá ochrana digitálních dokumentů. 1. vyd. Praha : Národní knihovna České republiky, 2010. 154 s. ISBN 978-807050-588-5. BROWN, Adrian. Strategie digitálního archivování. Praha : Odbor archivní správy MV ČR v Tiskárně Ministerstva vnitra, 2003. 64 s. ; 24 cm. (Překlad a předmluva Wanner, Macek)
  33. 33.       Ca. od roku 1960 data centra Ca. od 1990 - digital preservation jako reformátování do digitální podoby 1994-1996: CPA/RLG Task Force on Archiving of Digital Information 2000 – NDIIPP (National Digital Information Infrastructure and Preservation Program) 1995 – první verze OAIS 2002 – ISO 14721:2003
  34. 34. NDIIPP – 150 milionů USD (soukromé a veřejné finance)  Loc.gov, NARA, NLM, NAL, RLG, CLIR a další nefederální  2010 National Digital Stewardship Alliance (NDSA) – další růst komunity  300 projektů, NDIIPP spolufinancoval vývoj desítek konkrétní nástrojů  Nastartoval DP aktivity v archivech, muzeích, státní správě po celých Spojených státech  Podrobný přehled činnosti (do roku 2012) http://www.digitalpreservation.gov/multimedia/documents/ndiipp-statesreport032612_final.pdf RLG 1998: Digital Preservation Needs and Requirements in RLG MemberInstitutions: http://www.webjunction.org/content/dam/research/activities/digpresneed s/digpres.pdf IMAP 2001: http://www.imappreserve.org/
  35. 35. NL Austrálie:    1996: Web PANDORA (Preserving and Accessing Networked Documentary Resources of Australia) 1997: Statement of Principles for the Preservation of and Long-Term Access to Australian Digital Objects 1998: Preserving Access to Digital Information (PADI) Další projekty do roku 2000:  TNA UK (1998 – Preservation policy)  BL – 1998 - Výzkumný projekt na téma náklady na DP (http://www.ukoln.ac.uk/services/elib/papers/tavistock/hen dley/hendley.html)  http://www.interpares.org/ (archivy)  NESTOR  E-depot KB NL – OAIS LTP DIAS od 2003 (vývoj od 1999)  UNESCO 2003 Charter on the Preservation of Digital Heritage Hedstrom, Margaret; (1997). "Digital Preservation: A Time Bomb for Digital Libraries." Computers and the Humanities 31 (3): 189-202. <http://hdl.handle.net/2027.42/42573>
  36. 36. Projekty finacované EU v posledních 15 letech  http://www.erpanet.org  http://www.delos.info  Minerva (digitalizace)  CASPAR, PLANETS, WEPRESERVE, DPE  WF4Ever, TIMBUS, SHAMAN, SCAPE, PROTAGE, PrestoPRIME, KEEP, LiWA, ENSURE, BlogForever, ARCOMEN, APARSEN etc etc  Role DPE v ČR byla velmi významná
  37. 37.  Open source ◦ ◦ ◦ ◦ ◦ ◦  Archivematica RODA Hoppla Mopseus DAITSS …. Komerční ◦ Rosetta ◦ SDB ◦ …..
  38. 38.    4C project http://www.4cproject.eu/ Life I-III starší aktivity BL, Dánské NK, NA.NL http://www.nationaalarchief.nl/sites/default/ files/docs/kennisbank/codpv1.pdf
  39. 39. Jak přesvědčit stakeholdery, že to má smysl?  Advokacie jako součást řízení DP projektů Trvalá ochrana = trvalé financování  Paradoxy financování LTP projektů:  ◦ ◦ ◦ ◦ Velké finance na krátkou dobu Problematická udržitelnost infrastruktury Příklad cda.kultury.sk Nepochopení nutnosti ochrany na manažerské úrovni
  40. 40. Rozdílné chápání konceptu důvěryhodnosti (Viz konference CNZ 2013 – střed dvou světů) TRAC: “A trusted digital repository is one whose mission is to provide reliable, long-term access to managed digital resources to its designated community, now and in the future“ vs „bezpečný identifikátor“, časová razítka, elektronické podpisy a certifikáty, SSL  K prokázání autenticity nejsou v paměťových institucích nutné elekt. podpisy, postačí i metadata (eventy)
  41. 41. Tyllor and Cox v ČR - Certifikace „SW“ podle ISO 16363:2012??? IBM Filenet, Datera… ◦ http://www.cnz.cz/ke-stazeni/2013/konference2013/CNZ%202013-IBM%20prezentace.pdf EasyPLM – TD-IS s.r.o. ◦ http://www.td-is.cz/doc/certification/tdis_certificate_iso16363-12.pdf ISO 16363:2012: „An archive that conforms to this Recommended Practice shall have satisfied the auditor on each of the requirements.“
  42. 42.    Základní certifikace (Basic certification) – Data Seal of Approval (DSA). Rozšířená certifikace (Extended certification) - Základní certifikace + , externě posouzený a strukturovaný veřejně dostupný selfaudit podle ISO 16363 nebo DIN 31644. Formální certifikace (Formal certification) –plně externí, nezávislý audit a certifikaci dle ISO 16363 nebo DIN 31644.
  43. 43. Veřejně dostupná dokumentace k certifikace podle TRAC  HathiTrust  Portico  Chronopolis  Scholars Portal  CDA kultury DSA: 23 institucí http://datasealofapproval.org/en/assessment/ Nestror seal http://files.dnb.de/nestor/materialien/nestor_mat_17_eng.pdf
  44. 44. Australský NA (Digital Preservation Software Platform) http://www.aa.gov.au/collection/preserving/digitalrecords/index.aspx Manifest Maker  supports the transfer of digital records from agencies to the National Archives. It produces a list of all digital records being transferred, their checksum, and the relationship between the digital records and their related item numbers in RecordSearch, our archive management system Xena  (XML Electronic Normalising for Archives) – determines the file format of a digital record and converts it to an appropriate preservation file format based on open standards. Xena can also be used to view and/or export Xena files Digital Preservation Recorder  (DPR) – manages the digital preservation workflow, recording audit information about each transfer in to the digital archive. DPR uses Xena to perform digital record conversions Checksum Checker  monitors the contents of the National Archives' digital archive for data loss or corruption.
  45. 45.  DNB.de ◦ ◦ ◦ ◦        velmi záhy DIAS, pak „přešlapuje“ NESTOR, řada EU projektů Kolibri http://kopal.langzeitarchivierung.de/index_koLibRI DP4LIB http://dp4lib.langzeitarchivierung.de/ KB NL – Dias 2003, nový LTP 2012 – centrum výzkumu BL ◦ Aktivní v řadě EU projektů (SCAPE, APARSEN, SPRUCE, LIFE, PLANETS, preserv.) ◦ Národní britské aktivity (DCC, DPC, v rámci JISC) NL NZ – Rosetta (Kronos) – 2008 1. verze Norská NK (masová digitalizace) Dánská NK (archivace broadcastingu atd.) BNF.fr (SPAR – Fedora Commons + iRods + Athos Origin) Německé knihovny (SLUB, TIB, ETH, BSB) Rosetta
  46. 46. Open Planets Foundation http://www.openplanetsfoundation.org/  Planets suite ◦ Preservation Planning Tool, Plato (http://www.ifs.tuwien.ac.at/dp/plato/intro.html ) ◦ Planets Testbed ◦ Interoperability Framework
  47. 47. SCAPE ◦ Repository API  Report API  Management API  Data connector API (search, access, modify files)  Platform ◦ Preservation WATCH  Scout ◦ PLATO – preservation planning  Definovat požadavky, zhodnotit alternativy a výsledky, definovat preservation plan
  48. 48. SCAPE http://wiki.opflabs.org/display/SP/Ho me RODA (2009-) http://www.rodacommunity.org/ Keep-solutions.com http://www.sbaresearch.org/ Z líhně TU Wien
  49. 49. SNIA – SIRF: Selfcontained Information Retention Format ◦Logical container of „storage container“ ◦Logical and physical storage considered as a unit CDMI – ◦ standard interoperabílniho formátu pro přesun dat a metadat mezi poskytovateli cloudu SIRF obsahuje: •Magic object – identifikace a verzovani •Preservation objects (to co se nemění a je předmětem ochrany) •Catalog (průběžně se upravují, obsahuje metadata, která mají zajistit budoucí přenositelnost preservation objects bez potřeby vnějších funkcí)
  50. 50.  Archivace průmyslových informací (Product and Manufacturing Information (PMI) Working Group) ◦ http://www.lotar-international.org/ ◦ ISO 10303 (automotive, 3d modeling, CAD)  Archivace DICOM/PACs z oblasti medical imagining  Právní data, geologická data, nuclear waste
  51. 51.     iPres (2004-), Archiving, ANADP, PASIG (http://www.preservationandarchivingsig.org) APA, Personal digital archiving, akce IIPC Časopisy (IJDC, d-lib, Code4lib, Ariadne…) Školení ◦ http://www.dptp.org/ ◦ TIMBUS Digital Preservation Advanced Practitioner Training
  52. 52.  Formátové knihovny (PRONOM, UDFR, Loc.gov) Seznamy nástrojů  Příklady policies atd.  ◦ Library of Congress http://www.loc.gov/standards/mets/metstools.html http://www.loc.gov/standards/premis/tools.html Orbeon: http://www.orbeon.com/ OPF Knowledge Base:http://wiki.opf-labs.org/display/KB/Home OPF Tools registry: http://wiki.opflabs.org/display/TR/Digital+Preservation+Tool+Registry Presto Prime, Tools: https://prestocentre.org/library/tools Library of Congress Tool Registry: http://www.digitalpreservation.gov/tools/ FileFormat.Info Registry: http://www.fileformat.info/index.htm COPTR: http://coptr.digipres.org/Main_Page DCH-RP project registry (planned) - see report pages 3042 http://www.dch-rp.eu/getFile.php?id=166
  53. 53. „Digitální dokumenty je na rozdíl od mikrofilmu, mnohem obtížnější uchovat ve zpřístupnitelné podobě v dlouhodobé časové perspektivě, což je dáno vývojem v oblasti výpočetní techniky a … inovačními cykly přinášejícími zásadní změny v technické podpoře platforem, formátů…“ POLIŠENSKÝ, Jiří. 2002. Konsorcium pro zpřístupňování a archivaci dokumentů pro výzkum a vývoj v České republice. In: CASLIN 2002. Ochrana a sprístupňovanie dokumentov: nové trendy: Zborník z konferencie, konanej 23.- 27. júna 2000 v Pribyline. Martin: Slovenská národná knižnica, 2002, s. 57-63. VISK – Mikrofilmování do roku 2012 - Data archivuje NK – do roku 2012 Jan Hutař, Marek Melichar: České paměřové instituce a digitální data - historický exkurz, současný stav a předpokládaný vývoj
  54. 54.         DPE LiWA CASPAR (Langweilův model) IIPC SCAPE (VUT) NDK NDA CDK
  55. 55. Nové role vědeckých knihoven 2011: REPORT ON INTEGRATION OF DATA AND PUBLICATIONS (KB.NL, BL, DNB, LIBER, STM Publishers) http://www.alliancepermanentaccess.org/wpcontent/uploads/downloads/2011/11/ODEReportOnIntegrationOfDataAndPublications-1_1.pdf  2013: LERU Roadmap for science data http://www.leru.org/files/publications/AP14_LERU_Roadmap_for_Research_data_fina l.pdf  Horizon 2020 – větší zapojení vědeckých knihoven do výzkumné infrastruktury, posílení dostupnosti dat paměťových institucí http://ec.europa.eu/research/horizon2020/pdf/proposals/com%282011%29_811_fi nal.pdf http://ec.europa.eu/dgs/connect/en/content/mission-and-priorities http://ec.europa.eu/dgs/connect/en/content/online-accessibility-and-digitalpreservation-europes-cultural-heritage 
  56. 56.        Availability Findability Interpretability Re-usability Citability Curation Preservation ODE REPORT ON INTEGRATION OF DATA AND PUBLICATIONS http://www.alliancepermanentaccess.org/wp-content/uploads/downloads/2011/11/ODEReportOnIntegrationOfDataAndPublications-1_1.pdf
  57. 57.    Small sciences vs Big sciences Liší se v typech dat, způsobech zpracování dat, rychlosti publikačního cyklu, rychlosti citování atd. Big sciences – APARSEN, společně s EUDAT, SCIDIP-ES, DPHEP
  58. 58. Data z online vzdělávacích systémů – trendy:        3D Printing MOOCs Big Data Digital Textbooks Gamification The Flipped Classroom Mobile Learning ◦ Co z toho archivovat?
  59. 59.  Galleries, Libraries, Archives, Muzeums ◦ ◦ ◦ ◦ Větší integrace knihoven do heritages Jednotné systémy pro správu metadat a autorit Co všechno ještě bude v knihovním katalogu? Co všechno bude muset ještě knihovna archivovat? Příklad využítí Archivematiky v muzeu v Berlíně: urn:nbn:de:0297-zib-43020
  60. 60.    Řeší tu jednodušší třetinu (technologie) – nikoli organizaci a zdroje! „Důvěryhodná“ ve smyslu ISO norem nemůže být žádná demo instalace – důvěryhodnost se posuzuje v kontextu konkrétní organizace Normy připouští outrsourcování části činnosti jiné organizaci (CESNET jako poskytovatel OAIS funkcí „archival storage“ musí poskytnout dokumentaci)
  61. 61.   Nezapomenout na potřebu bit replikace Význam projektu pro MUNI – další krok by mělo být větší zapojení knihovny do archivace vědeckých dat (využít eu programů?)
  62. 62. Nezapomenout na řízení a strategické dokumenty - instituce, která není strategicky řízená nemůže provozovat LTP systém V našich podmínkách se obvykle velmi podceňuje plánování - Instituce nemají: - - Mission statement Plány rozvoje Plány financování Plán řízení lidských zdrojů Ani collection plan apod.
  63. 63. Děkuji http://digital-preservation-cz.blogspot.cz/

×