SlideShare a Scribd company logo
1 of 21
Digitální kurátorství: Jak uchovávat digitální data paměťových institucí pro budoucí generace
1
Cvičení
Michal Konečný
Digitální kurátorství: Jak uchovávat digitální data paměťových institucí pro budoucí generace
2
Co, jak a proč?
Pro dnešní cvičení je pro vás připravené digitální „pískoviště“
̶ SSH je způsob, jak se na dálku připojit k jinému počítači a spouštět na něm programy
̶ po připojení se zobrazí tzv. terminál, který umožní zadávat příkazy pomocí klávesnice a
zobrazovat jejich textový výstup
̶ nejčastěji se připojujeme k počítačům s operačním systémem využívajícím linuxové jádro
(Ubuntu, Debian, CentOS, Arch Linux…)
̶ linuxové operační systémy jsou si vzájemně velice podobné, z velké části kompatibilní, ale
ne vždy zcela totožné
̶ jsou velmi často využívány jako servery pro systémy pro dlouhodobou ochranu dat
Digitální kurátorství: Jak uchovávat digitální data paměťových institucí pro budoucí generace
3
Připojení
̶ Adresa: iskb49.digitalnikurator.cz
̶ Username: kurator
̶ Password: kurator
̶ Port: 4022
̶ Web: https://iskb49.digitalnikurator.cz
Digitální kurátorství: Jak uchovávat digitální data paměťových institucí pro budoucí generace
4
Nastavení PuTTY
Digitální kurátorství: Jak uchovávat digitální data paměťových institucí pro budoucí generace
5
SSH klient
Digitální kurátorství: Jak uchovávat digitální data paměťových institucí pro budoucí generace
6
Příkazová řádka
Textové rozhraní linuxových systémů se nazývá shell (v našem případě se jedná o variantu bash)
Základní příkazy umožňující práci se soubory a výstupy programů:
̶ ls vypíše obsah adresáře
̶ cd změní aktuální adresář: cd sandbox nebo cd .. pro skok o úroveň "výše"
̶ tabelátor pomáhá při doplňování názvů adresářů a souborů, stačí napsat pouze první písmeno a stisknout
TAB
̶ mkdir [název adresáře] vytvoří nový adresář: mkdir output
̶ cp [pův. soubor] [nový soubor] vytvoří kopii souboru
Tip: stiskem tabulátoru můžete doplňovat názvy souborů a adresářů
̶ echo "Hello world!" vypíše na obrazovku… Hello world!
̶ echo "Hello world!" > hello.txt vytvoří soubor hello.txt a zapíše do něj
̶ cat hello.txt vypíše na obrazovku obsah souboru hello.txt
̶ man [název příkazu] zobrazí manuál k příkazu nebo programu: man unoconv
Digitální kurátorství: Jak uchovávat digitální data paměťových institucí pro budoucí generace
7
POWRR TOOL GRID
̶ https://www.digipres.org/tools/
̶ Matice pro snadnější orientaci v nabídce nástrojů
̶ Založena na Community Owned digital Preservation Tool Registry (COPTR)
̶ Aktuálně obsahuje 481 nástrojů
̶ Ne vždy aktuální (FIDO…)
̶ Nástroje jsou rozděleny podle
̶ Typu digitálního objektu (audio, text, obrázek…)
̶ Fáze kurátorského cyklu (access, preservation, ingest…)
Digitální kurátorství: Jak uchovávat digitální data paměťových institucí pro budoucí generace
8
Identifikace formátů
̶ Identifikace podle přípony není spolehlivá
̶ Pro identifikaci se využívají signatures z formátových databází (PRONOM)
̶ DROID – ne vždy spolehlivý, někdy identifikuje pouze podle přípon
̶ FIDO – ne vždy přesný, ale rychlý
̶ Nanite – dokáže i extrahovat metadata, zvládá velké množství dat
̶ Siegfried – umožňuje editovat signatures a využívat jich více naráz
Digitální kurátorství: Jak uchovávat digitální data paměťových institucí pro budoucí generace
9
Identifikace formátů: FILE
̶ Nejjednodušší nástroj, dostupný v každém linuxovém systému
̶ Nespolehlivý
Nápověda
file -h
Identifikace souboru
file [soubor]
Identifikace souborů v adresáři "soubory"
file soubory/*
Digitální kurátorství: Jak uchovávat digitální data paměťových institucí pro budoucí generace
10
Identifikace formátů: DROID
̶ Vyžaduje Java Runtime Environment
̶ Grafické uživatelské rozhraní i příkazová řádka
Nápověda
droid -h
Vytvoření profilu s obsahem adresáře "soubory"
droid –a soubory -p profile.droid
Identifikace souborů v profilu a uložení výstupu do souboru "droid.txt"
droid -p profile.droid -e droid.txt
Digitální kurátorství: Jak uchovávat digitální data paměťových institucí pro budoucí generace
11
Identifikace formátů: FIDO
̶ Vyžaduje v počítači podporu jazyka Python
̶ Pouze příkazová řádka
Nápověda
fido –h
Identifikace souborů v adresáři "soubory" a vypsání na obrazovku
fido soubory
Identifikace souborů a uložení výstupu do souboru "fido.txt"
fido soubory > fido.txt
Digitální kurátorství: Jak uchovávat digitální data paměťových institucí pro budoucí generace
12
Identifikace formátů: SIEGFRIED
̶ Snadná instalace
̶ Pouze příkazová řádka
̶ Podporuje export ve formátu DROID
Nápověda
sf -h
Identifikace souborů v adresáři a vypsání na obrazovku
sf soubory
Identifikace souborů a uložení do souboru ve formátu droid včetně otisků
sf -hash md5 soubory > sf.txt
Digitální kurátorství: Jak uchovávat digitální data paměťových institucí pro budoucí generace
13
Validace formátů a extrakce metadat
̶ Podrobnější zpracování formátů, často je nutné využít více nástrojů naráz
̶ JHOVE/JHOVE2 – velmi využívaný, ale nepodporuje „kancelářské“ formáty
̶ NZME – vyvíjen Národní knihovnou NZ od roku 2003, často se kombinuje s JHOVE
̶ Nástroje jsou často omezené jen na určité množství formátů
̶ Dva přístupy, které to řeší:
1. Formátově specifické nástroje (pouze pro PDF/A, JPEG2000, video - Jpylyzer, ExifTool, Ffprobe)
2. Využití více omezených nástrojů v jednom „balíčku“ - FITS
Digitální kurátorství: Jak uchovávat digitální data paměťových institucí pro budoucí generace
14
Identifikace/validace formátů: JHOVE
̶ https://jhove.openpreservation.org/getting-started/
̶ Vyžaduje Java Runtime Environment
̶ Grafické uživatelské rozhraní i příkazová řádka
Nápověda
jhove -h
Identifikace souborů a vypsání na obrazovku
jhove soubory
Identifikace souborů a uložení do souboru ve formátu XML
jhove -h xml -o jhove.xml soubory
Digitální kurátorství: Jak uchovávat digitální data paměťových institucí pro budoucí generace
15
Komplexní identifikace/validace: FITS
̶ Pouze příkazová řádka
̶ Kombinuje řadu jednoúčelových nástrojů
̶ Výstup ve formátu XML
Nápověda
fits -h
Identifikace jednoho soubor a vypsání na obrazovku
fits –i [název souboru]
Identifikace souborů v adresáři "soubory" a uložení výsledků do adresáře "fits"
mkdir fits
fits –i soubory –o fits
Digitální kurátorství: Jak uchovávat digitální data paměťových institucí pro budoucí generace
16
Identifikace formátů: MEDIAINFO
̶ Snadná instalace
̶ Pouze příkazová řádka
̶ Určen pro multimediální soubory
Nápověda
mediainfo -h
Identifikace všech souborů v adresáři a vypsání na obrazovku
mediainfo soubory
Identifikace souboru a export metadat ve formátu EBUCore
mediainfo --Output=EBUCore -f soubory/[soubor] > mediainfo.xml
Digitální kurátorství: Jak uchovávat digitální data paměťových institucí pro budoucí generace
17
Analýza a deduplikace: DROIDSQLITEANALYSIS
̶ Napsáno v programovacím jazyce Python
̶ Pracuje s výstupy programů droid a siegfried
̶ Odhaluje problematické a duplicitní soubory
Analýza obsahu adresáře s výstupem do čitelné stránky
demystify --droid droid.txt > demystify.html
Digitální kurátorství: Jak uchovávat digitální data paměťových institucí pro budoucí generace
18
Migrace a normalizace
̶ Soubory je nejdříve nutné identifikovat a validovat
̶ Je nutné definovat vlastnosti, které musí být při migraci zachovány
̶ Výsledky i samotný proces musí být dokumentovány
̶ ImageMagic – univerzální knihovna pro migraci obrazových formátů
̶ Mencoder, ffmpeg – transkódování video souborů
̶ LibreOffice – převod kancelářských formátů, lze použít pouze jeho knihovny
̶ Calibre – migrace formátů pro elektronické knihy
Digitální kurátorství: Jak uchovávat digitální data paměťových institucí pro budoucí generace
19
Migrace kancelářských formátů: UNOCONV
http://dag.wiee.rs/home-made/unoconv/
̶ Používá knihovny z balíčku LibreOffice
̶ umožňuje konverzi mezi různými formáty (nejen „kancelářské“ soubory)
Nápověda
unoconv -h
Seznam podporovaných formátů
unoconv --show
Konverze souboru do PDF
unoconv [soubor]
Konverze souboru do PDF/A (používá výstupní filtry)
unoconv -o soubory/pdfa_output.pdf -f pdf -eeSelectPdfVersion=1 soubory/[soubor]
Digitální kurátorství: Jak uchovávat digitální data paměťových institucí pro budoucí generace
20
Migrace obrazových formátů: IMAGE MAGICK
https://imagemagick.org/script/command-line-processing.php
̶ univerzální konvertor bitmapových formátů
Nápověda
convert -help
Konverze souboru z formátu JPEG do formátu PNG
convert [soubor.jpg] [soubor.png]
Konverze a změna velikosti souboru
convert soubory/[soubor] -resize "200" soubory/small.png
Digitální kurátorství: Jak uchovávat digitální data paměťových institucí pro budoucí generace
21
Migrace video formátů: FFMPEG
https://ffmpeg.org/documentation.html
̶ kolekce nástrojů pro zobrazení, identifikaci a konverzi videosouborů
̶ extrémně flexibilní konvertor video formátů
Nápověda
ffmpeg -h
Konverze souboru z formátu AVI do formátu MP4
ffmpeg -i [soubor.avi] [soubor.mp4]
Konverze do bezztrátově komprimovaného videa s původní audiostopou
ffmpeg -i soubory/[soubor] -c:v libx265 -x265-params lossless=1 
-c:a copy soubory/export.mp4

More Related Content

Similar to 06 Cvičení.pptx

Borek Bernard: TypeScript - příčetný jazyk pro web
Borek Bernard: TypeScript - příčetný jazyk pro webBorek Bernard: TypeScript - příčetný jazyk pro web
Borek Bernard: TypeScript - příčetný jazyk pro web
Develcz
 
Bezpečnost otevřených a uzavřených řešení (Martin Mačok)
Bezpečnost otevřených a uzavřených řešení (Martin Mačok)Bezpečnost otevřených a uzavřených řešení (Martin Mačok)
Bezpečnost otevřených a uzavřených řešení (Martin Mačok)
DCIT, a.s.
 
Vyvoj Windows Store aplikaci pomoci HTML, CSS a Javascriptu
Vyvoj Windows Store aplikaci pomoci HTML, CSS a JavascriptuVyvoj Windows Store aplikaci pomoci HTML, CSS a Javascriptu
Vyvoj Windows Store aplikaci pomoci HTML, CSS a Javascriptu
Jindra Parus
 
SmartCard Forum 2008 - Programové vybavení OKsmart
SmartCard Forum 2008 - Programové vybavení OKsmartSmartCard Forum 2008 - Programové vybavení OKsmart
SmartCard Forum 2008 - Programové vybavení OKsmart
OKsystem
 
E docat by onlio onepager_new_2012
E docat by onlio onepager_new_2012E docat by onlio onepager_new_2012
E docat by onlio onepager_new_2012
Onlio
 
Jak na BYOD chytře?
Jak na BYOD chytře?Jak na BYOD chytře?
Jak na BYOD chytře?
www.embt.cz
 

Similar to 06 Cvičení.pptx (20)

04 Strategie dlouhodobé ochrany.pptx
04 Strategie dlouhodobé ochrany.pptx04 Strategie dlouhodobé ochrany.pptx
04 Strategie dlouhodobé ochrany.pptx
 
Softwarově definované úložiště
Softwarově definované úložištěSoftwarově definované úložiště
Softwarově definované úložiště
 
Node-RED
Node-REDNode-RED
Node-RED
 
Borek Bernard: TypeScript - příčetný jazyk pro web
Borek Bernard: TypeScript - příčetný jazyk pro webBorek Bernard: TypeScript - příčetný jazyk pro web
Borek Bernard: TypeScript - příčetný jazyk pro web
 
Přejděte na řízenou dokumentaci eDoCat DMS
Přejděte na řízenou dokumentaci eDoCat DMSPřejděte na řízenou dokumentaci eDoCat DMS
Přejděte na řízenou dokumentaci eDoCat DMS
 
Datová úložiště CESNET
Datová úložiště CESNETDatová úložiště CESNET
Datová úložiště CESNET
 
Bezpečnost otevřených a uzavřených řešení (Martin Mačok)
Bezpečnost otevřených a uzavřených řešení (Martin Mačok)Bezpečnost otevřených a uzavřených řešení (Martin Mačok)
Bezpečnost otevřených a uzavřených řešení (Martin Mačok)
 
Softecon 2010
Softecon 2010Softecon 2010
Softecon 2010
 
Vyvoj Windows Store aplikaci pomoci HTML, CSS a Javascriptu
Vyvoj Windows Store aplikaci pomoci HTML, CSS a JavascriptuVyvoj Windows Store aplikaci pomoci HTML, CSS a Javascriptu
Vyvoj Windows Store aplikaci pomoci HTML, CSS a Javascriptu
 
SmartCard Forum 2008 - Programové vybavení OKsmart
SmartCard Forum 2008 - Programové vybavení OKsmartSmartCard Forum 2008 - Programové vybavení OKsmart
SmartCard Forum 2008 - Programové vybavení OKsmart
 
E docat by onlio onepager_new_2012
E docat by onlio onepager_new_2012E docat by onlio onepager_new_2012
E docat by onlio onepager_new_2012
 
Bitcoin Trezor - hardware bitcoin wallet
Bitcoin Trezor - hardware bitcoin walletBitcoin Trezor - hardware bitcoin wallet
Bitcoin Trezor - hardware bitcoin wallet
 
Libor Coufal - Australská národní knihovna 2 - přednáška Praha 22.3.2017
Libor Coufal - Australská národní knihovna 2 - přednáška Praha 22.3.2017Libor Coufal - Australská národní knihovna 2 - přednáška Praha 22.3.2017
Libor Coufal - Australská národní knihovna 2 - přednáška Praha 22.3.2017
 
Programování pro Android - úvod, FI MUNI, 2013
Programování pro Android - úvod, FI MUNI, 2013Programování pro Android - úvod, FI MUNI, 2013
Programování pro Android - úvod, FI MUNI, 2013
 
Adolf Knoll: Digitální zpřístupnění historických a vzácných knihovních sbírek
Adolf Knoll: Digitální zpřístupnění historických a vzácných knihovních sbírek Adolf Knoll: Digitální zpřístupnění historických a vzácných knihovních sbírek
Adolf Knoll: Digitální zpřístupnění historických a vzácných knihovních sbírek
 
McAfee Adaptive threat intelligence i ve virtuálním prostředí
McAfee Adaptive threat intelligence i ve virtuálním prostředí McAfee Adaptive threat intelligence i ve virtuálním prostředí
McAfee Adaptive threat intelligence i ve virtuálním prostředí
 
Libri os - prezentace providerů (Jindřich Vobora a Petr Kazár)
Libri os - prezentace providerů (Jindřich Vobora a Petr Kazár)Libri os - prezentace providerů (Jindřich Vobora a Petr Kazár)
Libri os - prezentace providerů (Jindřich Vobora a Petr Kazár)
 
Symposium 2022 - Proc upgradovat ma Domino 1201.pdf
Symposium 2022 - Proc upgradovat ma Domino 1201.pdfSymposium 2022 - Proc upgradovat ma Domino 1201.pdf
Symposium 2022 - Proc upgradovat ma Domino 1201.pdf
 
Jak na BYOD chytře?
Jak na BYOD chytře?Jak na BYOD chytře?
Jak na BYOD chytře?
 
Semináře M-Files: Konec hledání řešení pro správu firemních dat
Semináře M-Files: Konec hledání řešení pro správu firemních datSemináře M-Files: Konec hledání řešení pro správu firemních dat
Semináře M-Files: Konec hledání řešení pro správu firemních dat
 

06 Cvičení.pptx

  • 1. Digitální kurátorství: Jak uchovávat digitální data paměťových institucí pro budoucí generace 1 Cvičení Michal Konečný
  • 2. Digitální kurátorství: Jak uchovávat digitální data paměťových institucí pro budoucí generace 2 Co, jak a proč? Pro dnešní cvičení je pro vás připravené digitální „pískoviště“ ̶ SSH je způsob, jak se na dálku připojit k jinému počítači a spouštět na něm programy ̶ po připojení se zobrazí tzv. terminál, který umožní zadávat příkazy pomocí klávesnice a zobrazovat jejich textový výstup ̶ nejčastěji se připojujeme k počítačům s operačním systémem využívajícím linuxové jádro (Ubuntu, Debian, CentOS, Arch Linux…) ̶ linuxové operační systémy jsou si vzájemně velice podobné, z velké části kompatibilní, ale ne vždy zcela totožné ̶ jsou velmi často využívány jako servery pro systémy pro dlouhodobou ochranu dat
  • 3. Digitální kurátorství: Jak uchovávat digitální data paměťových institucí pro budoucí generace 3 Připojení ̶ Adresa: iskb49.digitalnikurator.cz ̶ Username: kurator ̶ Password: kurator ̶ Port: 4022 ̶ Web: https://iskb49.digitalnikurator.cz
  • 4. Digitální kurátorství: Jak uchovávat digitální data paměťových institucí pro budoucí generace 4 Nastavení PuTTY
  • 5. Digitální kurátorství: Jak uchovávat digitální data paměťových institucí pro budoucí generace 5 SSH klient
  • 6. Digitální kurátorství: Jak uchovávat digitální data paměťových institucí pro budoucí generace 6 Příkazová řádka Textové rozhraní linuxových systémů se nazývá shell (v našem případě se jedná o variantu bash) Základní příkazy umožňující práci se soubory a výstupy programů: ̶ ls vypíše obsah adresáře ̶ cd změní aktuální adresář: cd sandbox nebo cd .. pro skok o úroveň "výše" ̶ tabelátor pomáhá při doplňování názvů adresářů a souborů, stačí napsat pouze první písmeno a stisknout TAB ̶ mkdir [název adresáře] vytvoří nový adresář: mkdir output ̶ cp [pův. soubor] [nový soubor] vytvoří kopii souboru Tip: stiskem tabulátoru můžete doplňovat názvy souborů a adresářů ̶ echo "Hello world!" vypíše na obrazovku… Hello world! ̶ echo "Hello world!" > hello.txt vytvoří soubor hello.txt a zapíše do něj ̶ cat hello.txt vypíše na obrazovku obsah souboru hello.txt ̶ man [název příkazu] zobrazí manuál k příkazu nebo programu: man unoconv
  • 7. Digitální kurátorství: Jak uchovávat digitální data paměťových institucí pro budoucí generace 7 POWRR TOOL GRID ̶ https://www.digipres.org/tools/ ̶ Matice pro snadnější orientaci v nabídce nástrojů ̶ Založena na Community Owned digital Preservation Tool Registry (COPTR) ̶ Aktuálně obsahuje 481 nástrojů ̶ Ne vždy aktuální (FIDO…) ̶ Nástroje jsou rozděleny podle ̶ Typu digitálního objektu (audio, text, obrázek…) ̶ Fáze kurátorského cyklu (access, preservation, ingest…)
  • 8. Digitální kurátorství: Jak uchovávat digitální data paměťových institucí pro budoucí generace 8 Identifikace formátů ̶ Identifikace podle přípony není spolehlivá ̶ Pro identifikaci se využívají signatures z formátových databází (PRONOM) ̶ DROID – ne vždy spolehlivý, někdy identifikuje pouze podle přípon ̶ FIDO – ne vždy přesný, ale rychlý ̶ Nanite – dokáže i extrahovat metadata, zvládá velké množství dat ̶ Siegfried – umožňuje editovat signatures a využívat jich více naráz
  • 9. Digitální kurátorství: Jak uchovávat digitální data paměťových institucí pro budoucí generace 9 Identifikace formátů: FILE ̶ Nejjednodušší nástroj, dostupný v každém linuxovém systému ̶ Nespolehlivý Nápověda file -h Identifikace souboru file [soubor] Identifikace souborů v adresáři "soubory" file soubory/*
  • 10. Digitální kurátorství: Jak uchovávat digitální data paměťových institucí pro budoucí generace 10 Identifikace formátů: DROID ̶ Vyžaduje Java Runtime Environment ̶ Grafické uživatelské rozhraní i příkazová řádka Nápověda droid -h Vytvoření profilu s obsahem adresáře "soubory" droid –a soubory -p profile.droid Identifikace souborů v profilu a uložení výstupu do souboru "droid.txt" droid -p profile.droid -e droid.txt
  • 11. Digitální kurátorství: Jak uchovávat digitální data paměťových institucí pro budoucí generace 11 Identifikace formátů: FIDO ̶ Vyžaduje v počítači podporu jazyka Python ̶ Pouze příkazová řádka Nápověda fido –h Identifikace souborů v adresáři "soubory" a vypsání na obrazovku fido soubory Identifikace souborů a uložení výstupu do souboru "fido.txt" fido soubory > fido.txt
  • 12. Digitální kurátorství: Jak uchovávat digitální data paměťových institucí pro budoucí generace 12 Identifikace formátů: SIEGFRIED ̶ Snadná instalace ̶ Pouze příkazová řádka ̶ Podporuje export ve formátu DROID Nápověda sf -h Identifikace souborů v adresáři a vypsání na obrazovku sf soubory Identifikace souborů a uložení do souboru ve formátu droid včetně otisků sf -hash md5 soubory > sf.txt
  • 13. Digitální kurátorství: Jak uchovávat digitální data paměťových institucí pro budoucí generace 13 Validace formátů a extrakce metadat ̶ Podrobnější zpracování formátů, často je nutné využít více nástrojů naráz ̶ JHOVE/JHOVE2 – velmi využívaný, ale nepodporuje „kancelářské“ formáty ̶ NZME – vyvíjen Národní knihovnou NZ od roku 2003, často se kombinuje s JHOVE ̶ Nástroje jsou často omezené jen na určité množství formátů ̶ Dva přístupy, které to řeší: 1. Formátově specifické nástroje (pouze pro PDF/A, JPEG2000, video - Jpylyzer, ExifTool, Ffprobe) 2. Využití více omezených nástrojů v jednom „balíčku“ - FITS
  • 14. Digitální kurátorství: Jak uchovávat digitální data paměťových institucí pro budoucí generace 14 Identifikace/validace formátů: JHOVE ̶ https://jhove.openpreservation.org/getting-started/ ̶ Vyžaduje Java Runtime Environment ̶ Grafické uživatelské rozhraní i příkazová řádka Nápověda jhove -h Identifikace souborů a vypsání na obrazovku jhove soubory Identifikace souborů a uložení do souboru ve formátu XML jhove -h xml -o jhove.xml soubory
  • 15. Digitální kurátorství: Jak uchovávat digitální data paměťových institucí pro budoucí generace 15 Komplexní identifikace/validace: FITS ̶ Pouze příkazová řádka ̶ Kombinuje řadu jednoúčelových nástrojů ̶ Výstup ve formátu XML Nápověda fits -h Identifikace jednoho soubor a vypsání na obrazovku fits –i [název souboru] Identifikace souborů v adresáři "soubory" a uložení výsledků do adresáře "fits" mkdir fits fits –i soubory –o fits
  • 16. Digitální kurátorství: Jak uchovávat digitální data paměťových institucí pro budoucí generace 16 Identifikace formátů: MEDIAINFO ̶ Snadná instalace ̶ Pouze příkazová řádka ̶ Určen pro multimediální soubory Nápověda mediainfo -h Identifikace všech souborů v adresáři a vypsání na obrazovku mediainfo soubory Identifikace souboru a export metadat ve formátu EBUCore mediainfo --Output=EBUCore -f soubory/[soubor] > mediainfo.xml
  • 17. Digitální kurátorství: Jak uchovávat digitální data paměťových institucí pro budoucí generace 17 Analýza a deduplikace: DROIDSQLITEANALYSIS ̶ Napsáno v programovacím jazyce Python ̶ Pracuje s výstupy programů droid a siegfried ̶ Odhaluje problematické a duplicitní soubory Analýza obsahu adresáře s výstupem do čitelné stránky demystify --droid droid.txt > demystify.html
  • 18. Digitální kurátorství: Jak uchovávat digitální data paměťových institucí pro budoucí generace 18 Migrace a normalizace ̶ Soubory je nejdříve nutné identifikovat a validovat ̶ Je nutné definovat vlastnosti, které musí být při migraci zachovány ̶ Výsledky i samotný proces musí být dokumentovány ̶ ImageMagic – univerzální knihovna pro migraci obrazových formátů ̶ Mencoder, ffmpeg – transkódování video souborů ̶ LibreOffice – převod kancelářských formátů, lze použít pouze jeho knihovny ̶ Calibre – migrace formátů pro elektronické knihy
  • 19. Digitální kurátorství: Jak uchovávat digitální data paměťových institucí pro budoucí generace 19 Migrace kancelářských formátů: UNOCONV http://dag.wiee.rs/home-made/unoconv/ ̶ Používá knihovny z balíčku LibreOffice ̶ umožňuje konverzi mezi různými formáty (nejen „kancelářské“ soubory) Nápověda unoconv -h Seznam podporovaných formátů unoconv --show Konverze souboru do PDF unoconv [soubor] Konverze souboru do PDF/A (používá výstupní filtry) unoconv -o soubory/pdfa_output.pdf -f pdf -eeSelectPdfVersion=1 soubory/[soubor]
  • 20. Digitální kurátorství: Jak uchovávat digitální data paměťových institucí pro budoucí generace 20 Migrace obrazových formátů: IMAGE MAGICK https://imagemagick.org/script/command-line-processing.php ̶ univerzální konvertor bitmapových formátů Nápověda convert -help Konverze souboru z formátu JPEG do formátu PNG convert [soubor.jpg] [soubor.png] Konverze a změna velikosti souboru convert soubory/[soubor] -resize "200" soubory/small.png
  • 21. Digitální kurátorství: Jak uchovávat digitální data paměťových institucí pro budoucí generace 21 Migrace video formátů: FFMPEG https://ffmpeg.org/documentation.html ̶ kolekce nástrojů pro zobrazení, identifikaci a konverzi videosouborů ̶ extrémně flexibilní konvertor video formátů Nápověda ffmpeg -h Konverze souboru z formátu AVI do formátu MP4 ffmpeg -i [soubor.avi] [soubor.mp4] Konverze do bezztrátově komprimovaného videa s původní audiostopou ffmpeg -i soubory/[soubor] -c:v libx265 -x265-params lossless=1 -c:a copy soubory/export.mp4