2. Webová archivace
“Web archiving is the process of collecting portions of the
World Wide Web to ensure the information is preserved in
an archive for future researchers, historians, and the
public.”
3. “Je snazší nalézt exemplář filmu z roku
1924, než webové stránky z roku 1994.”
M.S. Ankerson. “Writing web histories with an eye on the analog past.” 2012.
http://nms.sagepub.com/content/14/3/384.full.pdf+html
4. Co stojí za to archivovat?
“more is more, less is less”
vs.
“hoarding is not a strategy”
5.
6. Co stojí za to archivovat?
• V dnešní době můžeme jen hádat.
• Lidstvo nikdy nedokáže kategorizovat všechna data na
světě.
8. Celoplošné sklízení
1. všechno, celý web (Internet Archive)
2. předem definovaná část webu (národní web, TLD)
• semínka nevybírají kurátoři
• důraz na kvantitu -> co nejvíc, co nejrychleji a hlavně
automatizovaně
• nutnost definovat výsek, který chceme sklízet (všichni
nemůžou být IA)
10. Webarchiv - český webový archiv
• od roku 2001
• ~ 250 TB dat
• méně než 1 % zdrojů zpřístupněných online
• celý archiv dostupný pouze v Klementinu
15. Kolekce
První naše kolekce: Spolupráce s Karlovou univerzitou
(cuni.cz)
IIPC collaborative collection:
• World War I; Europan Refugee Crisis
• https://archive-it.org/home/IIPC
16.
17. w
w w
w w w
Děkuji za pozornost!
Mgr. Jaroslav Kvasnica
jaroslav.kvasnica@nkp.cz
webarchiv.cz
facebook.com/webarchivcz