SlideShare a Scribd company logo
1 of 26
Download to read offline
Kurz webové archivace
AISV143
Termíny
březen - Workshop technická část webové archivace, Centrální depozitář
Hostivař, Národní knihovna ČR
30. 3. 2017 - Přednáška: Obsahová část webové archivace, Jinonice
6. 4. 2017 - Přednáška: Úvod do problematiky smluv a metadatového
popisu, Jinonice
20. 4. 2017 - Přednáška: Webové archivy pro badatele, Jinonice (2068)
Úkoly
• Individuální úkol - tagování semínek
• deadline 20. 4. 2017
• Skupinový úkol - hledání semínek a jejich hodnocení
• vytvoření skupiny a zvolení tématu do konce února
• na workshop přinést seznam semínek
• do 20. 4. 2017 ohodnotit semínka
Webová archivace
Úvod
Webová archivace
Web archiving is the process of collecting portions of the
World Wide Web to ensure the information is preserved in
an archive for future researchers, historians, and the public.
Proč archivovat web?
“Je snazší nalézt exemplář filmu z roku
1924, než webové stránky z roku 1994.”
M.S. Ankerson. “Writing web histories with an eye on the analog past.” 2012. 

http://nms.sagepub.com/content/14/3/384.full.pdf+html
Typy webu
• Surface web - běžně přístupná část webu
• Deep web (invisible, hidden) - dynamický obsah,
kontextuální, privátní, skriptovaný atd.
• Dark web (darknet) - obvykle nelegální obsah, těžko
dosažitelný (P2P)
Personální
• pro osobní potřebu
• firemní archivace
• neřeší rozdíly mezi surface x deep
Typy archivace
Institucionální
• za účelem uchování kulturního
dědictví
• knihovny, univerzity
• často web-scale archiving
Web scale archiving
• webové archivy se snaží archivovat tak velkou část
internetu, že není možné kontrolovat akvizici, ochranu,
zpřístupnění ani kontrolu kvality jednotlivých webových
stránek pouze lidskými silami.
Sklizně a semínka
Sklizně - procesy automatického stahování a sběru dat z
vybraných webových zdrojů (vytváření kopií)
Semínka - jednotlivé URL adresy, které jsou předmětem
archivace, jeden zdroj může mít více semínek (např. při
přesměrování, nebo změně adresy)
Sklízeč - počítačový program, který dokáže automaticky
procházet a stahovat webové stránky. Sklízeče používají
zejména internetové vyhledávače a také webové archivy
Limity webové archivace
• legislativa + budget
• web 2.0 (streaming, dynamický a personalizovaný obsah)
• další technické překážky
Technické překážky
• Flash, Ajax, JavaScript …
• technických překážek je mnoho, řešení?
• univerzální řešení neexistuje
Kdo jsou webové archivy
• Internet Archive (archive.org)
• Národní knihovny
• Univerzity, neziskové organizace
V Evropě budujeme dark
archivy
• veřejně nepřístupné archivy
• většinou pouze v místě samé, někdy ani to ne
• autorský zákon, knihovní licence
Webarchiv
Český webový archiv, více
“český web”?
• bohemikální charakter zdroje (definice v collection policy)
• Území – zdroje publikované na území ČR

• Jazyk – všechny zdroje v češtině (bez ohledu na místo
vydání) 

• Autorství – všechny zdroje českých autorů (bez ohledu
na místo vydání) 

• Předmět/obsah – všechny zdroje, jejichž obsah se týká
České republiky nebo českého národa 

(bez ohledu na místo vydání) 

Historie Webarchivu
• 2000 - začátek (jako projekt NK ČR, MZK a MU ČR)
• 2001 - první archivované webové stránky
• 2005 - pravidelné sklízení obsahu
• 2007 - vstup do IIPC
Profil archivu
• stáří archivu: 3. 9. 2001
• ~ 250 TB
• frekvence sklízení: 1x - 1x|2x|6x|12x/year
• hloubka sklízení: 5000 - 15 000 objects
• přístupnost: in house/online access
Rozložení domén
Tempo růstu
• robot.txt nerespektujeme
• velké dilema pro webové archivy
• rozhodnutí má zásadní dopady na archiv
• “V současnosti standardně soubory robots.txt nezohledňujeme,
jelikož věříme, že historie webu by se měla uchovat v takové podobě,
v jaké ho vidí lidé a ne vyhledávače.”
Designated community
• koncový uživatelé, kteří by měli být schopni porozumět
konkrétní množině informací (OAIS)
• definice uživatelů určuje obsah i jeho formu
1. individuální uživatelé
2. institucionální uživatelé
3. výzkumníci a vědci
Zpřístupnění
• Wayback Machine (zobrazování)
• Vyhledávání:
• primárně WWW
• katalog Aleph
• Wayback Machine
• méně než 1 % zdrojů zpřístupněných online
• celý archiv dostupný pouze v Klementinu
• Bude to lepší v budoucnu? Ne.
• terminály v dalších knihovnách?
• metadata
w
w w
w w w
Děkuji za pozornost!
Mgr. Jaroslav Kvasnica
jaroslav.kvasnica@nkp.cz

More Related Content

What's hot

Právo.knihovna.cz na Infokonu
Právo.knihovna.cz na InfokonuPrávo.knihovna.cz na Infokonu
Právo.knihovna.cz na Infokonupravoknihovnacz
 
Infokon 2010: Pravo.knihovna.cz
Infokon 2010: Pravo.knihovna.czInfokon 2010: Pravo.knihovna.cz
Infokon 2010: Pravo.knihovna.czKISK FF MU
 
Knihovna 2.0
Knihovna 2.0Knihovna 2.0
Knihovna 2.0JanKanka
 
KP-SYS: Portaro / Tomáš Krejzek, Jan Pachol
KP-SYS: Portaro / Tomáš Krejzek, Jan PacholKP-SYS: Portaro / Tomáš Krejzek, Jan Pachol
KP-SYS: Portaro / Tomáš Krejzek, Jan PacholInfodays
 
Sharing Knowledge - Open Access Repositories in the V4 Countries
Sharing Knowledge - Open Access Repositories in the V4 CountriesSharing Knowledge - Open Access Repositories in the V4 Countries
Sharing Knowledge - Open Access Repositories in the V4 CountriesTereza Simandlová
 
Elektronické informační zdroje na VUT a vědecké publikování - FSI
Elektronické informační zdroje na VUT a vědecké publikování - FSIElektronické informační zdroje na VUT a vědecké publikování - FSI
Elektronické informační zdroje na VUT a vědecké publikování - FSIUstredni knihovna VUT
 
Oa repozitáře 2014 final publish
Oa repozitáře 2014 final publishOa repozitáře 2014 final publish
Oa repozitáře 2014 final publishPetra Dedicova
 
Knihovna 2.0 + Google Docs
Knihovna 2.0 + Google DocsKnihovna 2.0 + Google Docs
Knihovna 2.0 + Google DocsJanKanka
 

What's hot (11)

Kurz webové archivace 2018/1
Kurz webové archivace 2018/1Kurz webové archivace 2018/1
Kurz webové archivace 2018/1
 
Právo.knihovna.cz na Infokonu
Právo.knihovna.cz na InfokonuPrávo.knihovna.cz na Infokonu
Právo.knihovna.cz na Infokonu
 
Infokon 2010: Pravo.knihovna.cz
Infokon 2010: Pravo.knihovna.czInfokon 2010: Pravo.knihovna.cz
Infokon 2010: Pravo.knihovna.cz
 
Knihovna 2.0
Knihovna 2.0Knihovna 2.0
Knihovna 2.0
 
Slezska digitalni knihovna
Slezska digitalni knihovnaSlezska digitalni knihovna
Slezska digitalni knihovna
 
KP-SYS: Portaro / Tomáš Krejzek, Jan Pachol
KP-SYS: Portaro / Tomáš Krejzek, Jan PacholKP-SYS: Portaro / Tomáš Krejzek, Jan Pachol
KP-SYS: Portaro / Tomáš Krejzek, Jan Pachol
 
Open Access na VUT
Open Access na VUT Open Access na VUT
Open Access na VUT
 
Sharing Knowledge - Open Access Repositories in the V4 Countries
Sharing Knowledge - Open Access Repositories in the V4 CountriesSharing Knowledge - Open Access Repositories in the V4 Countries
Sharing Knowledge - Open Access Repositories in the V4 Countries
 
Elektronické informační zdroje na VUT a vědecké publikování - FSI
Elektronické informační zdroje na VUT a vědecké publikování - FSIElektronické informační zdroje na VUT a vědecké publikování - FSI
Elektronické informační zdroje na VUT a vědecké publikování - FSI
 
Oa repozitáře 2014 final publish
Oa repozitáře 2014 final publishOa repozitáře 2014 final publish
Oa repozitáře 2014 final publish
 
Knihovna 2.0 + Google Docs
Knihovna 2.0 + Google DocsKnihovna 2.0 + Google Docs
Knihovna 2.0 + Google Docs
 

Similar to Kurz webové archivace 2017/1

Uchování a trvalé zpřístupnění webových dokumentů
Uchování a trvalé zpřístupnění webových dokumentůUchování a trvalé zpřístupnění webových dokumentů
Uchování a trvalé zpřístupnění webových dokumentůtomas.sibek
 
Informační zdroje pro obor klasická studia
Informační zdroje pro obor klasická studia Informační zdroje pro obor klasická studia
Informační zdroje pro obor klasická studia Ústřední knihovna FF MU
 
Knihovny.cz v Bloku expertů KISK 2017
Knihovny.cz v Bloku expertů KISK 2017 Knihovny.cz v Bloku expertů KISK 2017
Knihovny.cz v Bloku expertů KISK 2017 Knihovny.cz
 
Komu se nelení, tomu se zelení - Open Access Greenhorns
Komu se nelení, tomu se zelení - Open Access GreenhornsKomu se nelení, tomu se zelení - Open Access Greenhorns
Komu se nelení, tomu se zelení - Open Access GreenhornsTereza Simandlová
 
Průvodce databázemi pro studenty Ústavu klasických studií
Průvodce databázemi pro studenty Ústavu klasických studiíPrůvodce databázemi pro studenty Ústavu klasických studií
Průvodce databázemi pro studenty Ústavu klasických studiíÚstřední knihovna FF MU
 
Online katalogy a weby knihoven
Online katalogy a weby knihovenOnline katalogy a weby knihoven
Online katalogy a weby knihovenJanKanka
 
Elektronické informační zdroje pro studenty KISKu
Elektronické informační zdroje pro studenty KISKuElektronické informační zdroje pro studenty KISKu
Elektronické informační zdroje pro studenty KISKuÚstřední knihovna FF MU
 
Knihovny.cz - centrální portál českých knihoven
Knihovny.cz - centrální portál českých knihovenKnihovny.cz - centrální portál českých knihoven
Knihovny.cz - centrální portál českých knihovenKnihovny.cz
 
Elektronické informační zdroje pro studium humanitních oborů
Elektronické informační zdroje pro studium humanitních oborůElektronické informační zdroje pro studium humanitních oborů
Elektronické informační zdroje pro studium humanitních oborůÚstřední knihovna FF MU
 
Průvodce databázemi Oxford Journals & Cambridge Journals (jaro 2012)
Průvodce databázemi Oxford Journals & Cambridge Journals (jaro 2012)Průvodce databázemi Oxford Journals & Cambridge Journals (jaro 2012)
Průvodce databázemi Oxford Journals & Cambridge Journals (jaro 2012)Ústřední knihovna FF MU
 
Průvodce databázemi ScienceDirect a JSTOR (jaro 2013)
Průvodce databázemi ScienceDirect a JSTOR (jaro 2013)Průvodce databázemi ScienceDirect a JSTOR (jaro 2013)
Průvodce databázemi ScienceDirect a JSTOR (jaro 2013)Ústřední knihovna FF MU
 
Jak pracovat s informacemi v Akademické knihovně JU - FROV
Jak pracovat s informacemi v Akademické knihovně JU - FROVJak pracovat s informacemi v Akademické knihovně JU - FROV
Jak pracovat s informacemi v Akademické knihovně JU - FROVVladimíra Bendová
 
Průvodce databázemi pro studenty oboru Dějiny starověku
Průvodce databázemi pro studenty oboru Dějiny starověkuPrůvodce databázemi pro studenty oboru Dějiny starověku
Průvodce databázemi pro studenty oboru Dějiny starověkuÚstřední knihovna FF MU
 
Průvodce databázemi pro studenty oboru Mediteránní studia
Průvodce databázemi pro studenty oboru Mediteránní studiaPrůvodce databázemi pro studenty oboru Mediteránní studia
Průvodce databázemi pro studenty oboru Mediteránní studiaÚstřední knihovna FF MU
 
Elektronické informační zdroje nejen pro filology - se zaměřením na zdroje pr...
Elektronické informační zdroje nejen pro filology - se zaměřením na zdroje pr...Elektronické informační zdroje nejen pro filology - se zaměřením na zdroje pr...
Elektronické informační zdroje nejen pro filology - se zaměřením na zdroje pr...Ústřední knihovna FF MU
 
Elektronické informační zdroje v práci doktorandů
Elektronické informační zdroje v práci doktorandůElektronické informační zdroje v práci doktorandů
Elektronické informační zdroje v práci doktorandůÚstřední knihovna FF MU
 
Průvodce EIZ MU aneb Kvalitní zdroje pro vaše studium
 Průvodce EIZ MU aneb Kvalitní zdroje pro vaše studium Průvodce EIZ MU aneb Kvalitní zdroje pro vaše studium
Průvodce EIZ MU aneb Kvalitní zdroje pro vaše studiumÚstřední knihovna FF MU
 

Similar to Kurz webové archivace 2017/1 (20)

Uchování a trvalé zpřístupnění webových dokumentů
Uchování a trvalé zpřístupnění webových dokumentůUchování a trvalé zpřístupnění webových dokumentů
Uchování a trvalé zpřístupnění webových dokumentů
 
Informační zdroje pro obor klasická studia
Informační zdroje pro obor klasická studia Informační zdroje pro obor klasická studia
Informační zdroje pro obor klasická studia
 
Knihovny.cz v Bloku expertů KISK 2017
Knihovny.cz v Bloku expertů KISK 2017 Knihovny.cz v Bloku expertů KISK 2017
Knihovny.cz v Bloku expertů KISK 2017
 
Knihovny.cz v Bloku expertů 2017
Knihovny.cz v Bloku expertů 2017Knihovny.cz v Bloku expertů 2017
Knihovny.cz v Bloku expertů 2017
 
Komu se nelení, tomu se zelení - Open Access Greenhorns
Komu se nelení, tomu se zelení - Open Access GreenhornsKomu se nelení, tomu se zelení - Open Access Greenhorns
Komu se nelení, tomu se zelení - Open Access Greenhorns
 
Průvodce databázemi pro studenty Ústavu klasických studií
Průvodce databázemi pro studenty Ústavu klasických studiíPrůvodce databázemi pro studenty Ústavu klasických studií
Průvodce databázemi pro studenty Ústavu klasických studií
 
Online katalogy a weby knihoven
Online katalogy a weby knihovenOnline katalogy a weby knihoven
Online katalogy a weby knihoven
 
Elektronické informační zdroje pro studenty KISKu
Elektronické informační zdroje pro studenty KISKuElektronické informační zdroje pro studenty KISKu
Elektronické informační zdroje pro studenty KISKu
 
Knihovny.cz - centrální portál českých knihoven
Knihovny.cz - centrální portál českých knihovenKnihovny.cz - centrální portál českých knihoven
Knihovny.cz - centrální portál českých knihoven
 
Elektronické informační zdroje pro studium humanitních oborů
Elektronické informační zdroje pro studium humanitních oborůElektronické informační zdroje pro studium humanitních oborů
Elektronické informační zdroje pro studium humanitních oborů
 
Průvodce databázemi Oxford Journals & Cambridge Journals (jaro 2012)
Průvodce databázemi Oxford Journals & Cambridge Journals (jaro 2012)Průvodce databázemi Oxford Journals & Cambridge Journals (jaro 2012)
Průvodce databázemi Oxford Journals & Cambridge Journals (jaro 2012)
 
Průvodce databázemi ScienceDirect a JSTOR (jaro 2013)
Průvodce databázemi ScienceDirect a JSTOR (jaro 2013)Průvodce databázemi ScienceDirect a JSTOR (jaro 2013)
Průvodce databázemi ScienceDirect a JSTOR (jaro 2013)
 
EIZ v práci doktorandů
EIZ v práci doktorandůEIZ v práci doktorandů
EIZ v práci doktorandů
 
Jak pracovat s informacemi v Akademické knihovně JU - FROV
Jak pracovat s informacemi v Akademické knihovně JU - FROVJak pracovat s informacemi v Akademické knihovně JU - FROV
Jak pracovat s informacemi v Akademické knihovně JU - FROV
 
Průvodce databázemi pro studenty oboru Dějiny starověku
Průvodce databázemi pro studenty oboru Dějiny starověkuPrůvodce databázemi pro studenty oboru Dějiny starověku
Průvodce databázemi pro studenty oboru Dějiny starověku
 
Průvodce databázemi pro studenty oboru Mediteránní studia
Průvodce databázemi pro studenty oboru Mediteránní studiaPrůvodce databázemi pro studenty oboru Mediteránní studia
Průvodce databázemi pro studenty oboru Mediteránní studia
 
Odborné informace onlie
Odborné informace onlie Odborné informace onlie
Odborné informace onlie
 
Elektronické informační zdroje nejen pro filology - se zaměřením na zdroje pr...
Elektronické informační zdroje nejen pro filology - se zaměřením na zdroje pr...Elektronické informační zdroje nejen pro filology - se zaměřením na zdroje pr...
Elektronické informační zdroje nejen pro filology - se zaměřením na zdroje pr...
 
Elektronické informační zdroje v práci doktorandů
Elektronické informační zdroje v práci doktorandůElektronické informační zdroje v práci doktorandů
Elektronické informační zdroje v práci doktorandů
 
Průvodce EIZ MU aneb Kvalitní zdroje pro vaše studium
 Průvodce EIZ MU aneb Kvalitní zdroje pro vaše studium Průvodce EIZ MU aneb Kvalitní zdroje pro vaše studium
Průvodce EIZ MU aneb Kvalitní zdroje pro vaše studium
 

More from Webarchive of National Library of the Czech Republic

More from Webarchive of National Library of the Czech Republic (20)

Inzerat - datovy analytik / datova analyticka
Inzerat - datovy analytik / datova analyticka Inzerat - datovy analytik / datova analyticka
Inzerat - datovy analytik / datova analyticka
 
Inzerát datovy analytik_wa
Inzerát datovy analytik_waInzerát datovy analytik_wa
Inzerát datovy analytik_wa
 
Sys admin wa_rvv
Sys admin wa_rvvSys admin wa_rvv
Sys admin wa_rvv
 
Volné pracovní místo - kurátor/ka webového archivu
Volné pracovní místo - kurátor/ka webového archivuVolné pracovní místo - kurátor/ka webového archivu
Volné pracovní místo - kurátor/ka webového archivu
 
Webarchiv - Curatorial approaches, topic collections and cooperation with the...
Webarchiv - Curatorial approaches, topic collections and cooperation with the...Webarchiv - Curatorial approaches, topic collections and cooperation with the...
Webarchiv - Curatorial approaches, topic collections and cooperation with the...
 
Volné místo - analytik českého webového archivu
Volné místo - analytik českého webového archivuVolné místo - analytik českého webového archivu
Volné místo - analytik českého webového archivu
 
Webarchiv aneb až po lokty v mrtvolách
Webarchiv aneb až po lokty v mrtvoláchWebarchiv aneb až po lokty v mrtvolách
Webarchiv aneb až po lokty v mrtvolách
 
Datovy analytik
Datovy analytikDatovy analytik
Datovy analytik
 
Webarchiv CZ 2017
Webarchiv CZ 2017Webarchiv CZ 2017
Webarchiv CZ 2017
 
Kurz webové archivace 2017/4
Kurz webové archivace 2017/4Kurz webové archivace 2017/4
Kurz webové archivace 2017/4
 
Kurz webové archivace 2017/3
Kurz webové archivace 2017/3Kurz webové archivace 2017/3
Kurz webové archivace 2017/3
 
Kurz webové archivace 2017/2
Kurz webové archivace 2017/2Kurz webové archivace 2017/2
Kurz webové archivace 2017/2
 
WARC 1.1 je skoro tady - co přinese nová verze?
WARC 1.1 je skoro tady - co přinese nová verze?WARC 1.1 je skoro tady - co přinese nová verze?
WARC 1.1 je skoro tady - co přinese nová verze?
 
WARC 1.1 je skoro tady - co přinese nová verze
WARC 1.1 je skoro tady - co přinese nová verzeWARC 1.1 je skoro tady - co přinese nová verze
WARC 1.1 je skoro tady - co přinese nová verze
 
Mezi snem a realitou. Otevřená data českého webového archivu.
Mezi snem a realitou. Otevřená data českého webového archivu.Mezi snem a realitou. Otevřená data českého webového archivu.
Mezi snem a realitou. Otevřená data českého webového archivu.
 
Kurz webové archivace III.
Kurz webové archivace III.Kurz webové archivace III.
Kurz webové archivace III.
 
Kurz webové archivace II.
Kurz webové archivace II.Kurz webové archivace II.
Kurz webové archivace II.
 
Webarchiv jako digitální knihovna II.
Webarchiv jako digitální knihovna II.Webarchiv jako digitální knihovna II.
Webarchiv jako digitální knihovna II.
 
Prezentace obsahu webového archivu
Prezentace obsahu webového archivuPrezentace obsahu webového archivu
Prezentace obsahu webového archivu
 
Infrastruktura památníku českého webu a zkušenosti s Heritrixem
Infrastruktura památníku českého webu a zkušenosti s HeritrixemInfrastruktura památníku českého webu a zkušenosti s Heritrixem
Infrastruktura památníku českého webu a zkušenosti s Heritrixem
 

Kurz webové archivace 2017/1

  • 2. Termíny březen - Workshop technická část webové archivace, Centrální depozitář Hostivař, Národní knihovna ČR 30. 3. 2017 - Přednáška: Obsahová část webové archivace, Jinonice 6. 4. 2017 - Přednáška: Úvod do problematiky smluv a metadatového popisu, Jinonice 20. 4. 2017 - Přednáška: Webové archivy pro badatele, Jinonice (2068)
  • 3. Úkoly • Individuální úkol - tagování semínek • deadline 20. 4. 2017 • Skupinový úkol - hledání semínek a jejich hodnocení • vytvoření skupiny a zvolení tématu do konce února • na workshop přinést seznam semínek • do 20. 4. 2017 ohodnotit semínka
  • 5. Webová archivace Web archiving is the process of collecting portions of the World Wide Web to ensure the information is preserved in an archive for future researchers, historians, and the public.
  • 6. Proč archivovat web? “Je snazší nalézt exemplář filmu z roku 1924, než webové stránky z roku 1994.” M.S. Ankerson. “Writing web histories with an eye on the analog past.” 2012. 
 http://nms.sagepub.com/content/14/3/384.full.pdf+html
  • 7. Typy webu • Surface web - běžně přístupná část webu • Deep web (invisible, hidden) - dynamický obsah, kontextuální, privátní, skriptovaný atd. • Dark web (darknet) - obvykle nelegální obsah, těžko dosažitelný (P2P)
  • 8. Personální • pro osobní potřebu • firemní archivace • neřeší rozdíly mezi surface x deep Typy archivace Institucionální • za účelem uchování kulturního dědictví • knihovny, univerzity • často web-scale archiving
  • 9. Web scale archiving • webové archivy se snaží archivovat tak velkou část internetu, že není možné kontrolovat akvizici, ochranu, zpřístupnění ani kontrolu kvality jednotlivých webových stránek pouze lidskými silami.
  • 10. Sklizně a semínka Sklizně - procesy automatického stahování a sběru dat z vybraných webových zdrojů (vytváření kopií) Semínka - jednotlivé URL adresy, které jsou předmětem archivace, jeden zdroj může mít více semínek (např. při přesměrování, nebo změně adresy) Sklízeč - počítačový program, který dokáže automaticky procházet a stahovat webové stránky. Sklízeče používají zejména internetové vyhledávače a také webové archivy
  • 11. Limity webové archivace • legislativa + budget • web 2.0 (streaming, dynamický a personalizovaný obsah) • další technické překážky
  • 12. Technické překážky • Flash, Ajax, JavaScript … • technických překážek je mnoho, řešení? • univerzální řešení neexistuje
  • 13. Kdo jsou webové archivy • Internet Archive (archive.org) • Národní knihovny • Univerzity, neziskové organizace
  • 14. V Evropě budujeme dark archivy • veřejně nepřístupné archivy • většinou pouze v místě samé, někdy ani to ne • autorský zákon, knihovní licence
  • 16. “český web”? • bohemikální charakter zdroje (definice v collection policy) • Území – zdroje publikované na území ČR
 • Jazyk – všechny zdroje v češtině (bez ohledu na místo vydání) 
 • Autorství – všechny zdroje českých autorů (bez ohledu na místo vydání) 
 • Předmět/obsah – všechny zdroje, jejichž obsah se týká České republiky nebo českého národa 
 (bez ohledu na místo vydání) 

  • 17. Historie Webarchivu • 2000 - začátek (jako projekt NK ČR, MZK a MU ČR) • 2001 - první archivované webové stránky • 2005 - pravidelné sklízení obsahu • 2007 - vstup do IIPC
  • 18. Profil archivu • stáří archivu: 3. 9. 2001 • ~ 250 TB • frekvence sklízení: 1x - 1x|2x|6x|12x/year • hloubka sklízení: 5000 - 15 000 objects • přístupnost: in house/online access
  • 21.
  • 22. • robot.txt nerespektujeme • velké dilema pro webové archivy • rozhodnutí má zásadní dopady na archiv • “V současnosti standardně soubory robots.txt nezohledňujeme, jelikož věříme, že historie webu by se měla uchovat v takové podobě, v jaké ho vidí lidé a ne vyhledávače.”
  • 23. Designated community • koncový uživatelé, kteří by měli být schopni porozumět konkrétní množině informací (OAIS) • definice uživatelů určuje obsah i jeho formu 1. individuální uživatelé 2. institucionální uživatelé 3. výzkumníci a vědci
  • 24. Zpřístupnění • Wayback Machine (zobrazování) • Vyhledávání: • primárně WWW • katalog Aleph • Wayback Machine
  • 25. • méně než 1 % zdrojů zpřístupněných online • celý archiv dostupný pouze v Klementinu • Bude to lepší v budoucnu? Ne. • terminály v dalších knihovnách? • metadata
  • 26. w w w w w w Děkuji za pozornost! Mgr. Jaroslav Kvasnica jaroslav.kvasnica@nkp.cz