SlideShare a Scribd company logo
Kurz webové archivace -
archivace a zdroje
Barbora Rudišinová
3. 3. 2016
Webarchiv
• http://webarchiv.cz
Autorský zákon
• archivace povolena tzv. “knihovní licencí” § 37 AZ:
„Do práva autorského nezasahuje knihovna, archiv, muzeum,
galerie, škola, vysoká škola a jiné nevýdělečné školské a vzdělávací
zařízení,
a) zhotoví-li rozmnoženinu díla, která neslouží k přímému nebo
nepřímému hospodářskému nebo obchodnímu účelu, pro své archivní
a konzervační potřeby“
Autorský zákon - zpřístupnění
• zpřístupnění archivních kopií je ale knihovní licencí
limitováno:
“zpřístupňuje-li dílo, včetně zhotovení jeho rozmnoženiny nezbytné
pro takové zpřístupnění, které je součástí jeho sbírek a jehož užití
není předmětem prodejních nebo licenčních podmínek, ... ,
jednotlivcům ze strany veřejnosti prostřednictvím k tomu určených
technických zařízení umístěných v jeho objektech, a to výhradně
pro účely výzkumu nebo soukromého studia takových osob, a
zamezí-li takovým osobám zhotovit rozmnoženinu díla”
Autorský zákon
Co z toho vyplývá?
• můžeme vytvářet archivní kopie webových stránek
• nesmíme je zpřístupňovat mimo terminály v budově NK
Řešení
• povinný výtisk el. dokumentů - v ČR není (zahraniční,
ale liší se, záleží na znění)
• spolupráce s vydavateli elektronických zdrojů (ČR, VB
atd.) - získání souhlasu se zpřístupněním
Archivace v českém Webarchivu
3 typy sklizní:
1.celoplošné sklizně
2.tematické sbírky
3.výběrová sbírka
Celoplošné sklizně
• cílem je vytvořit obraz “českého webu” v určitém čase
• zdrojem je seznam webových adres s národní doménou
.cz od CZ.NIC
• automatizované sklízení
• alespoň 1x ročně
• zabírají nejvíce místa
• není sklizeno kompletně vše - omezení (5000 dotazů na
doménu)
• přístupné pouze na terminálech v NK
Tematické sbírky
• k aktuálním událostem
• např. volby, úmrtí Václava Havla, stavba nové budovy
NTK
• manuální výběr zrojů kurátory
• kompletní přístup jen na terminálech v NK
Výběrová sbírka
• výběrový vzorek webů s určitou hodnotou (historickou,
kulturní, vědeckou atd.)
• zdroje manuálně vybírány kurátory nebo návrhy z ISSN
a od uživatelů (formulář http://webarchiv.cz/cs/pridat-
web) a poté hodnoceny
• snaha o zpřístupnění online - získání souhlasu s
archivací od vydavatele
• rozdělení do předmětových kategorií dle metody
konspektu
Přehled kategorií výběrové sbírky
Tvorba priorit pro předmětové kategorie
Příklad priorit
Příklad zdroje ve WA Adminu
Způsoby souhlasu se zpřístupněním
1.Smlouva
• výhradní udělení souhlasu pouze NK
• založená na Obč. zákonníku
• za obsah webu a aut. práva k němu odpovídá
vydavatel
2.Licence Creative Commons
• soubor licencí legálně upravující sdílení děl veřejností
• možnost nastavit podmínky (vždy nutnost citace,
možnost zákazu komerčního využití atd.)
• prakticky jen logo licence odkazující na plný text
Vyhledávání ve Webarchivu
Pomocí vyhledávacího pole:
• URL adresa (jakýkoliv platný tvar nkp.cz, www.nkp.cz
atd.)
• klíčová slova (hledá v názvech a anotacích)
Katalog stránek
Zobrazení v katalogu
Wayback
Kritéria zdrojů
• bohemikální dokument:
• v českém jazyce
• vydaný na území ČR
• vydaný českým autorem
• obsahově o ČR nebo Češích
• volně přístupné zdroje
• převážně nekomerční povaha
• unikátnost informací
• aktuálnost a (dlouhodobá) informační hodnota
• technické hledisko
Technické hledisko
• preferovány zdroje v běžných formátech
• problematická archivace sociálních sítí, externích
doplňků a aplikací (např. Google mapy), animace
vytvořené programem Flash, vyhledávací pole,
rozbalovací (drop-down) nabídky, některé prvky
vytvořené v Javascriptu
• při podezření na problém - vhodná kontrola na
https://archive.org/
Technické problémy
Kde hledat zdroje?
• Google
• Wikipedia
• stránky zastřešujících institucí a organizací
• registry a rejstříky státních nebo jiných subjektů
• odkazy na podobných stránkách
Jak ověřit téma zdroje?
Otázky?
barbora.rudisinova@nkp.cz

More Related Content

Similar to Kurz webové archivace II.

Kurz webové archivace 2017/1
Kurz webové archivace 2017/1Kurz webové archivace 2017/1
Elektronické informační zdroje na VUT a vědecké publikování - FSI
Elektronické informační zdroje na VUT a vědecké publikování - FSIElektronické informační zdroje na VUT a vědecké publikování - FSI
Elektronické informační zdroje na VUT a vědecké publikování - FSI
Ustredni knihovna VUT
 
Elektronické informační zdroje pro studenty KISKu
Elektronické informační zdroje pro studenty KISKuElektronické informační zdroje pro studenty KISKu
Elektronické informační zdroje pro studenty KISKu
Ústřední knihovna FF MU
 
Licence Creative Commons a jejich vyuziti v informacnich sluzbach
Licence Creative Commons a jejich vyuziti v informacnich sluzbachLicence Creative Commons a jejich vyuziti v informacnich sluzbach
Licence Creative Commons a jejich vyuziti v informacnich sluzbachropes
 
Handout - informační zdroje pro českou literaturu
Handout - informační zdroje pro českou literaturuHandout - informační zdroje pro českou literaturu
Handout - informační zdroje pro českou literaturu
Ústřední knihovna FF MU
 
Knihovna 2.0 + Google Docs
Knihovna 2.0 + Google DocsKnihovna 2.0 + Google Docs
Knihovna 2.0 + Google Docs
JanKanka
 
Informační zdroje pro obor klasická studia
Informační zdroje pro obor klasická studia Informační zdroje pro obor klasická studia
Informační zdroje pro obor klasická studia
Ústřední knihovna FF MU
 

Similar to Kurz webové archivace II. (8)

Kurz webové archivace 2017/1
Kurz webové archivace 2017/1Kurz webové archivace 2017/1
Kurz webové archivace 2017/1
 
Elektronické informační zdroje na VUT a vědecké publikování - FSI
Elektronické informační zdroje na VUT a vědecké publikování - FSIElektronické informační zdroje na VUT a vědecké publikování - FSI
Elektronické informační zdroje na VUT a vědecké publikování - FSI
 
Elektronické informační zdroje pro studenty KISKu
Elektronické informační zdroje pro studenty KISKuElektronické informační zdroje pro studenty KISKu
Elektronické informační zdroje pro studenty KISKu
 
Licence Creative Commons Gruber
Licence Creative Commons GruberLicence Creative Commons Gruber
Licence Creative Commons Gruber
 
Licence Creative Commons a jejich vyuziti v informacnich sluzbach
Licence Creative Commons a jejich vyuziti v informacnich sluzbachLicence Creative Commons a jejich vyuziti v informacnich sluzbach
Licence Creative Commons a jejich vyuziti v informacnich sluzbach
 
Handout - informační zdroje pro českou literaturu
Handout - informační zdroje pro českou literaturuHandout - informační zdroje pro českou literaturu
Handout - informační zdroje pro českou literaturu
 
Knihovna 2.0 + Google Docs
Knihovna 2.0 + Google DocsKnihovna 2.0 + Google Docs
Knihovna 2.0 + Google Docs
 
Informační zdroje pro obor klasická studia
Informační zdroje pro obor klasická studia Informační zdroje pro obor klasická studia
Informační zdroje pro obor klasická studia
 

More from Webarchive of National Library of the Czech Republic

Inzerat - datovy analytik / datova analyticka
Inzerat - datovy analytik / datova analyticka Inzerat - datovy analytik / datova analyticka
Inzerat - datovy analytik / datova analyticka
Webarchive of National Library of the Czech Republic
 
Inzerát datovy analytik_wa
Inzerát datovy analytik_waInzerát datovy analytik_wa
Volné pracovní místo - kurátor/ka webového archivu
Volné pracovní místo - kurátor/ka webového archivuVolné pracovní místo - kurátor/ka webového archivu
Volné pracovní místo - kurátor/ka webového archivu
Webarchive of National Library of the Czech Republic
 
Webarchiv - Curatorial approaches, topic collections and cooperation with the...
Webarchiv - Curatorial approaches, topic collections and cooperation with the...Webarchiv - Curatorial approaches, topic collections and cooperation with the...
Webarchiv - Curatorial approaches, topic collections and cooperation with the...
Webarchive of National Library of the Czech Republic
 
Volné místo - analytik českého webového archivu
Volné místo - analytik českého webového archivuVolné místo - analytik českého webového archivu
Volné místo - analytik českého webového archivu
Webarchive of National Library of the Czech Republic
 
Webarchiv aneb až po lokty v mrtvolách
Webarchiv aneb až po lokty v mrtvoláchWebarchiv aneb až po lokty v mrtvolách
Webarchiv aneb až po lokty v mrtvolách
Webarchive of National Library of the Czech Republic
 
Kurz webové archivace 2018/2
Kurz webové archivace 2018/2Kurz webové archivace 2018/2
Blok expertu
Blok expertuBlok expertu
Kurz webové archivace 2018/1
Kurz webové archivace 2018/1Kurz webové archivace 2018/1
Webarchiv
WebarchivWebarchiv
Datovy analytik
Datovy analytikDatovy analytik
Webarchiv CZ 2017
Webarchiv CZ 2017Webarchiv CZ 2017
Kurz webové archivace 2017/3
Kurz webové archivace 2017/3Kurz webové archivace 2017/3
Kurz webové archivace 2017/2
Kurz webové archivace 2017/2Kurz webové archivace 2017/2
Mezi snem a realitou. Otevřená data českého webového archivu.
Mezi snem a realitou. Otevřená data českého webového archivu.Mezi snem a realitou. Otevřená data českého webového archivu.
Mezi snem a realitou. Otevřená data českého webového archivu.
Webarchive of National Library of the Czech Republic
 
Webarchiv jako digitální knihovna II.
Webarchiv jako digitální knihovna II.Webarchiv jako digitální knihovna II.
Webarchiv jako digitální knihovna II.
Webarchive of National Library of the Czech Republic
 
Webarchiv jako digitální knihovna
Webarchiv jako digitální knihovnaWebarchiv jako digitální knihovna
Webarchiv jako digitální knihovna
Webarchive of National Library of the Czech Republic
 
Prezentace obsahu webového archivu
Prezentace obsahu webového archivuPrezentace obsahu webového archivu
Prezentace obsahu webového archivu
Webarchive of National Library of the Czech Republic
 
Infrastruktura památníku českého webu a zkušenosti s Heritrixem
Infrastruktura památníku českého webu a zkušenosti s HeritrixemInfrastruktura památníku českého webu a zkušenosti s Heritrixem
Infrastruktura památníku českého webu a zkušenosti s Heritrixem
Webarchive of National Library of the Czech Republic
 

More from Webarchive of National Library of the Czech Republic (20)

Inzerat - datovy analytik / datova analyticka
Inzerat - datovy analytik / datova analyticka Inzerat - datovy analytik / datova analyticka
Inzerat - datovy analytik / datova analyticka
 
Inzerát datovy analytik_wa
Inzerát datovy analytik_waInzerát datovy analytik_wa
Inzerát datovy analytik_wa
 
Sys admin wa_rvv
Sys admin wa_rvvSys admin wa_rvv
Sys admin wa_rvv
 
Volné pracovní místo - kurátor/ka webového archivu
Volné pracovní místo - kurátor/ka webového archivuVolné pracovní místo - kurátor/ka webového archivu
Volné pracovní místo - kurátor/ka webového archivu
 
Webarchiv - Curatorial approaches, topic collections and cooperation with the...
Webarchiv - Curatorial approaches, topic collections and cooperation with the...Webarchiv - Curatorial approaches, topic collections and cooperation with the...
Webarchiv - Curatorial approaches, topic collections and cooperation with the...
 
Volné místo - analytik českého webového archivu
Volné místo - analytik českého webového archivuVolné místo - analytik českého webového archivu
Volné místo - analytik českého webového archivu
 
Webarchiv aneb až po lokty v mrtvolách
Webarchiv aneb až po lokty v mrtvoláchWebarchiv aneb až po lokty v mrtvolách
Webarchiv aneb až po lokty v mrtvolách
 
Kurz webové archivace 2018/2
Kurz webové archivace 2018/2Kurz webové archivace 2018/2
Kurz webové archivace 2018/2
 
Blok expertu
Blok expertuBlok expertu
Blok expertu
 
Kurz webové archivace 2018/1
Kurz webové archivace 2018/1Kurz webové archivace 2018/1
Kurz webové archivace 2018/1
 
Webarchiv
WebarchivWebarchiv
Webarchiv
 
Datovy analytik
Datovy analytikDatovy analytik
Datovy analytik
 
Webarchiv CZ 2017
Webarchiv CZ 2017Webarchiv CZ 2017
Webarchiv CZ 2017
 
Kurz webové archivace 2017/3
Kurz webové archivace 2017/3Kurz webové archivace 2017/3
Kurz webové archivace 2017/3
 
Kurz webové archivace 2017/2
Kurz webové archivace 2017/2Kurz webové archivace 2017/2
Kurz webové archivace 2017/2
 
Mezi snem a realitou. Otevřená data českého webového archivu.
Mezi snem a realitou. Otevřená data českého webového archivu.Mezi snem a realitou. Otevřená data českého webového archivu.
Mezi snem a realitou. Otevřená data českého webového archivu.
 
Webarchiv jako digitální knihovna II.
Webarchiv jako digitální knihovna II.Webarchiv jako digitální knihovna II.
Webarchiv jako digitální knihovna II.
 
Webarchiv jako digitální knihovna
Webarchiv jako digitální knihovnaWebarchiv jako digitální knihovna
Webarchiv jako digitální knihovna
 
Prezentace obsahu webového archivu
Prezentace obsahu webového archivuPrezentace obsahu webového archivu
Prezentace obsahu webového archivu
 
Infrastruktura památníku českého webu a zkušenosti s Heritrixem
Infrastruktura památníku českého webu a zkušenosti s HeritrixemInfrastruktura památníku českého webu a zkušenosti s Heritrixem
Infrastruktura památníku českého webu a zkušenosti s Heritrixem
 

Kurz webové archivace II.

  • 1. Kurz webové archivace - archivace a zdroje Barbora Rudišinová 3. 3. 2016
  • 3. Autorský zákon • archivace povolena tzv. “knihovní licencí” § 37 AZ: „Do práva autorského nezasahuje knihovna, archiv, muzeum, galerie, škola, vysoká škola a jiné nevýdělečné školské a vzdělávací zařízení, a) zhotoví-li rozmnoženinu díla, která neslouží k přímému nebo nepřímému hospodářskému nebo obchodnímu účelu, pro své archivní a konzervační potřeby“
  • 4. Autorský zákon - zpřístupnění • zpřístupnění archivních kopií je ale knihovní licencí limitováno: “zpřístupňuje-li dílo, včetně zhotovení jeho rozmnoženiny nezbytné pro takové zpřístupnění, které je součástí jeho sbírek a jehož užití není předmětem prodejních nebo licenčních podmínek, ... , jednotlivcům ze strany veřejnosti prostřednictvím k tomu určených technických zařízení umístěných v jeho objektech, a to výhradně pro účely výzkumu nebo soukromého studia takových osob, a zamezí-li takovým osobám zhotovit rozmnoženinu díla”
  • 5. Autorský zákon Co z toho vyplývá? • můžeme vytvářet archivní kopie webových stránek • nesmíme je zpřístupňovat mimo terminály v budově NK
  • 6. Řešení • povinný výtisk el. dokumentů - v ČR není (zahraniční, ale liší se, záleží na znění) • spolupráce s vydavateli elektronických zdrojů (ČR, VB atd.) - získání souhlasu se zpřístupněním
  • 7. Archivace v českém Webarchivu 3 typy sklizní: 1.celoplošné sklizně 2.tematické sbírky 3.výběrová sbírka
  • 8. Celoplošné sklizně • cílem je vytvořit obraz “českého webu” v určitém čase • zdrojem je seznam webových adres s národní doménou .cz od CZ.NIC • automatizované sklízení • alespoň 1x ročně • zabírají nejvíce místa • není sklizeno kompletně vše - omezení (5000 dotazů na doménu) • přístupné pouze na terminálech v NK
  • 9. Tematické sbírky • k aktuálním událostem • např. volby, úmrtí Václava Havla, stavba nové budovy NTK • manuální výběr zrojů kurátory • kompletní přístup jen na terminálech v NK
  • 10. Výběrová sbírka • výběrový vzorek webů s určitou hodnotou (historickou, kulturní, vědeckou atd.) • zdroje manuálně vybírány kurátory nebo návrhy z ISSN a od uživatelů (formulář http://webarchiv.cz/cs/pridat- web) a poté hodnoceny • snaha o zpřístupnění online - získání souhlasu s archivací od vydavatele • rozdělení do předmětových kategorií dle metody konspektu
  • 12. Tvorba priorit pro předmětové kategorie
  • 14. Příklad zdroje ve WA Adminu
  • 15. Způsoby souhlasu se zpřístupněním 1.Smlouva • výhradní udělení souhlasu pouze NK • založená na Obč. zákonníku • za obsah webu a aut. práva k němu odpovídá vydavatel 2.Licence Creative Commons • soubor licencí legálně upravující sdílení děl veřejností • možnost nastavit podmínky (vždy nutnost citace, možnost zákazu komerčního využití atd.) • prakticky jen logo licence odkazující na plný text
  • 16. Vyhledávání ve Webarchivu Pomocí vyhledávacího pole: • URL adresa (jakýkoliv platný tvar nkp.cz, www.nkp.cz atd.) • klíčová slova (hledá v názvech a anotacích)
  • 20. Kritéria zdrojů • bohemikální dokument: • v českém jazyce • vydaný na území ČR • vydaný českým autorem • obsahově o ČR nebo Češích • volně přístupné zdroje • převážně nekomerční povaha • unikátnost informací • aktuálnost a (dlouhodobá) informační hodnota • technické hledisko
  • 21. Technické hledisko • preferovány zdroje v běžných formátech • problematická archivace sociálních sítí, externích doplňků a aplikací (např. Google mapy), animace vytvořené programem Flash, vyhledávací pole, rozbalovací (drop-down) nabídky, některé prvky vytvořené v Javascriptu • při podezření na problém - vhodná kontrola na https://archive.org/
  • 23. Kde hledat zdroje? • Google • Wikipedia • stránky zastřešujících institucí a organizací • registry a rejstříky státních nebo jiných subjektů • odkazy na podobných stránkách