Successfully reported this slideshow.
Uchování a trvalé zpřístupnění webových dokumentů   z kušenosti z  WebArchivu
eBorn dokumenty
Množství  obsahu r oste Registrované domény v zóně .cz
Internet Archive (IA) <ul><li>americká nezisková organizace </li></ul><ul><li>vznik 1996 - průkopnický projekt  </li></ul>...
Záloha dat IA <ul><li>data Internet Archive mají od roku 2002 zrcadlo v rámci Bibliotheca Alexandrina  </li></ul>
International Internet Preservation Consortium  <ul><li>vznik 2003 – 12 zakládajících členů:  </li></ul><ul><ul><li>Národn...
International Internet Preservation Consortium <ul><li>v roce 2007 - rozšíření o nové členy </li></ul><ul><li>celkový poče...
Český projekt <ul><li>řešený od roku 2000 Národní knihovnou  ČR </li></ul><ul><li>spolupráce s: </li></ul><ul><ul><li>Mora...
Typy sklizní <ul><li>celoplošné sklizně (tzv. harvesting) – delší interval  </li></ul><ul><ul><li>např. v oblasti národní ...
Průběh sklizní NEDLIB harvester Heritrix Number of files
Kritéria pro sklízení <ul><li>profil každé sklizně je dán definicí kriterií </li></ul>
Kritéria pro sklízení - celoplošné sklizně <ul><li>technické aspekty – nastavení software </li></ul><ul><li>snaha zachytit...
Kritéria pro sklízení - výběrové sklizně <ul><li>hodnocení člověka – kritéria výběru </li></ul><ul><li>snaha zachytit hodn...
Technické řešení <ul><li>získání </li></ul><ul><li>trvalé uložení </li></ul><ul><li>zpřístupnění  </li></ul>
Zpřístupnění - legislativa <ul><li>zpřístupnění – legislativní omezení – autorský zákon </li></ul><ul><ul><li>WebArchiv je...
Creative Commons (CC) <ul><li>licence je novým pojetím autorských práv – nová formulace: </li></ul><ul><ul><li>„ všechna p...
Creative Commons (CC) <ul><li>možná cesta pro řešení problematiky archivace webu </li></ul><ul><li>více zainteresovaných s...
Knihovnicko-administrační činnosti  <ul><li>výběr </li></ul><ul><ul><li>výběrové sklizně </li></ul></ul><ul><ul><li>temati...
Management <ul><li>financování – zdroje: </li></ul><ul><ul><li>z vlastní instituce </li></ul></ul><ul><ul><li>grantové </l...
Národní digitální knihovna  <ul><li>archiv webu má své místo ve sbírkách národních knihoven </li></ul><ul><ul><li>budování...
 
Děkuji za pozornost <ul><li>Tomáš Síbek </li></ul><ul><li>Národní knihovna ČR – WebArchiv </li></ul><ul><li>http://www.web...
Upcoming SlideShare
Loading in …5
×

Uchování a trvalé zpřístupnění webových dokumentů

1,125 views

Published on

Příspěvek na konferenci Digitálna knižnica (1.-3.10.2007, Slovensko).

Published in: Technology, Business
  • Be the first to comment

  • Be the first to like this

Uchování a trvalé zpřístupnění webových dokumentů

  1. 1. Uchování a trvalé zpřístupnění webových dokumentů z kušenosti z WebArchivu
  2. 2. eBorn dokumenty
  3. 3. Množství obsahu r oste Registrované domény v zóně .cz
  4. 4. Internet Archive (IA) <ul><li>americká nezisková organizace </li></ul><ul><li>vznik 1996 - průkopnický projekt </li></ul><ul><li>podporováno : </li></ul><ul><ul><li>Library of Congress </li></ul></ul><ul><ul><li>Smithsonian (muzejní organizace) </li></ul></ul><ul><li>archiv mezinárodního rozsahu </li></ul><ul><li>tvorba open source software nástrojů: </li></ul><ul><ul><li>Heritrix (sklízení webu) </li></ul></ul><ul><ul><li>Wayback Machine (zpřístupnění) </li></ul></ul>www.archive.org
  5. 5. Záloha dat IA <ul><li>data Internet Archive mají od roku 2002 zrcadlo v rámci Bibliotheca Alexandrina </li></ul>
  6. 6. International Internet Preservation Consortium <ul><li>vznik 2003 – 12 zakládajících členů: </li></ul><ul><ul><li>Národní knihovny - Austrálie, Kanady, Dánska, Finska, Francie, Islandu, Itálie, Norska, Švédska, Britská knihovna, americká Kongresová knihovna a Internet Archive </li></ul></ul><ul><li>koordinace tvorby nových software nástrojů </li></ul><ul><li>sjednocení pojetí - tvorba standardů </li></ul><ul><li>pracovní skupiny - přístup, sklízení, ochrana, standardy </li></ul>
  7. 7. International Internet Preservation Consortium <ul><li>v roce 2007 - rozšíření o nové členy </li></ul><ul><li>celkový počet členů vzrůstá na 27 </li></ul><ul><li>přijata i Národní knihovna ČR se svým projektem WebArchiv </li></ul><ul><li>probíhá další kolo přijímacího procesu </li></ul>
  8. 8. Český projekt <ul><li>řešený od roku 2000 Národní knihovnou ČR </li></ul><ul><li>spolupráce s: </li></ul><ul><ul><li>Moravskou zemskou knihovnou </li></ul></ul><ul><ul><li>Ústavem výpočetní techniky Masarykovy univerzity </li></ul></ul>
  9. 9. Typy sklizní <ul><li>celoplošné sklizně (tzv. harvesting) – delší interval </li></ul><ul><ul><li>např. v oblasti národní domény </li></ul></ul><ul><li>výběrové sklizně – kratší interval </li></ul><ul><ul><li>výběr hodnotných webových stránek s častými aktualizacemi </li></ul></ul><ul><ul><li>spolupráce se střediskem ISSN </li></ul></ul><ul><li>tematické sklizně </li></ul><ul><ul><li>výběry materiálů k významným údálostem nebo specifickému tématu </li></ul></ul><ul><ul><li>WebArchiv: Praha olympijská (2007); Nová budova Národní knihovny (2007); Volby (2006); Vysočina (2005); Dalimilova kronika (2005); Povodně (2002) </li></ul></ul>
  10. 10. Průběh sklizní NEDLIB harvester Heritrix Number of files
  11. 11. Kritéria pro sklízení <ul><li>profil každé sklizně je dán definicí kriterií </li></ul>
  12. 12. Kritéria pro sklízení - celoplošné sklizně <ul><li>technické aspekty – nastavení software </li></ul><ul><li>snaha zachytit národní tvorbu na internetu v kompletu </li></ul><ul><li>hlavním kritériem je národní doména </li></ul><ul><li>dalšími kritérii jsou: </li></ul><ul><ul><li>formát, přístup, protokol, velikost souboru, počet souborů z 1 domény (2. úrovně – např. nkp.cz) </li></ul></ul><ul><li>řada národních dokumentů na webu je i na jiných doménách </li></ul><ul><li>pracuje se na software pro rozpoznání jazyka </li></ul><ul><ul><li>sklizeň by se potom nemusela omezovat jen národní doménou </li></ul></ul>
  13. 13. Kritéria pro sklízení - výběrové sklizně <ul><li>hodnocení člověka – kritéria výběru </li></ul><ul><li>snaha zachytit hodnotné často aktualizované národní weby </li></ul><ul><li>kritérii jsou: </li></ul><ul><ul><li>doména, národní aspekty, obsah, přístup, formáty, původní forma, typ </li></ul></ul>
  14. 14. Technické řešení <ul><li>získání </li></ul><ul><li>trvalé uložení </li></ul><ul><li>zpřístupnění </li></ul>
  15. 15. Zpřístupnění - legislativa <ul><li>zpřístupnění – legislativní omezení – autorský zákon </li></ul><ul><ul><li>WebArchiv je dostupný pouze na terminálu v Národní knihovně </li></ul></ul><ul><ul><li>nutnost zamezit kopírování </li></ul></ul><ul><li>zdroje ve výběrových sklizních </li></ul><ul><ul><li>snaha zajistit neomezenou online dostupnost přes internet </li></ul></ul><ul><ul><li>smlouva o poskytování elektronických online zdrojů </li></ul></ul><ul><li>nutnost změnit legislativu </li></ul><ul><ul><li>tvorba návrhu zákona týkajícího se uložení elektronických publikací </li></ul></ul><ul><ul><li>zakotvení licence Creative Commons do české legislativy </li></ul></ul>
  16. 16. Creative Commons (CC) <ul><li>licence je novým pojetím autorských práv – nová formulace: </li></ul><ul><ul><li>„ všechna práva vyhrazena“ nahrazuje „některá práva vyhrazena“ </li></ul></ul><ul><li>CC znamená: </li></ul><ul><ul><li>volné užití díla bez nároku na finanční náhradu </li></ul></ul><ul><ul><li>stanoveny podmínky (např. pouze pro nekomerční účely) </li></ul></ul><ul><ul><li>při užití platí povinnost citovat původního autora </li></ul></ul><ul><li>CC umožňuje archivovat a online zpřístupňovat web </li></ul><ul><li>namísto uzavírání smluv autor aplikuje licenci </li></ul>
  17. 17. Creative Commons (CC) <ul><li>možná cesta pro řešení problematiky archivace webu </li></ul><ul><li>více zainteresovaných stran – řešení pro publikování na webu </li></ul><ul><li>Pracujeme a chystáme: </li></ul><ul><ul><li>právní analýzu – vztah české legislativy k CC </li></ul></ul><ul><ul><li>překlad licence do češtiny </li></ul></ul><ul><ul><li>propagaci </li></ul></ul><ul><li>http://creativecommons.org </li></ul>
  18. 18. Knihovnicko-administrační činnosti <ul><li>výběr </li></ul><ul><ul><li>výběrové sklizně </li></ul></ul><ul><ul><li>tematické sklizně </li></ul></ul><ul><li>uzavírání smluv </li></ul><ul><li>katalogizace (katalog NK ČR, ČNB) </li></ul><ul><li>metadata – ve formátu Dublin Core </li></ul>
  19. 19. Management <ul><li>financování – zdroje: </li></ul><ul><ul><li>z vlastní instituce </li></ul></ul><ul><ul><li>grantové </li></ul></ul><ul><li>spolupráce mezi institucemi: </li></ul><ul><ul><li>domácí </li></ul></ul><ul><ul><li>mezinárodní </li></ul></ul><ul><li>propagace: </li></ul><ul><ul><li>letáky, brožury </li></ul></ul><ul><ul><li>webová stránka, bannery </li></ul></ul><ul><ul><li>příspěvky na konferencích </li></ul></ul>
  20. 20. Národní digitální knihovna <ul><li>archiv webu má své místo ve sbírkách národních knihoven </li></ul><ul><ul><li>budování digitálních sbírek </li></ul></ul><ul><ul><li>digitalizační projekty </li></ul></ul><ul><li>snaha zpřístupnit digitální sbírky z jednoho rozhraní </li></ul><ul><ul><li>Manuscriptorium (rukopisy a staré tisky) </li></ul></ul><ul><ul><li>Kramerius (novodobé tisky – hlavně periodika, ale i monografie) </li></ul></ul><ul><ul><li>WebArchiv </li></ul></ul>www.ndk.cz
  21. 22. Děkuji za pozornost <ul><li>Tomáš Síbek </li></ul><ul><li>Národní knihovna ČR – WebArchiv </li></ul><ul><li>http://www.webarchiv.cz </li></ul><ul><li>[email_address] </li></ul>

×