The National Library of the Czech Republic has been archiving Czech websites since 2000 through its Webarchiv project. It currently archives over 245 TB of data representing billions of digital objects and over 1.6 million second-level domains under .cz. The archive is accessible at the library and selective harvests are accessible online. It focuses on long-term preservation of Czech web content while addressing legal issues around copyright and access. The department employs 3.5 people and uses software like Heritrix for crawling and Open Wayback for access.
This document discusses web archiving in the Czech Republic. It provides information on who archives the web, how it is archived, and why archiving the web is important. The National Library of the Czech Republic leads web archiving efforts and works with international partners like the International Internet Preservation Consortium to archive over 200 TB of web data using software like Heritrix and OpenWayback. Metadata standards like WARC and CDX are used to describe archived web pages and their relationships over time.
The National Library of the Czech Republic has been archiving Czech websites since 2000 through its Webarchiv project. It currently archives over 245 TB of data representing billions of digital objects and over 1.6 million second-level domains under .cz. The archive is accessible at the library and selective harvests are accessible online. It focuses on long-term preservation of Czech web content while addressing legal issues around copyright and access. The department employs 3.5 people and uses software like Heritrix for crawling and Open Wayback for access.
This document discusses web archiving in the Czech Republic. It provides information on who archives the web, how it is archived, and why archiving the web is important. The National Library of the Czech Republic leads web archiving efforts and works with international partners like the International Internet Preservation Consortium to archive over 200 TB of web data using software like Heritrix and OpenWayback. Metadata standards like WARC and CDX are used to describe archived web pages and their relationships over time.
1. Oznámení o volné pracovní pozici
Národní knihovna České republiky
zastoupená PhDr. Vítem Richterem, generálním ředitelem Národní knihovny České republiky
hledá vhodné uchazeče na obsazení pracovního místa
Systémový/á administrátor/ka webového archivu (Webarchiv.cz) - Referát
výzkumu a vývoje
Požadujeme:
vysokoškolské vzdělání technického směru, započaté studium VŠ nebo praxe v oboru
občan ČR, občan států EU (nebo cizí státní občan s trvalým pobytem v ČR)
znalost operačního systému Linuxu
pokročilá znalost anglického jazyka na úrovni porozumění odbornému textu
schopnost a chuť učit se novým věcem a samostatnost
Výhodou:
znalost skriptování
zkušenost s dalšími technologiemi pro správu systému (Docker, Ansible, atd.)
zkušenost s cloudovými řešeními a souvisejícími technologiemi
Náplň práce:
provoz, recovery a vylepšování nové infrastruktury na frameworku Apache Hadoop s
HDFS, Ambari, HBase a dalšími prvky
administrace, zajištění provozu a kontinuálního vylepšování současného webového
archivu
podílení se na návrhu, vývoji a testování nových řešení pro správu dat webového
archivu
zapojení do výzkumného projektu NAKI II
Nabízíme:
pracovní poměr na 1,0 úvazek v první fázi se smlouvou uzavřenou na 1 rok s
perspektivou prodloužení do 31.12.2022, případně dalšího působení v NK ČR
možnost home office a časová flexibilita
možnost zapojení do dalších aktivit NK ČR
zapojení do významného interdisciplinárního výzkumného projektu
činnosti vyplývající z pracovního úvazku mohou být nosným tématem i pro
vysokoškolskou kvalifikační práci na úrovni Ing. či Ph.D.
2. platové zařazení v platové třídě 12 (dle NV č. 341/2017 Sb. v platném znění) včetně
motivačního ohodnocení
zajímavou práci v dynamickém oboru
pracoviště v Centrálním depozitáři NK ČR v Praze – Hostivaři
široké spektrum benefitů: 5 týdnů dovolené, až 5 dní volna z kolektivní smlouvy,
stravenky, zvýhodněné vstupy do divadel, akcí v Klementinu, AMG karta opravňující k
bezplatným nebo zvýhodněným vstupům do muzeí a galerií
možnost vyzkoušet si práci s nejnovějšími technologiemi a velkými objemy dat
Nástup od 1. 10. 2020 nebo dle dohody.
V případě zájmu zašlete prosím stručný motivační dopis a strukturovaný profesní životopis
na e-mailovou adresu zdenko.vozar@nkp.cz, Do předmětu zprávy uveďte „Systémový/á
administrátor/ka webového archivu RVV“.
Vybraní uchazeči budou pozváni na osobní pohovor.
Zasláním Vašeho životopisu Národní knihovně České republiky dáváte souhlas ke zpracování
Vašich osobních dat a jejich uchování výhradně za účelem zprostředkování zaměstnání po
dobu výběrového řízení, nejdéle však jeden rok od jejich zaslání.