SlideShare a Scribd company logo
Zákulisí a specifika tvorby databáze Národních
věcných autorit
Marie.Balikova@nkp.cz
Národní knihovna ČR a otevřená data
Zpřístupnění databází NKČR pod veřejnou licencí CC0
• databáze Česká národní bibliografie (ČNB) ve formátu MARC 21, Dublin Core
• Databáze národních autorit NK ČR (AUT) ve formátu MARC 21
• Centrální adresář knihoven a informačních institucí v ČR (ADR)
Umožňuje nejširší možné užití databází pro nekomerční i komerční účely bez nutnosti uvedení
autorství
Hromadné stahování/sklízení dat ve strukturovaném formátu se děje pomocí protokolu OAI-PMH
U báze NKC i AUT je k dispozici celý i dílčí set obsahující data změněná v určitém období, nelze
stahovat jednotlivé záznamy
Databáze Národních autorit NK ČR obsahuje přes 1.138.000 autoritních záznamů
• personálních jmen, organizací, akcí, unifikovaných názvů
• věcných termínů, geografických termínů, chronologických údajů, formálních termínů,
skupin Konspektu
Otevřená data — Národní knihovna České republiky (nkp.cz)
Propojená data (Linked data)
Linked Data využívají Webu k propojení dat pocházejících z různých zdrojů.
Linked Data jsou data publikovaná na Webu ve strojově čitelné podobě, odkazují na externí zdroje
dat a umožňují, aby na ně odkazovaly další data.
Od klasického hypertextového Webu propojeného odkazy se Linked Data liší použitím
jazyka RDF pro ukládání dat s popisem jejich sémantického významu.
Linked data – WikiKnihovna
Základní pravidla pro publikování a propojování dat užitím webové infrastruktury
• použití URI (Uniform Resource Identifier – „jednotný identifikátor zdroje“) pro pojmenování entit
• použití HTTP URI, aby bylo možné tyto pojmy vyhledávat
• poskytovat užitečné informace při vyhledávání prostřednictvím URI použitím standardů (RDF,
SPARQL)
• zahrnout odkazy na další URI pro vyhledávání ostatních entit (Tim Berners-Lee, 2006 )
M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 3
Plány komunity Wikidat
Významná spolupráce se společností Wikimedia Česká republika, cílem jejíž činnosti je podpořit
kvalitu, využitelnost a užitečnost dat v otevřeném prostoru
• ve Wikidatech
• v Národních autoritách - obohacení národních autorit o potřebné informace
• zkvalitnění údajů na Wikipedii
Podpora Sémantického webu (strukturovaného, strojům srozumitelného webu).
Plány do budoucna (leden 2020)
„Mohli bychom také pracovat s věcnými autoritami (např. geografické záznamy), které v bázi
národních autorit také figurují. Čeká nás také rozhodnutí, zda záznamy, které Národní knihovna
má, ale Wikidata ne, začít do Wikidat nějakým způsobem importovat. A konečně, když už tento
import bude hotov, budeme řešit, jak ho do budoucna zautomatizovat, aby se nově přidávané
záznamy v bázi národních autorit objevily co nejdříve i ve Wikidatech“.
773 571 osob pod licencí CC-0: databázi jmenných autorit Národní knihovny jsme propojili s Wikidaty | Wikimedia ČR - blog
M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 4
Báze národních autorit
M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 5
Báze národních autorit
Podle typů entit rozlišujeme
Databázi jmenných autorit, která zahrnuje autority
• personální
• korporativní
• názvové
Správu souborů personálních a korporativních autorit zajišťuje oddělení ONJA
Na správě souboru názvových autorit se podílejí oddělení
• jmenného zpracování
• ONVAZ
• zpracování speciálních dokumentů
• hudební
M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 6
Báze národních autorit – pokrač.
Podle typů entit dále rozlišujeme
Databázi věcných autorit, která zahrnuje autority
• tematické
• geografické
• formální
• chronologické
• autoritní soubor obsahující Konspektové schéma
Správa věcných autorit uvedených typů je v kompetenci oddělení ONVAZ
M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 7
Proč autority vytváříme
Unifikace a standardizace selekčních prvků (přístupových prvků)
Propojení bibliografické a autoritní báze
Informace obsažené v autoritním záznamu umožňují:
• vyhledat danou entitu a s ní související informační zdroje;
• určit/potvrdit, že popisovaná entita odpovídá entitě zamýšlené, nebo rozlišit mezi dvěma
nebo více entitami s podobnými názvy (jmény);
• objasnit vztah mezi dvěma nebo více entitami, nebo objasnit vztah mezi popisovanou
entitou a jménem, pod nímž je entita známa;
• porozumět, proč určitá forma jména nebo názvu byla zvolena jako preferovaná forma
(Drobíková, 2011)
M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 8
Struktura autoritního záznamu
autoritní záznam (autorita)
• ucelený soubor údajů o určité entitě/třídě entit, kterou může být osoba, organizace,
akce/událost, dílo, místo, téma
• ucelený soubor informací o termínu používaném k označení formy nebo žánru
• preferovaná forma jména/označení dané entity
• variantní formy jména/označení dané entity
• vyjádření atributů/vlastností dané entity
• vyjádření vazeb (vztahů), které lze a je účelné mezi danou entitou a souvisejícími entitami
definovat a vyjádřit
• kódované informace
• poznámky, definice (u tematických a formálních autorit)
• informace o zdrojích ověření
• další informace – propojení na externí zdroje – obohacení údajů
M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 9
Doporučení, konceptuální modely, pravidla, formáty
M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 10
Mezinárodní principy katalogizace
M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 11
M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 12
Standardy, pravidla, formáty
Jmenné entity – osoby, korporace, akce – čerpají se ze souboru Národních jmenných autorit,
řídí se pravidly RDA
• RDA
• Soubory národních jmenných autorit
Věcné entity – obecné téma, geografické názvy, chronologické údaje, označení formy/žánru,
notace MDT, údaje Konspektu – čerpají se ze souboru Národních věcných autorit (CZENAS), řídí se
pravidly pro tvorbu jednotlivých typů selekčních prvků
CZENAS – standard pro věcné selekční údaje
Soubor tematických autorit
Soubor geografických autorit
Soubor formálních deskriptorů
Konspektové schéma
MDT České MDT Online
Formáty pro zápis údajů
MARC 21 MARC 21 aut
13
M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022
Formát MARC 21 AUT z pohledu věcných údajů
Nedostatečná strukturovanost (granularita) údajů
Doplňky, které jsou potřebné k rozlišení dvou nebo více entit, se uvádějí za označením entity ve
vstupním prvku v závorce
Rozdíl od personálních autorit, kde se uvádějí v podpoli c
Příklady názvových autorit
Aladdin (film : 1992)
Kingdom Come: Deliverance (videohra)
Příklady geografických autorit
Národní geopark GeoLoci (Česko)
Horní Palava (Blansko, Česko : ulice)
Loučky (Odry, Česko)
M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 14
Zápis doplňku jako součást preferované autoritní
formy GEO autority
M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 15
141294625 (viaf.org)
https://aleph.nkp.cz/F/?func=direct&doc_number=000134014&local_base=AUT
Formát MARC 21 z pohledu věcných údajů – pokrač.
Nedostatečná strukturovanost (granularita) údajů
Doplňky, které jsou potřebné k rozlišení dvou nebo více entit, se uvádějí za označením entity ve
vstupním prvku v závorce
Příklady tematických autorit
morfologie (biologie) morfologie (lingvistika)
bitva o Atlantu (1864 : Atlanta, Georgia)
Příklady formálních autorit
aranžmá (hudba)
thrillery (filmy)
M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 16
Zařazení entit do různých souborů autorit
Stejný druh entity „událost“ se řadí do různých autoritních souborů:
Akce (konference, semináře, workshopy) se považují za korporace a řadí se do souboru
korporativních autorit
• bitvy, války se řadí do tematických autorit
• pojmenované domy se řadí do korporativních autorit
• nepojmenované domy do tematických autorit
Řešení
nově koncipované datové modely, např.
BIBFRAME
Schema.org
M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 17
Ukázky rozdílného zařazení entit téhož typu
M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 18
Aktualizace formátu MARC 21
155 - Heading-Genre/Form Term October 1999
Prior to the definition of the X55 fields, X50 (Topical Terms) fields were used for genre/form headings
Field 034 - Coded Cartographic Mathematical Data [NEW, 2006]
Field 046 - Special Coded Dates [NEW, 2009]
Field 080 - Universal Decimal Classification Number [NEW, 2009]
Field 147 - Heading-Named Event [NEW, 2016]
Field 368 - Other Corporate Body Attributes [NEW, 2011]
Field 368 - Other Attributes of Person or Corporate Body [RENAMED, 2011]
Field 370 - Associated Place [NEW, 2009]
Field 371 - Address [NEW, 2009]
Field 372 - Field of Activity [NEW, 2009]
M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 19
Aktualizace formátu MARC 21
Field 373 - Affiliation [NEW, 2009] Field 373 - Associated Group [RENAMED, 2011]
Field 374 - Occupation [NEW, 2009]
Field 375 - Gender [NEW, 2009]
Field 376 - Family Information [NEW, 2009]
Field 377 - Associated Language [NEW, 2009]
Field 378 - Fuller Form of Personal Name [NEW, 2011]
Field 380 - Form of Work [NEW, 2010]
Field 381 - Other Distinguishing Characteristics of Work or Expression [NEW, 2010]
Field 382 - Medium of Performance [NEW, 2010]
Field 677 - Definition [NEW, 2016]
M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 20
Věcné autority
M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 21
Historie databáze věcných autorit
Dvě samostatné báze
databáze jmenných autorit (AUJ) (vznik 1998-1999)
• Personální autority
• Korporativní autority (2001)
databáze věcných autorit (AUV) (vznik 2000)
• Tematické
• Geografické
• Formální
Sloučení do jedné báze (AUT) (2002)
Důvody oddělených bází
Počty záznamů určených ke zpracování, komplexnost struktury věcných autorit
Technické
Verze systému Aleph (AL300) - omezená funkčnost AUT báze, pouze pro vyhledávání, „stahování“ údajů při
katalogizaci pouze pomocí speciálního programu
Verze systému Aleph (AL500) – regulérní plně funkční AUT báze propojená s BIB bází, integrace i
odkazového aparátu do BIB rejstříku
M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 22
Jmenné a věcné autority
Markantní rozdíl: počet autoritních záznamů
rok 2021
• počet geografických autorit je limitován počtem lokalit, které jsou potřeba ke zpřístupnění informačních zdrojů
• počet tematických a formálních autorit je limitován slovní zásobou národního jazyka a terminologickými
soustavami jednotlivých oborů
• počet tematických autorit může být dokonce i snížen, protože dochází ke změně
• obecně platných katalogizačních pravidel, a/nebo
• koncepce věcné katalogizace v daném oboru.
Např. v roce 2021 bylo zrušeno 1215 tzv. "malých autorit„ typu „koncerty (marimba, hoboj, smyčcový orchestr)“,
což vedlo k celkovému snížení počtu tematických o zhruba 800 záznamů;
Nástrojové obsazení se nyní uvádí v poli 382, je tedy nadbytečné, aby se informace o nástrojovém obsazení
uváděly nadále i v polích 650 a byly sporadicky řízeny autoritními záznamy v poli 150.
M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 23
24
M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022
Soubor autorit
Soubor ověřených a
unifikovaných
jmenných a/nebo
věcných selekčních
údajů, určených pro
zpracování a
vyhledávání
dokumentů s
nezbytným odkazovým
a poznámkovým
aparátem.
Informace v AUT záznamu
Podle původní představy měly záznamy národních autorit obsahovat pouze nezbytné informace
pro zajištění jednoznačnosti preferované formy jména/označení
• preferovaná forma jména
• variantní formy jména
• zdroj ověření informací
Dále trvá u názvových autorit pro entitu vyjádření – překlady děl
potřebné informace (propojení na externí zdroje) se uvádějí v základním autoritním záznamu pro
dílo
M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 25
Informace v AUT záznamu
V současnosti – podstatné rozšíření uváděných informací
• vyjadřují se všechny potřebné atributy a vazby, do kterých entity vstupují, včetně
potřebných poznámek - zásadní podmínka pro propojování informací v prostředí
sémantického webu
Věcné autority obsahují navíc
• explicitní vyjádření významových vztahů pomocí nadřazených, podřazených a asociovaných
pojmů
• asociované pojmy se dříve uváděly jenom v nejnutnějších případech
• ekvivalentní notaci klasifikačního systému MDT
• údaj skupiny Konspektu
specifikace požadavků spolupracujících knihoven
M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 26
Tematické autority
M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 27
Typy tematických autorit
Tematická autorita je druh věcné autority vyjadřující obecné pojmy; slouží k reprezentaci
předmětu/tématu informačního zdroje (o čem dokument je)
• abstraktní entity (vlast, štěstí, radost),
• vědní a umělecké obory (matematika, malířství),
• výrobky
• reálné objekty (skalní hrady, dřevěné mosty, nepojmenované domy, poldry, požární
technika),
• pomníky (včetně individuálních)
• specifické entity označující události a akce, které nejsou součástí korporativních autorit
• války, bitvy, události
• válka v Perském zálivu (1991)
• svíčková demonstrace (1988 : Bratislava, Slovensko)
• masakr ve Srebrenici (1995 : Srebrenica, Bosna a Hercegovina)
M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 28
Kde se tematické autority používají
Jmenné autority
rozlišující doplněk jména/označení jako součást záhlaví (v singuláru v podpoli c) – označuje u
reálných osob povolání; u posvátných, legendárních, fiktivních postav označuje typ
doplňující informace vyjadřující atributy jmenných autorit
• jiné související informace o osobě nebo korporaci (pole 368), např. výraz vyjadřující
• označení osoby, např. světci, fiktivní postavy…,
• typ korporace, např. hudební skupiny, knihovny
• oblast působnosti osoby, korporace (pole 372), např. výtvarné umění, orientalistika
• povolání osoby (pole 374), např. hudební skladatelé…
• forma u názvových autorit (pole 380) videohry, filmy
• jiné související informace týkající se díla, např. všeobecnosti a zajímavosti, věda, technika
Periskop (rozhlasový pořad)
M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 29
Kde se tematické autority používají – pokrač.
Věcné autority
rozlišující doplněk u nejednoznačných označení entit
• Tematické autority
Pascal (jednotka), Pascal (programovací jazyk),
ontologie (filozofie), ontologie (informatika)
Geografické autority
• U Zvonu (Plzeň, Česko : ulice), Kamenný hřib (Česko : přírodní památka);
doplňující informace vyjadřující atributy věcných autorit
BIB báze
vstupní prvek (samostatný výraz) předmětového selekčního jazyka, např. knihovníci -- Česko
tematické zpřesnění (tematické podheslo), např. Česko -- dějiny
M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 30
https://aleph.nkp.cz/F/?func=direct&doc_number=001093088&local_base=AUT
advance health care directive - Wikidata
Standardní formát Formát Marc 21 AUT
Struktura tematické autority
M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 31
Příklady „specifických“ entit - tematických autorit
M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 32
Tematické autority
Preferovaná forma i variantní formy označení musí být jednoznačné;
je nutné vyřešit otázku
synonymie – uvedením všech dostupných variantních forem
homonymie,polysémie - různé významy homonym se důsledně rozlišují
• specifikací termínu, např. operace:
binární operace, bankovní operace, bojové operace, operace srdce
• uvedením kvalifikátoru (relátoru) v závorce, který je součástí deskriptoru, např.
morfologie -morfologie (biologie) ; morfologie (lingvistika)
Explicitní vyjádření významových vztahů mezi pojmy téhož sémantického okruhu
• nadřazenost
• podřazenost
• asociace
M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 33
Tvar lexikálních jednotek
• substantivní tvar
• jednoslovné substantivum
• víceslovná lexikální jednotka, jejíž základ tvoří substantivum
• adjektivní spojení
• předložková vazba
• komplexní termín
Příklady
• epitafy
• polovojenské organizace
• památkově chráněná území
• ochrana osobních údajů
• manželky významných mužů
• padělání a pozměňování veřejné listiny
• agrese (mezinárodní právo)
• rodiče a děti
• ženy v politice
• malíři a řezbáři- nelzepovažovatza obecně platný komplexní termín, řeší pouze problém zpřístupnění
konkrétního dokumentu
• osobnosti Broumovska – situační termín
• trvalá budoucí udržitelnost muzeí – není termín
34
M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022
Tvar lexikálních jednotek
• dodržuje se přirozený slovosled
• dodržuje se pravopisná norma
• transliterace se řídí platnými normami
• singulár a plurál
• počitatelná v plurálu, např. prezidenti, knihy, řeky….
• abstrakta, počitatelná použitá jako abstrakta, názvy vědních oborů v singuláru, např. láska,
průmysl, fyzika, malířství…
• cizojazyčné termíny se uvádějí
• neexistuje-li adekvátní překlad, např. benchmarking
• je-li termín běžně používán v daném vědním oboru, např. paleobotanika…
• zkratky
• preference rozepsané formy
• zkratka se odkáže – odborné zkratky jsou nejednoznačné a pro laického uživatele nesrozumitelné
• všeobecně známé zkratky (jednoznačné) se používají, např. AIDS
M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 35
Funkce MDT v AUT záznamech
určení dominantního oboru
posouzení jednoznačnosti a systémovosti
termínů
tvorba hierarchické struktury univerzálního
souboru
tvorba vícejazyčného nástroje
součást struktury Konspektové schématu (2.
úroveň)
nástroj minimální úrovně katalogizace –
minimální záznam
M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 36
Údaj skupiny Konspektu v autoritním záznamu
Slouží jako
• standard pro popis a zpřístupnění
informačních zdrojů na úrovni
předmětových kategorií s subkategorií
• nástroj pro tvorbu předmětově
orientovaných informačních systémů v
národním i mezinárodním prostředí
• nástrojpro konverzi lokálních klasifikačních
systémů do univerzálních
• nástroj minimální úrovně katalogizace –
minimální záznam
• Pro tvorbu fasety “obor” v portálu
knihovny.cz – zpřesnění výsledků dotazu
Tematická mapa fondů
Tematické autority online
www.knihovny.cz
M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 37
Použijeme nabízený předvýběr v
Národních zdrojích a zvolíme Zobrazit
všechny
Získáme 51 dokumentů, omezíme z
nabídky filtrů fasetu „obor“ Literatura
pro děti a mládež
Získáme 6 dokumentů určených dětem a
mládeži
M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 38
Cílová komunita: nakladatelé
Preferují jednoduchá kritéria vyhledávání
M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 39
Cílová komunita: katalogizátoři, indexátoři
Informace o autoritních termínech
souvisejících s danou skupinou Konspektu a
propojených bibliografických záznamech
M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 40
Aktualizace a úprava údajů v souboru tematických autorit
Centrální správa souboru tematických autorit
Aktualizace probíhá průběžně
• připojování nových autorit v souvislosti s věcnou katalogizací informačních zdrojů
• je podmíněna
• aktualizací terminologických soustav jednotlivých oborů
• potřebami jednotlivých útvarů NK ČR – doplňování termínů označujících kategorii osob
včetně ženských variant pro tvorbu personálních autorit
• potřebami kooperujících institucí
• potřebami řešitelských týmů jednotlivých projektů – projekt TEMAP, INTERPI
M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 41
Aktualizace a úprava v záznamech tematických autorit
Připojení invertovaných tvarů
víceslovných termínů formou odkazů
„viz“ s cílem usnadnit
• orientaci a vstup uživatele do
autoritního souboru
• předpoklad harmonizace/mapování
řízených slovníků (projekt INTERPI,
2014)
M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 42
Tematické autority a propojená data (Wikidata)
Propojení předpokládá intelektuální posouzení (ruční mapování) propojených autoritních termínů
a položek Wikidat
Rozdíly
• plurál (autoritních termínů) versus singulár (většina externích zdrojů, např. Wikipedie,
Wikidata)
• komplexní termíny – „rodiče a děti“
• jednoznačnost autoritního termínu není vždy explicitně vyjádřena, někdy je význam
termínu objasněn pomocí notace klasifikačních znaků MDT
• v tematických autoritách nejsou prozatím vždy uvedeny potřebné informace v dostatečné
míře, u komplikovaných termínů nejsou uvedeny definice
• většinou obsahují preferovanou a odkazované formy, notaci MDT, skupinu Konspektu a
anglický ekvivalent
M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 43
Komplexní termín „rodiče a děti“
M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 44
Pojem vyjadřuje vztah
Používá se v plurálu
Frekventovaný termín
Termín „rodiče a děti“
LC Authorities
RAMEAU
M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 45
Termín „rodiče a děti“
Wikidata +
M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 46
Význam termínu objasněn pomocí notací MDT
M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 47
Výhody tematických autorit
Univerzální soubor - jsou v něm zahrnuty termíny ze všech oborů lidského poznání
obsahuje
• aktuální terminologii; vytváří se induktivní metodou, s dokumentem v ruce
• víceslovné deskriptory – zajištěna potřebná míra specifičnosti termínů
Termín/pojem prochází intelektuálním posouzením, ověřen v odborné literatuře a referenčních
zdrojích
Autoritní termíny jsou opatřeny anglickými ekvivalenty, což usnadní propojení na položku Wikidat
M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 48
Soubor geografických autorit
M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 49
Soubor geografických autorit
Geografická autorita
druh jmenné autority obsahující vlastní geografické jméno (jména obcí, měst, regionů, států,
geomorfologických útvarů, přírodních vodních toků), případně geografický název označující specifické
entity (trasy cyklistické, dopravní, turistické, naučné stezky, umělá vodní díla, přírodní rezervace,
chráněné krajinné oblasti.
Kde se používá
Jmenné autority
• vstupní prvek v korporativním záhlaví začínajícím jurisdikcí- Karlovy Vary (Česko). Magistrát
• kvalifikátor v korporativním záhlaví – Základní škola (Blovice, Česko)
• vyjádření atributu jmenných autorit (personálních, korporativních, názvových) – místo narození,
úmrtí, sídlo korporace, místo vzniku díla- Teplický kancionál; místo původu: Praha, Česko
M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 50
Soubor geografických autorit – pokrač.
Věcné autority
• kvalifikátor u geografických autorit – název státu, okresního města
• kvalifikátor u specifických tematických autorit(války, bitvy, události) –
bitva na Piavě (1918 : Piava, Itálie : řeka)
Bibliografická báze
• vstupní prvek (samostatný výraz) předmětového selekčního jazyka - Znojmo (Česko) -- dějiny
• geografické zpřesnění (geografické podheslo – název státu, oblasti) - intelektuální život -- Ukrajina
• velmi důležitý prvek při tvorbě platformy pro Sémantický Web – propojených otevřených dat
M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 51
Struktura geografické autority
preferovaná forma
variantní formy jména
vazba na nadřazený pojem
anglická forma jména
rozšíření údajů
kód GEO oblasti,
notace MDT – komunita
knihovníků
propojení na externí zdroje
pole GPS
kartografické souřadnice
link do mapy
hierarchické třídění – přidělení
kódu databáze SOVAMM –
doplnění údajů
status záznamu: Správní celek
M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 52
M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 53
M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 54
Obohacení geografických autorit – propojení s databází SOVAMM
Obohacení geografických autorit – propojení s databází CZ_RETRO
SOVAMM
V souboru geografických
autorit bylo v roce 2014
dořešeno propojení této
databáze s Databází
sídelních lokalit Čech,
Moravy a Slezska CZ_RETRO
pomocí pole 052, kde se
uvádí kód CZ_RETRO.
M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 55
Geografické autority jako propojená data
Do zveřejnění zprávy o uvolnění databáze národních autorit pod veřejnou licencí CC0 platilo
• „Geografické autority nebyly v původní náplni projektu, který byl realizován ve spolupráci s Národní
knihovnou v roce 2019, a tak zatím formálně nejsou uvolněny pod licencí CC-0. Jak však poznamenal Radek
Světlík ze Studijní a vědecké knihovny Plzeňského kraje, pro knihovnická propojená data jsou geografické
autority ještě důležitější než ty personální, které se věnují lidem. Proto jsme se podívali na zoubek i
geografickým autoritám a pro začátek je alespoň propojili s patřičnými záznamy ve Wikidatech.“
• Geografické autority jsou tedy nyní propojeny s položkami ve Wikidatech a nyní také uvolněny, protože
„Naštěstí jsou v mnoha případech geolokalizovány – obsahují informace o své geografické poloze na mapě
světa“.
• „Tato data nám laskavě z databáze vyexportovala Helena Dvořáková z Národní knihovny a účastnice
nedávného Biblio workshopu. Díky nástroji OpenRefine, který podporuje propojování s položkami na
Wikidatech podle jejich geografické blízkosti, jsme tak měli poměrně snadnou práci. Stačilo totiž hledat jen
mezi objekty, které jsou blízko daného záznamu. Tam, kde souřadnice k dispozici nebyly, jsme se museli
spolehnout na (pečlivě kontrolované) párování podle názvu a typu objektu“.
• „Geografické autority pokrývají široké spektrum různých témat – od států přes regiony, řeky, chráněná území
až po města či vesnice. Výsledkem je umístění téměř všech geografických autorit (s výjimkou tzv. „oblastí“ a
několika dalších typů objektů) na mapu světa, kde si je můžeme procházet“
• Půl roku po otevření báze autorit: knihovnická data ožívají ve Wikidatech | Wikimedia ČR - blog
Jsme velmi rádi, že náš projekt „Geolink“, který byl realizován v kooperaci s R. Záhoříkem v rámci projektu
Jednotné Informační Brány (JIB), byl takto vynikajícím způsobem uplatněn.
M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 56
Obohacení geografických autorit pomocí dat z Wikidat
Přínos
• odstranění nekonzistence
• duplicity
• překlepy, pravopisné chyby
• obohacení o vybrané identifikátory
• identifikátor Wikidat
• identifikátor Viaf, Geonames ??? Další ??? – nutná rešerše
• způsob
• dynamické načítání identifikátorů z Wikidat
• statické uložení v autoritním záznamu – rešerše nutná
M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 57
ZÁVĚR
Tvorba a údržba souborů autorit všech typů (součást autoritní kontroly) je pracná, systémově i
finančně náročná, ale přínosná;
Nikdy nekončící proces
• Předpokládá sledování
• potřeb uživatelů a specifikaci jejich racionálních požadavků
• vývoj a úpravy stávajících pravidel a implementaci nabytých poznatků
• sledování vývoje nových informačních technologií
• Komunikaci a kooperaci nejenom mezi paměťovými institucemi ale napříč celým sektorem,
komerčním i nekomerčním, všech kulturních, vědeckých a vzdělávacích institucí a odborné
veřejnosti
• Podmínkou je sdílení a zveřejňování informací formou propojených otevřených dat
M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 58
Integrace nových autorit
Volba adekvátní preferované formy
• válka na Ukrajině (2022-
• ruská invaze na Ukrajinu (2022-
• rusko-ukrajinský konflikt (2022-
• rusko-ukrajinská válka (2022-
• Putinova válka (2022-
• speciální vojenská operace (2022- : Ukrajina)
• 2022 Russian invasion of Ukraine
M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 59
60
Děkuji za pozornost
Případné dotazy zodpovím mailem:
Marie.Balikova@nkp.cz

More Related Content

Similar to Marie Balíková: Databáze věcných autorit

Pruvodce EIZ aneb kvalitní zdroje pro vaše studium (jaro 2012)
Pruvodce EIZ aneb kvalitní zdroje pro vaše studium (jaro 2012)Pruvodce EIZ aneb kvalitní zdroje pro vaše studium (jaro 2012)
Pruvodce EIZ aneb kvalitní zdroje pro vaše studium (jaro 2012)
Ústřední knihovna FF MU
 
Průvodce EIZ MU aneb Kvalitní zdroje pro vaše studium
 Průvodce EIZ MU aneb Kvalitní zdroje pro vaše studium Průvodce EIZ MU aneb Kvalitní zdroje pro vaše studium
Průvodce EIZ MU aneb Kvalitní zdroje pro vaše studiumÚstřední knihovna FF MU
 
Linked data (nejen) v knihovnách
Linked data (nejen) v knihovnáchLinked data (nejen) v knihovnách
Linked data (nejen) v knihovnách
Milan Janíček
 
Marie Balíková: Portál Národní autority ČR a novinky v oblasti jmenných, věcn...
Marie Balíková: Portál Národní autority ČR a novinky v oblasti jmenných, věcn...Marie Balíková: Portál Národní autority ČR a novinky v oblasti jmenných, věcn...
Marie Balíková: Portál Národní autority ČR a novinky v oblasti jmenných, věcn...
ÚISK FF UK
 
(Meta)data ve wikipedii a jak je dostat dovnitř a ven (Petr Kadlec)
(Meta)data ve wikipedii a jak je dostat dovnitř a ven (Petr Kadlec)(Meta)data ve wikipedii a jak je dostat dovnitř a ven (Petr Kadlec)
(Meta)data ve wikipedii a jak je dostat dovnitř a ven (Petr Kadlec)
Národní technická knihovna (NTK)
 
Pavel Holík, Ondřej Fabián: Xerxes: Portál informačních zdrojů (Nominované p...
Pavel Holík, Ondřej Fabián: Xerxes: Portál informačních zdrojů  (Nominované p...Pavel Holík, Ondřej Fabián: Xerxes: Portál informačních zdrojů  (Nominované p...
Pavel Holík, Ondřej Fabián: Xerxes: Portál informačních zdrojů (Nominované p...
PARTSIP: Partnerská síť informačních profesionálů
 
"Máte to?" - Summon jako základní vyhledávací nástroj NTK
"Máte to?" - Summon jako základní vyhledávací nástroj NTK"Máte to?" - Summon jako základní vyhledávací nástroj NTK
"Máte to?" - Summon jako základní vyhledávací nástroj NTK
Milan Janíček
 
Průvodce EIZ aneb Kvalitní zdroje pro vaše studium
Průvodce EIZ aneb Kvalitní zdroje pro vaše studiumPrůvodce EIZ aneb Kvalitní zdroje pro vaše studium
Průvodce EIZ aneb Kvalitní zdroje pro vaše studium
Ústřední knihovna FF MU
 
Průvodce EIZ aneb Kvalitní zdroje pro vaše studium
Průvodce EIZ aneb Kvalitní zdroje pro vaše studiumPrůvodce EIZ aneb Kvalitní zdroje pro vaše studium
Průvodce EIZ aneb Kvalitní zdroje pro vaše studiumÚstřední knihovna FF MU
 
TTT IVIG
TTT IVIGTTT IVIG
TTT IVIG
JanMat
 
Ondřej Černoš: Sémantický web
Ondřej Černoš: Sémantický webOndřej Černoš: Sémantický web
Ondřej Černoš: Sémantický web
ÚISK FF UK
 
Linda Skolková: Citování on-line informačních zdrojů v praxi
Linda Skolková: Citování on-line informačních zdrojů v praxi Linda Skolková: Citování on-line informačních zdrojů v praxi
Linda Skolková: Citování on-line informačních zdrojů v praxi
ÚISK FF UK
 
Digitisation activities and standards in Czech Archives
Digitisation activities and standards in Czech ArchivesDigitisation activities and standards in Czech Archives
Digitisation activities and standards in Czech Archives
ICARUS - International Centre for Archival Research
 
Linked Data for Czech Legislation - 2nd year of our project
Linked Data for Czech Legislation - 2nd year of our projectLinked Data for Czech Legislation - 2nd year of our project
Linked Data for Czech Legislation - 2nd year of our project
Martin Necasky
 
Experimentální OPAC
Experimentální OPACExperimentální OPAC
Experimentální OPAC
kadlec
 
Průvodce databázemi pro studenty oboru Teorie interaktivních médií
Průvodce databázemi pro studenty oboru Teorie interaktivních médiíPrůvodce databázemi pro studenty oboru Teorie interaktivních médií
Průvodce databázemi pro studenty oboru Teorie interaktivních médií
Ústřední knihovna FF MU
 

Similar to Marie Balíková: Databáze věcných autorit (20)

Pruvodce EIZ aneb kvalitní zdroje pro vaše studium (jaro 2012)
Pruvodce EIZ aneb kvalitní zdroje pro vaše studium (jaro 2012)Pruvodce EIZ aneb kvalitní zdroje pro vaše studium (jaro 2012)
Pruvodce EIZ aneb kvalitní zdroje pro vaše studium (jaro 2012)
 
Průvodce EIZ MU aneb Kvalitní zdroje pro vaše studium
 Průvodce EIZ MU aneb Kvalitní zdroje pro vaše studium Průvodce EIZ MU aneb Kvalitní zdroje pro vaše studium
Průvodce EIZ MU aneb Kvalitní zdroje pro vaše studium
 
Linked data (nejen) v knihovnách
Linked data (nejen) v knihovnáchLinked data (nejen) v knihovnách
Linked data (nejen) v knihovnách
 
Marie Balíková: Portál Národní autority ČR a novinky v oblasti jmenných, věcn...
Marie Balíková: Portál Národní autority ČR a novinky v oblasti jmenných, věcn...Marie Balíková: Portál Národní autority ČR a novinky v oblasti jmenných, věcn...
Marie Balíková: Portál Národní autority ČR a novinky v oblasti jmenných, věcn...
 
Xerxes (Ondřej Fabián)
Xerxes (Ondřej Fabián)Xerxes (Ondřej Fabián)
Xerxes (Ondřej Fabián)
 
(Meta)data ve wikipedii a jak je dostat dovnitř a ven (Petr Kadlec)
(Meta)data ve wikipedii a jak je dostat dovnitř a ven (Petr Kadlec)(Meta)data ve wikipedii a jak je dostat dovnitř a ven (Petr Kadlec)
(Meta)data ve wikipedii a jak je dostat dovnitř a ven (Petr Kadlec)
 
Pavel Holík, Ondřej Fabián: Xerxes: Portál informačních zdrojů (Nominované p...
Pavel Holík, Ondřej Fabián: Xerxes: Portál informačních zdrojů  (Nominované p...Pavel Holík, Ondřej Fabián: Xerxes: Portál informačních zdrojů  (Nominované p...
Pavel Holík, Ondřej Fabián: Xerxes: Portál informačních zdrojů (Nominované p...
 
"Máte to?" - Summon jako základní vyhledávací nástroj NTK
"Máte to?" - Summon jako základní vyhledávací nástroj NTK"Máte to?" - Summon jako základní vyhledávací nástroj NTK
"Máte to?" - Summon jako základní vyhledávací nástroj NTK
 
Průvodce EIZ aneb Kvalitní zdroje pro vaše studium
Průvodce EIZ aneb Kvalitní zdroje pro vaše studiumPrůvodce EIZ aneb Kvalitní zdroje pro vaše studium
Průvodce EIZ aneb Kvalitní zdroje pro vaše studium
 
Průvodce EIZ aneb Kvalitní zdroje pro vaše studium
Průvodce EIZ aneb Kvalitní zdroje pro vaše studiumPrůvodce EIZ aneb Kvalitní zdroje pro vaše studium
Průvodce EIZ aneb Kvalitní zdroje pro vaše studium
 
TTT IVIG
TTT IVIGTTT IVIG
TTT IVIG
 
EIZ pro klasická studia
EIZ pro klasická studiaEIZ pro klasická studia
EIZ pro klasická studia
 
Ondřej Černoš: Sémantický web
Ondřej Černoš: Sémantický webOndřej Černoš: Sémantický web
Ondřej Černoš: Sémantický web
 
Linda Skolková: Citování on-line informačních zdrojů v praxi
Linda Skolková: Citování on-line informačních zdrojů v praxi Linda Skolková: Citování on-line informačních zdrojů v praxi
Linda Skolková: Citování on-line informačních zdrojů v praxi
 
SAR System CZ
SAR System CZSAR System CZ
SAR System CZ
 
Digitisation activities and standards in Czech Archives
Digitisation activities and standards in Czech ArchivesDigitisation activities and standards in Czech Archives
Digitisation activities and standards in Czech Archives
 
Linked Data for Czech Legislation - 2nd year of our project
Linked Data for Czech Legislation - 2nd year of our projectLinked Data for Czech Legislation - 2nd year of our project
Linked Data for Czech Legislation - 2nd year of our project
 
Experimentální OPAC
Experimentální OPACExperimentální OPAC
Experimentální OPAC
 
Průvodce databázemi pro studenty oboru Teorie interaktivních médií
Průvodce databázemi pro studenty oboru Teorie interaktivních médiíPrůvodce databázemi pro studenty oboru Teorie interaktivních médií
Průvodce databázemi pro studenty oboru Teorie interaktivních médií
 
Eiz pro pedagogiku (podzim2012)
Eiz pro pedagogiku (podzim2012)Eiz pro pedagogiku (podzim2012)
Eiz pro pedagogiku (podzim2012)
 

More from ÚISK FF UK

Martina Košanová: Komunikace s problémovými uživateli knihoven
Martina Košanová: Komunikace s problémovými uživateli knihovenMartina Košanová: Komunikace s problémovými uživateli knihoven
Martina Košanová: Komunikace s problémovými uživateli knihoven
ÚISK FF UK
 
Vojtěch Vojtíšek & Laďka Zbiejczuk Suchá: Redesign knihovních služeb: webové ...
Vojtěch Vojtíšek & Laďka Zbiejczuk Suchá: Redesign knihovních služeb: webové ...Vojtěch Vojtíšek & Laďka Zbiejczuk Suchá: Redesign knihovních služeb: webové ...
Vojtěch Vojtíšek & Laďka Zbiejczuk Suchá: Redesign knihovních služeb: webové ...
ÚISK FF UK
 
Eva Novotná: Kartografické dědictví v Mapové sbírce Přírodovědecké fakulty UK
Eva Novotná: Kartografické dědictví v Mapové sbírce Přírodovědecké fakulty UKEva Novotná: Kartografické dědictví v Mapové sbírce Přírodovědecké fakulty UK
Eva Novotná: Kartografické dědictví v Mapové sbírce Přírodovědecké fakulty UK
ÚISK FF UK
 
Iva Horová: Sto let pokusů o vybudování národního zvukového archivu
Iva Horová: Sto let pokusů o vybudování národního zvukového archivuIva Horová: Sto let pokusů o vybudování národního zvukového archivu
Iva Horová: Sto let pokusů o vybudování národního zvukového archivu
ÚISK FF UK
 
Andrea Jelínková: Knihovědní detektivové
Andrea Jelínková: Knihovědní detektivovéAndrea Jelínková: Knihovědní detektivové
Andrea Jelínková: Knihovědní detektivové
ÚISK FF UK
 
Martina Košanová: Vizuální smog v knihovnách
Martina Košanová: Vizuální smog v knihovnáchMartina Košanová: Vizuální smog v knihovnách
Martina Košanová: Vizuální smog v knihovnách
ÚISK FF UK
 
Jana Šeblová: Samizdatová literatura a hudební publicistika
Jana Šeblová: Samizdatová literatura a hudební publicistikaJana Šeblová: Samizdatová literatura a hudební publicistika
Jana Šeblová: Samizdatová literatura a hudební publicistika
ÚISK FF UK
 
Jiří Nechvátal: Projekt Obálkyknih.cz
Jiří Nechvátal: Projekt Obálkyknih.czJiří Nechvátal: Projekt Obálkyknih.cz
Jiří Nechvátal: Projekt Obálkyknih.cz
ÚISK FF UK
 
Jak na video?
Jak na video? Jak na video?
Jak na video?
ÚISK FF UK
 
Eva Lesenková: Zdravotní gramotnost : Jak můžeme lépe získat informace o zdraví?
Eva Lesenková: Zdravotní gramotnost : Jak můžeme lépe získat informace o zdraví?Eva Lesenková: Zdravotní gramotnost : Jak můžeme lépe získat informace o zdraví?
Eva Lesenková: Zdravotní gramotnost : Jak můžeme lépe získat informace o zdraví?
ÚISK FF UK
 
Anna Hoťová: Školní knihovny
Anna Hoťová: Školní knihovnyAnna Hoťová: Školní knihovny
Anna Hoťová: Školní knihovny
ÚISK FF UK
 
Magdalena Paul: Fake news
Magdalena Paul: Fake newsMagdalena Paul: Fake news
Magdalena Paul: Fake news
ÚISK FF UK
 
Rudolf Rosa: Milníky umělé inteligence
Rudolf Rosa: Milníky umělé inteligenceRudolf Rosa: Milníky umělé inteligence
Rudolf Rosa: Milníky umělé inteligence
ÚISK FF UK
 
Pavel Berounský: Prohlídka datacentra Kokura (18. 10. 2021)
Pavel Berounský: Prohlídka datacentra Kokura (18. 10. 2021) Pavel Berounský: Prohlídka datacentra Kokura (18. 10. 2021)
Pavel Berounský: Prohlídka datacentra Kokura (18. 10. 2021)
ÚISK FF UK
 
Pavel Herout: Datová centra (18. 10. 2021)
Pavel Herout: Datová centra (18. 10. 2021)Pavel Herout: Datová centra (18. 10. 2021)
Pavel Herout: Datová centra (18. 10. 2021)
ÚISK FF UK
 
Anna Štičková: Čuchni ke knize
Anna Štičková: Čuchni ke knizeAnna Štičková: Čuchni ke knize
Anna Štičková: Čuchni ke knize
ÚISK FF UK
 
Hana Šandová: Centrum technického vzdělávání Půda jako třetí oddělení knihovny
Hana Šandová: Centrum technického vzdělávání Půda jako třetí oddělení knihovnyHana Šandová: Centrum technického vzdělávání Půda jako třetí oddělení knihovny
Hana Šandová: Centrum technického vzdělávání Půda jako třetí oddělení knihovny
ÚISK FF UK
 
Open data (Civic Tech)
Open data (Civic Tech) Open data (Civic Tech)
Open data (Civic Tech)
ÚISK FF UK
 
Vojtěch Ripka: Taking Mediality Seriously
Vojtěch Ripka: Taking Mediality SeriouslyVojtěch Ripka: Taking Mediality Seriously
Vojtěch Ripka: Taking Mediality Seriously
ÚISK FF UK
 
Tereza Simandlová: Open science v prostředí akademických knihoven: nová výzva...
Tereza Simandlová: Open science v prostředí akademických knihoven: nová výzva...Tereza Simandlová: Open science v prostředí akademických knihoven: nová výzva...
Tereza Simandlová: Open science v prostředí akademických knihoven: nová výzva...
ÚISK FF UK
 

More from ÚISK FF UK (20)

Martina Košanová: Komunikace s problémovými uživateli knihoven
Martina Košanová: Komunikace s problémovými uživateli knihovenMartina Košanová: Komunikace s problémovými uživateli knihoven
Martina Košanová: Komunikace s problémovými uživateli knihoven
 
Vojtěch Vojtíšek & Laďka Zbiejczuk Suchá: Redesign knihovních služeb: webové ...
Vojtěch Vojtíšek & Laďka Zbiejczuk Suchá: Redesign knihovních služeb: webové ...Vojtěch Vojtíšek & Laďka Zbiejczuk Suchá: Redesign knihovních služeb: webové ...
Vojtěch Vojtíšek & Laďka Zbiejczuk Suchá: Redesign knihovních služeb: webové ...
 
Eva Novotná: Kartografické dědictví v Mapové sbírce Přírodovědecké fakulty UK
Eva Novotná: Kartografické dědictví v Mapové sbírce Přírodovědecké fakulty UKEva Novotná: Kartografické dědictví v Mapové sbírce Přírodovědecké fakulty UK
Eva Novotná: Kartografické dědictví v Mapové sbírce Přírodovědecké fakulty UK
 
Iva Horová: Sto let pokusů o vybudování národního zvukového archivu
Iva Horová: Sto let pokusů o vybudování národního zvukového archivuIva Horová: Sto let pokusů o vybudování národního zvukového archivu
Iva Horová: Sto let pokusů o vybudování národního zvukového archivu
 
Andrea Jelínková: Knihovědní detektivové
Andrea Jelínková: Knihovědní detektivovéAndrea Jelínková: Knihovědní detektivové
Andrea Jelínková: Knihovědní detektivové
 
Martina Košanová: Vizuální smog v knihovnách
Martina Košanová: Vizuální smog v knihovnáchMartina Košanová: Vizuální smog v knihovnách
Martina Košanová: Vizuální smog v knihovnách
 
Jana Šeblová: Samizdatová literatura a hudební publicistika
Jana Šeblová: Samizdatová literatura a hudební publicistikaJana Šeblová: Samizdatová literatura a hudební publicistika
Jana Šeblová: Samizdatová literatura a hudební publicistika
 
Jiří Nechvátal: Projekt Obálkyknih.cz
Jiří Nechvátal: Projekt Obálkyknih.czJiří Nechvátal: Projekt Obálkyknih.cz
Jiří Nechvátal: Projekt Obálkyknih.cz
 
Jak na video?
Jak na video? Jak na video?
Jak na video?
 
Eva Lesenková: Zdravotní gramotnost : Jak můžeme lépe získat informace o zdraví?
Eva Lesenková: Zdravotní gramotnost : Jak můžeme lépe získat informace o zdraví?Eva Lesenková: Zdravotní gramotnost : Jak můžeme lépe získat informace o zdraví?
Eva Lesenková: Zdravotní gramotnost : Jak můžeme lépe získat informace o zdraví?
 
Anna Hoťová: Školní knihovny
Anna Hoťová: Školní knihovnyAnna Hoťová: Školní knihovny
Anna Hoťová: Školní knihovny
 
Magdalena Paul: Fake news
Magdalena Paul: Fake newsMagdalena Paul: Fake news
Magdalena Paul: Fake news
 
Rudolf Rosa: Milníky umělé inteligence
Rudolf Rosa: Milníky umělé inteligenceRudolf Rosa: Milníky umělé inteligence
Rudolf Rosa: Milníky umělé inteligence
 
Pavel Berounský: Prohlídka datacentra Kokura (18. 10. 2021)
Pavel Berounský: Prohlídka datacentra Kokura (18. 10. 2021) Pavel Berounský: Prohlídka datacentra Kokura (18. 10. 2021)
Pavel Berounský: Prohlídka datacentra Kokura (18. 10. 2021)
 
Pavel Herout: Datová centra (18. 10. 2021)
Pavel Herout: Datová centra (18. 10. 2021)Pavel Herout: Datová centra (18. 10. 2021)
Pavel Herout: Datová centra (18. 10. 2021)
 
Anna Štičková: Čuchni ke knize
Anna Štičková: Čuchni ke knizeAnna Štičková: Čuchni ke knize
Anna Štičková: Čuchni ke knize
 
Hana Šandová: Centrum technického vzdělávání Půda jako třetí oddělení knihovny
Hana Šandová: Centrum technického vzdělávání Půda jako třetí oddělení knihovnyHana Šandová: Centrum technického vzdělávání Půda jako třetí oddělení knihovny
Hana Šandová: Centrum technického vzdělávání Půda jako třetí oddělení knihovny
 
Open data (Civic Tech)
Open data (Civic Tech) Open data (Civic Tech)
Open data (Civic Tech)
 
Vojtěch Ripka: Taking Mediality Seriously
Vojtěch Ripka: Taking Mediality SeriouslyVojtěch Ripka: Taking Mediality Seriously
Vojtěch Ripka: Taking Mediality Seriously
 
Tereza Simandlová: Open science v prostředí akademických knihoven: nová výzva...
Tereza Simandlová: Open science v prostředí akademických knihoven: nová výzva...Tereza Simandlová: Open science v prostředí akademických knihoven: nová výzva...
Tereza Simandlová: Open science v prostředí akademických knihoven: nová výzva...
 

Marie Balíková: Databáze věcných autorit

  • 1. Zákulisí a specifika tvorby databáze Národních věcných autorit Marie.Balikova@nkp.cz
  • 2. Národní knihovna ČR a otevřená data Zpřístupnění databází NKČR pod veřejnou licencí CC0 • databáze Česká národní bibliografie (ČNB) ve formátu MARC 21, Dublin Core • Databáze národních autorit NK ČR (AUT) ve formátu MARC 21 • Centrální adresář knihoven a informačních institucí v ČR (ADR) Umožňuje nejširší možné užití databází pro nekomerční i komerční účely bez nutnosti uvedení autorství Hromadné stahování/sklízení dat ve strukturovaném formátu se děje pomocí protokolu OAI-PMH U báze NKC i AUT je k dispozici celý i dílčí set obsahující data změněná v určitém období, nelze stahovat jednotlivé záznamy Databáze Národních autorit NK ČR obsahuje přes 1.138.000 autoritních záznamů • personálních jmen, organizací, akcí, unifikovaných názvů • věcných termínů, geografických termínů, chronologických údajů, formálních termínů, skupin Konspektu Otevřená data — Národní knihovna České republiky (nkp.cz)
  • 3. Propojená data (Linked data) Linked Data využívají Webu k propojení dat pocházejících z různých zdrojů. Linked Data jsou data publikovaná na Webu ve strojově čitelné podobě, odkazují na externí zdroje dat a umožňují, aby na ně odkazovaly další data. Od klasického hypertextového Webu propojeného odkazy se Linked Data liší použitím jazyka RDF pro ukládání dat s popisem jejich sémantického významu. Linked data – WikiKnihovna Základní pravidla pro publikování a propojování dat užitím webové infrastruktury • použití URI (Uniform Resource Identifier – „jednotný identifikátor zdroje“) pro pojmenování entit • použití HTTP URI, aby bylo možné tyto pojmy vyhledávat • poskytovat užitečné informace při vyhledávání prostřednictvím URI použitím standardů (RDF, SPARQL) • zahrnout odkazy na další URI pro vyhledávání ostatních entit (Tim Berners-Lee, 2006 ) M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 3
  • 4. Plány komunity Wikidat Významná spolupráce se společností Wikimedia Česká republika, cílem jejíž činnosti je podpořit kvalitu, využitelnost a užitečnost dat v otevřeném prostoru • ve Wikidatech • v Národních autoritách - obohacení národních autorit o potřebné informace • zkvalitnění údajů na Wikipedii Podpora Sémantického webu (strukturovaného, strojům srozumitelného webu). Plány do budoucna (leden 2020) „Mohli bychom také pracovat s věcnými autoritami (např. geografické záznamy), které v bázi národních autorit také figurují. Čeká nás také rozhodnutí, zda záznamy, které Národní knihovna má, ale Wikidata ne, začít do Wikidat nějakým způsobem importovat. A konečně, když už tento import bude hotov, budeme řešit, jak ho do budoucna zautomatizovat, aby se nově přidávané záznamy v bázi národních autorit objevily co nejdříve i ve Wikidatech“. 773 571 osob pod licencí CC-0: databázi jmenných autorit Národní knihovny jsme propojili s Wikidaty | Wikimedia ČR - blog M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 4
  • 5. Báze národních autorit M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 5
  • 6. Báze národních autorit Podle typů entit rozlišujeme Databázi jmenných autorit, která zahrnuje autority • personální • korporativní • názvové Správu souborů personálních a korporativních autorit zajišťuje oddělení ONJA Na správě souboru názvových autorit se podílejí oddělení • jmenného zpracování • ONVAZ • zpracování speciálních dokumentů • hudební M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 6
  • 7. Báze národních autorit – pokrač. Podle typů entit dále rozlišujeme Databázi věcných autorit, která zahrnuje autority • tematické • geografické • formální • chronologické • autoritní soubor obsahující Konspektové schéma Správa věcných autorit uvedených typů je v kompetenci oddělení ONVAZ M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 7
  • 8. Proč autority vytváříme Unifikace a standardizace selekčních prvků (přístupových prvků) Propojení bibliografické a autoritní báze Informace obsažené v autoritním záznamu umožňují: • vyhledat danou entitu a s ní související informační zdroje; • určit/potvrdit, že popisovaná entita odpovídá entitě zamýšlené, nebo rozlišit mezi dvěma nebo více entitami s podobnými názvy (jmény); • objasnit vztah mezi dvěma nebo více entitami, nebo objasnit vztah mezi popisovanou entitou a jménem, pod nímž je entita známa; • porozumět, proč určitá forma jména nebo názvu byla zvolena jako preferovaná forma (Drobíková, 2011) M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 8
  • 9. Struktura autoritního záznamu autoritní záznam (autorita) • ucelený soubor údajů o určité entitě/třídě entit, kterou může být osoba, organizace, akce/událost, dílo, místo, téma • ucelený soubor informací o termínu používaném k označení formy nebo žánru • preferovaná forma jména/označení dané entity • variantní formy jména/označení dané entity • vyjádření atributů/vlastností dané entity • vyjádření vazeb (vztahů), které lze a je účelné mezi danou entitou a souvisejícími entitami definovat a vyjádřit • kódované informace • poznámky, definice (u tematických a formálních autorit) • informace o zdrojích ověření • další informace – propojení na externí zdroje – obohacení údajů M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 9
  • 10. Doporučení, konceptuální modely, pravidla, formáty M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 10
  • 11. Mezinárodní principy katalogizace M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 11
  • 12. M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 12
  • 13. Standardy, pravidla, formáty Jmenné entity – osoby, korporace, akce – čerpají se ze souboru Národních jmenných autorit, řídí se pravidly RDA • RDA • Soubory národních jmenných autorit Věcné entity – obecné téma, geografické názvy, chronologické údaje, označení formy/žánru, notace MDT, údaje Konspektu – čerpají se ze souboru Národních věcných autorit (CZENAS), řídí se pravidly pro tvorbu jednotlivých typů selekčních prvků CZENAS – standard pro věcné selekční údaje Soubor tematických autorit Soubor geografických autorit Soubor formálních deskriptorů Konspektové schéma MDT České MDT Online Formáty pro zápis údajů MARC 21 MARC 21 aut 13 M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022
  • 14. Formát MARC 21 AUT z pohledu věcných údajů Nedostatečná strukturovanost (granularita) údajů Doplňky, které jsou potřebné k rozlišení dvou nebo více entit, se uvádějí za označením entity ve vstupním prvku v závorce Rozdíl od personálních autorit, kde se uvádějí v podpoli c Příklady názvových autorit Aladdin (film : 1992) Kingdom Come: Deliverance (videohra) Příklady geografických autorit Národní geopark GeoLoci (Česko) Horní Palava (Blansko, Česko : ulice) Loučky (Odry, Česko) M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 14
  • 15. Zápis doplňku jako součást preferované autoritní formy GEO autority M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 15 141294625 (viaf.org) https://aleph.nkp.cz/F/?func=direct&doc_number=000134014&local_base=AUT
  • 16. Formát MARC 21 z pohledu věcných údajů – pokrač. Nedostatečná strukturovanost (granularita) údajů Doplňky, které jsou potřebné k rozlišení dvou nebo více entit, se uvádějí za označením entity ve vstupním prvku v závorce Příklady tematických autorit morfologie (biologie) morfologie (lingvistika) bitva o Atlantu (1864 : Atlanta, Georgia) Příklady formálních autorit aranžmá (hudba) thrillery (filmy) M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 16
  • 17. Zařazení entit do různých souborů autorit Stejný druh entity „událost“ se řadí do různých autoritních souborů: Akce (konference, semináře, workshopy) se považují za korporace a řadí se do souboru korporativních autorit • bitvy, války se řadí do tematických autorit • pojmenované domy se řadí do korporativních autorit • nepojmenované domy do tematických autorit Řešení nově koncipované datové modely, např. BIBFRAME Schema.org M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 17
  • 18. Ukázky rozdílného zařazení entit téhož typu M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 18
  • 19. Aktualizace formátu MARC 21 155 - Heading-Genre/Form Term October 1999 Prior to the definition of the X55 fields, X50 (Topical Terms) fields were used for genre/form headings Field 034 - Coded Cartographic Mathematical Data [NEW, 2006] Field 046 - Special Coded Dates [NEW, 2009] Field 080 - Universal Decimal Classification Number [NEW, 2009] Field 147 - Heading-Named Event [NEW, 2016] Field 368 - Other Corporate Body Attributes [NEW, 2011] Field 368 - Other Attributes of Person or Corporate Body [RENAMED, 2011] Field 370 - Associated Place [NEW, 2009] Field 371 - Address [NEW, 2009] Field 372 - Field of Activity [NEW, 2009] M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 19
  • 20. Aktualizace formátu MARC 21 Field 373 - Affiliation [NEW, 2009] Field 373 - Associated Group [RENAMED, 2011] Field 374 - Occupation [NEW, 2009] Field 375 - Gender [NEW, 2009] Field 376 - Family Information [NEW, 2009] Field 377 - Associated Language [NEW, 2009] Field 378 - Fuller Form of Personal Name [NEW, 2011] Field 380 - Form of Work [NEW, 2010] Field 381 - Other Distinguishing Characteristics of Work or Expression [NEW, 2010] Field 382 - Medium of Performance [NEW, 2010] Field 677 - Definition [NEW, 2016] M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 20
  • 21. Věcné autority M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 21
  • 22. Historie databáze věcných autorit Dvě samostatné báze databáze jmenných autorit (AUJ) (vznik 1998-1999) • Personální autority • Korporativní autority (2001) databáze věcných autorit (AUV) (vznik 2000) • Tematické • Geografické • Formální Sloučení do jedné báze (AUT) (2002) Důvody oddělených bází Počty záznamů určených ke zpracování, komplexnost struktury věcných autorit Technické Verze systému Aleph (AL300) - omezená funkčnost AUT báze, pouze pro vyhledávání, „stahování“ údajů při katalogizaci pouze pomocí speciálního programu Verze systému Aleph (AL500) – regulérní plně funkční AUT báze propojená s BIB bází, integrace i odkazového aparátu do BIB rejstříku M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 22
  • 23. Jmenné a věcné autority Markantní rozdíl: počet autoritních záznamů rok 2021 • počet geografických autorit je limitován počtem lokalit, které jsou potřeba ke zpřístupnění informačních zdrojů • počet tematických a formálních autorit je limitován slovní zásobou národního jazyka a terminologickými soustavami jednotlivých oborů • počet tematických autorit může být dokonce i snížen, protože dochází ke změně • obecně platných katalogizačních pravidel, a/nebo • koncepce věcné katalogizace v daném oboru. Např. v roce 2021 bylo zrušeno 1215 tzv. "malých autorit„ typu „koncerty (marimba, hoboj, smyčcový orchestr)“, což vedlo k celkovému snížení počtu tematických o zhruba 800 záznamů; Nástrojové obsazení se nyní uvádí v poli 382, je tedy nadbytečné, aby se informace o nástrojovém obsazení uváděly nadále i v polích 650 a byly sporadicky řízeny autoritními záznamy v poli 150. M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 23
  • 24. 24 M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 Soubor autorit Soubor ověřených a unifikovaných jmenných a/nebo věcných selekčních údajů, určených pro zpracování a vyhledávání dokumentů s nezbytným odkazovým a poznámkovým aparátem.
  • 25. Informace v AUT záznamu Podle původní představy měly záznamy národních autorit obsahovat pouze nezbytné informace pro zajištění jednoznačnosti preferované formy jména/označení • preferovaná forma jména • variantní formy jména • zdroj ověření informací Dále trvá u názvových autorit pro entitu vyjádření – překlady děl potřebné informace (propojení na externí zdroje) se uvádějí v základním autoritním záznamu pro dílo M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 25
  • 26. Informace v AUT záznamu V současnosti – podstatné rozšíření uváděných informací • vyjadřují se všechny potřebné atributy a vazby, do kterých entity vstupují, včetně potřebných poznámek - zásadní podmínka pro propojování informací v prostředí sémantického webu Věcné autority obsahují navíc • explicitní vyjádření významových vztahů pomocí nadřazených, podřazených a asociovaných pojmů • asociované pojmy se dříve uváděly jenom v nejnutnějších případech • ekvivalentní notaci klasifikačního systému MDT • údaj skupiny Konspektu specifikace požadavků spolupracujících knihoven M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 26
  • 27. Tematické autority M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 27
  • 28. Typy tematických autorit Tematická autorita je druh věcné autority vyjadřující obecné pojmy; slouží k reprezentaci předmětu/tématu informačního zdroje (o čem dokument je) • abstraktní entity (vlast, štěstí, radost), • vědní a umělecké obory (matematika, malířství), • výrobky • reálné objekty (skalní hrady, dřevěné mosty, nepojmenované domy, poldry, požární technika), • pomníky (včetně individuálních) • specifické entity označující události a akce, které nejsou součástí korporativních autorit • války, bitvy, události • válka v Perském zálivu (1991) • svíčková demonstrace (1988 : Bratislava, Slovensko) • masakr ve Srebrenici (1995 : Srebrenica, Bosna a Hercegovina) M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 28
  • 29. Kde se tematické autority používají Jmenné autority rozlišující doplněk jména/označení jako součást záhlaví (v singuláru v podpoli c) – označuje u reálných osob povolání; u posvátných, legendárních, fiktivních postav označuje typ doplňující informace vyjadřující atributy jmenných autorit • jiné související informace o osobě nebo korporaci (pole 368), např. výraz vyjadřující • označení osoby, např. světci, fiktivní postavy…, • typ korporace, např. hudební skupiny, knihovny • oblast působnosti osoby, korporace (pole 372), např. výtvarné umění, orientalistika • povolání osoby (pole 374), např. hudební skladatelé… • forma u názvových autorit (pole 380) videohry, filmy • jiné související informace týkající se díla, např. všeobecnosti a zajímavosti, věda, technika Periskop (rozhlasový pořad) M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 29
  • 30. Kde se tematické autority používají – pokrač. Věcné autority rozlišující doplněk u nejednoznačných označení entit • Tematické autority Pascal (jednotka), Pascal (programovací jazyk), ontologie (filozofie), ontologie (informatika) Geografické autority • U Zvonu (Plzeň, Česko : ulice), Kamenný hřib (Česko : přírodní památka); doplňující informace vyjadřující atributy věcných autorit BIB báze vstupní prvek (samostatný výraz) předmětového selekčního jazyka, např. knihovníci -- Česko tematické zpřesnění (tematické podheslo), např. Česko -- dějiny M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 30
  • 31. https://aleph.nkp.cz/F/?func=direct&doc_number=001093088&local_base=AUT advance health care directive - Wikidata Standardní formát Formát Marc 21 AUT Struktura tematické autority M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 31
  • 32. Příklady „specifických“ entit - tematických autorit M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 32
  • 33. Tematické autority Preferovaná forma i variantní formy označení musí být jednoznačné; je nutné vyřešit otázku synonymie – uvedením všech dostupných variantních forem homonymie,polysémie - různé významy homonym se důsledně rozlišují • specifikací termínu, např. operace: binární operace, bankovní operace, bojové operace, operace srdce • uvedením kvalifikátoru (relátoru) v závorce, který je součástí deskriptoru, např. morfologie -morfologie (biologie) ; morfologie (lingvistika) Explicitní vyjádření významových vztahů mezi pojmy téhož sémantického okruhu • nadřazenost • podřazenost • asociace M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 33
  • 34. Tvar lexikálních jednotek • substantivní tvar • jednoslovné substantivum • víceslovná lexikální jednotka, jejíž základ tvoří substantivum • adjektivní spojení • předložková vazba • komplexní termín Příklady • epitafy • polovojenské organizace • památkově chráněná území • ochrana osobních údajů • manželky významných mužů • padělání a pozměňování veřejné listiny • agrese (mezinárodní právo) • rodiče a děti • ženy v politice • malíři a řezbáři- nelzepovažovatza obecně platný komplexní termín, řeší pouze problém zpřístupnění konkrétního dokumentu • osobnosti Broumovska – situační termín • trvalá budoucí udržitelnost muzeí – není termín 34 M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022
  • 35. Tvar lexikálních jednotek • dodržuje se přirozený slovosled • dodržuje se pravopisná norma • transliterace se řídí platnými normami • singulár a plurál • počitatelná v plurálu, např. prezidenti, knihy, řeky…. • abstrakta, počitatelná použitá jako abstrakta, názvy vědních oborů v singuláru, např. láska, průmysl, fyzika, malířství… • cizojazyčné termíny se uvádějí • neexistuje-li adekvátní překlad, např. benchmarking • je-li termín běžně používán v daném vědním oboru, např. paleobotanika… • zkratky • preference rozepsané formy • zkratka se odkáže – odborné zkratky jsou nejednoznačné a pro laického uživatele nesrozumitelné • všeobecně známé zkratky (jednoznačné) se používají, např. AIDS M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 35
  • 36. Funkce MDT v AUT záznamech určení dominantního oboru posouzení jednoznačnosti a systémovosti termínů tvorba hierarchické struktury univerzálního souboru tvorba vícejazyčného nástroje součást struktury Konspektové schématu (2. úroveň) nástroj minimální úrovně katalogizace – minimální záznam M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 36
  • 37. Údaj skupiny Konspektu v autoritním záznamu Slouží jako • standard pro popis a zpřístupnění informačních zdrojů na úrovni předmětových kategorií s subkategorií • nástroj pro tvorbu předmětově orientovaných informačních systémů v národním i mezinárodním prostředí • nástrojpro konverzi lokálních klasifikačních systémů do univerzálních • nástroj minimální úrovně katalogizace – minimální záznam • Pro tvorbu fasety “obor” v portálu knihovny.cz – zpřesnění výsledků dotazu Tematická mapa fondů Tematické autority online www.knihovny.cz M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 37
  • 38. Použijeme nabízený předvýběr v Národních zdrojích a zvolíme Zobrazit všechny Získáme 51 dokumentů, omezíme z nabídky filtrů fasetu „obor“ Literatura pro děti a mládež Získáme 6 dokumentů určených dětem a mládeži M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 38
  • 39. Cílová komunita: nakladatelé Preferují jednoduchá kritéria vyhledávání M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 39
  • 40. Cílová komunita: katalogizátoři, indexátoři Informace o autoritních termínech souvisejících s danou skupinou Konspektu a propojených bibliografických záznamech M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 40
  • 41. Aktualizace a úprava údajů v souboru tematických autorit Centrální správa souboru tematických autorit Aktualizace probíhá průběžně • připojování nových autorit v souvislosti s věcnou katalogizací informačních zdrojů • je podmíněna • aktualizací terminologických soustav jednotlivých oborů • potřebami jednotlivých útvarů NK ČR – doplňování termínů označujících kategorii osob včetně ženských variant pro tvorbu personálních autorit • potřebami kooperujících institucí • potřebami řešitelských týmů jednotlivých projektů – projekt TEMAP, INTERPI M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 41
  • 42. Aktualizace a úprava v záznamech tematických autorit Připojení invertovaných tvarů víceslovných termínů formou odkazů „viz“ s cílem usnadnit • orientaci a vstup uživatele do autoritního souboru • předpoklad harmonizace/mapování řízených slovníků (projekt INTERPI, 2014) M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 42
  • 43. Tematické autority a propojená data (Wikidata) Propojení předpokládá intelektuální posouzení (ruční mapování) propojených autoritních termínů a položek Wikidat Rozdíly • plurál (autoritních termínů) versus singulár (většina externích zdrojů, např. Wikipedie, Wikidata) • komplexní termíny – „rodiče a děti“ • jednoznačnost autoritního termínu není vždy explicitně vyjádřena, někdy je význam termínu objasněn pomocí notace klasifikačních znaků MDT • v tematických autoritách nejsou prozatím vždy uvedeny potřebné informace v dostatečné míře, u komplikovaných termínů nejsou uvedeny definice • většinou obsahují preferovanou a odkazované formy, notaci MDT, skupinu Konspektu a anglický ekvivalent M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 43
  • 44. Komplexní termín „rodiče a děti“ M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 44 Pojem vyjadřuje vztah Používá se v plurálu Frekventovaný termín
  • 45. Termín „rodiče a děti“ LC Authorities RAMEAU M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 45
  • 46. Termín „rodiče a děti“ Wikidata + M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 46
  • 47. Význam termínu objasněn pomocí notací MDT M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 47
  • 48. Výhody tematických autorit Univerzální soubor - jsou v něm zahrnuty termíny ze všech oborů lidského poznání obsahuje • aktuální terminologii; vytváří se induktivní metodou, s dokumentem v ruce • víceslovné deskriptory – zajištěna potřebná míra specifičnosti termínů Termín/pojem prochází intelektuálním posouzením, ověřen v odborné literatuře a referenčních zdrojích Autoritní termíny jsou opatřeny anglickými ekvivalenty, což usnadní propojení na položku Wikidat M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 48
  • 49. Soubor geografických autorit M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 49
  • 50. Soubor geografických autorit Geografická autorita druh jmenné autority obsahující vlastní geografické jméno (jména obcí, měst, regionů, států, geomorfologických útvarů, přírodních vodních toků), případně geografický název označující specifické entity (trasy cyklistické, dopravní, turistické, naučné stezky, umělá vodní díla, přírodní rezervace, chráněné krajinné oblasti. Kde se používá Jmenné autority • vstupní prvek v korporativním záhlaví začínajícím jurisdikcí- Karlovy Vary (Česko). Magistrát • kvalifikátor v korporativním záhlaví – Základní škola (Blovice, Česko) • vyjádření atributu jmenných autorit (personálních, korporativních, názvových) – místo narození, úmrtí, sídlo korporace, místo vzniku díla- Teplický kancionál; místo původu: Praha, Česko M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 50
  • 51. Soubor geografických autorit – pokrač. Věcné autority • kvalifikátor u geografických autorit – název státu, okresního města • kvalifikátor u specifických tematických autorit(války, bitvy, události) – bitva na Piavě (1918 : Piava, Itálie : řeka) Bibliografická báze • vstupní prvek (samostatný výraz) předmětového selekčního jazyka - Znojmo (Česko) -- dějiny • geografické zpřesnění (geografické podheslo – název státu, oblasti) - intelektuální život -- Ukrajina • velmi důležitý prvek při tvorbě platformy pro Sémantický Web – propojených otevřených dat M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 51
  • 52. Struktura geografické autority preferovaná forma variantní formy jména vazba na nadřazený pojem anglická forma jména rozšíření údajů kód GEO oblasti, notace MDT – komunita knihovníků propojení na externí zdroje pole GPS kartografické souřadnice link do mapy hierarchické třídění – přidělení kódu databáze SOVAMM – doplnění údajů status záznamu: Správní celek M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 52
  • 53. M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 53
  • 54. M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 54 Obohacení geografických autorit – propojení s databází SOVAMM
  • 55. Obohacení geografických autorit – propojení s databází CZ_RETRO SOVAMM V souboru geografických autorit bylo v roce 2014 dořešeno propojení této databáze s Databází sídelních lokalit Čech, Moravy a Slezska CZ_RETRO pomocí pole 052, kde se uvádí kód CZ_RETRO. M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 55
  • 56. Geografické autority jako propojená data Do zveřejnění zprávy o uvolnění databáze národních autorit pod veřejnou licencí CC0 platilo • „Geografické autority nebyly v původní náplni projektu, který byl realizován ve spolupráci s Národní knihovnou v roce 2019, a tak zatím formálně nejsou uvolněny pod licencí CC-0. Jak však poznamenal Radek Světlík ze Studijní a vědecké knihovny Plzeňského kraje, pro knihovnická propojená data jsou geografické autority ještě důležitější než ty personální, které se věnují lidem. Proto jsme se podívali na zoubek i geografickým autoritám a pro začátek je alespoň propojili s patřičnými záznamy ve Wikidatech.“ • Geografické autority jsou tedy nyní propojeny s položkami ve Wikidatech a nyní také uvolněny, protože „Naštěstí jsou v mnoha případech geolokalizovány – obsahují informace o své geografické poloze na mapě světa“. • „Tato data nám laskavě z databáze vyexportovala Helena Dvořáková z Národní knihovny a účastnice nedávného Biblio workshopu. Díky nástroji OpenRefine, který podporuje propojování s položkami na Wikidatech podle jejich geografické blízkosti, jsme tak měli poměrně snadnou práci. Stačilo totiž hledat jen mezi objekty, které jsou blízko daného záznamu. Tam, kde souřadnice k dispozici nebyly, jsme se museli spolehnout na (pečlivě kontrolované) párování podle názvu a typu objektu“. • „Geografické autority pokrývají široké spektrum různých témat – od států přes regiony, řeky, chráněná území až po města či vesnice. Výsledkem je umístění téměř všech geografických autorit (s výjimkou tzv. „oblastí“ a několika dalších typů objektů) na mapu světa, kde si je můžeme procházet“ • Půl roku po otevření báze autorit: knihovnická data ožívají ve Wikidatech | Wikimedia ČR - blog Jsme velmi rádi, že náš projekt „Geolink“, který byl realizován v kooperaci s R. Záhoříkem v rámci projektu Jednotné Informační Brány (JIB), byl takto vynikajícím způsobem uplatněn. M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 56
  • 57. Obohacení geografických autorit pomocí dat z Wikidat Přínos • odstranění nekonzistence • duplicity • překlepy, pravopisné chyby • obohacení o vybrané identifikátory • identifikátor Wikidat • identifikátor Viaf, Geonames ??? Další ??? – nutná rešerše • způsob • dynamické načítání identifikátorů z Wikidat • statické uložení v autoritním záznamu – rešerše nutná M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 57
  • 58. ZÁVĚR Tvorba a údržba souborů autorit všech typů (součást autoritní kontroly) je pracná, systémově i finančně náročná, ale přínosná; Nikdy nekončící proces • Předpokládá sledování • potřeb uživatelů a specifikaci jejich racionálních požadavků • vývoj a úpravy stávajících pravidel a implementaci nabytých poznatků • sledování vývoje nových informačních technologií • Komunikaci a kooperaci nejenom mezi paměťovými institucemi ale napříč celým sektorem, komerčním i nekomerčním, všech kulturních, vědeckých a vzdělávacích institucí a odborné veřejnosti • Podmínkou je sdílení a zveřejňování informací formou propojených otevřených dat M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 58
  • 59. Integrace nových autorit Volba adekvátní preferované formy • válka na Ukrajině (2022- • ruská invaze na Ukrajinu (2022- • rusko-ukrajinský konflikt (2022- • rusko-ukrajinská válka (2022- • Putinova válka (2022- • speciální vojenská operace (2022- : Ukrajina) • 2022 Russian invasion of Ukraine M. Balíková, Odborné fórum ÚISK FF UK, 9. 5. 2022 59
  • 60. 60 Děkuji za pozornost Případné dotazy zodpovím mailem: Marie.Balikova@nkp.cz