Jak dokumentům automaticky přiřadit hesla PSH (Jindřich Mynarz, Ctibor Škuta)

•

1 like•1,753 views

Chcete vědět víc? Mnoho dalších prezentací, videí z konferencí, fotografií i jiných dokumentů je k dispozici v institucionálním repozitáři NTK: http://repozitar.techlib.cz

http://www.cs.waikato.ac.nz/~olena/publications/olena_medelyan_phd_thesis_July2009.pdf

Strojové učení
● Učení korespondencí mezi rysy
dokumentu a předmětovými hesly
● Kopírování a aplikace odpozorovaných
pravidel

Zdroje automatické indexace

1. analýza indexovaného dokumentu
2. analýza použitého řízeného slovníku
3. analýza způsobu použití daného slovníku nad korpusem
dokumentů

Výsledkem strojového učení nad zdroji automatické indexace je
indexační model.

Indexátor

http://code.google.
com/p/maui-indexer/

Korpus plných textů

http://nusl.techlib.cz/

Řízený slovník

http://psh.techlib.cz/skos/

Předzpracování dokumentu

● přizpůsobeno češtině
● normalizace
● odstranění nevýznamových výrazů
○ založeny na nejfrekventovanějších výrazech v Českém
národním korpusu FF UK
● redukce na slovní kořeny
○ dostupné české stemmery jsou příliš agresivní

Demo
http://invenio2.ntkcz.cz/indexer/
http://maui-indexer.appspot.com/

Výzvy pro indexaci

● Indexování vytvářené uživateli
● Využití herních prvků (http://www.librarything.
com/coverguess)
● Efektivní využití v uživatelských rozhraních

<mailto:jindrich.mynarz@techlib.cz>
<mailto:ctibor.skuta@techlib.cz>
<mailto:tomas.muller@techlib.cz>
Ikony převzaty z http://thenounproject.com/.

Viewers also liked

6 orofacial & neck infectionsEphrem Tamiru

PMO 101shailsood

anatomy-lecture-3-thoracic-wall-1-slidesForensic Pathology

Sindrome icterico obstructivoluisa488

Neurotransmitter - DopamineSankaraleengam Alagapan

Ship handlingBohe Bekho

Pigment printingKarcahi university

Titanic presentation mainBadapple96

Lecture 1 thoracic wall Dr. Noura El Tahawy

Chest Auscultationmedlearn

Thyroid ultrasoundDoaa Gadalla

Pediatric emqfbhvghvgj

FRACTIONAL FLOW RESERVEVishwanath Hesarur

Drug induce liver disease mitaarymita

Thyroidectomy Shafeeq Mohammed

Principle of photogrammetrySumant Diwakar

Drilling operation and componentsChoong KW

ng-owasp: OWASP Top 10 for AngularJS ApplicationsKevin Hakanson

Liver DiseaseMiami Dade

Spirality & ShrinkageSwapnil Ekramul

Viewers also liked (20)

6 orofacial & neck infections

PMO 101

anatomy-lecture-3-thoracic-wall-1-slides

Sindrome icterico obstructivo

Neurotransmitter - Dopamine

Ship handling

Pigment printing

Titanic presentation main

Lecture 1 thoracic wall

Chest Auscultation

Thyroid ultrasound

Pediatric emq

FRACTIONAL FLOW RESERVE

Drug induce liver disease mita

Thyroidectomy

Principle of photogrammetry

Drilling operation and components

ng-owasp: OWASP Top 10 for AngularJS Applications

Liver Disease

Spirality & Shrinkage

More from Národní technická knihovna (NTK)

Overlooked Principles of Strategic Management of Research at a National Level...Národní technická knihovna (NTK)

Využití bibliometrických ukazatelů v řízení výzkumné instituce (Daniel Münich...Národní technická knihovna (NTK)

InCites: Practical Aspects and Effective Use (Evangelia A. E. C. Lipitakis, ...Národní technická knihovna (NTK)

Zkušenosti Knihovny Akademie věd ČR (Pavel Míka, AV ČR)Národní technická knihovna (NTK)

Bibliometrie v Národní technické knihovně: metody, zkušenosti, mise a vize (J...Národní technická knihovna (NTK)

Bibliometrie: přínosy, úskalí (Jiří Jirát, VŠCHT)Národní technická knihovna (NTK)

Význam indikátorů v institucionálním hodnocení a financování (Jitka Moravcová...Národní technická knihovna (NTK)

Rozhraní VPKNárodní technická knihovna (NTK)

Šmankote, co je to NUŠL? (aktualizovaná verze 2014)Národní technická knihovna (NTK)

Rešeršní služby v komerčním sektoru (Martin Mlčoch, nezávislý konzultant)Národní technická knihovna (NTK)

Speciální informační služby pro zdravotníky v Národní lékařské knihovně (Mgr....Národní technická knihovna (NTK)

Rešeršní služby v NK ČR (Mgr. Karolína Košťálová, NK ČR) Národní technická knihovna (NTK)

Legislativní rámec rešerší (Mgr. Alena Pavelová, NTK) Národní technická knihovna (NTK)

Model rešeršních služeb v NTK (Bc. Drahomíra Dvořáková, NTK) Národní technická knihovna (NTK)

Rešeršní služby Bibliografie dějin Českých zemí v Historickém ústavu AV ČR (M...Národní technická knihovna (NTK)

Novinky ve vyhledávání Seznam .cz (Otakar Smrž)Národní technická knihovna (NTK)

Co znamená, že Google o nás ví víc než my sami; aneb zaprodáme duši vyhledáva...Národní technická knihovna (NTK)

Vyhledávání hudbou: YouTube trochu jinak (Ondřej Voců)Národní technická knihovna (NTK)

Co se skrývá za vyhledáváním v katalogu NTK (Kristýna Busch, Eliška Veselá)Národní technická knihovna (NTK)

Kouzlo muzejní nociNárodní technická knihovna (NTK)

More from Národní technická knihovna (NTK) (20)

Overlooked Principles of Strategic Management of Research at a National Level...

Využití bibliometrických ukazatelů v řízení výzkumné instituce (Daniel Münich...

InCites: Practical Aspects and Effective Use (Evangelia A. E. C. Lipitakis, ...

Zkušenosti Knihovny Akademie věd ČR (Pavel Míka, AV ČR)

Bibliometrie v Národní technické knihovně: metody, zkušenosti, mise a vize (J...

Bibliometrie: přínosy, úskalí (Jiří Jirát, VŠCHT)

Význam indikátorů v institucionálním hodnocení a financování (Jitka Moravcová...

Rozhraní VPK

Šmankote, co je to NUŠL? (aktualizovaná verze 2014)

Rešeršní služby v komerčním sektoru (Martin Mlčoch, nezávislý konzultant)

Speciální informační služby pro zdravotníky v Národní lékařské knihovně (Mgr....

Rešeršní služby v NK ČR (Mgr. Karolína Košťálová, NK ČR)

Legislativní rámec rešerší (Mgr. Alena Pavelová, NTK)

Model rešeršních služeb v NTK (Bc. Drahomíra Dvořáková, NTK)

Rešeršní služby Bibliografie dějin Českých zemí v Historickém ústavu AV ČR (M...

Novinky ve vyhledávání Seznam .cz (Otakar Smrž)

Co znamená, že Google o nás ví víc než my sami; aneb zaprodáme duši vyhledáva...

Vyhledávání hudbou: YouTube trochu jinak (Ondřej Voců)

Co se skrývá za vyhledáváním v katalogu NTK (Kristýna Busch, Eliška Veselá)

Kouzlo muzejní noci

Jak dokumentům automaticky přiřadit hesla PSH (Jindřich Mynarz, Ctibor Škuta)

1. http://bit.ly/psh-indexace

3. Google Patents

4. Sumarizace

10. Motivace

11. Zahlcení informacemi

12. Škálovatelnost indexace

13. Vyhledávání a prohlížení

14. Automatická indexace

15. http://www.cs.waikato.ac.nz/~olena/publications/olena_medelyan_phd_thesis_July2009.pdf

16. Strojové učení ● Učení korespondencí mezi rysy dokumentu a předmětovými hesly ● Kopírování a aplikace odpozorovaných pravidel

17. Zdroje automatické indexace 1. analýza indexovaného dokumentu 2. analýza použitého řízeného slovníku 3. analýza způsobu použití daného slovníku nad korpusem dokumentů Výsledkem strojového učení nad zdroji automatické indexace je indexační model.

18. Komponenty

19. Indexátor http://code.google. com/p/maui-indexer/

20. Korpus plných textů http://nusl.techlib.cz/

21. Řízený slovník http://psh.techlib.cz/skos/

22.

23. Automatické přiřazování hesel PSH

24. Zdroj

25. Předzpracování dokumentu ● přizpůsobeno češtině ● normalizace ● odstranění nevýznamových výrazů ○ založeny na nejfrekventovanějších výrazech v Českém národním korpusu FF UK ● redukce na slovní kořeny ○ dostupné české stemmery jsou příliš agresivní

26. Generování kandidátů

27. Zdroj

28. Zdroj

29. Filtrování kandidátů

30. Demo http://invenio2.ntkcz.cz/indexer/ http://maui-indexer.appspot.com/

31.

32.

33.

34. Výzvy pro indexaci ● Indexování vytvářené uživateli ● Využití herních prvků (http://www.librarything. com/coverguess) ● Efektivní využití v uživatelských rozhraních

35. <mailto:jindrich.mynarz@techlib.cz> <mailto:ctibor.skuta@techlib.cz> <mailto:tomas.muller@techlib.cz> Ikony převzaty z http://thenounproject.com/.

Jak dokumentům automaticky přiřadit hesla PSH (Jindřich Mynarz, Ctibor Škuta)

Recommended

Recommended

More Related Content

Viewers also liked

Viewers also liked (20)

More from Národní technická knihovna (NTK)

More from Národní technická knihovna (NTK) (20)

Jak dokumentům automaticky přiřadit hesla PSH (Jindřich Mynarz, Ctibor Škuta)