Successfully reported this slideshow.

Jak dokumentům automaticky přiřadit hesla PSH (Jindřich Mynarz, Ctibor Škuta)

1

Share

1 of 35
1 of 35

Jak dokumentům automaticky přiřadit hesla PSH (Jindřich Mynarz, Ctibor Škuta)

1

Share

Download to read offline

Chcete vědět víc? Mnoho dalších prezentací, videí z konferencí, fotografií i jiných dokumentů je k dispozici v institucionálním repozitáři NTK: http://repozitar.techlib.cz

Chcete vědět víc? Mnoho dalších prezentací, videí z konferencí, fotografií i jiných dokumentů je k dispozici v institucionálním repozitáři NTK: http://repozitar.techlib.cz

More Related Content

More from Národní technická knihovna (NTK)

Related Audiobooks

Free with a 14 day trial from Scribd

See all

Jak dokumentům automaticky přiřadit hesla PSH (Jindřich Mynarz, Ctibor Škuta)

 1. 1. http://bit.ly/psh-indexace
 2. 2. Google Patents
 3. 3. Sumarizace
 4. 4. Motivace
 5. 5. Zahlcení informacemi
 6. 6. Škálovatelnost indexace
 7. 7. Vyhledávání a prohlížení
 8. 8. Automatická indexace
 9. 9. http://www.cs.waikato.ac.nz/~olena/publications/olena_medelyan_phd_thesis_July2009.pdf
 10. 10. Strojové učení ● Učení korespondencí mezi rysy dokumentu a předmětovými hesly ● Kopírování a aplikace odpozorovaných pravidel
 11. 11. Zdroje automatické indexace 1. analýza indexovaného dokumentu 2. analýza použitého řízeného slovníku 3. analýza způsobu použití daného slovníku nad korpusem dokumentů Výsledkem strojového učení nad zdroji automatické indexace je indexační model.
 12. 12. Komponenty
 13. 13. Indexátor http://code.google. com/p/maui-indexer/
 14. 14. Korpus plných textů http://nusl.techlib.cz/
 15. 15. Řízený slovník http://psh.techlib.cz/skos/
 16. 16. Automatické přiřazování hesel PSH
 17. 17. Zdroj
 18. 18. Předzpracování dokumentu ● přizpůsobeno češtině ● normalizace ● odstranění nevýznamových výrazů ○ založeny na nejfrekventovanějších výrazech v Českém národním korpusu FF UK ● redukce na slovní kořeny ○ dostupné české stemmery jsou příliš agresivní
 19. 19. Generování kandidátů
 20. 20. Zdroj
 21. 21. Zdroj
 22. 22. Filtrování kandidátů
 23. 23. Demo http://invenio2.ntkcz.cz/indexer/ http://maui-indexer.appspot.com/
 24. 24. Výzvy pro indexaci ● Indexování vytvářené uživateli ● Využití herních prvků (http://www.librarything. com/coverguess) ● Efektivní využití v uživatelských rozhraních
 25. 25. <mailto:jindrich.mynarz@techlib.cz> <mailto:ctibor.skuta@techlib.cz> <mailto:tomas.muller@techlib.cz> Ikony převzaty z http://thenounproject.com/.

×