Successfully reported this slideshow.

Jak dokumentům automaticky přiřadit hesla PSH (Jindřich Mynarz, Ctibor Škuta)

1

Share

1 of 35
1 of 35

Jak dokumentům automaticky přiřadit hesla PSH (Jindřich Mynarz, Ctibor Škuta)

1

Share

Download to read offline

Chcete vědět víc? Mnoho dalších prezentací, videí z konferencí, fotografií i jiných dokumentů je k dispozici v institucionálním repozitáři NTK: http://repozitar.techlib.cz

Chcete vědět víc? Mnoho dalších prezentací, videí z konferencí, fotografií i jiných dokumentů je k dispozici v institucionálním repozitáři NTK: http://repozitar.techlib.cz

More Related Content

More from Národní technická knihovna (NTK)

Related Audiobooks

Free with a 14 day trial from Scribd

See all

Jak dokumentům automaticky přiřadit hesla PSH (Jindřich Mynarz, Ctibor Škuta)

  1. 1. http://bit.ly/psh-indexace
  2. 2. Google Patents
  3. 3. Sumarizace
  4. 4. Motivace
  5. 5. Zahlcení informacemi
  6. 6. Škálovatelnost indexace
  7. 7. Vyhledávání a prohlížení
  8. 8. Automatická indexace
  9. 9. http://www.cs.waikato.ac.nz/~olena/publications/olena_medelyan_phd_thesis_July2009.pdf
  10. 10. Strojové učení ● Učení korespondencí mezi rysy dokumentu a předmětovými hesly ● Kopírování a aplikace odpozorovaných pravidel
  11. 11. Zdroje automatické indexace 1. analýza indexovaného dokumentu 2. analýza použitého řízeného slovníku 3. analýza způsobu použití daného slovníku nad korpusem dokumentů Výsledkem strojového učení nad zdroji automatické indexace je indexační model.
  12. 12. Komponenty
  13. 13. Indexátor http://code.google. com/p/maui-indexer/
  14. 14. Korpus plných textů http://nusl.techlib.cz/
  15. 15. Řízený slovník http://psh.techlib.cz/skos/
  16. 16. Automatické přiřazování hesel PSH
  17. 17. Zdroj
  18. 18. Předzpracování dokumentu ● přizpůsobeno češtině ● normalizace ● odstranění nevýznamových výrazů ○ založeny na nejfrekventovanějších výrazech v Českém národním korpusu FF UK ● redukce na slovní kořeny ○ dostupné české stemmery jsou příliš agresivní
  19. 19. Generování kandidátů
  20. 20. Zdroj
  21. 21. Zdroj
  22. 22. Filtrování kandidátů
  23. 23. Demo http://invenio2.ntkcz.cz/indexer/ http://maui-indexer.appspot.com/
  24. 24. Výzvy pro indexaci ● Indexování vytvářené uživateli ● Využití herních prvků (http://www.librarything. com/coverguess) ● Efektivní využití v uživatelských rozhraních
  25. 25. <mailto:jindrich.mynarz@techlib.cz> <mailto:ctibor.skuta@techlib.cz> <mailto:tomas.muller@techlib.cz> Ikony převzaty z http://thenounproject.com/.

×