http://bit.ly/psh-indexace
Google Patents
Sumarizace
Motivace
Zahlcení informacemi
Škálovatelnost  indexace
Vyhledávání a  prohlížení
Automatická indexace
http://www.cs.waikato.ac.nz/~olena/publications/olena_medelyan_phd_thesis_July2009.pdf
Strojové učení● Učení korespondencí mezi rysy  dokumentu a předmětovými hesly● Kopírování a aplikace odpozorovaných  pravi...
Zdroje automatické indexace 1. analýza indexovaného dokumentu 2. analýza použitého řízeného slovníku 3. analýza způsobu po...
Komponenty
Indexátor http://code.google. com/p/maui-indexer/
Korpus plných textů     http://nusl.techlib.cz/
Řízený slovník  http://psh.techlib.cz/skos/
Automatické přiřazování     hesel PSH
Zdroj
Předzpracování dokumentu● přizpůsobeno češtině● normalizace● odstranění nevýznamových výrazů    ○ založeny na nejfrekvento...
Generování kandidátů
Zdroj
Zdroj
Filtrování kandidátů
Demohttp://invenio2.ntkcz.cz/indexer/http://maui-indexer.appspot.com/
Výzvy pro indexaci● Indexování vytvářené uživateli● Využití herních prvků (http://www.librarything.  com/coverguess)● Efek...
<mailto:jindrich.mynarz@techlib.cz><mailto:ctibor.skuta@techlib.cz><mailto:tomas.muller@techlib.cz>Ikony převzaty z http:/...
Jak dokumentům automaticky přiřadit hesla PSH (Jindřich Mynarz, Ctibor Škuta)
Jak dokumentům automaticky přiřadit hesla PSH (Jindřich Mynarz, Ctibor Škuta)
Jak dokumentům automaticky přiřadit hesla PSH (Jindřich Mynarz, Ctibor Škuta)
Jak dokumentům automaticky přiřadit hesla PSH (Jindřich Mynarz, Ctibor Škuta)
Jak dokumentům automaticky přiřadit hesla PSH (Jindřich Mynarz, Ctibor Škuta)
Jak dokumentům automaticky přiřadit hesla PSH (Jindřich Mynarz, Ctibor Škuta)
Jak dokumentům automaticky přiřadit hesla PSH (Jindřich Mynarz, Ctibor Škuta)
Jak dokumentům automaticky přiřadit hesla PSH (Jindřich Mynarz, Ctibor Škuta)
Jak dokumentům automaticky přiřadit hesla PSH (Jindřich Mynarz, Ctibor Škuta)
Jak dokumentům automaticky přiřadit hesla PSH (Jindřich Mynarz, Ctibor Škuta)
Upcoming SlideShare
Loading in …5
×

Jak dokumentům automaticky přiřadit hesla PSH (Jindřich Mynarz, Ctibor Škuta)

1,018 views
940 views

Published on

Chcete vědět víc? Mnoho dalších prezentací, videí z konferencí, fotografií i jiných dokumentů je k dispozici v institucionálním repozitáři NTK: http://repozitar.techlib.cz

0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
1,018
On SlideShare
0
From Embeds
0
Number of Embeds
42
Actions
Shares
0
Downloads
6
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Jak dokumentům automaticky přiřadit hesla PSH (Jindřich Mynarz, Ctibor Škuta)

  1. 1. http://bit.ly/psh-indexace
  2. 2. Google Patents
  3. 3. Sumarizace
  4. 4. Motivace
  5. 5. Zahlcení informacemi
  6. 6. Škálovatelnost indexace
  7. 7. Vyhledávání a prohlížení
  8. 8. Automatická indexace
  9. 9. http://www.cs.waikato.ac.nz/~olena/publications/olena_medelyan_phd_thesis_July2009.pdf
  10. 10. Strojové učení● Učení korespondencí mezi rysy dokumentu a předmětovými hesly● Kopírování a aplikace odpozorovaných pravidel
  11. 11. Zdroje automatické indexace 1. analýza indexovaného dokumentu 2. analýza použitého řízeného slovníku 3. analýza způsobu použití daného slovníku nad korpusem dokumentůVýsledkem strojového učení nad zdroji automatické indexace jeindexační model.
  12. 12. Komponenty
  13. 13. Indexátor http://code.google. com/p/maui-indexer/
  14. 14. Korpus plných textů http://nusl.techlib.cz/
  15. 15. Řízený slovník http://psh.techlib.cz/skos/
  16. 16. Automatické přiřazování hesel PSH
  17. 17. Zdroj
  18. 18. Předzpracování dokumentu● přizpůsobeno češtině● normalizace● odstranění nevýznamových výrazů ○ založeny na nejfrekventovanějších výrazech v Českém národním korpusu FF UK● redukce na slovní kořeny ○ dostupné české stemmery jsou příliš agresivní
  19. 19. Generování kandidátů
  20. 20. Zdroj
  21. 21. Zdroj
  22. 22. Filtrování kandidátů
  23. 23. Demohttp://invenio2.ntkcz.cz/indexer/http://maui-indexer.appspot.com/
  24. 24. Výzvy pro indexaci● Indexování vytvářené uživateli● Využití herních prvků (http://www.librarything. com/coverguess)● Efektivní využití v uživatelských rozhraních
  25. 25. <mailto:jindrich.mynarz@techlib.cz><mailto:ctibor.skuta@techlib.cz><mailto:tomas.muller@techlib.cz>Ikony převzaty z http://thenounproject.com/.

×