Výzkum ve fulltextu

1,076 views

Published on

0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
1,076
On SlideShare
0
From Embeds
0
Number of Embeds
398
Actions
Shares
0
Downloads
0
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Výzkum ve fulltextu

  1. 1. Výzkum ve fulltextuDen s vývojáři 2012Jiří Materna
  2. 2. Čím se zabýváme?
  3. 3. Strojové učení
  4. 4. Klasifikační úloha
  5. 5. Filtrování nevhodného obsahu
  6. 6. Filtrování nevhodného obsahuPodíl porna na internetu: 1.5 %
  7. 7. Regresní úloha
  8. 8. Rankování
  9. 9. Zpracování přirozeného jazyka
  10. 10. Oprava uživatelských dotazů
  11. 11. Oprava uživatelských dotazůUživatel hledá dotaz „java“:• myslí to, co napsal (programovací jazyk)• myslí „jawa“ (značku motorek) a jde o chybu• myslí něco úplně jiného
  12. 12. Podobnost slov
  13. 13. SynonymieKdy je možná substituce synonym?Příklad: překládat/tlumočit(1) Student jazykové školy překládal projev zahraničního hosta.(2) Tu hromadu písku překládal celý den.
  14. 14. Podobnost dokumentůDoc1: Student jazykovéškoly překládal projevzahraničního hosta.Doc2: Tu hromadu pískupřekládal celý den.Doc3: Šla Nanynka do zelí.Pseudodoc: simultánnítlumočení
  15. 15. Další lingvistické oříšky• detekce jazyka• doplnění diakritiky• morfologický guesser• odvozování slov• práce se zkratkami• …
  16. 16. Děkuji za pozornost…Jiří Maternae-mail: jiri.materna@firma.seznam.czTwitter: @JiriMaterna

×