Výzkum ve fulltextu

  • 859 views
Uploaded on

 

  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Be the first to comment
    Be the first to like this
No Downloads

Views

Total Views
859
On Slideshare
0
From Embeds
0
Number of Embeds
2

Actions

Shares
Downloads
0
Comments
0
Likes
0

Embeds 0

No embeds

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
    No notes for slide

Transcript

  • 1. Výzkum ve fulltextuDen s vývojáři 2012Jiří Materna
  • 2. Čím se zabýváme?
  • 3. Strojové učení
  • 4. Klasifikační úloha
  • 5. Filtrování nevhodného obsahu
  • 6. Filtrování nevhodného obsahuPodíl porna na internetu: 1.5 %
  • 7. Regresní úloha
  • 8. Rankování
  • 9. Zpracování přirozeného jazyka
  • 10. Oprava uživatelských dotazů
  • 11. Oprava uživatelských dotazůUživatel hledá dotaz „java“:• myslí to, co napsal (programovací jazyk)• myslí „jawa“ (značku motorek) a jde o chybu• myslí něco úplně jiného
  • 12. Podobnost slov
  • 13. SynonymieKdy je možná substituce synonym?Příklad: překládat/tlumočit(1) Student jazykové školy překládal projev zahraničního hosta.(2) Tu hromadu písku překládal celý den.
  • 14. Podobnost dokumentůDoc1: Student jazykovéškoly překládal projevzahraničního hosta.Doc2: Tu hromadu pískupřekládal celý den.Doc3: Šla Nanynka do zelí.Pseudodoc: simultánnítlumočení
  • 15. Další lingvistické oříšky• detekce jazyka• doplnění diakritiky• morfologický guesser• odvozování slov• práce se zkratkami• …
  • 16. Děkuji za pozornost…Jiří Maternae-mail: jiri.materna@firma.seznam.czTwitter: @JiriMaterna