Úvod do Strojového Učení

        David Filip
Obsah Přednášky

 
    • Úvod
       o Vysvětlení pojmu
       o Motivační příklad
    • Přehled typických úloh
    • Jak ...
Strojové Učení

Metodologie pro získávání informací z dat.
 
Mezní obor mezi umělou inteligencí a statistikou.
 
Oblasti s...
Roboti (1/3)
Potřebujeme najít pravidla pro rozeznání přátelských a nepřátelských robotů.
Roboti (2/3)



Tvar Hlavy    Úsměv   Ozdoba krku   Tvar těla     Předmět v ruce   Přátelský?

   Kruh        ne       kra...
Roboti (3/3)
Něco Reálnějšího

Máme web a chceme optimalizovat landing page pro
aktuálního uživatele.
 
1. Získáme a identifikujeme důl...
Typické Úlohy
Typické Využití Strojového Učení

    •   Cílený marketing
    •   Cross selling
    •   Predikce odchodu zákazníků
    • ...
Klasifikace


Určení třídy objektu:
• Příklad s roboty (rozhodovací stromy)
• Spam filter (naive Bayes)
• Inteligentní výb...
Clustering

 
Hledání skupin objektů v datech:
  • Google News
  • Výsledky průzkumů a anket
  • Informace o chování zákaz...
Filtering


Výběr potencionálně zajímavých objektů:
  • na základě shody obsahu
  • na základě podobnosti uživatelů
 
  • ...
Jak začít
Proč se věnovat strojovému učení

 
    • Součastná řešení jsou tak naivní, že nedá práci vytvořit
      lepší
    • I ve ...
Prerekvizity

• Znalost formálního zápisu a důkazů (!)
• Matematika:
   o Lineární algebra
   o Pravděpodobnost
   o Stati...
Implementace

    • Nutná znalost algoritmů
    • Většina práce je předzpracování dat a ladění parametrů
 
 
    • Knihovn...
Typické Problémy

Velké nebezpečí u lidí, kteří tomu rozumí "tak trochem".
 
  • Validita Modelu:
    o jsou výsledky sprá...
Knihy




Česky: Dobývání znalostí z databází
Odkazy

Anglicky:
  http://www.autonlab.org/tutorials/index.html
  http://www.cs.utexas.edu/~mooney/cs391L/
  http://www.s...
Otázky?



  davidfilip@gmail.com
     twitter.com/dejv
          dejv.eu
Slidy: slideshare.net/dejv
Upcoming SlideShare
Loading in …5
×

Uvod Do Strojoveho Uceni

1,048 views

Published on

Published in: Technology
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
1,048
On SlideShare
0
From Embeds
0
Number of Embeds
53
Actions
Shares
0
Downloads
7
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Uvod Do Strojoveho Uceni

  1. 1. Úvod do Strojového Učení David Filip
  2. 2. Obsah Přednášky   • Úvod o Vysvětlení pojmu o Motivační příklad • Přehled typických úloh • Jak začít o Prerekvizity o Implementace o Knihy + odkazy   Zaměřeno na zodpovězení otázky “Proč?”, opomíjí “Jak?”
  3. 3. Strojové Učení Metodologie pro získávání informací z dat.   Mezní obor mezi umělou inteligencí a statistikou.   Oblasti strojového učení: • Klasifikace • Seskupování • Vyhledávání • Doporučování • Hledání vzorů chování • a další (počítačové vidění, robotika)    
  4. 4. Roboti (1/3) Potřebujeme najít pravidla pro rozeznání přátelských a nepřátelských robotů.
  5. 5. Roboti (2/3) Tvar Hlavy Úsměv Ozdoba krku Tvar těla Předmět v ruce Přátelský? Kruh ne kravata čtverec šavle ne Čtverec ano motýlek čtverec nic ano Kruh ne motýlek kruh šavle ano Trojúhelník ne kravata čtverec balón ne Kruh ano nic trojúhelník květina ne Trojúhelník ne nic trojúhelník balón ano Trojúhelník ano kravata kruh nic ne Kruh ano kravata kruh nic ano
  6. 6. Roboti (3/3)
  7. 7. Něco Reálnějšího Máme web a chceme optimalizovat landing page pro aktuálního uživatele.   1. Získáme a identifikujeme důležité (historické)  Referrer, page views, přečtení stránky About 1. Vybudujeme rozhodovací strom 2. Sledujeme chování návštšníka a nabízíme promotion   Promotion:  Zvýraznění nejpravděpodobnějšího plánu  Nabídka slevy  ...  
  8. 8. Typické Úlohy
  9. 9. Typické Využití Strojového Učení • Cílený marketing • Cross selling • Predikce odchodu zákazníků • Fraud detection • Credit risk • Spam filtering • Recommendation engines • Farmacie  
  10. 10. Klasifikace Určení třídy objektu: • Příklad s roboty (rozhodovací stromy) • Spam filter (naive Bayes) • Inteligentní výběr zajímavých článků
  11. 11. Clustering   Hledání skupin objektů v datech: • Google News • Výsledky průzkumů a anket • Informace o chování zákazníků • Seznam kupovaných výrobků      V omezeném rozsahu možno využít SQL, pro lepší výsledky existují specializované algoritmy.
  12. 12. Filtering Výběr potencionálně zajímavých objektů: • na základě shody obsahu • na základě podobnosti uživatelů   • Doporučování na Amazonu • Last.fm doporučení hudebních skupin • Netflix • News feed na Facebooku
  13. 13. Jak začít
  14. 14. Proč se věnovat strojovému učení   • Součastná řešení jsou tak naivní, že nedá práci vytvořit lepší • I ve velmi malém týmu je možno vytvořit velké věci • Vysoká bariéra pro vstup nových hráčů • Nenasycenost trhu
  15. 15. Prerekvizity • Znalost formálního zápisu a důkazů (!) • Matematika: o Lineární algebra o Pravděpodobnost o Statistika • Informatika: o Logika (stačí výroková a predikátová) o Analýza algoritmů, datové struktury, ... o Teorie grafů
  16. 16. Implementace • Nutná znalost algoritmů • Většina práce je předzpracování dat a ladění parametrů     • Knihovny pro většinu jazyků: o Ruby: ai4r o Python: PyML, SciPy o Java: Weka, Java-ML   • Nástroje: o Free: Weka, R, Orange, ... o Placené: Matlab, SAS, SPSS, Mathematica, ...
  17. 17. Typické Problémy Velké nebezpečí u lidí, kteří tomu rozumí "tak trochem".   • Validita Modelu: o jsou výsledky správné? o black-box metody   • Neintuitivnost většiny problémů  
  18. 18. Knihy Česky: Dobývání znalostí z databází
  19. 19. Odkazy Anglicky: http://www.autonlab.org/tutorials/index.html http://www.cs.utexas.edu/~mooney/cs391L/ http://www.stanford.edu/class/cs229/materials.html Česky: http://sorry.vse.cz/~berka/4IZ450/
  20. 20. Otázky? davidfilip@gmail.com twitter.com/dejv dejv.eu Slidy: slideshare.net/dejv

×