SlideShare a Scribd company logo
1 of 34
Základy strojového učení
DataRestart 2016
Michal Illich
Michal Illich
Obsah
1. Kdo používá strojové učení?
2. Kde ho můžete použít vy
3a. Jaké modely používat?
3b. Dva jednoduché příklady
4. Co s tím děláme my
5. Shrnutí
Kdo používá produkty strojového učení?
Kde se používá na webu - I
Kde se používá na webu - II
Kde se používá na webu - III
Mimo web
Siri
OCR
Self-driving cars
Kde ho můžete použít vy?
Ema má e-shop...
Skladovost
● Které zboží mám nakoupit na sklad?
● Cíl:
– Minimalizace ceny skladovaného zboží
– Při maximalizace prodejů
Cenotvorba
● Jakou mám nastavit marži?
(u konkrétního výrobku)
● Cíl:
– Maximální celkový zisk
(přičemž nižší cena znamená více prodejů, ale s nižší marží...)
Parametry zboží
● Mám desítky tisíc produktů v e-shopu, jak k nim
doplnit informace (technické specifikace)?
● Cíl:
– Informovat zákazníka a umožnit vyhledávání
– Ale minimalizovat náklady na získání informací
Doporučování
● Zákazník si koupil X, jaká Y mu nabídnout?
● Cíl:
– Prodat více (nebo častěji)
Jaké modely se používají?
Co je to vlastně model?
Krabička
● Má vstupy
● Má výstup(y)
● a „uvnitř je chytrá“
Jak model vznikne?
Učením!
1. Vyberete algoritmus (a jeho parametry)
2. Natrénujete model (na minulých datech)
3. Pak jej používáte (na nových datech)
Lineární regrese
1. Každý vstup má přiřazenou váhu
2. Vstupy prostě vynásobím váhou.
A všechno to sečtu.
3. A mám výsledek.
Lineární regrese - příklad
Marže = 3
– 0.2 * PočetKonkurentůCoToMajíSkladem
– 0.3 * PočetKonkurentůCoToMajíLevnější
+ 0.8 * JeToNovinka
+ 0.5 * MámSklademPosledníKus
Lineární regrese - pokračování
Co udělá strojové učení lépe než člověk?
● zanalyzuje obrovská data
● určí koeficienty „matematicky optimálně“
● vybere ty správné vstupy
● může to vše dělat každou noc automaticky
Rozhodovací stromy
Neuronová síť
Neuronová síť
Velmi obecná
- využitelná pro mnoho různých problémů
- špičkové výsledky zejména pro obraz a zvuk
Nelineární
Deep learning
- obrovský trend
- viz mj. i moje přednáška
Hodně „magie“
- těžká na interpretaci
- vyžaduje zkušenosti s nastavením
Kde si s ním hrajeme my
Magictable
Brandiozo
Golem
a jeden neveřejný projekt
Hledáme chyby...
Případně data rovnou dodáme
Robot to udělá
- levněji než lidé
- rychleji a na větších datech
- stejně přesně nebo lépe
Člověk zůstane v roli dohledu/učitele,
nedělá už rutinní práci.
Příklad, jak strojové učení používáme
Jak jej používáme – vysvětlení
1. Ručně navržené algoritmy spárují zdroje
Konkrétně parametry z různých zdrojů (e-shopů, webů)
2. Strojové učení umí předpovědět
které spárování je správně a které nejspíš chybně.
S přesností 97 %
3. Chybná/podezřelá spárování potlačíme
Dáme jim nižší váhu v souhrnném reportu
Open source nástroje
Neuronové sítě:
theano, keras, tensorflow, cuda-convnet
Další algoritmy:
gbm, libsvm, vowpal wabbit, sofia-kmeans, gensim
Nástroje s GUI:
weka, orange, rapid miner
Cloudové služby (proprietární):
Amazon, Azure, Google, BigML
Závěr
1/2
Mít data nestačí. Používejte je.
kreslit barevné grafy je základ, nikoliv plné využití dat
Strojové učení.
nechte stroje samotné najít si vztahy v datech
2/2
Díky!
michal@illich.cz
@michalillich
MagicTable.com
(vyplňte svůj mail, máte-li zájem)
Appendix
Zdroje obrázků:
http://www.edureka.co/blog/decision-trees/

More Related Content

Similar to Základy strojového učení

Online a open-source nástroje využitelné pro marketing aneb jak ušetřit spou...
Online a open-source nástroje využitelné pro marketing  aneb jak ušetřit spou...Online a open-source nástroje využitelné pro marketing  aneb jak ušetřit spou...
Online a open-source nástroje využitelné pro marketing aneb jak ušetřit spou...
Barbora Buchtová
 

Similar to Základy strojového učení (20)

Jak rozpoznat hodnotné informace
Jak rozpoznat hodnotné informaceJak rozpoznat hodnotné informace
Jak rozpoznat hodnotné informace
 
Prezentace bibliotheca
Prezentace bibliothecaPrezentace bibliotheca
Prezentace bibliotheca
 
Online a open-source nástroje využitelné pro marketing aneb jak ušetřit spou...
Online a open-source nástroje využitelné pro marketing  aneb jak ušetřit spou...Online a open-source nástroje využitelné pro marketing  aneb jak ušetřit spou...
Online a open-source nástroje využitelné pro marketing aneb jak ušetřit spou...
 
AI Restart 2024: Lukáš Kostka - Automatizace analýzy klíčových slov aneb změn...
AI Restart 2024: Lukáš Kostka - Automatizace analýzy klíčových slov aneb změn...AI Restart 2024: Lukáš Kostka - Automatizace analýzy klíčových slov aneb změn...
AI Restart 2024: Lukáš Kostka - Automatizace analýzy klíčových slov aneb změn...
 
Žijeme s uživateli
Žijeme s uživateliŽijeme s uživateli
Žijeme s uživateli
 
Co nového pod sluncem? - Ivan Pilný
Co nového pod sluncem? - Ivan PilnýCo nového pod sluncem? - Ivan Pilný
Co nového pod sluncem? - Ivan Pilný
 
Kouzelné slovíčko je akceschopnost
Kouzelné slovíčko je akceschopnostKouzelné slovíčko je akceschopnost
Kouzelné slovíčko je akceschopnost
 
Analýza klíčových slov - Plzeňský Barcamp 2015
Analýza klíčových slov - Plzeňský Barcamp 2015Analýza klíčových slov - Plzeňský Barcamp 2015
Analýza klíčových slov - Plzeňský Barcamp 2015
 
SEO Restart 2024: Martin Žatkovič - Můžeme jakožto SEO konzultanti uspět v Go...
SEO Restart 2024: Martin Žatkovič - Můžeme jakožto SEO konzultanti uspět v Go...SEO Restart 2024: Martin Žatkovič - Můžeme jakožto SEO konzultanti uspět v Go...
SEO Restart 2024: Martin Žatkovič - Můžeme jakožto SEO konzultanti uspět v Go...
 
SEO Restart 2023: Vojtěch Fiala - Praktické využití AI v SEO pro začátečníky ...
SEO Restart 2023: Vojtěch Fiala - Praktické využití AI v SEO pro začátečníky ...SEO Restart 2023: Vojtěch Fiala - Praktické využití AI v SEO pro začátečníky ...
SEO Restart 2023: Vojtěch Fiala - Praktické využití AI v SEO pro začátečníky ...
 
Profiling PHP Applications
Profiling PHP ApplicationsProfiling PHP Applications
Profiling PHP Applications
 
25. 2. 2016 produktivita a efektivita v digitálním světě - v1.01
25. 2. 2016   produktivita a efektivita v digitálním světě - v1.0125. 2. 2016   produktivita a efektivita v digitálním světě - v1.01
25. 2. 2016 produktivita a efektivita v digitálním světě - v1.01
 
Social media monitoring
Social media monitoringSocial media monitoring
Social media monitoring
 
Datadriven management
Datadriven managementDatadriven management
Datadriven management
 
Ta pravá data pro správná rozhodnutí
Ta pravá data pro správná rozhodnutíTa pravá data pro správná rozhodnutí
Ta pravá data pro správná rozhodnutí
 
Janek Žežula - V čem je platforma Targito unikátní a jak vám usnadní práci?
Janek Žežula - V čem je platforma Targito unikátní a jak vám usnadní práci?Janek Žežula - V čem je platforma Targito unikátní a jak vám usnadní práci?
Janek Žežula - V čem je platforma Targito unikátní a jak vám usnadní práci?
 
Jak neztratit brand při tvorbě webu?
Jak neztratit brand při tvorbě webu?Jak neztratit brand při tvorbě webu?
Jak neztratit brand při tvorbě webu?
 
Big Data: reálné aplikace pro business - Odborna snidane 30. 11. 2016
Big Data: reálné aplikace pro business - Odborna snidane 30. 11. 2016Big Data: reálné aplikace pro business - Odborna snidane 30. 11. 2016
Big Data: reálné aplikace pro business - Odborna snidane 30. 11. 2016
 
Učící se společnost 8
Učící se společnost 8Učící se společnost 8
Učící se společnost 8
 
Webová analytika (ČZU - Webdesign, 11. 12. 2013)
Webová analytika (ČZU - Webdesign, 11. 12. 2013)Webová analytika (ČZU - Webdesign, 11. 12. 2013)
Webová analytika (ČZU - Webdesign, 11. 12. 2013)
 

Základy strojového učení