SlideShare a Scribd company logo
Strojové Učení v Marketingu
          David Filip
Obsah Prezentace

Přiblížení pojmu strojového učení
Oblasti použití
Příklady:
    analýza registrací
    optimalizace landing page
    hledání skupin zákazníků
Implementace metod strojového učení
Typické problémy
Strojové Učení
Metodologie pro získávání skrytých informací z dat

Mezní obor mezi umělou inteligencí a statistikou
      Klasifikace
      Seskupování
      Vyhledávání
      Doporučování
      Hledání vzorů chování

A další, pro nás teď nezajímavé oblasti
Typické Použití

   Cílený marketing
   Cross selling
   Odchod zákazníků
   Fraud detection
   Credit risk
   Spam filtering
   Recommendation engines
   Farmacie

a další
Příklady
Analýza Registrací (1/3)
Provozujeme aplikaci a máme zájem zjistit, které faktory
ovlivňují registrace

Zjištěné údaje (analytics, logy apod).
        Referrer      Lokalita    Četl FAQ   Page Views   Registrace
     Google        USA           Ne          18             None
     Seznam        CR            Ano         25             Free
     Google        India         Ne          2              None
     (Direct)      USA           Ne          14             Free
     Google        USA           Ano         25           Premium


                                       ...
Rozhodovací Stromy
  V praxi nejpoužívanější metoda
  Jednoduchá na interpretaci




Jako vstupní data možno použít:
   číselné údaje
   logické hodnoty
   textové popisky kategorií
Funguje i s chybějící informací
Analýza Registrací (2/3)
Analýza Registrací (3/3)

Problémy:
   Výsledek je příliš vázán na data
   Strom může být příliš rozsáhlý

Řešením je prořezání stromu: odstranění částí, které podstatně
neovlivňují výsledek.

Prořezávání se dle potřeby děje automaticky či manuálně.
Optimalizace Landing Page

Využití předchozího přístupu "on the fly":

1.   Vygenerujeme a prořežeme strom
2.   Zaznamenáme chování uživatele
3.   ????*
4.   Profit

* = dle klasifikace nabízíme speciální nabídku
Clustering (1/2)

Hledání skupin podobných objektů v datech.


Objektem může být:
   Výsledky průzkumů a anket
   Informace o chování zákazníků
   Seznam kupovaných výrobků


Problém velkých datasetů
Clustering (2/2)

Omezeně můžeme využít obyčejné SQL

Pro hledání složitějších závislostí existují lepší postupy:

   hierarchické členění
   k-means clustering: pro hledání k skupin
   density based clustering
Implementační detaily
Implementace postupů

Používání standardních algoritmů
Prakticky nulová invence implementátora
Knihovny pro ML pro téměř každý jazyk
Samostatné nástroje:
   Free: Weka, R, Orange, ...
   Placené: SPSS, SAS, Matlab, ...
Typické problémy

Velké nebezpečí u lidí, kteří tomu rozumí "tak trochem".


Validnost modelu:
   jsou výsledky správné?
   "bias" problém
   black-box metody

Problémy s intuicí:
   část problémů je navíc neintuitivních
Úvod pro programátory




Česky: Dobývání znalostí z databází
Dotazy?

More Related Content

Similar to Strojove Uceni V Marketingu

05 online ws měření chování na internetu – stemmark jan fait
05 online ws měření chování na internetu – stemmark jan fait05 online ws měření chování na internetu – stemmark jan fait
05 online ws měření chování na internetu – stemmark jan faitSIMAR
 
01 online úvod final huntova a tucek
01 online úvod final huntova a tucek01 online úvod final huntova a tucek
01 online úvod final huntova a tucekSIMAR
 
Nejčastější neduhy v datech Google Analytics
Nejčastější neduhy v datech Google AnalyticsNejčastější neduhy v datech Google Analytics
Nejčastější neduhy v datech Google AnalyticsTaste Medio
 
25. 2. 2016 produktivita a efektivita v digitálním světě - v1.01
25. 2. 2016   produktivita a efektivita v digitálním světě - v1.0125. 2. 2016   produktivita a efektivita v digitálním světě - v1.01
25. 2. 2016 produktivita a efektivita v digitálním světě - v1.01Jan Janca
 
Datadriven management
Datadriven managementDatadriven management
Datadriven managementRevoltBI
 
Nástroje pro vizualizaci a analýzu dat (nejen) ve fyzikální praktiku
Nástroje pro vizualizaci a analýzu dat (nejen) ve fyzikální praktiku Nástroje pro vizualizaci a analýzu dat (nejen) ve fyzikální praktiku
Nástroje pro vizualizaci a analýzu dat (nejen) ve fyzikální praktiku Michal Černý
 
BI and the competitive advantage of the business
BI and the competitive advantage of the businessBI and the competitive advantage of the business
BI and the competitive advantage of the businessJaroslav Smarda
 
Webová analytika (ČZU - Webdesign, 11. 12. 2013)
Webová analytika (ČZU - Webdesign, 11. 12. 2013)Webová analytika (ČZU - Webdesign, 11. 12. 2013)
Webová analytika (ČZU - Webdesign, 11. 12. 2013)Sherpas
 
AI Restart 2024: Lukáš Kostka - Automatizace analýzy klíčových slov aneb změn...
AI Restart 2024: Lukáš Kostka - Automatizace analýzy klíčových slov aneb změn...AI Restart 2024: Lukáš Kostka - Automatizace analýzy klíčových slov aneb změn...
AI Restart 2024: Lukáš Kostka - Automatizace analýzy klíčových slov aneb změn...Taste
 
Jak na Smartlook, nejen pro Shoptet
Jak na Smartlook, nejen pro ShoptetJak na Smartlook, nejen pro Shoptet
Jak na Smartlook, nejen pro ShoptetMarek Čech
 
Seologer novinky v nástroji
Seologer novinky v nástrojiSeologer novinky v nástroji
Seologer novinky v nástrojiMarketing Miner
 
Algoritmy a sociální sítě - stručný úvod
Algoritmy a sociální sítě - stručný úvodAlgoritmy a sociální sítě - stručný úvod
Algoritmy a sociální sítě - stručný úvodJosef Šlerka
 

Similar to Strojove Uceni V Marketingu (16)

05 online ws měření chování na internetu – stemmark jan fait
05 online ws měření chování na internetu – stemmark jan fait05 online ws měření chování na internetu – stemmark jan fait
05 online ws měření chování na internetu – stemmark jan fait
 
01 online úvod final huntova a tucek
01 online úvod final huntova a tucek01 online úvod final huntova a tucek
01 online úvod final huntova a tucek
 
Nejčastější neduhy v datech Google Analytics
Nejčastější neduhy v datech Google AnalyticsNejčastější neduhy v datech Google Analytics
Nejčastější neduhy v datech Google Analytics
 
25. 2. 2016 produktivita a efektivita v digitálním světě - v1.01
25. 2. 2016   produktivita a efektivita v digitálním světě - v1.0125. 2. 2016   produktivita a efektivita v digitálním světě - v1.01
25. 2. 2016 produktivita a efektivita v digitálním světě - v1.01
 
Trable programatora
Trable programatoraTrable programatora
Trable programatora
 
Datadriven management
Datadriven managementDatadriven management
Datadriven management
 
Nástroje pro vizualizaci a analýzu dat (nejen) ve fyzikální praktiku
Nástroje pro vizualizaci a analýzu dat (nejen) ve fyzikální praktiku Nástroje pro vizualizaci a analýzu dat (nejen) ve fyzikální praktiku
Nástroje pro vizualizaci a analýzu dat (nejen) ve fyzikální praktiku
 
BI and the competitive advantage of the business
BI and the competitive advantage of the businessBI and the competitive advantage of the business
BI and the competitive advantage of the business
 
Webová analytika (ČZU - Webdesign, 11. 12. 2013)
Webová analytika (ČZU - Webdesign, 11. 12. 2013)Webová analytika (ČZU - Webdesign, 11. 12. 2013)
Webová analytika (ČZU - Webdesign, 11. 12. 2013)
 
BIDataMining
BIDataMiningBIDataMining
BIDataMining
 
AI Restart 2024: Lukáš Kostka - Automatizace analýzy klíčových slov aneb změn...
AI Restart 2024: Lukáš Kostka - Automatizace analýzy klíčových slov aneb změn...AI Restart 2024: Lukáš Kostka - Automatizace analýzy klíčových slov aneb změn...
AI Restart 2024: Lukáš Kostka - Automatizace analýzy klíčových slov aneb změn...
 
Adobe je dobré
Adobe je dobréAdobe je dobré
Adobe je dobré
 
Jak na Smartlook, nejen pro Shoptet
Jak na Smartlook, nejen pro ShoptetJak na Smartlook, nejen pro Shoptet
Jak na Smartlook, nejen pro Shoptet
 
Seologer novinky v nástroji
Seologer novinky v nástrojiSeologer novinky v nástroji
Seologer novinky v nástroji
 
Algoritmy a sociální sítě - stručný úvod
Algoritmy a sociální sítě - stručný úvodAlgoritmy a sociální sítě - stručný úvod
Algoritmy a sociální sítě - stručný úvod
 
Strukturovaná data
Strukturovaná dataStrukturovaná data
Strukturovaná data
 

Strojove Uceni V Marketingu

  • 1. Strojové Učení v Marketingu David Filip
  • 2. Obsah Prezentace Přiblížení pojmu strojového učení Oblasti použití Příklady: analýza registrací optimalizace landing page hledání skupin zákazníků Implementace metod strojového učení Typické problémy
  • 3. Strojové Učení Metodologie pro získávání skrytých informací z dat Mezní obor mezi umělou inteligencí a statistikou Klasifikace Seskupování Vyhledávání Doporučování Hledání vzorů chování A další, pro nás teď nezajímavé oblasti
  • 4. Typické Použití Cílený marketing Cross selling Odchod zákazníků Fraud detection Credit risk Spam filtering Recommendation engines Farmacie a další
  • 6. Analýza Registrací (1/3) Provozujeme aplikaci a máme zájem zjistit, které faktory ovlivňují registrace Zjištěné údaje (analytics, logy apod). Referrer Lokalita Četl FAQ Page Views Registrace Google USA Ne 18 None Seznam CR Ano 25 Free Google India Ne 2 None (Direct) USA Ne 14 Free Google USA Ano 25 Premium ...
  • 7. Rozhodovací Stromy V praxi nejpoužívanější metoda Jednoduchá na interpretaci Jako vstupní data možno použít: číselné údaje logické hodnoty textové popisky kategorií Funguje i s chybějící informací
  • 9. Analýza Registrací (3/3) Problémy: Výsledek je příliš vázán na data Strom může být příliš rozsáhlý Řešením je prořezání stromu: odstranění částí, které podstatně neovlivňují výsledek. Prořezávání se dle potřeby děje automaticky či manuálně.
  • 10. Optimalizace Landing Page Využití předchozího přístupu "on the fly": 1. Vygenerujeme a prořežeme strom 2. Zaznamenáme chování uživatele 3. ????* 4. Profit * = dle klasifikace nabízíme speciální nabídku
  • 11. Clustering (1/2) Hledání skupin podobných objektů v datech. Objektem může být: Výsledky průzkumů a anket Informace o chování zákazníků Seznam kupovaných výrobků Problém velkých datasetů
  • 12. Clustering (2/2) Omezeně můžeme využít obyčejné SQL Pro hledání složitějších závislostí existují lepší postupy: hierarchické členění k-means clustering: pro hledání k skupin density based clustering
  • 14. Implementace postupů Používání standardních algoritmů Prakticky nulová invence implementátora Knihovny pro ML pro téměř každý jazyk Samostatné nástroje: Free: Weka, R, Orange, ... Placené: SPSS, SAS, Matlab, ...
  • 15. Typické problémy Velké nebezpečí u lidí, kteří tomu rozumí "tak trochem". Validnost modelu: jsou výsledky správné? "bias" problém black-box metody Problémy s intuicí: část problémů je navíc neintuitivních
  • 16. Úvod pro programátory Česky: Dobývání znalostí z databází