Jak pomocí
machine learningu
vytěžovat data
z RTB i v CRM?
Prezentující
Eliška Králová
• Digital Data Manager v České spořitelně
• Vedení týmu zaměřeného na zpracování a aktivaci online dat
Prezentující
Eliška Králová
• Digital Data Manager v České spořitelně
• Vedení týmu zaměřeného na zpracování a aktivaci online dat
Jakub Štěch
• Seniorní Data Scientist v DataSentics​
• PhD student FJFI ČVUT v Praze (Matematika ​statistika)
NEVYUŽITÝ POTENCIÁL.
DETERMINISTICKÁ
BYZNYSOVÁ PRAVIDLA.
RUČNÍ
ZPRACOVÁNÍ.
HLEDÁNÍ
SOUVISLOSTÍ.
ZDLOUHAVOST.
TĚŽKOPÁDNOST.
BARIÉRA.
REKLAMA WEB INTERNETOVÉ BANKOVNICTVÍ DALŠÍ ZDROJE
ONLINE
SVĚT
OFFLINE
SVĚT
POBOČKY TRANSAKCE MAIL/SMS/PUSH CALLCENTRA
3rd party
PROPOJENÍ.
FLEXIBILITA.
AUTOMATIZACE.
UMĚLÁ
INTELIGENCE.
REKLAMA WEB INTERNETOVÉ BANKOVNICTVÍ DALŠÍ ZDROJE
ONLINE
SVĚT
OFFLINE
SVĚT
POBOČKY TRANSAKCE MAIL/SMS/PUSH CALLCENTRA
3rd party
NÁVRH ŘEŠENÍ.
SPECIALISTÉ.
REKLAMA WEB INTERNETOVÉ BANKOVNICTVÍ DALŠÍ ZDROJE
Uživatelský online profil
ONLINE
SVĚT
CLOUDOVÉ
PROSTŘEDÍ
OFFLINE
SVĚT
POBOČKY TRANSAKCE MAIL/SMS/PUSH CALLCENTRA
3rd party
REKLAMA WEB INTERNETOVÉ BANKOVNICTVÍ DALŠÍ ZDROJE
Uživatelský online profil
ONLINE
SVĚT
CLOUDOVÉ
PROSTŘEDÍ
OFFLINE
SVĚT
POBOČKY TRANSAKCE MAIL/SMS/PUSH CALLCENTRA
3rd party
REKLAMA WEB INTERNETOVÉ BANKOVNICTVÍ DALŠÍ ZDROJE
Uživatelský online profil
Klientský profil (CRM)
ONLINE
SVĚT
CLOUDOVÉ
PROSTŘEDÍ
OFFLINE
SVĚT
POBOČKY TRANSAKCE MAIL/SMS/PUSH CALLCENTRA
3rd party
ON-PREM
PROSTŘEDÍ
REKLAMA WEB INTERNETOVÉ BANKOVNICTVÍ DALŠÍ ZDROJE
Uživatelský online profil
Klientský profil (CRM)
ONLINE
SVĚT
CLOUDOVÉ
PROSTŘEDÍ
OFFLINE
SVĚT
POBOČKY TRANSAKCE MAIL/SMS/PUSH CALLCENTRA
NÁSTROJE
PRO SPRÁVU
ONLINE
REKLAMY
3rd party
NÁSTROJE
PRO SPRÁVU
KLASICKÝCH
KAMPANÍ
ON-PREM
PROSTŘEDÍ
POSTUPNĚ.
AGILNĚ.
END-TO-END.
Optimalizace nákupu reklamy
1.CÍL = Navýšení online konverzí
REKLAMA WEB INTERNETOVÉ BANKOVNICTVÍ DALŠÍ ZDROJE
Uživatelský online profil
Klientský profil (CRM)
ONLINE
SVĚT
CLOUDOVÉ
PROSTŘEDÍ
OFFLINE
SVĚT
POBOČKY TRANSAKCE MAIL/SMS/PUSH CALLCENTRA
NÁSTROJE
PRO SPRÁVU
ONLINE
REKLAMY
3rd party
NÁSTROJE
PRO SPRÁVU
KLASICKÝCH
KAMPANÍ
ON-PREM
PROSTŘEDÍ
REKLAMA WEB INTERNETOVÉ BANKOVNICTVÍ DALŠÍ ZDROJE
Uživatelský online profil
Klientský profil (CRM)
ONLINE
SVĚT
CLOUDOVÉ
PROSTŘEDÍ
OFFLINE
SVĚT
POBOČKY TRANSAKCE MAIL/SMS/PUSH CALLCENTRA
NÁSTROJE
PRO SPRÁVU
ONLINE
REKLAMY
3rd party
NÁSTROJE
PRO SPRÁVU
KLASICKÝCH
KAMPANÍ
ON-PREM
PROSTŘEDÍ
Optimalizace nákupu online reklamy
CÍL
Získat více
angažovaných
návštěv
Optimalizace nákupu online reklamy
Vstupní data pro optimalizační model
NAVŠTÍVENÉ WEBY
S REKLAMOU ČS
KLIK
ANGAŽOVANÁ
NÁVŠTĚVA WEBU
1.imprese 2.imprese 3.imprese
seznam sauto sauto 1 1
finance babiš - 1 1
finance seznam finance 0 1
lidl seznam seznam 0 1
idnes rohlik 0 0
idnes 0 0
CÍL
Získat více
angažovaných
návštěv
Optimalizace nákupu online reklamy
Vstupní data pro optimalizační model
VYSVĚTLUJÍCÍ PROMĚNNÉ
CÍL
Získat více
angažovaných
návštěv
NAVŠTÍVENÉ WEBY
S REKLAMOU ČS
KLIK
ANGAŽOVANÁ
NÁVŠTĚVA WEBU
1.imprese 2.imprese 3.imprese
seznam sauto sauto 1 1
finance babiš - 1 1
finance seznam finance 0 1
lidl seznam seznam 0 1
idnes rohlik 0 0
idnes 0 0
Optimalizace nákupu online reklamy
Vstupní data pro optimalizační model
NAVŠTÍVENÉ WEBY
S REKLAMOU ČS
KLIK
ANGAŽOVANÁ
NÁVŠTĚVA WEBU
1.imprese 2.imprese 3.imprese
seznam sauto sauto 1 1
finance babiš - 1 1
finance seznam finance 0 1
lidl seznam seznam 0 1
idnes rohlik 0 0
idnes 0 0
VYSVĚTLUJÍCÍ PROMĚNNÉ CÍL
CÍL
Získat více
angažovaných
návštěv
Optimalizace nákupu online reklamy
Nalezení signifikantních proměnných
NAVŠTÍVENÉ WEBY
S REKLAMOU ČS
KLIK
ANGAŽOVANÁ
NÁVŠTĚVA WEBU
1.imprese 2.imprese 3.imprese
seznam sauto sauto 1 1
finance babiš - 1 1
finance seznam finance 0 1
lidl seznam seznam 0 1
idnes rohlik 0 0
idnes 0 0
VYSVĚTLUJÍCÍ PROMĚNNÉ
CÍL
Získat více
angažovaných
návštěv
CÍL
Optimalizace nákupu online reklamy
Nalezení signifikantních proměnných
VYSVĚTLUJÍCÍ PROMĚNNÉ
CÍL
Získat více
angažovaných
návštěv
CÍL
NAVŠTÍVENÉ WEBY
S REKLAMOU ČS
KLIK
ANGAŽOVANÁ
NÁVŠTĚVA WEBU
1.imprese 2.imprese 3.imprese
seznam sauto sauto 1 1
finance babiš - 1 1
finance seznam finance 0 1
lidl seznam seznam 0 1
idnes rohlik 0 0
idnes 0 0
Optimalizace nákupu online reklamy
Nalezení signifikantních proměnných
VYSVĚTLUJÍCÍ PROMĚNNÉ
CÍL
Získat více
angažovaných
návštěv
CÍL
NAVŠTÍVENÉ WEBY
S REKLAMOU ČS
KLIK
ANGAŽOVANÁ
NÁVŠTĚVA WEBU
1.imprese 2.imprese 3.imprese
seznam sauto sauto 1 1
finance babiš - 1 1
finance seznam finance 0 1
lidl seznam seznam 0 1
idnes rohlik 0 0
idnes 0 0
Vstupní data = uživatelem navštívené URL adresy
Optimalizace nákupu online reklamy
Příprava machine learning modelu
1.Extrakce proměnných pomocí term frequency inverse document frequency
ze spojených URL
2.Obohacení URL o popis navštívených webů
3.Nalezení kontextu pomocí embedovacích technik word2vec
Upravená vstupní data = prediktory z klíčových slov v URL
Optimalizace nákupu online reklamy
Machine learning model
1.Extrakce proměnných pomocí term frequency inverse document frequency
ze spojených URL
2.Obohacení URL o popis navštívených webů
3.Nalezení kontextu pomocí embedovacích technik word2vec
4.Machine learning model (glm, xgboost) pro predikci pravděpodobností
angažované návštěvy na základě featur z URL adres z Adform Master Data
Optimalizace nákupu online reklamy
Machine learning model nepotřebuje expertní pravidla
handmade_hardcoded_model.py​
if url in [‘babis’, ‘sauto’, ‘finance’]:
return ‘click’
elif url in [‘blesk’, ‘seznam’] and clicks > 3:
return ‘click’
else
return ‘impression’
MACHINE LEARNING
MODEL
Optimalizace nákupu online reklamy
Automatické získání pravidel z historie
MACHINE LEARNING
MODEL
Evaluace modelu pro navýšení počtu angažovaných návštěv
TOP 10 % uživatelů
s největší pravděpodobností
ang. návštěvy CSAS.cz
Skutečné
navýšení
počtu
návštěv
MÍRA NÁVŠTĚVY PRO MODELEM VYBRANÉ SKUPINY UŽIVATELŮ
Optimalizace nákupu online reklamy
Přínos ML modelu pro predikci angažované návštěvy
2 000 000 000
záznamů
2 000 000 000
záznamů
Optimalizace nákupu online reklamy
Přínos ML modelu pro predikci angažované návštěvy
2x více návštěv
za stejnou cenu
MÍRA NÁVŠTĚVY PRO MODELEM VYBRANÉ SKUPINY UŽIVATELŮ
Optimalizace péče o klienta
2.CÍL = Navýšení offline konverzí (např. sjednání půjčky)
REKLAMA WEB INTERNETOVÉ BANKOVNICTVÍ DALŠÍ ZDROJE
Uživatelský online profil
Klientský profil (CRM)
ONLINE
SVĚT
CLOUDOVÉ
PROSTŘEDÍ
OFFLINE
SVĚT
POBOČKY TRANSAKCE MAIL/SMS/PUSH CALLCENTRA
NÁSTROJE
PRO SPRÁVU
ONLINE
REKLAMY
3rd party
NÁSTROJE
PRO SPRÁVU
KLASICKÝCH
KAMPANÍ
Optimalizace péče o klienta CÍL
Predikce
sjednání
půjčky
Optimalizace péče o klienta
Vstupní data pro optimalizační model
NAVŠTÍVENÉ WEBY
S REKLAMOU ČS
WEB ČS
1.imprese 2.imprese 3.imprese Kalkulačka FAQ BLOG
finance sauto sauto 1 1 0
finance babiš - 0 1 0
seznam seznam finance 1 0 1
lidl seznam seznam 0 0 1
idnes rohlik 0 0 0
idnes 0 0 0
CÍL
Predikce
sjednání
půjčky
Optimalizace péče o klienta
Vstupní data pro optimalizační model
NAVŠTÍVENÉ WEBY
S REKLAMOU ČS
WEB ČS
1.imprese 2.imprese 3.imprese Kalkulačka FAQ BLOG
finance sauto sauto 1 1 0
finance babiš - 0 1 0
seznam seznam finance 1 0 1
lidl seznam seznam 0 0 1
idnes rohlik 0 0 0
idnes 0 0 0
VYSVĚTLUJÍCÍ PROMĚNNÉ
z online světa
CÍL
Predikce
sjednání
půjčky
Optimalizace péče o klienta
Vstupní data pro optimalizační model
NAVŠTÍVENÉ WEBY
S REKLAMOU ČS
WEB ČS
OFFLINE
SKÓRE
1.imprese 2.imprese 3.imprese Kalkulačka FAQ BLOG
finance sauto sauto 1 1 0 0,79
finance babiš - 0 1 0 0,31
seznam seznam finance 1 0 1 0,34
lidl seznam seznam 0 0 1 0,01
idnes rohlik 0 0 0 0,07
idnes 0 0 0 0,08
VYSVĚTLUJÍCÍ PROMĚNNÉ
z online světa
VYSVĚTLUJÍCÍ PROMĚNNÉ
z offline světa
CÍL
Predikce
sjednání
půjčky
Optimalizace péče o klienta
Predikce offline konverze pro obohacení klientského profilu
NAVŠTÍVENÉ WEBY
S REKLAMOU ČS
WEB ČS
OFFLINE
SKÓRE
OFFLINE
KONVERZE
1.imprese 2.imprese 3.imprese Kalkulačka FAQ BLOG
finance sauto sauto 1 1 0 0,79 1
finance babiš - 0 1 0 0,31 0
seznam seznam finance 1 0 1 0,34 0
lidl seznam seznam 0 0 1 0,01 0
idnes rohlik 0 0 0 0,07 0
idnes 0 0 0 0,08 0
VYSVĚTLUJÍCÍ PROMĚNNÉ
z online světa CÍL
VYSVĚTLUJÍCÍ PROMĚNNÉ
z offline světa
Optimalizace péče o klienta
Příprava machine learning modelu
1.Extrakce proměnných pomocí term frequency inverse document frequency
ze spojených URL
2.Obohacení URL o popis navštívených webů
3.Nalezení kontextu pomocí embedovacích technik word2vec
4.Machine learning model (glm, xgboost) pro predikci pravděpodobností
offline konverze
Evaluace modelu pro predikci sjednání půjčky
REKLAMA WEB INTERNETOVÉ BANKOVNICTVÍ DALŠÍ ZDROJE
Uživatelský online profil
Klientský profil (CRM)
ONLINE
SVĚT
CLOUDOVÉ
PROSTŘEDÍ
OFFLINE
SVĚT
POBOČKY TRANSAKCE MAIL/SMS/PUSH CALLCENTRA
NÁSTROJE
PRO SPRÁVU
ONLINE
REKLAMY
3rd party
NÁSTROJE
PRO SPRÁVU
KLASICKÝCH
KAMPANÍ
Příprava machine learning modelu
1.Extrakce proměnných pomocí term frequency inverse document frequency
ze spojených URL
2.Obohacení URL o popis navštívených webů
3.Nalezení kontextu pomocí embedovacích technik word2vec
4.Machine learning model (glm, xgboost) pro predikci pravděpodobností
offline konverze
5.Vysvětlení koeficientů a signifikantních proměnných modelu
Obohacení klientského profilu o online signály
Generování doporučení pro zákazníky na pobočce
byty
idnes
půjčka
chalupy
hypotéka
finance
seznam
twitter
instagram
wikipedia
seznam
seznam
jágr
wikipedia
wikipedia
babiš
wikipedia
bezrealitky
Obohacení klientského profilu o online signály
Generování doporučení pro zákazníky na pobočce
byty
idnes
půjčka
chalupy
hypotéka
finance
seznam
twitter
instagram
wikipedia
seznam
seznam
jágr
wikipedia
wikipedia
bezrealitky
babiš
wikipedia
Obohacení klientského profilu o online signály
Generování témat komunikace
byty
idnes
půjčka
chalupy
hypotéka
finance
seznam
twitter
instagram
wikipedia
seznam
seznam
jágr
wikipedia
wikipedia
bezrealitky
babiš
wikipedia
byty
idnes
půjčka
chalupy
hypotéka
finance
seznam
twitter
instagram
wikipedia
seznam
seznam
jágr
wikipedia
wikipedia
babiš
wikipedia
Klient řeší
půjčku/hypotéku
(80%)
bezrealitky
byty
idnes
půjčka
chalupy
hypotéka
finance
seznam
twitter
instagram
wikipedia
seznam
seznam
jágr
wikipedia
wikipedia
babiš
wikipedia
Klient řeší:
bydlení (60%)
půjčku/hypotéku
(30%)
bezrealitky
SPOLUPRÁCE.
PŘÍLEŽITOSTI.
BUDOUCNOST.
DĚKUJEME!
Jakub Štěch
DataSentics s.r.o.
jakub.stech@datasentics.com
Eliška Králová
Česká spořitelna a.s.
ekralova@csas.cz

Jak pomocí machine learningu vytěžovat data z RTB i v CRM?

  • 1.
  • 2.
    Prezentující Eliška Králová • DigitalData Manager v České spořitelně • Vedení týmu zaměřeného na zpracování a aktivaci online dat
  • 3.
    Prezentující Eliška Králová • DigitalData Manager v České spořitelně • Vedení týmu zaměřeného na zpracování a aktivaci online dat Jakub Štěch • Seniorní Data Scientist v DataSentics​ • PhD student FJFI ČVUT v Praze (Matematika ​statistika)
  • 4.
  • 5.
  • 6.
  • 7.
  • 8.
    REKLAMA WEB INTERNETOVÉBANKOVNICTVÍ DALŠÍ ZDROJE ONLINE SVĚT OFFLINE SVĚT POBOČKY TRANSAKCE MAIL/SMS/PUSH CALLCENTRA 3rd party
  • 9.
  • 10.
  • 11.
  • 12.
    REKLAMA WEB INTERNETOVÉBANKOVNICTVÍ DALŠÍ ZDROJE ONLINE SVĚT OFFLINE SVĚT POBOČKY TRANSAKCE MAIL/SMS/PUSH CALLCENTRA 3rd party
  • 13.
  • 18.
    REKLAMA WEB INTERNETOVÉBANKOVNICTVÍ DALŠÍ ZDROJE Uživatelský online profil ONLINE SVĚT CLOUDOVÉ PROSTŘEDÍ OFFLINE SVĚT POBOČKY TRANSAKCE MAIL/SMS/PUSH CALLCENTRA 3rd party
  • 19.
    REKLAMA WEB INTERNETOVÉBANKOVNICTVÍ DALŠÍ ZDROJE Uživatelský online profil ONLINE SVĚT CLOUDOVÉ PROSTŘEDÍ OFFLINE SVĚT POBOČKY TRANSAKCE MAIL/SMS/PUSH CALLCENTRA 3rd party
  • 20.
    REKLAMA WEB INTERNETOVÉBANKOVNICTVÍ DALŠÍ ZDROJE Uživatelský online profil Klientský profil (CRM) ONLINE SVĚT CLOUDOVÉ PROSTŘEDÍ OFFLINE SVĚT POBOČKY TRANSAKCE MAIL/SMS/PUSH CALLCENTRA 3rd party ON-PREM PROSTŘEDÍ
  • 21.
    REKLAMA WEB INTERNETOVÉBANKOVNICTVÍ DALŠÍ ZDROJE Uživatelský online profil Klientský profil (CRM) ONLINE SVĚT CLOUDOVÉ PROSTŘEDÍ OFFLINE SVĚT POBOČKY TRANSAKCE MAIL/SMS/PUSH CALLCENTRA NÁSTROJE PRO SPRÁVU ONLINE REKLAMY 3rd party NÁSTROJE PRO SPRÁVU KLASICKÝCH KAMPANÍ ON-PREM PROSTŘEDÍ
  • 22.
  • 23.
    Optimalizace nákupu reklamy 1.CÍL= Navýšení online konverzí
  • 24.
    REKLAMA WEB INTERNETOVÉBANKOVNICTVÍ DALŠÍ ZDROJE Uživatelský online profil Klientský profil (CRM) ONLINE SVĚT CLOUDOVÉ PROSTŘEDÍ OFFLINE SVĚT POBOČKY TRANSAKCE MAIL/SMS/PUSH CALLCENTRA NÁSTROJE PRO SPRÁVU ONLINE REKLAMY 3rd party NÁSTROJE PRO SPRÁVU KLASICKÝCH KAMPANÍ ON-PREM PROSTŘEDÍ
  • 25.
    REKLAMA WEB INTERNETOVÉBANKOVNICTVÍ DALŠÍ ZDROJE Uživatelský online profil Klientský profil (CRM) ONLINE SVĚT CLOUDOVÉ PROSTŘEDÍ OFFLINE SVĚT POBOČKY TRANSAKCE MAIL/SMS/PUSH CALLCENTRA NÁSTROJE PRO SPRÁVU ONLINE REKLAMY 3rd party NÁSTROJE PRO SPRÁVU KLASICKÝCH KAMPANÍ ON-PREM PROSTŘEDÍ
  • 26.
    Optimalizace nákupu onlinereklamy CÍL Získat více angažovaných návštěv
  • 27.
    Optimalizace nákupu onlinereklamy Vstupní data pro optimalizační model NAVŠTÍVENÉ WEBY S REKLAMOU ČS KLIK ANGAŽOVANÁ NÁVŠTĚVA WEBU 1.imprese 2.imprese 3.imprese seznam sauto sauto 1 1 finance babiš - 1 1 finance seznam finance 0 1 lidl seznam seznam 0 1 idnes rohlik 0 0 idnes 0 0 CÍL Získat více angažovaných návštěv
  • 28.
    Optimalizace nákupu onlinereklamy Vstupní data pro optimalizační model VYSVĚTLUJÍCÍ PROMĚNNÉ CÍL Získat více angažovaných návštěv NAVŠTÍVENÉ WEBY S REKLAMOU ČS KLIK ANGAŽOVANÁ NÁVŠTĚVA WEBU 1.imprese 2.imprese 3.imprese seznam sauto sauto 1 1 finance babiš - 1 1 finance seznam finance 0 1 lidl seznam seznam 0 1 idnes rohlik 0 0 idnes 0 0
  • 29.
    Optimalizace nákupu onlinereklamy Vstupní data pro optimalizační model NAVŠTÍVENÉ WEBY S REKLAMOU ČS KLIK ANGAŽOVANÁ NÁVŠTĚVA WEBU 1.imprese 2.imprese 3.imprese seznam sauto sauto 1 1 finance babiš - 1 1 finance seznam finance 0 1 lidl seznam seznam 0 1 idnes rohlik 0 0 idnes 0 0 VYSVĚTLUJÍCÍ PROMĚNNÉ CÍL CÍL Získat více angažovaných návštěv
  • 30.
    Optimalizace nákupu onlinereklamy Nalezení signifikantních proměnných NAVŠTÍVENÉ WEBY S REKLAMOU ČS KLIK ANGAŽOVANÁ NÁVŠTĚVA WEBU 1.imprese 2.imprese 3.imprese seznam sauto sauto 1 1 finance babiš - 1 1 finance seznam finance 0 1 lidl seznam seznam 0 1 idnes rohlik 0 0 idnes 0 0 VYSVĚTLUJÍCÍ PROMĚNNÉ CÍL Získat více angažovaných návštěv CÍL
  • 31.
    Optimalizace nákupu onlinereklamy Nalezení signifikantních proměnných VYSVĚTLUJÍCÍ PROMĚNNÉ CÍL Získat více angažovaných návštěv CÍL NAVŠTÍVENÉ WEBY S REKLAMOU ČS KLIK ANGAŽOVANÁ NÁVŠTĚVA WEBU 1.imprese 2.imprese 3.imprese seznam sauto sauto 1 1 finance babiš - 1 1 finance seznam finance 0 1 lidl seznam seznam 0 1 idnes rohlik 0 0 idnes 0 0
  • 32.
    Optimalizace nákupu onlinereklamy Nalezení signifikantních proměnných VYSVĚTLUJÍCÍ PROMĚNNÉ CÍL Získat více angažovaných návštěv CÍL NAVŠTÍVENÉ WEBY S REKLAMOU ČS KLIK ANGAŽOVANÁ NÁVŠTĚVA WEBU 1.imprese 2.imprese 3.imprese seznam sauto sauto 1 1 finance babiš - 1 1 finance seznam finance 0 1 lidl seznam seznam 0 1 idnes rohlik 0 0 idnes 0 0
  • 33.
    Vstupní data =uživatelem navštívené URL adresy
  • 34.
    Optimalizace nákupu onlinereklamy Příprava machine learning modelu 1.Extrakce proměnných pomocí term frequency inverse document frequency ze spojených URL 2.Obohacení URL o popis navštívených webů 3.Nalezení kontextu pomocí embedovacích technik word2vec
  • 35.
    Upravená vstupní data= prediktory z klíčových slov v URL
  • 36.
    Optimalizace nákupu onlinereklamy Machine learning model 1.Extrakce proměnných pomocí term frequency inverse document frequency ze spojených URL 2.Obohacení URL o popis navštívených webů 3.Nalezení kontextu pomocí embedovacích technik word2vec 4.Machine learning model (glm, xgboost) pro predikci pravděpodobností angažované návštěvy na základě featur z URL adres z Adform Master Data
  • 37.
    Optimalizace nákupu onlinereklamy Machine learning model nepotřebuje expertní pravidla handmade_hardcoded_model.py​ if url in [‘babis’, ‘sauto’, ‘finance’]: return ‘click’ elif url in [‘blesk’, ‘seznam’] and clicks > 3: return ‘click’ else return ‘impression’ MACHINE LEARNING MODEL
  • 38.
    Optimalizace nákupu onlinereklamy Automatické získání pravidel z historie MACHINE LEARNING MODEL
  • 39.
    Evaluace modelu pronavýšení počtu angažovaných návštěv TOP 10 % uživatelů s největší pravděpodobností ang. návštěvy CSAS.cz Skutečné navýšení počtu návštěv
  • 40.
    MÍRA NÁVŠTĚVY PROMODELEM VYBRANÉ SKUPINY UŽIVATELŮ Optimalizace nákupu online reklamy Přínos ML modelu pro predikci angažované návštěvy 2 000 000 000 záznamů
  • 41.
    2 000 000000 záznamů Optimalizace nákupu online reklamy Přínos ML modelu pro predikci angažované návštěvy 2x více návštěv za stejnou cenu MÍRA NÁVŠTĚVY PRO MODELEM VYBRANÉ SKUPINY UŽIVATELŮ
  • 42.
    Optimalizace péče oklienta 2.CÍL = Navýšení offline konverzí (např. sjednání půjčky)
  • 43.
    REKLAMA WEB INTERNETOVÉBANKOVNICTVÍ DALŠÍ ZDROJE Uživatelský online profil Klientský profil (CRM) ONLINE SVĚT CLOUDOVÉ PROSTŘEDÍ OFFLINE SVĚT POBOČKY TRANSAKCE MAIL/SMS/PUSH CALLCENTRA NÁSTROJE PRO SPRÁVU ONLINE REKLAMY 3rd party NÁSTROJE PRO SPRÁVU KLASICKÝCH KAMPANÍ
  • 44.
    Optimalizace péče oklienta CÍL Predikce sjednání půjčky
  • 45.
    Optimalizace péče oklienta Vstupní data pro optimalizační model NAVŠTÍVENÉ WEBY S REKLAMOU ČS WEB ČS 1.imprese 2.imprese 3.imprese Kalkulačka FAQ BLOG finance sauto sauto 1 1 0 finance babiš - 0 1 0 seznam seznam finance 1 0 1 lidl seznam seznam 0 0 1 idnes rohlik 0 0 0 idnes 0 0 0 CÍL Predikce sjednání půjčky
  • 46.
    Optimalizace péče oklienta Vstupní data pro optimalizační model NAVŠTÍVENÉ WEBY S REKLAMOU ČS WEB ČS 1.imprese 2.imprese 3.imprese Kalkulačka FAQ BLOG finance sauto sauto 1 1 0 finance babiš - 0 1 0 seznam seznam finance 1 0 1 lidl seznam seznam 0 0 1 idnes rohlik 0 0 0 idnes 0 0 0 VYSVĚTLUJÍCÍ PROMĚNNÉ z online světa CÍL Predikce sjednání půjčky
  • 47.
    Optimalizace péče oklienta Vstupní data pro optimalizační model NAVŠTÍVENÉ WEBY S REKLAMOU ČS WEB ČS OFFLINE SKÓRE 1.imprese 2.imprese 3.imprese Kalkulačka FAQ BLOG finance sauto sauto 1 1 0 0,79 finance babiš - 0 1 0 0,31 seznam seznam finance 1 0 1 0,34 lidl seznam seznam 0 0 1 0,01 idnes rohlik 0 0 0 0,07 idnes 0 0 0 0,08 VYSVĚTLUJÍCÍ PROMĚNNÉ z online světa VYSVĚTLUJÍCÍ PROMĚNNÉ z offline světa CÍL Predikce sjednání půjčky
  • 48.
    Optimalizace péče oklienta Predikce offline konverze pro obohacení klientského profilu NAVŠTÍVENÉ WEBY S REKLAMOU ČS WEB ČS OFFLINE SKÓRE OFFLINE KONVERZE 1.imprese 2.imprese 3.imprese Kalkulačka FAQ BLOG finance sauto sauto 1 1 0 0,79 1 finance babiš - 0 1 0 0,31 0 seznam seznam finance 1 0 1 0,34 0 lidl seznam seznam 0 0 1 0,01 0 idnes rohlik 0 0 0 0,07 0 idnes 0 0 0 0,08 0 VYSVĚTLUJÍCÍ PROMĚNNÉ z online světa CÍL VYSVĚTLUJÍCÍ PROMĚNNÉ z offline světa
  • 49.
    Optimalizace péče oklienta Příprava machine learning modelu 1.Extrakce proměnných pomocí term frequency inverse document frequency ze spojených URL 2.Obohacení URL o popis navštívených webů 3.Nalezení kontextu pomocí embedovacích technik word2vec 4.Machine learning model (glm, xgboost) pro predikci pravděpodobností offline konverze
  • 50.
    Evaluace modelu propredikci sjednání půjčky
  • 51.
    REKLAMA WEB INTERNETOVÉBANKOVNICTVÍ DALŠÍ ZDROJE Uživatelský online profil Klientský profil (CRM) ONLINE SVĚT CLOUDOVÉ PROSTŘEDÍ OFFLINE SVĚT POBOČKY TRANSAKCE MAIL/SMS/PUSH CALLCENTRA NÁSTROJE PRO SPRÁVU ONLINE REKLAMY 3rd party NÁSTROJE PRO SPRÁVU KLASICKÝCH KAMPANÍ
  • 52.
    Příprava machine learningmodelu 1.Extrakce proměnných pomocí term frequency inverse document frequency ze spojených URL 2.Obohacení URL o popis navštívených webů 3.Nalezení kontextu pomocí embedovacích technik word2vec 4.Machine learning model (glm, xgboost) pro predikci pravděpodobností offline konverze 5.Vysvětlení koeficientů a signifikantních proměnných modelu
  • 53.
    Obohacení klientského profiluo online signály Generování doporučení pro zákazníky na pobočce byty idnes půjčka chalupy hypotéka finance seznam twitter instagram wikipedia seznam seznam jágr wikipedia wikipedia babiš wikipedia bezrealitky
  • 54.
    Obohacení klientského profiluo online signály Generování doporučení pro zákazníky na pobočce byty idnes půjčka chalupy hypotéka finance seznam twitter instagram wikipedia seznam seznam jágr wikipedia wikipedia bezrealitky babiš wikipedia
  • 55.
    Obohacení klientského profiluo online signály Generování témat komunikace byty idnes půjčka chalupy hypotéka finance seznam twitter instagram wikipedia seznam seznam jágr wikipedia wikipedia bezrealitky babiš wikipedia
  • 56.
  • 57.
  • 58.
  • 59.

Editor's Notes

  • #5 Spousta cenných dat - využití bída = klasika = nevyužitý potenciál
  • #6 Vyznat se v nich, zpracování - retardovaně deterministicky - byznysový pravidla - kombinace = smrt
  • #7 Ok, udělejme to efektivněji - narážím na pain onpremu = sklep s kompem
  • #8 systémů mega moc/propojení offline online = nemožný
  • #9  Musíme se ke zpracování dat postavit jinak
  • #10 snadné propojení - vzájemně v online a pak hlavně i s offline
  • #11 Flexibilní prostředí pro zpracování (rychlost, custom nastavení odpovídající potřebám, cenová efektivita)
  • #12 Chytristika - nechci to klikat, mozek to nevymyslí, je to neudržitelný, potřebuju něco co mi řekne
  • #13  JAK TO ZÍSKAT?
  • #14 chceme něco nového a tím pádem potřebujeme novou znalost → experti
  • #19  pro digi data flexibilní cloudové prostředí, ve které bychom mohli vybudouvat onlinový profil klienta
  • #20 cloud = ideální prostředí pro rychlé zpracování dat, prototyping a machine lerning
  • #21  offline zdroje - ponechání původní struktury, cloud vybrán tak, že propojení bude možné
  • #23 Museli jsme změnit i přístup - postupně, agilně, poc, ...
  • #26  Obohacení o vstupy z webu
  • #42 Idea: V datech z online reklamy nalézt ukazatele předpovídající, že uživatel klikne na náš banner Použitá data: Přes 1,5 mld záznamů o každém zobrazení reklamy: ID uživatele, doba zobrazení reklamy, místo zobrazení = url stránky, interakce s reklamou CTR = míra prokliku = poměr mezi počtem kliknutí na reklamu a celkovým počtem zobrazení reklamy