SlideShare a Scribd company logo
Big data jako nástroj pro
hluboký transakční mining
Petr Paščenko 1. února 2018
2
Začněme od začátku:
Jak (kde) vzniká globální internetová firma?
3
Snadnější úkol:
Kde vzniká ocelárna?
› Rozmístění věcí na
světě nebývá náhodné
› Ocelárny vznikají tam,
kde se potkává
– Uhlí
– Železná ruda
– Zaměstnanci
– Dopravní cesty
4
Kde vzniká globální internetová firma?
› Co je to Google?
› Byznys model
– Vysoká návštěvnost
– Prodej reklamy
› Data
– stránka – odkaz – stránka
› Algoritmus
– Page Rank
– Dnes kombinace mnoha algoritmů
› Vynálezce Map-Reduce
5
Kde vzniká globální internetová firma?
› Proč zrovna Amazon?
› Byznys model
– K jedné knížce čtyři další
– Doprava zdarma
› Data
– člověk – kniha – člověk
› Algoritmus
– Kolaborativní filtrování
– LU dekompozice velkých matic
› Podobně Netflix, Youtube, …
6
Kde vzniká globální internetová firma?
› Byznys model
– Prodej reklamy (úplně jako TV)
– Proud musí být zajímavý
› Data
– člověk – (obsah) – člověk
› Algoritmus
– SNA, kolaborativní filtrování
7
Co mají společného?
1. Silná transakční vazba, která vyjadřuje preferenci.
2. Inovativní (Big data) algoritmus
3. Byznys založený na rozpoznání potřeb individuálního klienta
8
Jak to dělají analogová odvětví?
› Tradiční analytická práce s daty – SQL
› Agregace po skupinách, kontingenční
tabulky, datové krychle
– průměrný plat středoškolsky vzdělaných
žen narozených ve znamení vodnáře trvale
žijících v Moravskoslezském kraji
› Práce se segmenty
– hrubý, globální pohled, vysoká míra
zobecnění
– mladí, středoškoláci, muži, dlouhodobí
klienti
DWH
9
Proč potřebuje Data Science
Big Data technologie?
› Výpočetní cluster umožňuje velké
iterativní výpočty
› Výpočetní cluster umožňuje vyhodnocování na úrovni
individuálního klienta a jeho bezprostředního okolí
› Svět se mění
– Jak je možné, že předvolební průzkumy fungují stále hůře?
– Nosný je kontext (bubliny)
– Zkracuje se reakční čas
HADOOP
FOCUS 10.10.2017
10
Naše mise: přenést inovativní algoritmy
z digitálních odvětví do analogových
1. Silná transakční vazba, která vyjadřuje preferenci.
– Naši zákazníci mají rozsáhlé transakční databáze
• Bankovní transakce (převody, platby kartou, výběry z bankomatů)
• Telekomunikační data (volání, sms, lokace, crm)
• Webová data (trackování pohybu v bankovnictví a na webu)
2. Inovativní Big data algoritmy
3. Byznys založený na rozpoznání potřeb individuálního klienta
› První krok: existující a dobře pojmenované vztahy
– Rodina, zaměstnavatel-zaměstnanec, dlužník-věřitel, spřízněné firmy
› Konečný cíl: subjekt a jeho kontext

More Related Content

Similar to 20180201 1 big data jako nastroj pro hluboka transakcní mining

4 hádanky budoucnosti e-mail marketingu
4 hádanky budoucnosti e-mail marketingu4 hádanky budoucnosti e-mail marketingu
4 hádanky budoucnosti e-mail marketingu
Taste Medio
 
Jan Baštýř | VIVmail.cz | 4 hádanky budoucnosti e-mail marketingu
Jan Baštýř | VIVmail.cz | 4 hádanky budoucnosti e-mail marketinguJan Baštýř | VIVmail.cz | 4 hádanky budoucnosti e-mail marketingu
Jan Baštýř | VIVmail.cz | 4 hádanky budoucnosti e-mail marketingu
Targito
 
Mapy a byznys
Mapy a byznysMapy a byznys
Mapy a byznys
Jan Sirotek
 
Moře financí - jak pomocí IT udržet finance pod kontrolou (M. Solnička)
Moře financí - jak pomocí IT udržet finance pod kontrolou (M. Solnička)Moře financí - jak pomocí IT udržet finance pod kontrolou (M. Solnička)
Moře financí - jak pomocí IT udržet finance pod kontrolou (M. Solnička)KISK FF MU
 
Knihovny 2020: Praktické využití principů sémantického webu (projekt Dáme práci)
Knihovny 2020: Praktické využití principů sémantického webu (projekt Dáme práci)Knihovny 2020: Praktické využití principů sémantického webu (projekt Dáme práci)
Knihovny 2020: Praktické využití principů sémantického webu (projekt Dáme práci)
Jakub Fiala
 
Jak se mění práce analytika (Martin Bosák)
Jak se mění práce analytika (Martin Bosák)Jak se mění práce analytika (Martin Bosák)
Jak se mění práce analytika (Martin Bosák)
Taste Medio
 
Real-Time Web
Real-Time WebReal-Time Web
Real-Time Web
Josef Šlerka
 
Chytrý redakční systém jako základ efektivního podnikání
Chytrý redakční systém jako základ efektivního podnikáníChytrý redakční systém jako základ efektivního podnikání
Chytrý redakční systém jako základ efektivního podnikání
estudio-cz
 
Radek Hudák - Jak vybrat řešení pro e-shop
Radek Hudák - Jak vybrat řešení pro e-shopRadek Hudák - Jak vybrat řešení pro e-shop
Radek Hudák - Jak vybrat řešení pro e-shop
GetFound
 
NMI13 Michal Illich - Extrakce strukturovaných dat z webových stránek
NMI13 Michal Illich - Extrakce strukturovaných dat z webových stránekNMI13 Michal Illich - Extrakce strukturovaných dat z webových stránek
NMI13 Michal Illich - Extrakce strukturovaných dat z webových stránek
New Media Inspiration
 
Milan Vašina: Digitální ekonomika 2015
Milan Vašina: Digitální ekonomika 2015Milan Vašina: Digitální ekonomika 2015
Milan Vašina: Digitální ekonomika 2015
Zonky
 
NoSQL databáze, MongoDB
NoSQL databáze, MongoDBNoSQL databáze, MongoDB
NoSQL databáze, MongoDB
Lukáš Korous
 
NEJBANKA FIntech
NEJBANKA FIntechNEJBANKA FIntech
NEJBANKA FIntech
Martin Svik
 
Životopis budoucnosti – jak si získat každého šéfa přes sociální síť? | LIDÉ ...
Životopis budoucnosti – jak si získat každého šéfa přes sociální síť? | LIDÉ ...Životopis budoucnosti – jak si získat každého šéfa přes sociální síť? | LIDÉ ...
Životopis budoucnosti – jak si získat každého šéfa přes sociální síť? | LIDÉ ...
Milad Iss
 
MetaData – kde je hodnota v datech
MetaData – kde je hodnota v datechMetaData – kde je hodnota v datech
MetaData – kde je hodnota v datech
Taste Medio
 
LinkedIn - od osobního profilu k lead generation (PPC Restart 2021)
LinkedIn - od osobního profilu k lead generation (PPC Restart 2021)LinkedIn - od osobního profilu k lead generation (PPC Restart 2021)
LinkedIn - od osobního profilu k lead generation (PPC Restart 2021)
Adam Zbiejczuk
 
PPC Restart 2021: Adam Zbiejczuk - LinkedIn - od osobního profilu k lead gene...
PPC Restart 2021: Adam Zbiejczuk - LinkedIn - od osobního profilu k lead gene...PPC Restart 2021: Adam Zbiejczuk - LinkedIn - od osobního profilu k lead gene...
PPC Restart 2021: Adam Zbiejczuk - LinkedIn - od osobního profilu k lead gene...
Taste
 
Extrakce strukturovaných dat z webových stránek
Extrakce strukturovaných dat z webových stránekExtrakce strukturovaných dat z webových stránek
Extrakce strukturovaných dat z webových stránek
michalillich
 
20180321 profinit zpracovani velkych_dat_v_praxi
20180321 profinit zpracovani velkych_dat_v_praxi20180321 profinit zpracovani velkych_dat_v_praxi
20180321 profinit zpracovani velkych_dat_v_praxi
Profinit
 
Data Date #3: Přemysl Horáček - Jak daleko jste s datovou analytikou? Maturit...
Data Date #3: Přemysl Horáček - Jak daleko jste s datovou analytikou? Maturit...Data Date #3: Přemysl Horáček - Jak daleko jste s datovou analytikou? Maturit...
Data Date #3: Přemysl Horáček - Jak daleko jste s datovou analytikou? Maturit...
Taste
 

Similar to 20180201 1 big data jako nastroj pro hluboka transakcní mining (20)

4 hádanky budoucnosti e-mail marketingu
4 hádanky budoucnosti e-mail marketingu4 hádanky budoucnosti e-mail marketingu
4 hádanky budoucnosti e-mail marketingu
 
Jan Baštýř | VIVmail.cz | 4 hádanky budoucnosti e-mail marketingu
Jan Baštýř | VIVmail.cz | 4 hádanky budoucnosti e-mail marketinguJan Baštýř | VIVmail.cz | 4 hádanky budoucnosti e-mail marketingu
Jan Baštýř | VIVmail.cz | 4 hádanky budoucnosti e-mail marketingu
 
Mapy a byznys
Mapy a byznysMapy a byznys
Mapy a byznys
 
Moře financí - jak pomocí IT udržet finance pod kontrolou (M. Solnička)
Moře financí - jak pomocí IT udržet finance pod kontrolou (M. Solnička)Moře financí - jak pomocí IT udržet finance pod kontrolou (M. Solnička)
Moře financí - jak pomocí IT udržet finance pod kontrolou (M. Solnička)
 
Knihovny 2020: Praktické využití principů sémantického webu (projekt Dáme práci)
Knihovny 2020: Praktické využití principů sémantického webu (projekt Dáme práci)Knihovny 2020: Praktické využití principů sémantického webu (projekt Dáme práci)
Knihovny 2020: Praktické využití principů sémantického webu (projekt Dáme práci)
 
Jak se mění práce analytika (Martin Bosák)
Jak se mění práce analytika (Martin Bosák)Jak se mění práce analytika (Martin Bosák)
Jak se mění práce analytika (Martin Bosák)
 
Real-Time Web
Real-Time WebReal-Time Web
Real-Time Web
 
Chytrý redakční systém jako základ efektivního podnikání
Chytrý redakční systém jako základ efektivního podnikáníChytrý redakční systém jako základ efektivního podnikání
Chytrý redakční systém jako základ efektivního podnikání
 
Radek Hudák - Jak vybrat řešení pro e-shop
Radek Hudák - Jak vybrat řešení pro e-shopRadek Hudák - Jak vybrat řešení pro e-shop
Radek Hudák - Jak vybrat řešení pro e-shop
 
NMI13 Michal Illich - Extrakce strukturovaných dat z webových stránek
NMI13 Michal Illich - Extrakce strukturovaných dat z webových stránekNMI13 Michal Illich - Extrakce strukturovaných dat z webových stránek
NMI13 Michal Illich - Extrakce strukturovaných dat z webových stránek
 
Milan Vašina: Digitální ekonomika 2015
Milan Vašina: Digitální ekonomika 2015Milan Vašina: Digitální ekonomika 2015
Milan Vašina: Digitální ekonomika 2015
 
NoSQL databáze, MongoDB
NoSQL databáze, MongoDBNoSQL databáze, MongoDB
NoSQL databáze, MongoDB
 
NEJBANKA FIntech
NEJBANKA FIntechNEJBANKA FIntech
NEJBANKA FIntech
 
Životopis budoucnosti – jak si získat každého šéfa přes sociální síť? | LIDÉ ...
Životopis budoucnosti – jak si získat každého šéfa přes sociální síť? | LIDÉ ...Životopis budoucnosti – jak si získat každého šéfa přes sociální síť? | LIDÉ ...
Životopis budoucnosti – jak si získat každého šéfa přes sociální síť? | LIDÉ ...
 
MetaData – kde je hodnota v datech
MetaData – kde je hodnota v datechMetaData – kde je hodnota v datech
MetaData – kde je hodnota v datech
 
LinkedIn - od osobního profilu k lead generation (PPC Restart 2021)
LinkedIn - od osobního profilu k lead generation (PPC Restart 2021)LinkedIn - od osobního profilu k lead generation (PPC Restart 2021)
LinkedIn - od osobního profilu k lead generation (PPC Restart 2021)
 
PPC Restart 2021: Adam Zbiejczuk - LinkedIn - od osobního profilu k lead gene...
PPC Restart 2021: Adam Zbiejczuk - LinkedIn - od osobního profilu k lead gene...PPC Restart 2021: Adam Zbiejczuk - LinkedIn - od osobního profilu k lead gene...
PPC Restart 2021: Adam Zbiejczuk - LinkedIn - od osobního profilu k lead gene...
 
Extrakce strukturovaných dat z webových stránek
Extrakce strukturovaných dat z webových stránekExtrakce strukturovaných dat z webových stránek
Extrakce strukturovaných dat z webových stránek
 
20180321 profinit zpracovani velkych_dat_v_praxi
20180321 profinit zpracovani velkych_dat_v_praxi20180321 profinit zpracovani velkych_dat_v_praxi
20180321 profinit zpracovani velkych_dat_v_praxi
 
Data Date #3: Přemysl Horáček - Jak daleko jste s datovou analytikou? Maturit...
Data Date #3: Přemysl Horáček - Jak daleko jste s datovou analytikou? Maturit...Data Date #3: Přemysl Horáček - Jak daleko jste s datovou analytikou? Maturit...
Data Date #3: Přemysl Horáček - Jak daleko jste s datovou analytikou? Maturit...
 

More from Profinit

Reference Data Management
Reference Data ManagementReference Data Management
Reference Data Management
Profinit
 
Cloud in examples—(how to) benefit from modern technologies in the cloud
Cloud in examples—(how to) benefit from modern technologies in the cloudCloud in examples—(how to) benefit from modern technologies in the cloud
Cloud in examples—(how to) benefit from modern technologies in the cloud
Profinit
 
Building big data pipelines—lessons learned
Building big data pipelines—lessons learnedBuilding big data pipelines—lessons learned
Building big data pipelines—lessons learned
Profinit
 
Understand your data dependencies – Key enabler to efficient modernisation
 Understand your data dependencies – Key enabler to efficient modernisation  Understand your data dependencies – Key enabler to efficient modernisation
Understand your data dependencies – Key enabler to efficient modernisation
Profinit
 
Propensity Modelling for Banks
Propensity Modelling for BanksPropensity Modelling for Banks
Propensity Modelling for Banks
Profinit
 
Legacy systems modernisation
Legacy systems modernisationLegacy systems modernisation
Legacy systems modernisation
Profinit
 
Automating Data Lakes, Data Warehouses and Data Stores
Automating Data Lakes, Data Warehouses and Data StoresAutomating Data Lakes, Data Warehouses and Data Stores
Automating Data Lakes, Data Warehouses and Data Stores
Profinit
 
4 Steps Towards Data Transparency
4 Steps Towards Data Transparency4 Steps Towards Data Transparency
4 Steps Towards Data Transparency
Profinit
 
Software systems modernisation
Software systems modernisationSoftware systems modernisation
Software systems modernisation
Profinit
 
Odborná snídaně: Datový sklad jako Perpetuum Mobile
Odborná snídaně: Datový sklad jako Perpetuum MobileOdborná snídaně: Datový sklad jako Perpetuum Mobile
Odborná snídaně: Datový sklad jako Perpetuum Mobile
Profinit
 
Data Science a MLOps v prostředí cloudu
Data Science a MLOps v prostředí clouduData Science a MLOps v prostředí cloudu
Data Science a MLOps v prostředí cloudu
Profinit
 
Detekce sociálních vazeb: domácnosti a přátelé
Detekce sociálních vazeb: domácnosti a přáteléDetekce sociálních vazeb: domácnosti a přátelé
Detekce sociálních vazeb: domácnosti a přátelé
Profinit
 
Výsledky backtestu propensitního modelu
Výsledky backtestu propensitního modeluVýsledky backtestu propensitního modelu
Výsledky backtestu propensitního modelu
Profinit
 
Propensitní modelování
Propensitní modelováníPropensitní modelování
Propensitní modelování
Profinit
 
Profinit Webinar: Benefits of Software Systems Modernization over their Repla...
Profinit Webinar: Benefits of Software Systems Modernization over their Repla...Profinit Webinar: Benefits of Software Systems Modernization over their Repla...
Profinit Webinar: Benefits of Software Systems Modernization over their Repla...
Profinit
 
Profinit webinar: Instalment Detector
Profinit webinar: Instalment DetectorProfinit webinar: Instalment Detector
Profinit webinar: Instalment Detector
Profinit
 
Profinit_snidane_DWH_22_10_2019_publish
Profinit_snidane_DWH_22_10_2019_publishProfinit_snidane_DWH_22_10_2019_publish
Profinit_snidane_DWH_22_10_2019_publish
Profinit
 
2019 09-23-snidane qa-public
2019 09-23-snidane qa-public2019 09-23-snidane qa-public
2019 09-23-snidane qa-public
Profinit
 
2019 03-20 snidane-serie-kuchyne-full
2019 03-20 snidane-serie-kuchyne-full2019 03-20 snidane-serie-kuchyne-full
2019 03-20 snidane-serie-kuchyne-full
Profinit
 
2018 11-28 snidane-serie-kuchyne
2018 11-28 snidane-serie-kuchyne2018 11-28 snidane-serie-kuchyne
2018 11-28 snidane-serie-kuchyne
Profinit
 

More from Profinit (20)

Reference Data Management
Reference Data ManagementReference Data Management
Reference Data Management
 
Cloud in examples—(how to) benefit from modern technologies in the cloud
Cloud in examples—(how to) benefit from modern technologies in the cloudCloud in examples—(how to) benefit from modern technologies in the cloud
Cloud in examples—(how to) benefit from modern technologies in the cloud
 
Building big data pipelines—lessons learned
Building big data pipelines—lessons learnedBuilding big data pipelines—lessons learned
Building big data pipelines—lessons learned
 
Understand your data dependencies – Key enabler to efficient modernisation
 Understand your data dependencies – Key enabler to efficient modernisation  Understand your data dependencies – Key enabler to efficient modernisation
Understand your data dependencies – Key enabler to efficient modernisation
 
Propensity Modelling for Banks
Propensity Modelling for BanksPropensity Modelling for Banks
Propensity Modelling for Banks
 
Legacy systems modernisation
Legacy systems modernisationLegacy systems modernisation
Legacy systems modernisation
 
Automating Data Lakes, Data Warehouses and Data Stores
Automating Data Lakes, Data Warehouses and Data StoresAutomating Data Lakes, Data Warehouses and Data Stores
Automating Data Lakes, Data Warehouses and Data Stores
 
4 Steps Towards Data Transparency
4 Steps Towards Data Transparency4 Steps Towards Data Transparency
4 Steps Towards Data Transparency
 
Software systems modernisation
Software systems modernisationSoftware systems modernisation
Software systems modernisation
 
Odborná snídaně: Datový sklad jako Perpetuum Mobile
Odborná snídaně: Datový sklad jako Perpetuum MobileOdborná snídaně: Datový sklad jako Perpetuum Mobile
Odborná snídaně: Datový sklad jako Perpetuum Mobile
 
Data Science a MLOps v prostředí cloudu
Data Science a MLOps v prostředí clouduData Science a MLOps v prostředí cloudu
Data Science a MLOps v prostředí cloudu
 
Detekce sociálních vazeb: domácnosti a přátelé
Detekce sociálních vazeb: domácnosti a přáteléDetekce sociálních vazeb: domácnosti a přátelé
Detekce sociálních vazeb: domácnosti a přátelé
 
Výsledky backtestu propensitního modelu
Výsledky backtestu propensitního modeluVýsledky backtestu propensitního modelu
Výsledky backtestu propensitního modelu
 
Propensitní modelování
Propensitní modelováníPropensitní modelování
Propensitní modelování
 
Profinit Webinar: Benefits of Software Systems Modernization over their Repla...
Profinit Webinar: Benefits of Software Systems Modernization over their Repla...Profinit Webinar: Benefits of Software Systems Modernization over their Repla...
Profinit Webinar: Benefits of Software Systems Modernization over their Repla...
 
Profinit webinar: Instalment Detector
Profinit webinar: Instalment DetectorProfinit webinar: Instalment Detector
Profinit webinar: Instalment Detector
 
Profinit_snidane_DWH_22_10_2019_publish
Profinit_snidane_DWH_22_10_2019_publishProfinit_snidane_DWH_22_10_2019_publish
Profinit_snidane_DWH_22_10_2019_publish
 
2019 09-23-snidane qa-public
2019 09-23-snidane qa-public2019 09-23-snidane qa-public
2019 09-23-snidane qa-public
 
2019 03-20 snidane-serie-kuchyne-full
2019 03-20 snidane-serie-kuchyne-full2019 03-20 snidane-serie-kuchyne-full
2019 03-20 snidane-serie-kuchyne-full
 
2018 11-28 snidane-serie-kuchyne
2018 11-28 snidane-serie-kuchyne2018 11-28 snidane-serie-kuchyne
2018 11-28 snidane-serie-kuchyne
 

20180201 1 big data jako nastroj pro hluboka transakcní mining

  • 1. Big data jako nástroj pro hluboký transakční mining Petr Paščenko 1. února 2018
  • 2. 2 Začněme od začátku: Jak (kde) vzniká globální internetová firma?
  • 3. 3 Snadnější úkol: Kde vzniká ocelárna? › Rozmístění věcí na světě nebývá náhodné › Ocelárny vznikají tam, kde se potkává – Uhlí – Železná ruda – Zaměstnanci – Dopravní cesty
  • 4. 4 Kde vzniká globální internetová firma? › Co je to Google? › Byznys model – Vysoká návštěvnost – Prodej reklamy › Data – stránka – odkaz – stránka › Algoritmus – Page Rank – Dnes kombinace mnoha algoritmů › Vynálezce Map-Reduce
  • 5. 5 Kde vzniká globální internetová firma? › Proč zrovna Amazon? › Byznys model – K jedné knížce čtyři další – Doprava zdarma › Data – člověk – kniha – člověk › Algoritmus – Kolaborativní filtrování – LU dekompozice velkých matic › Podobně Netflix, Youtube, …
  • 6. 6 Kde vzniká globální internetová firma? › Byznys model – Prodej reklamy (úplně jako TV) – Proud musí být zajímavý › Data – člověk – (obsah) – člověk › Algoritmus – SNA, kolaborativní filtrování
  • 7. 7 Co mají společného? 1. Silná transakční vazba, která vyjadřuje preferenci. 2. Inovativní (Big data) algoritmus 3. Byznys založený na rozpoznání potřeb individuálního klienta
  • 8. 8 Jak to dělají analogová odvětví? › Tradiční analytická práce s daty – SQL › Agregace po skupinách, kontingenční tabulky, datové krychle – průměrný plat středoškolsky vzdělaných žen narozených ve znamení vodnáře trvale žijících v Moravskoslezském kraji › Práce se segmenty – hrubý, globální pohled, vysoká míra zobecnění – mladí, středoškoláci, muži, dlouhodobí klienti DWH
  • 9. 9 Proč potřebuje Data Science Big Data technologie? › Výpočetní cluster umožňuje velké iterativní výpočty › Výpočetní cluster umožňuje vyhodnocování na úrovni individuálního klienta a jeho bezprostředního okolí › Svět se mění – Jak je možné, že předvolební průzkumy fungují stále hůře? – Nosný je kontext (bubliny) – Zkracuje se reakční čas HADOOP FOCUS 10.10.2017
  • 10. 10 Naše mise: přenést inovativní algoritmy z digitálních odvětví do analogových 1. Silná transakční vazba, která vyjadřuje preferenci. – Naši zákazníci mají rozsáhlé transakční databáze • Bankovní transakce (převody, platby kartou, výběry z bankomatů) • Telekomunikační data (volání, sms, lokace, crm) • Webová data (trackování pohybu v bankovnictví a na webu) 2. Inovativní Big data algoritmy 3. Byznys založený na rozpoznání potřeb individuálního klienta › První krok: existující a dobře pojmenované vztahy – Rodina, zaměstnavatel-zaměstnanec, dlužník-věřitel, spřízněné firmy › Konečný cíl: subjekt a jeho kontext