SlideShare a Scribd company logo
1 of 21
Download to read offline
Propensitní modelování
pro predikci úvěrů
Peter Baláži, Petr Paščenko 10. 9. 2020
Výzkumná spolupráce
Equa bank a.s. + Profinit
3
› Spolupráca funguje od roku 2015
› V roku 2018 sa spolupráca stala trojstrannou a pridala sa MFF UK
› Základným princípom spolupráce je reciprocita:
• Zdieľame dáta
• Získavame know-how a prístup k posledným technológiám
• Motivujeme bankové use-cases pro Data Science
• Identifikujeme perspektívne riešenia a zavierame slepé cesty
› Realizácie formou PoC
+
4
+
› Vybudovanie Hadoop cluster a integrácia dát
› Salary detector – porovnanie prístupov, heuristický X analytický (bayes)
› Household detector – identifikácia párov
› Analýza chovania klientov pri online žiadostiach
› Odchod úverového klienta, retencia
› Match offer a ponuka optimálnej úrokovej sadzby
› Modelovanie propensity pro úverové produkty
– MFF grant, podobnosti a pseudosociálne siete
Úvod do Data Science
a prediktivního modelování
6
Data Science v bankovnictví
Business Experts Technical Experts
?
7
Osnova
› Představení
› Prediktivní modelování 1.0
› Propensitní model
– Z pohledu Byznysu
– Z pohledu Data Science
– Z pohledu IT
› Výsledky pilotního běhu
8
Prediktivní modelování 1.0
Klient
• Muž, 28 let
• Praha 6
• VŠ, zaměstnaný
• Příjem 32 000 / měs.
 Funguje překvapivě dobře
 Není vůbec snadné ho porazit
Matice
příznaků
Úvěr
vezme
nevezme
• Logistická regrese
• Rozhodovací stromy
• Bayesovské modely
• Neuronové sítě
• …
Model
9
› Co kdybychom znali sociální síť klienta?
› Dokážeme:
– Rozpoznat mikrosegmenty (soc. kontext, podobné chování)
– Rozpoznat události (změny kontextu v čase)
› Zdrojem modelování jsou bankovní transakce
– Přesuny peněz vytvářejí digitální stopu
› Výzkum na reálných bankovních datech
– 2018-2020 Matematicko-fyzikální fakulta UK
– Anonymizovaná data (několikaletá historie)
Výzkumný grant TAČR
MICROTARGETING
Propensitní model
z pohledu byznysu
11
Propensitní model: byznysový pohled
› Model jako metoda výběru
– Každému klientovi přidělí pravděpodobnost
– Seřadí klienty od nejlepších po nejhorší
› Hlavní způsoby použití
1. Efektivní využití limitovaného kanálu
• například call centrum
2. Výběr jen responzivních klientů
• vzhledem k času
3. Next best offer
• Výběr z více možností (úvěr nebo investice)
• Nabídka s nejvyšší nadějí (např. banner)
1 : 20
1 : 5 1 : 40
%
12
1510
0% 10% 20% 30% 40% 50%
Velikost výběru
Lift
Model 1
Model 2
▼
Propensitní model: profitabilita
Přínos modelu:
› 𝑿 – Velikost výběru
– dána kapacitou kanálu
› 𝑳 – Lift
– kolikrát větší response
› 𝑹 𝟎 – Základní response rate
– odpovídá náhodnému výběru
› 𝒊𝒏𝒄 – Jednotkový výnos
– Průměrný výnos z 1 úvěru
𝑿 ∙ ∆𝑳 ∙ 𝑹 𝟎 ∙ 𝒊𝒏𝒄
Příklad: 𝟐𝟓 𝟎𝟎𝟎 ∙ 7,5 − 5 ∙ 𝟐% ∙ 𝟏𝟎 𝟎𝟎𝟎 Kč = 𝟏𝟐, 𝟓 𝐦𝐢𝐥. 𝐊č
Propensitní model
z pohledu data science
14
Sociální a pseudosociální sítě
› Sociální sítě
– Lidé, které skutečně znáte (rodina, přátelé, kolegové z práce…)
– Prodrobněji ve druhé polovině
› Pseudosociální sítě
– Lidé s podobnými vzorci chování
Klient Protistrana DateTime Částka
123456 345678 20181106-07:25:14 206,16
234567 456789 20181106-08:36:14 27,70
345678 567890 20181106-09:47:14 450,00
456789 678901 20181106-10:58:14 1587.27
567890 789012 20181106-11:09:14 3.15
678901 890123 20181106-12:10:14 206,16
789012 901234 20181106-13:21:14 27,70
890123 012345 20181106-14:32:14 4150,00
901234 123456 20181106-15:43:14 1587.27
123456 345678 20181106-07:25:14 13.15
234567 456789 20181106-08:36:14 20,16
345678 567890 20181106-09:47:14 27,70
456789 678901 20181106-10:58:14 450,00
567890 789012 20181106-11:09:14 1587.27
678901 890123 20181106-12:10:14 3.15
789012 901234 20181106-13:21:14 206,16
890123 012345 20181106-14:32:14 27,70
901234 123456 20181106-15:43:14 450,00
15
Grafové embeddingy
› Projekce do prostoru souřadnic
– Modely operují v kartézském prostoru
– „Kontext“ bývá z podstaty nekartézský (slova, grafy,…)
EMBEDDING
Propensitní model
z pohledu IT
17
Technologie a implementace
APACHE SPARK SQL
BUSINESS
KNOWLEDGE
DWH
A B TM $
TRANSACTIONS
#
#
#
#
Technologické platformy: Hadoop nebo Cloud (Databricks na Azure nebo AWS)
18
Implementace
› Python
– Hlavní vývojový jazyk (ml/mlops knihovny, optimální poměr vývojového a
běhového času, lze dodržovat standardní sw. proces)
› Modelové flow – metadatová registrace artefaktů
– Výpočty jednotlivých součástí trvají hodiny a dny, nelze spouštět v jednom
běhu. Desítky modulů fungují v kontraktačním režimu.
› Implementace v Cloudu
– Začali jsme vývojem na Hadoop, ale stavíme i cloud verzi – rychlé pilotování.
19
› Cíl: Propensitní modelování pro cílený marketing
TRANSACTIONS
& CLIENT DATA SIMILARITIES NETWORKS SCORING TARGETING
› Byznys case
› Nejlepší možná predikce zájmu o půjčku
› Zaměřeno na optimalizaci využití kanálů
› Pilotní implementace v Equa Bank, a.s.
› Výkon modelu až na úrovni 87 %AUC
Shrnutí
Diskuze?
Profinit EU, s.r.o.
Tychonova 2, 160 00 Prague 6 | Phone + 420 224 316 016
Web
www.profinit.eu
LinkedIn
linkedin.com/company/profinit
Twitter
twitter.com/Profinit_EU
Facebook
facebook.com/Profinit.EU
Youtube
Profinit EU
Děkujeme za pozornost!
bigdataforbanking.com

More Related Content

Similar to Propensitní modelování

Sociální média a jejich využití v hr
Sociální média a jejich využití v hrSociální média a jejich využití v hr
Sociální média a jejich využití v hrMilan Novak
 
Prediktivní analytika pro rok 2020
Prediktivní analytika pro rok 2020Prediktivní analytika pro rok 2020
Prediktivní analytika pro rok 2020Taste Medio
 
Data Date #3: Přemysl Horáček - Jak daleko jste s datovou analytikou? Maturit...
Data Date #3: Přemysl Horáček - Jak daleko jste s datovou analytikou? Maturit...Data Date #3: Přemysl Horáček - Jak daleko jste s datovou analytikou? Maturit...
Data Date #3: Přemysl Horáček - Jak daleko jste s datovou analytikou? Maturit...Taste
 
Zprava o cinnosti 2013 - Valná hromada SIMAR, veřejná verze
Zprava o cinnosti 2013 - Valná hromada SIMAR, veřejná verzeZprava o cinnosti 2013 - Valná hromada SIMAR, veřejná verze
Zprava o cinnosti 2013 - Valná hromada SIMAR, veřejná verzeSIMAR
 
Digitální komunikace - Vysoká škola ekonomická - Marketingová komunikace
Digitální komunikace - Vysoká škola ekonomická - Marketingová komunikaceDigitální komunikace - Vysoká škola ekonomická - Marketingová komunikace
Digitální komunikace - Vysoká škola ekonomická - Marketingová komunikaceOndřej Krišica
 
Jak vidí české e-shopy rok 2017
Jak vidí české e-shopy rok 2017Jak vidí české e-shopy rok 2017
Jak vidí české e-shopy rok 2017ACOMWARE s.r.o.
 
Zvýšení výkonu PPC kampaní díky auditu kampaní - Marketing Festival 2014
Zvýšení výkonu PPC kampaní díky auditu kampaní - Marketing Festival 2014Zvýšení výkonu PPC kampaní díky auditu kampaní - Marketing Festival 2014
Zvýšení výkonu PPC kampaní díky auditu kampaní - Marketing Festival 2014Ondřej Krišica
 
PPC Restart 2023: Tomáš Beňo - Marketing Mix Modeling: Budoucnost vyhodnocová...
PPC Restart 2023: Tomáš Beňo - Marketing Mix Modeling: Budoucnost vyhodnocová...PPC Restart 2023: Tomáš Beňo - Marketing Mix Modeling: Budoucnost vyhodnocová...
PPC Restart 2023: Tomáš Beňo - Marketing Mix Modeling: Budoucnost vyhodnocová...Taste
 
Workshop Big Data - Profinit - Petr Mikeška
Workshop Big Data - Profinit - Petr MikeškaWorkshop Big Data - Profinit - Petr Mikeška
Workshop Big Data - Profinit - Petr MikeškaProfinit
 
Datarestart - Big Data v praxi
Datarestart - Big Data v praxiDatarestart - Big Data v praxi
Datarestart - Big Data v praxiProfinit
 
Nejdůlezitejsi metrika v zivote startupu
Nejdůlezitejsi metrika v zivote startupuNejdůlezitejsi metrika v zivote startupu
Nejdůlezitejsi metrika v zivote startupuOptimics s.r.o.
 
Webová analytika (ČZU - Webdesign, 21. 11. 2012)
Webová analytika (ČZU - Webdesign, 21. 11. 2012)Webová analytika (ČZU - Webdesign, 21. 11. 2012)
Webová analytika (ČZU - Webdesign, 21. 11. 2012)Sherpas
 
Workshop e-mail marketing a wireframe - VŠE - 2016
Workshop e-mail marketing a wireframe - VŠE - 2016Workshop e-mail marketing a wireframe - VŠE - 2016
Workshop e-mail marketing a wireframe - VŠE - 2016Tomáš Růžička
 

Similar to Propensitní modelování (16)

Sociální média a jejich využití v hr
Sociální média a jejich využití v hrSociální média a jejich využití v hr
Sociální média a jejich využití v hr
 
Prediktivní analytika pro rok 2020
Prediktivní analytika pro rok 2020Prediktivní analytika pro rok 2020
Prediktivní analytika pro rok 2020
 
Data Date #3: Přemysl Horáček - Jak daleko jste s datovou analytikou? Maturit...
Data Date #3: Přemysl Horáček - Jak daleko jste s datovou analytikou? Maturit...Data Date #3: Přemysl Horáček - Jak daleko jste s datovou analytikou? Maturit...
Data Date #3: Přemysl Horáček - Jak daleko jste s datovou analytikou? Maturit...
 
Zprava o cinnosti 2013 - Valná hromada SIMAR, veřejná verze
Zprava o cinnosti 2013 - Valná hromada SIMAR, veřejná verzeZprava o cinnosti 2013 - Valná hromada SIMAR, veřejná verze
Zprava o cinnosti 2013 - Valná hromada SIMAR, veřejná verze
 
Digitální komunikace - Vysoká škola ekonomická - Marketingová komunikace
Digitální komunikace - Vysoká škola ekonomická - Marketingová komunikaceDigitální komunikace - Vysoká škola ekonomická - Marketingová komunikace
Digitální komunikace - Vysoká škola ekonomická - Marketingová komunikace
 
Jak vidí české e-shopy rok 2017
Jak vidí české e-shopy rok 2017Jak vidí české e-shopy rok 2017
Jak vidí české e-shopy rok 2017
 
Zvýšení výkonu PPC kampaní díky auditu kampaní - Marketing Festival 2014
Zvýšení výkonu PPC kampaní díky auditu kampaní - Marketing Festival 2014Zvýšení výkonu PPC kampaní díky auditu kampaní - Marketing Festival 2014
Zvýšení výkonu PPC kampaní díky auditu kampaní - Marketing Festival 2014
 
Prezentace LA Degustation Online Vladimír Rejlek
Prezentace LA Degustation Online Vladimír RejlekPrezentace LA Degustation Online Vladimír Rejlek
Prezentace LA Degustation Online Vladimír Rejlek
 
PPC Restart 2023: Tomáš Beňo - Marketing Mix Modeling: Budoucnost vyhodnocová...
PPC Restart 2023: Tomáš Beňo - Marketing Mix Modeling: Budoucnost vyhodnocová...PPC Restart 2023: Tomáš Beňo - Marketing Mix Modeling: Budoucnost vyhodnocová...
PPC Restart 2023: Tomáš Beňo - Marketing Mix Modeling: Budoucnost vyhodnocová...
 
Mapy a byznys
Mapy a byznysMapy a byznys
Mapy a byznys
 
women in business
women in businesswomen in business
women in business
 
Workshop Big Data - Profinit - Petr Mikeška
Workshop Big Data - Profinit - Petr MikeškaWorkshop Big Data - Profinit - Petr Mikeška
Workshop Big Data - Profinit - Petr Mikeška
 
Datarestart - Big Data v praxi
Datarestart - Big Data v praxiDatarestart - Big Data v praxi
Datarestart - Big Data v praxi
 
Nejdůlezitejsi metrika v zivote startupu
Nejdůlezitejsi metrika v zivote startupuNejdůlezitejsi metrika v zivote startupu
Nejdůlezitejsi metrika v zivote startupu
 
Webová analytika (ČZU - Webdesign, 21. 11. 2012)
Webová analytika (ČZU - Webdesign, 21. 11. 2012)Webová analytika (ČZU - Webdesign, 21. 11. 2012)
Webová analytika (ČZU - Webdesign, 21. 11. 2012)
 
Workshop e-mail marketing a wireframe - VŠE - 2016
Workshop e-mail marketing a wireframe - VŠE - 2016Workshop e-mail marketing a wireframe - VŠE - 2016
Workshop e-mail marketing a wireframe - VŠE - 2016
 

More from Profinit

Reference Data Management
Reference Data ManagementReference Data Management
Reference Data ManagementProfinit
 
Cloud in examples—(how to) benefit from modern technologies in the cloud
Cloud in examples—(how to) benefit from modern technologies in the cloudCloud in examples—(how to) benefit from modern technologies in the cloud
Cloud in examples—(how to) benefit from modern technologies in the cloudProfinit
 
Building big data pipelines—lessons learned
Building big data pipelines—lessons learnedBuilding big data pipelines—lessons learned
Building big data pipelines—lessons learnedProfinit
 
Understand your data dependencies – Key enabler to efficient modernisation
 Understand your data dependencies – Key enabler to efficient modernisation  Understand your data dependencies – Key enabler to efficient modernisation
Understand your data dependencies – Key enabler to efficient modernisation Profinit
 
Propensity Modelling for Banks
Propensity Modelling for BanksPropensity Modelling for Banks
Propensity Modelling for BanksProfinit
 
Legacy systems modernisation
Legacy systems modernisationLegacy systems modernisation
Legacy systems modernisationProfinit
 
Automating Data Lakes, Data Warehouses and Data Stores
Automating Data Lakes, Data Warehouses and Data StoresAutomating Data Lakes, Data Warehouses and Data Stores
Automating Data Lakes, Data Warehouses and Data StoresProfinit
 
4 Steps Towards Data Transparency
4 Steps Towards Data Transparency4 Steps Towards Data Transparency
4 Steps Towards Data TransparencyProfinit
 
Software systems modernisation
Software systems modernisationSoftware systems modernisation
Software systems modernisationProfinit
 
Odborná snídaně: Datový sklad jako Perpetuum Mobile
Odborná snídaně: Datový sklad jako Perpetuum MobileOdborná snídaně: Datový sklad jako Perpetuum Mobile
Odborná snídaně: Datový sklad jako Perpetuum MobileProfinit
 
Data Science a MLOps v prostředí cloudu
Data Science a MLOps v prostředí clouduData Science a MLOps v prostředí cloudu
Data Science a MLOps v prostředí clouduProfinit
 
Detekce sociálních vazeb: domácnosti a přátelé
Detekce sociálních vazeb: domácnosti a přáteléDetekce sociálních vazeb: domácnosti a přátelé
Detekce sociálních vazeb: domácnosti a přáteléProfinit
 
Výsledky backtestu propensitního modelu
Výsledky backtestu propensitního modeluVýsledky backtestu propensitního modelu
Výsledky backtestu propensitního modeluProfinit
 
Profinit Webinar: Benefits of Software Systems Modernization over their Repla...
Profinit Webinar: Benefits of Software Systems Modernization over their Repla...Profinit Webinar: Benefits of Software Systems Modernization over their Repla...
Profinit Webinar: Benefits of Software Systems Modernization over their Repla...Profinit
 
Profinit webinar: Instalment Detector
Profinit webinar: Instalment DetectorProfinit webinar: Instalment Detector
Profinit webinar: Instalment DetectorProfinit
 
Profinit_snidane_DWH_22_10_2019_publish
Profinit_snidane_DWH_22_10_2019_publishProfinit_snidane_DWH_22_10_2019_publish
Profinit_snidane_DWH_22_10_2019_publishProfinit
 
2019 09-23-snidane qa-public
2019 09-23-snidane qa-public2019 09-23-snidane qa-public
2019 09-23-snidane qa-publicProfinit
 
2019 03-20 snidane-serie-kuchyne-full
2019 03-20 snidane-serie-kuchyne-full2019 03-20 snidane-serie-kuchyne-full
2019 03-20 snidane-serie-kuchyne-fullProfinit
 
2018 11-28 snidane-serie-kuchyne
2018 11-28 snidane-serie-kuchyne2018 11-28 snidane-serie-kuchyne
2018 11-28 snidane-serie-kuchyneProfinit
 
Matedatový sklad
Matedatový skladMatedatový sklad
Matedatový skladProfinit
 

More from Profinit (20)

Reference Data Management
Reference Data ManagementReference Data Management
Reference Data Management
 
Cloud in examples—(how to) benefit from modern technologies in the cloud
Cloud in examples—(how to) benefit from modern technologies in the cloudCloud in examples—(how to) benefit from modern technologies in the cloud
Cloud in examples—(how to) benefit from modern technologies in the cloud
 
Building big data pipelines—lessons learned
Building big data pipelines—lessons learnedBuilding big data pipelines—lessons learned
Building big data pipelines—lessons learned
 
Understand your data dependencies – Key enabler to efficient modernisation
 Understand your data dependencies – Key enabler to efficient modernisation  Understand your data dependencies – Key enabler to efficient modernisation
Understand your data dependencies – Key enabler to efficient modernisation
 
Propensity Modelling for Banks
Propensity Modelling for BanksPropensity Modelling for Banks
Propensity Modelling for Banks
 
Legacy systems modernisation
Legacy systems modernisationLegacy systems modernisation
Legacy systems modernisation
 
Automating Data Lakes, Data Warehouses and Data Stores
Automating Data Lakes, Data Warehouses and Data StoresAutomating Data Lakes, Data Warehouses and Data Stores
Automating Data Lakes, Data Warehouses and Data Stores
 
4 Steps Towards Data Transparency
4 Steps Towards Data Transparency4 Steps Towards Data Transparency
4 Steps Towards Data Transparency
 
Software systems modernisation
Software systems modernisationSoftware systems modernisation
Software systems modernisation
 
Odborná snídaně: Datový sklad jako Perpetuum Mobile
Odborná snídaně: Datový sklad jako Perpetuum MobileOdborná snídaně: Datový sklad jako Perpetuum Mobile
Odborná snídaně: Datový sklad jako Perpetuum Mobile
 
Data Science a MLOps v prostředí cloudu
Data Science a MLOps v prostředí clouduData Science a MLOps v prostředí cloudu
Data Science a MLOps v prostředí cloudu
 
Detekce sociálních vazeb: domácnosti a přátelé
Detekce sociálních vazeb: domácnosti a přáteléDetekce sociálních vazeb: domácnosti a přátelé
Detekce sociálních vazeb: domácnosti a přátelé
 
Výsledky backtestu propensitního modelu
Výsledky backtestu propensitního modeluVýsledky backtestu propensitního modelu
Výsledky backtestu propensitního modelu
 
Profinit Webinar: Benefits of Software Systems Modernization over their Repla...
Profinit Webinar: Benefits of Software Systems Modernization over their Repla...Profinit Webinar: Benefits of Software Systems Modernization over their Repla...
Profinit Webinar: Benefits of Software Systems Modernization over their Repla...
 
Profinit webinar: Instalment Detector
Profinit webinar: Instalment DetectorProfinit webinar: Instalment Detector
Profinit webinar: Instalment Detector
 
Profinit_snidane_DWH_22_10_2019_publish
Profinit_snidane_DWH_22_10_2019_publishProfinit_snidane_DWH_22_10_2019_publish
Profinit_snidane_DWH_22_10_2019_publish
 
2019 09-23-snidane qa-public
2019 09-23-snidane qa-public2019 09-23-snidane qa-public
2019 09-23-snidane qa-public
 
2019 03-20 snidane-serie-kuchyne-full
2019 03-20 snidane-serie-kuchyne-full2019 03-20 snidane-serie-kuchyne-full
2019 03-20 snidane-serie-kuchyne-full
 
2018 11-28 snidane-serie-kuchyne
2018 11-28 snidane-serie-kuchyne2018 11-28 snidane-serie-kuchyne
2018 11-28 snidane-serie-kuchyne
 
Matedatový sklad
Matedatový skladMatedatový sklad
Matedatový sklad
 

Propensitní modelování

  • 1. Propensitní modelování pro predikci úvěrů Peter Baláži, Petr Paščenko 10. 9. 2020
  • 3. 3 › Spolupráca funguje od roku 2015 › V roku 2018 sa spolupráca stala trojstrannou a pridala sa MFF UK › Základným princípom spolupráce je reciprocita: • Zdieľame dáta • Získavame know-how a prístup k posledným technológiám • Motivujeme bankové use-cases pro Data Science • Identifikujeme perspektívne riešenia a zavierame slepé cesty › Realizácie formou PoC +
  • 4. 4 + › Vybudovanie Hadoop cluster a integrácia dát › Salary detector – porovnanie prístupov, heuristický X analytický (bayes) › Household detector – identifikácia párov › Analýza chovania klientov pri online žiadostiach › Odchod úverového klienta, retencia › Match offer a ponuka optimálnej úrokovej sadzby › Modelovanie propensity pro úverové produkty – MFF grant, podobnosti a pseudosociálne siete
  • 5. Úvod do Data Science a prediktivního modelování
  • 6. 6 Data Science v bankovnictví Business Experts Technical Experts ?
  • 7. 7 Osnova › Představení › Prediktivní modelování 1.0 › Propensitní model – Z pohledu Byznysu – Z pohledu Data Science – Z pohledu IT › Výsledky pilotního běhu
  • 8. 8 Prediktivní modelování 1.0 Klient • Muž, 28 let • Praha 6 • VŠ, zaměstnaný • Příjem 32 000 / měs.  Funguje překvapivě dobře  Není vůbec snadné ho porazit Matice příznaků Úvěr vezme nevezme • Logistická regrese • Rozhodovací stromy • Bayesovské modely • Neuronové sítě • … Model
  • 9. 9 › Co kdybychom znali sociální síť klienta? › Dokážeme: – Rozpoznat mikrosegmenty (soc. kontext, podobné chování) – Rozpoznat události (změny kontextu v čase) › Zdrojem modelování jsou bankovní transakce – Přesuny peněz vytvářejí digitální stopu › Výzkum na reálných bankovních datech – 2018-2020 Matematicko-fyzikální fakulta UK – Anonymizovaná data (několikaletá historie) Výzkumný grant TAČR MICROTARGETING
  • 11. 11 Propensitní model: byznysový pohled › Model jako metoda výběru – Každému klientovi přidělí pravděpodobnost – Seřadí klienty od nejlepších po nejhorší › Hlavní způsoby použití 1. Efektivní využití limitovaného kanálu • například call centrum 2. Výběr jen responzivních klientů • vzhledem k času 3. Next best offer • Výběr z více možností (úvěr nebo investice) • Nabídka s nejvyšší nadějí (např. banner) 1 : 20 1 : 5 1 : 40 %
  • 12. 12 1510 0% 10% 20% 30% 40% 50% Velikost výběru Lift Model 1 Model 2 ▼ Propensitní model: profitabilita Přínos modelu: › 𝑿 – Velikost výběru – dána kapacitou kanálu › 𝑳 – Lift – kolikrát větší response › 𝑹 𝟎 – Základní response rate – odpovídá náhodnému výběru › 𝒊𝒏𝒄 – Jednotkový výnos – Průměrný výnos z 1 úvěru 𝑿 ∙ ∆𝑳 ∙ 𝑹 𝟎 ∙ 𝒊𝒏𝒄 Příklad: 𝟐𝟓 𝟎𝟎𝟎 ∙ 7,5 − 5 ∙ 𝟐% ∙ 𝟏𝟎 𝟎𝟎𝟎 Kč = 𝟏𝟐, 𝟓 𝐦𝐢𝐥. 𝐊č
  • 14. 14 Sociální a pseudosociální sítě › Sociální sítě – Lidé, které skutečně znáte (rodina, přátelé, kolegové z práce…) – Prodrobněji ve druhé polovině › Pseudosociální sítě – Lidé s podobnými vzorci chování Klient Protistrana DateTime Částka 123456 345678 20181106-07:25:14 206,16 234567 456789 20181106-08:36:14 27,70 345678 567890 20181106-09:47:14 450,00 456789 678901 20181106-10:58:14 1587.27 567890 789012 20181106-11:09:14 3.15 678901 890123 20181106-12:10:14 206,16 789012 901234 20181106-13:21:14 27,70 890123 012345 20181106-14:32:14 4150,00 901234 123456 20181106-15:43:14 1587.27 123456 345678 20181106-07:25:14 13.15 234567 456789 20181106-08:36:14 20,16 345678 567890 20181106-09:47:14 27,70 456789 678901 20181106-10:58:14 450,00 567890 789012 20181106-11:09:14 1587.27 678901 890123 20181106-12:10:14 3.15 789012 901234 20181106-13:21:14 206,16 890123 012345 20181106-14:32:14 27,70 901234 123456 20181106-15:43:14 450,00
  • 15. 15 Grafové embeddingy › Projekce do prostoru souřadnic – Modely operují v kartézském prostoru – „Kontext“ bývá z podstaty nekartézský (slova, grafy,…) EMBEDDING
  • 17. 17 Technologie a implementace APACHE SPARK SQL BUSINESS KNOWLEDGE DWH A B TM $ TRANSACTIONS # # # # Technologické platformy: Hadoop nebo Cloud (Databricks na Azure nebo AWS)
  • 18. 18 Implementace › Python – Hlavní vývojový jazyk (ml/mlops knihovny, optimální poměr vývojového a běhového času, lze dodržovat standardní sw. proces) › Modelové flow – metadatová registrace artefaktů – Výpočty jednotlivých součástí trvají hodiny a dny, nelze spouštět v jednom běhu. Desítky modulů fungují v kontraktačním režimu. › Implementace v Cloudu – Začali jsme vývojem na Hadoop, ale stavíme i cloud verzi – rychlé pilotování.
  • 19. 19 › Cíl: Propensitní modelování pro cílený marketing TRANSACTIONS & CLIENT DATA SIMILARITIES NETWORKS SCORING TARGETING › Byznys case › Nejlepší možná predikce zájmu o půjčku › Zaměřeno na optimalizaci využití kanálů › Pilotní implementace v Equa Bank, a.s. › Výkon modelu až na úrovni 87 %AUC Shrnutí
  • 21. Profinit EU, s.r.o. Tychonova 2, 160 00 Prague 6 | Phone + 420 224 316 016 Web www.profinit.eu LinkedIn linkedin.com/company/profinit Twitter twitter.com/Profinit_EU Facebook facebook.com/Profinit.EU Youtube Profinit EU Děkujeme za pozornost! bigdataforbanking.com