Your SlideShare is downloading. ×

Real-time prediktivni analytika na webu

5,668

Published on

Published in: Business
0 Comments
1 Like
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total Views
5,668
On Slideshare
0
From Embeds
0
Number of Embeds
8
Actions
Shares
0
Downloads
0
Comments
0
Likes
1
Embeds 0
No embeds

Report content
Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
No notes for slide

Transcript

  • 1. Real-time prediktivníanalytika na webuJiří Brázda13. 6. 2012
  • 2. Data miningLogistická regresePrincipal component analysis# PREDICTIONd.te$predProb <- predict(cs.m3bf, newdata=d.te, type="response"); #predict on testing settapply(d.te$predProb, d.te$yPurchase, mean, na.rm=T); #probability mean by response group# CROSSVALIDATIONd.te$predYPurchase <- ifelse( d.te$predProb < val.prob(d.te$predProb, as.numeric(d.te$yPurchase),cex=.5)[2], #ROC 0,1);
  • 3. Případová studie
  • 4.  4. největší pojišťovna dle předepsaného pojistného v neživotním pojištění v ČR  Naše case study [PDF] 2011: http://j.mp/csobpoj-redesign 2010: http://j.mp/csobpoj-omnitureReal-time prediktivní analytika na webu | Optimics 4
  • 5. Real-time prediktivní analytika na webu | Optimics 5
  • 6. 1 2 3 4 5 6Real-time prediktivní analytika na webu | Optimics 6
  • 7. V momentě výpočtu ceny se pokoušíme o predikci, zda tato návštěva skončí sjednáním pojistky či nikolivReal-time prediktivní analytika na webu | Optimics 7
  • 8. Postup vytvoření prediktivního modelu  Definice zadání a výběr proměnných  Příprava dat z Adobe SiteCatalyst  Rozdělení dat na training / test  Vytvoření modelu na training datech (logistická regrese)  Ověření modelu na test datech  Návrh aplikace modelu do praxe na webu – zvýšení konverzního poměru – zvýšení průměrného pojistnéhoReal-time prediktivní analytika na webu | Optimics 8
  • 9. Predikce x skutečnostReal-time prediktivní analytika na webu | Optimics 9
  • 10. Prediktivní analytika je jako popelka… … snaží se oddělit hrách a čočku do dvou ošatek hrách čočkaReal-time prediktivní analytika na webu | Optimics 10
  • 11. Jaký faktor zdaleka nejvícezvyšuje pravděpodobnostsjednání pojistky? A. Cena (čím nižší cena, tím větší pravděpodobnost) B. Předchozí nákup (tj. zákazník v minulosti již sjednal cestovní pojištění) C. Počet dětí na pojistce (čím více dětí, tím větší pravděpodobnost)
  • 12. Sjednání pojistky v minulostiReal-time prediktivní analytika na webu | Optimics 12
  • 13. Hodnocení modelu
  • 14. ROCReal-time prediktivní analytika na webu | Optimics 14
  • 15. Konzervativní modelReal-time prediktivní analytika na webu | Optimics 15
  • 16. Liberální modelReal-time prediktivní analytika na webu | Optimics 16
  • 17. Volba modelu závisí na aplikaci!!!  Volba modelu závisí na jeho aplikaci v reálném světě (a typicky nákladech spojených s false positives): – Ve zdravotnictví mohou mít false positives vážné následky – Na webu lze (relativně) beztrestně A/B testovat  Kritériem úspěšnosti modelu může být accuracy  Kritériem úspěšnosti prediktivní analytiky by měly být metriky související s prodeji / náklady / spokojeností zákazníkůReal-time prediktivní analytika na webu | Optimics 17
  • 18. Co bude teď dalším krokem proČSOB Pojišťovnu? A. Ladit model k dokonalosti. Zvyšovat kvalitativní parametry a přesnost modelu. B. Aplikovat model do praxe v rámci svého programu A/B testování na webu.
  • 19. Na dlouhé večery…  R http://www.r-project.org/  RapidMiner http://rapid-i.com/  Intro to ROC http://j.mp/introROC  Intro to DM http://j.mp/introDM  Data Mining http://j.mp/DMtechniques TechniquesReal-time prediktivní analytika na webu | Optimics 19
  • 20. Děkuji za pozornost! +420 602345620 jiri.brazda@optimics.cz

×