Advertisement
Advertisement

More Related Content

Similar to 3차프로젝트 스페인 santander 은행 고객 데이터를 활용한 금융상품 추천(20)

Recently uploaded(20)

Advertisement

3차프로젝트 스페인 santander 은행 고객 데이터를 활용한 금융상품 추천

  1. Santander Product Recommendation
  2. Contents 1. 프로젝트 개요 2. 데이터 개요 및 변수 설명 3. 분석 환경 4. SEMMA Process
  3. 1. 프로젝트 개요
  4. 4
  5. 5 김 진 아 전 병 훈정 현 진 시각화, 알고리즘 적용, 평가 방법 연구 EDA, 변수 생성, 데이터 전처리, 알고리즘 적용 EDA, 전처리, 알고리즘 공부&적용, 캐글 제출
  6. 2. 데이터 개요 및 변수 설명
  7. 7 데이터 셋 〮〮〮 〮〮〮 데이터 개요
  8. 8
  9. 9
  10. 3. 분석 환경
  11. 11 2GB
  12. 4. SEMMA Process
  13. 4-1. Sampling
  14. 14 Sampling Data Partitioning Data Raw Data “ ”
  15. 15 Test Data 194,648 15 Saving Account 194,659 4 Guarantees 77,290 117373 Current Accounts 179,756 14907 Payroll Account 193,045 1618 Junior Account 〮〮〮
  16. 4-2.Exploring
  17. 20 5030 40 60 70 80 90 100 150000 100000 50000 0 Female maleUnknown 150000 100000 50000 VIP Individuals college graduated unknown 150000 100000 50000 150000 100000 50000 ~ 50 51~100 101~150 151~200 200~
  18. Segment VIP Individuals college graduated unknown
  19. seniority ~ 50 51~100 101~150 151~200 200~
  20. age ~25 26~35 36~45 46~55 56~65 66~
  21. 4-3. Modify
  22. 22 . 01 02 03 04 05 06 07 …
  23. 23
  24. 24 “ ”
  25. 25 기존 변수
  26. 26 [1] Mortgage => Direct Debit 0.0061232 0.8603142 5.960670 [2] Payroll => Pensions 0.0625038 1.0000000 14.813015 [3] Pensions => Payroll 0.0625038 0.9258697 14.813015 [4] Payroll => Payroll Account 0.0592032 0.9471936 10.451423 [5] Pensions => Payroll Account 0.0638628 0.9460006 10.438259 ConfidenceSupport Lift ... 1 2 3 4
  27. 4-4. Modeling
  28. 28
  29. 29 “ ”
  30. 30
  31. 31
  32. 32 <
  33. 33 “ ”
  34. 34 Rendom Forest Naive Bayesian Logistic Regression Rendom Forest Naive Bayesian Logistic Regression Rendom Forest Naive Bayesian Logistic Regression Rendom Forest Naive Bayesian Logistic Regression Rendom Forest Naive Bayesian Logistic Regression Rendom Forest Naive Bayesian Logistic Regression 〮〮〮 0.305 0.938 0.290 0.333 0.764 0.356 0.718 0.613 0.713 0.700 0.400 0.300 0.841 0.609 0.919 0.967 0.812 0.977
  35. 35
  36. 4-5. Assessment
  37. 37 2016.06 고객ID 예측 상품 7개 실제 구매한 상품 (정답) Precision Average Precision 1 A, B, C, D, E, F, G B 0.5 0.5 / 1(정답 개수) 2 A, B, C, D, E, F, G A 1 1 / 1 (정갑 개수) 3 A, B, C, D, E, F, G G 0.14 0.14 / 1(정답개수) MAP@7 = = 0.2466 EX)
  38. 38
  39. 39
Advertisement