SlideShare a Scribd company logo
PEMODELAN RESPON PELANGGAN UNTUK
MENENTUKAN TARGET PELANGAN PADA
PRODUK BARU DI PERUSAHAAN X
Oleh :
Dissa Rahmayani 06211540000070
Dosen Pengampu:
Novri Suhermi, S.Si, M.Sc
DEPARTEMEN STATISTIKA
FAKULTAS MATEMATIKA, KOMPUTASI, DAN SAINS DATA
INSTITUT TEKNOLOGI SEPULUH NOPEMBER
SURABAYA 2018
OUTLINE
01 Pendahuluan
02
03
04
Metodologi Penelitian
Analisis dan Pembahasan
Kesimpulan
212/20/2018
I. PENDAHULUAN
PENDAHULUAN
Perusahaan melakukan promosi untuk
menarik perhatian pelanggan
Promosi
Perusahaan membutuhkan respon
dari pelanggan untuk mengevaluasi
produk
Pelanggan diklasifikasikan menjadi
2, yaitu pelanggan yang memberi
respon dan tidak
Respon
Klasifikasi
12/20/2018 4
II. METODOLOGI PENELITIAN
Data yang digunakan pada analisis ini merupakan data
sekunder yang diperoleh dari website Kaggle yaitu
tentang “Promotion Response and Target Dataset”
dengan data pelanggan sebanyak 25.000 data.
Sumber Data
612/20/2018
Variabel Penelitian
Variabel Keterangan Tipe Data
01 Resp Respon (0 = Tidak, 1 = Ya) Kategorik
02 Card_tenure Card tenure dalam bulan Numerik
03 Risk_score Risk Score Numerik
04 Num_promoted Berapa kali pelanggan dihubungi Numerik
05 Avg_bal Average balance Numerik
06 Geo_group Geographical group ( W, SE, S, E) Kategorik
07 Res_type Residence type (SI = single family, CO
= cooperative, CN = Condominium, RE
= rental, TO = Townhouse)
kategorik
12/20/2018 7
Langkah Analisis
060504030201
Melakukan
eksplorasi data
pelanggan
Preprocessing
meliputi imputasi
missing value dan
membuat kode
pada data
kategorik
Membuat variabel
baru / feature
engineering
Memilih variabel
terbaik / feature
selection
Klasifikasi respon
pelanggan dengan
metode
pengambilan
sampel Hold-out
dan Cross
Validation
Menentukan model
terbaik
berdasarkan
parameter tuning
12/20/2018 8
III. ANALISIS DAN PEMBAHASAN
Karakteristik Data
Dari 25.000 data pelanggan, hanya 6,9% pelanggan yang
memberikan respon terhadap produk. Sedangkan 96,1% lainnya
tidak memberikan respon
12/20/2018 10
Karakteristik Data
12/20/2018 11
Karakteristik Data
12/20/2018 12
Karakteristik Data
12/20/2018 13
Preprocessing
Card tenure dan average balance
diimputasi dengan nilai median.
Geographical group dan residence
type diimputasi dengan nilai modus.
Variabel Missing Value
Resp 0
Card_tenure 485
Risk_score 0
Num_promoted 0
Avg_bal 714
Geo_group 509
Res_type 984
12/20/2018 14
Feature Engineering
Feature engineering dilakukan dengan mengubah kategori pada variabel
Geographical group dan Residence type menjadi dummy. Dengan demikian,
terbentuk variabel baru yaitu geo_N, geo_SE, geo_W, res_CO, res_RE, res_SI,
dan res_TO
12/20/2018 15
Feature Selection
Variabel terbaik adalah :
1. card tenure
2. risk score
3. average balance
4. geographical group N
5. residence type rental
6. residence single family
12/20/2018 16
Hold-out Method
Sebanyak 8 dari 9 metode,
akurasi yang didapatkan dari
stratify train-test split lebih baik
dibandingkan dengan train-test
split.
Dengan metode ini, metode
klasifikasi yang menghasilkan
akurasi tertinggi adalah
Decision Tree
Metode
Akurasi
Train-Test split Stratify Train-Test Split
kNN 0.744 0.932
Naive Bayes 0.649 0.907
Decision Tree 0.998 0.999
Bagging 0.964 0.984
Random Forest 0.968 0.983
Gradient Boosting 0.715 0.932
Adaptive Boosting 0.671 0.931
SVM 0.337 0.904
Regresi Logistik 0.604 0.579
12/20/2018 17
Cross Validation
Nilai akurasi yang didapatkan
berdasarkan nilai Kfold dan
Stratified Kfold hampir sama,
sehingga keduanya sama-
sama baik digunakan.
Metode
Akurasi
KFold Stratified Kfold
kNN 0.927 0.927
Naive Bayes 0.907 0.906
Decision Tree 0.868 0.869
Bagging 0.921 0.921
Random Forest 0.922 0.921
Gradient Boosting 0.931 0.931
Adaptive Boosting 0.931 0.931
SVM 0.931 0.931
Regresi Logistik 0.931 0.931
12/20/2018 18
Parameter Tuning
Parameter tuning bertujuan
untuk memilih parameter
terbaik untuk
mengklasifikasikan model
12/20/2018 19
Metode Parameter Tuning
kNN {'n_neighbors': 20, 'weights': 'uniform'}
Decision
Tree
{'class_weight': None, 'max_depth': None,
'max_leaf_nodes': None, 'min_samples_leaf': 21,
'min_samples_split': 82}
Random
Forest
{'max_depth': 10,'max_features': 1.0,
'min_samples_leaf': 10,'n_estimators': 5}
Gradient
Boosting
{'learning_rate': 0.01,'max_depth': 7, 'max_features':
'auto','min_samples_leaf': 1, 'n_estimators': 100}
Best Model Decision Tree
Nilai akurasi data training tertinggi adalah klasifikasi dengan metode Decision Tree
dengan pengambilan sampel stratify training-testing yaitu sebesar 0,998 dan data testing
sebesar 0.862.
Berdasarkan parameter tuning, nilai akurasi data training yang didapatkan sebesar
0,93135 dan data testing sebesar 0,9314. Sehingga model sudah baik dan tidak terjadi
overfitting
12/20/2018 20
IV. KESIMPULAN
Dari 25.000 pelanggan, hanya 6,9% saja yang memberikan respon terhadap produk. Sebagian
besar pelanggan di Perusahaan X berasal dari wilayah timur dan mempunyai tempat tinggal
berjenis cooperative
KESIMPULAN
01
Pada metode Hold-out, penggunaan stratify Train-test split lebih baik digunakan dibandingkan train-
test split, terutama pada data imbalanced. Pada metode cross validation, baik Kfold maupun stratify
Kfold sama-sama baik digunakan
Best model yang didapatkan adalah Decision Tree dengan parameter tuning yang menghasilkan
akurasi pada data training sebesar 0,93135 dan data testing sebesar 0,9314.
02
03
2212/20/2018
Terima Kasih

More Related Content

Recently uploaded

2 Depresiasi & Pelepasan Aset Tetap.pptx
2 Depresiasi &  Pelepasan Aset Tetap.pptx2 Depresiasi &  Pelepasan Aset Tetap.pptx
2 Depresiasi & Pelepasan Aset Tetap.pptx
NicolasBayu
 
PREMIUM!!! WA 0821 7001 0763 (FORTRESS) Pintu Dobel Minimalis di Denpasar.pdf
PREMIUM!!! WA 0821 7001 0763 (FORTRESS) Pintu Dobel Minimalis di Denpasar.pdfPREMIUM!!! WA 0821 7001 0763 (FORTRESS) Pintu Dobel Minimalis di Denpasar.pdf
PREMIUM!!! WA 0821 7001 0763 (FORTRESS) Pintu Dobel Minimalis di Denpasar.pdf
FORTRESS
 
Ilmu PENGANTAR BISNIS creat riva dan teman teman.pptx
Ilmu PENGANTAR BISNIS creat riva dan teman teman.pptxIlmu PENGANTAR BISNIS creat riva dan teman teman.pptx
Ilmu PENGANTAR BISNIS creat riva dan teman teman.pptx
RamonaChasdiana
 
Project Bab 1 - Kelompok 1 Dari kami yang sudah membuat.pptx
Project Bab 1 - Kelompok 1 Dari kami yang sudah membuat.pptxProject Bab 1 - Kelompok 1 Dari kami yang sudah membuat.pptx
Project Bab 1 - Kelompok 1 Dari kami yang sudah membuat.pptx
abiddah0606
 
Proposal Bisnis Jasa Laundry Pakaian.ppt
Proposal Bisnis Jasa Laundry Pakaian.pptProposal Bisnis Jasa Laundry Pakaian.ppt
Proposal Bisnis Jasa Laundry Pakaian.ppt
muhamadrafiakbar
 
Metode Pengembangan Sistem Informasiiiii
Metode Pengembangan Sistem InformasiiiiiMetode Pengembangan Sistem Informasiiiii
Metode Pengembangan Sistem Informasiiiii
RioCesar
 
3 Kewajiban Lancar & Kewajiban Jangka Panjang.pptx
3 Kewajiban Lancar & Kewajiban Jangka Panjang.pptx3 Kewajiban Lancar & Kewajiban Jangka Panjang.pptx
3 Kewajiban Lancar & Kewajiban Jangka Panjang.pptx
NicolasBayu
 
STRATEGI PASAR dalam menjalankan bisnis pemasar
STRATEGI PASAR dalam menjalankan bisnis pemasarSTRATEGI PASAR dalam menjalankan bisnis pemasar
STRATEGI PASAR dalam menjalankan bisnis pemasar
rioeradeka
 
Pengembangan Strategi Pemasaran UMKM Melalui Media Online pada Komunitas Ibu-...
Pengembangan Strategi Pemasaran UMKM Melalui Media Online pada Komunitas Ibu-...Pengembangan Strategi Pemasaran UMKM Melalui Media Online pada Komunitas Ibu-...
Pengembangan Strategi Pemasaran UMKM Melalui Media Online pada Komunitas Ibu-...
Habibatut Tijani
 
ACCURATE ONLINE - MANUAL BOOK - CARA PENGGUNAAN.pdf
ACCURATE ONLINE - MANUAL BOOK - CARA PENGGUNAAN.pdfACCURATE ONLINE - MANUAL BOOK - CARA PENGGUNAAN.pdf
ACCURATE ONLINE - MANUAL BOOK - CARA PENGGUNAAN.pdf
Azvan Enginering
 
Pertemuan 6 Materi Kecerdasan Intelektual.ppt
Pertemuan 6 Materi Kecerdasan Intelektual.pptPertemuan 6 Materi Kecerdasan Intelektual.ppt
Pertemuan 6 Materi Kecerdasan Intelektual.ppt
MardhatilaFitriSopal
 
UNIKBET : Daftar Slot Pragmatic Play Yang Ada Deposit Sesama Bank DKI Promo B...
UNIKBET : Daftar Slot Pragmatic Play Yang Ada Deposit Sesama Bank DKI Promo B...UNIKBET : Daftar Slot Pragmatic Play Yang Ada Deposit Sesama Bank DKI Promo B...
UNIKBET : Daftar Slot Pragmatic Play Yang Ada Deposit Sesama Bank DKI Promo B...
unikbetslotbankmaybank
 

Recently uploaded (12)

2 Depresiasi & Pelepasan Aset Tetap.pptx
2 Depresiasi &  Pelepasan Aset Tetap.pptx2 Depresiasi &  Pelepasan Aset Tetap.pptx
2 Depresiasi & Pelepasan Aset Tetap.pptx
 
PREMIUM!!! WA 0821 7001 0763 (FORTRESS) Pintu Dobel Minimalis di Denpasar.pdf
PREMIUM!!! WA 0821 7001 0763 (FORTRESS) Pintu Dobel Minimalis di Denpasar.pdfPREMIUM!!! WA 0821 7001 0763 (FORTRESS) Pintu Dobel Minimalis di Denpasar.pdf
PREMIUM!!! WA 0821 7001 0763 (FORTRESS) Pintu Dobel Minimalis di Denpasar.pdf
 
Ilmu PENGANTAR BISNIS creat riva dan teman teman.pptx
Ilmu PENGANTAR BISNIS creat riva dan teman teman.pptxIlmu PENGANTAR BISNIS creat riva dan teman teman.pptx
Ilmu PENGANTAR BISNIS creat riva dan teman teman.pptx
 
Project Bab 1 - Kelompok 1 Dari kami yang sudah membuat.pptx
Project Bab 1 - Kelompok 1 Dari kami yang sudah membuat.pptxProject Bab 1 - Kelompok 1 Dari kami yang sudah membuat.pptx
Project Bab 1 - Kelompok 1 Dari kami yang sudah membuat.pptx
 
Proposal Bisnis Jasa Laundry Pakaian.ppt
Proposal Bisnis Jasa Laundry Pakaian.pptProposal Bisnis Jasa Laundry Pakaian.ppt
Proposal Bisnis Jasa Laundry Pakaian.ppt
 
Metode Pengembangan Sistem Informasiiiii
Metode Pengembangan Sistem InformasiiiiiMetode Pengembangan Sistem Informasiiiii
Metode Pengembangan Sistem Informasiiiii
 
3 Kewajiban Lancar & Kewajiban Jangka Panjang.pptx
3 Kewajiban Lancar & Kewajiban Jangka Panjang.pptx3 Kewajiban Lancar & Kewajiban Jangka Panjang.pptx
3 Kewajiban Lancar & Kewajiban Jangka Panjang.pptx
 
STRATEGI PASAR dalam menjalankan bisnis pemasar
STRATEGI PASAR dalam menjalankan bisnis pemasarSTRATEGI PASAR dalam menjalankan bisnis pemasar
STRATEGI PASAR dalam menjalankan bisnis pemasar
 
Pengembangan Strategi Pemasaran UMKM Melalui Media Online pada Komunitas Ibu-...
Pengembangan Strategi Pemasaran UMKM Melalui Media Online pada Komunitas Ibu-...Pengembangan Strategi Pemasaran UMKM Melalui Media Online pada Komunitas Ibu-...
Pengembangan Strategi Pemasaran UMKM Melalui Media Online pada Komunitas Ibu-...
 
ACCURATE ONLINE - MANUAL BOOK - CARA PENGGUNAAN.pdf
ACCURATE ONLINE - MANUAL BOOK - CARA PENGGUNAAN.pdfACCURATE ONLINE - MANUAL BOOK - CARA PENGGUNAAN.pdf
ACCURATE ONLINE - MANUAL BOOK - CARA PENGGUNAAN.pdf
 
Pertemuan 6 Materi Kecerdasan Intelektual.ppt
Pertemuan 6 Materi Kecerdasan Intelektual.pptPertemuan 6 Materi Kecerdasan Intelektual.ppt
Pertemuan 6 Materi Kecerdasan Intelektual.ppt
 
UNIKBET : Daftar Slot Pragmatic Play Yang Ada Deposit Sesama Bank DKI Promo B...
UNIKBET : Daftar Slot Pragmatic Play Yang Ada Deposit Sesama Bank DKI Promo B...UNIKBET : Daftar Slot Pragmatic Play Yang Ada Deposit Sesama Bank DKI Promo B...
UNIKBET : Daftar Slot Pragmatic Play Yang Ada Deposit Sesama Bank DKI Promo B...
 

Featured

Product Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage EngineeringsProduct Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage Engineerings
Pixeldarts
 
How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthHow Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental Health
ThinkNow
 
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfAI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
marketingartwork
 
Skeleton Culture Code
Skeleton Culture CodeSkeleton Culture Code
Skeleton Culture Code
Skeleton Technologies
 
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024
Neil Kimberley
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)
contently
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
Albert Qian
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
Kurio // The Social Media Age(ncy)
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
Search Engine Journal
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
SpeakerHub
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next
Tessa Mero
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Lily Ray
 
How to have difficult conversations
How to have difficult conversations How to have difficult conversations
How to have difficult conversations
Rajiv Jayarajah, MAppComm, ACC
 
Introduction to Data Science
Introduction to Data ScienceIntroduction to Data Science
Introduction to Data Science
Christy Abraham Joy
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best Practices
Vit Horky
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project management
MindGenius
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
RachelPearson36
 
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Applitools
 
12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work
GetSmarter
 

Featured (20)

Product Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage EngineeringsProduct Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage Engineerings
 
How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthHow Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental Health
 
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfAI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
 
Skeleton Culture Code
Skeleton Culture CodeSkeleton Culture Code
Skeleton Culture Code
 
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search Intent
 
How to have difficult conversations
How to have difficult conversations How to have difficult conversations
How to have difficult conversations
 
Introduction to Data Science
Introduction to Data ScienceIntroduction to Data Science
Introduction to Data Science
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best Practices
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project management
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
 
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
 
12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work
 

Klasifikasi Respon pelanggan di Perusahaan X

  • 1. PEMODELAN RESPON PELANGGAN UNTUK MENENTUKAN TARGET PELANGAN PADA PRODUK BARU DI PERUSAHAAN X Oleh : Dissa Rahmayani 06211540000070 Dosen Pengampu: Novri Suhermi, S.Si, M.Sc DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA, KOMPUTASI, DAN SAINS DATA INSTITUT TEKNOLOGI SEPULUH NOPEMBER SURABAYA 2018
  • 4. PENDAHULUAN Perusahaan melakukan promosi untuk menarik perhatian pelanggan Promosi Perusahaan membutuhkan respon dari pelanggan untuk mengevaluasi produk Pelanggan diklasifikasikan menjadi 2, yaitu pelanggan yang memberi respon dan tidak Respon Klasifikasi 12/20/2018 4
  • 6. Data yang digunakan pada analisis ini merupakan data sekunder yang diperoleh dari website Kaggle yaitu tentang “Promotion Response and Target Dataset” dengan data pelanggan sebanyak 25.000 data. Sumber Data 612/20/2018
  • 7. Variabel Penelitian Variabel Keterangan Tipe Data 01 Resp Respon (0 = Tidak, 1 = Ya) Kategorik 02 Card_tenure Card tenure dalam bulan Numerik 03 Risk_score Risk Score Numerik 04 Num_promoted Berapa kali pelanggan dihubungi Numerik 05 Avg_bal Average balance Numerik 06 Geo_group Geographical group ( W, SE, S, E) Kategorik 07 Res_type Residence type (SI = single family, CO = cooperative, CN = Condominium, RE = rental, TO = Townhouse) kategorik 12/20/2018 7
  • 8. Langkah Analisis 060504030201 Melakukan eksplorasi data pelanggan Preprocessing meliputi imputasi missing value dan membuat kode pada data kategorik Membuat variabel baru / feature engineering Memilih variabel terbaik / feature selection Klasifikasi respon pelanggan dengan metode pengambilan sampel Hold-out dan Cross Validation Menentukan model terbaik berdasarkan parameter tuning 12/20/2018 8
  • 9. III. ANALISIS DAN PEMBAHASAN
  • 10. Karakteristik Data Dari 25.000 data pelanggan, hanya 6,9% pelanggan yang memberikan respon terhadap produk. Sedangkan 96,1% lainnya tidak memberikan respon 12/20/2018 10
  • 14. Preprocessing Card tenure dan average balance diimputasi dengan nilai median. Geographical group dan residence type diimputasi dengan nilai modus. Variabel Missing Value Resp 0 Card_tenure 485 Risk_score 0 Num_promoted 0 Avg_bal 714 Geo_group 509 Res_type 984 12/20/2018 14
  • 15. Feature Engineering Feature engineering dilakukan dengan mengubah kategori pada variabel Geographical group dan Residence type menjadi dummy. Dengan demikian, terbentuk variabel baru yaitu geo_N, geo_SE, geo_W, res_CO, res_RE, res_SI, dan res_TO 12/20/2018 15
  • 16. Feature Selection Variabel terbaik adalah : 1. card tenure 2. risk score 3. average balance 4. geographical group N 5. residence type rental 6. residence single family 12/20/2018 16
  • 17. Hold-out Method Sebanyak 8 dari 9 metode, akurasi yang didapatkan dari stratify train-test split lebih baik dibandingkan dengan train-test split. Dengan metode ini, metode klasifikasi yang menghasilkan akurasi tertinggi adalah Decision Tree Metode Akurasi Train-Test split Stratify Train-Test Split kNN 0.744 0.932 Naive Bayes 0.649 0.907 Decision Tree 0.998 0.999 Bagging 0.964 0.984 Random Forest 0.968 0.983 Gradient Boosting 0.715 0.932 Adaptive Boosting 0.671 0.931 SVM 0.337 0.904 Regresi Logistik 0.604 0.579 12/20/2018 17
  • 18. Cross Validation Nilai akurasi yang didapatkan berdasarkan nilai Kfold dan Stratified Kfold hampir sama, sehingga keduanya sama- sama baik digunakan. Metode Akurasi KFold Stratified Kfold kNN 0.927 0.927 Naive Bayes 0.907 0.906 Decision Tree 0.868 0.869 Bagging 0.921 0.921 Random Forest 0.922 0.921 Gradient Boosting 0.931 0.931 Adaptive Boosting 0.931 0.931 SVM 0.931 0.931 Regresi Logistik 0.931 0.931 12/20/2018 18
  • 19. Parameter Tuning Parameter tuning bertujuan untuk memilih parameter terbaik untuk mengklasifikasikan model 12/20/2018 19 Metode Parameter Tuning kNN {'n_neighbors': 20, 'weights': 'uniform'} Decision Tree {'class_weight': None, 'max_depth': None, 'max_leaf_nodes': None, 'min_samples_leaf': 21, 'min_samples_split': 82} Random Forest {'max_depth': 10,'max_features': 1.0, 'min_samples_leaf': 10,'n_estimators': 5} Gradient Boosting {'learning_rate': 0.01,'max_depth': 7, 'max_features': 'auto','min_samples_leaf': 1, 'n_estimators': 100}
  • 20. Best Model Decision Tree Nilai akurasi data training tertinggi adalah klasifikasi dengan metode Decision Tree dengan pengambilan sampel stratify training-testing yaitu sebesar 0,998 dan data testing sebesar 0.862. Berdasarkan parameter tuning, nilai akurasi data training yang didapatkan sebesar 0,93135 dan data testing sebesar 0,9314. Sehingga model sudah baik dan tidak terjadi overfitting 12/20/2018 20
  • 22. Dari 25.000 pelanggan, hanya 6,9% saja yang memberikan respon terhadap produk. Sebagian besar pelanggan di Perusahaan X berasal dari wilayah timur dan mempunyai tempat tinggal berjenis cooperative KESIMPULAN 01 Pada metode Hold-out, penggunaan stratify Train-test split lebih baik digunakan dibandingkan train- test split, terutama pada data imbalanced. Pada metode cross validation, baik Kfold maupun stratify Kfold sama-sama baik digunakan Best model yang didapatkan adalah Decision Tree dengan parameter tuning yang menghasilkan akurasi pada data training sebesar 0,93135 dan data testing sebesar 0,9314. 02 03 2212/20/2018