6. Apa yang ada di pikiran kalian ketika mendengar…
“Data Science”
7. Data Science
● Apa itu data science ?
● Bagaimana flow data science di dunia industri ?
● Tools yang digunakan dalam data science ?
POIN
PEMBAHASAN
1
Python
● Introduction to Python
● Hands on - Google Collaboratory
2
9. Data Science
Berdasarkan bisnis, data science adalah Ilmu yang mempelajari data untuk menghasilkan
insights business dan membuat keputusan bisnis lebih baik (Better Decision Making).
“Data is the New Oil”
But data without analytics, insights, and
wisdom, is like an oil field without a pump.
Invest in people, systems, and strategies
that connect the dots.
10. Nasabah Perbankan yang tidak aktif bertransaksi dalam 6 bulan
terakhir memiliki kecenderungan tidak mampu membayar
pinjaman hingga lunas jika ajuan pinjamannya di setujui.
Pekerjaan Data Science
Pada Grocery Store kita, Customer yang metode
pembayarannya menggunakan e-wallet, debit atau credit card
memiliki potensi berbelanja 15% lebih banyak dibandingkan
menggunakan Cash.
11. Pekerjaan Data Science (Basic)
Classification
Membangun model machine learning yang mampu
menentukan apakah ajuan pinjaman calon debitur
diterima/ditolak.
Hasil dari model tersebut berupa score.
SCORE
Transaction History
Customer Data
12. Pekerjaan Data Science (Basic)
Menentukan apakah pelanggan internet provider akan mengganti provider atau tidak
Mendeteksi lebih dini apakah suatu karyawan akan resign atau tidak
Mendeteksi apakah seorang pasien menderita penyakit kanker
Classification
Memprediksi Harga Rumah atau Harga Mobil
Menentukan Jumlah uang yang akan ditarik (Cash Out) pada suatu ATM
Mengelompokkan wilayah indonesia menjadi beberapa kelompok potensial (Business)
Melakukan segmentasi customer kedalam beberapa segment
Regression
Forecasting
Clustering
13. Pekerjaan Data Science (Advanced)
Face Recognition Text Summarization (NLP) Mobility Analysis
Geospatial Indexing Product Recommendation
17. Why Data Science?
Loan Interest Index
Jumlah Peminjam
Total Pinjaman yang tersalurkan
Demografi (Kabupaten/Kota)
Business and Economic Index
Jumlah UMKM
PDB Wilayah
etc
18. Why Data Science?
Loan Interest Index
Loan Interest Index merupakan skor yang menunjukkan
ketertarikan suatu wilayah terhadap produk pinjaman
perusahaan kita.
Business and Economics Index
Business and Economics Index merupakan skor yang
menunjukkan tingkat aktivitas bisnis dan perekonomian
suatu wilayah.
Note: Data yang digunakan merupakan data dummy
19. Why Data Science?
Note: Data yang digunakan merupakan data dummy
Loan Interest Index
Business and
Economics Index
MACHINE
LEARNING
Loan Interest Index
Business
and
Economic
Index
BEST
OCEAN
UNPRODUCTIVE Narrow
Clustering
20. Why Data Science?
Note: Data yang digunakan merupakan data dummy
USER ACQUISITION
Untuk Akuisisi User Baru
maka region terbaik berada
pada Cluster BEST dan
OCEAN
22. Identify and Analyze the Business Problem
Collect (Big) Data
Join and Store Data
Data Exploration and Transformation
Data Preparation
Analytics
Data Science Flow
Take
Biz
Decision
Who are most likely
to buy our
products?
Business Team
Data Engineer Data Scientist
28. What is machine learning?
Business Needs
Team Business memberikan kebutuhan bisnis
kepada team data untuk mengidentifikasi
transaksi kartu kredit yang terdeteksi
FRAUD sebelum berdampak
buruk kepada perusahaan
29. What is machine learning?
Classical Programming Approach
Detection
Transaction History
Rules
Problems:
● Programmer harus menerapkan rule kepada system secara manual
● Kasus Fraud yang terjadi hampir tidak bisa dideteksi (Complex Rule)
● Setiap rule yang ditambahkan memperlambat proses deteksi
30. What is machine learning?
Classical Programming Approach
Detection
Transaction History
Rules
Machine Learning Approach
Model
Transaction History
Customer Data
Most Recent
Transaction Detection
31. What is machine learning?
Classical Programming Approach
Rules Mutlak
33. What is machine learning?
Machine Learning Approach
Model
Transaction History
Customer Data
Most Recent
Transaction Detection
Advantage Using Machine Learning:
● Mencari Pola dan Mendefinisikan Rules berdasarkan Data tanpa bantuan manusia
● Mampu beradaptasi terhadap kasus - kasus fraud terbaru
● Model yang dibuat tidak memerlukan waktu komputasi yang lama (Prediksi lebih cepat)
34. Start
What is machine learning?
Classical Programming Approach
Rule
Based
Transaction History
Rules
New
Transaction
Fraud Not Fraud
Machine Learning Approach
Model
Transaction History
Customer Data
Most Recent
Transaction
Fraud Not Fraud
Start
New
Transaction
35. What is machine learning?
Labeled Data
Direct Feedback
Predict Outcome / Future
Continues Decision Process
Reward Based Learning
Learn Serief of Action
No Labels
No Feedback
Find Hidden Structure
39. Why Python?
Advantage Using Python:
● Memiliki dukungan yang lebih baik untuk pengembangan aplikasi
● Memiliki banyak library untuk pengolahan data dan analisis statistik
(Open Source)
● Lebih populer dan banyak digunakan (Collaborative)
● Lebih cepat dalam eksekusi kode pada beberapa kasus, terutama pada
pengolahan data yang besar