Dokumen tersebut membahas perbedaan antara data science dan machine learning serta siklus hidup proyek data science. Data science berfokus pada pemahaman data untuk kebutuhan bisnis sedangkan machine learning berfokus pada cara mesin belajar dari data. Siklus hidup proyek data science meliputi pemahaman kebutuhan bisnis, akuisisi data, pra-pemrosesan data, pemodelan menggunakan machine learning, dan penyebarluasan model. Contoh kasus yang dijelaskan adalah sistem
3. Ventje Jeremias Lewi Engel, M.T., CEH
Dosen Informatika ITHB
Peneliti Machine Learning
Aktivis Cybersecurity
Follow me for daily content of ML & AI
@ventje_engel
Who am I
4. Data Science vs Machine Learning
Data Science Life Cycle
Real Life Story in Data Project
OUTLINE
9. Kita membutuhkan tools dan teknik yang lebih
advanced. Enter the Data Science.
Deep dives at granular level of
data
Understand complex behaviors
and trends
Smarter business decision
10. Netflix menganalisis pola dan kebiasaan
menonton setiap customernya
What drives user interest
What to recommend
How to get new
customers
11. P&G dan Unilever menganalisis pola belanja
customer berdasarkan waktu dan season
What future demand will
be
Who are the moving
targets
12. Di sisi lain, Machine Learning berkembang untuk
membuat mesin bisa belajar dari data
Awalnya adalah proses statistik
yang diotomatisasi
13. Machine Learning menemukan pola yang
sebelumya tidak bisa dilihat oleh ahli statistik
Efisiensi
Automation
Scaling
Akurasi &
sensitivitas
15. Data Science
Data science berfokus kepada pemahaman data
dari sisi internal maupun eksternal organisasi
Machine learning berfokus pada cara mesin
belajar dari data tanpa intervensi manusia
Machine Learning
Data science memerlukan keahlian banyak
bidang: statistik, IT, domain bisnis, dan presentasi
Machine learning memerlukan keahlian di bidang
statistik, kalkulus, dan pemrograman
Data science memiliki target untuk memberikan
rekomendasi bagi manajemen organisasi
Machine learning memiliki target untuk modeling,
automation, dan scaling
Data science sangat menekankan pada business
requirements & understanding
Machine learning sangat menekankan pada
peningkatan akurasi, sensitivitas, bias, & variance
Data Scientist: people person & open-minded Machine Learning Engineer: technical-oriented
VS
16. Data Science vs Machine Learning
Data Science Life Cycle
Real Life Story in Data Project
OUTLINE
17. 5STEPSTIPSORPOINTS
BUSINESS REQUIREMENTS
Memahami kebutuhan dan target bisnis dari organisasi.1
DATA ACQUISITION
Identifikasi sumber data yang akan dikoneksikan dan data apa saja yang
diperlukan. Memastikan format data yang bisa dikelola dengan mudah.
2
DATA PREPROCESSING
Menyiapkan data untuk analisis dengan data cleaning: duplikat,
missing, outliers. Dilanjutkan dengan eksplorasi data: viz dan non-viz.
3
MODELING
Di tahap ini Machine Learning digunakan.4
DEPLOYMENT
Model yang sudah siap dimasukkan ke server production. Memastikan
bisa diakses via web services dan aplikasi mobile. Bertanggung jawab
terhadap maintenance dan scaling.
5
19. BUSINESS REQUIREMENTS
Sistem rekomendasi untuk
meningkatkan penjualan
Funnel dalam penjualan: viewing -
wishlist - add to cart - checkout -
payment - delivery
1
20. DATA ACQUISITION
Data apa saja: viewing history,
wishlist, Previous purchases, Pola
review dan rating customer, dan Info
detail termasuk info pembayaran
Sumber data?
Format yang didapat? Perlu
transformasi data? Disimpan di
mana?
2
21. DATA PREPROCESSING
Cleaning: duplikat, missing, outliers.
Fake data (profile & reviews)
Stage from funnel
Unnecessary data
Exploration & visualization
3