4. Data science adalah penggabungan
matematika dan statistik, pemrograman, analitik,
artificial intelligence, dan machine learning.
- IBM -
Data science adalah bidang multidisiplin yang
mengekstraksi pengetahuan dan wawasan dari
data terstruktur dan tidak terstruktur melalui
analisis statistik, pembelajaran mesin, dan
keahlian domain. - Analytics Vidhya -
9. https://www.dicoding.com/academies/615/tutorials/33238
Data Scientist Data Engineer Data Analyst
Data scientist adalah praktisi
dalam bidang data science.
Data engineer merupakan seseorang
yang tugas utamanya adalah
menyiapkan data yang dikoleksi dari
berbagai sumber informasi dengan
membangun sistem data atau
infrastruktur agar dapat mudah untuk
dianalisa dan mendukung kebutuhan
perusahaan
Data analyst adalah profesi
pekerjaan yang bertugas untuk
membaca serta menganalisis
data yang ada dari perusahaan.
10. Tahapan Data Science
Problem Definition Data Collection Data Preprocesing
Deployment Model Evaluation Modelling
https://databasetown.com/6-steps-of-data-science-lifecycle/
17. Data preprocessing adalah serangkaian teknik untuk
menyiapkan dan membersihkan data mentah sehingga siap
untuk analisis lebih lanjut. Proses ini memastikan bahwa data
yang digunakan memiliki kualitas tinggi dan relevan.
25. Handle Missing Value
1. Delete Data = Jumlah missing value sangat kecil
2. Mean = data numerik ketika distribusi data mendekati
normal.
3. Median = Data memiliki outlier, karena lebih tahan terhadap
nilai ekstrem.
4. Modus = Data kategorikal
26. Cek Outlier
Outlier adalah sebuah data yang menyimpang
secara ekstrim dari rata-rata sekumpulan data yang
ada.
Contohnya terdapat data tinggi badan mahasiswa,
antara lain: 9 cm, 145 cm, 150 cm, 153 cm, 617 cm.
Dari data di atas yang dimaksud dengan outlier
adalah “9 cm” karena terlalu rendah dan “617 cm”
sebab terlalu tinggi.