The document discusses data preparation and exploratory data analysis. It explains that exploratory data analysis involves exploring a dataset before using it, to understand the data source, data types, attribute names, duplicate rows, missing values, outliers, and univariate, bivariate, and multivariate analyses. This helps ensure the dataset is clean before applying data mining techniques to extract knowledge from the data. The document also provides examples of handling issues like missing values, duplicate rows, and outliers during exploratory data analysis.
Dokumen tersebut membahas konsep dasar klasifikasi, yang merupakan proses mengelompokkan data baru ke dalam kelas yang telah ditentukan sebelumnya berdasarkan atribut-atributnya. Diberikan contoh kasus klasifikasi pelanggan untuk menentukan bonus berdasarkan panggilan dan blok. Beberapa teknik klasifikasi dijelaskan seperti menggunakan probabilitas, aturan IF-ELSE, garis keputusan, jarak rata-rata
Kriptograf - Algoritma Kriptografi Klasik (bagian 1)KuliahKita
1. Algoritma kriptografi klasik meliputi cipher substitusi dan transposisi yang berbasis karakter tanpa menggunakan komputer. 2. Cipher substitusi seperti Caesar cipher mengganti huruf plainteks dengan huruf lain sesuai tabel substitusi, sedangkan cipher transposisi mengubah posisi huruf dengan mengacaknya. 3. Super enkripsi merupakan kombinasi dari cipher substitusi dan transposisi untuk meningkatkan keamanan teks rahasia.
Data mining 5 klasifikasi decision tree dan random forestIrwansyahSaputra1
The document discusses decision trees and random forests. It begins with an introduction to decision trees, including how they are used in everyday life to make decisions. It then covers key concepts such as entropy, information gain, and how decision trees use these concepts to build tree structures by recursively splitting nodes based on predictor variables that maximize information gain. The document provides examples to illustrate entropy, information gain, and how they are used to select the root node and build the tree structure.
Dokumen ini membahas konsep dan arsitektur data mining serta metode-metode yang digunakan dalam data mining seperti predictive modeling, clustering, association rule, dan sequence analysis beserta contoh-contoh penerapannya.
Dokumen tersebut merangkum tentang machine learning dan data mining. Machine learning adalah ilmu yang mempelajari cara memberikan kemampuan kepada komputer untuk menyelesaikan masalah secara mandiri tanpa bantuan user, sedangkan data mining adalah proses ekstraksi pengetahuan dari database besar menggunakan teknik statistik dan machine learning. Dokumen ini juga membahas perbedaan antara supervised learning dan unsupervised learning serta beberapa algoritma machine learning seperti klasifikasi, regresi, kl
Data science adalah ilmu yang menggabungkan matematika, statistika, dan ilmu komputer untuk menganalisis data besar dan kecil guna menemukan pola dan memprediksi dengan akurat, membantu pengambilan keputusan. Kemampuan pentingnya termasuk pemrograman, basis data, analisis dan visualisasi data, serta pemahaman masalah bisnis. Data science mencakup data mining untuk menemukan pola baru dan machine learning untuk melatih sistem agar belajar sendiri
Data Mining digunakan untuk mengekstrak pola dan pengetahuan dari data besar yang kompleks untuk memecahkan masalah bisnis. Teknik utama Data Mining meliputi estimasi, prediksi, klasifikasi, klastering dan asosiasi. Metode pembelajaran terdiri dari pembelajaran terbimbing, tidak terbimbing dan semi terbimbing.
The document discusses data preparation and exploratory data analysis. It explains that exploratory data analysis involves exploring a dataset before using it, to understand the data source, data types, attribute names, duplicate rows, missing values, outliers, and univariate, bivariate, and multivariate analyses. This helps ensure the dataset is clean before applying data mining techniques to extract knowledge from the data. The document also provides examples of handling issues like missing values, duplicate rows, and outliers during exploratory data analysis.
Dokumen tersebut membahas konsep dasar klasifikasi, yang merupakan proses mengelompokkan data baru ke dalam kelas yang telah ditentukan sebelumnya berdasarkan atribut-atributnya. Diberikan contoh kasus klasifikasi pelanggan untuk menentukan bonus berdasarkan panggilan dan blok. Beberapa teknik klasifikasi dijelaskan seperti menggunakan probabilitas, aturan IF-ELSE, garis keputusan, jarak rata-rata
Kriptograf - Algoritma Kriptografi Klasik (bagian 1)KuliahKita
1. Algoritma kriptografi klasik meliputi cipher substitusi dan transposisi yang berbasis karakter tanpa menggunakan komputer. 2. Cipher substitusi seperti Caesar cipher mengganti huruf plainteks dengan huruf lain sesuai tabel substitusi, sedangkan cipher transposisi mengubah posisi huruf dengan mengacaknya. 3. Super enkripsi merupakan kombinasi dari cipher substitusi dan transposisi untuk meningkatkan keamanan teks rahasia.
Data mining 5 klasifikasi decision tree dan random forestIrwansyahSaputra1
The document discusses decision trees and random forests. It begins with an introduction to decision trees, including how they are used in everyday life to make decisions. It then covers key concepts such as entropy, information gain, and how decision trees use these concepts to build tree structures by recursively splitting nodes based on predictor variables that maximize information gain. The document provides examples to illustrate entropy, information gain, and how they are used to select the root node and build the tree structure.
Dokumen ini membahas konsep dan arsitektur data mining serta metode-metode yang digunakan dalam data mining seperti predictive modeling, clustering, association rule, dan sequence analysis beserta contoh-contoh penerapannya.
Dokumen tersebut merangkum tentang machine learning dan data mining. Machine learning adalah ilmu yang mempelajari cara memberikan kemampuan kepada komputer untuk menyelesaikan masalah secara mandiri tanpa bantuan user, sedangkan data mining adalah proses ekstraksi pengetahuan dari database besar menggunakan teknik statistik dan machine learning. Dokumen ini juga membahas perbedaan antara supervised learning dan unsupervised learning serta beberapa algoritma machine learning seperti klasifikasi, regresi, kl
Data science adalah ilmu yang menggabungkan matematika, statistika, dan ilmu komputer untuk menganalisis data besar dan kecil guna menemukan pola dan memprediksi dengan akurat, membantu pengambilan keputusan. Kemampuan pentingnya termasuk pemrograman, basis data, analisis dan visualisasi data, serta pemahaman masalah bisnis. Data science mencakup data mining untuk menemukan pola baru dan machine learning untuk melatih sistem agar belajar sendiri
Data Mining digunakan untuk mengekstrak pola dan pengetahuan dari data besar yang kompleks untuk memecahkan masalah bisnis. Teknik utama Data Mining meliputi estimasi, prediksi, klasifikasi, klastering dan asosiasi. Metode pembelajaran terdiri dari pembelajaran terbimbing, tidak terbimbing dan semi terbimbing.
This document discusses several techniques for measuring similarity and dissimilarity between data objects: Euclidean distance, Manhattan distance, Chebyshev distance, and cosine similarity. It provides definitions and formulas for each technique and provides examples to illustrate how they work. The techniques can be used for tasks like classification, clustering, and image processing.
Dokumen tersebut membahas tentang klasifikasi data mining, meliputi definisi klasifikasi, langkah-langkah klasifikasi, contoh task klasifikasi, teknik klasifikasi seperti decision tree dan Naive Bayes, serta parameter evaluasi model."
Dokumen tersebut membahas tentang data mining dan pengajaran desain pembelajaran. Secara singkat, dokumen tersebut menjelaskan tentang konsep-konsep dasar data mining, algoritma yang digunakan dalam data mining seperti estimasi, prediksi, klasifikasi, dan klastering, serta tahapan proses data mining mulai dari input data hingga evaluasi hasilnya.
Dokumen tersebut membahas tentang algoritma Naive Bayes Classifier untuk klasifikasi dan prediksi data. Algoritma ini bekerja dengan menghitung probabilitas kelas berdasarkan pengalaman sebelumnya dengan asumsi independensi antar variabel. Diberikan contoh perhitungan Naive Bayes untuk memprediksi kemungkinan seseorang membeli komputer dan status kelulusannya berdasarkan atribut-atribut tertentu.
Dokumen tersebut memberikan penjelasan mengenai konsep dasar data mining klasifikasi, proses klasifikasi menggunakan algoritma Naive Bayes, serta contoh kasus klasifikasi menggunakan atribut usia, pendapatan, pekerjaan, dan punya deposito atau tidak.
Matematika Diskrit - 01 pengantar matematika diskrit KuliahKita
Dokumen ini memberikan pengantar tentang Matematika Diskrit. Matematika Diskrit mempelajari objek-objek diskrit atau berhingga seperti himpunan bilangan bulat. Matematika Diskrit relevan untuk komputer karena komputer bekerja secara diskrit. Beberapa contoh persoalan Matematika Diskrit adalah menentukan jumlah password dan algoritma terbaik. Ada beberapa alasan mempelajari Matematika Diskrit seperti mengembangkan pemikiran matematis dan member
Dokumen tersebut membahas tentang SQL (Structured Query Language) yang merupakan bahasa query untuk memanipulasi dan mengekstraksi data dari basis data relasional. Dokumen ini menjelaskan konsep dasar SQL meliputi DDL, DML, DCL, serta contoh-contoh query SQL seperti pembuatan tabel, insert, update, delete, select dan join data.
Kebutuhan Sentiment Analysis
Text Mining untuk Sentiment Analysis
Pengolahan kata Text Mining menggunakan Machine Learning
Studi Kasus Sentiment Analysis
Big data merupakan data yang beragam, cepat berubah, dan berukuran besar sehingga sulit ditangani dengan teknologi konvensional. Big data dapat memberikan manfaat seperti mengetahui respon masyarakat terhadap produk, membantu pengambilan keputusan, dan mengetahui perilaku pelanggan. Ada tantangan dalam penerapan big data seperti keterbatasan SDM dan biaya mahal. Diperlukan perlindungan privasi konsumen di era ekonomi digital.
The document discusses the Naive Bayes classifier. It begins with an introduction to probability and defines the formula for Naive Bayes classification. It then provides an example dataset to demonstrate how to calculate the probabilities of each attribute value belonging to each class. The example shows calculating the probabilities for attributes like major, gender, school origin, GPA, and assistant status to predict whether a student's study duration will be on time or late.
Dokumen tersebut membahas arsitektur dan model data mining. Terdapat penjelasan mengenai komponen-komponen arsitektur data mining seperti data cleaning, data integration, data mining engine, dan graphical user interface. Juga dibahas model-model data mining seperti prediction methods dan description methods beserta contoh-contohnya seperti klasifikasi, regresi, dan clustering.
This document discusses several techniques for measuring similarity and dissimilarity between data objects: Euclidean distance, Manhattan distance, Chebyshev distance, and cosine similarity. It provides definitions and formulas for each technique and provides examples to illustrate how they work. The techniques can be used for tasks like classification, clustering, and image processing.
Dokumen tersebut membahas tentang klasifikasi data mining, meliputi definisi klasifikasi, langkah-langkah klasifikasi, contoh task klasifikasi, teknik klasifikasi seperti decision tree dan Naive Bayes, serta parameter evaluasi model."
Dokumen tersebut membahas tentang data mining dan pengajaran desain pembelajaran. Secara singkat, dokumen tersebut menjelaskan tentang konsep-konsep dasar data mining, algoritma yang digunakan dalam data mining seperti estimasi, prediksi, klasifikasi, dan klastering, serta tahapan proses data mining mulai dari input data hingga evaluasi hasilnya.
Dokumen tersebut membahas tentang algoritma Naive Bayes Classifier untuk klasifikasi dan prediksi data. Algoritma ini bekerja dengan menghitung probabilitas kelas berdasarkan pengalaman sebelumnya dengan asumsi independensi antar variabel. Diberikan contoh perhitungan Naive Bayes untuk memprediksi kemungkinan seseorang membeli komputer dan status kelulusannya berdasarkan atribut-atribut tertentu.
Dokumen tersebut memberikan penjelasan mengenai konsep dasar data mining klasifikasi, proses klasifikasi menggunakan algoritma Naive Bayes, serta contoh kasus klasifikasi menggunakan atribut usia, pendapatan, pekerjaan, dan punya deposito atau tidak.
Matematika Diskrit - 01 pengantar matematika diskrit KuliahKita
Dokumen ini memberikan pengantar tentang Matematika Diskrit. Matematika Diskrit mempelajari objek-objek diskrit atau berhingga seperti himpunan bilangan bulat. Matematika Diskrit relevan untuk komputer karena komputer bekerja secara diskrit. Beberapa contoh persoalan Matematika Diskrit adalah menentukan jumlah password dan algoritma terbaik. Ada beberapa alasan mempelajari Matematika Diskrit seperti mengembangkan pemikiran matematis dan member
Dokumen tersebut membahas tentang SQL (Structured Query Language) yang merupakan bahasa query untuk memanipulasi dan mengekstraksi data dari basis data relasional. Dokumen ini menjelaskan konsep dasar SQL meliputi DDL, DML, DCL, serta contoh-contoh query SQL seperti pembuatan tabel, insert, update, delete, select dan join data.
Kebutuhan Sentiment Analysis
Text Mining untuk Sentiment Analysis
Pengolahan kata Text Mining menggunakan Machine Learning
Studi Kasus Sentiment Analysis
Big data merupakan data yang beragam, cepat berubah, dan berukuran besar sehingga sulit ditangani dengan teknologi konvensional. Big data dapat memberikan manfaat seperti mengetahui respon masyarakat terhadap produk, membantu pengambilan keputusan, dan mengetahui perilaku pelanggan. Ada tantangan dalam penerapan big data seperti keterbatasan SDM dan biaya mahal. Diperlukan perlindungan privasi konsumen di era ekonomi digital.
The document discusses the Naive Bayes classifier. It begins with an introduction to probability and defines the formula for Naive Bayes classification. It then provides an example dataset to demonstrate how to calculate the probabilities of each attribute value belonging to each class. The example shows calculating the probabilities for attributes like major, gender, school origin, GPA, and assistant status to predict whether a student's study duration will be on time or late.
Dokumen tersebut membahas arsitektur dan model data mining. Terdapat penjelasan mengenai komponen-komponen arsitektur data mining seperti data cleaning, data integration, data mining engine, dan graphical user interface. Juga dibahas model-model data mining seperti prediction methods dan description methods beserta contoh-contohnya seperti klasifikasi, regresi, dan clustering.
Dokumen tersebut membahas tentang machine learning dan data mining. Machine learning adalah ilmu yang mempelajari cara memberikan kemampuan kepada komputer untuk menyelesaikan masalah secara mandiri tanpa bantuan user, sedangkan data mining adalah proses ekstraksi pengetahuan dari database besar menggunakan teknik statistik dan machine learning. Dokumen ini juga membahas perbedaan antara supervised learning dan unsupervised learning serta beberapa algoritma machine learning seperti klasifikasi, regresi, klaster
Dokumen tersebut membahas tentang pengantar data analitik yang mencakup konsep data besar (big data), sumber data, karakteristik volume, kecepatan, keragaman dan ketepatan data besar, ekosistem data besar, jenis-jenis analisis data besar beserta contoh penerapannya, serta profesi terkait data analitik.
SIA memainkan peran penting dalam mendukung rantai nilai organisasi dengan menyediakan informasi akurat dan tepat waktu untuk meningkatkan efisiensi aktivitas utama. SIA juga dapat menambah nilai dengan memperbaiki kualitas, mengurangi biaya, dan meningkatkan efisiensi serta efektivitas rantai pasokan. SIA harus dirancang sesuai dengan strategi korporat dan budaya organisasi untuk mendukung pencapaian
Dokumen tersebut membahas tentang pengantar data mining, mengapa diperlukan data mining, apa itu data mining, jenis data yang dapat dimining, fungsi dan klasifikasi sistem data mining, algoritma populer data mining, permasalahan dalam data mining.
Dokumen tersebut membahas tentang pengantar data mining, mengapa diperlukan data mining, apa itu data mining, jenis data yang dapat dimining, fungsi dan klasifikasi sistem data mining, algoritma populer data mining, permasalahan dalam data mining.
Dokumen ini membahas perbedaan antara supervised learning dan unsupervised learning. Supervised learning melibatkan pelatihan model menggunakan data label, sementara unsupervised learning melakukan clustering data tanpa label. Metode supervised learning meliputi regresi dan klasifikasi, sedangkan metode unsupervised learning meliputi clustering dan SOM.
Materi ini menjelaskan tentang definisi data miining menurut para ahli. Selain itu materi ini menjelaskan tentang fungsi dan kategori-kategori bidang Data Mining
Pengantar Data Warehouse:
• Pengertian Data, Informasi dan Database
• Proses Data mining
• Data minning & Business Intelegent
• Manfaat Data minning
• Aplikasi Data Mining
"Jodoh Menurut Prespektif Al-Quran" (Kajian Tasir Ibnu Katsir Surah An-Nur ay...Muhammad Nur Hadi
Jurnal "Jodoh Menurut Prespektif Al-Quran" (Kajian Tasir Ibnu Katsir Surah An-Nur ayat 26 dan 32 dan Surah Al-Hujurat Ayat 13), Ditulis oleh Muhammmad Nur Hadi, Mahasiswa Program Studi Ilmu Hadist di UIN SUSKA RIAU.
2. Tentang Saya
• Irwansyah Saputra
• Dosen Ilmu Komputer
• Mahasiswa S3 Ilmu Komputer IPB University
• Bidang Kajian: Computational Intelligence &
Optimization (Data mining, machine learning,
artificial intelligence)
Halo semuanya, saya suka belajar tentang segala
hal dan suka berbagi pengetahuan. Saya juga
sering menjadi pembicara di berbagai seminar.
Kontak yang bisa dihubungi:
WhatsApp: 0895323302241
Instagram: @irwansight_
Web: https://irw.one
3. Disclaimer
Materi ini digunakan sebagai bahan ajar Program Data Mining di
Multinity.id
Silakan gunakan, mohon untuk tidak mengubah template.
Jika Anda memiliki kesulitan dalam memahami materi pada slide
ini, silakan belajar di Multinity.id
4. Referensi
1. Jiawei Han and Micheline Kamber, Data Mining: Concepts and Techniques
Third Edition, Elsevier, 2012
2. Ian H. Witten, Frank Eibe, Mark A. Hall, Data mining: Practical Machine
Learning Tools and Techniques 3rd Edition, Elsevier, 2011
3. Markus Hofmann and Ralf Klinkenberg, RapidMiner: Data Mining Use Cases
and Business Analytics Applications, CRC Press Taylor & Francis Group, 2014
4. Daniel T. Larose, Discovering Knowledge in Data: an Introduction to Data
Mining, John Wiley & Sons, 2005
5. Ethem Alpaydin, Introduction to Machine Learning, 3rd ed., MIT Press,
2014
6. Florin Gorunescu, Data Mining: Concepts, Models and Techniques,
Springer, 2011
7. Oded Maimon and Lior Rokach, Data Mining and Knowledge Discovery
Handbook Second Edition, Springer, 2010
8. Warren Liao and Evangelos Triantaphyllou (eds.), Recent Advances in Data
Mining of Enterprise Data: Algorithms and Applications, World Scientific,
2007
11. Structured & Unstructred Data
Unstructured data is
approximately 80% of the data
that organizations process daily.
https://lawtomated.com/structured-data-vs-unstructured-data-what-are-they-and-why-care/
13. Tipe Data
• Variabel merupakan karakter
contoh atau populasi yang menarik
untuk diamati.
• Variabel tersebut dibagi kedalam 2,
yaitu kualitatif & kuantitatif.
• Kualitatif: observasi yang bersifat
data kategorial
• Kuantitatif: observasi yang bersifat
data numerik
14. Variabel Kualitatif
• Menjelaskan data karakteristik atau
sifat bukan dengan angka.
• Contoh: warna mata, nama negara
di asia, tempat lahir, ranking di
kelas, tingkat kepuasan
pengunjung, nomor hp, dan
lainnya.
15. Variabel Kuantitatif
• Menjelaskan data hasil dari
perhitungan atau pengukuran.
• Contoh: jumlah pasien yang
berkunjung, suhu ruangan, tekanan
angin pada ban mobil, jumlah gaji
yang dihasilkan, tingkat IQ, jumlah
penjualan mobil, jarak rumah ke
sekolah dan lain sebagainya.
16. Variabel Kuantitatif
• Dibagi ke dalam 2 jenis, Diskrit dan
Kontinu.
• Diskrit memiliki karakteristik nilai
bulat dan ada batasan antar nilai.
Contoh: jumlah pengunjung mall
dalam satu hari, jumlah mobil yang
terjual
• Kontinu memiliki karakteristik
bertolak belakang dengan diskrit.
Contoh: tekanan angin pada ban,
suhu tubuh orang demam, suhu di
kutub utara, tinggi badan siswa,
pajak yang mesti dibayar
17. Summary
Tipe Variabel
Merek Komputer
Jenis Kelamin
Warna mata
Diskrit
Jumlah anggota keluarga
Jumlah pasien yang datang
Kontinu
Jumlah pajak yang dibayarkan
Tinggi badan siswa
Suhu ruangan
Kualitatif Kuantitatif
21. Tipe Data Nominal
• Data nominal tidak memiliki
urutan atau tingkatan.
• Bersifat kategorial dan tidak
dapat dihitung secara
matematis.
• Contoh: macam-macam warna,
jenis kelamin, nomor jersey,
merek laptop dan lainnya.
Mutually Exclusive dan Exhaustive*
Mutually Exclusive: Tidak boleh ada di lebih dari satu himpunan.
Exhaustive: harus masuk pada salah satu himpunan. Tidak boleh berada di luar himpunan.
22. Tipe Data Ordinal
• Data ordinal memiliki
urutan atau tingkatan.
• Bersifat kategorial dan tidak
dapat dihitung secara
matematis.
• Contoh: tingkat kepuasan
pelanggan, jenjang sekolah,
juara perlombaan dan
lainnya.
23. Tipe Data Interval
• Data interval mirip dengan ordinal
yaitu memiliki tingkatan.
• Perbedaannya adalah nilai pada
data interval dapat dijelaskan
secara matematis.
• Bersifat nominal dan dapat dihitung
secara matematis.
• Tidak dimulai dari nol.
• Contoh: suhu orang demam,
ukuran pakaian (M, L, XL)
24. Tipe Data Rasio
• Data Rasio mirip dengan interval.
• Perbedaannya adalah nilai pada
data rasio dimulai dari nol poin.
• Bersifat nominal dan dapat dihitung
secara matematis.
• Contoh: upah karyawan, jumlah
mobil yang terjual, berat badan,
tinggi badan
27. Data mining
• Ekstraksi pola yang menarik
dari data dalam jumlah besar.
• Suatu pola dikatakan menarik
apabila pola tersebut tidak
sepele, implisit, tidak diketahui
sebelumnya, dan berguna.
• Penggalian data diperlukan
saat data yang tersedia terlalu
banyak
32. Cara kerja Supervised Learning
• Dipandu oleh guru. Dataset memiliki label/target/class.
• Mayoritas algoritma data mining adalah SL.
• Algoritma bekerja sesuai dengan label/target/class yang dipengaruhi oleh atribut.
34. Cara kerja Unsupervised Learning
• Mencari kemiripan dalam kelompoknya, dan tidak mirip dengan kelompok lainnya.
• Tidak ada class/target/label pada dataset.
• Clustering dan asosiasi termasuk ke dalam UL
36. Reinforcement Learning
• Belajar dari kesalahan
• Terdiri dari agent, environment, reward.
• Agent mengenali lingkungan.
• Reward didapatkan saat benar. Reward = 0 jika salah. Sehingga tidak akan mengulangi kesalahan
yang sama.
39. Estimasi Produksi Cacat
1. Prediksikan Jumlah Cacat Produksi jika suhu dalam keadaan tinggi
(Variabel X), contohnya: 30°C
Y = -27,02 + 1,56X
Y = -27,02 + 1,56(30)
=19,78
2. Jika Cacat Produksi (Variabel Y) yang ditargetkan hanya boleh 5
unit, maka berapakah suhu ruangan yang diperlukan untuk
mencapai target tersebut?
5= -27,02 + 1,56X
1,56X = 5+27,02
X= 32,02/1,56
X =20,52
Jadi Prediksi Suhu Ruangan yang paling sesuai untuk mencapai target Cacat Produksi
adalah sekitar 20,520C
46. Mengelompokkan Pelanggan
Dataset terkait memisahkan
pelanggan berdasarkan panggilan
lokal dan internasional.
Dataset tanpa label.
Jumlah cluster ditentukan dari awal. Pada
kasus ini cluster dibagi ke dalam 2.
Pengetahuan yang didapatkan berupa cluster
48. Kasus Market Basket Analysis
• Contoh dataset tidak semuanya dimunculkan.
• Setelah menerapkan algoritma asosiasi
seperti Apriori, muncul hasil seperti di kanan.
49. Penjelasan
• Algoritma association rule (aturan asosiasi) adalah algoritma yang
menemukan atribut yang “muncul bersamaan”
• Contoh, pada hari kamis malam, 1000 pelanggan telah melakukan
belanja di supermaket ABC, dimana:
• 200 orang membeli Apel
• dari 200 orang yang membeli Apel, 50 orangnya membeli Pear
• Jadi, association rule menjadi, “Jika membeli apel, maka membeli
Pear”, dengan nilai support = 200/1000 = 20% dan nilai confidence
= 50/200 = 25%
• Algoritma association rule diantaranya adalah: A priori algorithm,
FP-Growth algorithm, GRI algorithm.
51. Algoritma Data Mining
1. Estimation (Estimasi):
• Linear Regression, Neural Network, Support Vector Machine, etc
2. Prediction/Forecasting (Prediksi/Peramalan):
• Linear Regression, Neural Network, Support Vector Machine, etc
3. Classification (Klasifikasi):
• Naive Bayes, K-Nearest Neighbor, C4.5, ID3, CART, Linear Discriminant Analysis,
Logistic Regression, etc
4. Clustering (Klastering):
• K-Means, K-Medoids, Self-Organizing Map (SOM), Fuzzy C-Means, etc
5. Association (Asosiasi):
• FP-Growth, A Priori, Coefficient of Correlation, Chi Square, etc
52. Penerapan Data Mining
• Penerapan Data Mining Untuk Evaluasi Kinerja Akademik Mahasiswa
• Penerapan data mining untuk memprediksi kriteria nasabah kredit
• Penerapan Datamining Pada Ekspor Buah-Buahan Menurut Negara
Tujuan
• Penerapan Datamining Dalam Mengelompokkan Kunjungan
Wisatawan Ke Objek Wisata Unggulan Di Prov. Dki Jakarta
• Penerapan Data Mining Untuk Analisis Pola Pembelian Konsumen
Pada Data Transaksi Penjualan Spare Part Motor