SlideShare a Scribd company logo
1 of 10
1
Data Mining
Diskusi Pertemuan 1
Nama : Hendro Gunawan
NIM : 200401072103
Kelas : IT501
Gambar 1. Introduction To Data Mining, AI, Big Data
Kata Pengantar
Data Mining mengalami pertumbuhan yang luar biasa, sebanding dengan kecepatan peningkatan ukuran
data di era big data saat ini, dengan volume data yang sudah mencapai zettabyte (satu trilyun gigabyte).
Pada banyak buku teks, artikel,makalah, dan beragam literatur lainnya, data mining digunakan untuk
enam fungsi: klasifikasi (clasification), klasterisasi (clustering), regresi (regression), deteksi anomali
(anomaly detection) pembelajaran aturan assosiasi (association rule learning) atau pemodelan
kebergantungan (dependency modeling), dan perangkuman (summarization). Mengingat area yang
sangat luas.
1.Pendahuluan
Sebagai ilmu yang relatif baru, saat ini data Mining menjadi salah satu pusat perhatian para akademisi
maupun praktisi. Beragam riset dan pengembangan Data Mining telah memberikan banyak produk yang
berguna bagi masyarakat luas, walaupun ada sebagian masyarakat yang merasa dirugikan atau kurang
nyaman dengan hadirnya Data Mining. Pada bab ini kita, Anda dan saya, akan mendiskusikan secara
singkat mengenai pengertian, kegunaan, aplikasi, dan etika dalam Data Mining. Kita musti memahami
semua itu secara benar sebelum membahas hal-hal yang lebih detail.
1.1 Apa Itu Data Mining?
Cara pandang dan pengetahuan yang berbeda membuat para ahli memberikan definisi berbeda tentang
Data Mining. Sebagian ahli menyatakan bahwa Data Mining adalah langkah analisis terhadap proses
penemuan pengetahuan di dalam basis data atau knowledge discovery in database yang disingkat KDD
2
(Fayyad et al. 1996). Pengetahuan bisa berupa pola data atau relasi antar data yang valid (yang tidak
diketahui sebelumnya). Data Mining merupakan gabungan sejumlah disiplin ilmu komputer (ACM
2006), (Clifton 2010), yang didefinisikan sebagai proses penemuan pola-pola baru dari kumpulan-
kumpulan data sangat besar, meliputi metode-metode yang merupakan irisan dari artificial inteligence,
machine learning, statistic, dan database systems (ACM 2006).
Data Mining ditujukan untuk mengekstrak (mengambil intisari) pengetahuan dari sekumpulan data
sehingga didapatkan struktur yang dapat dimengerti manusia (ACM 2006) serta meliputi basis data dan
managemen data prapemrosesan data, pertimbangan model dan inferensi, ukuran ketertarikan,
pertimbangan kompleksitas, pasca pemrosesan terhadap struktur yang ditemukan, visualisasi, dan online
updating (ACM 2006).
1.2 Mengapa Perlu Data Mining?
Beberapa tahun terakhir, data semakin heterogen dan kompleks dengan volume yang meningkat cepat
secara eksponensial. Menurut John Gantz dan David Reinsel dalam investigasi yang dilakukan di IDC,
volume data pada tahun 2011 mencapai 1,8 zettabyte atau 1,8 trilyun gigabyte, pada tahun 2012
meningkat lebih dari 50% menjadi 2,8 zettabytes ( Gantz et al. 2012). Pada tahun 2013 volume data
sudah menjadi 4,4 zettabytes dan akan terus meningkat dengan cepat hingga diperkirakan mencapai 44
zettabytes di tahun 2020 (Turner 2014). Oleh karena itu, saat ini dikenal dengan istilah Big data
mempunyai empat karakteristik: berukuran sangat besar (high-volume), sangat bervariasi (high-variety),
kecepatan pertumbuhan tinggi (high-velocity), dan dan sangat tidak jelas (high veracity). Namun, big
data dapat dianalisis sehingga perusahaan dapat mengambil keputusan strategis bisnis dengan lebih baik.
Dalam big data, tentu saja Anda akan kesulitan membaca dan mengetahui pola-pola dan relasi-relasi
data jika dilakukan secara manual atau konvensional. Sebagai contoh, suatu perusahaan operator seluler
dengan ratusan juta pelanggan, dalam setahun bisa menghasilkan milyaran data penggunaan komunikasi
suara, SMS, dan internet. Dari milyaran data tersebut, bagaimana menemukan pola-pola pelanggan
dalam menggunakan komunikasi suara, SMS, dan internet? Pola tersebut bisa dilihat dalam suatu
periode tertentu, misalnya bulan, minggu, hari, bahkan jam. Bagaimana klasifikasi/segmentasi
pelanggan? Bagaimana relasi antara komunikasi suara, SMS, dan internet? Bagaimana pola komunikasi
antara pelanggan seluler di suatu operator dengan pelanggan operator lain? Semua pertanyaan tersebut
tentu saja sulit di jawab jika analisis data dilakukan secara konvensional.
Data Mining atau penambangan data adalah teknik yang relatif cepat dan mudah untuk menemukan
pengetahuan, pola dan/atau relasi antar data, secara otomatis. Dengan menggabungkan empat disiplin
ilmu komputer seperti pada definisi di atas, pengetahuan bisa ditemukan dalam lima proses berurutan:
seleksi, prapemrosesan, transformasi, data mining, dan interpretasi/evaluasi (Fayyad et al. 1996).
1.3 Kegunaan Data Mining
3
Secara umum, kegunaan Data Mining dapat dibagi menjadi dua: deskriptif dan prediktif. Deskriptif
berarti data mining digunakan untuk mencari pola-pola yang dapat dipahami manusia yang menjelaskan
karakteristik data. Sedangkan prediktif berarti data mining digunakan untuk membentuk sebuah model
pengetahuan yang akan digunakan untuk melakukan prediksi.
Berdasarkan fungsionalitasnya, tugas-tugas data mining bisa dikelompokkan ke dalam enam kelompok
berikut ini (Fayyad et al. 1996):
 Klasifikasi (classificationi): men-generalisasi struktur yang diketahui untuk diaplikasikan pada data-
data baru. Misalkan, klasifikasi penyakit ke dalam sejumlah jenis, klasifikasi email ke dalam spam
atau bukan.
 Klasterisasi (clustering): mengelompokkan data, yang tidak diketahui label kelasnya, ke dalam
sejumlah kelompok tertentu sesuai dengan ukuran kemiripannya.
 Regresi (regression): menemukan suatu fungsi yang memodelkan data dengan galat (kesalahan
prediksi) seminimal mungkin.
 Deteksi anomali (anomaly detection): mengidentifikasi data yang tidak umum, bisa berupa outlier
(pencilan), perubahan atau deviasi yang mungkin sangat penting dan perlu investigasi lebih lanjut.
 Pembelajaran aturan asosiasi (association rule learning) atau pemodelan kebergantungan
(dependency modeling): mencari relasi antar variabel.
 Perangkuman (summarization): menyediakan representasi data yang lebih sederhana, meliputi
visualisasi dan pembuatan laporan.
1.4 Aplikasi-aplikasi Data Mining
Saat ini data mining banyak diaplikasikan pada berbagai bidang, seperti bisnis, seni dan hiburan, sains,
dan teknik, jurnalistik, politik, dan lain-lain. Berikut ini sejumlah aplikasi yang dikelompokkan
berdasarkan bidang-bidang tersebut.
1.4.1 Marketing dan Bisnis
Pada suatu perusahaan, banyak proses bisnis dari hulu sampai hilir yang perlu didesain secara serius
untuk mendapatkan benefit dan/atau profit yang maksimal dengan biaya pengeluaran yang seminimal
mungkin. Misalkan, proses pemilihan vendor dan rekan bisnis yang paling baik, model promosi yang
efektif dan tepat sasaran, proses mendeteksi kecurangan pelanggan sehingga perusahaan tidak
mengalami kerugian besar, sistem CRM (customer relationship managemen) yang handal, dan banyak
lagi yang lain. Beriokut ini beberapa contoh aplikasi data mining dalam bidang marketing dan bisnis
secara luas:
A. Market Basket Analysis
Market basket analysis (analisis keranjang belanja) atau yang dikenal dengan association rule (aturan
asosiasi) adalah salah satu konsep menarik dalam data mining yang berusaha menemukan asosiasi atau
keterkaitan data. Diberi nama market basket analysis karena pada awal ditemukannya, konsep ini
4
berkaitan dengan barang-barang yang berada di dalm keranjang belanjaan yang secara langsung
menunjukkan tingakah laku konsumen saat berbelanja. Misalkan, 90 dari 100 konsumen yang membeli
margarin, ternyata mereka juga membeli tepung. Hal ini berarti asosiasi antara margarin dan tepung
sangatlah kuat, misalnya dinatakan dalam ukuran prosentase sebesar 90%.
Konsep ini bisa digunakan untuk tujuan yang baik bagi pedagang maupun pelanggan, seperti
menempatkan barang-barang yang memiliki asosiasi kuat di tempat yang berdekatan sehingga pelanggan
lebih mudah menemukannya. Misalkan, margarin, tepung, dan gula diletakkan di posisi yang sangat
berdekatan karena ketiganya memiliki asosiasi yang kuat. Tetapi, konsep ini bisa disalahgunakan untuk
mencari keuntungan maksimal dan bahkan bisa membuat pelanggan merasa dirugikan. Misalkan
membuat promosi berupa potongan harga untuk barang A, tetapi diam-diam menaikkan harga untuk
barang B yang memiliki asosiasi sangat kuat dengan barang A. Maslah ini pernah muncul pada tahun
2001. Menjelang hari lebaran, ada seorang yang belanja bahan-bahan membuat kue di sebuah
supermarket besar yang menawarkan potongan harga (diskon) hingga 30% untuk produk margarin.
Tertarik dengan harga margarin yang sangat murah dan beramsumsi bahwa harga barang-barang lainnya
pasti murah, dia membeli tepung dalam jumlah banyak. Keesokan harinya, dia pergi ke supermarket lain
yang tidak menawarkan potongan harga. Dia terkejut ketika mengetahui harga tepung di situ 60% lebih
murah dari pada di supermarket pertama. Setelah dikalkulasi, total harga margarin dan tepung secara
keseluruhan lebih murah di supermarket yang tidak menawarkan potongan harga. Dia merasa terkecoh.
Beberapa bulan kemudian dia baru tahu bahwa teknik penjualan dengan potongan harga pada
supermarket pertama itu ternyata menggunakan konsep market basket atau association rule.
Secara hukum, jual beli seperti di atas adalah sah karena konsumen dianggap sudah melihat dan merasa
cocok denga label harga barang yang tertera. Pihak supermarket tentu saja merasa tidak bersalah dan
justru menyalahkan konsumen yang tidak bersikap kritis dan teliti. Di sisi supermarket, promosi yang
dibuat adalah sebuah strategi untuk mendapatkan keuntungan. Namun, di sisi konsumen, promosi yang
dibuat supermarket tersebut bisa membuat mereka merasa terkecoh dan merasa dirugikan.
Bagaimanapun, promosi yang jujur seperti “Margarin diskon 30% sedangkan tepung naik 40%” apakah
mungkin dilakukan? Tentu saja tidak. Jadi, yang sebaiknya dilakukan konsumen adalah bersikap kritis,
teliti, dan bijak dalam menilai segala bentuk promosi.
B. Recomender System
Ketika perusahaan harus memilih satu vendor atau rekan bisnis diantara banyak pilihan yang tersedia,
diperlukan usaha dan biaya cukup besar untuk melakukan proses ini. Maslah ini bisa diselesaikan dengan
mudah menggunakan recommender system (sistem perekomendasi). Sistem ini bisa dibangun
menggunakan teknik perangkingan yang pada dsarnya menggunakan teknik klasifikasi atau klasterisasi.
Hal lainnya adalah masalah pemilihan pegawai berdasarkan historinya. Misalkan, lulusan universitas
5
mana yang sering kali menunjukkan performansi bagus. Sehingga perusahaan bisa memfokuskan
rekrutasi dari lulusan sejumlah universitas tertentu saja.
C. Churn Prediction
Suatu perusahaan telekomunikasi seluler dengan jumlah pelanggan yang mencapai 100 juta orang perlu
memprediksi pelanggan mana yang loyal dan tidak loyal sehingga bisa menentukan promosi yang tepat
sasaran kepada setiap kategori pelanggan. Misalkan, jika terdapat 60% pelanggan yang diprediksi
termasuk kategori tidak loyal dan mungkin berpindah (churn) ke operator lain, maka perusahaan ini bisa
membuat promosi yang lebih menarik dan tepat supaya tidak kehilangan sangat banyak pelanggan.
Promosi bisa difokuskan hanya untuk kategori pelanggan tersebut saja tanpa perlu promosi untuk
kategori pelanggan yang loyal. Dengan demikian, biaya promosi bisa ditekan. Hal yang sama juga bisa
dilakukan untuk perusahan lain yang bergerak dalam bisnis apapun. Lebih luas lagi, masalah ini
digunakan untuk membangun sistem optimasi untuk CRM yang lebih lengkap dan menyeluruh. Sistem
prediksi churn ini bisa dibangun menggunakan teknik klasifikasi atau klasterisasi.
D. Fraud Detection
Perusahaan telekomunikasi yang memiliki ratusan juta pelanggan akan menghasilkan basis data sangat
besar,. Dari sekian ratus juta pelanggan, mungkin saja terdapat sejumlah kecil pelanggan yang
melakukan kecurangan. Misalnya, tagihan telepon pelanggan pasca bayar biasanya dikisaran ratusan
ribu rupiah per bulan dan dibayar secara lancar. Tetapi, beberapa bulan terakhir tagihannya mencapai
puluhan juta rupiah per bulan. Pembayaran mulai tersendat, dan akhirnya tidak lagi membayar, sehingga
perusahaan dirugikan. Mengingat jumlah pelanggan yang mencapai jutaan, sulit dideteksi pola tagihan
pelanggan mana yang berpotensi melakukan kecurangan seperti di atas. Tetapi, dengan teknik data
mining, masalah ini bisa diselesaikan dengan mudah yaitu dengan membangun fraud detection (
pendeteksi kecurangan). Sistem ini bisa dibangun menggunakan teknik anomaly detection.
1.4.2 Seni dan Hiburan
Pada bidang seni musik, kita bisa membuat sistem klasifikasi yang secara otomatis mengelompokkan
ribuan atau bahkan jutaan lagu ke dalam sejumlah genre atau mood (suasana hati). Hal ini bisa
menghenmat banyak waktu dan biaya dalam proses pencarian serta dapat memudahkan pengguna dalam
menetukan pilihan lagu. Untuk dunia hiburan, kita bisa membangun aplikasi untuk memberikan
penilaian (rating), memprediksi nilai, atau bahkan merekomendasikan film. Dengan demikian, para
penikmat film dapat lebih mudah menentukan pilihan film yang disukai.
1.4.3 Sains dan Teknik
Saat ini, dunia sains dan teknik sangat banyak menggunakan teknik data mining untuk menyelesaikan
permasalahan yang sangat kompleks, seperti genetika, medis , teknik elektri, dan sebagainya. Pada ilmu
biologi, suatu masalah yang sangat dikenal adalah pencocokan susunan genetika manusia yang disebut
dengan dioxiribo nucleic acid (DNA). Suatu teknik yang disebut sequence mining bisa membantu kita
6
memahami pemetaan hubungan darah antar manusia. Metode data mining yang bisa digunakan adalah
multifactor dimensionality reduction (Zhu et al. 2007).
Data mining juga digunakan pada bidang teknik tenaga listrik. Beberapa masalah yang bisa diselesikan
adalah bagaimana memonitor kondisi peralatan listrik tegangan tinggi, bagaimana memprediksi
kebutuhan daya per hari, per mingu atau per bulan. Sehingga daya listrik yang diproduksi bisa sesuai
dengan kebutuhan (Suyanto 2008). Selama ini, sistem prediksi beban listrik per jam yang berhasil dibuat
memiliki rata-rata galat atau tingkat kesalahan cukup besar, di atas 10%. Jika galat ini bisa direduksi
hingga di bawah 1%, maka perusahaan listrik bisa menghemat ribuan atau bahkan jtaan mega watt daya
yang selama ini terbuang percuma karena biaya penyimpanan listrik ke dalam baterai memang sangat
mahal. Teknik data mining yang bisa digunakan adalah klasterisasi dan prediksi.
1.4.4 Jurnalistik
Mereka yang bekerja di bidang jurnalistik telah lama tertarik menggunakan data mining untuk penulisan
artikel atau berita secara otomatis. Sejak tahun 2009 telah dikenal istilah Data-Driven Journalism (DDJ),
suatu proses jurnalistik berbasis analisis dan penyaringan himpunan data berukuran besar untuk
membuat atau mengangkat berita. Banyak aplikasi penulisan artikel otomatis telah dikembangkan. Jika
Anda membuka Google dan mengetikkan kat kunci article generator, article creator, news generator,
auto content generator, atau easy generator, maka Anda akan mendapati banyak situs yang menawarkan
aplikasi penulisan artikel otomatis, seperti http://articlegenerator.org dan http://articoolo.com. Dengan
aplikasi ini, Anda hanya perlu memasukkan kata-kata penting mengenai tema yang Anda inginkan,
misal tentang kenaikan harga sembako, maka dalam hitungan satu hingga dua menit Anda akan
mendapatkan sebuah artikel unik, yang belum pernah ditulis siapapun, tentang kenaikan harga sembako.
Tentu saja, aplikasi tersebut bisa saja disalahgunakan untuk menghasilkan ribuan berita palsu (fake news)
maupun berita bohong (hoax) yang sengaja disebarkan secara masif demi kepentingan tertentu. Oleh
karena itu, beberapa kalangan mencemaskan hal ini. Namun, bagi kalangna lain yang pro data mining
justru memiliki pemikiran sebaliknya. Mengapa tidak mengunakan data mining untuk membangun suatu
aplikasi pendeteksi berita palsu maupun berita bohong? Mudah kok. Tidak sulit sama sekali. Anda hanya
perlu teknik machine learning sederhana. Saat ini bahkan sudah banyak aplikasi pendeteksi berita palsu
maupun berita bohong. Anda bisa mencarinya sendiri di Google, bukan?
Selain aplikasi penulisan artikel otomatis dan pendeteksi berita palsu/bohong, data mining juga banyak
digunakan untuk aplikasi peringkasan teks (text summarization). Pernahkah Anda membaca suatu berita
yang di bagian akhirnya tercantum “Ditulis dari berbagai sumber”? Itu artinya Si Penulis membaca
bamyak artikel lain, kemudian merangkum dan menulis sebuah artikel unik yang benar-benar baru,
berbeda dari semua artikel yang dibacaya. Secara teknis, dalam data mining hal ini disebut multi-
document text summarization.
7
1.4.5 Politik
Dunia politik telah lama menggunakan teknik-teknik data mining untuk menganalisis preferensi politik
masyarakat dalam pemilu partai politik, pemilu legislatif, hingga pemilihan presiden. Dengan data
mining, para konsultan politik dapat mengeksploitasi data-data pengguna media sosial. Mereka
mnganalisis aktivitas jutaan pengguna media sosial untuk memetakkan sentimen dan dukungan rakyat
pada calon presiden tertentu. Selain itu, mereka juga dapat melakukan klasifikasi dan klasterisasi data-
data pribadi pengguna sehingga dapat merancang strategi dan membangun propaganda yang tepat untuk
mempengaruhi persepsi pemilih.
1.5 Teknik-teknik Data Mining
Sebagian kalangna kesulitan membedakan data mining dengan machine learning. Hal ini dapat
dimaklumi mengingat kedua istilah tersebut memang memiliki tumpang tindih yang tinggi. Dalam
banyak literatur, sebagian ahli mendefinisikan data mining sebagai sains yang menggunakan berbagai
macam teknik, yang sebagian besar dipelajari dan ditemukan di bidang machine learning, untuk
mengekstrak pola-pola penting dan berguna dari kumpulan-kumpulan data berukuran besar (big data).
Dengan kata lain, pembelajaran mesin (machine learning) merupakan teknik-teknik yang mendukung
dan paling banyak digunakan dalam penggalian data (data mining). Sementara itu, machine learning
sring kali disebut-sebut secara berdampingan dengan istilah deep learning dan artificial inteligence. Hal
ini juga wajar saja karena posisinya yang juga tumpang tindih. Kita bisa menggambarkan relasi data
mining, big data, artificial inteligence, machine learning, dan deep learning secara sederhana dalam
sebuah diagram pada gambar 1.5.1 berikut ini.
Gambar 1.5.1 data mining, big data, artificial inteligence, machine learning, dan deep learning
8
1.6 Etika Dalam Data Mining
Data mining bisa memberikan dampak negatif maupun positif bergantung pada penggunaannya. Jika
tidak memperhatikan etika pengguanaan data, khususnya yang berhubungan dengan data-data pribadi,
maka data mining bisa berdampak negatif. Misalkan, klasterisasi pelanggan berdasarkan suku bangsa,
agama, ras, golongan, usia, maupun gender bisa berujung pada masalah diskriminasi dan bisa merugikan
suatu kelompok tertentu. Tetapi, ketika data mining digunakan untuk masalah medis yang harus
membedakan gender atau usia tertentu, maka hal ini justru berefek positif. Misalkan, ada suatu jenis
penyakit yang peluamhnya lebih besar diderita oleh kaum wanita atau oleh kelompok usia tertentu, maka
sudah seharusnya pihak medis melakukan penanganan secara berbeda.
1.7 Latihan
1. Jelaskan dengan kalimat sendiri apa yang dimaksud dengan data mining?
2. Sebutkan konsep alur proses data mining!
Jawaban:
1. Data mining adalah proses menemukan pola, hubungan, atau informasi yang berharga dalam
kumpulan data yang besar dan kompleks. Ini melibatkan penggunaan berbagai teknik dan alat statistik,
matematika, dan kecerdasan buatan untuk menganalisis data yang telah dikumpulkan dan disimpan
dalam berbagai format.
Tujuan utama dari data mining adalah untuk mengungkap wawasan atau pengetahuan yang dapat
membantu pengambilan keputusan yang lebih baik dalam berbagai bidang, termasuk bisnis, ilmu
pengetahuan, kesehatan, keuangan, dan lainnya. Beberapa teknik umum yang digunakan dalam data
mining meliputi:
1. Clustering: Mengelompokkan data ke dalam kelompok-kelompok yang serupa berdasarkan
karakteristik atau atribut tertentu.
2. Classification: Mengklasifikasikan data ke dalam kategori atau kelas yang telah ditentukan
berdasarkan atribut yang ada.
3. Association Rule Mining: Mengidentifikasi hubungan atau asosiasi antara berbagai atribut dalam
data.
4. Regression Analysis: Mengidentifikasi hubungan antara variabel dependen dan variabel
independen dalam data.
5. Anomaly Detection: Mengidentifikasi data yang tidak biasa atau tidak sesuai dengan pola umum
dalam dataset.
6. Text Mining: Menggali informasi dari data teks, seperti dokumen, tweet, atau laporan.
Data mining sering digunakan dalam mendukung pengambilan keputusan strategis, peramalan,
pemasaran berbasis data, deteksi fraud, analisis risiko, dan banyak aplikasi lainnya. Dengan
9
berkembangnya teknologi dan ketersediaan data yang melimpah, data mining telah menjadi alat yang
sangat penting dalam dunia bisnis dan penelitian.
2. Alur proses data mining melibatkan serangkaian langkah-langkah yang sistematis untuk
mengidentifikasi pola atau informasi berharga dalam kumpulan data. Berikut adalah konsep alur proses
data mining yang umum digunakan:
1. Pemahaman Masalah: Langkah awal dalam proses data mining adalah memahami masalah atau
tujuan yang ingin dicapai. Ini melibatkan berbicara dengan pemangku kepentingan dan
mengidentifikasi apa yang ingin dicapai dengan analisis data.
2. Pemahaman Data:Mengumpulkan data yang relevan untuk analisis. Ini melibatkan pemahaman
terhadap sumber data, jenis data yang ada, dan kualitas data.
3. Eksplorasi Data (Data Exploration): Mengeksplorasi data untuk memahami pola dasar, statistik
deskriptif, dan karakteristik umum. Tujuannya adalah mengidentifikasi potensi masalah dalam
data seperti missing values atau outliers.
4. Pemilihan Data (Data Selection): Memilih subset data yang relevan untuk analisis lebih lanjut.
Terkadang, tidak semua data dalam kumpulan data akan diperlukan untuk mencapai tujuan
analisis.
5. Pemrosesan Data (Data Preprocessing): Membersihkan data dengan mengatasi masalah seperti
data yang hilang, duplikasi, atau outlier. Ini juga mencakup normalisasi data jika diperlukan.
6. Pemilihan Model dan Teknik Data Mining: Memilih model atau teknik data mining yang paling
sesuai untuk masalah yang ada. Ini tergantung pada tujuan analisis, tipe data, dan karakteristik
masalah.
7. Transformasi Data: Melakukan transformasi pada data, jika diperlukan, untuk mempersiapkan
data untuk analisis. Ini mungkin melibatkan konversi data kategoris menjadi data numerik atau
pengurangan dimensi.
8. Penerapan Model Data Mining: Menerapkan teknik data mining yang dipilih pada data yang
telah diproses untuk mengekstrak pola atau informasi yang relevan.
9. Evaluasi Model: Mengevaluasi kualitas model dengan metrik yang sesuai. Tujuan adalah
memastikan model berfungsi dengan baik dalam mengungkap pola yang relevan dalam data.
10. Interpretasi Hasil: Menginterpretasikan hasil data mining untuk mendapatkan wawasan yang
berharga dan mendukung pengambilan keputusan.
11. Integrasi dengan Bisnis atau Penelitian: Mengintegrasikan wawasan dari data mining ke dalam
keputusan bisnis atau hasil penelitian. Ini adalah tahap akhir yang memungkinkan tindakan
berdasarkan temuan.
12. Penyajian Hasil: Menyajikan hasil analisis data dalam format yang mudah dimengerti, seperti
laporan, grafik, atau visualisasi.
10
Setelah menyelesaikan alur proses data mining, langkah-langkah ini seringkali diulang dan ditingkatkan
seiring dengan perkembangan pemahaman masalah dan data yang lebih baik. Data mining adalah proses
iteratif yang memungkinkan organisasi untuk terus memperoleh wawasan baru dari data mereka.
Terima kasih
Referensi
Suyanto, D. (2018). Data Mining Untuk Klasifikasi Dan Klasterisasi. Bandung: Informatika.
Website
https://www.slideshare.net/HendroGunawan8/data-mining-diskusi-1docx

More Related Content

Similar to Data Mining Diskusi 1.docx

big data in consumer behavior
big data in consumer behaviorbig data in consumer behavior
big data in consumer behaviorKeziaflorance
 
PMK 1 PENGANTAR DATA ANALITIK.pdf
PMK 1 PENGANTAR DATA ANALITIK.pdfPMK 1 PENGANTAR DATA ANALITIK.pdf
PMK 1 PENGANTAR DATA ANALITIK.pdfAndri946883
 
KELOMPOK 8 tugas pertemuan 4.pptx
KELOMPOK 8 tugas pertemuan 4.pptxKELOMPOK 8 tugas pertemuan 4.pptx
KELOMPOK 8 tugas pertemuan 4.pptxalzarefa
 
Pengantar Big Data dan Data Mining.pptx
Pengantar Big Data dan Data Mining.pptxPengantar Big Data dan Data Mining.pptx
Pengantar Big Data dan Data Mining.pptxRudiCelebes2
 
adoc.pub_buku-saku-big-data-kementerian-komunikasi-dan-info.pdf
adoc.pub_buku-saku-big-data-kementerian-komunikasi-dan-info.pdfadoc.pub_buku-saku-big-data-kementerian-komunikasi-dan-info.pdf
adoc.pub_buku-saku-big-data-kementerian-komunikasi-dan-info.pdfDinarSafa1
 
Consumer behavior and big data
Consumer behavior and big dataConsumer behavior and big data
Consumer behavior and big dataHallifatulAmbyah
 
Information systems and people
Information systems and peopleInformation systems and people
Information systems and peopleYuliWahyu2
 
Sistem Informasi Manajemen
Sistem Informasi ManajemenSistem Informasi Manajemen
Sistem Informasi ManajemenAdinda_Dinasti
 
pengenalan-Pengantar-Big-Data _____.pptx
pengenalan-Pengantar-Big-Data _____.pptxpengenalan-Pengantar-Big-Data _____.pptx
pengenalan-Pengantar-Big-Data _____.pptxbaktilast1
 
Pengantar-Big-Databhgfhfhfdhgfdghgfdhdfhfhf.pptx
Pengantar-Big-Databhgfhfhfdhgfdghgfdhdfhfhf.pptxPengantar-Big-Databhgfhfhfdhgfdghgfdhdfhfhf.pptx
Pengantar-Big-Databhgfhfhfdhgfdghgfdhdfhfhf.pptxBatakMusikGroup
 
BIG DATA & CONSUMER BEHAVIOR
BIG DATA & CONSUMER BEHAVIORBIG DATA & CONSUMER BEHAVIOR
BIG DATA & CONSUMER BEHAVIORNajla Q
 

Similar to Data Mining Diskusi 1.docx (20)

Big data
Big dataBig data
Big data
 
big data in consumer behavior
big data in consumer behaviorbig data in consumer behavior
big data in consumer behavior
 
Big Data
Big DataBig Data
Big Data
 
BIG DATA
BIG DATABIG DATA
BIG DATA
 
Presentation1.pptx
Presentation1.pptxPresentation1.pptx
Presentation1.pptx
 
Data mining
Data miningData mining
Data mining
 
PMK 1 PENGANTAR DATA ANALITIK.pdf
PMK 1 PENGANTAR DATA ANALITIK.pdfPMK 1 PENGANTAR DATA ANALITIK.pdf
PMK 1 PENGANTAR DATA ANALITIK.pdf
 
093-P01.pdf
093-P01.pdf093-P01.pdf
093-P01.pdf
 
KELOMPOK 8 tugas pertemuan 4.pptx
KELOMPOK 8 tugas pertemuan 4.pptxKELOMPOK 8 tugas pertemuan 4.pptx
KELOMPOK 8 tugas pertemuan 4.pptx
 
Pengantar Big Data dan Data Mining.pptx
Pengantar Big Data dan Data Mining.pptxPengantar Big Data dan Data Mining.pptx
Pengantar Big Data dan Data Mining.pptx
 
Consumer Behavior and Big Data
Consumer Behavior and Big DataConsumer Behavior and Big Data
Consumer Behavior and Big Data
 
adoc.pub_buku-saku-big-data-kementerian-komunikasi-dan-info.pdf
adoc.pub_buku-saku-big-data-kementerian-komunikasi-dan-info.pdfadoc.pub_buku-saku-big-data-kementerian-komunikasi-dan-info.pdf
adoc.pub_buku-saku-big-data-kementerian-komunikasi-dan-info.pdf
 
Big Data
Big DataBig Data
Big Data
 
Consumer behavior and big data
Consumer behavior and big dataConsumer behavior and big data
Consumer behavior and big data
 
Information systems and people
Information systems and peopleInformation systems and people
Information systems and people
 
Sistem Informasi Manajemen
Sistem Informasi ManajemenSistem Informasi Manajemen
Sistem Informasi Manajemen
 
Tugas 1 dm1
Tugas 1 dm1Tugas 1 dm1
Tugas 1 dm1
 
pengenalan-Pengantar-Big-Data _____.pptx
pengenalan-Pengantar-Big-Data _____.pptxpengenalan-Pengantar-Big-Data _____.pptx
pengenalan-Pengantar-Big-Data _____.pptx
 
Pengantar-Big-Databhgfhfhfdhgfdghgfdhdfhfhf.pptx
Pengantar-Big-Databhgfhfhfdhgfdghgfdhdfhfhf.pptxPengantar-Big-Databhgfhfhfdhgfdghgfdhdfhfhf.pptx
Pengantar-Big-Databhgfhfhfdhgfdghgfdhdfhfhf.pptx
 
BIG DATA & CONSUMER BEHAVIOR
BIG DATA & CONSUMER BEHAVIORBIG DATA & CONSUMER BEHAVIOR
BIG DATA & CONSUMER BEHAVIOR
 

More from HendroGunawan8

Jaringan VOIP Ringkasan Modul Pertemuan Ke-6.pdf
Jaringan VOIP Ringkasan Modul Pertemuan Ke-6.pdfJaringan VOIP Ringkasan Modul Pertemuan Ke-6.pdf
Jaringan VOIP Ringkasan Modul Pertemuan Ke-6.pdfHendroGunawan8
 
Pengolahan Citra Diskusi Pertemuan Ke-6.pdf
Pengolahan Citra Diskusi Pertemuan Ke-6.pdfPengolahan Citra Diskusi Pertemuan Ke-6.pdf
Pengolahan Citra Diskusi Pertemuan Ke-6.pdfHendroGunawan8
 
Diskusi Modul Sistem Pakar Sesi Ke-6 - Salin.pdf
Diskusi Modul Sistem Pakar Sesi Ke-6 - Salin.pdfDiskusi Modul Sistem Pakar Sesi Ke-6 - Salin.pdf
Diskusi Modul Sistem Pakar Sesi Ke-6 - Salin.pdfHendroGunawan8
 
Metode Mamdani sering juga dikenal dengan nama Metode Max-Min. Diskusi PPT Si...
Metode Mamdani sering juga dikenal dengan nama Metode Max-Min. Diskusi PPT Si...Metode Mamdani sering juga dikenal dengan nama Metode Max-Min. Diskusi PPT Si...
Metode Mamdani sering juga dikenal dengan nama Metode Max-Min. Diskusi PPT Si...HendroGunawan8
 
Estetika Humanisme Diskusi Modul Ke-6.pdf
Estetika Humanisme Diskusi Modul Ke-6.pdfEstetika Humanisme Diskusi Modul Ke-6.pdf
Estetika Humanisme Diskusi Modul Ke-6.pdfHendroGunawan8
 
Estetika Humanisme Diskusi Modul Part Ke-6.pdf
Estetika Humanisme Diskusi Modul Part Ke-6.pdfEstetika Humanisme Diskusi Modul Part Ke-6.pdf
Estetika Humanisme Diskusi Modul Part Ke-6.pdfHendroGunawan8
 
Pengolahan Citra Diskusi Pertemuan Ke-5.pdf
Pengolahan Citra Diskusi Pertemuan Ke-5.pdfPengolahan Citra Diskusi Pertemuan Ke-5.pdf
Pengolahan Citra Diskusi Pertemuan Ke-5.pdfHendroGunawan8
 
Diskusi Modul Sistem Pakar Sesi Ke-5.pdf
Diskusi Modul Sistem Pakar Sesi Ke-5.pdfDiskusi Modul Sistem Pakar Sesi Ke-5.pdf
Diskusi Modul Sistem Pakar Sesi Ke-5.pdfHendroGunawan8
 
Diskusi Modul Sistem Pakar Sesi Ke-5.pdf
Diskusi Modul Sistem Pakar Sesi Ke-5.pdfDiskusi Modul Sistem Pakar Sesi Ke-5.pdf
Diskusi Modul Sistem Pakar Sesi Ke-5.pdfHendroGunawan8
 
Estetstika Humanisme_Hendro Gunawan_200401072103_IT-05.docx
Estetstika Humanisme_Hendro Gunawan_200401072103_IT-05.docxEstetstika Humanisme_Hendro Gunawan_200401072103_IT-05.docx
Estetstika Humanisme_Hendro Gunawan_200401072103_IT-05.docxHendroGunawan8
 
Jaringan VOIP Ringkasan Video Pertemuan Ke-4.pdf
Jaringan VOIP Ringkasan Video Pertemuan Ke-4.pdfJaringan VOIP Ringkasan Video Pertemuan Ke-4.pdf
Jaringan VOIP Ringkasan Video Pertemuan Ke-4.pdfHendroGunawan8
 
Estetika Humanisme Diskusi Modul Part Ke-4 (DipulihkanOtomatis).pdf
Estetika Humanisme Diskusi Modul Part Ke-4 (DipulihkanOtomatis).pdfEstetika Humanisme Diskusi Modul Part Ke-4 (DipulihkanOtomatis).pdf
Estetika Humanisme Diskusi Modul Part Ke-4 (DipulihkanOtomatis).pdfHendroGunawan8
 
Estetika Humanisme Diskusi Video Sesi Ke-4.pdf
Estetika Humanisme Diskusi Video Sesi Ke-4.pdfEstetika Humanisme Diskusi Video Sesi Ke-4.pdf
Estetika Humanisme Diskusi Video Sesi Ke-4.pdfHendroGunawan8
 
Pengolahan Citra Diskusi Pertemuan Ke-4.pdf
Pengolahan Citra Diskusi Pertemuan Ke-4.pdfPengolahan Citra Diskusi Pertemuan Ke-4.pdf
Pengolahan Citra Diskusi Pertemuan Ke-4.pdfHendroGunawan8
 
Diskusi Modul Sistem Pakar Sesi Ke-4.pdf
Diskusi Modul Sistem Pakar Sesi Ke-4.pdfDiskusi Modul Sistem Pakar Sesi Ke-4.pdf
Diskusi Modul Sistem Pakar Sesi Ke-4.pdfHendroGunawan8
 
Diskusi PPT Sistem Pakar Sesi Ke-4 Simple Naïve Bayesian Classifier .pdf
Diskusi PPT Sistem Pakar Sesi Ke-4 Simple Naïve Bayesian Classifier .pdfDiskusi PPT Sistem Pakar Sesi Ke-4 Simple Naïve Bayesian Classifier .pdf
Diskusi PPT Sistem Pakar Sesi Ke-4 Simple Naïve Bayesian Classifier .pdfHendroGunawan8
 
Estetika Humanisme Diskusi Modul Part Ke-3.pdf
Estetika Humanisme Diskusi Modul Part Ke-3.pdfEstetika Humanisme Diskusi Modul Part Ke-3.pdf
Estetika Humanisme Diskusi Modul Part Ke-3.pdfHendroGunawan8
 
Diskusi Modul Sistem Pakar Sesi Ke-3.pdf
Diskusi Modul Sistem Pakar Sesi Ke-3.pdfDiskusi Modul Sistem Pakar Sesi Ke-3.pdf
Diskusi Modul Sistem Pakar Sesi Ke-3.pdfHendroGunawan8
 
Diskusi Modul Sistem Pakar Sesi Ke-3.pdf
Diskusi Modul Sistem Pakar Sesi Ke-3.pdfDiskusi Modul Sistem Pakar Sesi Ke-3.pdf
Diskusi Modul Sistem Pakar Sesi Ke-3.pdfHendroGunawan8
 
Estetika Humanisme Diskusi Video Sesi Ke-3 (DipulihkanOtomatis).pdf
Estetika Humanisme Diskusi Video Sesi Ke-3 (DipulihkanOtomatis).pdfEstetika Humanisme Diskusi Video Sesi Ke-3 (DipulihkanOtomatis).pdf
Estetika Humanisme Diskusi Video Sesi Ke-3 (DipulihkanOtomatis).pdfHendroGunawan8
 

More from HendroGunawan8 (20)

Jaringan VOIP Ringkasan Modul Pertemuan Ke-6.pdf
Jaringan VOIP Ringkasan Modul Pertemuan Ke-6.pdfJaringan VOIP Ringkasan Modul Pertemuan Ke-6.pdf
Jaringan VOIP Ringkasan Modul Pertemuan Ke-6.pdf
 
Pengolahan Citra Diskusi Pertemuan Ke-6.pdf
Pengolahan Citra Diskusi Pertemuan Ke-6.pdfPengolahan Citra Diskusi Pertemuan Ke-6.pdf
Pengolahan Citra Diskusi Pertemuan Ke-6.pdf
 
Diskusi Modul Sistem Pakar Sesi Ke-6 - Salin.pdf
Diskusi Modul Sistem Pakar Sesi Ke-6 - Salin.pdfDiskusi Modul Sistem Pakar Sesi Ke-6 - Salin.pdf
Diskusi Modul Sistem Pakar Sesi Ke-6 - Salin.pdf
 
Metode Mamdani sering juga dikenal dengan nama Metode Max-Min. Diskusi PPT Si...
Metode Mamdani sering juga dikenal dengan nama Metode Max-Min. Diskusi PPT Si...Metode Mamdani sering juga dikenal dengan nama Metode Max-Min. Diskusi PPT Si...
Metode Mamdani sering juga dikenal dengan nama Metode Max-Min. Diskusi PPT Si...
 
Estetika Humanisme Diskusi Modul Ke-6.pdf
Estetika Humanisme Diskusi Modul Ke-6.pdfEstetika Humanisme Diskusi Modul Ke-6.pdf
Estetika Humanisme Diskusi Modul Ke-6.pdf
 
Estetika Humanisme Diskusi Modul Part Ke-6.pdf
Estetika Humanisme Diskusi Modul Part Ke-6.pdfEstetika Humanisme Diskusi Modul Part Ke-6.pdf
Estetika Humanisme Diskusi Modul Part Ke-6.pdf
 
Pengolahan Citra Diskusi Pertemuan Ke-5.pdf
Pengolahan Citra Diskusi Pertemuan Ke-5.pdfPengolahan Citra Diskusi Pertemuan Ke-5.pdf
Pengolahan Citra Diskusi Pertemuan Ke-5.pdf
 
Diskusi Modul Sistem Pakar Sesi Ke-5.pdf
Diskusi Modul Sistem Pakar Sesi Ke-5.pdfDiskusi Modul Sistem Pakar Sesi Ke-5.pdf
Diskusi Modul Sistem Pakar Sesi Ke-5.pdf
 
Diskusi Modul Sistem Pakar Sesi Ke-5.pdf
Diskusi Modul Sistem Pakar Sesi Ke-5.pdfDiskusi Modul Sistem Pakar Sesi Ke-5.pdf
Diskusi Modul Sistem Pakar Sesi Ke-5.pdf
 
Estetstika Humanisme_Hendro Gunawan_200401072103_IT-05.docx
Estetstika Humanisme_Hendro Gunawan_200401072103_IT-05.docxEstetstika Humanisme_Hendro Gunawan_200401072103_IT-05.docx
Estetstika Humanisme_Hendro Gunawan_200401072103_IT-05.docx
 
Jaringan VOIP Ringkasan Video Pertemuan Ke-4.pdf
Jaringan VOIP Ringkasan Video Pertemuan Ke-4.pdfJaringan VOIP Ringkasan Video Pertemuan Ke-4.pdf
Jaringan VOIP Ringkasan Video Pertemuan Ke-4.pdf
 
Estetika Humanisme Diskusi Modul Part Ke-4 (DipulihkanOtomatis).pdf
Estetika Humanisme Diskusi Modul Part Ke-4 (DipulihkanOtomatis).pdfEstetika Humanisme Diskusi Modul Part Ke-4 (DipulihkanOtomatis).pdf
Estetika Humanisme Diskusi Modul Part Ke-4 (DipulihkanOtomatis).pdf
 
Estetika Humanisme Diskusi Video Sesi Ke-4.pdf
Estetika Humanisme Diskusi Video Sesi Ke-4.pdfEstetika Humanisme Diskusi Video Sesi Ke-4.pdf
Estetika Humanisme Diskusi Video Sesi Ke-4.pdf
 
Pengolahan Citra Diskusi Pertemuan Ke-4.pdf
Pengolahan Citra Diskusi Pertemuan Ke-4.pdfPengolahan Citra Diskusi Pertemuan Ke-4.pdf
Pengolahan Citra Diskusi Pertemuan Ke-4.pdf
 
Diskusi Modul Sistem Pakar Sesi Ke-4.pdf
Diskusi Modul Sistem Pakar Sesi Ke-4.pdfDiskusi Modul Sistem Pakar Sesi Ke-4.pdf
Diskusi Modul Sistem Pakar Sesi Ke-4.pdf
 
Diskusi PPT Sistem Pakar Sesi Ke-4 Simple Naïve Bayesian Classifier .pdf
Diskusi PPT Sistem Pakar Sesi Ke-4 Simple Naïve Bayesian Classifier .pdfDiskusi PPT Sistem Pakar Sesi Ke-4 Simple Naïve Bayesian Classifier .pdf
Diskusi PPT Sistem Pakar Sesi Ke-4 Simple Naïve Bayesian Classifier .pdf
 
Estetika Humanisme Diskusi Modul Part Ke-3.pdf
Estetika Humanisme Diskusi Modul Part Ke-3.pdfEstetika Humanisme Diskusi Modul Part Ke-3.pdf
Estetika Humanisme Diskusi Modul Part Ke-3.pdf
 
Diskusi Modul Sistem Pakar Sesi Ke-3.pdf
Diskusi Modul Sistem Pakar Sesi Ke-3.pdfDiskusi Modul Sistem Pakar Sesi Ke-3.pdf
Diskusi Modul Sistem Pakar Sesi Ke-3.pdf
 
Diskusi Modul Sistem Pakar Sesi Ke-3.pdf
Diskusi Modul Sistem Pakar Sesi Ke-3.pdfDiskusi Modul Sistem Pakar Sesi Ke-3.pdf
Diskusi Modul Sistem Pakar Sesi Ke-3.pdf
 
Estetika Humanisme Diskusi Video Sesi Ke-3 (DipulihkanOtomatis).pdf
Estetika Humanisme Diskusi Video Sesi Ke-3 (DipulihkanOtomatis).pdfEstetika Humanisme Diskusi Video Sesi Ke-3 (DipulihkanOtomatis).pdf
Estetika Humanisme Diskusi Video Sesi Ke-3 (DipulihkanOtomatis).pdf
 

Recently uploaded

MODUL AJAR IPAS KELAS 5 KURIKULUM MERDEKA.pdf
MODUL AJAR IPAS KELAS 5 KURIKULUM MERDEKA.pdfMODUL AJAR IPAS KELAS 5 KURIKULUM MERDEKA.pdf
MODUL AJAR IPAS KELAS 5 KURIKULUM MERDEKA.pdfAndiCoc
 
Konseptual Model Keperawatan Jiwa pada manusia
Konseptual Model Keperawatan Jiwa pada manusiaKonseptual Model Keperawatan Jiwa pada manusia
Konseptual Model Keperawatan Jiwa pada manusiaharnosuharno5
 
Bab 4 Persatuan dan Kesatuan di Lingkup Wilayah Kabupaten dan Kota.pptx
Bab 4 Persatuan dan Kesatuan di Lingkup Wilayah Kabupaten dan Kota.pptxBab 4 Persatuan dan Kesatuan di Lingkup Wilayah Kabupaten dan Kota.pptx
Bab 4 Persatuan dan Kesatuan di Lingkup Wilayah Kabupaten dan Kota.pptxrizalhabib4
 
MODUL AJAR IPAS KELAS 3 KURIKULUM MERDEKA.pdf
MODUL AJAR IPAS KELAS 3 KURIKULUM MERDEKA.pdfMODUL AJAR IPAS KELAS 3 KURIKULUM MERDEKA.pdf
MODUL AJAR IPAS KELAS 3 KURIKULUM MERDEKA.pdfAndiCoc
 
MODUL AJAR BAHASA INGGRIS KELAS 6 KURIKULUM MERDEKA.pdf
MODUL AJAR BAHASA INGGRIS KELAS 6 KURIKULUM MERDEKA.pdfMODUL AJAR BAHASA INGGRIS KELAS 6 KURIKULUM MERDEKA.pdf
MODUL AJAR BAHASA INGGRIS KELAS 6 KURIKULUM MERDEKA.pdfAndiCoc
 
1. Kisi-kisi PAT IPA Kelas 7 Kurmer 2024
1. Kisi-kisi PAT IPA Kelas 7 Kurmer 20241. Kisi-kisi PAT IPA Kelas 7 Kurmer 2024
1. Kisi-kisi PAT IPA Kelas 7 Kurmer 2024DessyArliani
 
MODUL PENDIDIKAN PANCASILA KELAS 6 KURIKULUM MERDEKA.pdf
MODUL PENDIDIKAN PANCASILA KELAS 6 KURIKULUM MERDEKA.pdfMODUL PENDIDIKAN PANCASILA KELAS 6 KURIKULUM MERDEKA.pdf
MODUL PENDIDIKAN PANCASILA KELAS 6 KURIKULUM MERDEKA.pdfAndiCoc
 
contoh-kisi-kisi-bahasa-inggris-kelas-9.docx
contoh-kisi-kisi-bahasa-inggris-kelas-9.docxcontoh-kisi-kisi-bahasa-inggris-kelas-9.docx
contoh-kisi-kisi-bahasa-inggris-kelas-9.docxdedyfirgiawan
 
Surat Pribadi dan Surat Dinas 7 SMP ppt.pdf
Surat Pribadi dan Surat Dinas 7 SMP ppt.pdfSurat Pribadi dan Surat Dinas 7 SMP ppt.pdf
Surat Pribadi dan Surat Dinas 7 SMP ppt.pdfEirinELS
 
MODUL AJAR SENI MUSIK KELAS 6 KURIKULUM MERDEKA.pdf
MODUL AJAR SENI MUSIK KELAS 6 KURIKULUM MERDEKA.pdfMODUL AJAR SENI MUSIK KELAS 6 KURIKULUM MERDEKA.pdf
MODUL AJAR SENI MUSIK KELAS 6 KURIKULUM MERDEKA.pdfAndiCoc
 
Topik 4_Eksplorasi Konsep LK Kelompok_Pendidikan Berkelanjutan
Topik 4_Eksplorasi Konsep LK Kelompok_Pendidikan BerkelanjutanTopik 4_Eksplorasi Konsep LK Kelompok_Pendidikan Berkelanjutan
Topik 4_Eksplorasi Konsep LK Kelompok_Pendidikan BerkelanjutanAyuApriliyanti6
 
BAB 1 BEBATAN DAN BALUTAN DALAM PERTOLONGAN CEMAS
BAB 1 BEBATAN DAN BALUTAN DALAM PERTOLONGAN CEMASBAB 1 BEBATAN DAN BALUTAN DALAM PERTOLONGAN CEMAS
BAB 1 BEBATAN DAN BALUTAN DALAM PERTOLONGAN CEMASNursKitchen
 
.....................Swamedikasi 2-2.pptx
.....................Swamedikasi 2-2.pptx.....................Swamedikasi 2-2.pptx
.....................Swamedikasi 2-2.pptxfurqanridha
 
RENCANA + Link2 MATERI Training _"SISTEM MANAJEMEN MUTU (ISO 9001_2015)".
RENCANA + Link2 MATERI Training _"SISTEM MANAJEMEN MUTU (ISO 9001_2015)".RENCANA + Link2 MATERI Training _"SISTEM MANAJEMEN MUTU (ISO 9001_2015)".
RENCANA + Link2 MATERI Training _"SISTEM MANAJEMEN MUTU (ISO 9001_2015)".Kanaidi ken
 
MODUL AJAR MATEMATIKA KELAS 3 KURIKULUM MERDEKA.pdf
MODUL AJAR MATEMATIKA KELAS 3 KURIKULUM MERDEKA.pdfMODUL AJAR MATEMATIKA KELAS 3 KURIKULUM MERDEKA.pdf
MODUL AJAR MATEMATIKA KELAS 3 KURIKULUM MERDEKA.pdfAndiCoc
 
AKSI NYATA TOPIK 1 MERDEKA BELAJAR. PPTX
AKSI NYATA TOPIK 1 MERDEKA BELAJAR. PPTXAKSI NYATA TOPIK 1 MERDEKA BELAJAR. PPTX
AKSI NYATA TOPIK 1 MERDEKA BELAJAR. PPTXIksanSaputra6
 
Asimilasi Masyarakat Cina Dengan Orang Melayu di Kelantan (Cina Peranakan Kel...
Asimilasi Masyarakat Cina Dengan Orang Melayu di Kelantan (Cina Peranakan Kel...Asimilasi Masyarakat Cina Dengan Orang Melayu di Kelantan (Cina Peranakan Kel...
Asimilasi Masyarakat Cina Dengan Orang Melayu di Kelantan (Cina Peranakan Kel...luqmanhakimkhairudin
 
MODUL AJAR SENI RUPA KELAS 6 KURIKULUM MERDEKA.pdf
MODUL AJAR SENI RUPA KELAS 6 KURIKULUM MERDEKA.pdfMODUL AJAR SENI RUPA KELAS 6 KURIKULUM MERDEKA.pdf
MODUL AJAR SENI RUPA KELAS 6 KURIKULUM MERDEKA.pdfAndiCoc
 
KISI-KISI SOAL DAN KARTU SOAL BAHASA INGGRIS.docx
KISI-KISI SOAL DAN KARTU SOAL BAHASA INGGRIS.docxKISI-KISI SOAL DAN KARTU SOAL BAHASA INGGRIS.docx
KISI-KISI SOAL DAN KARTU SOAL BAHASA INGGRIS.docxDewiUmbar
 
MODUL AJAR SENI TARI KELAS 6 KURIKULUM MERDEKA.pdf
MODUL AJAR SENI TARI KELAS 6 KURIKULUM MERDEKA.pdfMODUL AJAR SENI TARI KELAS 6 KURIKULUM MERDEKA.pdf
MODUL AJAR SENI TARI KELAS 6 KURIKULUM MERDEKA.pdfAndiCoc
 

Recently uploaded (20)

MODUL AJAR IPAS KELAS 5 KURIKULUM MERDEKA.pdf
MODUL AJAR IPAS KELAS 5 KURIKULUM MERDEKA.pdfMODUL AJAR IPAS KELAS 5 KURIKULUM MERDEKA.pdf
MODUL AJAR IPAS KELAS 5 KURIKULUM MERDEKA.pdf
 
Konseptual Model Keperawatan Jiwa pada manusia
Konseptual Model Keperawatan Jiwa pada manusiaKonseptual Model Keperawatan Jiwa pada manusia
Konseptual Model Keperawatan Jiwa pada manusia
 
Bab 4 Persatuan dan Kesatuan di Lingkup Wilayah Kabupaten dan Kota.pptx
Bab 4 Persatuan dan Kesatuan di Lingkup Wilayah Kabupaten dan Kota.pptxBab 4 Persatuan dan Kesatuan di Lingkup Wilayah Kabupaten dan Kota.pptx
Bab 4 Persatuan dan Kesatuan di Lingkup Wilayah Kabupaten dan Kota.pptx
 
MODUL AJAR IPAS KELAS 3 KURIKULUM MERDEKA.pdf
MODUL AJAR IPAS KELAS 3 KURIKULUM MERDEKA.pdfMODUL AJAR IPAS KELAS 3 KURIKULUM MERDEKA.pdf
MODUL AJAR IPAS KELAS 3 KURIKULUM MERDEKA.pdf
 
MODUL AJAR BAHASA INGGRIS KELAS 6 KURIKULUM MERDEKA.pdf
MODUL AJAR BAHASA INGGRIS KELAS 6 KURIKULUM MERDEKA.pdfMODUL AJAR BAHASA INGGRIS KELAS 6 KURIKULUM MERDEKA.pdf
MODUL AJAR BAHASA INGGRIS KELAS 6 KURIKULUM MERDEKA.pdf
 
1. Kisi-kisi PAT IPA Kelas 7 Kurmer 2024
1. Kisi-kisi PAT IPA Kelas 7 Kurmer 20241. Kisi-kisi PAT IPA Kelas 7 Kurmer 2024
1. Kisi-kisi PAT IPA Kelas 7 Kurmer 2024
 
MODUL PENDIDIKAN PANCASILA KELAS 6 KURIKULUM MERDEKA.pdf
MODUL PENDIDIKAN PANCASILA KELAS 6 KURIKULUM MERDEKA.pdfMODUL PENDIDIKAN PANCASILA KELAS 6 KURIKULUM MERDEKA.pdf
MODUL PENDIDIKAN PANCASILA KELAS 6 KURIKULUM MERDEKA.pdf
 
contoh-kisi-kisi-bahasa-inggris-kelas-9.docx
contoh-kisi-kisi-bahasa-inggris-kelas-9.docxcontoh-kisi-kisi-bahasa-inggris-kelas-9.docx
contoh-kisi-kisi-bahasa-inggris-kelas-9.docx
 
Surat Pribadi dan Surat Dinas 7 SMP ppt.pdf
Surat Pribadi dan Surat Dinas 7 SMP ppt.pdfSurat Pribadi dan Surat Dinas 7 SMP ppt.pdf
Surat Pribadi dan Surat Dinas 7 SMP ppt.pdf
 
MODUL AJAR SENI MUSIK KELAS 6 KURIKULUM MERDEKA.pdf
MODUL AJAR SENI MUSIK KELAS 6 KURIKULUM MERDEKA.pdfMODUL AJAR SENI MUSIK KELAS 6 KURIKULUM MERDEKA.pdf
MODUL AJAR SENI MUSIK KELAS 6 KURIKULUM MERDEKA.pdf
 
Topik 4_Eksplorasi Konsep LK Kelompok_Pendidikan Berkelanjutan
Topik 4_Eksplorasi Konsep LK Kelompok_Pendidikan BerkelanjutanTopik 4_Eksplorasi Konsep LK Kelompok_Pendidikan Berkelanjutan
Topik 4_Eksplorasi Konsep LK Kelompok_Pendidikan Berkelanjutan
 
BAB 1 BEBATAN DAN BALUTAN DALAM PERTOLONGAN CEMAS
BAB 1 BEBATAN DAN BALUTAN DALAM PERTOLONGAN CEMASBAB 1 BEBATAN DAN BALUTAN DALAM PERTOLONGAN CEMAS
BAB 1 BEBATAN DAN BALUTAN DALAM PERTOLONGAN CEMAS
 
.....................Swamedikasi 2-2.pptx
.....................Swamedikasi 2-2.pptx.....................Swamedikasi 2-2.pptx
.....................Swamedikasi 2-2.pptx
 
RENCANA + Link2 MATERI Training _"SISTEM MANAJEMEN MUTU (ISO 9001_2015)".
RENCANA + Link2 MATERI Training _"SISTEM MANAJEMEN MUTU (ISO 9001_2015)".RENCANA + Link2 MATERI Training _"SISTEM MANAJEMEN MUTU (ISO 9001_2015)".
RENCANA + Link2 MATERI Training _"SISTEM MANAJEMEN MUTU (ISO 9001_2015)".
 
MODUL AJAR MATEMATIKA KELAS 3 KURIKULUM MERDEKA.pdf
MODUL AJAR MATEMATIKA KELAS 3 KURIKULUM MERDEKA.pdfMODUL AJAR MATEMATIKA KELAS 3 KURIKULUM MERDEKA.pdf
MODUL AJAR MATEMATIKA KELAS 3 KURIKULUM MERDEKA.pdf
 
AKSI NYATA TOPIK 1 MERDEKA BELAJAR. PPTX
AKSI NYATA TOPIK 1 MERDEKA BELAJAR. PPTXAKSI NYATA TOPIK 1 MERDEKA BELAJAR. PPTX
AKSI NYATA TOPIK 1 MERDEKA BELAJAR. PPTX
 
Asimilasi Masyarakat Cina Dengan Orang Melayu di Kelantan (Cina Peranakan Kel...
Asimilasi Masyarakat Cina Dengan Orang Melayu di Kelantan (Cina Peranakan Kel...Asimilasi Masyarakat Cina Dengan Orang Melayu di Kelantan (Cina Peranakan Kel...
Asimilasi Masyarakat Cina Dengan Orang Melayu di Kelantan (Cina Peranakan Kel...
 
MODUL AJAR SENI RUPA KELAS 6 KURIKULUM MERDEKA.pdf
MODUL AJAR SENI RUPA KELAS 6 KURIKULUM MERDEKA.pdfMODUL AJAR SENI RUPA KELAS 6 KURIKULUM MERDEKA.pdf
MODUL AJAR SENI RUPA KELAS 6 KURIKULUM MERDEKA.pdf
 
KISI-KISI SOAL DAN KARTU SOAL BAHASA INGGRIS.docx
KISI-KISI SOAL DAN KARTU SOAL BAHASA INGGRIS.docxKISI-KISI SOAL DAN KARTU SOAL BAHASA INGGRIS.docx
KISI-KISI SOAL DAN KARTU SOAL BAHASA INGGRIS.docx
 
MODUL AJAR SENI TARI KELAS 6 KURIKULUM MERDEKA.pdf
MODUL AJAR SENI TARI KELAS 6 KURIKULUM MERDEKA.pdfMODUL AJAR SENI TARI KELAS 6 KURIKULUM MERDEKA.pdf
MODUL AJAR SENI TARI KELAS 6 KURIKULUM MERDEKA.pdf
 

Data Mining Diskusi 1.docx

  • 1. 1 Data Mining Diskusi Pertemuan 1 Nama : Hendro Gunawan NIM : 200401072103 Kelas : IT501 Gambar 1. Introduction To Data Mining, AI, Big Data Kata Pengantar Data Mining mengalami pertumbuhan yang luar biasa, sebanding dengan kecepatan peningkatan ukuran data di era big data saat ini, dengan volume data yang sudah mencapai zettabyte (satu trilyun gigabyte). Pada banyak buku teks, artikel,makalah, dan beragam literatur lainnya, data mining digunakan untuk enam fungsi: klasifikasi (clasification), klasterisasi (clustering), regresi (regression), deteksi anomali (anomaly detection) pembelajaran aturan assosiasi (association rule learning) atau pemodelan kebergantungan (dependency modeling), dan perangkuman (summarization). Mengingat area yang sangat luas. 1.Pendahuluan Sebagai ilmu yang relatif baru, saat ini data Mining menjadi salah satu pusat perhatian para akademisi maupun praktisi. Beragam riset dan pengembangan Data Mining telah memberikan banyak produk yang berguna bagi masyarakat luas, walaupun ada sebagian masyarakat yang merasa dirugikan atau kurang nyaman dengan hadirnya Data Mining. Pada bab ini kita, Anda dan saya, akan mendiskusikan secara singkat mengenai pengertian, kegunaan, aplikasi, dan etika dalam Data Mining. Kita musti memahami semua itu secara benar sebelum membahas hal-hal yang lebih detail. 1.1 Apa Itu Data Mining? Cara pandang dan pengetahuan yang berbeda membuat para ahli memberikan definisi berbeda tentang Data Mining. Sebagian ahli menyatakan bahwa Data Mining adalah langkah analisis terhadap proses penemuan pengetahuan di dalam basis data atau knowledge discovery in database yang disingkat KDD
  • 2. 2 (Fayyad et al. 1996). Pengetahuan bisa berupa pola data atau relasi antar data yang valid (yang tidak diketahui sebelumnya). Data Mining merupakan gabungan sejumlah disiplin ilmu komputer (ACM 2006), (Clifton 2010), yang didefinisikan sebagai proses penemuan pola-pola baru dari kumpulan- kumpulan data sangat besar, meliputi metode-metode yang merupakan irisan dari artificial inteligence, machine learning, statistic, dan database systems (ACM 2006). Data Mining ditujukan untuk mengekstrak (mengambil intisari) pengetahuan dari sekumpulan data sehingga didapatkan struktur yang dapat dimengerti manusia (ACM 2006) serta meliputi basis data dan managemen data prapemrosesan data, pertimbangan model dan inferensi, ukuran ketertarikan, pertimbangan kompleksitas, pasca pemrosesan terhadap struktur yang ditemukan, visualisasi, dan online updating (ACM 2006). 1.2 Mengapa Perlu Data Mining? Beberapa tahun terakhir, data semakin heterogen dan kompleks dengan volume yang meningkat cepat secara eksponensial. Menurut John Gantz dan David Reinsel dalam investigasi yang dilakukan di IDC, volume data pada tahun 2011 mencapai 1,8 zettabyte atau 1,8 trilyun gigabyte, pada tahun 2012 meningkat lebih dari 50% menjadi 2,8 zettabytes ( Gantz et al. 2012). Pada tahun 2013 volume data sudah menjadi 4,4 zettabytes dan akan terus meningkat dengan cepat hingga diperkirakan mencapai 44 zettabytes di tahun 2020 (Turner 2014). Oleh karena itu, saat ini dikenal dengan istilah Big data mempunyai empat karakteristik: berukuran sangat besar (high-volume), sangat bervariasi (high-variety), kecepatan pertumbuhan tinggi (high-velocity), dan dan sangat tidak jelas (high veracity). Namun, big data dapat dianalisis sehingga perusahaan dapat mengambil keputusan strategis bisnis dengan lebih baik. Dalam big data, tentu saja Anda akan kesulitan membaca dan mengetahui pola-pola dan relasi-relasi data jika dilakukan secara manual atau konvensional. Sebagai contoh, suatu perusahaan operator seluler dengan ratusan juta pelanggan, dalam setahun bisa menghasilkan milyaran data penggunaan komunikasi suara, SMS, dan internet. Dari milyaran data tersebut, bagaimana menemukan pola-pola pelanggan dalam menggunakan komunikasi suara, SMS, dan internet? Pola tersebut bisa dilihat dalam suatu periode tertentu, misalnya bulan, minggu, hari, bahkan jam. Bagaimana klasifikasi/segmentasi pelanggan? Bagaimana relasi antara komunikasi suara, SMS, dan internet? Bagaimana pola komunikasi antara pelanggan seluler di suatu operator dengan pelanggan operator lain? Semua pertanyaan tersebut tentu saja sulit di jawab jika analisis data dilakukan secara konvensional. Data Mining atau penambangan data adalah teknik yang relatif cepat dan mudah untuk menemukan pengetahuan, pola dan/atau relasi antar data, secara otomatis. Dengan menggabungkan empat disiplin ilmu komputer seperti pada definisi di atas, pengetahuan bisa ditemukan dalam lima proses berurutan: seleksi, prapemrosesan, transformasi, data mining, dan interpretasi/evaluasi (Fayyad et al. 1996). 1.3 Kegunaan Data Mining
  • 3. 3 Secara umum, kegunaan Data Mining dapat dibagi menjadi dua: deskriptif dan prediktif. Deskriptif berarti data mining digunakan untuk mencari pola-pola yang dapat dipahami manusia yang menjelaskan karakteristik data. Sedangkan prediktif berarti data mining digunakan untuk membentuk sebuah model pengetahuan yang akan digunakan untuk melakukan prediksi. Berdasarkan fungsionalitasnya, tugas-tugas data mining bisa dikelompokkan ke dalam enam kelompok berikut ini (Fayyad et al. 1996):  Klasifikasi (classificationi): men-generalisasi struktur yang diketahui untuk diaplikasikan pada data- data baru. Misalkan, klasifikasi penyakit ke dalam sejumlah jenis, klasifikasi email ke dalam spam atau bukan.  Klasterisasi (clustering): mengelompokkan data, yang tidak diketahui label kelasnya, ke dalam sejumlah kelompok tertentu sesuai dengan ukuran kemiripannya.  Regresi (regression): menemukan suatu fungsi yang memodelkan data dengan galat (kesalahan prediksi) seminimal mungkin.  Deteksi anomali (anomaly detection): mengidentifikasi data yang tidak umum, bisa berupa outlier (pencilan), perubahan atau deviasi yang mungkin sangat penting dan perlu investigasi lebih lanjut.  Pembelajaran aturan asosiasi (association rule learning) atau pemodelan kebergantungan (dependency modeling): mencari relasi antar variabel.  Perangkuman (summarization): menyediakan representasi data yang lebih sederhana, meliputi visualisasi dan pembuatan laporan. 1.4 Aplikasi-aplikasi Data Mining Saat ini data mining banyak diaplikasikan pada berbagai bidang, seperti bisnis, seni dan hiburan, sains, dan teknik, jurnalistik, politik, dan lain-lain. Berikut ini sejumlah aplikasi yang dikelompokkan berdasarkan bidang-bidang tersebut. 1.4.1 Marketing dan Bisnis Pada suatu perusahaan, banyak proses bisnis dari hulu sampai hilir yang perlu didesain secara serius untuk mendapatkan benefit dan/atau profit yang maksimal dengan biaya pengeluaran yang seminimal mungkin. Misalkan, proses pemilihan vendor dan rekan bisnis yang paling baik, model promosi yang efektif dan tepat sasaran, proses mendeteksi kecurangan pelanggan sehingga perusahaan tidak mengalami kerugian besar, sistem CRM (customer relationship managemen) yang handal, dan banyak lagi yang lain. Beriokut ini beberapa contoh aplikasi data mining dalam bidang marketing dan bisnis secara luas: A. Market Basket Analysis Market basket analysis (analisis keranjang belanja) atau yang dikenal dengan association rule (aturan asosiasi) adalah salah satu konsep menarik dalam data mining yang berusaha menemukan asosiasi atau keterkaitan data. Diberi nama market basket analysis karena pada awal ditemukannya, konsep ini
  • 4. 4 berkaitan dengan barang-barang yang berada di dalm keranjang belanjaan yang secara langsung menunjukkan tingakah laku konsumen saat berbelanja. Misalkan, 90 dari 100 konsumen yang membeli margarin, ternyata mereka juga membeli tepung. Hal ini berarti asosiasi antara margarin dan tepung sangatlah kuat, misalnya dinatakan dalam ukuran prosentase sebesar 90%. Konsep ini bisa digunakan untuk tujuan yang baik bagi pedagang maupun pelanggan, seperti menempatkan barang-barang yang memiliki asosiasi kuat di tempat yang berdekatan sehingga pelanggan lebih mudah menemukannya. Misalkan, margarin, tepung, dan gula diletakkan di posisi yang sangat berdekatan karena ketiganya memiliki asosiasi yang kuat. Tetapi, konsep ini bisa disalahgunakan untuk mencari keuntungan maksimal dan bahkan bisa membuat pelanggan merasa dirugikan. Misalkan membuat promosi berupa potongan harga untuk barang A, tetapi diam-diam menaikkan harga untuk barang B yang memiliki asosiasi sangat kuat dengan barang A. Maslah ini pernah muncul pada tahun 2001. Menjelang hari lebaran, ada seorang yang belanja bahan-bahan membuat kue di sebuah supermarket besar yang menawarkan potongan harga (diskon) hingga 30% untuk produk margarin. Tertarik dengan harga margarin yang sangat murah dan beramsumsi bahwa harga barang-barang lainnya pasti murah, dia membeli tepung dalam jumlah banyak. Keesokan harinya, dia pergi ke supermarket lain yang tidak menawarkan potongan harga. Dia terkejut ketika mengetahui harga tepung di situ 60% lebih murah dari pada di supermarket pertama. Setelah dikalkulasi, total harga margarin dan tepung secara keseluruhan lebih murah di supermarket yang tidak menawarkan potongan harga. Dia merasa terkecoh. Beberapa bulan kemudian dia baru tahu bahwa teknik penjualan dengan potongan harga pada supermarket pertama itu ternyata menggunakan konsep market basket atau association rule. Secara hukum, jual beli seperti di atas adalah sah karena konsumen dianggap sudah melihat dan merasa cocok denga label harga barang yang tertera. Pihak supermarket tentu saja merasa tidak bersalah dan justru menyalahkan konsumen yang tidak bersikap kritis dan teliti. Di sisi supermarket, promosi yang dibuat adalah sebuah strategi untuk mendapatkan keuntungan. Namun, di sisi konsumen, promosi yang dibuat supermarket tersebut bisa membuat mereka merasa terkecoh dan merasa dirugikan. Bagaimanapun, promosi yang jujur seperti “Margarin diskon 30% sedangkan tepung naik 40%” apakah mungkin dilakukan? Tentu saja tidak. Jadi, yang sebaiknya dilakukan konsumen adalah bersikap kritis, teliti, dan bijak dalam menilai segala bentuk promosi. B. Recomender System Ketika perusahaan harus memilih satu vendor atau rekan bisnis diantara banyak pilihan yang tersedia, diperlukan usaha dan biaya cukup besar untuk melakukan proses ini. Maslah ini bisa diselesaikan dengan mudah menggunakan recommender system (sistem perekomendasi). Sistem ini bisa dibangun menggunakan teknik perangkingan yang pada dsarnya menggunakan teknik klasifikasi atau klasterisasi. Hal lainnya adalah masalah pemilihan pegawai berdasarkan historinya. Misalkan, lulusan universitas
  • 5. 5 mana yang sering kali menunjukkan performansi bagus. Sehingga perusahaan bisa memfokuskan rekrutasi dari lulusan sejumlah universitas tertentu saja. C. Churn Prediction Suatu perusahaan telekomunikasi seluler dengan jumlah pelanggan yang mencapai 100 juta orang perlu memprediksi pelanggan mana yang loyal dan tidak loyal sehingga bisa menentukan promosi yang tepat sasaran kepada setiap kategori pelanggan. Misalkan, jika terdapat 60% pelanggan yang diprediksi termasuk kategori tidak loyal dan mungkin berpindah (churn) ke operator lain, maka perusahaan ini bisa membuat promosi yang lebih menarik dan tepat supaya tidak kehilangan sangat banyak pelanggan. Promosi bisa difokuskan hanya untuk kategori pelanggan tersebut saja tanpa perlu promosi untuk kategori pelanggan yang loyal. Dengan demikian, biaya promosi bisa ditekan. Hal yang sama juga bisa dilakukan untuk perusahan lain yang bergerak dalam bisnis apapun. Lebih luas lagi, masalah ini digunakan untuk membangun sistem optimasi untuk CRM yang lebih lengkap dan menyeluruh. Sistem prediksi churn ini bisa dibangun menggunakan teknik klasifikasi atau klasterisasi. D. Fraud Detection Perusahaan telekomunikasi yang memiliki ratusan juta pelanggan akan menghasilkan basis data sangat besar,. Dari sekian ratus juta pelanggan, mungkin saja terdapat sejumlah kecil pelanggan yang melakukan kecurangan. Misalnya, tagihan telepon pelanggan pasca bayar biasanya dikisaran ratusan ribu rupiah per bulan dan dibayar secara lancar. Tetapi, beberapa bulan terakhir tagihannya mencapai puluhan juta rupiah per bulan. Pembayaran mulai tersendat, dan akhirnya tidak lagi membayar, sehingga perusahaan dirugikan. Mengingat jumlah pelanggan yang mencapai jutaan, sulit dideteksi pola tagihan pelanggan mana yang berpotensi melakukan kecurangan seperti di atas. Tetapi, dengan teknik data mining, masalah ini bisa diselesaikan dengan mudah yaitu dengan membangun fraud detection ( pendeteksi kecurangan). Sistem ini bisa dibangun menggunakan teknik anomaly detection. 1.4.2 Seni dan Hiburan Pada bidang seni musik, kita bisa membuat sistem klasifikasi yang secara otomatis mengelompokkan ribuan atau bahkan jutaan lagu ke dalam sejumlah genre atau mood (suasana hati). Hal ini bisa menghenmat banyak waktu dan biaya dalam proses pencarian serta dapat memudahkan pengguna dalam menetukan pilihan lagu. Untuk dunia hiburan, kita bisa membangun aplikasi untuk memberikan penilaian (rating), memprediksi nilai, atau bahkan merekomendasikan film. Dengan demikian, para penikmat film dapat lebih mudah menentukan pilihan film yang disukai. 1.4.3 Sains dan Teknik Saat ini, dunia sains dan teknik sangat banyak menggunakan teknik data mining untuk menyelesaikan permasalahan yang sangat kompleks, seperti genetika, medis , teknik elektri, dan sebagainya. Pada ilmu biologi, suatu masalah yang sangat dikenal adalah pencocokan susunan genetika manusia yang disebut dengan dioxiribo nucleic acid (DNA). Suatu teknik yang disebut sequence mining bisa membantu kita
  • 6. 6 memahami pemetaan hubungan darah antar manusia. Metode data mining yang bisa digunakan adalah multifactor dimensionality reduction (Zhu et al. 2007). Data mining juga digunakan pada bidang teknik tenaga listrik. Beberapa masalah yang bisa diselesikan adalah bagaimana memonitor kondisi peralatan listrik tegangan tinggi, bagaimana memprediksi kebutuhan daya per hari, per mingu atau per bulan. Sehingga daya listrik yang diproduksi bisa sesuai dengan kebutuhan (Suyanto 2008). Selama ini, sistem prediksi beban listrik per jam yang berhasil dibuat memiliki rata-rata galat atau tingkat kesalahan cukup besar, di atas 10%. Jika galat ini bisa direduksi hingga di bawah 1%, maka perusahaan listrik bisa menghemat ribuan atau bahkan jtaan mega watt daya yang selama ini terbuang percuma karena biaya penyimpanan listrik ke dalam baterai memang sangat mahal. Teknik data mining yang bisa digunakan adalah klasterisasi dan prediksi. 1.4.4 Jurnalistik Mereka yang bekerja di bidang jurnalistik telah lama tertarik menggunakan data mining untuk penulisan artikel atau berita secara otomatis. Sejak tahun 2009 telah dikenal istilah Data-Driven Journalism (DDJ), suatu proses jurnalistik berbasis analisis dan penyaringan himpunan data berukuran besar untuk membuat atau mengangkat berita. Banyak aplikasi penulisan artikel otomatis telah dikembangkan. Jika Anda membuka Google dan mengetikkan kat kunci article generator, article creator, news generator, auto content generator, atau easy generator, maka Anda akan mendapati banyak situs yang menawarkan aplikasi penulisan artikel otomatis, seperti http://articlegenerator.org dan http://articoolo.com. Dengan aplikasi ini, Anda hanya perlu memasukkan kata-kata penting mengenai tema yang Anda inginkan, misal tentang kenaikan harga sembako, maka dalam hitungan satu hingga dua menit Anda akan mendapatkan sebuah artikel unik, yang belum pernah ditulis siapapun, tentang kenaikan harga sembako. Tentu saja, aplikasi tersebut bisa saja disalahgunakan untuk menghasilkan ribuan berita palsu (fake news) maupun berita bohong (hoax) yang sengaja disebarkan secara masif demi kepentingan tertentu. Oleh karena itu, beberapa kalangan mencemaskan hal ini. Namun, bagi kalangna lain yang pro data mining justru memiliki pemikiran sebaliknya. Mengapa tidak mengunakan data mining untuk membangun suatu aplikasi pendeteksi berita palsu maupun berita bohong? Mudah kok. Tidak sulit sama sekali. Anda hanya perlu teknik machine learning sederhana. Saat ini bahkan sudah banyak aplikasi pendeteksi berita palsu maupun berita bohong. Anda bisa mencarinya sendiri di Google, bukan? Selain aplikasi penulisan artikel otomatis dan pendeteksi berita palsu/bohong, data mining juga banyak digunakan untuk aplikasi peringkasan teks (text summarization). Pernahkah Anda membaca suatu berita yang di bagian akhirnya tercantum “Ditulis dari berbagai sumber”? Itu artinya Si Penulis membaca bamyak artikel lain, kemudian merangkum dan menulis sebuah artikel unik yang benar-benar baru, berbeda dari semua artikel yang dibacaya. Secara teknis, dalam data mining hal ini disebut multi- document text summarization.
  • 7. 7 1.4.5 Politik Dunia politik telah lama menggunakan teknik-teknik data mining untuk menganalisis preferensi politik masyarakat dalam pemilu partai politik, pemilu legislatif, hingga pemilihan presiden. Dengan data mining, para konsultan politik dapat mengeksploitasi data-data pengguna media sosial. Mereka mnganalisis aktivitas jutaan pengguna media sosial untuk memetakkan sentimen dan dukungan rakyat pada calon presiden tertentu. Selain itu, mereka juga dapat melakukan klasifikasi dan klasterisasi data- data pribadi pengguna sehingga dapat merancang strategi dan membangun propaganda yang tepat untuk mempengaruhi persepsi pemilih. 1.5 Teknik-teknik Data Mining Sebagian kalangna kesulitan membedakan data mining dengan machine learning. Hal ini dapat dimaklumi mengingat kedua istilah tersebut memang memiliki tumpang tindih yang tinggi. Dalam banyak literatur, sebagian ahli mendefinisikan data mining sebagai sains yang menggunakan berbagai macam teknik, yang sebagian besar dipelajari dan ditemukan di bidang machine learning, untuk mengekstrak pola-pola penting dan berguna dari kumpulan-kumpulan data berukuran besar (big data). Dengan kata lain, pembelajaran mesin (machine learning) merupakan teknik-teknik yang mendukung dan paling banyak digunakan dalam penggalian data (data mining). Sementara itu, machine learning sring kali disebut-sebut secara berdampingan dengan istilah deep learning dan artificial inteligence. Hal ini juga wajar saja karena posisinya yang juga tumpang tindih. Kita bisa menggambarkan relasi data mining, big data, artificial inteligence, machine learning, dan deep learning secara sederhana dalam sebuah diagram pada gambar 1.5.1 berikut ini. Gambar 1.5.1 data mining, big data, artificial inteligence, machine learning, dan deep learning
  • 8. 8 1.6 Etika Dalam Data Mining Data mining bisa memberikan dampak negatif maupun positif bergantung pada penggunaannya. Jika tidak memperhatikan etika pengguanaan data, khususnya yang berhubungan dengan data-data pribadi, maka data mining bisa berdampak negatif. Misalkan, klasterisasi pelanggan berdasarkan suku bangsa, agama, ras, golongan, usia, maupun gender bisa berujung pada masalah diskriminasi dan bisa merugikan suatu kelompok tertentu. Tetapi, ketika data mining digunakan untuk masalah medis yang harus membedakan gender atau usia tertentu, maka hal ini justru berefek positif. Misalkan, ada suatu jenis penyakit yang peluamhnya lebih besar diderita oleh kaum wanita atau oleh kelompok usia tertentu, maka sudah seharusnya pihak medis melakukan penanganan secara berbeda. 1.7 Latihan 1. Jelaskan dengan kalimat sendiri apa yang dimaksud dengan data mining? 2. Sebutkan konsep alur proses data mining! Jawaban: 1. Data mining adalah proses menemukan pola, hubungan, atau informasi yang berharga dalam kumpulan data yang besar dan kompleks. Ini melibatkan penggunaan berbagai teknik dan alat statistik, matematika, dan kecerdasan buatan untuk menganalisis data yang telah dikumpulkan dan disimpan dalam berbagai format. Tujuan utama dari data mining adalah untuk mengungkap wawasan atau pengetahuan yang dapat membantu pengambilan keputusan yang lebih baik dalam berbagai bidang, termasuk bisnis, ilmu pengetahuan, kesehatan, keuangan, dan lainnya. Beberapa teknik umum yang digunakan dalam data mining meliputi: 1. Clustering: Mengelompokkan data ke dalam kelompok-kelompok yang serupa berdasarkan karakteristik atau atribut tertentu. 2. Classification: Mengklasifikasikan data ke dalam kategori atau kelas yang telah ditentukan berdasarkan atribut yang ada. 3. Association Rule Mining: Mengidentifikasi hubungan atau asosiasi antara berbagai atribut dalam data. 4. Regression Analysis: Mengidentifikasi hubungan antara variabel dependen dan variabel independen dalam data. 5. Anomaly Detection: Mengidentifikasi data yang tidak biasa atau tidak sesuai dengan pola umum dalam dataset. 6. Text Mining: Menggali informasi dari data teks, seperti dokumen, tweet, atau laporan. Data mining sering digunakan dalam mendukung pengambilan keputusan strategis, peramalan, pemasaran berbasis data, deteksi fraud, analisis risiko, dan banyak aplikasi lainnya. Dengan
  • 9. 9 berkembangnya teknologi dan ketersediaan data yang melimpah, data mining telah menjadi alat yang sangat penting dalam dunia bisnis dan penelitian. 2. Alur proses data mining melibatkan serangkaian langkah-langkah yang sistematis untuk mengidentifikasi pola atau informasi berharga dalam kumpulan data. Berikut adalah konsep alur proses data mining yang umum digunakan: 1. Pemahaman Masalah: Langkah awal dalam proses data mining adalah memahami masalah atau tujuan yang ingin dicapai. Ini melibatkan berbicara dengan pemangku kepentingan dan mengidentifikasi apa yang ingin dicapai dengan analisis data. 2. Pemahaman Data:Mengumpulkan data yang relevan untuk analisis. Ini melibatkan pemahaman terhadap sumber data, jenis data yang ada, dan kualitas data. 3. Eksplorasi Data (Data Exploration): Mengeksplorasi data untuk memahami pola dasar, statistik deskriptif, dan karakteristik umum. Tujuannya adalah mengidentifikasi potensi masalah dalam data seperti missing values atau outliers. 4. Pemilihan Data (Data Selection): Memilih subset data yang relevan untuk analisis lebih lanjut. Terkadang, tidak semua data dalam kumpulan data akan diperlukan untuk mencapai tujuan analisis. 5. Pemrosesan Data (Data Preprocessing): Membersihkan data dengan mengatasi masalah seperti data yang hilang, duplikasi, atau outlier. Ini juga mencakup normalisasi data jika diperlukan. 6. Pemilihan Model dan Teknik Data Mining: Memilih model atau teknik data mining yang paling sesuai untuk masalah yang ada. Ini tergantung pada tujuan analisis, tipe data, dan karakteristik masalah. 7. Transformasi Data: Melakukan transformasi pada data, jika diperlukan, untuk mempersiapkan data untuk analisis. Ini mungkin melibatkan konversi data kategoris menjadi data numerik atau pengurangan dimensi. 8. Penerapan Model Data Mining: Menerapkan teknik data mining yang dipilih pada data yang telah diproses untuk mengekstrak pola atau informasi yang relevan. 9. Evaluasi Model: Mengevaluasi kualitas model dengan metrik yang sesuai. Tujuan adalah memastikan model berfungsi dengan baik dalam mengungkap pola yang relevan dalam data. 10. Interpretasi Hasil: Menginterpretasikan hasil data mining untuk mendapatkan wawasan yang berharga dan mendukung pengambilan keputusan. 11. Integrasi dengan Bisnis atau Penelitian: Mengintegrasikan wawasan dari data mining ke dalam keputusan bisnis atau hasil penelitian. Ini adalah tahap akhir yang memungkinkan tindakan berdasarkan temuan. 12. Penyajian Hasil: Menyajikan hasil analisis data dalam format yang mudah dimengerti, seperti laporan, grafik, atau visualisasi.
  • 10. 10 Setelah menyelesaikan alur proses data mining, langkah-langkah ini seringkali diulang dan ditingkatkan seiring dengan perkembangan pemahaman masalah dan data yang lebih baik. Data mining adalah proses iteratif yang memungkinkan organisasi untuk terus memperoleh wawasan baru dari data mereka. Terima kasih Referensi Suyanto, D. (2018). Data Mining Untuk Klasifikasi Dan Klasterisasi. Bandung: Informatika. Website https://www.slideshare.net/HendroGunawan8/data-mining-diskusi-1docx