SlideShare a Scribd company logo
1 of 22
Data Mining Pertemuan 3
1
Model Data Mining
KID Lab
2
Presenter : Arwansyah Advisor : Prof. Jen-Wei Huang
Outline
 Proses dan tahapan data mining.
 Karakteristik data
 Metode Data Mining
 Persiapan data
 Membuat dataset
Model Data Mining
 Prediction Methods / Predictive / Prediski
Menggunakan beberapa variabel untuk memprediksi sesuatu
atau suatu nilai yang akan datang.
 Description Methods / Deskriptif
Mendapatkan pola penafsiran (human- interpretable patterns)
untuk menjelaskan data.
3
4
Proses dan Tahapan Data Mining
5
Himpunan Data (Dataset)
 Atribut adalah faktor atau parameter yang menyebabkan
class/label/target terjadi
 Jenis dataset ada dua: Private dan Public
 Private Dataset: data set dapat diambil dari organisasi yang kita
jadikan obyek penelitian : Bank, Rumah Sakit, Industri, Pabrik,
Perusahaan Jasa, etc
 Public Dataset : data set dapat diambil dari repositori pubik
yang disepakati oleh para peneliti data mining. UCI Repository
(http://www.ics.uci.edu/~mlearn/MLRepository.html) ACM
KDD Cup (http://www.sigkdd.org/kddcup/)
Proses dan Tahapan Data Mining(Lanj..)
6
Proses dan Tahapan Data Mining(Lanj..)
7
Proses dan Tahapan Data Mining(Lanj..)
Karakteristik Data 8
Jenis atribut atau nilai dari kolom ada beberapa, diantaranya adalah
 Nominal yang merupakan kategori class yang tidak memiliki
perbedaan nilai atau rangking. Contoh pekerjaan (Dosen, PNS).
 Binary merupakan atribut yang tidak memiliki perbedaan dan
hanya memiliki 2 states, contohnya seperti jenis kelamin
(perempuan, laki-laki).
 Ordinal merupakan kategori class yang memiliki nilai rangking,
contohnya seperti jabatan, jenjang pendidikan, dll.
 Numeric merupakan kuantitas yang memiliki ukuran nilai yang
memiliki jarak yang jelas, contohnya adalah umur. Numeric ini
memiliki 2 jenis, yaitu rasio dan interval.
9
Karakteristik Data(Lanj..)
Dalam data mining terdapat karakteristik penting dari dataset yaitu:
 Dimensionality adalah karakteristik dataset yang mengolah data
multidimensional sehingga menyebabkan data yang
diolahmemiliki dimensi yang besar dan usaha yang dilakukan
juga semakin besar.
 Sparsity merupakan terjadinya titik jarang atau kekosongan
dalam data. Hal ini dapat terjadi pada data multidimensional.
 Resolution merupakan skala pada data dan resolusi yang
berbeda.
 Distribution merupakan sifat penyebaran data dan sejauh mana
renggang atau jarak dari data tersebut.
Metode Data Mining 10
 Classification/Klasifikasi adalah sebuah proses menemukan
definisi kesamaan karakteristik dalam suatu kelompok atau kelas
(class). Klasifikasi data mining menjadi salah satu metode yang
paling umum untuk digunakan. Metode ini dilakukan bertujuan
untuk memperkirakan kelas dari suatu objek yang labelnya
belum diketahui. (Decision Tree (CART, ID3, C4.5, Credal DT,
Credal C4.5, DynamicCC4.5), Naive Bayes, K-Nearest
Neighbor, Linear Discriminant Analysis, Logistic Regression.)
11
Metode Data Mining(Lanj..)
12
 Association adalah Metode data mining yang kedua adalah
Market basket analysis (analisa keranjang pasar) atau
association. Berhubungan dengan pemasaran, metode ini
bertujuan untuk mengidentifikasi produk yang sering dibeli
bersamaan oleh pelanggan. (FP-Growth, A Priori, Coefficient of
Correlation, Chi Square, etc)
Metode Data Mining(Lanj..)
13
14
Metode Data Mining(Lanj..)
 Clustering data mining adalah nama lain untuk metode
segmentation. Tujuan dari segmentasi pada metode data mining
adalah mengelompokkan suatu class ke dalam beberapa segmen
berdasarkan atribut yang ditentukan. Penentuan atribut harus
sesuai kesamaan yang dimiliki beberapa class tadi. (K-Means,
K-Medoids, Self-Organizing Map (SOM), Fuzzy C-Means)
7
15
Metode Data Mining(Lanj..)
7
16
Metode Data Mining(Lanj..)
 Regression Metode keempat dari data mining adalah regression.
Metode yang satu ini sedikit mirip dengan klasifikasi data
mining. Bedanya, regresi merupakan metode yang bertujuan
untuk mencari pola nilai numerik, bukan kelas. Hasil dari
metode regression adalah sebuah fungsi sebagai penentu hasil
yang didasarkan nilai dari input (Linear Regression, Neural
Network)
17
Metode Data Mining(Lanj..)
7
18
Metode Data Mining(Lanj..)
 Forecasting data mining adalah metode yang digunakan untuk
memprediksi nilai yang akan dicapai pada satu periode. Dengan
menggunakan teknik ini, noise data dan nilai pada periode
sebelumnya dijadikan dasar bahan prediksi.
 Sequence adalah sebuah urutan peristiwa. Tidak jauh dari
namanya, metode sequence analysis berfungsi untuk mencari
sebuah pola pada serangkaian kejadian atau sequence. Contoh
sederhananya dalam kehidupan sehari-hari adalah ketika makan.
Rangkaian yang umum dilakukan adalah mengambil piring,
sendok dan garpu, kemudian baru mengambil lauk pauk. Pola
seperti itu lah yang berusaha dicari tahu melalui sequencing.
19
Metode Data Mining(Lanj..)
20
Persiapan data & Membuat Data Set
21
Site Penyedia Datasets
 https://data.go.id/dataset
 https://www.kaggle.com/datasets?tags=12107-
Computer+Science
 https://data.jakarta.go.id/dataset
22

More Related Content

Similar to Pertemuan 3 Model Data Mining.pptx

APPLIED DATABASE III - Slide Arsitektur Data Mining
APPLIED DATABASE III - Slide Arsitektur Data MiningAPPLIED DATABASE III - Slide Arsitektur Data Mining
APPLIED DATABASE III - Slide Arsitektur Data MiningDEDE IRYAWAN
 
DM-01-Pengantar-Perkuliahan-Data-mining.pdf
DM-01-Pengantar-Perkuliahan-Data-mining.pdfDM-01-Pengantar-Perkuliahan-Data-mining.pdf
DM-01-Pengantar-Perkuliahan-Data-mining.pdfRinnaRachmatika2
 
data mining
data miningdata mining
data miningdewi2093
 
Procceding_KNIT_2_97-102_AndikaDwiHadiri
Procceding_KNIT_2_97-102_AndikaDwiHadiriProcceding_KNIT_2_97-102_AndikaDwiHadiri
Procceding_KNIT_2_97-102_AndikaDwiHadiriAndika Dwi Hadiri
 
Data Mining Diskusi 3.pdf
Data Mining Diskusi 3.pdfData Mining Diskusi 3.pdf
Data Mining Diskusi 3.pdfHendroGunawan8
 
ppt TEKNIK ANALISIS DATA.pptx
ppt TEKNIK ANALISIS DATA.pptxppt TEKNIK ANALISIS DATA.pptx
ppt TEKNIK ANALISIS DATA.pptxBujangBaturusa
 
DATA MINING : ESTIMASI, PREDIKSI, KLASIFIKASI, KLASTERING, DAN ASOSIASI.ppt
DATA MINING : ESTIMASI, PREDIKSI, KLASIFIKASI, KLASTERING, DAN ASOSIASI.pptDATA MINING : ESTIMASI, PREDIKSI, KLASIFIKASI, KLASTERING, DAN ASOSIASI.ppt
DATA MINING : ESTIMASI, PREDIKSI, KLASIFIKASI, KLASTERING, DAN ASOSIASI.pptmuhammadarsyad77
 
TUGAS 1 KEL 4 SISTEM LOGISTIK.pptx
TUGAS 1 KEL 4 SISTEM LOGISTIK.pptxTUGAS 1 KEL 4 SISTEM LOGISTIK.pptx
TUGAS 1 KEL 4 SISTEM LOGISTIK.pptxSangrian1
 
Pertemuan 10 - Metodologi Data Science - Copy.pptx
Pertemuan 10 - Metodologi Data Science - Copy.pptxPertemuan 10 - Metodologi Data Science - Copy.pptx
Pertemuan 10 - Metodologi Data Science - Copy.pptxFennyRahmayani
 
Materi Kuliah Data Mining full
Materi Kuliah Data Mining fullMateri Kuliah Data Mining full
Materi Kuliah Data Mining fullMunajat ( Munjob )
 
ppt metopen kel 09.pptx
ppt metopen kel 09.pptxppt metopen kel 09.pptx
ppt metopen kel 09.pptxRahmaNatasyah
 
Data Mining Diskusi 2.pdf
Data Mining Diskusi 2.pdfData Mining Diskusi 2.pdf
Data Mining Diskusi 2.pdfHendroGunawan8
 
10 feature engineering-univ-gunadarma
10 feature engineering-univ-gunadarma10 feature engineering-univ-gunadarma
10 feature engineering-univ-gunadarmaArdianDwiPraba
 

Similar to Pertemuan 3 Model Data Mining.pptx (20)

APPLIED DATABASE III - Slide Arsitektur Data Mining
APPLIED DATABASE III - Slide Arsitektur Data MiningAPPLIED DATABASE III - Slide Arsitektur Data Mining
APPLIED DATABASE III - Slide Arsitektur Data Mining
 
DM-01-Pengantar-Perkuliahan-Data-mining.pdf
DM-01-Pengantar-Perkuliahan-Data-mining.pdfDM-01-Pengantar-Perkuliahan-Data-mining.pdf
DM-01-Pengantar-Perkuliahan-Data-mining.pdf
 
Arsitektur dan model data mining
Arsitektur dan model data miningArsitektur dan model data mining
Arsitektur dan model data mining
 
data mining
data miningdata mining
data mining
 
fuzzyShp
fuzzyShpfuzzyShp
fuzzyShp
 
Procceding_KNIT_2_97-102_AndikaDwiHadiri
Procceding_KNIT_2_97-102_AndikaDwiHadiriProcceding_KNIT_2_97-102_AndikaDwiHadiri
Procceding_KNIT_2_97-102_AndikaDwiHadiri
 
Data Mining Diskusi 3.pdf
Data Mining Diskusi 3.pdfData Mining Diskusi 3.pdf
Data Mining Diskusi 3.pdf
 
BAB_5_Data_Mining.ppt
BAB_5_Data_Mining.pptBAB_5_Data_Mining.ppt
BAB_5_Data_Mining.ppt
 
Data mining
Data miningData mining
Data mining
 
ppt TEKNIK ANALISIS DATA.pptx
ppt TEKNIK ANALISIS DATA.pptxppt TEKNIK ANALISIS DATA.pptx
ppt TEKNIK ANALISIS DATA.pptx
 
DATA MINING : ESTIMASI, PREDIKSI, KLASIFIKASI, KLASTERING, DAN ASOSIASI.ppt
DATA MINING : ESTIMASI, PREDIKSI, KLASIFIKASI, KLASTERING, DAN ASOSIASI.pptDATA MINING : ESTIMASI, PREDIKSI, KLASIFIKASI, KLASTERING, DAN ASOSIASI.ppt
DATA MINING : ESTIMASI, PREDIKSI, KLASIFIKASI, KLASTERING, DAN ASOSIASI.ppt
 
Konsep dan teknologi data mining
Konsep dan teknologi data miningKonsep dan teknologi data mining
Konsep dan teknologi data mining
 
TUGAS 1 KEL 4 SISTEM LOGISTIK.pptx
TUGAS 1 KEL 4 SISTEM LOGISTIK.pptxTUGAS 1 KEL 4 SISTEM LOGISTIK.pptx
TUGAS 1 KEL 4 SISTEM LOGISTIK.pptx
 
15749 5 pengelompokkan data mining
15749 5 pengelompokkan data mining15749 5 pengelompokkan data mining
15749 5 pengelompokkan data mining
 
Pertemuan 10 - Metodologi Data Science - Copy.pptx
Pertemuan 10 - Metodologi Data Science - Copy.pptxPertemuan 10 - Metodologi Data Science - Copy.pptx
Pertemuan 10 - Metodologi Data Science - Copy.pptx
 
Materi Kuliah Data Mining full
Materi Kuliah Data Mining fullMateri Kuliah Data Mining full
Materi Kuliah Data Mining full
 
ppt metopen kel 09.pptx
ppt metopen kel 09.pptxppt metopen kel 09.pptx
ppt metopen kel 09.pptx
 
Data Mining Diskusi 2.pdf
Data Mining Diskusi 2.pdfData Mining Diskusi 2.pdf
Data Mining Diskusi 2.pdf
 
Tugas 1 dm1
Tugas 1 dm1Tugas 1 dm1
Tugas 1 dm1
 
10 feature engineering-univ-gunadarma
10 feature engineering-univ-gunadarma10 feature engineering-univ-gunadarma
10 feature engineering-univ-gunadarma
 

Recently uploaded

PERTEMUAN 4 himpunan dan fungsi logika fuzzy.ppT
PERTEMUAN 4 himpunan dan fungsi logika fuzzy.ppTPERTEMUAN 4 himpunan dan fungsi logika fuzzy.ppT
PERTEMUAN 4 himpunan dan fungsi logika fuzzy.ppTYudaPerwira5
 
PPT SIDANG UJIAN KOMPREHENSIF KUALITATIF
PPT SIDANG UJIAN KOMPREHENSIF KUALITATIFPPT SIDANG UJIAN KOMPREHENSIF KUALITATIF
PPT SIDANG UJIAN KOMPREHENSIF KUALITATIFFPMJ604FIKRIRIANDRA
 
KISI KISI PSAJ IPS KLS IX 2324.docskskkks
KISI KISI PSAJ IPS KLS IX 2324.docskskkksKISI KISI PSAJ IPS KLS IX 2324.docskskkks
KISI KISI PSAJ IPS KLS IX 2324.docskskkksdanzztzy405
 
KISI-KISI USEK PJOK TA 2023-2024 anans ajaja jaja hdsh
KISI-KISI USEK PJOK TA 2023-2024 anans ajaja jaja hdshKISI-KISI USEK PJOK TA 2023-2024 anans ajaja jaja hdsh
KISI-KISI USEK PJOK TA 2023-2024 anans ajaja jaja hdshDosenBernard
 
514034136-Tugas-Modul-4-5-Komputer-Dan-Media-Pembelajaran.pptx
514034136-Tugas-Modul-4-5-Komputer-Dan-Media-Pembelajaran.pptx514034136-Tugas-Modul-4-5-Komputer-Dan-Media-Pembelajaran.pptx
514034136-Tugas-Modul-4-5-Komputer-Dan-Media-Pembelajaran.pptxAbidinMaulana
 
Salinan PPT TATA BAHASA Bahasa Indonesia
Salinan PPT TATA BAHASA Bahasa IndonesiaSalinan PPT TATA BAHASA Bahasa Indonesia
Salinan PPT TATA BAHASA Bahasa Indonesiasdn4mangkujayan
 
Sistem operasi adalah program yang bertindak sebagai perantara antara user de...
Sistem operasi adalah program yang bertindak sebagai perantara antara user de...Sistem operasi adalah program yang bertindak sebagai perantara antara user de...
Sistem operasi adalah program yang bertindak sebagai perantara antara user de...Shary Armonitha
 
SIMPUS SIMPUS SIMPUS & E- PUSKESMAS (3).ppt
SIMPUS SIMPUS SIMPUS & E- PUSKESMAS (3).pptSIMPUS SIMPUS SIMPUS & E- PUSKESMAS (3).ppt
SIMPUS SIMPUS SIMPUS & E- PUSKESMAS (3).pptEndangNingsih7
 
Alur Pengajuan Surat Keterangan Pindah (Individu) lewat IKD.pdf
Alur Pengajuan Surat Keterangan Pindah (Individu) lewat IKD.pdfAlur Pengajuan Surat Keterangan Pindah (Individu) lewat IKD.pdf
Alur Pengajuan Surat Keterangan Pindah (Individu) lewat IKD.pdfPemdes Wonoyoso
 
Materi Pajak Untuk BOS tahun 2024 untuk madrasah MI,MTS, dan MA
Materi Pajak Untuk BOS tahun 2024 untuk madrasah MI,MTS, dan MAMateri Pajak Untuk BOS tahun 2024 untuk madrasah MI,MTS, dan MA
Materi Pajak Untuk BOS tahun 2024 untuk madrasah MI,MTS, dan MAmasqiqu340
 
Perlindungan Anak Dalam Hukum Perdata (2).pdf
Perlindungan Anak Dalam Hukum Perdata (2).pdfPerlindungan Anak Dalam Hukum Perdata (2).pdf
Perlindungan Anak Dalam Hukum Perdata (2).pdfjeffrisovana999
 
KONSEP DASAR ADVOKASI GIZI KEBIJAKAN PEMERINTAHAN
KONSEP DASAR ADVOKASI GIZI KEBIJAKAN PEMERINTAHANKONSEP DASAR ADVOKASI GIZI KEBIJAKAN PEMERINTAHAN
KONSEP DASAR ADVOKASI GIZI KEBIJAKAN PEMERINTAHANDevonneDillaElFachri
 
Contoh Algoritma Asosiasi pada data mining
Contoh Algoritma Asosiasi pada data miningContoh Algoritma Asosiasi pada data mining
Contoh Algoritma Asosiasi pada data miningSamFChaerul
 

Recently uploaded (15)

PERTEMUAN 4 himpunan dan fungsi logika fuzzy.ppT
PERTEMUAN 4 himpunan dan fungsi logika fuzzy.ppTPERTEMUAN 4 himpunan dan fungsi logika fuzzy.ppT
PERTEMUAN 4 himpunan dan fungsi logika fuzzy.ppT
 
PPT SIDANG UJIAN KOMPREHENSIF KUALITATIF
PPT SIDANG UJIAN KOMPREHENSIF KUALITATIFPPT SIDANG UJIAN KOMPREHENSIF KUALITATIF
PPT SIDANG UJIAN KOMPREHENSIF KUALITATIF
 
KISI KISI PSAJ IPS KLS IX 2324.docskskkks
KISI KISI PSAJ IPS KLS IX 2324.docskskkksKISI KISI PSAJ IPS KLS IX 2324.docskskkks
KISI KISI PSAJ IPS KLS IX 2324.docskskkks
 
KISI-KISI USEK PJOK TA 2023-2024 anans ajaja jaja hdsh
KISI-KISI USEK PJOK TA 2023-2024 anans ajaja jaja hdshKISI-KISI USEK PJOK TA 2023-2024 anans ajaja jaja hdsh
KISI-KISI USEK PJOK TA 2023-2024 anans ajaja jaja hdsh
 
514034136-Tugas-Modul-4-5-Komputer-Dan-Media-Pembelajaran.pptx
514034136-Tugas-Modul-4-5-Komputer-Dan-Media-Pembelajaran.pptx514034136-Tugas-Modul-4-5-Komputer-Dan-Media-Pembelajaran.pptx
514034136-Tugas-Modul-4-5-Komputer-Dan-Media-Pembelajaran.pptx
 
Salinan PPT TATA BAHASA Bahasa Indonesia
Salinan PPT TATA BAHASA Bahasa IndonesiaSalinan PPT TATA BAHASA Bahasa Indonesia
Salinan PPT TATA BAHASA Bahasa Indonesia
 
Abortion pills in Jeddah+966543202731/ buy cytotec
Abortion pills in Jeddah+966543202731/ buy cytotecAbortion pills in Jeddah+966543202731/ buy cytotec
Abortion pills in Jeddah+966543202731/ buy cytotec
 
Abortion pills in Kuwait salmiyah [+966572737505 ] Get Cytotec in Kuwait city...
Abortion pills in Kuwait salmiyah [+966572737505 ] Get Cytotec in Kuwait city...Abortion pills in Kuwait salmiyah [+966572737505 ] Get Cytotec in Kuwait city...
Abortion pills in Kuwait salmiyah [+966572737505 ] Get Cytotec in Kuwait city...
 
Sistem operasi adalah program yang bertindak sebagai perantara antara user de...
Sistem operasi adalah program yang bertindak sebagai perantara antara user de...Sistem operasi adalah program yang bertindak sebagai perantara antara user de...
Sistem operasi adalah program yang bertindak sebagai perantara antara user de...
 
SIMPUS SIMPUS SIMPUS & E- PUSKESMAS (3).ppt
SIMPUS SIMPUS SIMPUS & E- PUSKESMAS (3).pptSIMPUS SIMPUS SIMPUS & E- PUSKESMAS (3).ppt
SIMPUS SIMPUS SIMPUS & E- PUSKESMAS (3).ppt
 
Alur Pengajuan Surat Keterangan Pindah (Individu) lewat IKD.pdf
Alur Pengajuan Surat Keterangan Pindah (Individu) lewat IKD.pdfAlur Pengajuan Surat Keterangan Pindah (Individu) lewat IKD.pdf
Alur Pengajuan Surat Keterangan Pindah (Individu) lewat IKD.pdf
 
Materi Pajak Untuk BOS tahun 2024 untuk madrasah MI,MTS, dan MA
Materi Pajak Untuk BOS tahun 2024 untuk madrasah MI,MTS, dan MAMateri Pajak Untuk BOS tahun 2024 untuk madrasah MI,MTS, dan MA
Materi Pajak Untuk BOS tahun 2024 untuk madrasah MI,MTS, dan MA
 
Perlindungan Anak Dalam Hukum Perdata (2).pdf
Perlindungan Anak Dalam Hukum Perdata (2).pdfPerlindungan Anak Dalam Hukum Perdata (2).pdf
Perlindungan Anak Dalam Hukum Perdata (2).pdf
 
KONSEP DASAR ADVOKASI GIZI KEBIJAKAN PEMERINTAHAN
KONSEP DASAR ADVOKASI GIZI KEBIJAKAN PEMERINTAHANKONSEP DASAR ADVOKASI GIZI KEBIJAKAN PEMERINTAHAN
KONSEP DASAR ADVOKASI GIZI KEBIJAKAN PEMERINTAHAN
 
Contoh Algoritma Asosiasi pada data mining
Contoh Algoritma Asosiasi pada data miningContoh Algoritma Asosiasi pada data mining
Contoh Algoritma Asosiasi pada data mining
 

Pertemuan 3 Model Data Mining.pptx

  • 1. Data Mining Pertemuan 3 1 Model Data Mining
  • 2. KID Lab 2 Presenter : Arwansyah Advisor : Prof. Jen-Wei Huang Outline  Proses dan tahapan data mining.  Karakteristik data  Metode Data Mining  Persiapan data  Membuat dataset
  • 3. Model Data Mining  Prediction Methods / Predictive / Prediski Menggunakan beberapa variabel untuk memprediksi sesuatu atau suatu nilai yang akan datang.  Description Methods / Deskriptif Mendapatkan pola penafsiran (human- interpretable patterns) untuk menjelaskan data. 3
  • 4. 4 Proses dan Tahapan Data Mining
  • 5. 5 Himpunan Data (Dataset)  Atribut adalah faktor atau parameter yang menyebabkan class/label/target terjadi  Jenis dataset ada dua: Private dan Public  Private Dataset: data set dapat diambil dari organisasi yang kita jadikan obyek penelitian : Bank, Rumah Sakit, Industri, Pabrik, Perusahaan Jasa, etc  Public Dataset : data set dapat diambil dari repositori pubik yang disepakati oleh para peneliti data mining. UCI Repository (http://www.ics.uci.edu/~mlearn/MLRepository.html) ACM KDD Cup (http://www.sigkdd.org/kddcup/) Proses dan Tahapan Data Mining(Lanj..)
  • 6. 6 Proses dan Tahapan Data Mining(Lanj..)
  • 7. 7 Proses dan Tahapan Data Mining(Lanj..)
  • 8. Karakteristik Data 8 Jenis atribut atau nilai dari kolom ada beberapa, diantaranya adalah  Nominal yang merupakan kategori class yang tidak memiliki perbedaan nilai atau rangking. Contoh pekerjaan (Dosen, PNS).  Binary merupakan atribut yang tidak memiliki perbedaan dan hanya memiliki 2 states, contohnya seperti jenis kelamin (perempuan, laki-laki).  Ordinal merupakan kategori class yang memiliki nilai rangking, contohnya seperti jabatan, jenjang pendidikan, dll.  Numeric merupakan kuantitas yang memiliki ukuran nilai yang memiliki jarak yang jelas, contohnya adalah umur. Numeric ini memiliki 2 jenis, yaitu rasio dan interval.
  • 9. 9 Karakteristik Data(Lanj..) Dalam data mining terdapat karakteristik penting dari dataset yaitu:  Dimensionality adalah karakteristik dataset yang mengolah data multidimensional sehingga menyebabkan data yang diolahmemiliki dimensi yang besar dan usaha yang dilakukan juga semakin besar.  Sparsity merupakan terjadinya titik jarang atau kekosongan dalam data. Hal ini dapat terjadi pada data multidimensional.  Resolution merupakan skala pada data dan resolusi yang berbeda.  Distribution merupakan sifat penyebaran data dan sejauh mana renggang atau jarak dari data tersebut.
  • 10. Metode Data Mining 10  Classification/Klasifikasi adalah sebuah proses menemukan definisi kesamaan karakteristik dalam suatu kelompok atau kelas (class). Klasifikasi data mining menjadi salah satu metode yang paling umum untuk digunakan. Metode ini dilakukan bertujuan untuk memperkirakan kelas dari suatu objek yang labelnya belum diketahui. (Decision Tree (CART, ID3, C4.5, Credal DT, Credal C4.5, DynamicCC4.5), Naive Bayes, K-Nearest Neighbor, Linear Discriminant Analysis, Logistic Regression.)
  • 12. 12  Association adalah Metode data mining yang kedua adalah Market basket analysis (analisa keranjang pasar) atau association. Berhubungan dengan pemasaran, metode ini bertujuan untuk mengidentifikasi produk yang sering dibeli bersamaan oleh pelanggan. (FP-Growth, A Priori, Coefficient of Correlation, Chi Square, etc) Metode Data Mining(Lanj..)
  • 13. 13
  • 14. 14 Metode Data Mining(Lanj..)  Clustering data mining adalah nama lain untuk metode segmentation. Tujuan dari segmentasi pada metode data mining adalah mengelompokkan suatu class ke dalam beberapa segmen berdasarkan atribut yang ditentukan. Penentuan atribut harus sesuai kesamaan yang dimiliki beberapa class tadi. (K-Means, K-Medoids, Self-Organizing Map (SOM), Fuzzy C-Means)
  • 16. 7 16 Metode Data Mining(Lanj..)  Regression Metode keempat dari data mining adalah regression. Metode yang satu ini sedikit mirip dengan klasifikasi data mining. Bedanya, regresi merupakan metode yang bertujuan untuk mencari pola nilai numerik, bukan kelas. Hasil dari metode regression adalah sebuah fungsi sebagai penentu hasil yang didasarkan nilai dari input (Linear Regression, Neural Network)
  • 18. 7 18 Metode Data Mining(Lanj..)  Forecasting data mining adalah metode yang digunakan untuk memprediksi nilai yang akan dicapai pada satu periode. Dengan menggunakan teknik ini, noise data dan nilai pada periode sebelumnya dijadikan dasar bahan prediksi.  Sequence adalah sebuah urutan peristiwa. Tidak jauh dari namanya, metode sequence analysis berfungsi untuk mencari sebuah pola pada serangkaian kejadian atau sequence. Contoh sederhananya dalam kehidupan sehari-hari adalah ketika makan. Rangkaian yang umum dilakukan adalah mengambil piring, sendok dan garpu, kemudian baru mengambil lauk pauk. Pola seperti itu lah yang berusaha dicari tahu melalui sequencing.
  • 20. 20 Persiapan data & Membuat Data Set
  • 21. 21 Site Penyedia Datasets  https://data.go.id/dataset  https://www.kaggle.com/datasets?tags=12107- Computer+Science  https://data.jakarta.go.id/dataset
  • 22. 22