SlideShare a Scribd company logo
1 of 14
Download to read offline
KonsepData Mining 
Pendahuluan 
Bertalya 
UniversitasGunadarma 
2009
LatarBelakang 
•Data ygdikumpulkansemakin 
bertambahbanyak 
–Data web, e-commerce 
–Data pembelianditoko2 / supermarket 
–TransaksiBank/KartuKredit 
–Detail panggilantelepon 
–Statistikpemerintahan 
–Rekammedis 
–Database molekul 
–Citra astronomis 
Pendahuluan 2
LatarBelakang(lanj.) 
•Komputersekarangmurahdanpowefull 
•Tekanankompetisisemakinkuat 
–Menyediakanlayananyglbhbaik& customized(misdalamCustomer Relationship Management) 
•Teknikpenyimpanandata semakintinggidengankecepatantinggi(GB/jam) 
•Prosesekstraksiinformasididalamkumpulandata ygbesarmenjaditantangan 
•Pendekatananalisisdata tradisionaltidakdapatdigunakanutkmengekstrakdata dlmjumlahbesar 
•Data mining merupakanteknikygmenggabungkanteknikanalisisdata tradisionaldenganalgoritmaygsophisticatedutkpemrosesandata dlmjumlahbesar 
Pendahuluan 3
LatarBelakang(lanj.) 
•Informasiygdibutuhkanmisalnya: 
–Kebutuhandaripelanggan(data layanantelepon) 
–target respondenuntukpromosiproduk 
–Jenisprodukygpaling banyakterjual 
–Historistransaksidariseorangpelanggan 
–Pelangganyang paling loyal 
–Mengetahuiperilakugen2 dalamberbagaisituasi 
–Mengetahuiawaldanakhirmusimpadasuatuarea 
Informasi yang dibutuhkan seperti di atas dapat 
diekstrak dengan data mining 
Pendahuluan 4
DefinisiData Mining 
•Mengekstrakatau“mining”pengetahuandarikumpulandata ygsangatbesar 
•Ekstraksiinformasiygbergunadaridata, dimanasebelumnyatidakdiharapkan, tidakdikenal& implisit 
•Eksplorasi& analisis, secaraotomatisatausemi- otomatisdarisekumpulandata ygsangatbesaruntukmemperolehpola2 data ygberarti 
•Prosesanalisisdatabase ygbesarsecarasemi-otomatisutkmenemukanpolayang valid, baru, bergunadandapatdipahamimanusia 
Pendahuluan 5
AsalData Mining 
•Berasaldarimachine learning/AI, pattern recognition, statistics, & database systems•Tekniktradisionaltidaksesuaidisebabkankarena–Data ygsangat2 besar–Data dengandimensiygbesar–Data ygtersebar& heterogenMachine Learning/ Pattern RecognitionStatistics/ AIData MiningDatabase systems 
Pendahuluan 6
Ilmuyang BerkaitanDenganData Mining 
•Statistik 
Merupakandasarteoritetapihasilnyasulitdiinterpretasisertabutuhbantuandaripemakaiutkmelakukananalisisdata. 
•Machine Learning 
Merupakanprosespembelajaransecaraotomatis& pem- belajaraninisetaradgnkonstruksiaturan2 berbasispadakeadaan& transisidarilingkungansekitar. 
•SistemDatabase 
Data dikumpulkandandisimpandalamdatabase. 
Pendahuluan 7
TantanganData Mining 
•Skalabilitas, dikrnkanpenyimpanandata menggunakanukuranbesar(gigabyte, terabyte dst) makapadaprosesdata mining, kumpulandata harusdiskala 
•Dimensionalitasygtinggi, dimanadata ygdisimpanmemilikiatributdlmjumlahbesar, Sepertidata pengukuransuhudibeberapalokasiygmemilikikomponenwaktu& spasial 
•Data ygheterogen& kompleks, dimanadata mempunyaiatributygheterogen, cthkumpulanhalweb ygterdiriatasteksygsemi terstruktur& banyakterdapatlink. Teknikdata mining harusmempunyaiteknikotokorelasispasial& waktu, graph connectivity& keterhubunganparent-child antaraelementekssemi terstruktur& dokumenXML 
Pendahuluan 8
TantanganData Mining (lanj.) 
•Pendistribusian& kepemilikandata, dimanadata tersimpandilebihdarisatulokasi& dimilikilebihdarisatuorganisasi. Untukituteknikdata mining harusdapatal : (1)berkonsolidasi terhadaphasildata mining ygberasaldarisumberberbeda, (2) mengurangijumlahkomunikasiutkkomputasiygtersebar 
•Analisisygnon-tradisional, membutuhkanteknikevaluasi& penurunanribuanhipotesis 
Pendahuluan 9
Data mining merupakanbagiandariprosesKnowledge Discovery in Databases(KDD) –Prosestransformasidata mentahmenjadiinformasiberguna. 
Pendahuluan 10
Tahap2 padaKDD 
•Selection, penyeleksianatausegmentasidata berdasarkankriteriattt. 
•Preprocessing, tahappembersihandimanainfo. tidakbergunadibuang. Selainitudata dikonfigurasiulangutkmenjaminformat tetapkonsisten. 
•Transformation, prosestransformasisehinggadata dapatdigunakandanditelusuri. Pemetaan data 
kompleks 
•Data mining, prosesekstraksipoladaridata ygada. 
•Interpretation & evaluation, prosesinterpretasipolamenjadipengetahuanygdapatdigunakanutkmen- dukungpengambilankeputusan(cthprediksi& klasifikasi, ringkasankontendatabase sertapenjelasanfenomenaygdiamati. 
Pendahuluan 11
TugasData Mining 
•MetodePrediksi 
Menggunakanbeberapaatribututkmemprediksinilaidariatributygakandatang. Atributygakandiprediksidisbttargetataudependent variable. Atributygdigunakan disbt 
explanatoryatauindependent variable. 
2 tipe: 
-classification, digunakanuntukvariabeltarget diskrit 
-regression, digunakanuntukvariabeltarget kontinu 
•MetodeDeskripsi 
Menemukanpola2 (ygmenggambarkandata) ygdapatdiinterpretasikanmanusia 
•Clustering 
•Association Rule Discovery 
•Sequential Pattern Discovery 
Pendahuluan 12
AplikasiData Mining 
•Pemasaran/ Penyewaan 
–Identifikasipolapembayaranpelanggan 
–Menemukanasosiasidiantarakarakteristikdemografikpelanggan 
–Analisiskeranjangpemasaran 
•Perbankan 
–Mendeteksipolapenyalahgunaankartukredit 
–Identifikasipelangganygloyal 
–Mendeteksikartukreditygdihabiskanolehkelompokpelanggan 
•Asuransi& PelayananKesehatan 
–Analisisdariklaim 
–Memprediksipelangganygakanmembelipolis baru 
–Identifikasipolaperilakupelangganygberbahaya 
•Transformasi 
–Menentukanjadualdistribusikeoutlet2 
Pendahuluan 13
AplikasiData Mining (lanj.) 
•Pengobatan 
–Identifikasiterapipengobatanygberhasilutkpenyakitberbeda 
–Mengkarakterisasikanperilakupasienutkmemprediksikunjungan 
–Menganalisissejarahpenyakitpasien, sertamenemukanhubunganantarapenyakit2 ygada 
•Duniailmuwan 
–Mendeteksigalaksibaru 
Pendahuluan 14

More Related Content

Similar to Pendahuluan kdm

Herwanto_Kuliah_Umum_Big_Data_Analysis.pptx
Herwanto_Kuliah_Umum_Big_Data_Analysis.pptxHerwanto_Kuliah_Umum_Big_Data_Analysis.pptx
Herwanto_Kuliah_Umum_Big_Data_Analysis.pptx
SuraClips
 
Emerging data base technologies and application
Emerging data base technologies and applicationEmerging data base technologies and application
Emerging data base technologies and application
Yunus Thariq
 
Data mining week 1 - pengantar data mining
Data mining   week 1 - pengantar data miningData mining   week 1 - pengantar data mining
Data mining week 1 - pengantar data mining
Lye Lazar
 

Similar to Pendahuluan kdm (20)

Pengantar_Data_Mining.ppt
Pengantar_Data_Mining.pptPengantar_Data_Mining.ppt
Pengantar_Data_Mining.ppt
 
Pengantar_Data_Mining.ppt
Pengantar_Data_Mining.pptPengantar_Data_Mining.ppt
Pengantar_Data_Mining.ppt
 
Pengantar_Data_Mining.ppt
Pengantar_Data_Mining.pptPengantar_Data_Mining.ppt
Pengantar_Data_Mining.ppt
 
pendahuluan dan proses kdd
pendahuluan dan proses kddpendahuluan dan proses kdd
pendahuluan dan proses kdd
 
Arsitektur dan model data mining
Arsitektur dan model data miningArsitektur dan model data mining
Arsitektur dan model data mining
 
BAB_5_Data_Mining.ppt
BAB_5_Data_Mining.pptBAB_5_Data_Mining.ppt
BAB_5_Data_Mining.ppt
 
Herwanto_Kuliah_Umum_Big_Data_Analysis.pptx
Herwanto_Kuliah_Umum_Big_Data_Analysis.pptxHerwanto_Kuliah_Umum_Big_Data_Analysis.pptx
Herwanto_Kuliah_Umum_Big_Data_Analysis.pptx
 
Pengantar Data Mining di Teknik Lingkungan
Pengantar Data Mining di Teknik LingkunganPengantar Data Mining di Teknik Lingkungan
Pengantar Data Mining di Teknik Lingkungan
 
Big Data - Python for Data Science (Bahas Indonesia)
Big Data - Python for Data Science (Bahas Indonesia)Big Data - Python for Data Science (Bahas Indonesia)
Big Data - Python for Data Science (Bahas Indonesia)
 
Kuliah_Umum_Big_Data_Analysis_TEKNIK INFORMATIKA.pptx
Kuliah_Umum_Big_Data_Analysis_TEKNIK INFORMATIKA.pptxKuliah_Umum_Big_Data_Analysis_TEKNIK INFORMATIKA.pptx
Kuliah_Umum_Big_Data_Analysis_TEKNIK INFORMATIKA.pptx
 
Data mining
Data miningData mining
Data mining
 
Tahapan Analisis Data Digital
Tahapan Analisis Data DigitalTahapan Analisis Data Digital
Tahapan Analisis Data Digital
 
DM-Pertemuan_01.pptx
DM-Pertemuan_01.pptxDM-Pertemuan_01.pptx
DM-Pertemuan_01.pptx
 
MIK4237-02.pdf
MIK4237-02.pdfMIK4237-02.pdf
MIK4237-02.pdf
 
Tugas 1 dm1
Tugas 1 dm1Tugas 1 dm1
Tugas 1 dm1
 
2. Pengantar Data Mining
2. Pengantar Data Mining2. Pengantar Data Mining
2. Pengantar Data Mining
 
Bab1.pptx
Bab1.pptxBab1.pptx
Bab1.pptx
 
Emerging data base technologies and application
Emerging data base technologies and applicationEmerging data base technologies and application
Emerging data base technologies and application
 
Business intelligence
Business intelligenceBusiness intelligence
Business intelligence
 
Data mining week 1 - pengantar data mining
Data mining   week 1 - pengantar data miningData mining   week 1 - pengantar data mining
Data mining week 1 - pengantar data mining
 

More from Universitas Bina Darma Palembang

More from Universitas Bina Darma Palembang (20)

30448 pertemuan1
30448 pertemuan130448 pertemuan1
30448 pertemuan1
 
29510 pertemuan18(form method-get-post-dan-session(1))
29510 pertemuan18(form method-get-post-dan-session(1))29510 pertemuan18(form method-get-post-dan-session(1))
29510 pertemuan18(form method-get-post-dan-session(1))
 
28501 pertemuan14(php)
28501 pertemuan14(php)28501 pertemuan14(php)
28501 pertemuan14(php)
 
28500 pertemuan22(header dokumen html dgn tag title)
28500 pertemuan22(header dokumen html dgn tag title)28500 pertemuan22(header dokumen html dgn tag title)
28500 pertemuan22(header dokumen html dgn tag title)
 
25437 pertemuan25(hitcounter)
25437 pertemuan25(hitcounter)25437 pertemuan25(hitcounter)
25437 pertemuan25(hitcounter)
 
23921 pertemuan 3
23921 pertemuan 323921 pertemuan 3
23921 pertemuan 3
 
19313 pertemuan6
19313 pertemuan619313 pertemuan6
19313 pertemuan6
 
18759 pertemuan20(web html editor)
18759 pertemuan20(web html editor)18759 pertemuan20(web html editor)
18759 pertemuan20(web html editor)
 
18040 pertemuan13(css)
18040 pertemuan13(css)18040 pertemuan13(css)
18040 pertemuan13(css)
 
17945 pertemuan5
17945 pertemuan517945 pertemuan5
17945 pertemuan5
 
16406 pertemuan17(konsep basis-data-di-web)
16406 pertemuan17(konsep basis-data-di-web)16406 pertemuan17(konsep basis-data-di-web)
16406 pertemuan17(konsep basis-data-di-web)
 
15294 pertemuan9(eksplorasi &defenisi masalah0
15294 pertemuan9(eksplorasi &defenisi masalah015294 pertemuan9(eksplorasi &defenisi masalah0
15294 pertemuan9(eksplorasi &defenisi masalah0
 
13926 pertemuan4
13926 pertemuan413926 pertemuan4
13926 pertemuan4
 
12738 pertemuan 15(php lanjutan)
12738 pertemuan 15(php lanjutan)12738 pertemuan 15(php lanjutan)
12738 pertemuan 15(php lanjutan)
 
6346 pertemuan21(web statis dengan struktur html)
6346 pertemuan21(web statis dengan struktur html)6346 pertemuan21(web statis dengan struktur html)
6346 pertemuan21(web statis dengan struktur html)
 
5623 pertemuan11(html1)
5623 pertemuan11(html1)5623 pertemuan11(html1)
5623 pertemuan11(html1)
 
4740 pertemuan8(komponen dalam web)
4740 pertemuan8(komponen dalam web)4740 pertemuan8(komponen dalam web)
4740 pertemuan8(komponen dalam web)
 
4075 pertemuan10 (analisa kebutuhan)
4075 pertemuan10 (analisa kebutuhan)4075 pertemuan10 (analisa kebutuhan)
4075 pertemuan10 (analisa kebutuhan)
 
2670 pertemuan12(html lanjut)
2670 pertemuan12(html lanjut)2670 pertemuan12(html lanjut)
2670 pertemuan12(html lanjut)
 
2190 pertemuan24(polling)
2190 pertemuan24(polling)2190 pertemuan24(polling)
2190 pertemuan24(polling)
 

Recently uploaded

Abortion pills in Kuwait salmiyah [+966572737505 ] Get Cytotec in Kuwait city...
Abortion pills in Kuwait salmiyah [+966572737505 ] Get Cytotec in Kuwait city...Abortion pills in Kuwait salmiyah [+966572737505 ] Get Cytotec in Kuwait city...
Abortion pills in Kuwait salmiyah [+966572737505 ] Get Cytotec in Kuwait city...
Abortion pills in Riyadh +966572737505 get cytotec
 
KISI-KISI USEK PJOK TA 2023-2024 anans ajaja jaja hdsh
KISI-KISI USEK PJOK TA 2023-2024 anans ajaja jaja hdshKISI-KISI USEK PJOK TA 2023-2024 anans ajaja jaja hdsh
KISI-KISI USEK PJOK TA 2023-2024 anans ajaja jaja hdsh
DosenBernard
 
Abortion pills in Jeddah+966543202731/ buy cytotec
Abortion pills in Jeddah+966543202731/ buy cytotecAbortion pills in Jeddah+966543202731/ buy cytotec
Abortion pills in Jeddah+966543202731/ buy cytotec
Abortion pills in Riyadh +966572737505 get cytotec
 
KISI KISI PSAJ IPS KLS IX 2324.docskskkks
KISI KISI PSAJ IPS KLS IX 2324.docskskkksKISI KISI PSAJ IPS KLS IX 2324.docskskkks
KISI KISI PSAJ IPS KLS IX 2324.docskskkks
danzztzy405
 
SIMPUS SIMPUS SIMPUS & E- PUSKESMAS (3).ppt
SIMPUS SIMPUS SIMPUS & E- PUSKESMAS (3).pptSIMPUS SIMPUS SIMPUS & E- PUSKESMAS (3).ppt
SIMPUS SIMPUS SIMPUS & E- PUSKESMAS (3).ppt
EndangNingsih7
 

Recently uploaded (17)

KONSEP DASAR ADVOKASI GIZI KEBIJAKAN PEMERINTAHAN
KONSEP DASAR ADVOKASI GIZI KEBIJAKAN PEMERINTAHANKONSEP DASAR ADVOKASI GIZI KEBIJAKAN PEMERINTAHAN
KONSEP DASAR ADVOKASI GIZI KEBIJAKAN PEMERINTAHAN
 
Sistem operasi adalah program yang bertindak sebagai perantara antara user de...
Sistem operasi adalah program yang bertindak sebagai perantara antara user de...Sistem operasi adalah program yang bertindak sebagai perantara antara user de...
Sistem operasi adalah program yang bertindak sebagai perantara antara user de...
 
Abortion pills in Kuwait salmiyah [+966572737505 ] Get Cytotec in Kuwait city...
Abortion pills in Kuwait salmiyah [+966572737505 ] Get Cytotec in Kuwait city...Abortion pills in Kuwait salmiyah [+966572737505 ] Get Cytotec in Kuwait city...
Abortion pills in Kuwait salmiyah [+966572737505 ] Get Cytotec in Kuwait city...
 
PPT SIDANG UJIAN KOMPREHENSIF KUALITATIF
PPT SIDANG UJIAN KOMPREHENSIF KUALITATIFPPT SIDANG UJIAN KOMPREHENSIF KUALITATIF
PPT SIDANG UJIAN KOMPREHENSIF KUALITATIF
 
Perlindungan Anak Dalam Hukum Perdata (2).pdf
Perlindungan Anak Dalam Hukum Perdata (2).pdfPerlindungan Anak Dalam Hukum Perdata (2).pdf
Perlindungan Anak Dalam Hukum Perdata (2).pdf
 
DATA MINING : ESTIMASI, PREDIKSI, KLASIFIKASI, KLASTERING, DAN ASOSIASI.ppt
DATA MINING : ESTIMASI, PREDIKSI, KLASIFIKASI, KLASTERING, DAN ASOSIASI.pptDATA MINING : ESTIMASI, PREDIKSI, KLASIFIKASI, KLASTERING, DAN ASOSIASI.ppt
DATA MINING : ESTIMASI, PREDIKSI, KLASIFIKASI, KLASTERING, DAN ASOSIASI.ppt
 
Salinan PPT TATA BAHASA Bahasa Indonesia
Salinan PPT TATA BAHASA Bahasa IndonesiaSalinan PPT TATA BAHASA Bahasa Indonesia
Salinan PPT TATA BAHASA Bahasa Indonesia
 
KISI-KISI USEK PJOK TA 2023-2024 anans ajaja jaja hdsh
KISI-KISI USEK PJOK TA 2023-2024 anans ajaja jaja hdshKISI-KISI USEK PJOK TA 2023-2024 anans ajaja jaja hdsh
KISI-KISI USEK PJOK TA 2023-2024 anans ajaja jaja hdsh
 
Abortion pills in Jeddah+966543202731/ buy cytotec
Abortion pills in Jeddah+966543202731/ buy cytotecAbortion pills in Jeddah+966543202731/ buy cytotec
Abortion pills in Jeddah+966543202731/ buy cytotec
 
DATA MINING : RSITEKTUR & MODEL DATA MINING
DATA MINING : RSITEKTUR & MODEL DATA MININGDATA MINING : RSITEKTUR & MODEL DATA MINING
DATA MINING : RSITEKTUR & MODEL DATA MINING
 
Contoh Algoritma Asosiasi pada data mining
Contoh Algoritma Asosiasi pada data miningContoh Algoritma Asosiasi pada data mining
Contoh Algoritma Asosiasi pada data mining
 
KISI KISI PSAJ IPS KLS IX 2324.docskskkks
KISI KISI PSAJ IPS KLS IX 2324.docskskkksKISI KISI PSAJ IPS KLS IX 2324.docskskkks
KISI KISI PSAJ IPS KLS IX 2324.docskskkks
 
SIMPUS SIMPUS SIMPUS & E- PUSKESMAS (3).ppt
SIMPUS SIMPUS SIMPUS & E- PUSKESMAS (3).pptSIMPUS SIMPUS SIMPUS & E- PUSKESMAS (3).ppt
SIMPUS SIMPUS SIMPUS & E- PUSKESMAS (3).ppt
 
PERTEMUAN 4 himpunan dan fungsi logika fuzzy.ppT
PERTEMUAN 4 himpunan dan fungsi logika fuzzy.ppTPERTEMUAN 4 himpunan dan fungsi logika fuzzy.ppT
PERTEMUAN 4 himpunan dan fungsi logika fuzzy.ppT
 
Alur Pengajuan Surat Keterangan Pindah (Individu) lewat IKD.pdf
Alur Pengajuan Surat Keterangan Pindah (Individu) lewat IKD.pdfAlur Pengajuan Surat Keterangan Pindah (Individu) lewat IKD.pdf
Alur Pengajuan Surat Keterangan Pindah (Individu) lewat IKD.pdf
 
Materi Pajak Untuk BOS tahun 2024 untuk madrasah MI,MTS, dan MA
Materi Pajak Untuk BOS tahun 2024 untuk madrasah MI,MTS, dan MAMateri Pajak Untuk BOS tahun 2024 untuk madrasah MI,MTS, dan MA
Materi Pajak Untuk BOS tahun 2024 untuk madrasah MI,MTS, dan MA
 
514034136-Tugas-Modul-4-5-Komputer-Dan-Media-Pembelajaran.pptx
514034136-Tugas-Modul-4-5-Komputer-Dan-Media-Pembelajaran.pptx514034136-Tugas-Modul-4-5-Komputer-Dan-Media-Pembelajaran.pptx
514034136-Tugas-Modul-4-5-Komputer-Dan-Media-Pembelajaran.pptx
 

Pendahuluan kdm

  • 1. KonsepData Mining Pendahuluan Bertalya UniversitasGunadarma 2009
  • 2. LatarBelakang •Data ygdikumpulkansemakin bertambahbanyak –Data web, e-commerce –Data pembelianditoko2 / supermarket –TransaksiBank/KartuKredit –Detail panggilantelepon –Statistikpemerintahan –Rekammedis –Database molekul –Citra astronomis Pendahuluan 2
  • 3. LatarBelakang(lanj.) •Komputersekarangmurahdanpowefull •Tekanankompetisisemakinkuat –Menyediakanlayananyglbhbaik& customized(misdalamCustomer Relationship Management) •Teknikpenyimpanandata semakintinggidengankecepatantinggi(GB/jam) •Prosesekstraksiinformasididalamkumpulandata ygbesarmenjaditantangan •Pendekatananalisisdata tradisionaltidakdapatdigunakanutkmengekstrakdata dlmjumlahbesar •Data mining merupakanteknikygmenggabungkanteknikanalisisdata tradisionaldenganalgoritmaygsophisticatedutkpemrosesandata dlmjumlahbesar Pendahuluan 3
  • 4. LatarBelakang(lanj.) •Informasiygdibutuhkanmisalnya: –Kebutuhandaripelanggan(data layanantelepon) –target respondenuntukpromosiproduk –Jenisprodukygpaling banyakterjual –Historistransaksidariseorangpelanggan –Pelangganyang paling loyal –Mengetahuiperilakugen2 dalamberbagaisituasi –Mengetahuiawaldanakhirmusimpadasuatuarea Informasi yang dibutuhkan seperti di atas dapat diekstrak dengan data mining Pendahuluan 4
  • 5. DefinisiData Mining •Mengekstrakatau“mining”pengetahuandarikumpulandata ygsangatbesar •Ekstraksiinformasiygbergunadaridata, dimanasebelumnyatidakdiharapkan, tidakdikenal& implisit •Eksplorasi& analisis, secaraotomatisatausemi- otomatisdarisekumpulandata ygsangatbesaruntukmemperolehpola2 data ygberarti •Prosesanalisisdatabase ygbesarsecarasemi-otomatisutkmenemukanpolayang valid, baru, bergunadandapatdipahamimanusia Pendahuluan 5
  • 6. AsalData Mining •Berasaldarimachine learning/AI, pattern recognition, statistics, & database systems•Tekniktradisionaltidaksesuaidisebabkankarena–Data ygsangat2 besar–Data dengandimensiygbesar–Data ygtersebar& heterogenMachine Learning/ Pattern RecognitionStatistics/ AIData MiningDatabase systems Pendahuluan 6
  • 7. Ilmuyang BerkaitanDenganData Mining •Statistik Merupakandasarteoritetapihasilnyasulitdiinterpretasisertabutuhbantuandaripemakaiutkmelakukananalisisdata. •Machine Learning Merupakanprosespembelajaransecaraotomatis& pem- belajaraninisetaradgnkonstruksiaturan2 berbasispadakeadaan& transisidarilingkungansekitar. •SistemDatabase Data dikumpulkandandisimpandalamdatabase. Pendahuluan 7
  • 8. TantanganData Mining •Skalabilitas, dikrnkanpenyimpanandata menggunakanukuranbesar(gigabyte, terabyte dst) makapadaprosesdata mining, kumpulandata harusdiskala •Dimensionalitasygtinggi, dimanadata ygdisimpanmemilikiatributdlmjumlahbesar, Sepertidata pengukuransuhudibeberapalokasiygmemilikikomponenwaktu& spasial •Data ygheterogen& kompleks, dimanadata mempunyaiatributygheterogen, cthkumpulanhalweb ygterdiriatasteksygsemi terstruktur& banyakterdapatlink. Teknikdata mining harusmempunyaiteknikotokorelasispasial& waktu, graph connectivity& keterhubunganparent-child antaraelementekssemi terstruktur& dokumenXML Pendahuluan 8
  • 9. TantanganData Mining (lanj.) •Pendistribusian& kepemilikandata, dimanadata tersimpandilebihdarisatulokasi& dimilikilebihdarisatuorganisasi. Untukituteknikdata mining harusdapatal : (1)berkonsolidasi terhadaphasildata mining ygberasaldarisumberberbeda, (2) mengurangijumlahkomunikasiutkkomputasiygtersebar •Analisisygnon-tradisional, membutuhkanteknikevaluasi& penurunanribuanhipotesis Pendahuluan 9
  • 10. Data mining merupakanbagiandariprosesKnowledge Discovery in Databases(KDD) –Prosestransformasidata mentahmenjadiinformasiberguna. Pendahuluan 10
  • 11. Tahap2 padaKDD •Selection, penyeleksianatausegmentasidata berdasarkankriteriattt. •Preprocessing, tahappembersihandimanainfo. tidakbergunadibuang. Selainitudata dikonfigurasiulangutkmenjaminformat tetapkonsisten. •Transformation, prosestransformasisehinggadata dapatdigunakandanditelusuri. Pemetaan data kompleks •Data mining, prosesekstraksipoladaridata ygada. •Interpretation & evaluation, prosesinterpretasipolamenjadipengetahuanygdapatdigunakanutkmen- dukungpengambilankeputusan(cthprediksi& klasifikasi, ringkasankontendatabase sertapenjelasanfenomenaygdiamati. Pendahuluan 11
  • 12. TugasData Mining •MetodePrediksi Menggunakanbeberapaatribututkmemprediksinilaidariatributygakandatang. Atributygakandiprediksidisbttargetataudependent variable. Atributygdigunakan disbt explanatoryatauindependent variable. 2 tipe: -classification, digunakanuntukvariabeltarget diskrit -regression, digunakanuntukvariabeltarget kontinu •MetodeDeskripsi Menemukanpola2 (ygmenggambarkandata) ygdapatdiinterpretasikanmanusia •Clustering •Association Rule Discovery •Sequential Pattern Discovery Pendahuluan 12
  • 13. AplikasiData Mining •Pemasaran/ Penyewaan –Identifikasipolapembayaranpelanggan –Menemukanasosiasidiantarakarakteristikdemografikpelanggan –Analisiskeranjangpemasaran •Perbankan –Mendeteksipolapenyalahgunaankartukredit –Identifikasipelangganygloyal –Mendeteksikartukreditygdihabiskanolehkelompokpelanggan •Asuransi& PelayananKesehatan –Analisisdariklaim –Memprediksipelangganygakanmembelipolis baru –Identifikasipolaperilakupelangganygberbahaya •Transformasi –Menentukanjadualdistribusikeoutlet2 Pendahuluan 13
  • 14. AplikasiData Mining (lanj.) •Pengobatan –Identifikasiterapipengobatanygberhasilutkpenyakitberbeda –Mengkarakterisasikanperilakupasienutkmemprediksikunjungan –Menganalisissejarahpenyakitpasien, sertamenemukanhubunganantarapenyakit2 ygada •Duniailmuwan –Mendeteksigalaksibaru Pendahuluan 14