More Related Content Similar to Pendahuluan kdm (20) More from Universitas Bina Darma Palembang (20) Pendahuluan kdm2. LatarBelakang
â˘Data ygdikumpulkansemakin
bertambahbanyak
âData web, e-commerce
âData pembelianditoko2 / supermarket
âTransaksiBank/KartuKredit
âDetail panggilantelepon
âStatistikpemerintahan
âRekammedis
âDatabase molekul
âCitra astronomis
Pendahuluan 2
3. LatarBelakang(lanj.)
â˘Komputersekarangmurahdanpowefull
â˘Tekanankompetisisemakinkuat
âMenyediakanlayananyglbhbaik& customized(misdalamCustomer Relationship Management)
â˘Teknikpenyimpanandata semakintinggidengankecepatantinggi(GB/jam)
â˘Prosesekstraksiinformasididalamkumpulandata ygbesarmenjaditantangan
â˘Pendekatananalisisdata tradisionaltidakdapatdigunakanutkmengekstrakdata dlmjumlahbesar
â˘Data mining merupakanteknikygmenggabungkanteknikanalisisdata tradisionaldenganalgoritmaygsophisticatedutkpemrosesandata dlmjumlahbesar
Pendahuluan 3
4. LatarBelakang(lanj.)
â˘Informasiygdibutuhkanmisalnya:
âKebutuhandaripelanggan(data layanantelepon)
âtarget respondenuntukpromosiproduk
âJenisprodukygpaling banyakterjual
âHistoristransaksidariseorangpelanggan
âPelangganyang paling loyal
âMengetahuiperilakugen2 dalamberbagaisituasi
âMengetahuiawaldanakhirmusimpadasuatuarea
Informasi yang dibutuhkan seperti di atas dapat
diekstrak dengan data mining
Pendahuluan 4
5. DefinisiData Mining
â˘Mengekstrakatauâminingâpengetahuandarikumpulandata ygsangatbesar
â˘Ekstraksiinformasiygbergunadaridata, dimanasebelumnyatidakdiharapkan, tidakdikenal& implisit
â˘Eksplorasi& analisis, secaraotomatisatausemi- otomatisdarisekumpulandata ygsangatbesaruntukmemperolehpola2 data ygberarti
â˘Prosesanalisisdatabase ygbesarsecarasemi-otomatisutkmenemukanpolayang valid, baru, bergunadandapatdipahamimanusia
Pendahuluan 5
6. AsalData Mining
â˘Berasaldarimachine learning/AI, pattern recognition, statistics, & database systemsâ˘TekniktradisionaltidaksesuaidisebabkankarenaâData ygsangat2 besarâData dengandimensiygbesarâData ygtersebar& heterogenMachine Learning/ Pattern RecognitionStatistics/ AIData MiningDatabase systems
Pendahuluan 6
7. Ilmuyang BerkaitanDenganData Mining
â˘Statistik
Merupakandasarteoritetapihasilnyasulitdiinterpretasisertabutuhbantuandaripemakaiutkmelakukananalisisdata.
â˘Machine Learning
Merupakanprosespembelajaransecaraotomatis& pem- belajaraninisetaradgnkonstruksiaturan2 berbasispadakeadaan& transisidarilingkungansekitar.
â˘SistemDatabase
Data dikumpulkandandisimpandalamdatabase.
Pendahuluan 7
8. TantanganData Mining
â˘Skalabilitas, dikrnkanpenyimpanandata menggunakanukuranbesar(gigabyte, terabyte dst) makapadaprosesdata mining, kumpulandata harusdiskala
â˘Dimensionalitasygtinggi, dimanadata ygdisimpanmemilikiatributdlmjumlahbesar, Sepertidata pengukuransuhudibeberapalokasiygmemilikikomponenwaktu& spasial
â˘Data ygheterogen& kompleks, dimanadata mempunyaiatributygheterogen, cthkumpulanhalweb ygterdiriatasteksygsemi terstruktur& banyakterdapatlink. Teknikdata mining harusmempunyaiteknikotokorelasispasial& waktu, graph connectivity& keterhubunganparent-child antaraelementekssemi terstruktur& dokumenXML
Pendahuluan 8
9. TantanganData Mining (lanj.)
â˘Pendistribusian& kepemilikandata, dimanadata tersimpandilebihdarisatulokasi& dimilikilebihdarisatuorganisasi. Untukituteknikdata mining harusdapatal : (1)berkonsolidasi terhadaphasildata mining ygberasaldarisumberberbeda, (2) mengurangijumlahkomunikasiutkkomputasiygtersebar
â˘Analisisygnon-tradisional, membutuhkanteknikevaluasi& penurunanribuanhipotesis
Pendahuluan 9
11. Tahap2 padaKDD
â˘Selection, penyeleksianatausegmentasidata berdasarkankriteriattt.
â˘Preprocessing, tahappembersihandimanainfo. tidakbergunadibuang. Selainitudata dikonfigurasiulangutkmenjaminformat tetapkonsisten.
â˘Transformation, prosestransformasisehinggadata dapatdigunakandanditelusuri. Pemetaan data
kompleks
â˘Data mining, prosesekstraksipoladaridata ygada.
â˘Interpretation & evaluation, prosesinterpretasipolamenjadipengetahuanygdapatdigunakanutkmen- dukungpengambilankeputusan(cthprediksi& klasifikasi, ringkasankontendatabase sertapenjelasanfenomenaygdiamati.
Pendahuluan 11
12. TugasData Mining
â˘MetodePrediksi
Menggunakanbeberapaatribututkmemprediksinilaidariatributygakandatang. Atributygakandiprediksidisbttargetataudependent variable. Atributygdigunakan disbt
explanatoryatauindependent variable.
2 tipe:
-classification, digunakanuntukvariabeltarget diskrit
-regression, digunakanuntukvariabeltarget kontinu
â˘MetodeDeskripsi
Menemukanpola2 (ygmenggambarkandata) ygdapatdiinterpretasikanmanusia
â˘Clustering
â˘Association Rule Discovery
â˘Sequential Pattern Discovery
Pendahuluan 12
13. AplikasiData Mining
â˘Pemasaran/ Penyewaan
âIdentifikasipolapembayaranpelanggan
âMenemukanasosiasidiantarakarakteristikdemografikpelanggan
âAnalisiskeranjangpemasaran
â˘Perbankan
âMendeteksipolapenyalahgunaankartukredit
âIdentifikasipelangganygloyal
âMendeteksikartukreditygdihabiskanolehkelompokpelanggan
â˘Asuransi& PelayananKesehatan
âAnalisisdariklaim
âMemprediksipelangganygakanmembelipolis baru
âIdentifikasipolaperilakupelangganygberbahaya
â˘Transformasi
âMenentukanjadualdistribusikeoutlet2
Pendahuluan 13
14. AplikasiData Mining (lanj.)
â˘Pengobatan
âIdentifikasiterapipengobatanygberhasilutkpenyakitberbeda
âMengkarakterisasikanperilakupasienutkmemprediksikunjungan
âMenganalisissejarahpenyakitpasien, sertamenemukanhubunganantarapenyakit2 ygada
â˘Duniailmuwan
âMendeteksigalaksibaru
Pendahuluan 14