SlideShare a Scribd company logo
1 of 28
Download to read offline
28 September 2005 Pendahuluan dan Proses KDD 1 
PERTEMUAN 1& 2 
PENDAHULUAN DAN PROSES KDD
28 September 2005 Pendahuluan dan Proses KDD 2 
KebutuhanBisnis 
Terdapattigakebutuhanbisnis: 
‰Penambahanmaupunpeningkatankapasitasproduk 
‰Penguranganbiayaoperasiperusahaan 
‰Peningkatanefektifitaspemasarandankeuntungan
28 September 2005 Pendahuluan dan Proses KDD 3 
PermasalahanBisnissecaraumum 
•Permasalahanbisnisyang umumdihadapi: 
1.Bagaimanamenyajikanadvertensikepadatarget yang tepatsasaran 
2.Menyajikanhalamanweb ygkhusussetiappelanggan 
3.Menampilkaninformasiproduklain yang biasadibelibersamaandenganproduktertentu. 
4.Mengklasifikasikanartikel-artikelsecaraotomatis 
5.Mengelompokkanpengunjungweb yang memilikikesamaankarateristiktertentu 
6.Mengestimasidata yang hilang 
7.Memprediksikelakuandimasayang akandatang
28 September 2005 Pendahuluan dan Proses KDD 4 
SolusiMasalah 
Konsepdasaryang perludipikirkanpelakubisnissebagaisolusipermasalahan, yaitu: 
1.PerumusanTarget 
Memilihtarget pemasaranuntukdisuguhiadvertensitertentubertujuanuntukmeningkatkanprofit perusahaan, pengenalanproduksecaraluasatauhasil-hasilterukurlainnya. 
2.Personalisasi 
Memanfaatkanpersonalisasiuntukmemilihadvertensiyang paling sesuaiuntukorangtertentudanpersonalisasiinibertujuanagar pengunjungyang sudahmenjadipelangganmembelisebanyakmungkinprodukperusahaan. 
3.Asosiasi(analisiskeranjangpasar) 
Asosiasiinimengidentifikasiitem-item produkyang mungkindibelibersamaandenganproduklain ataudilihatsecarabersamaanpadasaatmencariinformasimengenaiproduktertentu.
28 September 2005 Pendahuluan dan Proses KDD 5 
5.ManajemenPengetahuanSisteminimengidentifikasidanmemanfaatkanpola-poladidalamdokumenyang berbahasaalamiatauberformattext. Pendekataninidigunakanuntukmenyortirdokumenbarudanmempersonalisasipublikasionline6. PengelompokkanPengelompokkandigunakanuntukmembuatlaporanmengenaikarateristikumumdarigrup-gruppengunjung(kustomer) yang berbeda. 7. EstimasidanPrediksiEstimasimenerkasebuahnilaiyang belumdiketahuidanprediksimemperkirakannilaiuntukmasadatang. 8. PohonKeputusanSebagaidiagram alirdarititik-titikpertanyaanyang menujupadasebuahkeputusan.
28 September 2005 Pendahuluan dan Proses KDD 6 
KebutuhandanKesempatanuntukData Mining 
Kebutuhanakandata mining dikarenakan: 
1.Ketersediaandata yang melimpah, kebutuhanakaninformasi(ataupengetahuan) sebagaipendukungpengambilankeputusanuntukmembuatsolusibisnisdandukunganinfrastrukturdibidangteknologiinformasi 
2.Ketersediaandata transaksidalamvolume yang besar 
3.Informasisebagaiasetperusahaanyang pentingsehinggamelahirkangudangdata yang mengintegrasikaninformasidarisistemyang tersebaruntukmendukungpengambilankeputusan 
4.Ketersediaanteknologiinformasidalamskalayang terjangkaudansudahdapatdiadopsisecaraluas.
28 September 2005 Pendahuluan dan Proses KDD 7 
DefinisiData Mining 
‰Data mining adalahprosesyang memperkerjakansatuataulebihteknik-teknikpembelajarankomputer(machine learning) untukmenganalisisdanmengekstraksipengetahuan(knowledge) secaraotomatis. 
‰Data mining merupakanprosesiteratifdaninteraktifuntukmenemukanpolaataumodel yang sahih, baru, bermanfaat, dandimengertidalamsuatudatabase yang sangatbesar(massive databases). 
‰Data mining merupakanserangkaianprosesuntukmenggalinilaitambahdarisuatukumpulandata berupapengetahuanyang selamainitidakdiketahuisecaramanual darisuatukumpulandata 
‰Data mining menggunakanberbagaiperangkatlunakanalisisdata untukmenemukanpoladanrelasidata agar dapatdigunakanuntukmembuatprediksidengantepat
28 September 2005 Pendahuluan dan Proses KDD 8 
MengapaMelakukanData Mining 
‰SudutPandangKomersial: 
•Meledaknyavolume data yang dihimpundandisimpandalamdata warehouse 
•Proseskomputasiyang dapatdiupayakan 
•Kuatnyatekanankompetitif 
∼Dapatmenyediakanyang lebihbaik, layanan-layanankastemisasi 
∼Informasimenjadiprodukyang berarti 
‰SudutPandangKeilmuan: 
•Kecepatandata yang dihimpundandisimpan(Gbyte/hour) 
∼Remote sensor yang ditempatkanpadasuatusatelit 
∼Telescope yang digunakanuntukmen-scan langit 
∼Simulasisaintifikyang membangkitkandata dalamukuranterabytes 
•Teknik-tekniktradisionaltidakfisibelutnukmengolahdata mentah 
•Data mining untukreduksidata ; 
∼Catalogging, klassifikasi, segmentasidata 
∼Membantuilmuwandalammelakukanformulasihipotesisi
28 September 2005 Pendahuluan dan Proses KDD 9 
IlmuBerkaitanData Mining 
Bidangilmuyang berkaitan: 
‰Database 
‰Information science (ilmuinformasi) 
‰High performance computing 
‰Visualisasi 
‰Machine learning 
‰Statistik 
‰Neural networks (jaringansaraftiruan) 
‰Pemodelanmatematika 
‰Information retrieval 
‰Information extraction dan 
‰Pengenalanpola
28 September 2005 Pendahuluan dan Proses KDD 10 
‰AnalisaPasardanManajemenBeberapasolusidapatdiselesaikandengandata mining : –Menebaktarget pasar–Melihatpolabelipemakaidariwaktukewaktu–Cross Market Analysis–ProfilCustomer–IdentifikasiKebutuhanCustomer–Menilailoyalitascustomer–Informasisummary ‰AnalisaPerusahaandanManajemenResikoBeberapasolusidapatdiselesaikandengandata mining : –MerencanakanKeuangandanEvaluasiAset–MerencanakanSumberDaya(Resource Planning) –MemoniotrPersaingan(Competition) PenerapanData Mining
28 September 2005 Pendahuluan dan Proses KDD 11 
‰Telekomunikasi 
Data mining digunakanuntukmelihatjutaantransaksiyang masukdengantujuanmenambahlayananotomatis 
‰KeuanganData mining digunakanuntukmendeteksitransaksi- transaksikeuanganyang mencurigakandimanaakansusahdilakukanjikamenggunakananalisisstandar. ‰AsuransiAustralian Health Insurance Commisionmenggunakandata mining untukmengidentifikasilayanankesehatandanberhasilmenghematsatujutadollar pertahun
28 September 2005 Pendahuluan dan Proses KDD 12 
‰Olahraga IBM Advanced Scout menggunakandata mining untukmenganalisisstatistikpermainanNBA dalamrangkacompetitive advantage untuktimNew York Knicks 
‰Astronomi 
Jet Propulsion Laboratory (JPL) diPasadena danPulomarObservatory menemukan22 quasar denganbantuandata mining. 
‰Internet Web Surf-AidIBM Surf-Aid menggunakanalgoritmadata mining untukmendataakseshalamanWeb khususnyaberkaitandenganpemasaranmelaluiweb.
28 September 2005 Pendahuluan dan Proses KDD 13 
Tools Data Mining 
‰Karateristik-karateristik pentingdaritool data mining meliputi: 
–Data preparation facilities 
–Selection of data mining operation (algorithms) 
–Product scalability and performance 
–Facilities for visualization of result 
‰Data mining tool, meliputi: 
–Integral Solution Ltd’sClementine 
–DataMindCorp’s Data Crusher 
–IBM’s Intelligent Miner 
–Silicon Graphics Inc.’s MineSet 
–InformationsDiscovery Inc.’s Data Mining Suite 
–SAS Institute Inc.’s SAS System and Right Information System’Thought.
28 September 2005 Pendahuluan dan Proses KDD 14 
EvolusiDatabase 
‰Th1960 
–Pengumpulandata, pembuatandata, IMS dannetwork DBMS 
‰Th1970 
–Model data relasional, ImplementasiDBMS relasional 
‰Th1980 
–RDBMS, Model data lanjutan(extended-relational, OO, deductive) 
‰Th1990 
–Data mining, data warehouse, database multimedia, danWeb database. 
‰Th2000 
–Stream data managemendanmining 
–Data mining denganberbagaivariasiaplikasi 
–Teknologiweb dansisteminformasiglobal
28 September 2005 Pendahuluan dan Proses KDD 15 
Teknik–teknikDatabase 
Searching 
‰Searching dilakukanuntukmemeriksaserangkaianitem yang memilikisifat- sifatyang diinginkan. 
‰Tindakanuntukmenemukansuatuitem tertentubaikyang diketahuikeberadaannyamaupuntidak. 
‰Memasukkankatadalamsuatuprogram komputeruntukmembandingkandenganinformasiyang adadalamdatabase. 
Indexing 
‰Indexing adalahstruktur-strukturaksesyang digunakanuntukmempercepatrespondalammendapatkanrecord-record padakondisi-kondisipencariantertentu. 
‰Indexing field adalahsuatustrukturaksesindex yang biasanyamenjelaskanfield tunggaldarisuatufile. 
‰Indexing organization memberikanefisiensiakseskerecord-record secaraberurutataurandom.
28 September 2005 Pendahuluan dan Proses KDD 16 
Data Reduction 
‰Data reduction adalahtransformasisuatumasalahkemasalahlain dandapatdigunakanuntukmendefinisikanserangkaianmasalahyang kompleks. 
‰Data reduction merupakan teknik yang digunakan untuk mentransformasi dari data mentah ke bentuk format data yang lebih berguna. Sebagai contoh groupping, summingdan averaging data. 
‰Data reduction dilakukanuntuk mengatasi ukuran data yang terlalu besar. Ukuran data yang terlalu besar dapat menimbulkan ketidakefisienan proses dan peningkatan biaya pemrosesan. 
‰Data reduction dilakukan dalam tahap data preprocessing pada rangkaian proses Knowledge Discovery Databases (KDD) sebelum data mining dengan tujuan mengurangi ukuran data yang besar.
28 September 2005 Pendahuluan dan Proses KDD 17 
OLAP (On-line analytical processing) 
‰OLAP adalahsuatusistematauteknologiyang dirancanguntukmendukungprosesanalisiskompleksdalamrangkamengungkapkankecenderunganpasardanfaktor-faktorpentingdalambisnis 
‰OLAP ditandaidengankemampuannyamenaikkanataumenurunkandimensidata sehinggakitadapatmenggalidata sampaipadalevel yang sangatdetail danmemperolehpandanganyang lebihluasmengenaiobjekyang sedangkitaanalisis. 
‰OLAP secarakhususmemfokuskanpadapembuatandata agar dapatdiaksespadasaatpendefinisiankembalidimensi. 
‰OLAP dapatdigunakanmembuatrangkumandarimultidimensidata yang berbeda, rangkumanbarudanmendapatkanresponsecaraonline, danmemberikanview duadimensipadadata cube multidimensisecarainteraktif.
28 September 2005 Pendahuluan dan Proses KDD 18 
Data Warehouse 
Definisi: 
‰Data Warehouse adalahPusatrepositoriinformasiyang mampumemberikandatabase berorientasisubyekuntuk informasi yang bersifathistorisyang mendukungDSS (Decision SuportSystem) danEIS (Executive Information System). 
‰Salinandaritransaksidata yang terstruktursecaraspesifikpadaquery dananalisa. 
‰Salinandaritransaksidata yang terstrukturspesifikuntukquery danlaporan 
Tujuan: 
‰Meningkatkankualitasdanakurasiinformasibisnisdanmengirimkaninformasikepemakaidalambentukyang dimengertidandapatdiaksesdenganmudah.
28 September 2005 Pendahuluan dan Proses KDD 19 
Ciri-ciriData Warehouse 
Terdapat4 karateristikdata warehouse 
•Subject oriented 
–Data yang disusunmenurutsubyekberisihanyainformasiyang pentingbagipemprosesandecision support. 
–Database yang semuainformasiyang tersimpandikelompokkanberdasarkansubyektertentumisalnya: pelanggan, gudang, pasar, dsb. 
–SemuaInformasitersebutdisimpandalamsuatusistemdata warehouse. 
–Data-data disetiapsubyekdirangkumkedalamdimensi, misalnya: periodewaktu, produk, wilayah, dsb, sehinggadapatmemberikannilaisejarahuntukbahananalisa. 
•Integrated 
–Jikadata terletakpadaberbagaiaplikasiyang terpisahdalamsuatulingkunganoperasional, encoding data seringtidakseragamsehingggabiladata dipindahkankedata warehouse makacoding akandiasumsikansama sepertilazimnya. 
•Time-variant 
–Data warehouse adalahtempatuntukstoring data selama5 sampai10 tahunataulebih, data digunakanuntukperbandinganatauperkiraandandata initidakdapatdiperbaharui. 
•Non volatile 
–Data tidakdapatdiperbaharuiataudirubahtetapihanyadapatditambahdandilihat.
28 September 2005 Pendahuluan dan Proses KDD 20 
Masalah-masalahdalammenerapkanData warehouse : •Dokumentasidanpengelolaanmetadata daridata warehouse. •Penentuanaturandalamprosestransformasiuntukmemetakanberbagaisumberlegacy data yang akandimasukkankedalamdata warehouse. •Pencapaianprosespengembanganyang handal, baikdalammembangun, mempimplementasikan, maupunmemeliharadata warehouse.
28 September 2005 Pendahuluan dan Proses KDD 21 
Data Preprocessing 
‰Data preprocessing menerangkantipe-tipeprosesyang melaksanakandata mentahuntukmempersiapkanprosesproseduryang lainnya. 
‰Dalamdata mining menstrasformasidata kesuatuformat yang prosesnyalebihmudahdanefektifuntukkebutuhanpemakai, contohnyaNeural Network. 
‰Terdapatbeberapaalatdanmetodeyang berbedayang digunakanuntukpreprocessing seperti: 
–Sampling : menyeleksisubset representatifdaripopulasidata yang besar. 
–Transformation : memanipulasidata mentahuntukmenghasilkaninput tunggal. 
–Denoising: menghilangkannoise daridata 
–Normalization : mengorganisasidata untukpengaksesanyang lebihspesifik 
–Feature extration: membukaspesifikasidata yang signifikandalamkontekstertentu.
28 September 2005 Pendahuluan dan Proses KDD 22 
Knowledge Discovery In Database (KDD) 
‰KDD berhubungandenganteknikintegrasidanpenemuanilmiah, interprestasi danvisualisasidaripola-polasejumlahkumpulandata. 
‰Knowledge discoveryin databases(KDD) adalahkeseluruhanprosesnon-trivial untukmencaridanmengidentifikasipola(pattern) dalamdata, dimanapolayang ditemukanbersifatsah, baru, dapatbermanfaatdandapatdimengerti.
Gambar. 1. TahapanKDD 
28 September 2005 Pendahuluan dan Proses KDD 23
28 September 2005 Pendahuluan dan Proses KDD 24 
TahapanProsesKDD1.Data Selection–Menciptakanhimpunandata target , pemilihanhimpunandata, ataumemfokuskanpadasubset variabelatausampeldata, dimanapenemuan(discovery) akandilakukan. –Pemilihan(seleksi) data darisekumpulandata operasionalperludilakukansebelumtahappenggalianinformasidalamKDD dimulai. Data hasilseleksiyang akandigunakanuntukprosesdata mining, disimpandalamsuatuberkas, terpisahdaribasis data operasional.
28 September 2005 Pendahuluan dan Proses KDD 25 
2. Pre-processing/ Cleaning 
–Pemprosesanpendahuluandanpembersihandata merupakanoperasidasarsepertipenghapusannoise dilakukan. 
–Sebelumprosesdata miningdapatdilaksanakan, perludilakukanprosescleaningpadadata yang menjadifokusKDD. 
–Prosescleaning mencakupantaralain membuangduplikasidata, memeriksadata yang inkonsisten, danmemperbaikikesalahanpadadata, sepertikesalahancetak(tipografi). 
–Dilakukanprosesenrichment, yaituproses“memperkaya” data yang sudahadadengandata atauinformasilain yang relevandandiperlukanuntukKDD, sepertidata atauinformasieksternal.
28 September 2005 Pendahuluan dan Proses KDD 26 
3.Transformation 
–Pencarianfitur-fituryang bergunauntukmempresentasikandata bergantungkepadagoal yang ingindicapai. 
–Merupakanprosestransformasipadadata yang telahdipilih, sehinggadata tersebutsesuaiuntukprosesdata mining. Prosesinimerupakanproseskreatifdansangattergantungpadajenisataupolainformasiyang akandicaridalambasis data
28 September 2005 Pendahuluan dan Proses KDD 27 
4.Data mining 
–Pemilihantugasdata mining; pemilihangoal dariprosesKDD misalnyaklasifikasi, regresi, clustering, dll. 
–Pemilihanalgoritmadata mining untukpencarian(searching) 
–ProsesData miningyaituprosesmencaripolaatauinformasimenarikdalamdata terpilihdenganmenggunakanteknikataumetodetertentu. Teknik, metode, ataualgoritmadalamdata miningsangatbervariasi. Pemilihanmetodeataualgoritmayang tepatsangatbergantungpadatujuandanprosesKDD secarakeseluruhan.
28 September 2005 Pendahuluan dan Proses KDD 28 
5. Interpretation/ Evaluation 
–Penerjemahanpola-polayang dihasilkandaridata mining. 
–Polainformasiyang dihasilkandariprosesdata miningperluditampilkandalambentukyang mudahdimengertiolehpihakyang berkepentingan. 
–TahapinimerupakanbagiandariprosesKDD yang mencakuppemeriksaanapakahpolaatauinformasiyang ditemukanbertentangandenganfaktaatauhipotesayang adasebelumnya.

More Related Content

Similar to pendahuluan dan proses kdd

Itb 2004-perancangan e-business-business intelligence-noverino-kharizt
Itb 2004-perancangan e-business-business intelligence-noverino-khariztItb 2004-perancangan e-business-business intelligence-noverino-kharizt
Itb 2004-perancangan e-business-business intelligence-noverino-kharizt
Noverino Rifai
 
Pertemuan_-_6-Infrastruktur_TI_dan_Perkembangan_Teknologi.ppt
Pertemuan_-_6-Infrastruktur_TI_dan_Perkembangan_Teknologi.pptPertemuan_-_6-Infrastruktur_TI_dan_Perkembangan_Teknologi.ppt
Pertemuan_-_6-Infrastruktur_TI_dan_Perkembangan_Teknologi.ppt
ssuserbc5208
 
SIM Bab 7 pengembangan sistem
SIM Bab 7 pengembangan sistemSIM Bab 7 pengembangan sistem
SIM Bab 7 pengembangan sistem
wingpie
 
BAB 7. Pengembangan Sistem
BAB 7. Pengembangan Sistem BAB 7. Pengembangan Sistem
BAB 7. Pengembangan Sistem
audi15Ar
 
Tik in organisation
Tik in organisationTik in organisation
Tik in organisation
rusdicinere
 

Similar to pendahuluan dan proses kdd (20)

Software re engineering
Software re engineeringSoftware re engineering
Software re engineering
 
Kuliah Tamu - Dari Proses Bisnis Menuju Struktur Data.pdf
Kuliah Tamu - Dari Proses Bisnis Menuju Struktur Data.pdfKuliah Tamu - Dari Proses Bisnis Menuju Struktur Data.pdf
Kuliah Tamu - Dari Proses Bisnis Menuju Struktur Data.pdf
 
supply chain management
supply chain managementsupply chain management
supply chain management
 
Interpretasi re engineering
Interpretasi re engineeringInterpretasi re engineering
Interpretasi re engineering
 
Sistem Manajemen Database
Sistem Manajemen DatabaseSistem Manajemen Database
Sistem Manajemen Database
 
Itb 2004-perancangan e-business-business intelligence-noverino-kharizt
Itb 2004-perancangan e-business-business intelligence-noverino-khariztItb 2004-perancangan e-business-business intelligence-noverino-kharizt
Itb 2004-perancangan e-business-business intelligence-noverino-kharizt
 
Pertemuan_-_6-Infrastruktur_TI_dan_Perkembangan_Teknologi.ppt
Pertemuan_-_6-Infrastruktur_TI_dan_Perkembangan_Teknologi.pptPertemuan_-_6-Infrastruktur_TI_dan_Perkembangan_Teknologi.ppt
Pertemuan_-_6-Infrastruktur_TI_dan_Perkembangan_Teknologi.ppt
 
Pertemuan_-_6-Infrastruktur_TI_dan_Perkembangan_Teknologi.ppt
Pertemuan_-_6-Infrastruktur_TI_dan_Perkembangan_Teknologi.pptPertemuan_-_6-Infrastruktur_TI_dan_Perkembangan_Teknologi.ppt
Pertemuan_-_6-Infrastruktur_TI_dan_Perkembangan_Teknologi.ppt
 
LIMA DOMAIN KEBOLEHLAKSANAAN SISTEM
 LIMA DOMAIN KEBOLEHLAKSANAAN SISTEM LIMA DOMAIN KEBOLEHLAKSANAAN SISTEM
LIMA DOMAIN KEBOLEHLAKSANAAN SISTEM
 
Paper cisco kelompok 6 by Annisa Shabrina
Paper cisco kelompok 6 by Annisa ShabrinaPaper cisco kelompok 6 by Annisa Shabrina
Paper cisco kelompok 6 by Annisa Shabrina
 
04 Contoh Praktik - Tatang A Taufik
04  Contoh Praktik - Tatang A Taufik04  Contoh Praktik - Tatang A Taufik
04 Contoh Praktik - Tatang A Taufik
 
Herwanto_Kuliah_Umum_Big_Data_Analysis.pptx
Herwanto_Kuliah_Umum_Big_Data_Analysis.pptxHerwanto_Kuliah_Umum_Big_Data_Analysis.pptx
Herwanto_Kuliah_Umum_Big_Data_Analysis.pptx
 
SIM Bab 7 pengembangan sistem
SIM Bab 7 pengembangan sistemSIM Bab 7 pengembangan sistem
SIM Bab 7 pengembangan sistem
 
BAB 7. Pengembangan Sistem
BAB 7. Pengembangan Sistem BAB 7. Pengembangan Sistem
BAB 7. Pengembangan Sistem
 
feni endriawan
feni endriawanfeni endriawan
feni endriawan
 
Kuliah_Umum_Big_Data_Analysis_TEKNIK INFORMATIKA.pptx
Kuliah_Umum_Big_Data_Analysis_TEKNIK INFORMATIKA.pptxKuliah_Umum_Big_Data_Analysis_TEKNIK INFORMATIKA.pptx
Kuliah_Umum_Big_Data_Analysis_TEKNIK INFORMATIKA.pptx
 
Tik in organisation
Tik in organisationTik in organisation
Tik in organisation
 
SIM-Novalin Falentin.Hehanussa
SIM-Novalin Falentin.HehanussaSIM-Novalin Falentin.Hehanussa
SIM-Novalin Falentin.Hehanussa
 
Aplikasi Pengelolaan Persedian Barang Dagang Berupa ATK
Aplikasi Pengelolaan Persedian Barang Dagang Berupa ATKAplikasi Pengelolaan Persedian Barang Dagang Berupa ATK
Aplikasi Pengelolaan Persedian Barang Dagang Berupa ATK
 
2 sistem informasi untuk keunggulan kompetitif
2 sistem informasi untuk  keunggulan kompetitif2 sistem informasi untuk  keunggulan kompetitif
2 sistem informasi untuk keunggulan kompetitif
 

More from Universitas Bina Darma Palembang

More from Universitas Bina Darma Palembang (20)

30448 pertemuan1
30448 pertemuan130448 pertemuan1
30448 pertemuan1
 
29510 pertemuan18(form method-get-post-dan-session(1))
29510 pertemuan18(form method-get-post-dan-session(1))29510 pertemuan18(form method-get-post-dan-session(1))
29510 pertemuan18(form method-get-post-dan-session(1))
 
28501 pertemuan14(php)
28501 pertemuan14(php)28501 pertemuan14(php)
28501 pertemuan14(php)
 
28500 pertemuan22(header dokumen html dgn tag title)
28500 pertemuan22(header dokumen html dgn tag title)28500 pertemuan22(header dokumen html dgn tag title)
28500 pertemuan22(header dokumen html dgn tag title)
 
25437 pertemuan25(hitcounter)
25437 pertemuan25(hitcounter)25437 pertemuan25(hitcounter)
25437 pertemuan25(hitcounter)
 
23921 pertemuan 3
23921 pertemuan 323921 pertemuan 3
23921 pertemuan 3
 
19313 pertemuan6
19313 pertemuan619313 pertemuan6
19313 pertemuan6
 
18759 pertemuan20(web html editor)
18759 pertemuan20(web html editor)18759 pertemuan20(web html editor)
18759 pertemuan20(web html editor)
 
18040 pertemuan13(css)
18040 pertemuan13(css)18040 pertemuan13(css)
18040 pertemuan13(css)
 
17945 pertemuan5
17945 pertemuan517945 pertemuan5
17945 pertemuan5
 
16406 pertemuan17(konsep basis-data-di-web)
16406 pertemuan17(konsep basis-data-di-web)16406 pertemuan17(konsep basis-data-di-web)
16406 pertemuan17(konsep basis-data-di-web)
 
15294 pertemuan9(eksplorasi &defenisi masalah0
15294 pertemuan9(eksplorasi &defenisi masalah015294 pertemuan9(eksplorasi &defenisi masalah0
15294 pertemuan9(eksplorasi &defenisi masalah0
 
13926 pertemuan4
13926 pertemuan413926 pertemuan4
13926 pertemuan4
 
12738 pertemuan 15(php lanjutan)
12738 pertemuan 15(php lanjutan)12738 pertemuan 15(php lanjutan)
12738 pertemuan 15(php lanjutan)
 
6346 pertemuan21(web statis dengan struktur html)
6346 pertemuan21(web statis dengan struktur html)6346 pertemuan21(web statis dengan struktur html)
6346 pertemuan21(web statis dengan struktur html)
 
5623 pertemuan11(html1)
5623 pertemuan11(html1)5623 pertemuan11(html1)
5623 pertemuan11(html1)
 
4740 pertemuan8(komponen dalam web)
4740 pertemuan8(komponen dalam web)4740 pertemuan8(komponen dalam web)
4740 pertemuan8(komponen dalam web)
 
4075 pertemuan10 (analisa kebutuhan)
4075 pertemuan10 (analisa kebutuhan)4075 pertemuan10 (analisa kebutuhan)
4075 pertemuan10 (analisa kebutuhan)
 
2670 pertemuan12(html lanjut)
2670 pertemuan12(html lanjut)2670 pertemuan12(html lanjut)
2670 pertemuan12(html lanjut)
 
2190 pertemuan24(polling)
2190 pertemuan24(polling)2190 pertemuan24(polling)
2190 pertemuan24(polling)
 

Recently uploaded

KISI-KISI USEK PJOK TA 2023-2024 anans ajaja jaja hdsh
KISI-KISI USEK PJOK TA 2023-2024 anans ajaja jaja hdshKISI-KISI USEK PJOK TA 2023-2024 anans ajaja jaja hdsh
KISI-KISI USEK PJOK TA 2023-2024 anans ajaja jaja hdsh
DosenBernard
 
Abortion pills in Kuwait salmiyah [+966572737505 ] Get Cytotec in Kuwait city...
Abortion pills in Kuwait salmiyah [+966572737505 ] Get Cytotec in Kuwait city...Abortion pills in Kuwait salmiyah [+966572737505 ] Get Cytotec in Kuwait city...
Abortion pills in Kuwait salmiyah [+966572737505 ] Get Cytotec in Kuwait city...
Abortion pills in Riyadh +966572737505 get cytotec
 
KISI KISI PSAJ IPS KLS IX 2324.docskskkks
KISI KISI PSAJ IPS KLS IX 2324.docskskkksKISI KISI PSAJ IPS KLS IX 2324.docskskkks
KISI KISI PSAJ IPS KLS IX 2324.docskskkks
danzztzy405
 
SIMPUS SIMPUS SIMPUS & E- PUSKESMAS (3).ppt
SIMPUS SIMPUS SIMPUS & E- PUSKESMAS (3).pptSIMPUS SIMPUS SIMPUS & E- PUSKESMAS (3).ppt
SIMPUS SIMPUS SIMPUS & E- PUSKESMAS (3).ppt
EndangNingsih7
 
Abortion pills in Jeddah+966543202731/ buy cytotec
Abortion pills in Jeddah+966543202731/ buy cytotecAbortion pills in Jeddah+966543202731/ buy cytotec
Abortion pills in Jeddah+966543202731/ buy cytotec
Abortion pills in Riyadh +966572737505 get cytotec
 

Recently uploaded (17)

PERTEMUAN 4 himpunan dan fungsi logika fuzzy.ppT
PERTEMUAN 4 himpunan dan fungsi logika fuzzy.ppTPERTEMUAN 4 himpunan dan fungsi logika fuzzy.ppT
PERTEMUAN 4 himpunan dan fungsi logika fuzzy.ppT
 
Sistem operasi adalah program yang bertindak sebagai perantara antara user de...
Sistem operasi adalah program yang bertindak sebagai perantara antara user de...Sistem operasi adalah program yang bertindak sebagai perantara antara user de...
Sistem operasi adalah program yang bertindak sebagai perantara antara user de...
 
KISI-KISI USEK PJOK TA 2023-2024 anans ajaja jaja hdsh
KISI-KISI USEK PJOK TA 2023-2024 anans ajaja jaja hdshKISI-KISI USEK PJOK TA 2023-2024 anans ajaja jaja hdsh
KISI-KISI USEK PJOK TA 2023-2024 anans ajaja jaja hdsh
 
Salinan PPT TATA BAHASA Bahasa Indonesia
Salinan PPT TATA BAHASA Bahasa IndonesiaSalinan PPT TATA BAHASA Bahasa Indonesia
Salinan PPT TATA BAHASA Bahasa Indonesia
 
PPT SIDANG UJIAN KOMPREHENSIF KUALITATIF
PPT SIDANG UJIAN KOMPREHENSIF KUALITATIFPPT SIDANG UJIAN KOMPREHENSIF KUALITATIF
PPT SIDANG UJIAN KOMPREHENSIF KUALITATIF
 
Abortion pills in Kuwait salmiyah [+966572737505 ] Get Cytotec in Kuwait city...
Abortion pills in Kuwait salmiyah [+966572737505 ] Get Cytotec in Kuwait city...Abortion pills in Kuwait salmiyah [+966572737505 ] Get Cytotec in Kuwait city...
Abortion pills in Kuwait salmiyah [+966572737505 ] Get Cytotec in Kuwait city...
 
Materi Pajak Untuk BOS tahun 2024 untuk madrasah MI,MTS, dan MA
Materi Pajak Untuk BOS tahun 2024 untuk madrasah MI,MTS, dan MAMateri Pajak Untuk BOS tahun 2024 untuk madrasah MI,MTS, dan MA
Materi Pajak Untuk BOS tahun 2024 untuk madrasah MI,MTS, dan MA
 
KONSEP DASAR ADVOKASI GIZI KEBIJAKAN PEMERINTAHAN
KONSEP DASAR ADVOKASI GIZI KEBIJAKAN PEMERINTAHANKONSEP DASAR ADVOKASI GIZI KEBIJAKAN PEMERINTAHAN
KONSEP DASAR ADVOKASI GIZI KEBIJAKAN PEMERINTAHAN
 
Perlindungan Anak Dalam Hukum Perdata (2).pdf
Perlindungan Anak Dalam Hukum Perdata (2).pdfPerlindungan Anak Dalam Hukum Perdata (2).pdf
Perlindungan Anak Dalam Hukum Perdata (2).pdf
 
DATA MINING : RSITEKTUR & MODEL DATA MINING
DATA MINING : RSITEKTUR & MODEL DATA MININGDATA MINING : RSITEKTUR & MODEL DATA MINING
DATA MINING : RSITEKTUR & MODEL DATA MINING
 
DATA MINING : ESTIMASI, PREDIKSI, KLASIFIKASI, KLASTERING, DAN ASOSIASI.ppt
DATA MINING : ESTIMASI, PREDIKSI, KLASIFIKASI, KLASTERING, DAN ASOSIASI.pptDATA MINING : ESTIMASI, PREDIKSI, KLASIFIKASI, KLASTERING, DAN ASOSIASI.ppt
DATA MINING : ESTIMASI, PREDIKSI, KLASIFIKASI, KLASTERING, DAN ASOSIASI.ppt
 
KISI KISI PSAJ IPS KLS IX 2324.docskskkks
KISI KISI PSAJ IPS KLS IX 2324.docskskkksKISI KISI PSAJ IPS KLS IX 2324.docskskkks
KISI KISI PSAJ IPS KLS IX 2324.docskskkks
 
SIMPUS SIMPUS SIMPUS & E- PUSKESMAS (3).ppt
SIMPUS SIMPUS SIMPUS & E- PUSKESMAS (3).pptSIMPUS SIMPUS SIMPUS & E- PUSKESMAS (3).ppt
SIMPUS SIMPUS SIMPUS & E- PUSKESMAS (3).ppt
 
Alur Pengajuan Surat Keterangan Pindah (Individu) lewat IKD.pdf
Alur Pengajuan Surat Keterangan Pindah (Individu) lewat IKD.pdfAlur Pengajuan Surat Keterangan Pindah (Individu) lewat IKD.pdf
Alur Pengajuan Surat Keterangan Pindah (Individu) lewat IKD.pdf
 
Contoh Algoritma Asosiasi pada data mining
Contoh Algoritma Asosiasi pada data miningContoh Algoritma Asosiasi pada data mining
Contoh Algoritma Asosiasi pada data mining
 
Abortion pills in Jeddah+966543202731/ buy cytotec
Abortion pills in Jeddah+966543202731/ buy cytotecAbortion pills in Jeddah+966543202731/ buy cytotec
Abortion pills in Jeddah+966543202731/ buy cytotec
 
514034136-Tugas-Modul-4-5-Komputer-Dan-Media-Pembelajaran.pptx
514034136-Tugas-Modul-4-5-Komputer-Dan-Media-Pembelajaran.pptx514034136-Tugas-Modul-4-5-Komputer-Dan-Media-Pembelajaran.pptx
514034136-Tugas-Modul-4-5-Komputer-Dan-Media-Pembelajaran.pptx
 

pendahuluan dan proses kdd

  • 1. 28 September 2005 Pendahuluan dan Proses KDD 1 PERTEMUAN 1& 2 PENDAHULUAN DAN PROSES KDD
  • 2. 28 September 2005 Pendahuluan dan Proses KDD 2 KebutuhanBisnis Terdapattigakebutuhanbisnis: ‰Penambahanmaupunpeningkatankapasitasproduk ‰Penguranganbiayaoperasiperusahaan ‰Peningkatanefektifitaspemasarandankeuntungan
  • 3. 28 September 2005 Pendahuluan dan Proses KDD 3 PermasalahanBisnissecaraumum •Permasalahanbisnisyang umumdihadapi: 1.Bagaimanamenyajikanadvertensikepadatarget yang tepatsasaran 2.Menyajikanhalamanweb ygkhusussetiappelanggan 3.Menampilkaninformasiproduklain yang biasadibelibersamaandenganproduktertentu. 4.Mengklasifikasikanartikel-artikelsecaraotomatis 5.Mengelompokkanpengunjungweb yang memilikikesamaankarateristiktertentu 6.Mengestimasidata yang hilang 7.Memprediksikelakuandimasayang akandatang
  • 4. 28 September 2005 Pendahuluan dan Proses KDD 4 SolusiMasalah Konsepdasaryang perludipikirkanpelakubisnissebagaisolusipermasalahan, yaitu: 1.PerumusanTarget Memilihtarget pemasaranuntukdisuguhiadvertensitertentubertujuanuntukmeningkatkanprofit perusahaan, pengenalanproduksecaraluasatauhasil-hasilterukurlainnya. 2.Personalisasi Memanfaatkanpersonalisasiuntukmemilihadvertensiyang paling sesuaiuntukorangtertentudanpersonalisasiinibertujuanagar pengunjungyang sudahmenjadipelangganmembelisebanyakmungkinprodukperusahaan. 3.Asosiasi(analisiskeranjangpasar) Asosiasiinimengidentifikasiitem-item produkyang mungkindibelibersamaandenganproduklain ataudilihatsecarabersamaanpadasaatmencariinformasimengenaiproduktertentu.
  • 5. 28 September 2005 Pendahuluan dan Proses KDD 5 5.ManajemenPengetahuanSisteminimengidentifikasidanmemanfaatkanpola-poladidalamdokumenyang berbahasaalamiatauberformattext. Pendekataninidigunakanuntukmenyortirdokumenbarudanmempersonalisasipublikasionline6. PengelompokkanPengelompokkandigunakanuntukmembuatlaporanmengenaikarateristikumumdarigrup-gruppengunjung(kustomer) yang berbeda. 7. EstimasidanPrediksiEstimasimenerkasebuahnilaiyang belumdiketahuidanprediksimemperkirakannilaiuntukmasadatang. 8. PohonKeputusanSebagaidiagram alirdarititik-titikpertanyaanyang menujupadasebuahkeputusan.
  • 6. 28 September 2005 Pendahuluan dan Proses KDD 6 KebutuhandanKesempatanuntukData Mining Kebutuhanakandata mining dikarenakan: 1.Ketersediaandata yang melimpah, kebutuhanakaninformasi(ataupengetahuan) sebagaipendukungpengambilankeputusanuntukmembuatsolusibisnisdandukunganinfrastrukturdibidangteknologiinformasi 2.Ketersediaandata transaksidalamvolume yang besar 3.Informasisebagaiasetperusahaanyang pentingsehinggamelahirkangudangdata yang mengintegrasikaninformasidarisistemyang tersebaruntukmendukungpengambilankeputusan 4.Ketersediaanteknologiinformasidalamskalayang terjangkaudansudahdapatdiadopsisecaraluas.
  • 7. 28 September 2005 Pendahuluan dan Proses KDD 7 DefinisiData Mining ‰Data mining adalahprosesyang memperkerjakansatuataulebihteknik-teknikpembelajarankomputer(machine learning) untukmenganalisisdanmengekstraksipengetahuan(knowledge) secaraotomatis. ‰Data mining merupakanprosesiteratifdaninteraktifuntukmenemukanpolaataumodel yang sahih, baru, bermanfaat, dandimengertidalamsuatudatabase yang sangatbesar(massive databases). ‰Data mining merupakanserangkaianprosesuntukmenggalinilaitambahdarisuatukumpulandata berupapengetahuanyang selamainitidakdiketahuisecaramanual darisuatukumpulandata ‰Data mining menggunakanberbagaiperangkatlunakanalisisdata untukmenemukanpoladanrelasidata agar dapatdigunakanuntukmembuatprediksidengantepat
  • 8. 28 September 2005 Pendahuluan dan Proses KDD 8 MengapaMelakukanData Mining ‰SudutPandangKomersial: •Meledaknyavolume data yang dihimpundandisimpandalamdata warehouse •Proseskomputasiyang dapatdiupayakan •Kuatnyatekanankompetitif ∼Dapatmenyediakanyang lebihbaik, layanan-layanankastemisasi ∼Informasimenjadiprodukyang berarti ‰SudutPandangKeilmuan: •Kecepatandata yang dihimpundandisimpan(Gbyte/hour) ∼Remote sensor yang ditempatkanpadasuatusatelit ∼Telescope yang digunakanuntukmen-scan langit ∼Simulasisaintifikyang membangkitkandata dalamukuranterabytes •Teknik-tekniktradisionaltidakfisibelutnukmengolahdata mentah •Data mining untukreduksidata ; ∼Catalogging, klassifikasi, segmentasidata ∼Membantuilmuwandalammelakukanformulasihipotesisi
  • 9. 28 September 2005 Pendahuluan dan Proses KDD 9 IlmuBerkaitanData Mining Bidangilmuyang berkaitan: ‰Database ‰Information science (ilmuinformasi) ‰High performance computing ‰Visualisasi ‰Machine learning ‰Statistik ‰Neural networks (jaringansaraftiruan) ‰Pemodelanmatematika ‰Information retrieval ‰Information extraction dan ‰Pengenalanpola
  • 10. 28 September 2005 Pendahuluan dan Proses KDD 10 ‰AnalisaPasardanManajemenBeberapasolusidapatdiselesaikandengandata mining : –Menebaktarget pasar–Melihatpolabelipemakaidariwaktukewaktu–Cross Market Analysis–ProfilCustomer–IdentifikasiKebutuhanCustomer–Menilailoyalitascustomer–Informasisummary ‰AnalisaPerusahaandanManajemenResikoBeberapasolusidapatdiselesaikandengandata mining : –MerencanakanKeuangandanEvaluasiAset–MerencanakanSumberDaya(Resource Planning) –MemoniotrPersaingan(Competition) PenerapanData Mining
  • 11. 28 September 2005 Pendahuluan dan Proses KDD 11 ‰Telekomunikasi Data mining digunakanuntukmelihatjutaantransaksiyang masukdengantujuanmenambahlayananotomatis ‰KeuanganData mining digunakanuntukmendeteksitransaksi- transaksikeuanganyang mencurigakandimanaakansusahdilakukanjikamenggunakananalisisstandar. ‰AsuransiAustralian Health Insurance Commisionmenggunakandata mining untukmengidentifikasilayanankesehatandanberhasilmenghematsatujutadollar pertahun
  • 12. 28 September 2005 Pendahuluan dan Proses KDD 12 ‰Olahraga IBM Advanced Scout menggunakandata mining untukmenganalisisstatistikpermainanNBA dalamrangkacompetitive advantage untuktimNew York Knicks ‰Astronomi Jet Propulsion Laboratory (JPL) diPasadena danPulomarObservatory menemukan22 quasar denganbantuandata mining. ‰Internet Web Surf-AidIBM Surf-Aid menggunakanalgoritmadata mining untukmendataakseshalamanWeb khususnyaberkaitandenganpemasaranmelaluiweb.
  • 13. 28 September 2005 Pendahuluan dan Proses KDD 13 Tools Data Mining ‰Karateristik-karateristik pentingdaritool data mining meliputi: –Data preparation facilities –Selection of data mining operation (algorithms) –Product scalability and performance –Facilities for visualization of result ‰Data mining tool, meliputi: –Integral Solution Ltd’sClementine –DataMindCorp’s Data Crusher –IBM’s Intelligent Miner –Silicon Graphics Inc.’s MineSet –InformationsDiscovery Inc.’s Data Mining Suite –SAS Institute Inc.’s SAS System and Right Information System’Thought.
  • 14. 28 September 2005 Pendahuluan dan Proses KDD 14 EvolusiDatabase ‰Th1960 –Pengumpulandata, pembuatandata, IMS dannetwork DBMS ‰Th1970 –Model data relasional, ImplementasiDBMS relasional ‰Th1980 –RDBMS, Model data lanjutan(extended-relational, OO, deductive) ‰Th1990 –Data mining, data warehouse, database multimedia, danWeb database. ‰Th2000 –Stream data managemendanmining –Data mining denganberbagaivariasiaplikasi –Teknologiweb dansisteminformasiglobal
  • 15. 28 September 2005 Pendahuluan dan Proses KDD 15 Teknik–teknikDatabase Searching ‰Searching dilakukanuntukmemeriksaserangkaianitem yang memilikisifat- sifatyang diinginkan. ‰Tindakanuntukmenemukansuatuitem tertentubaikyang diketahuikeberadaannyamaupuntidak. ‰Memasukkankatadalamsuatuprogram komputeruntukmembandingkandenganinformasiyang adadalamdatabase. Indexing ‰Indexing adalahstruktur-strukturaksesyang digunakanuntukmempercepatrespondalammendapatkanrecord-record padakondisi-kondisipencariantertentu. ‰Indexing field adalahsuatustrukturaksesindex yang biasanyamenjelaskanfield tunggaldarisuatufile. ‰Indexing organization memberikanefisiensiakseskerecord-record secaraberurutataurandom.
  • 16. 28 September 2005 Pendahuluan dan Proses KDD 16 Data Reduction ‰Data reduction adalahtransformasisuatumasalahkemasalahlain dandapatdigunakanuntukmendefinisikanserangkaianmasalahyang kompleks. ‰Data reduction merupakan teknik yang digunakan untuk mentransformasi dari data mentah ke bentuk format data yang lebih berguna. Sebagai contoh groupping, summingdan averaging data. ‰Data reduction dilakukanuntuk mengatasi ukuran data yang terlalu besar. Ukuran data yang terlalu besar dapat menimbulkan ketidakefisienan proses dan peningkatan biaya pemrosesan. ‰Data reduction dilakukan dalam tahap data preprocessing pada rangkaian proses Knowledge Discovery Databases (KDD) sebelum data mining dengan tujuan mengurangi ukuran data yang besar.
  • 17. 28 September 2005 Pendahuluan dan Proses KDD 17 OLAP (On-line analytical processing) ‰OLAP adalahsuatusistematauteknologiyang dirancanguntukmendukungprosesanalisiskompleksdalamrangkamengungkapkankecenderunganpasardanfaktor-faktorpentingdalambisnis ‰OLAP ditandaidengankemampuannyamenaikkanataumenurunkandimensidata sehinggakitadapatmenggalidata sampaipadalevel yang sangatdetail danmemperolehpandanganyang lebihluasmengenaiobjekyang sedangkitaanalisis. ‰OLAP secarakhususmemfokuskanpadapembuatandata agar dapatdiaksespadasaatpendefinisiankembalidimensi. ‰OLAP dapatdigunakanmembuatrangkumandarimultidimensidata yang berbeda, rangkumanbarudanmendapatkanresponsecaraonline, danmemberikanview duadimensipadadata cube multidimensisecarainteraktif.
  • 18. 28 September 2005 Pendahuluan dan Proses KDD 18 Data Warehouse Definisi: ‰Data Warehouse adalahPusatrepositoriinformasiyang mampumemberikandatabase berorientasisubyekuntuk informasi yang bersifathistorisyang mendukungDSS (Decision SuportSystem) danEIS (Executive Information System). ‰Salinandaritransaksidata yang terstruktursecaraspesifikpadaquery dananalisa. ‰Salinandaritransaksidata yang terstrukturspesifikuntukquery danlaporan Tujuan: ‰Meningkatkankualitasdanakurasiinformasibisnisdanmengirimkaninformasikepemakaidalambentukyang dimengertidandapatdiaksesdenganmudah.
  • 19. 28 September 2005 Pendahuluan dan Proses KDD 19 Ciri-ciriData Warehouse Terdapat4 karateristikdata warehouse •Subject oriented –Data yang disusunmenurutsubyekberisihanyainformasiyang pentingbagipemprosesandecision support. –Database yang semuainformasiyang tersimpandikelompokkanberdasarkansubyektertentumisalnya: pelanggan, gudang, pasar, dsb. –SemuaInformasitersebutdisimpandalamsuatusistemdata warehouse. –Data-data disetiapsubyekdirangkumkedalamdimensi, misalnya: periodewaktu, produk, wilayah, dsb, sehinggadapatmemberikannilaisejarahuntukbahananalisa. •Integrated –Jikadata terletakpadaberbagaiaplikasiyang terpisahdalamsuatulingkunganoperasional, encoding data seringtidakseragamsehingggabiladata dipindahkankedata warehouse makacoding akandiasumsikansama sepertilazimnya. •Time-variant –Data warehouse adalahtempatuntukstoring data selama5 sampai10 tahunataulebih, data digunakanuntukperbandinganatauperkiraandandata initidakdapatdiperbaharui. •Non volatile –Data tidakdapatdiperbaharuiataudirubahtetapihanyadapatditambahdandilihat.
  • 20. 28 September 2005 Pendahuluan dan Proses KDD 20 Masalah-masalahdalammenerapkanData warehouse : •Dokumentasidanpengelolaanmetadata daridata warehouse. •Penentuanaturandalamprosestransformasiuntukmemetakanberbagaisumberlegacy data yang akandimasukkankedalamdata warehouse. •Pencapaianprosespengembanganyang handal, baikdalammembangun, mempimplementasikan, maupunmemeliharadata warehouse.
  • 21. 28 September 2005 Pendahuluan dan Proses KDD 21 Data Preprocessing ‰Data preprocessing menerangkantipe-tipeprosesyang melaksanakandata mentahuntukmempersiapkanprosesproseduryang lainnya. ‰Dalamdata mining menstrasformasidata kesuatuformat yang prosesnyalebihmudahdanefektifuntukkebutuhanpemakai, contohnyaNeural Network. ‰Terdapatbeberapaalatdanmetodeyang berbedayang digunakanuntukpreprocessing seperti: –Sampling : menyeleksisubset representatifdaripopulasidata yang besar. –Transformation : memanipulasidata mentahuntukmenghasilkaninput tunggal. –Denoising: menghilangkannoise daridata –Normalization : mengorganisasidata untukpengaksesanyang lebihspesifik –Feature extration: membukaspesifikasidata yang signifikandalamkontekstertentu.
  • 22. 28 September 2005 Pendahuluan dan Proses KDD 22 Knowledge Discovery In Database (KDD) ‰KDD berhubungandenganteknikintegrasidanpenemuanilmiah, interprestasi danvisualisasidaripola-polasejumlahkumpulandata. ‰Knowledge discoveryin databases(KDD) adalahkeseluruhanprosesnon-trivial untukmencaridanmengidentifikasipola(pattern) dalamdata, dimanapolayang ditemukanbersifatsah, baru, dapatbermanfaatdandapatdimengerti.
  • 23. Gambar. 1. TahapanKDD 28 September 2005 Pendahuluan dan Proses KDD 23
  • 24. 28 September 2005 Pendahuluan dan Proses KDD 24 TahapanProsesKDD1.Data Selection–Menciptakanhimpunandata target , pemilihanhimpunandata, ataumemfokuskanpadasubset variabelatausampeldata, dimanapenemuan(discovery) akandilakukan. –Pemilihan(seleksi) data darisekumpulandata operasionalperludilakukansebelumtahappenggalianinformasidalamKDD dimulai. Data hasilseleksiyang akandigunakanuntukprosesdata mining, disimpandalamsuatuberkas, terpisahdaribasis data operasional.
  • 25. 28 September 2005 Pendahuluan dan Proses KDD 25 2. Pre-processing/ Cleaning –Pemprosesanpendahuluandanpembersihandata merupakanoperasidasarsepertipenghapusannoise dilakukan. –Sebelumprosesdata miningdapatdilaksanakan, perludilakukanprosescleaningpadadata yang menjadifokusKDD. –Prosescleaning mencakupantaralain membuangduplikasidata, memeriksadata yang inkonsisten, danmemperbaikikesalahanpadadata, sepertikesalahancetak(tipografi). –Dilakukanprosesenrichment, yaituproses“memperkaya” data yang sudahadadengandata atauinformasilain yang relevandandiperlukanuntukKDD, sepertidata atauinformasieksternal.
  • 26. 28 September 2005 Pendahuluan dan Proses KDD 26 3.Transformation –Pencarianfitur-fituryang bergunauntukmempresentasikandata bergantungkepadagoal yang ingindicapai. –Merupakanprosestransformasipadadata yang telahdipilih, sehinggadata tersebutsesuaiuntukprosesdata mining. Prosesinimerupakanproseskreatifdansangattergantungpadajenisataupolainformasiyang akandicaridalambasis data
  • 27. 28 September 2005 Pendahuluan dan Proses KDD 27 4.Data mining –Pemilihantugasdata mining; pemilihangoal dariprosesKDD misalnyaklasifikasi, regresi, clustering, dll. –Pemilihanalgoritmadata mining untukpencarian(searching) –ProsesData miningyaituprosesmencaripolaatauinformasimenarikdalamdata terpilihdenganmenggunakanteknikataumetodetertentu. Teknik, metode, ataualgoritmadalamdata miningsangatbervariasi. Pemilihanmetodeataualgoritmayang tepatsangatbergantungpadatujuandanprosesKDD secarakeseluruhan.
  • 28. 28 September 2005 Pendahuluan dan Proses KDD 28 5. Interpretation/ Evaluation –Penerjemahanpola-polayang dihasilkandaridata mining. –Polainformasiyang dihasilkandariprosesdata miningperluditampilkandalambentukyang mudahdimengertiolehpihakyang berkepentingan. –TahapinimerupakanbagiandariprosesKDD yang mencakuppemeriksaanapakahpolaatauinformasiyang ditemukanbertentangandenganfaktaatauhipotesayang adasebelumnya.