SlideShare a Scribd company logo

Jawaban No. 2 Tahap-Tahap Data Mining Karena DM adalah suatu ...

B
butest

Tahapan data mining terdiri dari pembersihan data, integrasi data, transformasi data, teknik data mining, evaluasi pola, dan presentasi pengetahuan. Proses ini bersifat interaktif dengan pengguna untuk menemukan pola dan informasi menarik dari data.

1 of 6
Download to read offline
Jawaban No. 2<br />Tahap-Tahap Data Mining <br />Karena DM adalah suatu rangkaian proses, DM dapat dibagi menjadi beberapa tahap yang diilustrasikan di Gambar 1[4]: <br />1. Pembersihan data (untuk membuang data yang tidak konsisten dan noise) <br />2. Integrasi data (penggabungan data dari beberapa sumber) <br />3. Transformasi data (data diubah menjadi bentuk yang sesuai untuk di-mining) <br />4. Aplikasi teknik DM <br />5. Evaluasi pola yang ditemukan (untuk menemukan yang menarik/bernilai) <br />6. Presentasi pengetahuan (dengan teknik visualisasi) <br />12192015240<br />Gambar 1 : Tahap-Tahap Data Mining <br />Tahap-tahap tsb. bersifat interaktif di mana pemakai terlibat langsung atau dengan perantaraan knowledge base.<br />Selection – Pemilihan atau penyeleksian data dari sekumpulan data operasional yang dilakukan sebelum tahap penggalian informasi dalam KDD dimulai. Dalam tahapan ini, kita memilih data-data seperti apa saja yang kita butuhkan untuk diproses lebih lanjut. <br />2. Preprocessing – Pada umumnya data yang diperoleh, baik dari database suatu perusahaan maupun hasil eksperimen, memiliki isian-isian yang tidak sempurna seperti data yang hilang, data yang tidak valid atau juga hanya sekedar salah ketik. Selain itu, ada juga atribut-atribut data yang tidak relevan dengan hipotesa data mining yang kita miliki. Data-data yang tidak relevan itu juga lebih baik dibuang karena keberadaannya bisa mengurangi mutu atau akurasi dari hasil data mining nantinya. “Garbage in garbage out” (hanya sampah yang akan dihasilkan bila yang dimasukkan juga sampah) merupakan istilah yang sering dipakai untuk menggambarkan tahap ini. Pembersihan data juga akan mempengaruhi performasi dari sistem data mining karena data yang ditangani akan berkurang jumlah dan kompleksitasnya. <br />3. Transformation – Beberapa teknik data mining membutuhkan format data yang khusus sebelum bisa diaplikasikan. Sebagai contoh beberapa teknik standar seperti analisis asosiasi dan klastering hanya bisa menerima input data kategorikal. Karenanya data berupa angka numerik yang berlanjut perlu dibagi-bagi menjadi beberapa interval. Proses ini sering disebut binning. Disini juga dilakukan pemilihan data yang diperlukan oleh teknik data mining yang dipakai. Transformasi dan pemilihan data ini juga menentukan kualitas dari hasil data mining nantinya karena ada beberapa karakteristik dari teknik-teknik data mining tertentu yang tergantung pada tahapan ini. <br />4. Data mining – Data mining merupakan proses untuk mencari pola atau informasi menarik dalam data terpilih dengan menggunakan teknik atau metode tertentu. Teknik, metode, atau algoritma dalam data mining sangat bervariasi. Pemilihan metode atau algoritma yang tepat sangat bergantung pada tujuan dan proses KDD secara keseluruhan. <br />5. Interpretation and evaluation – Pola informasi yang dihasilkan dari proses data mining perlu ditampilkan dalam bentuk yang mudah dimengerti. Tahap ini merupakan bagian dari proses KDD yang mencakup pemeriksaan apakah pola atau informasi yang ditemukan bertentangan dengan fakta atau hipotesa yang ada sebelumnya.<br />Jawaban No. 6<br />Ada beberapa teknik dalam Agglomerative methods yaitu: <br />a) Single linkage (nearest neighbor methods) <br />Metode ini menggunakan prinsip jarak minimum yang diawali dengan mencari dua obyek terdekat dan keduanya membentuk cluster yang pertama. <br />Pada langkah selanjutnya terdapat dua kemungkinan, yaitu :<br />• obyek ketiga akan bergabung dengan cluster yang telah terbentuk, atau <br />• dua obyek lainnya akan membentu cluster baru. <br />Proses ini akan berlanjut sampai akhirnya terbentuk cluster tunggal. Pada metode ini jarak antar cluster didefinisikan sebagai jarak terdekat antar anggotanya.<br />Langkah penyelesaiannya : <br />1. Mencari obyek dengan jarak minimum <br />A dan B mempunyai jarak terdekat, yaitu 1.0 maka obyek A dan A bergabung menjadi satu cluster. <br />2. Menghitung jarak antara cluster AB dengan obyek lainnya. <br />D(AB)C = min {dAC, dBC}= dBC = 3.0 <br />D(AB)D = min {dAD, dBD}= dAD = 6.0 <br />D(AB)E = min {dAE, dBE}= dBE = 7.0 <br />Dengan demikian terbentu matriks jarak yang baru<br />Mencari obyek dengan jarak terdekat <br />D dan E mempunyai jarak yang terdekat yaitu 2.0 maka obyek D dan E bergabung menjadi satu cluster. <br />4. menghitung jarak antara cluster dengan obyek lainnya. <br />D(AB)C = 3.0 <br />D(AB)(DE) = min {dAD, dAE, dBD, dBE} = dAD = 6.0<br />D(DE)C = min {dCD, dCE} = dCD = 4.0 <br />5. Mencari jarak terdekat antara cluster dengan obyek dan diperoleh obyek C bergabung dengan cluster AB <br />6. Pada langkah yang terakhir, cluster ABC bergabung dengan DE sehingga terbentuk cluster tunggal. <br />Jawaban No. 4<br />Proses untuk mengelompokkan secara fisik atau abstrak obyek-obyek ke dalam<br />bentuk kelas-kelas atau obyek-obyek yang serupa,disebut dengan clustering atau<br />unsupervised classification. Melakukan analisa dengan clustering, akan sangat<br />membantu untuk membentuk partisi-parti si yang berguna terhadap sejumlah besar<br />himpunan obyek dengan didasarkan pada prinsip quot;
divide and conquerquot;
 yang<br />mendekomposisikan suatu sistem skala besar, menjadi komponen-komponen yang lebih<br />kecil, untuk menyederhanakan proses desain dan implementasi<br />Jawaban no. 3<br />DATA WAREHOUSE adalah suatu koleksi data yang bisa digunakan untuk menunjang pengambilan keputusan manajemen, yang berorientasi subjek (topik), terpadu, time variant, dan tidak mudah berubah  (W.H.Inmon)<br />Data Warehouse membantu para pekerja teknologi (manager,executive,analyst) untuk pengambilan keputusan yang lebih cepat dan mudah <br />Data warehouse memungkinkan user untuk memeriksa history data dan melakukan analisis terhadap data sehingga dapat mengambil keputusan berdasarkan analisa yang dibuat <br />DATA MINING adalah usaha penemuan pengetahuan di intelejensia buatan (bidang machine learning) atau analisis statistik dengan mencari atau menemukan aturan-aturan, pola-pola dan struktur dari himpunan data yang besar.<br />Data mining mengotomatisasi proses pencarian informasi pemprediksi di dalam basis data yang besar. Pertanyaan-pertanyaan yang berkaitan dengan prediksi ini dapat cepat dijawab langsung dari data yang tersedia.<br />Contoh dari masalah prediksi ini misalnya target pemasaran,peramalan kebangkrutan dan bentuk bentuk kerugian lainnya.<br />Beda data mining dengan data warehouse dan OLAP (On-line Analytical Processing)? Adalah teknologi yang ada di data warehouse dan OLAP dimanfaatkan penuh untuk melakukan data mining. <br />bahwa teknologi data warehouse digunakan untuk melakukan OLAP, sedangkan data mining digunakan untuk melakukan information discovery yang informasinya lebih ditujukan untuk seorang Data Analyst dan Business Analyst (dengan ditambah visualisasi tentunya). Dalam prakteknya, data mining juga mengambil data dari data warehouse. Hanya saja aplikasi dari data mining lebih khusus dan lebih spesifik dibandingkan OLAP mengingat database bukan satu-satunya bidang ilmu yang mempengaruhi data mining, banyak lagi bidang ilmu yang turut memperkaya data mining seperti: information science (ilmu informasi), high performance computing, visualisasi, machine learning, statistik, neural networks (jaringan syaraf tiruan), pemodelan matematika, information retrieval dan information extraction serta pengenalan pola. Bahkan pengolahan citra (image processing) juga digunakan dalam rangka melakukan data mining terhadap data image/spatial.<br />JAWABAN NO. 1<br />Model Data Mining   <br />Prediction Methods<br />Menggunakan beberapa variabel untuk memprediksi sesuatu atau suatu nilai yang akan datang. <br />Description Methods<br /> Mendapatkan pola penafsiran (human-interpretable patterns) untuk menjelaskan data. <br />Data Mining<br />PrediktifDeskriptifKlasifikasiDecision treeAnalisis Time seriesRegresiPrediksiJaringan syaraf tiruan KlasteringSummarizationAturan Asosiasi (Assosiation Rule)Sequence Discovery<br />Salah satu model klasifikasi yang mudah di interpretasikan <br />Contoh : identifikasi pembeli komputer ( dari decision tree di bawah ini ternyata salah satu kelompok yang potensial adalah orang yang berusia < 30 dan pelajar <br />Decision tree (Pohonkeputusan)agestudenCredit ratingyesyesnoyesno<=3031-40>40yesnoexcelentfair<br />Regression<br />Digunakan untuk memetakan data dengan prediksi atribut bernilai real<br />Contoh:<br />Memprediksi jumlah penjualan produk baru pada advertising expenditure.<br />Memprediksi kecepatan memutar (wind velocities) pada fungsi temperatur, tekanan udara , dll <br />
Jawaban No. 2 Tahap-Tahap Data Mining Karena  DM adalah suatu ...
Jawaban No. 2 Tahap-Tahap Data Mining Karena  DM adalah suatu ...
Jawaban No. 2 Tahap-Tahap Data Mining Karena  DM adalah suatu ...
Jawaban No. 2 Tahap-Tahap Data Mining Karena  DM adalah suatu ...
Jawaban No. 2 Tahap-Tahap Data Mining Karena  DM adalah suatu ...

Recommended

Analisa klasifikasi biaya pasien rawat inap menggunakan teknik data mining at...
Analisa klasifikasi biaya pasien rawat inap menggunakan teknik data mining at...Analisa klasifikasi biaya pasien rawat inap menggunakan teknik data mining at...
Analisa klasifikasi biaya pasien rawat inap menggunakan teknik data mining at...Koltiva
 
Data mining week 1 - pengantar data mining
Data mining   week 1 - pengantar data miningData mining   week 1 - pengantar data mining
Data mining week 1 - pengantar data miningLye Lazar
 
Pert 03 introduction dm 2012
Pert 03 introduction dm 2012Pert 03 introduction dm 2012
Pert 03 introduction dm 2012aiiniR
 
Jurnal biaya pasien rawat inap penyakit jantung
Jurnal biaya pasien rawat inap penyakit jantungJurnal biaya pasien rawat inap penyakit jantung
Jurnal biaya pasien rawat inap penyakit jantungAndy Murtanto
 

More Related Content

What's hot

What's hot (20)

Arsitektur dan model data mining
Arsitektur dan model data miningArsitektur dan model data mining
Arsitektur dan model data mining
 
26813 9 arsitektur data mining
26813 9 arsitektur data mining26813 9 arsitektur data mining
26813 9 arsitektur data mining
 
bds spatial data mining
bds spatial data miningbds spatial data mining
bds spatial data mining
 
Nelson weldy
Nelson weldyNelson weldy
Nelson weldy
 
Bab ii isolehfix 1
Bab ii isolehfix 1Bab ii isolehfix 1
Bab ii isolehfix 1
 
P1 data mining
P1  data mining P1  data mining
P1 data mining
 
fuzzyShp
fuzzyShpfuzzyShp
fuzzyShp
 
Kecerdasan bisnis- Sistem Penunjang Keputusan
Kecerdasan bisnis- Sistem Penunjang KeputusanKecerdasan bisnis- Sistem Penunjang Keputusan
Kecerdasan bisnis- Sistem Penunjang Keputusan
 
Data warehouse dan data mining dianvs.blogspot.com
Data warehouse dan data mining dianvs.blogspot.comData warehouse dan data mining dianvs.blogspot.com
Data warehouse dan data mining dianvs.blogspot.com
 
Kecerdasan bisnis
Kecerdasan bisnisKecerdasan bisnis
Kecerdasan bisnis
 
17. sarah fadilah implementasi data mining untuk pengenalan karakteristik t...
17. sarah fadilah   implementasi data mining untuk pengenalan karakteristik t...17. sarah fadilah   implementasi data mining untuk pengenalan karakteristik t...
17. sarah fadilah implementasi data mining untuk pengenalan karakteristik t...
 
15749 5 pengelompokkan data mining
15749 5 pengelompokkan data mining15749 5 pengelompokkan data mining
15749 5 pengelompokkan data mining
 
Modul praktikum 3 cluster
Modul praktikum 3   clusterModul praktikum 3   cluster
Modul praktikum 3 cluster
 
data mining
data miningdata mining
data mining
 
Karakteristik data warehouse
Karakteristik data warehouseKarakteristik data warehouse
Karakteristik data warehouse
 
Tugas 1 dm1
Tugas 1 dm1Tugas 1 dm1
Tugas 1 dm1
 
penggunaan condition pada C++ (devc++) dan penjelasannya
penggunaan condition pada C++ (devc++) dan penjelasannyapenggunaan condition pada C++ (devc++) dan penjelasannya
penggunaan condition pada C++ (devc++) dan penjelasannya
 
Konsep Data Mining
Konsep Data MiningKonsep Data Mining
Konsep Data Mining
 
484 922-1-pb
484 922-1-pb484 922-1-pb
484 922-1-pb
 
Tugas 1 data mining publish
Tugas 1 data mining publishTugas 1 data mining publish
Tugas 1 data mining publish
 

Similar to Jawaban No. 2 Tahap-Tahap Data Mining Karena DM adalah suatu ...

Pertemuan 3 Model Data Mining.pptx
Pertemuan 3 Model Data Mining.pptxPertemuan 3 Model Data Mining.pptx
Pertemuan 3 Model Data Mining.pptxArwansyahDipanegara
 
MODUL DATA MINING
MODUL DATA MININGMODUL DATA MINING
MODUL DATA MININGNanzalXIV
 
Pertemuan 10 - Metodologi Data Science - Copy.pptx
Pertemuan 10 - Metodologi Data Science - Copy.pptxPertemuan 10 - Metodologi Data Science - Copy.pptx
Pertemuan 10 - Metodologi Data Science - Copy.pptxFennyRahmayani
 
Jurnal metode clustering dengan algoritma fuzzy c means untuk rekomendasi pem...
Jurnal metode clustering dengan algoritma fuzzy c means untuk rekomendasi pem...Jurnal metode clustering dengan algoritma fuzzy c means untuk rekomendasi pem...
Jurnal metode clustering dengan algoritma fuzzy c means untuk rekomendasi pem...ym.ygrex@comp
 
TUGAS 1 KEL 4 SISTEM LOGISTIK.pptx
TUGAS 1 KEL 4 SISTEM LOGISTIK.pptxTUGAS 1 KEL 4 SISTEM LOGISTIK.pptx
TUGAS 1 KEL 4 SISTEM LOGISTIK.pptxSangrian1
 
Analisis dan penyajian data
Analisis dan penyajian dataAnalisis dan penyajian data
Analisis dan penyajian dataKacung Abdullah
 
Data Mining Diskusi 3.pdf
Data Mining Diskusi 3.pdfData Mining Diskusi 3.pdf
Data Mining Diskusi 3.pdfHendroGunawan8
 
10 feature engineering-univ-gunadarma
10 feature engineering-univ-gunadarma10 feature engineering-univ-gunadarma
10 feature engineering-univ-gunadarmaArdianDwiPraba
 
ppt metopen kel 09.pptx
ppt metopen kel 09.pptxppt metopen kel 09.pptx
ppt metopen kel 09.pptxRahmaNatasyah
 
99 1-414-2-10-20190724
99 1-414-2-10-2019072499 1-414-2-10-20190724
99 1-414-2-10-20190724ssuser82ed8e
 
Materi Data Science Teknik Informatika Politeknik TEDC
Materi Data Science Teknik Informatika Politeknik TEDCMateri Data Science Teknik Informatika Politeknik TEDC
Materi Data Science Teknik Informatika Politeknik TEDCcastakaagussugianto
 
Proses Data: Analisis Data Eksploratori - Modul Ajar Kuliah 07
Proses Data: Analisis Data Eksploratori - Modul Ajar Kuliah 07Proses Data: Analisis Data Eksploratori - Modul Ajar Kuliah 07
Proses Data: Analisis Data Eksploratori - Modul Ajar Kuliah 07Arif Rahman
 
Materi Kuliah Data Mining full
Materi Kuliah Data Mining fullMateri Kuliah Data Mining full
Materi Kuliah Data Mining fullMunajat ( Munjob )
 
01 pengantar kdd
01 pengantar kdd01 pengantar kdd
01 pengantar kddAslam Janto
 
Procceding_KNIT_2_97-102_AndikaDwiHadiri
Procceding_KNIT_2_97-102_AndikaDwiHadiriProcceding_KNIT_2_97-102_AndikaDwiHadiri
Procceding_KNIT_2_97-102_AndikaDwiHadiriAndika Dwi Hadiri
 

Similar to Jawaban No. 2 Tahap-Tahap Data Mining Karena DM adalah suatu ... (20)

Pertemuan 3 Model Data Mining.pptx
Pertemuan 3 Model Data Mining.pptxPertemuan 3 Model Data Mining.pptx
Pertemuan 3 Model Data Mining.pptx
 
MODUL DATA MINING
MODUL DATA MININGMODUL DATA MINING
MODUL DATA MINING
 
BAB_5_Data_Mining.ppt
BAB_5_Data_Mining.pptBAB_5_Data_Mining.ppt
BAB_5_Data_Mining.ppt
 
Pertemuan 4.pdf
Pertemuan 4.pdfPertemuan 4.pdf
Pertemuan 4.pdf
 
Pertemuan 10 - Metodologi Data Science - Copy.pptx
Pertemuan 10 - Metodologi Data Science - Copy.pptxPertemuan 10 - Metodologi Data Science - Copy.pptx
Pertemuan 10 - Metodologi Data Science - Copy.pptx
 
Jurnal metode clustering dengan algoritma fuzzy c means untuk rekomendasi pem...
Jurnal metode clustering dengan algoritma fuzzy c means untuk rekomendasi pem...Jurnal metode clustering dengan algoritma fuzzy c means untuk rekomendasi pem...
Jurnal metode clustering dengan algoritma fuzzy c means untuk rekomendasi pem...
 
TUGAS 1 KEL 4 SISTEM LOGISTIK.pptx
TUGAS 1 KEL 4 SISTEM LOGISTIK.pptxTUGAS 1 KEL 4 SISTEM LOGISTIK.pptx
TUGAS 1 KEL 4 SISTEM LOGISTIK.pptx
 
Analisis dan penyajian data
Analisis dan penyajian dataAnalisis dan penyajian data
Analisis dan penyajian data
 
Data Mining Diskusi 3.pdf
Data Mining Diskusi 3.pdfData Mining Diskusi 3.pdf
Data Mining Diskusi 3.pdf
 
10 feature engineering-univ-gunadarma
10 feature engineering-univ-gunadarma10 feature engineering-univ-gunadarma
10 feature engineering-univ-gunadarma
 
ppt metopen kel 09.pptx
ppt metopen kel 09.pptxppt metopen kel 09.pptx
ppt metopen kel 09.pptx
 
LN s10-machine vision-s2
LN s10-machine vision-s2LN s10-machine vision-s2
LN s10-machine vision-s2
 
99 1-414-2-10-20190724
99 1-414-2-10-2019072499 1-414-2-10-20190724
99 1-414-2-10-20190724
 
Modul klasifikasi decission tree modul klasifikasi
Modul klasifikasi decission tree modul klasifikasiModul klasifikasi decission tree modul klasifikasi
Modul klasifikasi decission tree modul klasifikasi
 
Materi Data Science Teknik Informatika Politeknik TEDC
Materi Data Science Teknik Informatika Politeknik TEDCMateri Data Science Teknik Informatika Politeknik TEDC
Materi Data Science Teknik Informatika Politeknik TEDC
 
Proses Data: Analisis Data Eksploratori - Modul Ajar Kuliah 07
Proses Data: Analisis Data Eksploratori - Modul Ajar Kuliah 07Proses Data: Analisis Data Eksploratori - Modul Ajar Kuliah 07
Proses Data: Analisis Data Eksploratori - Modul Ajar Kuliah 07
 
Materi Kuliah Data Mining full
Materi Kuliah Data Mining fullMateri Kuliah Data Mining full
Materi Kuliah Data Mining full
 
mengelola sumber data
mengelola sumber datamengelola sumber data
mengelola sumber data
 
01 pengantar kdd
01 pengantar kdd01 pengantar kdd
01 pengantar kdd
 
Procceding_KNIT_2_97-102_AndikaDwiHadiri
Procceding_KNIT_2_97-102_AndikaDwiHadiriProcceding_KNIT_2_97-102_AndikaDwiHadiri
Procceding_KNIT_2_97-102_AndikaDwiHadiri
 

More from butest

EL MODELO DE NEGOCIO DE YOUTUBE
EL MODELO DE NEGOCIO DE YOUTUBEEL MODELO DE NEGOCIO DE YOUTUBE
EL MODELO DE NEGOCIO DE YOUTUBEbutest
 
1. MPEG I.B.P frame之不同
1. MPEG I.B.P frame之不同1. MPEG I.B.P frame之不同
1. MPEG I.B.P frame之不同butest
 
LESSONS FROM THE MICHAEL JACKSON TRIAL
LESSONS FROM THE MICHAEL JACKSON TRIALLESSONS FROM THE MICHAEL JACKSON TRIAL
LESSONS FROM THE MICHAEL JACKSON TRIALbutest
 
Timeline: The Life of Michael Jackson
Timeline: The Life of Michael JacksonTimeline: The Life of Michael Jackson
Timeline: The Life of Michael Jacksonbutest
 
Popular Reading Last Updated April 1, 2010 Adams, Lorraine The ...
Popular Reading Last Updated April 1, 2010 Adams, Lorraine The ...Popular Reading Last Updated April 1, 2010 Adams, Lorraine The ...
Popular Reading Last Updated April 1, 2010 Adams, Lorraine The ...butest
 
LESSONS FROM THE MICHAEL JACKSON TRIAL
LESSONS FROM THE MICHAEL JACKSON TRIALLESSONS FROM THE MICHAEL JACKSON TRIAL
LESSONS FROM THE MICHAEL JACKSON TRIALbutest
 
Com 380, Summer II
Com 380, Summer IICom 380, Summer II
Com 380, Summer IIbutest
 
The MYnstrel Free Press Volume 2: Economic Struggles, Meet Jazz
The MYnstrel Free Press Volume 2: Economic Struggles, Meet JazzThe MYnstrel Free Press Volume 2: Economic Struggles, Meet Jazz
The MYnstrel Free Press Volume 2: Economic Struggles, Meet Jazzbutest
 
MICHAEL JACKSON.doc
MICHAEL JACKSON.docMICHAEL JACKSON.doc
MICHAEL JACKSON.docbutest
 
Social Networks: Twitter Facebook SL - Slide 1
Social Networks: Twitter Facebook SL - Slide 1Social Networks: Twitter Facebook SL - Slide 1
Social Networks: Twitter Facebook SL - Slide 1butest
 
Facebook
Facebook Facebook
Facebook butest
 
Executive Summary Hare Chevrolet is a General Motors dealership ...
Executive Summary Hare Chevrolet is a General Motors dealership ...Executive Summary Hare Chevrolet is a General Motors dealership ...
Executive Summary Hare Chevrolet is a General Motors dealership ...butest
 
Welcome to the Dougherty County Public Library's Facebook and ...
Welcome to the Dougherty County Public Library's Facebook and ...Welcome to the Dougherty County Public Library's Facebook and ...
Welcome to the Dougherty County Public Library's Facebook and ...butest
 
NEWS ANNOUNCEMENT
NEWS ANNOUNCEMENTNEWS ANNOUNCEMENT
NEWS ANNOUNCEMENTbutest
 
C-2100 Ultra Zoom.doc
C-2100 Ultra Zoom.docC-2100 Ultra Zoom.doc
C-2100 Ultra Zoom.docbutest
 
MAC Printing on ITS Printers.doc.doc
MAC Printing on ITS Printers.doc.docMAC Printing on ITS Printers.doc.doc
MAC Printing on ITS Printers.doc.docbutest
 
Mac OS X Guide.doc
Mac OS X Guide.docMac OS X Guide.doc
Mac OS X Guide.docbutest
 
WEB DESIGN!
WEB DESIGN!WEB DESIGN!
WEB DESIGN!butest
 

More from butest (20)

EL MODELO DE NEGOCIO DE YOUTUBE
EL MODELO DE NEGOCIO DE YOUTUBEEL MODELO DE NEGOCIO DE YOUTUBE
EL MODELO DE NEGOCIO DE YOUTUBE
 
1. MPEG I.B.P frame之不同
1. MPEG I.B.P frame之不同1. MPEG I.B.P frame之不同
1. MPEG I.B.P frame之不同
 
LESSONS FROM THE MICHAEL JACKSON TRIAL
LESSONS FROM THE MICHAEL JACKSON TRIALLESSONS FROM THE MICHAEL JACKSON TRIAL
LESSONS FROM THE MICHAEL JACKSON TRIAL
 
Timeline: The Life of Michael Jackson
Timeline: The Life of Michael JacksonTimeline: The Life of Michael Jackson
Timeline: The Life of Michael Jackson
 
Popular Reading Last Updated April 1, 2010 Adams, Lorraine The ...
Popular Reading Last Updated April 1, 2010 Adams, Lorraine The ...Popular Reading Last Updated April 1, 2010 Adams, Lorraine The ...
Popular Reading Last Updated April 1, 2010 Adams, Lorraine The ...
 
LESSONS FROM THE MICHAEL JACKSON TRIAL
LESSONS FROM THE MICHAEL JACKSON TRIALLESSONS FROM THE MICHAEL JACKSON TRIAL
LESSONS FROM THE MICHAEL JACKSON TRIAL
 
Com 380, Summer II
Com 380, Summer IICom 380, Summer II
Com 380, Summer II
 
PPT
PPTPPT
PPT
 
The MYnstrel Free Press Volume 2: Economic Struggles, Meet Jazz
The MYnstrel Free Press Volume 2: Economic Struggles, Meet JazzThe MYnstrel Free Press Volume 2: Economic Struggles, Meet Jazz
The MYnstrel Free Press Volume 2: Economic Struggles, Meet Jazz
 
MICHAEL JACKSON.doc
MICHAEL JACKSON.docMICHAEL JACKSON.doc
MICHAEL JACKSON.doc
 
Social Networks: Twitter Facebook SL - Slide 1
Social Networks: Twitter Facebook SL - Slide 1Social Networks: Twitter Facebook SL - Slide 1
Social Networks: Twitter Facebook SL - Slide 1
 
Facebook
Facebook Facebook
Facebook
 
Executive Summary Hare Chevrolet is a General Motors dealership ...
Executive Summary Hare Chevrolet is a General Motors dealership ...Executive Summary Hare Chevrolet is a General Motors dealership ...
Executive Summary Hare Chevrolet is a General Motors dealership ...
 
Welcome to the Dougherty County Public Library's Facebook and ...
Welcome to the Dougherty County Public Library's Facebook and ...Welcome to the Dougherty County Public Library's Facebook and ...
Welcome to the Dougherty County Public Library's Facebook and ...
 
NEWS ANNOUNCEMENT
NEWS ANNOUNCEMENTNEWS ANNOUNCEMENT
NEWS ANNOUNCEMENT
 
C-2100 Ultra Zoom.doc
C-2100 Ultra Zoom.docC-2100 Ultra Zoom.doc
C-2100 Ultra Zoom.doc
 
MAC Printing on ITS Printers.doc.doc
MAC Printing on ITS Printers.doc.docMAC Printing on ITS Printers.doc.doc
MAC Printing on ITS Printers.doc.doc
 
Mac OS X Guide.doc
Mac OS X Guide.docMac OS X Guide.doc
Mac OS X Guide.doc
 
hier
hierhier
hier
 
WEB DESIGN!
WEB DESIGN!WEB DESIGN!
WEB DESIGN!
 

Jawaban No. 2 Tahap-Tahap Data Mining Karena DM adalah suatu ...

  • 1. Jawaban No. 2<br />Tahap-Tahap Data Mining <br />Karena DM adalah suatu rangkaian proses, DM dapat dibagi menjadi beberapa tahap yang diilustrasikan di Gambar 1[4]: <br />1. Pembersihan data (untuk membuang data yang tidak konsisten dan noise) <br />2. Integrasi data (penggabungan data dari beberapa sumber) <br />3. Transformasi data (data diubah menjadi bentuk yang sesuai untuk di-mining) <br />4. Aplikasi teknik DM <br />5. Evaluasi pola yang ditemukan (untuk menemukan yang menarik/bernilai) <br />6. Presentasi pengetahuan (dengan teknik visualisasi) <br />12192015240<br />Gambar 1 : Tahap-Tahap Data Mining <br />Tahap-tahap tsb. bersifat interaktif di mana pemakai terlibat langsung atau dengan perantaraan knowledge base.<br />Selection – Pemilihan atau penyeleksian data dari sekumpulan data operasional yang dilakukan sebelum tahap penggalian informasi dalam KDD dimulai. Dalam tahapan ini, kita memilih data-data seperti apa saja yang kita butuhkan untuk diproses lebih lanjut. <br />2. Preprocessing – Pada umumnya data yang diperoleh, baik dari database suatu perusahaan maupun hasil eksperimen, memiliki isian-isian yang tidak sempurna seperti data yang hilang, data yang tidak valid atau juga hanya sekedar salah ketik. Selain itu, ada juga atribut-atribut data yang tidak relevan dengan hipotesa data mining yang kita miliki. Data-data yang tidak relevan itu juga lebih baik dibuang karena keberadaannya bisa mengurangi mutu atau akurasi dari hasil data mining nantinya. “Garbage in garbage out” (hanya sampah yang akan dihasilkan bila yang dimasukkan juga sampah) merupakan istilah yang sering dipakai untuk menggambarkan tahap ini. Pembersihan data juga akan mempengaruhi performasi dari sistem data mining karena data yang ditangani akan berkurang jumlah dan kompleksitasnya. <br />3. Transformation – Beberapa teknik data mining membutuhkan format data yang khusus sebelum bisa diaplikasikan. Sebagai contoh beberapa teknik standar seperti analisis asosiasi dan klastering hanya bisa menerima input data kategorikal. Karenanya data berupa angka numerik yang berlanjut perlu dibagi-bagi menjadi beberapa interval. Proses ini sering disebut binning. Disini juga dilakukan pemilihan data yang diperlukan oleh teknik data mining yang dipakai. Transformasi dan pemilihan data ini juga menentukan kualitas dari hasil data mining nantinya karena ada beberapa karakteristik dari teknik-teknik data mining tertentu yang tergantung pada tahapan ini. <br />4. Data mining – Data mining merupakan proses untuk mencari pola atau informasi menarik dalam data terpilih dengan menggunakan teknik atau metode tertentu. Teknik, metode, atau algoritma dalam data mining sangat bervariasi. Pemilihan metode atau algoritma yang tepat sangat bergantung pada tujuan dan proses KDD secara keseluruhan. <br />5. Interpretation and evaluation – Pola informasi yang dihasilkan dari proses data mining perlu ditampilkan dalam bentuk yang mudah dimengerti. Tahap ini merupakan bagian dari proses KDD yang mencakup pemeriksaan apakah pola atau informasi yang ditemukan bertentangan dengan fakta atau hipotesa yang ada sebelumnya.<br />Jawaban No. 6<br />Ada beberapa teknik dalam Agglomerative methods yaitu: <br />a) Single linkage (nearest neighbor methods) <br />Metode ini menggunakan prinsip jarak minimum yang diawali dengan mencari dua obyek terdekat dan keduanya membentuk cluster yang pertama. <br />Pada langkah selanjutnya terdapat dua kemungkinan, yaitu :<br />• obyek ketiga akan bergabung dengan cluster yang telah terbentuk, atau <br />• dua obyek lainnya akan membentu cluster baru. <br />Proses ini akan berlanjut sampai akhirnya terbentuk cluster tunggal. Pada metode ini jarak antar cluster didefinisikan sebagai jarak terdekat antar anggotanya.<br />Langkah penyelesaiannya : <br />1. Mencari obyek dengan jarak minimum <br />A dan B mempunyai jarak terdekat, yaitu 1.0 maka obyek A dan A bergabung menjadi satu cluster. <br />2. Menghitung jarak antara cluster AB dengan obyek lainnya. <br />D(AB)C = min {dAC, dBC}= dBC = 3.0 <br />D(AB)D = min {dAD, dBD}= dAD = 6.0 <br />D(AB)E = min {dAE, dBE}= dBE = 7.0 <br />Dengan demikian terbentu matriks jarak yang baru<br />Mencari obyek dengan jarak terdekat <br />D dan E mempunyai jarak yang terdekat yaitu 2.0 maka obyek D dan E bergabung menjadi satu cluster. <br />4. menghitung jarak antara cluster dengan obyek lainnya. <br />D(AB)C = 3.0 <br />D(AB)(DE) = min {dAD, dAE, dBD, dBE} = dAD = 6.0<br />D(DE)C = min {dCD, dCE} = dCD = 4.0 <br />5. Mencari jarak terdekat antara cluster dengan obyek dan diperoleh obyek C bergabung dengan cluster AB <br />6. Pada langkah yang terakhir, cluster ABC bergabung dengan DE sehingga terbentuk cluster tunggal. <br />Jawaban No. 4<br />Proses untuk mengelompokkan secara fisik atau abstrak obyek-obyek ke dalam<br />bentuk kelas-kelas atau obyek-obyek yang serupa,disebut dengan clustering atau<br />unsupervised classification. Melakukan analisa dengan clustering, akan sangat<br />membantu untuk membentuk partisi-parti si yang berguna terhadap sejumlah besar<br />himpunan obyek dengan didasarkan pada prinsip quot; divide and conquerquot; yang<br />mendekomposisikan suatu sistem skala besar, menjadi komponen-komponen yang lebih<br />kecil, untuk menyederhanakan proses desain dan implementasi<br />Jawaban no. 3<br />DATA WAREHOUSE adalah suatu koleksi data yang bisa digunakan untuk menunjang pengambilan keputusan manajemen, yang berorientasi subjek (topik), terpadu, time variant, dan tidak mudah berubah (W.H.Inmon)<br />Data Warehouse membantu para pekerja teknologi (manager,executive,analyst) untuk pengambilan keputusan yang lebih cepat dan mudah <br />Data warehouse memungkinkan user untuk memeriksa history data dan melakukan analisis terhadap data sehingga dapat mengambil keputusan berdasarkan analisa yang dibuat <br />DATA MINING adalah usaha penemuan pengetahuan di intelejensia buatan (bidang machine learning) atau analisis statistik dengan mencari atau menemukan aturan-aturan, pola-pola dan struktur dari himpunan data yang besar.<br />Data mining mengotomatisasi proses pencarian informasi pemprediksi di dalam basis data yang besar. Pertanyaan-pertanyaan yang berkaitan dengan prediksi ini dapat cepat dijawab langsung dari data yang tersedia.<br />Contoh dari masalah prediksi ini misalnya target pemasaran,peramalan kebangkrutan dan bentuk bentuk kerugian lainnya.<br />Beda data mining dengan data warehouse dan OLAP (On-line Analytical Processing)? Adalah teknologi yang ada di data warehouse dan OLAP dimanfaatkan penuh untuk melakukan data mining. <br />bahwa teknologi data warehouse digunakan untuk melakukan OLAP, sedangkan data mining digunakan untuk melakukan information discovery yang informasinya lebih ditujukan untuk seorang Data Analyst dan Business Analyst (dengan ditambah visualisasi tentunya). Dalam prakteknya, data mining juga mengambil data dari data warehouse. Hanya saja aplikasi dari data mining lebih khusus dan lebih spesifik dibandingkan OLAP mengingat database bukan satu-satunya bidang ilmu yang mempengaruhi data mining, banyak lagi bidang ilmu yang turut memperkaya data mining seperti: information science (ilmu informasi), high performance computing, visualisasi, machine learning, statistik, neural networks (jaringan syaraf tiruan), pemodelan matematika, information retrieval dan information extraction serta pengenalan pola. Bahkan pengolahan citra (image processing) juga digunakan dalam rangka melakukan data mining terhadap data image/spatial.<br />JAWABAN NO. 1<br />Model Data Mining <br />Prediction Methods<br />Menggunakan beberapa variabel untuk memprediksi sesuatu atau suatu nilai yang akan datang. <br />Description Methods<br /> Mendapatkan pola penafsiran (human-interpretable patterns) untuk menjelaskan data. <br />Data Mining<br />PrediktifDeskriptifKlasifikasiDecision treeAnalisis Time seriesRegresiPrediksiJaringan syaraf tiruan KlasteringSummarizationAturan Asosiasi (Assosiation Rule)Sequence Discovery<br />Salah satu model klasifikasi yang mudah di interpretasikan <br />Contoh : identifikasi pembeli komputer ( dari decision tree di bawah ini ternyata salah satu kelompok yang potensial adalah orang yang berusia < 30 dan pelajar <br />Decision tree (Pohonkeputusan)agestudenCredit ratingyesyesnoyesno<=3031-40>40yesnoexcelentfair<br />Regression<br />Digunakan untuk memetakan data dengan prediksi atribut bernilai real<br />Contoh:<br />Memprediksi jumlah penjualan produk baru pada advertising expenditure.<br />Memprediksi kecepatan memutar (wind velocities) pada fungsi temperatur, tekanan udara , dll <br />