SlideShare a Scribd company logo
1 of 28
Download to read offline
PERTEMUAN 3 
ARSITEKTUR & MODEL DATA MINING 
28 September 2005 Arsitektur dan Model Data Mining 1
Arsitektur : Sistm Data Mining 
Graphical User Interface (GUI) 
Pattern evaluation 
Data Mining Engine 
Database or data warehouse 
server 
Knowledge-base 
Data clening & data integration Filtering 
Data base Data warehouse 
28 September 2005 Arsitektur dan Model Data Mining 2
Keterangan : 
1. Data cleaning (Pembersihan Data) : untuk membuang data 
yang tidak konsisten dan noise) 
2. Data integration : penggabungan data dari beberapa sumber 
3. Data Mining Engine : Mentranformasikan data menjadi 
bentuk yang sesuai untuk di mining 
4. Pattern evaluation : untuk menemukan yang bernilai melalui 
knowledge base 
5. Graphical User Interface (GUI) : untuk end user 
Semua tahap bersifat interaktif di mana user terlibat langsung 
atau dengan perantaraan knowledge base 
28 September 2005 Arsitektur dan Model Data Mining 3
Model Data Mining 
•Prediction Methods 
–Menggunakan beberapa variabel untuk 
memprediksi sesuatu atau suatu nilai yang 
akan datang. 
•Description Methods 
– Mendapatkan pola penafsiran (human-interpretable 
patterns) untuk menjelaskan 
data. 
28 September 2005 Arsitektur dan Model Data Mining 4
Prediktif 
Data Mining 
Deskriptif 
Klasifikasi 
Decision tree 
Analisis Time series 
Regresi 
Prediksi 
Jaringan syaraf tiruan 
Klastering 
Summarization 
Aturan Asosiasi 
(Assosiation Rule) 
Sequence Discovery 
28 September 2005 Arsitektur dan Model Data Mining 5
Klasifikasi 
 Proses untuk menemukan model atau fungsi yang menjelaskan atau membedakan 
konsep atau kelas data dengan tujuan untuk dapat memprediksi kelas dari suatu 
objek yang labelnya tidak diketahui 
 Contoh : Mendeteksi Penipuan 
 Tujuan : Memprediksi kasus kecurangan transaksi kartu kredit. 
– Pendekatan : 
• Menggunakan transaksi kartu kredit dan informasi dilihat dari atribut 
account holder 
– Kapan cutomer melakukan pembelian, Dengan cara apa customer 
membayar, sebarapa sering customer membayar secara tepat waktu, 
dll 
• Beri nama/tanda transaksi yang telah dilaksanakan sebagai transaksi yang 
curang atau yang baik. Ini sebagai atribut klass ( the class attribute.) 
• Pelajari model untuk class transaksi 
• Gunakan model ini untuk mendetekdi kecurangan dengan meneliti transaksi 
kartu kredit pada account. 
28 September 2005 Arsitektur dan Model Data Mining 6
Regression 
 Digunakan untuk memetakan data dengan prediksi atribut 
bernilai real 
 Contoh: 
– Memprediksi jumlah penjualan produk baru pada 
advertising expenditure. 
– Memprediksi kecepatan memutar (wind velocities) pada 
fungsi temperatur, tekanan udara , dll 
28 September 2005 Arsitektur dan Model Data Mining 7
Decision tree (Pohon keputusan) 
 Salah satu model klasifikasi yang mudah di interpretasikan 
 Contoh : identifikasi pembeli komputer ( dari decision tree di bawah 
ini ternyata salah satu kelompok yang potensial adalah orang yang 
berusia < 30 dan pelajar 
age 
<=30 31-40 >40 
yes 
studen Credit rating 
no yes excelent fair 
no yes no yes 
28 September 2005 Arsitektur dan Model Data Mining 8
Prediksi 
28 September 2005 Arsitektur dan Model Data Mining 9
Neural Network (Jaringan syaraf tiruan) 
 Jaringan syaraf buatan di mulai dengan layer input, dimana tiap 
simpul berkorespondensi dengan variabel prediktor. 
 Simpul- simpul input ini terhubung kebeberapa simpul dalam 
hidden layer. 
 Dan simpul dalam hidden layer dapat terhubung ke simpul lain 
dalam hidden layer atau ke output layer. 
 Output layer terdiri dari satu atau beberapa variable respon 
1 
2 
3 
4 
5 
6 
input 
Hidden layer 
output 
28 September 2005 Arsitektur dan Model Data Mining 10
 Telekomunikasi 
Data mining digunakan untuk melihat jutaan transaksi yang 
masuk dengan tujuan menambah layanan otomatis 
 Keuangan 
Data mining digunakan untuk mendeteksi transaksi-transaksi 
keuangan yang mencurigakan dimana akan 
susah dilakukan jika menggunakan analisis standar. 
 Asuransi 
Australian Health Insurance Commision menggunakan data 
mining untuk mengidentifikasi layanan kesehatan dan 
berhasil menghemat satu juta dollar pertahun 
28 September 2005 Arsitektur dan Model Data Mining 11
 Olah raga 
IBM Advanced Scout menggunakan data mining untuk 
menganalisis statistik permainan NBA dalam rangka competitive 
advantage untuk tim New York Knicks 
 Astronomi 
Jet Propulsion Laboratory (JPL) di Pasadena dan Pulomar 
Observatory menemukan 22 quasar dengan bantuan data 
mining. 
 Internet Web Surf-Aid 
IBM Surf-Aid menggunakan algoritma data mining untuk mendata 
akses halaman Web khususnya berkaitan dengan pemasaran melalui 
web. 
28 September 2005 Arsitektur dan Model Data Mining 12
Tools Data Mining 
 Karateristik-karateristik penting dari tool data mining meliputi : 
– Data preparation facilities 
– Selection of data mining operation (algorithms) 
– Product scalability and performance 
– Facilities for visualization of result 
 Data mining tool, meliputi : 
– Integral Solution Ltd’s Clementine 
– DataMind Corp’s Data Crusher 
– IBM’s Intelligent Miner 
– Silicon Graphics Inc.’s MineSet 
– Informations Discovery Inc.’s Data Mining Suite 
– SAS Institute Inc.’s SAS System and Right Information 
System’Thought. 
28 September 2005 Arsitektur dan Model Data Mining 13
Evolusi Database 
 Th 1960 
– Pengumpulan data, pembuatan data, IMS dan network DBMS 
 Th 1970 
– Model data relasional, Implementasi DBMS relasional 
 Th 1980 
– RDBMS, Model data lanjutan (extended-relational, OO, deductive) 
 Th 1990 
– Data mining, data warehouse, database multimedia, dan Web 
database. 
 Th 2000 
– Stream data managemen dan mining 
– Data mining dengan berbagai variasi aplikasi 
– Teknologi web dan sistem informasi global 
28 September 2005 Arsitektur dan Model Data Mining 14
Teknik – teknik Database 
Searching 
 Searching dilakukan untuk memeriksa serangkaian item yang memiliki sifat-sifat 
yang diinginkan. 
 Tindakan untuk menemukan suatu item tertentu baik yang diketahui 
keberadaannya maupun tidak. 
 Memasukkan kata dalam suatu program komputer untuk membandingkan 
dengan informasi yang ada dalam database. 
Indexing 
 Indexing adalah struktur-struktur akses yang digunakan untuk mempercepat 
respon dalam mendapatkan record-record pada kondisi-kondisi pencarian 
tertentu. 
 Indexing field adalah suatu struktur akses index yang biasanya menjelaskan 
field tunggal dari suatu file. 
 Indexing organization memberikan efisiensi akses ke record-record secara 
berurut atau random. 
28 September 2005 Arsitektur dan Model Data Mining 15
Data Reduction 
 Data reduction adalah transformasi suatu masalah ke masalah 
lain dan dapat digunakan untuk mendefinisikan serangkaian 
masalah yang kompleks. 
 Data reduction merupakan teknik yang digunakan untuk 
mentransformasi dari data mentah ke bentuk format data yang 
lebih berguna. Sebagai contoh groupping, summing dan 
averaging data. 
 Data reduction dilakukan untuk mengatasi ukuran data yang 
terlalu besar. Ukuran data yang terlalu besar dapat menimbulkan 
ketidakefisienan proses dan peningkatan biaya pemrosesan. 
 Data reduction dilakukan dalam tahap data preprocessing pada 
rangkaian proses Knowledge Discovery Databases (KDD) 
sebelum data mining dengan tujuan mengurangi ukuran data 
yang besar. 
28 September 2005 Arsitektur dan Model Data Mining 16
OLAP (On-line analytical processing) 
 OLAP adalah suatu sistem atau teknologi yang dirancang untuk 
mendukung proses analisis kompleks dalam rangka mengungkapkan 
kecenderungan pasar dan faktor-faktor penting dalam bisnis 
 OLAP ditandai dengan kemampuannya menaikkan atau menurunkan 
dimensi data sehingga kita dapat menggali data sampai pada level yang 
sangat detail dan memperoleh pandangan yang lebih luas mengenai 
objek yang sedang kita analisis. 
 OLAP secara khusus memfokuskan pada pembuatan data agar dapat 
diakses pada saat pendefinisian kembali dimensi. 
 OLAP dapat digunakan membuat rangkuman dari multidimensi data 
yang berbeda, rangkuman baru dan mendapatkan respon secara online, 
dan memberikan view dua dimensi pada data cube multidimensi secara 
interaktif. 
28 September 2005 Arsitektur dan Model Data Mining 17
Data Warehouse 
Definisi : 
 Data Warehouse adalah Pusat repositori informasi yang mampu 
memberikan database berorientasi subyek untuk informasi yang 
bersifat historis yang mendukung DSS (Decision Suport System) 
dan EIS (Executive Information System). 
 Salinan dari transaksi data yang terstruktur secara spesifik pada 
query dan analisa. 
 Salinan dari transaksi data yang terstruktur spesifik untuk query 
dan laporan 
Tujuan : 
 Meningkatkan kualitas dan akurasi informasi bisnis dan 
mengirimkan informasi ke pemakai dalam bentuk yang 
dimengerti dan dapat diakses dengan mudah. 
28 September 2005 Arsitektur dan Model Data Mining 18
Ciri-ciri Data Warehouse 
Terdapat 4 karateristik data warehouse 
• Subject oriented 
– Data yang disusun menurut subyek berisi hanya informasi yang penting bagi pemprosesan 
decision support. 
– Database yang semua informasi yang tersimpan di kelompokkan berdasarkan 
subyek tertentu misalnya: pelanggan, gudang, pasar, dsb. 
– Semua Informasi tersebut disimpan dalam suatu sistem data warehouse. 
– Data-data di setiap subyek dirangkum ke dalam dimensi, misalnya : periode 
waktu, produk, wilayah, dsb, sehingga dapat memberikan nilai sejarah untuk 
bahan analisa. 
• Integrated 
– Jika data terletak pada berbagai aplikasi yang terpisah dalam suatu lingkungan 
operasional, encoding data sering tidak seragam sehinggga bila data dipindahkan ke data 
warehouse maka coding akan diasumsikan sama seperti lazimnya. 
• Time-variant 
– Data warehouse adalah tempat untuk storing data selama 5 sampai 10 tahun atau lebih, 
data digunakan untuk perbandingan atau perkiraan dan data ini tidak dapat diperbaharui. 
• Non volatile 
– Data tidak dapat diperbaharui atau dirubah tetapi hanya dapat ditambah dan dilihat. 
28 September 2005 Arsitektur dan Model Data Mining 19
Masalah-masalah dalam menerapkan Data warehouse : 
• Dokumentasi dan pengelolaan metadata dari data 
warehouse. 
• Penentuan aturan dalam proses transformasi untuk 
memetakan berbagai sumber legacy data yang akan 
dimasukkan ke dalam data warehouse. 
• Pencapaian proses pengembangan yang handal, baik 
dalam membangun, mempimplementasikan, maupun 
memelihara data warehouse. 
28 September 2005 Arsitektur dan Model Data Mining 20
Data Preprocessing 
 Data preprocessing menerangkan tipe-tipe proses yang melaksanakan data 
mentah untuk mempersiapkan proses prosedur yang lainnya. 
 Dalam data mining menstrasformasi data ke suatu format yang prosesnya 
lebih mudah dan efektif untuk kebutuhan pemakai, contohnya Neural 
Network. 
 Terdapat beberapa alat dan metode yang berbeda yang digunakan untuk 
preprocessing seperti : 
– Sampling : menyeleksi subset representatif dari populasi data yang 
besar. 
– Transformation : memanipulasi data mentah untuk menghasilkan 
input tunggal. 
– Denoising : menghilangkan noise dari data 
– Normalization : mengorganisasi data untuk pengaksesan yang lebih 
spesifik 
– Feature extration : membuka spesifikasi data yang signifikan dalam 
konteks tertentu. 
28 September 2005 Arsitektur dan Model Data Mining 21
Knowledge Discovery In Database (KDD) 
 KDD berhubungan dengan teknik integrasi dan penemuan 
ilmiah, interprestasi dan visualisasi dari pola-pola 
sejumlah kumpulan data. 
 Knowledge discovery in databases (KDD) adalah 
keseluruhan proses non-trivial untuk mencari dan 
mengidentifikasi pola (pattern) dalam data, dimana pola 
yang ditemukan bersifat sah, baru, dapat bermanfaat dan 
dapat dimengerti. 
28 September 2005 Arsitektur dan Model Data Mining 22
Gambar. 1. Tahapan KDD 
28 September 2005 Arsitektur dan Model Data Mining 23
Tahapan Proses KDD 
3. Data Selection 
– Menciptakan himpunan data target , pemilihan 
himpunan data, atau memfokuskan pada subset variabel 
atau sampel data, dimana penemuan (discovery) akan 
dilakukan. 
– Pemilihan (seleksi) data dari sekumpulan data 
operasional perlu dilakukan sebelum tahap penggalian 
informasi dalam KDD dimulai. Data hasil seleksi yang 
akan digunakan untuk proses data mining, disimpan 
dalam suatu berkas, terpisah dari basis data operasional. 
28 September 2005 Arsitektur dan Model Data Mining 24
2. Pre-processing/ Cleaning 
– Pemprosesan pendahuluan dan pembersihan data merupakan 
operasi dasar seperti penghapusan noise dilakukan. 
– Sebelum proses data mining dapat dilaksanakan, perlu 
dilakukan proses cleaning pada data yang menjadi fokus 
KDD. 
– Proses cleaning mencakup antara lain membuang duplikasi 
data, memeriksa data yang inkonsisten, dan memperbaiki 
kesalahan pada data, seperti kesalahan cetak (tipografi). 
– Dilakukan proses enrichment, yaitu proses “memperkaya” 
data yang sudah ada dengan data atau informasi lain yang 
relevan dan diperlukan untuk KDD, seperti data atau 
informasi eksternal. 
28 September 2005 Arsitektur dan Model Data Mining 25
2. Transformation 
– Pencarian fitur-fitur yang berguna untuk 
mempresentasikan data bergantung kepada goal yang 
ingin dicapai. 
– Merupakan proses transformasi pada data yang telah 
dipilih, sehingga data tersebut sesuai untuk proses data 
mining. Proses ini merupakan proses kreatif dan sangat 
tergantung pada jenis atau pola informasi yang akan 
dicari dalam basis data 
28 September 2005 Arsitektur dan Model Data Mining 26
2. Data mining 
– Pemilihan tugas data mining; pemilihan goal dari proses 
KDD misalnya klasifikasi, regresi, clustering, dll. 
– Pemilihan algoritma data mining untuk pencarian 
(searching) 
– Proses Data mining yaitu proses mencari pola atau 
informasi menarik dalam data terpilih dengan 
menggunakan teknik atau metode tertentu. Teknik, 
metode, atau algoritma dalam data mining sangat 
bervariasi. Pemilihan metode atau algoritma yang tepat 
sangat bergantung pada tujuan dan proses KDD secara 
keseluruhan. 
28 September 2005 Arsitektur dan Model Data Mining 27
5. Interpretation/ Evaluation 
– Penerjemahan pola-pola yang dihasilkan dari data 
mining. 
– Pola informasi yang dihasilkan dari proses data mining 
perlu ditampilkan dalam bentuk yang mudah dimengerti 
oleh pihak yang berkepentingan. 
– Tahap ini merupakan bagian dari proses KDD yang 
mencakup pemeriksaan apakah pola atau informasi 
yang ditemukan bertentangan dengan fakta atau 
hipotesa yang ada sebelumnya. 
28 September 2005 Arsitektur dan Model Data Mining 28

More Related Content

What's hot

5 Macam Metode Dasar Kriptografi
5 Macam Metode Dasar Kriptografi5 Macam Metode Dasar Kriptografi
5 Macam Metode Dasar KriptografiRoziq Bahtiar
 
Arsitektur dan Infrastruktur Data Warehouse
Arsitektur dan Infrastruktur Data WarehouseArsitektur dan Infrastruktur Data Warehouse
Arsitektur dan Infrastruktur Data Warehousededidarwis
 
4 diagram relasi antar entitas (ERD)
4 diagram relasi antar entitas (ERD)4 diagram relasi antar entitas (ERD)
4 diagram relasi antar entitas (ERD)Simon Patabang
 
Analisis sistem-informasi
Analisis sistem-informasiAnalisis sistem-informasi
Analisis sistem-informasiryanprasetya
 
Pertemuan 5 optimasi_dengan_alternatif_terbatas_-_lengkap
Pertemuan 5 optimasi_dengan_alternatif_terbatas_-_lengkapPertemuan 5 optimasi_dengan_alternatif_terbatas_-_lengkap
Pertemuan 5 optimasi_dengan_alternatif_terbatas_-_lengkapAbrianto Nugraha
 
Pertemuan 2-pemecahan-masalah-ai
Pertemuan 2-pemecahan-masalah-aiPertemuan 2-pemecahan-masalah-ai
Pertemuan 2-pemecahan-masalah-aiwillyhayon
 
Algoritma dan Struktur Data (Python) - Struktur Data
Algoritma dan Struktur Data (Python) - Struktur DataAlgoritma dan Struktur Data (Python) - Struktur Data
Algoritma dan Struktur Data (Python) - Struktur DataAndiNurkholis1
 
Data Warehousing and OLAP I
Data Warehousing and OLAP IData Warehousing and OLAP I
Data Warehousing and OLAP IShary Armonitha
 
Perancangan dan Analisa Sistem
Perancangan dan Analisa SistemPerancangan dan Analisa Sistem
Perancangan dan Analisa Sistemguestb7aaaf1e
 
10 soal dan pembahasan permasalahan program linear
10 soal dan pembahasan permasalahan program linear10 soal dan pembahasan permasalahan program linear
10 soal dan pembahasan permasalahan program linearpayjo_00
 
Metode pencarian heuristik
Metode pencarian heuristikMetode pencarian heuristik
Metode pencarian heuristikBaguss Chandrass
 
RPL 1 (Lama) - Pengujian Perangkat Lunak
RPL 1 (Lama) - Pengujian Perangkat LunakRPL 1 (Lama) - Pengujian Perangkat Lunak
RPL 1 (Lama) - Pengujian Perangkat LunakAdam Mukharil Bachtiar
 
Algoritma Apriori
Algoritma AprioriAlgoritma Apriori
Algoritma Aprioridedidarwis
 
Modul PBO Bab-07 - Enkapsulasi (Encapsulation)
Modul PBO Bab-07 - Enkapsulasi (Encapsulation)Modul PBO Bab-07 - Enkapsulasi (Encapsulation)
Modul PBO Bab-07 - Enkapsulasi (Encapsulation)Rakhmat Dedi Gunawan
 

What's hot (20)

Algoritma penjadwalan proses
Algoritma penjadwalan prosesAlgoritma penjadwalan proses
Algoritma penjadwalan proses
 
5 Macam Metode Dasar Kriptografi
5 Macam Metode Dasar Kriptografi5 Macam Metode Dasar Kriptografi
5 Macam Metode Dasar Kriptografi
 
Pertemuan 3 Desain Test Case
Pertemuan 3 Desain Test CasePertemuan 3 Desain Test Case
Pertemuan 3 Desain Test Case
 
Arsitektur dan Infrastruktur Data Warehouse
Arsitektur dan Infrastruktur Data WarehouseArsitektur dan Infrastruktur Data Warehouse
Arsitektur dan Infrastruktur Data Warehouse
 
4 diagram relasi antar entitas (ERD)
4 diagram relasi antar entitas (ERD)4 diagram relasi antar entitas (ERD)
4 diagram relasi antar entitas (ERD)
 
Analisis sistem-informasi
Analisis sistem-informasiAnalisis sistem-informasi
Analisis sistem-informasi
 
Kelompok 3 incremental
Kelompok 3   incrementalKelompok 3   incremental
Kelompok 3 incremental
 
Jawaban Struktur data soal-latihan
Jawaban Struktur data soal-latihanJawaban Struktur data soal-latihan
Jawaban Struktur data soal-latihan
 
Erp pertemuan-2
Erp pertemuan-2Erp pertemuan-2
Erp pertemuan-2
 
Pertemuan 5 optimasi_dengan_alternatif_terbatas_-_lengkap
Pertemuan 5 optimasi_dengan_alternatif_terbatas_-_lengkapPertemuan 5 optimasi_dengan_alternatif_terbatas_-_lengkap
Pertemuan 5 optimasi_dengan_alternatif_terbatas_-_lengkap
 
Pertemuan 2-pemecahan-masalah-ai
Pertemuan 2-pemecahan-masalah-aiPertemuan 2-pemecahan-masalah-ai
Pertemuan 2-pemecahan-masalah-ai
 
Algoritma dan Struktur Data (Python) - Struktur Data
Algoritma dan Struktur Data (Python) - Struktur DataAlgoritma dan Struktur Data (Python) - Struktur Data
Algoritma dan Struktur Data (Python) - Struktur Data
 
Data Warehousing and OLAP I
Data Warehousing and OLAP IData Warehousing and OLAP I
Data Warehousing and OLAP I
 
Perancangan dan Analisa Sistem
Perancangan dan Analisa SistemPerancangan dan Analisa Sistem
Perancangan dan Analisa Sistem
 
10 soal dan pembahasan permasalahan program linear
10 soal dan pembahasan permasalahan program linear10 soal dan pembahasan permasalahan program linear
10 soal dan pembahasan permasalahan program linear
 
Metode pencarian heuristik
Metode pencarian heuristikMetode pencarian heuristik
Metode pencarian heuristik
 
RPL 1 (Lama) - Pengujian Perangkat Lunak
RPL 1 (Lama) - Pengujian Perangkat LunakRPL 1 (Lama) - Pengujian Perangkat Lunak
RPL 1 (Lama) - Pengujian Perangkat Lunak
 
Algoritma Apriori
Algoritma AprioriAlgoritma Apriori
Algoritma Apriori
 
Modul PBO Bab-07 - Enkapsulasi (Encapsulation)
Modul PBO Bab-07 - Enkapsulasi (Encapsulation)Modul PBO Bab-07 - Enkapsulasi (Encapsulation)
Modul PBO Bab-07 - Enkapsulasi (Encapsulation)
 
Erp pertemuan-4
Erp pertemuan-4Erp pertemuan-4
Erp pertemuan-4
 

Similar to Arsitektur dan model data mining

Kecerdasan bisnis- Sistem Penunjang Keputusan
Kecerdasan bisnis- Sistem Penunjang KeputusanKecerdasan bisnis- Sistem Penunjang Keputusan
Kecerdasan bisnis- Sistem Penunjang KeputusanDasufianti
 
Herwanto_Kuliah_Umum_Big_Data_Analysis.pptx
Herwanto_Kuliah_Umum_Big_Data_Analysis.pptxHerwanto_Kuliah_Umum_Big_Data_Analysis.pptx
Herwanto_Kuliah_Umum_Big_Data_Analysis.pptxSuraClips
 
Data Mining Diskusi 3.pdf
Data Mining Diskusi 3.pdfData Mining Diskusi 3.pdf
Data Mining Diskusi 3.pdfHendroGunawan8
 
Jawaban No. 2 Tahap-Tahap Data Mining Karena DM adalah suatu ...
Jawaban No. 2 Tahap-Tahap Data Mining Karena  DM adalah suatu ...Jawaban No. 2 Tahap-Tahap Data Mining Karena  DM adalah suatu ...
Jawaban No. 2 Tahap-Tahap Data Mining Karena DM adalah suatu ...butest
 
Chapter 11 Data Management
Chapter 11   Data ManagementChapter 11   Data Management
Chapter 11 Data ManagementHani Novita
 
Big Data - Python for Data Science (Bahas Indonesia)
Big Data - Python for Data Science (Bahas Indonesia)Big Data - Python for Data Science (Bahas Indonesia)
Big Data - Python for Data Science (Bahas Indonesia)ArianDerida
 
Kuliah_Umum_Big_Data_Analysis_TEKNIK INFORMATIKA.pptx
Kuliah_Umum_Big_Data_Analysis_TEKNIK INFORMATIKA.pptxKuliah_Umum_Big_Data_Analysis_TEKNIK INFORMATIKA.pptx
Kuliah_Umum_Big_Data_Analysis_TEKNIK INFORMATIKA.pptxRidwanTI
 
Sd pertemuan 1 & 2
Sd   pertemuan 1 & 2Sd   pertemuan 1 & 2
Sd pertemuan 1 & 2biedoen
 
Sd pertemuan 1 & 2
Sd   pertemuan 1 & 2Sd   pertemuan 1 & 2
Sd pertemuan 1 & 2muissyahril
 
Sd pertemuan 1 & 2
Sd   pertemuan 1 & 2Sd   pertemuan 1 & 2
Sd pertemuan 1 & 2muissyahril
 
STRUKTUR DATA
STRUKTUR DATASTRUKTUR DATA
STRUKTUR DATAkejolo
 
Struktur data pertemuan 1 & 2
Struktur data   pertemuan 1 & 2Struktur data   pertemuan 1 & 2
Struktur data pertemuan 1 & 2biedoen
 
Sd pertemuan 1 & 2
Sd   pertemuan 1 & 2Sd   pertemuan 1 & 2
Sd pertemuan 1 & 2kejolo
 
Essential sql server 2008 bi sql server indonesia group - data mining
Essential sql server 2008 bi sql server indonesia group - data miningEssential sql server 2008 bi sql server indonesia group - data mining
Essential sql server 2008 bi sql server indonesia group - data miningCharlez Dbc
 
Proses Data: Analisis Data Eksploratori - Modul Ajar Kuliah Analisis Data 07
Proses Data: Analisis Data Eksploratori - Modul Ajar Kuliah Analisis Data 07Proses Data: Analisis Data Eksploratori - Modul Ajar Kuliah Analisis Data 07
Proses Data: Analisis Data Eksploratori - Modul Ajar Kuliah Analisis Data 07Arif Rahman
 

Similar to Arsitektur dan model data mining (20)

Kecerdasan bisnis- Sistem Penunjang Keputusan
Kecerdasan bisnis- Sistem Penunjang KeputusanKecerdasan bisnis- Sistem Penunjang Keputusan
Kecerdasan bisnis- Sistem Penunjang Keputusan
 
Kecerdasan bisnis
Kecerdasan bisnisKecerdasan bisnis
Kecerdasan bisnis
 
Herwanto_Kuliah_Umum_Big_Data_Analysis.pptx
Herwanto_Kuliah_Umum_Big_Data_Analysis.pptxHerwanto_Kuliah_Umum_Big_Data_Analysis.pptx
Herwanto_Kuliah_Umum_Big_Data_Analysis.pptx
 
pendahuluan dan proses kdd
pendahuluan dan proses kddpendahuluan dan proses kdd
pendahuluan dan proses kdd
 
Data Mining Diskusi 3.pdf
Data Mining Diskusi 3.pdfData Mining Diskusi 3.pdf
Data Mining Diskusi 3.pdf
 
Jawaban No. 2 Tahap-Tahap Data Mining Karena DM adalah suatu ...
Jawaban No. 2 Tahap-Tahap Data Mining Karena  DM adalah suatu ...Jawaban No. 2 Tahap-Tahap Data Mining Karena  DM adalah suatu ...
Jawaban No. 2 Tahap-Tahap Data Mining Karena DM adalah suatu ...
 
Chapter 11 Data Management
Chapter 11   Data ManagementChapter 11   Data Management
Chapter 11 Data Management
 
Big Data - Python for Data Science (Bahas Indonesia)
Big Data - Python for Data Science (Bahas Indonesia)Big Data - Python for Data Science (Bahas Indonesia)
Big Data - Python for Data Science (Bahas Indonesia)
 
BAB_5_Data_Mining.ppt
BAB_5_Data_Mining.pptBAB_5_Data_Mining.ppt
BAB_5_Data_Mining.ppt
 
Kuliah_Umum_Big_Data_Analysis_TEKNIK INFORMATIKA.pptx
Kuliah_Umum_Big_Data_Analysis_TEKNIK INFORMATIKA.pptxKuliah_Umum_Big_Data_Analysis_TEKNIK INFORMATIKA.pptx
Kuliah_Umum_Big_Data_Analysis_TEKNIK INFORMATIKA.pptx
 
mengelola sumber data
mengelola sumber datamengelola sumber data
mengelola sumber data
 
Sd pertemuan 1 & 2
Sd   pertemuan 1 & 2Sd   pertemuan 1 & 2
Sd pertemuan 1 & 2
 
Sd pertemuan 1 & 2
Sd   pertemuan 1 & 2Sd   pertemuan 1 & 2
Sd pertemuan 1 & 2
 
Sd pertemuan 1 & 2
Sd   pertemuan 1 & 2Sd   pertemuan 1 & 2
Sd pertemuan 1 & 2
 
STRUKTUR DATA
STRUKTUR DATASTRUKTUR DATA
STRUKTUR DATA
 
Struktur data pertemuan 1 & 2
Struktur data   pertemuan 1 & 2Struktur data   pertemuan 1 & 2
Struktur data pertemuan 1 & 2
 
Sd pertemuan 1 & 2
Sd   pertemuan 1 & 2Sd   pertemuan 1 & 2
Sd pertemuan 1 & 2
 
Essential sql server 2008 bi sql server indonesia group - data mining
Essential sql server 2008 bi sql server indonesia group - data miningEssential sql server 2008 bi sql server indonesia group - data mining
Essential sql server 2008 bi sql server indonesia group - data mining
 
Proses Data: Analisis Data Eksploratori - Modul Ajar Kuliah Analisis Data 07
Proses Data: Analisis Data Eksploratori - Modul Ajar Kuliah Analisis Data 07Proses Data: Analisis Data Eksploratori - Modul Ajar Kuliah Analisis Data 07
Proses Data: Analisis Data Eksploratori - Modul Ajar Kuliah Analisis Data 07
 
Konsep dan teknologi data mining
Konsep dan teknologi data miningKonsep dan teknologi data mining
Konsep dan teknologi data mining
 

More from Universitas Bina Darma Palembang

More from Universitas Bina Darma Palembang (20)

30448 pertemuan1
30448 pertemuan130448 pertemuan1
30448 pertemuan1
 
29510 pertemuan18(form method-get-post-dan-session(1))
29510 pertemuan18(form method-get-post-dan-session(1))29510 pertemuan18(form method-get-post-dan-session(1))
29510 pertemuan18(form method-get-post-dan-session(1))
 
28501 pertemuan14(php)
28501 pertemuan14(php)28501 pertemuan14(php)
28501 pertemuan14(php)
 
28500 pertemuan22(header dokumen html dgn tag title)
28500 pertemuan22(header dokumen html dgn tag title)28500 pertemuan22(header dokumen html dgn tag title)
28500 pertemuan22(header dokumen html dgn tag title)
 
25437 pertemuan25(hitcounter)
25437 pertemuan25(hitcounter)25437 pertemuan25(hitcounter)
25437 pertemuan25(hitcounter)
 
23921 pertemuan 3
23921 pertemuan 323921 pertemuan 3
23921 pertemuan 3
 
19313 pertemuan6
19313 pertemuan619313 pertemuan6
19313 pertemuan6
 
18759 pertemuan20(web html editor)
18759 pertemuan20(web html editor)18759 pertemuan20(web html editor)
18759 pertemuan20(web html editor)
 
18040 pertemuan13(css)
18040 pertemuan13(css)18040 pertemuan13(css)
18040 pertemuan13(css)
 
17945 pertemuan5
17945 pertemuan517945 pertemuan5
17945 pertemuan5
 
16406 pertemuan17(konsep basis-data-di-web)
16406 pertemuan17(konsep basis-data-di-web)16406 pertemuan17(konsep basis-data-di-web)
16406 pertemuan17(konsep basis-data-di-web)
 
15294 pertemuan9(eksplorasi &defenisi masalah0
15294 pertemuan9(eksplorasi &defenisi masalah015294 pertemuan9(eksplorasi &defenisi masalah0
15294 pertemuan9(eksplorasi &defenisi masalah0
 
13926 pertemuan4
13926 pertemuan413926 pertemuan4
13926 pertemuan4
 
12738 pertemuan 15(php lanjutan)
12738 pertemuan 15(php lanjutan)12738 pertemuan 15(php lanjutan)
12738 pertemuan 15(php lanjutan)
 
6346 pertemuan21(web statis dengan struktur html)
6346 pertemuan21(web statis dengan struktur html)6346 pertemuan21(web statis dengan struktur html)
6346 pertemuan21(web statis dengan struktur html)
 
5623 pertemuan11(html1)
5623 pertemuan11(html1)5623 pertemuan11(html1)
5623 pertemuan11(html1)
 
4740 pertemuan8(komponen dalam web)
4740 pertemuan8(komponen dalam web)4740 pertemuan8(komponen dalam web)
4740 pertemuan8(komponen dalam web)
 
4075 pertemuan10 (analisa kebutuhan)
4075 pertemuan10 (analisa kebutuhan)4075 pertemuan10 (analisa kebutuhan)
4075 pertemuan10 (analisa kebutuhan)
 
2670 pertemuan12(html lanjut)
2670 pertemuan12(html lanjut)2670 pertemuan12(html lanjut)
2670 pertemuan12(html lanjut)
 
2190 pertemuan24(polling)
2190 pertemuan24(polling)2190 pertemuan24(polling)
2190 pertemuan24(polling)
 

Recently uploaded

SKP GURU satuan kinerja pegawai tahun 2023 untuk PNS Aceh
SKP GURU satuan kinerja pegawai tahun 2023 untuk PNS AcehSKP GURU satuan kinerja pegawai tahun 2023 untuk PNS Aceh
SKP GURU satuan kinerja pegawai tahun 2023 untuk PNS AcehBISMIAULIA
 
MATERI SESI 2 KONSEP ETIKA KOMUNIKASI.pptx
MATERI SESI 2 KONSEP ETIKA KOMUNIKASI.pptxMATERI SESI 2 KONSEP ETIKA KOMUNIKASI.pptx
MATERI SESI 2 KONSEP ETIKA KOMUNIKASI.pptxrikosyahputra0173
 
MARIA NOVILIA BOISALA FASILITATOR PMM.pptx
MARIA NOVILIA BOISALA FASILITATOR PMM.pptxMARIA NOVILIA BOISALA FASILITATOR PMM.pptx
MARIA NOVILIA BOISALA FASILITATOR PMM.pptxmariaboisala21
 
Manajemen Lalu Lintas Baru Di Jalan Selamet Riyadi
Manajemen Lalu Lintas Baru Di Jalan Selamet RiyadiManajemen Lalu Lintas Baru Di Jalan Selamet Riyadi
Manajemen Lalu Lintas Baru Di Jalan Selamet RiyadiCristianoRonaldo185977
 
PPT Olah Nilai Kurikulum merdeka belajar.pptx
PPT Olah Nilai Kurikulum merdeka belajar.pptxPPT Olah Nilai Kurikulum merdeka belajar.pptx
PPT Olah Nilai Kurikulum merdeka belajar.pptxnursariheldaseptiana
 
kesalahan tipe 1 dan 2 pada statistik.pptx
kesalahan tipe 1 dan 2 pada statistik.pptxkesalahan tipe 1 dan 2 pada statistik.pptx
kesalahan tipe 1 dan 2 pada statistik.pptxAhmadSyajili
 
415418921-statistika- mean media modus data tunggal dan data kelompok
415418921-statistika- mean media modus data tunggal dan data kelompok415418921-statistika- mean media modus data tunggal dan data kelompok
415418921-statistika- mean media modus data tunggal dan data kelompokelmalinda2
 
pertemuan-3-distribusi pada-frekuensi.ppt
pertemuan-3-distribusi pada-frekuensi.pptpertemuan-3-distribusi pada-frekuensi.ppt
pertemuan-3-distribusi pada-frekuensi.pptAhmadSyajili
 
Metode penelitian Deskriptif atau Survei
Metode penelitian Deskriptif atau SurveiMetode penelitian Deskriptif atau Survei
Metode penelitian Deskriptif atau Surveikustiyantidew94
 

Recently uploaded (9)

SKP GURU satuan kinerja pegawai tahun 2023 untuk PNS Aceh
SKP GURU satuan kinerja pegawai tahun 2023 untuk PNS AcehSKP GURU satuan kinerja pegawai tahun 2023 untuk PNS Aceh
SKP GURU satuan kinerja pegawai tahun 2023 untuk PNS Aceh
 
MATERI SESI 2 KONSEP ETIKA KOMUNIKASI.pptx
MATERI SESI 2 KONSEP ETIKA KOMUNIKASI.pptxMATERI SESI 2 KONSEP ETIKA KOMUNIKASI.pptx
MATERI SESI 2 KONSEP ETIKA KOMUNIKASI.pptx
 
MARIA NOVILIA BOISALA FASILITATOR PMM.pptx
MARIA NOVILIA BOISALA FASILITATOR PMM.pptxMARIA NOVILIA BOISALA FASILITATOR PMM.pptx
MARIA NOVILIA BOISALA FASILITATOR PMM.pptx
 
Manajemen Lalu Lintas Baru Di Jalan Selamet Riyadi
Manajemen Lalu Lintas Baru Di Jalan Selamet RiyadiManajemen Lalu Lintas Baru Di Jalan Selamet Riyadi
Manajemen Lalu Lintas Baru Di Jalan Selamet Riyadi
 
PPT Olah Nilai Kurikulum merdeka belajar.pptx
PPT Olah Nilai Kurikulum merdeka belajar.pptxPPT Olah Nilai Kurikulum merdeka belajar.pptx
PPT Olah Nilai Kurikulum merdeka belajar.pptx
 
kesalahan tipe 1 dan 2 pada statistik.pptx
kesalahan tipe 1 dan 2 pada statistik.pptxkesalahan tipe 1 dan 2 pada statistik.pptx
kesalahan tipe 1 dan 2 pada statistik.pptx
 
415418921-statistika- mean media modus data tunggal dan data kelompok
415418921-statistika- mean media modus data tunggal dan data kelompok415418921-statistika- mean media modus data tunggal dan data kelompok
415418921-statistika- mean media modus data tunggal dan data kelompok
 
pertemuan-3-distribusi pada-frekuensi.ppt
pertemuan-3-distribusi pada-frekuensi.pptpertemuan-3-distribusi pada-frekuensi.ppt
pertemuan-3-distribusi pada-frekuensi.ppt
 
Metode penelitian Deskriptif atau Survei
Metode penelitian Deskriptif atau SurveiMetode penelitian Deskriptif atau Survei
Metode penelitian Deskriptif atau Survei
 

Arsitektur dan model data mining

  • 1. PERTEMUAN 3 ARSITEKTUR & MODEL DATA MINING 28 September 2005 Arsitektur dan Model Data Mining 1
  • 2. Arsitektur : Sistm Data Mining Graphical User Interface (GUI) Pattern evaluation Data Mining Engine Database or data warehouse server Knowledge-base Data clening & data integration Filtering Data base Data warehouse 28 September 2005 Arsitektur dan Model Data Mining 2
  • 3. Keterangan : 1. Data cleaning (Pembersihan Data) : untuk membuang data yang tidak konsisten dan noise) 2. Data integration : penggabungan data dari beberapa sumber 3. Data Mining Engine : Mentranformasikan data menjadi bentuk yang sesuai untuk di mining 4. Pattern evaluation : untuk menemukan yang bernilai melalui knowledge base 5. Graphical User Interface (GUI) : untuk end user Semua tahap bersifat interaktif di mana user terlibat langsung atau dengan perantaraan knowledge base 28 September 2005 Arsitektur dan Model Data Mining 3
  • 4. Model Data Mining •Prediction Methods –Menggunakan beberapa variabel untuk memprediksi sesuatu atau suatu nilai yang akan datang. •Description Methods – Mendapatkan pola penafsiran (human-interpretable patterns) untuk menjelaskan data. 28 September 2005 Arsitektur dan Model Data Mining 4
  • 5. Prediktif Data Mining Deskriptif Klasifikasi Decision tree Analisis Time series Regresi Prediksi Jaringan syaraf tiruan Klastering Summarization Aturan Asosiasi (Assosiation Rule) Sequence Discovery 28 September 2005 Arsitektur dan Model Data Mining 5
  • 6. Klasifikasi  Proses untuk menemukan model atau fungsi yang menjelaskan atau membedakan konsep atau kelas data dengan tujuan untuk dapat memprediksi kelas dari suatu objek yang labelnya tidak diketahui  Contoh : Mendeteksi Penipuan  Tujuan : Memprediksi kasus kecurangan transaksi kartu kredit. – Pendekatan : • Menggunakan transaksi kartu kredit dan informasi dilihat dari atribut account holder – Kapan cutomer melakukan pembelian, Dengan cara apa customer membayar, sebarapa sering customer membayar secara tepat waktu, dll • Beri nama/tanda transaksi yang telah dilaksanakan sebagai transaksi yang curang atau yang baik. Ini sebagai atribut klass ( the class attribute.) • Pelajari model untuk class transaksi • Gunakan model ini untuk mendetekdi kecurangan dengan meneliti transaksi kartu kredit pada account. 28 September 2005 Arsitektur dan Model Data Mining 6
  • 7. Regression  Digunakan untuk memetakan data dengan prediksi atribut bernilai real  Contoh: – Memprediksi jumlah penjualan produk baru pada advertising expenditure. – Memprediksi kecepatan memutar (wind velocities) pada fungsi temperatur, tekanan udara , dll 28 September 2005 Arsitektur dan Model Data Mining 7
  • 8. Decision tree (Pohon keputusan)  Salah satu model klasifikasi yang mudah di interpretasikan  Contoh : identifikasi pembeli komputer ( dari decision tree di bawah ini ternyata salah satu kelompok yang potensial adalah orang yang berusia < 30 dan pelajar age <=30 31-40 >40 yes studen Credit rating no yes excelent fair no yes no yes 28 September 2005 Arsitektur dan Model Data Mining 8
  • 9. Prediksi 28 September 2005 Arsitektur dan Model Data Mining 9
  • 10. Neural Network (Jaringan syaraf tiruan)  Jaringan syaraf buatan di mulai dengan layer input, dimana tiap simpul berkorespondensi dengan variabel prediktor.  Simpul- simpul input ini terhubung kebeberapa simpul dalam hidden layer.  Dan simpul dalam hidden layer dapat terhubung ke simpul lain dalam hidden layer atau ke output layer.  Output layer terdiri dari satu atau beberapa variable respon 1 2 3 4 5 6 input Hidden layer output 28 September 2005 Arsitektur dan Model Data Mining 10
  • 11.  Telekomunikasi Data mining digunakan untuk melihat jutaan transaksi yang masuk dengan tujuan menambah layanan otomatis  Keuangan Data mining digunakan untuk mendeteksi transaksi-transaksi keuangan yang mencurigakan dimana akan susah dilakukan jika menggunakan analisis standar.  Asuransi Australian Health Insurance Commision menggunakan data mining untuk mengidentifikasi layanan kesehatan dan berhasil menghemat satu juta dollar pertahun 28 September 2005 Arsitektur dan Model Data Mining 11
  • 12.  Olah raga IBM Advanced Scout menggunakan data mining untuk menganalisis statistik permainan NBA dalam rangka competitive advantage untuk tim New York Knicks  Astronomi Jet Propulsion Laboratory (JPL) di Pasadena dan Pulomar Observatory menemukan 22 quasar dengan bantuan data mining.  Internet Web Surf-Aid IBM Surf-Aid menggunakan algoritma data mining untuk mendata akses halaman Web khususnya berkaitan dengan pemasaran melalui web. 28 September 2005 Arsitektur dan Model Data Mining 12
  • 13. Tools Data Mining  Karateristik-karateristik penting dari tool data mining meliputi : – Data preparation facilities – Selection of data mining operation (algorithms) – Product scalability and performance – Facilities for visualization of result  Data mining tool, meliputi : – Integral Solution Ltd’s Clementine – DataMind Corp’s Data Crusher – IBM’s Intelligent Miner – Silicon Graphics Inc.’s MineSet – Informations Discovery Inc.’s Data Mining Suite – SAS Institute Inc.’s SAS System and Right Information System’Thought. 28 September 2005 Arsitektur dan Model Data Mining 13
  • 14. Evolusi Database  Th 1960 – Pengumpulan data, pembuatan data, IMS dan network DBMS  Th 1970 – Model data relasional, Implementasi DBMS relasional  Th 1980 – RDBMS, Model data lanjutan (extended-relational, OO, deductive)  Th 1990 – Data mining, data warehouse, database multimedia, dan Web database.  Th 2000 – Stream data managemen dan mining – Data mining dengan berbagai variasi aplikasi – Teknologi web dan sistem informasi global 28 September 2005 Arsitektur dan Model Data Mining 14
  • 15. Teknik – teknik Database Searching  Searching dilakukan untuk memeriksa serangkaian item yang memiliki sifat-sifat yang diinginkan.  Tindakan untuk menemukan suatu item tertentu baik yang diketahui keberadaannya maupun tidak.  Memasukkan kata dalam suatu program komputer untuk membandingkan dengan informasi yang ada dalam database. Indexing  Indexing adalah struktur-struktur akses yang digunakan untuk mempercepat respon dalam mendapatkan record-record pada kondisi-kondisi pencarian tertentu.  Indexing field adalah suatu struktur akses index yang biasanya menjelaskan field tunggal dari suatu file.  Indexing organization memberikan efisiensi akses ke record-record secara berurut atau random. 28 September 2005 Arsitektur dan Model Data Mining 15
  • 16. Data Reduction  Data reduction adalah transformasi suatu masalah ke masalah lain dan dapat digunakan untuk mendefinisikan serangkaian masalah yang kompleks.  Data reduction merupakan teknik yang digunakan untuk mentransformasi dari data mentah ke bentuk format data yang lebih berguna. Sebagai contoh groupping, summing dan averaging data.  Data reduction dilakukan untuk mengatasi ukuran data yang terlalu besar. Ukuran data yang terlalu besar dapat menimbulkan ketidakefisienan proses dan peningkatan biaya pemrosesan.  Data reduction dilakukan dalam tahap data preprocessing pada rangkaian proses Knowledge Discovery Databases (KDD) sebelum data mining dengan tujuan mengurangi ukuran data yang besar. 28 September 2005 Arsitektur dan Model Data Mining 16
  • 17. OLAP (On-line analytical processing)  OLAP adalah suatu sistem atau teknologi yang dirancang untuk mendukung proses analisis kompleks dalam rangka mengungkapkan kecenderungan pasar dan faktor-faktor penting dalam bisnis  OLAP ditandai dengan kemampuannya menaikkan atau menurunkan dimensi data sehingga kita dapat menggali data sampai pada level yang sangat detail dan memperoleh pandangan yang lebih luas mengenai objek yang sedang kita analisis.  OLAP secara khusus memfokuskan pada pembuatan data agar dapat diakses pada saat pendefinisian kembali dimensi.  OLAP dapat digunakan membuat rangkuman dari multidimensi data yang berbeda, rangkuman baru dan mendapatkan respon secara online, dan memberikan view dua dimensi pada data cube multidimensi secara interaktif. 28 September 2005 Arsitektur dan Model Data Mining 17
  • 18. Data Warehouse Definisi :  Data Warehouse adalah Pusat repositori informasi yang mampu memberikan database berorientasi subyek untuk informasi yang bersifat historis yang mendukung DSS (Decision Suport System) dan EIS (Executive Information System).  Salinan dari transaksi data yang terstruktur secara spesifik pada query dan analisa.  Salinan dari transaksi data yang terstruktur spesifik untuk query dan laporan Tujuan :  Meningkatkan kualitas dan akurasi informasi bisnis dan mengirimkan informasi ke pemakai dalam bentuk yang dimengerti dan dapat diakses dengan mudah. 28 September 2005 Arsitektur dan Model Data Mining 18
  • 19. Ciri-ciri Data Warehouse Terdapat 4 karateristik data warehouse • Subject oriented – Data yang disusun menurut subyek berisi hanya informasi yang penting bagi pemprosesan decision support. – Database yang semua informasi yang tersimpan di kelompokkan berdasarkan subyek tertentu misalnya: pelanggan, gudang, pasar, dsb. – Semua Informasi tersebut disimpan dalam suatu sistem data warehouse. – Data-data di setiap subyek dirangkum ke dalam dimensi, misalnya : periode waktu, produk, wilayah, dsb, sehingga dapat memberikan nilai sejarah untuk bahan analisa. • Integrated – Jika data terletak pada berbagai aplikasi yang terpisah dalam suatu lingkungan operasional, encoding data sering tidak seragam sehinggga bila data dipindahkan ke data warehouse maka coding akan diasumsikan sama seperti lazimnya. • Time-variant – Data warehouse adalah tempat untuk storing data selama 5 sampai 10 tahun atau lebih, data digunakan untuk perbandingan atau perkiraan dan data ini tidak dapat diperbaharui. • Non volatile – Data tidak dapat diperbaharui atau dirubah tetapi hanya dapat ditambah dan dilihat. 28 September 2005 Arsitektur dan Model Data Mining 19
  • 20. Masalah-masalah dalam menerapkan Data warehouse : • Dokumentasi dan pengelolaan metadata dari data warehouse. • Penentuan aturan dalam proses transformasi untuk memetakan berbagai sumber legacy data yang akan dimasukkan ke dalam data warehouse. • Pencapaian proses pengembangan yang handal, baik dalam membangun, mempimplementasikan, maupun memelihara data warehouse. 28 September 2005 Arsitektur dan Model Data Mining 20
  • 21. Data Preprocessing  Data preprocessing menerangkan tipe-tipe proses yang melaksanakan data mentah untuk mempersiapkan proses prosedur yang lainnya.  Dalam data mining menstrasformasi data ke suatu format yang prosesnya lebih mudah dan efektif untuk kebutuhan pemakai, contohnya Neural Network.  Terdapat beberapa alat dan metode yang berbeda yang digunakan untuk preprocessing seperti : – Sampling : menyeleksi subset representatif dari populasi data yang besar. – Transformation : memanipulasi data mentah untuk menghasilkan input tunggal. – Denoising : menghilangkan noise dari data – Normalization : mengorganisasi data untuk pengaksesan yang lebih spesifik – Feature extration : membuka spesifikasi data yang signifikan dalam konteks tertentu. 28 September 2005 Arsitektur dan Model Data Mining 21
  • 22. Knowledge Discovery In Database (KDD)  KDD berhubungan dengan teknik integrasi dan penemuan ilmiah, interprestasi dan visualisasi dari pola-pola sejumlah kumpulan data.  Knowledge discovery in databases (KDD) adalah keseluruhan proses non-trivial untuk mencari dan mengidentifikasi pola (pattern) dalam data, dimana pola yang ditemukan bersifat sah, baru, dapat bermanfaat dan dapat dimengerti. 28 September 2005 Arsitektur dan Model Data Mining 22
  • 23. Gambar. 1. Tahapan KDD 28 September 2005 Arsitektur dan Model Data Mining 23
  • 24. Tahapan Proses KDD 3. Data Selection – Menciptakan himpunan data target , pemilihan himpunan data, atau memfokuskan pada subset variabel atau sampel data, dimana penemuan (discovery) akan dilakukan. – Pemilihan (seleksi) data dari sekumpulan data operasional perlu dilakukan sebelum tahap penggalian informasi dalam KDD dimulai. Data hasil seleksi yang akan digunakan untuk proses data mining, disimpan dalam suatu berkas, terpisah dari basis data operasional. 28 September 2005 Arsitektur dan Model Data Mining 24
  • 25. 2. Pre-processing/ Cleaning – Pemprosesan pendahuluan dan pembersihan data merupakan operasi dasar seperti penghapusan noise dilakukan. – Sebelum proses data mining dapat dilaksanakan, perlu dilakukan proses cleaning pada data yang menjadi fokus KDD. – Proses cleaning mencakup antara lain membuang duplikasi data, memeriksa data yang inkonsisten, dan memperbaiki kesalahan pada data, seperti kesalahan cetak (tipografi). – Dilakukan proses enrichment, yaitu proses “memperkaya” data yang sudah ada dengan data atau informasi lain yang relevan dan diperlukan untuk KDD, seperti data atau informasi eksternal. 28 September 2005 Arsitektur dan Model Data Mining 25
  • 26. 2. Transformation – Pencarian fitur-fitur yang berguna untuk mempresentasikan data bergantung kepada goal yang ingin dicapai. – Merupakan proses transformasi pada data yang telah dipilih, sehingga data tersebut sesuai untuk proses data mining. Proses ini merupakan proses kreatif dan sangat tergantung pada jenis atau pola informasi yang akan dicari dalam basis data 28 September 2005 Arsitektur dan Model Data Mining 26
  • 27. 2. Data mining – Pemilihan tugas data mining; pemilihan goal dari proses KDD misalnya klasifikasi, regresi, clustering, dll. – Pemilihan algoritma data mining untuk pencarian (searching) – Proses Data mining yaitu proses mencari pola atau informasi menarik dalam data terpilih dengan menggunakan teknik atau metode tertentu. Teknik, metode, atau algoritma dalam data mining sangat bervariasi. Pemilihan metode atau algoritma yang tepat sangat bergantung pada tujuan dan proses KDD secara keseluruhan. 28 September 2005 Arsitektur dan Model Data Mining 27
  • 28. 5. Interpretation/ Evaluation – Penerjemahan pola-pola yang dihasilkan dari data mining. – Pola informasi yang dihasilkan dari proses data mining perlu ditampilkan dalam bentuk yang mudah dimengerti oleh pihak yang berkepentingan. – Tahap ini merupakan bagian dari proses KDD yang mencakup pemeriksaan apakah pola atau informasi yang ditemukan bertentangan dengan fakta atau hipotesa yang ada sebelumnya. 28 September 2005 Arsitektur dan Model Data Mining 28