SlideShare a Scribd company logo
1 of 30
Download to read offline
Pertemuan 8, 9, 10 
Teknik-teknik Data Mining
Outline 
Teknik-teknik data mining terdiri dari : 
• Analisis cluster 
• Induksi (pohon keputusan dan aturan induksi) 
• Jaringan syaraf buatan (Neural Network) 
• Online Analytical Processing (OLAP) 
• Visualisasi data 
28 September 2005 Teknik-teknik Data Mining 2
Analisis Cluster 
• Dalam lingkungan ‘unsupervised learning’, sistem harus 
mendapatkan klas2nya sendiri dan ini dilakukan dengan meng-cluster 
data dalam database seperti tergambar pada gambar 1. 
• Langkah pertama adalah dengan mendapatkan subset2 dari objek2 
yang terhubung, kemudian mencari deskripsinya cth, D1, D2, D3, 
dst., yang menggambarkan masing2 subset. 
Gambar 1. Perolehan cluster dan deskripsi pada database 
28 September 2005 Teknik-teknik Data Mining 3
Analisis Cluster (Lanjutan) 
• Clustering dan segmentasi sebenarnya mempartisi database, karena 
itu setiap partisi atau group adalah sama menurut kriteria atau 
metrik tertentu. Jika pengukuran kesamaan tersedia, maka terdapat 
sejumlah teknik untuk membentuk cluster. 
• Kebanyakan aplikasi2 data mining menggunakan clusteing menurut 
similarity (kesamaan), contohnya segmentasi basis klien. Clustering 
menurut optimasi dari sekumpulan fungsi-fungsi digunakan pada 
analisis data, misalnya ketika mensetting tarif asuransi klien dapat 
disegmentasi menurut sejumlah parameter. 
• Contoh aplikasi : 
– Perangkat ‘stand-alone’ : explore data distribution 
– Langkah preprocessing untuk algoritma lain 
– Pengenalan pola, analisis data spasial, pengenalan citra, market 
research, WWW, … 
• clustering dokumen2 
• clustering data log web untuk mendapatkan group dengan pola 
akses yang sama 
28 September 2005 Teknik-teknik Data Mining 4
Apa itu Clustering ? 
• Penggelompokkan data ke cluster2 
– Data yang sama satu sama lain berada pada cluster yang sama 
– Yang tidak sama berada pada cluster lain 
– ‘Unsupervised learning’: klas2 yang belum ditentukan 
Outliers 
Gambar 2. Clustering 
Cluster 1 
Cluster 2 
28 September 2005 Teknik-teknik Data Mining 5
Clustering Yang Baik 
• Intraclass similarity (Kesamaan di dalam klas) yang tinggi dan 
interclass similarity (kesamaan antar klas) yang rendah 
– Bergantung pada pengukuran kesamaan 
• Kemampuan untuk memdapatkan beberapa atau semua pola yang 
tersembunyi 
28 September 2005 Teknik-teknik Data Mining 6
Kebutuhan Clustering 
• Scalability 
• Kemampuan mengerjakan atribut2 dari berbagai tipe 
• Penemuan clusters dengan bentuk yang tidak tentu 
• Kebutuhan minimal untuk pengetahuan domain untuk menentukan 
parameter input 
• Dapat menerima noise dan outlier 
• Tidak mengindahkan susunan record dari input 
• Dimensi yang tinggi 
• Menyatu dengan batasan yang dispesifikasikan oleh user 
• Interpretability and usability 
28 September 2005 Teknik-teknik Data Mining 7
Tipe-tipe Data pada Clustering 
• Variabel2 berskala interval 
• Variabel biner 
• Variabel nominal, ordinal dan rasio 
• Variable2 dari berbagai tipe variabel 
28 September 2005 Teknik-teknik Data Mining 8
Kategori Pendekatan Clustering 
• Algoritma Partisi 
– Mempartisi objek2 ke dalam k cluster 
– Realokasi objek2 secara iteratif untuk memperbaiki clustering 
• Algoritma Hirarkis 
– Agglomerative: setiap objek merupakan cluster, gabungan dari cluster2 
membentuk cluster yang besar 
– Divisive: semua objek berada dalam suatu cluster, pembagian cluster 
tsb membentuk cluster2 yang kecil 
• Metode berbasis densitas 
– Berbasis koneksitas dan fungsi densitas 
– Noise disaring, kemudian temukan cluster2 dalam bentuk sembarang 
• Metode berbasis grid 
– Kuantisasi ruang objek ke dalam struktur grid 
• Berbasis Model 
– Gunakan model untuk menemukan keadaan data yang baik 
28 September 2005 Teknik-teknik Data Mining 9
Algoritma Partisi : Konsep Dasar 
• Partisi n objek ke dalam k cluster 
– Optimasi kriteria partisi yang dipilih 
• Global optimal: dicoba semua partisi 
– (kn-(k-1)n-…-1) partisi yang mungkin 
• Metode heuristik : k-means dan k-medoids 
– K-means: cluster direpresentasikan oleh pusat 
– K-medoids or PAM (partition around medoids): setiap cluster 
direpresentasikan oleh salah satu objek pada cluster 
28 September 2005 Teknik-teknik Data Mining 10
K-means 
• Pilih k objek sembarang sebagai inisial pusat cluster 
• Sampai tidak ada perubahan, kerjakan 
– Tunjukkan setiap objek pada cluster dimana objeknya hampir 
sama, berdasarkan nilai tengah dari objek2 pada cluster 
– Update the cluster means, i.e., calculate the mean value of the 
objects for each cluster 
28 September 2005 Teknik-teknik Data Mining 11
Gambar 3. Contoh : K-Means 
10 
9 
8 
7 
6 
5 
4 
3 
2 
1 
0 
0 1 2 3 4 5 6 7 8 9 10 
10 
9 
8 
7 
6 
5 
4 
3 
2 
1 
0 
0 1 2 3 4 5 6 7 8 9 10 
reassign reassign 
10 
9 
8 
7 
6 
5 
4 
3 
2 
1 
0 
0 1 2 3 4 5 6 7 8 9 10 
10 
9 
8 
7 
6 
5 
4 
3 
2 
1 
0 
0 1 2 3 4 5 6 7 8 9 10 
28 September 2005 Teknik-teknik Data Mining 12 
10 
9 
8 
7 
6 
5 
4 
3 
2 
1 
0 
0 1 2 3 4 5 6 7 8 9 10 
K=2 
Arbitrarily choose K 
object as initial 
cluster center 
Assign 
each 
objects 
to most 
similar 
center 
Update 
the 
cluster 
means 
Update 
the 
cluster 
means
Induksi 
• Induksi merupakan salah satu teknik inferensi informasi pada 
database. 
• Ada dua teknik inferensi yakni 
– Induksi merupakan teknik inferensi informasi yang digeneralisasi dari 
database, contohnya setiap pegawai mempunyai manajer. 
– Deduksi merupakan teknik inferensi informasi dari konsekuensi logis 
informasi pada database, contohnya operasi join pada dua tabel; 
dimana yang pertama mengenai pegawai dan departemen sedangkan 
yang kedua mengenai departemen dan manajer, menghasilkan relasi 
antara pegawai dan manajer. 
28 September 2005 Teknik-teknik Data Mining 13
Pohon Keputusan 
• Pohon keputusan merupakan representasi pengetahuan yang 
simpel. Pohon keputusan ini mengklasifikasikan contoh2 pada klas2 
dengan angka finit, node diberi nama atribut, edge di beri nilai 
atribut sedangkan leave diberi nama klas. Objek2 diklasifikasikan 
dengan struktur pohon, dengan menggunakan dahan2nya sebagai 
nilai atribut dari objek. 
• Gambar berikut mengenai keadaan cuaca. Objek2 berisikan 
informasi mengenai suasana cuaca, kelembaban dll. Beberapa 
objek merupakan contoh positif dinotasikan dengan P sedangkan 
yang lain negatif atau N. 
28 September 2005 Teknik-teknik Data Mining 14
Gambar 4. Struktur Pohon Keputusan 
28 September 2005 Teknik-teknik Data Mining 15
Induksi Aturan 
• Sistem data mining harus dapat menyimpulkan suatu model dari 
database dimana model ini mendefinisikan klas2 seperti halnya 
database yang terdiri atas satu atau lebih atribut yang menunjukkan 
klas dari tupel. Klas dapat didefinisikan oleh kondisi atribut. 
• Aturan produksi dipergunakan untuk merepresentasikan 
pengetahuan sistem pakar dan keuntungannya mudah 
diinterpretasikan oleh kepakaran manusia dikarenakan modularitas 
yakni aturan yang tunggal dapat dipahami dengan sendirinya dan 
tidak perlu referensi aturan lain. 
28 September 2005 Teknik-teknik Data Mining 16
Jaringan Syaraf Buatan 
• Merupakan pendekatan perhitungan yang melibatkan 
pengembangan struktur secara matematis dengan kemampuan 
untuk ‘belajar’. 
• Mampu menurunkan pengertian dari data yang kompleks dan tidak 
jelas dan dapat digunakan pula untuk mengekstrak pola dan 
mendeteksi tren2 yang sangat kompleks untuk dibicarakan baik 
oleh manusia maupun teknik komputer lainnya. 
• Jaringan syaraf buatan yang terlatih dapat dianggap sebagai ‘pakar’ 
dalam kategori informasi yang akan dianalisis. Pakar ini dapat 
digunakan untuk memproyeksi situasi baru dari ketertarikan dan 
jawaban dari pertanyaan ‘what if’ 
28 September 2005 Teknik-teknik Data Mining 17
Jaringan Syaraf Buatan (Lanjutan) 
• Dikarenakan jaringan syaraf buatan adalah terbaik dalam 
mengidentifikasikan pola atau tren dalam data, maka cocok pula 
digunakan untuk kebutuhan memprediksi antara lain: 
– Prediksi penjualan 
– Pengontrolan proses industri 
– Riset Pelanggan 
– Validasi data 
– Manajemen resiko 
– Pemasaran target 
– dll 
28 September 2005 Teknik-teknik Data Mining 18
Jaringan Syaraf Buatan (Lanjutan) 
• Jaringan ini menggunakan sekumpulan elemen2 pemrosesan 
(node) analog pada syaraf otak manusia. Elemen2 pemrosesan ini 
terhubung dalam jaringan dimana dapat mengidentifikasikan pola2 
dalam data sewaktu dipertunjukkan pada data, artinya jaringan 
belajar dari pengalaman seperti halnya manusia. 
• Pada gambar 5, layer bawah adalah lapisan input dengan x1 – x5. 
Layer tengah disebut juga layer tersembunyi dengan sejumlah 
variabel node. Layer atas merupakan layer output dengan node z1 
– z2 yang diperoleh dari input yang dicobakan. 
• Contoh, prediksi penjualan (output) berdasarkan penjualan lama, 
harga dan cuaca (input). 
28 September 2005 Teknik-teknik Data Mining 19
Gambar 5. Struktur Jaringan Syaraf Buatan 
28 September 2005 Teknik-teknik Data Mining 20
Jaringan Syaraf Buatan (Lanjutan) 
• Setiap node yang ada pada layer tersembunyi, secara keseluruhan 
terhubung dengan input, berarti setiap yg dipelajari didasarkan pada 
semua input yg diambil bersamaan. Hal ini terlihat pada gambar 6. 
• Pada gambar 7. dijelaskan mengenai jaringan syaraf buatan The 
Clementine User Guide untuk mengidentifikasikan resiko kanker 
dari berbagai faktor input. 
28 September 2005 Teknik-teknik Data Mining 21
Gambar 6. Di dalam Node 
28 September 2005 Teknik-teknik Data Mining 22
Gambar 7. Jaringan Syaraf Buatan 
The Clementine User Guide 
28 September 2005 Teknik-teknik Data Mining 23
OLAP (On-line Analytical Processing) 
Definisi Menurut E.F. Codd 
• OLAP atau On line Analytical Processing merupakan salah satu 
aplikasi database untuk memproses database yang sangat besar 
dengan data yang kompleks. 
• OLAP didefinisikan oleh E.F. Codd (1993) sebagai sintesis dinamik, 
analisis dan konsolidasi dari data multidimensional yang sangat 
besar. 
• Aturan atau kebutuhan dari sistem OLAP : 
- View konseptual multidimensional - Penanganan dynamic sparse matrix 
- Transparansi - Pendukung multi-user 
- Aksesibilitas - Operasi unrestricted cross dimensional 
- Kinerja reporting yang konsisten - Manipulasi data intuitif 
- Arsitektur client/server - Reporting yang fleksibel 
- Dimensionalitas generik - Level agregasi dan dimensi yang tidak 
terbatas 
28 September 2005 Teknik-teknik Data Mining 24
Definisi OLAP Menurut Nigel Pendse 
• OLAP didefinisikan oleh Nigel Pendse sebagai Fast Analysis of 
Shared Multidimensional Information, artinya 
 Fast dimana pemakai memperoleh respon dalam detik sehingga tidak 
terputus rantai pemikirannya 
 Analysis dimana sistem menyediakan fungsi2 analisis dan lingkup 
intuitif dan fungsi2 ini dapat mensuplai logika bisnis dan analisis 
statistikal yang relevan dengan aplikasi user 
 Shared dimana sistem mendukung user yang banyak secara konkurensi 
 Multidimensional merupakan kebutuhan utama sehingga sistem 
mensuplai view konseptual multidimensional dari data termasuk 
pendukung untuk hirarki multiple 
 Information merupakan data dan informasi yang diwariskan, dimana 
dibutuhkan oleh aplikasi user 
28 September 2005 Teknik-teknik Data Mining 25
Komponen OLAP Menurut Kirk Cruikshank 
• Kirk Cruikshank dari Arbor Software mengidentifikasikan ada 3 
komponen OLAP : 
 Database multidimensional harus dapat mengekspresikan 
kalkulasi bisnis yang kompleks dengan mudah. Data harus 
bereferensi dan didefinisikan matematis 
 Navigasi intuitatif dalam penyusunan data ‘roam around’ yang 
mana membutuhkan hirarki mining 
 Respons instan, yang artinya kebutuhan untuk memberi user 
informasi secepat mungkin 
28 September 2005 Teknik-teknik Data Mining 26
Contoh OLAP 
• Contoh database OLAP misalnya data penjualan yang dikumpulkan 
dari region, tipe produk dan cabang penjualan. 
• Queri OLAP harus mengakses database penjualan yang lebih dari 
satu tahun dan multi-gigabyte untuk menemukan penjualan produk 
di setiap region per-tipe produk. 
• Queri OLAP dapat dikarakterisasikan sebagai transaksi online yang 
° Mengakses data dalam jumlah besar, mis: data penjualan beberapa 
tahun 
° Menganalisis relationship antara tipe elemen bisnis mis: penjualan, 
wilayah, produk dan cabang 
° Melibatkan data yang terkumpul mis: volume penjualan, dollar yang 
dianggarkan dan dollar yang dihabiskan 
28 September 2005 Teknik-teknik Data Mining 27
Contoh OLAP (lanjutan) 
° Menyajikan data dalam berbagai perspektif, mis: penjualan berdasarkan 
wilayah vs penjualan berdasarkan cabang dari produk dalam setiap 
wilayah 
° Membandingkan data yang terkumpul dalam periode waktu secara 
hirarki, mis: bulanan, tahunan 
° Melibatkan kalkulasi kompleks antara elemen data , mis: keuntungan 
yang diharapkan sebagai fungsi dari pendapatan penjualan untuk setiap 
tipe dari cabang penjualan dalam suatu wilayah tertentu. 
° Dapat merespon permohonan user secara cepat sehingga user dapat 
mengikuti proses pemikiran yang analitik tanpa masuk pada sistem 
28 September 2005 Teknik-teknik Data Mining 28
Visualisasi Data 
• Visualisasi data memungkinkan si analis menperoleh pemahaman 
yang dalam dan lebih intuitif mengenai data dan dapat bekerja 
sebaik mungkin pada data mining. 
• Data mining memperbolehkan si analis memfokuskan pola2 dan 
trend2 tertentu dan menjelajahi ke dalam menggunakan visualisasi. 
28 September 2005 Teknik-teknik Data Mining 29
Selesai 
28 September 2005 Teknik-teknik Data Mining 30

More Related Content

Similar to teknik-teknik data mining

Sd pertemuan 1 & 2
Sd   pertemuan 1 & 2Sd   pertemuan 1 & 2
Sd pertemuan 1 & 2biedoen
 
Sd pertemuan 1 & 2
Sd   pertemuan 1 & 2Sd   pertemuan 1 & 2
Sd pertemuan 1 & 2muissyahril
 
Sd pertemuan 1 & 2
Sd   pertemuan 1 & 2Sd   pertemuan 1 & 2
Sd pertemuan 1 & 2muissyahril
 
STRUKTUR DATA
STRUKTUR DATASTRUKTUR DATA
STRUKTUR DATAkejolo
 
Struktur data pertemuan 1 & 2
Struktur data   pertemuan 1 & 2Struktur data   pertemuan 1 & 2
Struktur data pertemuan 1 & 2biedoen
 
Sd pertemuan 1 & 2
Sd   pertemuan 1 & 2Sd   pertemuan 1 & 2
Sd pertemuan 1 & 2kejolo
 
Modul praktikum 3 cluster
Modul praktikum 3   clusterModul praktikum 3   cluster
Modul praktikum 3 clusterDeiHart DeiHart
 
tugas1-kelompok-K-Medoids-dataMining.pptx
tugas1-kelompok-K-Medoids-dataMining.pptxtugas1-kelompok-K-Medoids-dataMining.pptx
tugas1-kelompok-K-Medoids-dataMining.pptxaakuntumbal
 
Materi Kuliah Data Mining full
Materi Kuliah Data Mining fullMateri Kuliah Data Mining full
Materi Kuliah Data Mining fullMunajat ( Munjob )
 
DM-01-Pengantar-Perkuliahan-Data-mining.pdf
DM-01-Pengantar-Perkuliahan-Data-mining.pdfDM-01-Pengantar-Perkuliahan-Data-mining.pdf
DM-01-Pengantar-Perkuliahan-Data-mining.pdfRinnaRachmatika2
 
10 feature engineering-univ-gunadarma
10 feature engineering-univ-gunadarma10 feature engineering-univ-gunadarma
10 feature engineering-univ-gunadarmaArdianDwiPraba
 
Pertemuan 3 Model Data Mining.pptx
Pertemuan 3 Model Data Mining.pptxPertemuan 3 Model Data Mining.pptx
Pertemuan 3 Model Data Mining.pptxArwansyahDipanegara
 
9 dts-transformasi data-univ-gunadarma
9 dts-transformasi data-univ-gunadarma9 dts-transformasi data-univ-gunadarma
9 dts-transformasi data-univ-gunadarmaArdianDwiPraba
 
04-cara-pemakaian-weka.ppt
04-cara-pemakaian-weka.ppt04-cara-pemakaian-weka.ppt
04-cara-pemakaian-weka.pptPutrifitriasari1
 
Tutorial WEKA.ppt
Tutorial WEKA.pptTutorial WEKA.ppt
Tutorial WEKA.pptJurnalJTIM
 
APPLIED DATABASE III - Slide Arsitektur Data Mining
APPLIED DATABASE III - Slide Arsitektur Data MiningAPPLIED DATABASE III - Slide Arsitektur Data Mining
APPLIED DATABASE III - Slide Arsitektur Data MiningDEDE IRYAWAN
 

Similar to teknik-teknik data mining (20)

1. klasifikasi dan evaluasi
1. klasifikasi dan evaluasi1. klasifikasi dan evaluasi
1. klasifikasi dan evaluasi
 
Sd pertemuan 1 & 2
Sd   pertemuan 1 & 2Sd   pertemuan 1 & 2
Sd pertemuan 1 & 2
 
Sd pertemuan 1 & 2
Sd   pertemuan 1 & 2Sd   pertemuan 1 & 2
Sd pertemuan 1 & 2
 
Sd pertemuan 1 & 2
Sd   pertemuan 1 & 2Sd   pertemuan 1 & 2
Sd pertemuan 1 & 2
 
STRUKTUR DATA
STRUKTUR DATASTRUKTUR DATA
STRUKTUR DATA
 
Struktur data pertemuan 1 & 2
Struktur data   pertemuan 1 & 2Struktur data   pertemuan 1 & 2
Struktur data pertemuan 1 & 2
 
Sd pertemuan 1 & 2
Sd   pertemuan 1 & 2Sd   pertemuan 1 & 2
Sd pertemuan 1 & 2
 
Modul praktikum 3 cluster
Modul praktikum 3   clusterModul praktikum 3   cluster
Modul praktikum 3 cluster
 
tugas1-kelompok-K-Medoids-dataMining.pptx
tugas1-kelompok-K-Medoids-dataMining.pptxtugas1-kelompok-K-Medoids-dataMining.pptx
tugas1-kelompok-K-Medoids-dataMining.pptx
 
Materi Kuliah Data Mining full
Materi Kuliah Data Mining fullMateri Kuliah Data Mining full
Materi Kuliah Data Mining full
 
DM-01-Pengantar-Perkuliahan-Data-mining.pdf
DM-01-Pengantar-Perkuliahan-Data-mining.pdfDM-01-Pengantar-Perkuliahan-Data-mining.pdf
DM-01-Pengantar-Perkuliahan-Data-mining.pdf
 
1. Pengantar Objek.ppt
1. Pengantar Objek.ppt1. Pengantar Objek.ppt
1. Pengantar Objek.ppt
 
10 feature engineering-univ-gunadarma
10 feature engineering-univ-gunadarma10 feature engineering-univ-gunadarma
10 feature engineering-univ-gunadarma
 
Data mining 7
Data mining 7Data mining 7
Data mining 7
 
Pertemuan 3 Model Data Mining.pptx
Pertemuan 3 Model Data Mining.pptxPertemuan 3 Model Data Mining.pptx
Pertemuan 3 Model Data Mining.pptx
 
9 dts-transformasi data-univ-gunadarma
9 dts-transformasi data-univ-gunadarma9 dts-transformasi data-univ-gunadarma
9 dts-transformasi data-univ-gunadarma
 
04-cara-pemakaian-weka.ppt
04-cara-pemakaian-weka.ppt04-cara-pemakaian-weka.ppt
04-cara-pemakaian-weka.ppt
 
Tutorial WEKA.ppt
Tutorial WEKA.pptTutorial WEKA.ppt
Tutorial WEKA.ppt
 
Modul klasifikasi decission tree modul klasifikasi
Modul klasifikasi decission tree modul klasifikasiModul klasifikasi decission tree modul klasifikasi
Modul klasifikasi decission tree modul klasifikasi
 
APPLIED DATABASE III - Slide Arsitektur Data Mining
APPLIED DATABASE III - Slide Arsitektur Data MiningAPPLIED DATABASE III - Slide Arsitektur Data Mining
APPLIED DATABASE III - Slide Arsitektur Data Mining
 

More from Universitas Bina Darma Palembang

More from Universitas Bina Darma Palembang (20)

30448 pertemuan1
30448 pertemuan130448 pertemuan1
30448 pertemuan1
 
29510 pertemuan18(form method-get-post-dan-session(1))
29510 pertemuan18(form method-get-post-dan-session(1))29510 pertemuan18(form method-get-post-dan-session(1))
29510 pertemuan18(form method-get-post-dan-session(1))
 
28501 pertemuan14(php)
28501 pertemuan14(php)28501 pertemuan14(php)
28501 pertemuan14(php)
 
28500 pertemuan22(header dokumen html dgn tag title)
28500 pertemuan22(header dokumen html dgn tag title)28500 pertemuan22(header dokumen html dgn tag title)
28500 pertemuan22(header dokumen html dgn tag title)
 
25437 pertemuan25(hitcounter)
25437 pertemuan25(hitcounter)25437 pertemuan25(hitcounter)
25437 pertemuan25(hitcounter)
 
23921 pertemuan 3
23921 pertemuan 323921 pertemuan 3
23921 pertemuan 3
 
19313 pertemuan6
19313 pertemuan619313 pertemuan6
19313 pertemuan6
 
18759 pertemuan20(web html editor)
18759 pertemuan20(web html editor)18759 pertemuan20(web html editor)
18759 pertemuan20(web html editor)
 
18040 pertemuan13(css)
18040 pertemuan13(css)18040 pertemuan13(css)
18040 pertemuan13(css)
 
17945 pertemuan5
17945 pertemuan517945 pertemuan5
17945 pertemuan5
 
16406 pertemuan17(konsep basis-data-di-web)
16406 pertemuan17(konsep basis-data-di-web)16406 pertemuan17(konsep basis-data-di-web)
16406 pertemuan17(konsep basis-data-di-web)
 
15294 pertemuan9(eksplorasi &defenisi masalah0
15294 pertemuan9(eksplorasi &defenisi masalah015294 pertemuan9(eksplorasi &defenisi masalah0
15294 pertemuan9(eksplorasi &defenisi masalah0
 
13926 pertemuan4
13926 pertemuan413926 pertemuan4
13926 pertemuan4
 
12738 pertemuan 15(php lanjutan)
12738 pertemuan 15(php lanjutan)12738 pertemuan 15(php lanjutan)
12738 pertemuan 15(php lanjutan)
 
6346 pertemuan21(web statis dengan struktur html)
6346 pertemuan21(web statis dengan struktur html)6346 pertemuan21(web statis dengan struktur html)
6346 pertemuan21(web statis dengan struktur html)
 
5623 pertemuan11(html1)
5623 pertemuan11(html1)5623 pertemuan11(html1)
5623 pertemuan11(html1)
 
4740 pertemuan8(komponen dalam web)
4740 pertemuan8(komponen dalam web)4740 pertemuan8(komponen dalam web)
4740 pertemuan8(komponen dalam web)
 
4075 pertemuan10 (analisa kebutuhan)
4075 pertemuan10 (analisa kebutuhan)4075 pertemuan10 (analisa kebutuhan)
4075 pertemuan10 (analisa kebutuhan)
 
2670 pertemuan12(html lanjut)
2670 pertemuan12(html lanjut)2670 pertemuan12(html lanjut)
2670 pertemuan12(html lanjut)
 
2190 pertemuan24(polling)
2190 pertemuan24(polling)2190 pertemuan24(polling)
2190 pertemuan24(polling)
 

Recently uploaded

KONSEP DASAR ADVOKASI GIZI KEBIJAKAN PEMERINTAHAN
KONSEP DASAR ADVOKASI GIZI KEBIJAKAN PEMERINTAHANKONSEP DASAR ADVOKASI GIZI KEBIJAKAN PEMERINTAHAN
KONSEP DASAR ADVOKASI GIZI KEBIJAKAN PEMERINTAHANDevonneDillaElFachri
 
Contoh Algoritma Asosiasi pada data mining
Contoh Algoritma Asosiasi pada data miningContoh Algoritma Asosiasi pada data mining
Contoh Algoritma Asosiasi pada data miningSamFChaerul
 
PERTEMUAN 4 himpunan dan fungsi logika fuzzy.ppT
PERTEMUAN 4 himpunan dan fungsi logika fuzzy.ppTPERTEMUAN 4 himpunan dan fungsi logika fuzzy.ppT
PERTEMUAN 4 himpunan dan fungsi logika fuzzy.ppTYudaPerwira5
 
Salinan PPT TATA BAHASA Bahasa Indonesia
Salinan PPT TATA BAHASA Bahasa IndonesiaSalinan PPT TATA BAHASA Bahasa Indonesia
Salinan PPT TATA BAHASA Bahasa Indonesiasdn4mangkujayan
 
KISI KISI PSAJ IPS KLS IX 2324.docskskkks
KISI KISI PSAJ IPS KLS IX 2324.docskskkksKISI KISI PSAJ IPS KLS IX 2324.docskskkks
KISI KISI PSAJ IPS KLS IX 2324.docskskkksdanzztzy405
 
SIMPUS SIMPUS SIMPUS & E- PUSKESMAS (3).ppt
SIMPUS SIMPUS SIMPUS & E- PUSKESMAS (3).pptSIMPUS SIMPUS SIMPUS & E- PUSKESMAS (3).ppt
SIMPUS SIMPUS SIMPUS & E- PUSKESMAS (3).pptEndangNingsih7
 
DATA MINING : ESTIMASI, PREDIKSI, KLASIFIKASI, KLASTERING, DAN ASOSIASI.ppt
DATA MINING : ESTIMASI, PREDIKSI, KLASIFIKASI, KLASTERING, DAN ASOSIASI.pptDATA MINING : ESTIMASI, PREDIKSI, KLASIFIKASI, KLASTERING, DAN ASOSIASI.ppt
DATA MINING : ESTIMASI, PREDIKSI, KLASIFIKASI, KLASTERING, DAN ASOSIASI.pptmuhammadarsyad77
 
DATA MINING : RSITEKTUR & MODEL DATA MINING
DATA MINING : RSITEKTUR & MODEL DATA MININGDATA MINING : RSITEKTUR & MODEL DATA MINING
DATA MINING : RSITEKTUR & MODEL DATA MININGYudaPerwira5
 
Materi Pajak Untuk BOS tahun 2024 untuk madrasah MI,MTS, dan MA
Materi Pajak Untuk BOS tahun 2024 untuk madrasah MI,MTS, dan MAMateri Pajak Untuk BOS tahun 2024 untuk madrasah MI,MTS, dan MA
Materi Pajak Untuk BOS tahun 2024 untuk madrasah MI,MTS, dan MAmasqiqu340
 
514034136-Tugas-Modul-4-5-Komputer-Dan-Media-Pembelajaran.pptx
514034136-Tugas-Modul-4-5-Komputer-Dan-Media-Pembelajaran.pptx514034136-Tugas-Modul-4-5-Komputer-Dan-Media-Pembelajaran.pptx
514034136-Tugas-Modul-4-5-Komputer-Dan-Media-Pembelajaran.pptxAbidinMaulana
 
KISI-KISI USEK PJOK TA 2023-2024 anans ajaja jaja hdsh
KISI-KISI USEK PJOK TA 2023-2024 anans ajaja jaja hdshKISI-KISI USEK PJOK TA 2023-2024 anans ajaja jaja hdsh
KISI-KISI USEK PJOK TA 2023-2024 anans ajaja jaja hdshDosenBernard
 
PPT SIDANG UJIAN KOMPREHENSIF KUALITATIF
PPT SIDANG UJIAN KOMPREHENSIF KUALITATIFPPT SIDANG UJIAN KOMPREHENSIF KUALITATIF
PPT SIDANG UJIAN KOMPREHENSIF KUALITATIFFPMJ604FIKRIRIANDRA
 
Perlindungan Anak Dalam Hukum Perdata (2).pdf
Perlindungan Anak Dalam Hukum Perdata (2).pdfPerlindungan Anak Dalam Hukum Perdata (2).pdf
Perlindungan Anak Dalam Hukum Perdata (2).pdfjeffrisovana999
 
Sistem operasi adalah program yang bertindak sebagai perantara antara user de...
Sistem operasi adalah program yang bertindak sebagai perantara antara user de...Sistem operasi adalah program yang bertindak sebagai perantara antara user de...
Sistem operasi adalah program yang bertindak sebagai perantara antara user de...Shary Armonitha
 
Alur Pengajuan Surat Keterangan Pindah (Individu) lewat IKD.pdf
Alur Pengajuan Surat Keterangan Pindah (Individu) lewat IKD.pdfAlur Pengajuan Surat Keterangan Pindah (Individu) lewat IKD.pdf
Alur Pengajuan Surat Keterangan Pindah (Individu) lewat IKD.pdfPemdes Wonoyoso
 

Recently uploaded (17)

KONSEP DASAR ADVOKASI GIZI KEBIJAKAN PEMERINTAHAN
KONSEP DASAR ADVOKASI GIZI KEBIJAKAN PEMERINTAHANKONSEP DASAR ADVOKASI GIZI KEBIJAKAN PEMERINTAHAN
KONSEP DASAR ADVOKASI GIZI KEBIJAKAN PEMERINTAHAN
 
Contoh Algoritma Asosiasi pada data mining
Contoh Algoritma Asosiasi pada data miningContoh Algoritma Asosiasi pada data mining
Contoh Algoritma Asosiasi pada data mining
 
PERTEMUAN 4 himpunan dan fungsi logika fuzzy.ppT
PERTEMUAN 4 himpunan dan fungsi logika fuzzy.ppTPERTEMUAN 4 himpunan dan fungsi logika fuzzy.ppT
PERTEMUAN 4 himpunan dan fungsi logika fuzzy.ppT
 
Salinan PPT TATA BAHASA Bahasa Indonesia
Salinan PPT TATA BAHASA Bahasa IndonesiaSalinan PPT TATA BAHASA Bahasa Indonesia
Salinan PPT TATA BAHASA Bahasa Indonesia
 
Abortion pills in Kuwait salmiyah [+966572737505 ] Get Cytotec in Kuwait city...
Abortion pills in Kuwait salmiyah [+966572737505 ] Get Cytotec in Kuwait city...Abortion pills in Kuwait salmiyah [+966572737505 ] Get Cytotec in Kuwait city...
Abortion pills in Kuwait salmiyah [+966572737505 ] Get Cytotec in Kuwait city...
 
KISI KISI PSAJ IPS KLS IX 2324.docskskkks
KISI KISI PSAJ IPS KLS IX 2324.docskskkksKISI KISI PSAJ IPS KLS IX 2324.docskskkks
KISI KISI PSAJ IPS KLS IX 2324.docskskkks
 
SIMPUS SIMPUS SIMPUS & E- PUSKESMAS (3).ppt
SIMPUS SIMPUS SIMPUS & E- PUSKESMAS (3).pptSIMPUS SIMPUS SIMPUS & E- PUSKESMAS (3).ppt
SIMPUS SIMPUS SIMPUS & E- PUSKESMAS (3).ppt
 
DATA MINING : ESTIMASI, PREDIKSI, KLASIFIKASI, KLASTERING, DAN ASOSIASI.ppt
DATA MINING : ESTIMASI, PREDIKSI, KLASIFIKASI, KLASTERING, DAN ASOSIASI.pptDATA MINING : ESTIMASI, PREDIKSI, KLASIFIKASI, KLASTERING, DAN ASOSIASI.ppt
DATA MINING : ESTIMASI, PREDIKSI, KLASIFIKASI, KLASTERING, DAN ASOSIASI.ppt
 
DATA MINING : RSITEKTUR & MODEL DATA MINING
DATA MINING : RSITEKTUR & MODEL DATA MININGDATA MINING : RSITEKTUR & MODEL DATA MINING
DATA MINING : RSITEKTUR & MODEL DATA MINING
 
Materi Pajak Untuk BOS tahun 2024 untuk madrasah MI,MTS, dan MA
Materi Pajak Untuk BOS tahun 2024 untuk madrasah MI,MTS, dan MAMateri Pajak Untuk BOS tahun 2024 untuk madrasah MI,MTS, dan MA
Materi Pajak Untuk BOS tahun 2024 untuk madrasah MI,MTS, dan MA
 
514034136-Tugas-Modul-4-5-Komputer-Dan-Media-Pembelajaran.pptx
514034136-Tugas-Modul-4-5-Komputer-Dan-Media-Pembelajaran.pptx514034136-Tugas-Modul-4-5-Komputer-Dan-Media-Pembelajaran.pptx
514034136-Tugas-Modul-4-5-Komputer-Dan-Media-Pembelajaran.pptx
 
KISI-KISI USEK PJOK TA 2023-2024 anans ajaja jaja hdsh
KISI-KISI USEK PJOK TA 2023-2024 anans ajaja jaja hdshKISI-KISI USEK PJOK TA 2023-2024 anans ajaja jaja hdsh
KISI-KISI USEK PJOK TA 2023-2024 anans ajaja jaja hdsh
 
PPT SIDANG UJIAN KOMPREHENSIF KUALITATIF
PPT SIDANG UJIAN KOMPREHENSIF KUALITATIFPPT SIDANG UJIAN KOMPREHENSIF KUALITATIF
PPT SIDANG UJIAN KOMPREHENSIF KUALITATIF
 
Perlindungan Anak Dalam Hukum Perdata (2).pdf
Perlindungan Anak Dalam Hukum Perdata (2).pdfPerlindungan Anak Dalam Hukum Perdata (2).pdf
Perlindungan Anak Dalam Hukum Perdata (2).pdf
 
Abortion pills in Jeddah+966543202731/ buy cytotec
Abortion pills in Jeddah+966543202731/ buy cytotecAbortion pills in Jeddah+966543202731/ buy cytotec
Abortion pills in Jeddah+966543202731/ buy cytotec
 
Sistem operasi adalah program yang bertindak sebagai perantara antara user de...
Sistem operasi adalah program yang bertindak sebagai perantara antara user de...Sistem operasi adalah program yang bertindak sebagai perantara antara user de...
Sistem operasi adalah program yang bertindak sebagai perantara antara user de...
 
Alur Pengajuan Surat Keterangan Pindah (Individu) lewat IKD.pdf
Alur Pengajuan Surat Keterangan Pindah (Individu) lewat IKD.pdfAlur Pengajuan Surat Keterangan Pindah (Individu) lewat IKD.pdf
Alur Pengajuan Surat Keterangan Pindah (Individu) lewat IKD.pdf
 

teknik-teknik data mining

  • 1. Pertemuan 8, 9, 10 Teknik-teknik Data Mining
  • 2. Outline Teknik-teknik data mining terdiri dari : • Analisis cluster • Induksi (pohon keputusan dan aturan induksi) • Jaringan syaraf buatan (Neural Network) • Online Analytical Processing (OLAP) • Visualisasi data 28 September 2005 Teknik-teknik Data Mining 2
  • 3. Analisis Cluster • Dalam lingkungan ‘unsupervised learning’, sistem harus mendapatkan klas2nya sendiri dan ini dilakukan dengan meng-cluster data dalam database seperti tergambar pada gambar 1. • Langkah pertama adalah dengan mendapatkan subset2 dari objek2 yang terhubung, kemudian mencari deskripsinya cth, D1, D2, D3, dst., yang menggambarkan masing2 subset. Gambar 1. Perolehan cluster dan deskripsi pada database 28 September 2005 Teknik-teknik Data Mining 3
  • 4. Analisis Cluster (Lanjutan) • Clustering dan segmentasi sebenarnya mempartisi database, karena itu setiap partisi atau group adalah sama menurut kriteria atau metrik tertentu. Jika pengukuran kesamaan tersedia, maka terdapat sejumlah teknik untuk membentuk cluster. • Kebanyakan aplikasi2 data mining menggunakan clusteing menurut similarity (kesamaan), contohnya segmentasi basis klien. Clustering menurut optimasi dari sekumpulan fungsi-fungsi digunakan pada analisis data, misalnya ketika mensetting tarif asuransi klien dapat disegmentasi menurut sejumlah parameter. • Contoh aplikasi : – Perangkat ‘stand-alone’ : explore data distribution – Langkah preprocessing untuk algoritma lain – Pengenalan pola, analisis data spasial, pengenalan citra, market research, WWW, … • clustering dokumen2 • clustering data log web untuk mendapatkan group dengan pola akses yang sama 28 September 2005 Teknik-teknik Data Mining 4
  • 5. Apa itu Clustering ? • Penggelompokkan data ke cluster2 – Data yang sama satu sama lain berada pada cluster yang sama – Yang tidak sama berada pada cluster lain – ‘Unsupervised learning’: klas2 yang belum ditentukan Outliers Gambar 2. Clustering Cluster 1 Cluster 2 28 September 2005 Teknik-teknik Data Mining 5
  • 6. Clustering Yang Baik • Intraclass similarity (Kesamaan di dalam klas) yang tinggi dan interclass similarity (kesamaan antar klas) yang rendah – Bergantung pada pengukuran kesamaan • Kemampuan untuk memdapatkan beberapa atau semua pola yang tersembunyi 28 September 2005 Teknik-teknik Data Mining 6
  • 7. Kebutuhan Clustering • Scalability • Kemampuan mengerjakan atribut2 dari berbagai tipe • Penemuan clusters dengan bentuk yang tidak tentu • Kebutuhan minimal untuk pengetahuan domain untuk menentukan parameter input • Dapat menerima noise dan outlier • Tidak mengindahkan susunan record dari input • Dimensi yang tinggi • Menyatu dengan batasan yang dispesifikasikan oleh user • Interpretability and usability 28 September 2005 Teknik-teknik Data Mining 7
  • 8. Tipe-tipe Data pada Clustering • Variabel2 berskala interval • Variabel biner • Variabel nominal, ordinal dan rasio • Variable2 dari berbagai tipe variabel 28 September 2005 Teknik-teknik Data Mining 8
  • 9. Kategori Pendekatan Clustering • Algoritma Partisi – Mempartisi objek2 ke dalam k cluster – Realokasi objek2 secara iteratif untuk memperbaiki clustering • Algoritma Hirarkis – Agglomerative: setiap objek merupakan cluster, gabungan dari cluster2 membentuk cluster yang besar – Divisive: semua objek berada dalam suatu cluster, pembagian cluster tsb membentuk cluster2 yang kecil • Metode berbasis densitas – Berbasis koneksitas dan fungsi densitas – Noise disaring, kemudian temukan cluster2 dalam bentuk sembarang • Metode berbasis grid – Kuantisasi ruang objek ke dalam struktur grid • Berbasis Model – Gunakan model untuk menemukan keadaan data yang baik 28 September 2005 Teknik-teknik Data Mining 9
  • 10. Algoritma Partisi : Konsep Dasar • Partisi n objek ke dalam k cluster – Optimasi kriteria partisi yang dipilih • Global optimal: dicoba semua partisi – (kn-(k-1)n-…-1) partisi yang mungkin • Metode heuristik : k-means dan k-medoids – K-means: cluster direpresentasikan oleh pusat – K-medoids or PAM (partition around medoids): setiap cluster direpresentasikan oleh salah satu objek pada cluster 28 September 2005 Teknik-teknik Data Mining 10
  • 11. K-means • Pilih k objek sembarang sebagai inisial pusat cluster • Sampai tidak ada perubahan, kerjakan – Tunjukkan setiap objek pada cluster dimana objeknya hampir sama, berdasarkan nilai tengah dari objek2 pada cluster – Update the cluster means, i.e., calculate the mean value of the objects for each cluster 28 September 2005 Teknik-teknik Data Mining 11
  • 12. Gambar 3. Contoh : K-Means 10 9 8 7 6 5 4 3 2 1 0 0 1 2 3 4 5 6 7 8 9 10 10 9 8 7 6 5 4 3 2 1 0 0 1 2 3 4 5 6 7 8 9 10 reassign reassign 10 9 8 7 6 5 4 3 2 1 0 0 1 2 3 4 5 6 7 8 9 10 10 9 8 7 6 5 4 3 2 1 0 0 1 2 3 4 5 6 7 8 9 10 28 September 2005 Teknik-teknik Data Mining 12 10 9 8 7 6 5 4 3 2 1 0 0 1 2 3 4 5 6 7 8 9 10 K=2 Arbitrarily choose K object as initial cluster center Assign each objects to most similar center Update the cluster means Update the cluster means
  • 13. Induksi • Induksi merupakan salah satu teknik inferensi informasi pada database. • Ada dua teknik inferensi yakni – Induksi merupakan teknik inferensi informasi yang digeneralisasi dari database, contohnya setiap pegawai mempunyai manajer. – Deduksi merupakan teknik inferensi informasi dari konsekuensi logis informasi pada database, contohnya operasi join pada dua tabel; dimana yang pertama mengenai pegawai dan departemen sedangkan yang kedua mengenai departemen dan manajer, menghasilkan relasi antara pegawai dan manajer. 28 September 2005 Teknik-teknik Data Mining 13
  • 14. Pohon Keputusan • Pohon keputusan merupakan representasi pengetahuan yang simpel. Pohon keputusan ini mengklasifikasikan contoh2 pada klas2 dengan angka finit, node diberi nama atribut, edge di beri nilai atribut sedangkan leave diberi nama klas. Objek2 diklasifikasikan dengan struktur pohon, dengan menggunakan dahan2nya sebagai nilai atribut dari objek. • Gambar berikut mengenai keadaan cuaca. Objek2 berisikan informasi mengenai suasana cuaca, kelembaban dll. Beberapa objek merupakan contoh positif dinotasikan dengan P sedangkan yang lain negatif atau N. 28 September 2005 Teknik-teknik Data Mining 14
  • 15. Gambar 4. Struktur Pohon Keputusan 28 September 2005 Teknik-teknik Data Mining 15
  • 16. Induksi Aturan • Sistem data mining harus dapat menyimpulkan suatu model dari database dimana model ini mendefinisikan klas2 seperti halnya database yang terdiri atas satu atau lebih atribut yang menunjukkan klas dari tupel. Klas dapat didefinisikan oleh kondisi atribut. • Aturan produksi dipergunakan untuk merepresentasikan pengetahuan sistem pakar dan keuntungannya mudah diinterpretasikan oleh kepakaran manusia dikarenakan modularitas yakni aturan yang tunggal dapat dipahami dengan sendirinya dan tidak perlu referensi aturan lain. 28 September 2005 Teknik-teknik Data Mining 16
  • 17. Jaringan Syaraf Buatan • Merupakan pendekatan perhitungan yang melibatkan pengembangan struktur secara matematis dengan kemampuan untuk ‘belajar’. • Mampu menurunkan pengertian dari data yang kompleks dan tidak jelas dan dapat digunakan pula untuk mengekstrak pola dan mendeteksi tren2 yang sangat kompleks untuk dibicarakan baik oleh manusia maupun teknik komputer lainnya. • Jaringan syaraf buatan yang terlatih dapat dianggap sebagai ‘pakar’ dalam kategori informasi yang akan dianalisis. Pakar ini dapat digunakan untuk memproyeksi situasi baru dari ketertarikan dan jawaban dari pertanyaan ‘what if’ 28 September 2005 Teknik-teknik Data Mining 17
  • 18. Jaringan Syaraf Buatan (Lanjutan) • Dikarenakan jaringan syaraf buatan adalah terbaik dalam mengidentifikasikan pola atau tren dalam data, maka cocok pula digunakan untuk kebutuhan memprediksi antara lain: – Prediksi penjualan – Pengontrolan proses industri – Riset Pelanggan – Validasi data – Manajemen resiko – Pemasaran target – dll 28 September 2005 Teknik-teknik Data Mining 18
  • 19. Jaringan Syaraf Buatan (Lanjutan) • Jaringan ini menggunakan sekumpulan elemen2 pemrosesan (node) analog pada syaraf otak manusia. Elemen2 pemrosesan ini terhubung dalam jaringan dimana dapat mengidentifikasikan pola2 dalam data sewaktu dipertunjukkan pada data, artinya jaringan belajar dari pengalaman seperti halnya manusia. • Pada gambar 5, layer bawah adalah lapisan input dengan x1 – x5. Layer tengah disebut juga layer tersembunyi dengan sejumlah variabel node. Layer atas merupakan layer output dengan node z1 – z2 yang diperoleh dari input yang dicobakan. • Contoh, prediksi penjualan (output) berdasarkan penjualan lama, harga dan cuaca (input). 28 September 2005 Teknik-teknik Data Mining 19
  • 20. Gambar 5. Struktur Jaringan Syaraf Buatan 28 September 2005 Teknik-teknik Data Mining 20
  • 21. Jaringan Syaraf Buatan (Lanjutan) • Setiap node yang ada pada layer tersembunyi, secara keseluruhan terhubung dengan input, berarti setiap yg dipelajari didasarkan pada semua input yg diambil bersamaan. Hal ini terlihat pada gambar 6. • Pada gambar 7. dijelaskan mengenai jaringan syaraf buatan The Clementine User Guide untuk mengidentifikasikan resiko kanker dari berbagai faktor input. 28 September 2005 Teknik-teknik Data Mining 21
  • 22. Gambar 6. Di dalam Node 28 September 2005 Teknik-teknik Data Mining 22
  • 23. Gambar 7. Jaringan Syaraf Buatan The Clementine User Guide 28 September 2005 Teknik-teknik Data Mining 23
  • 24. OLAP (On-line Analytical Processing) Definisi Menurut E.F. Codd • OLAP atau On line Analytical Processing merupakan salah satu aplikasi database untuk memproses database yang sangat besar dengan data yang kompleks. • OLAP didefinisikan oleh E.F. Codd (1993) sebagai sintesis dinamik, analisis dan konsolidasi dari data multidimensional yang sangat besar. • Aturan atau kebutuhan dari sistem OLAP : - View konseptual multidimensional - Penanganan dynamic sparse matrix - Transparansi - Pendukung multi-user - Aksesibilitas - Operasi unrestricted cross dimensional - Kinerja reporting yang konsisten - Manipulasi data intuitif - Arsitektur client/server - Reporting yang fleksibel - Dimensionalitas generik - Level agregasi dan dimensi yang tidak terbatas 28 September 2005 Teknik-teknik Data Mining 24
  • 25. Definisi OLAP Menurut Nigel Pendse • OLAP didefinisikan oleh Nigel Pendse sebagai Fast Analysis of Shared Multidimensional Information, artinya  Fast dimana pemakai memperoleh respon dalam detik sehingga tidak terputus rantai pemikirannya  Analysis dimana sistem menyediakan fungsi2 analisis dan lingkup intuitif dan fungsi2 ini dapat mensuplai logika bisnis dan analisis statistikal yang relevan dengan aplikasi user  Shared dimana sistem mendukung user yang banyak secara konkurensi  Multidimensional merupakan kebutuhan utama sehingga sistem mensuplai view konseptual multidimensional dari data termasuk pendukung untuk hirarki multiple  Information merupakan data dan informasi yang diwariskan, dimana dibutuhkan oleh aplikasi user 28 September 2005 Teknik-teknik Data Mining 25
  • 26. Komponen OLAP Menurut Kirk Cruikshank • Kirk Cruikshank dari Arbor Software mengidentifikasikan ada 3 komponen OLAP :  Database multidimensional harus dapat mengekspresikan kalkulasi bisnis yang kompleks dengan mudah. Data harus bereferensi dan didefinisikan matematis  Navigasi intuitatif dalam penyusunan data ‘roam around’ yang mana membutuhkan hirarki mining  Respons instan, yang artinya kebutuhan untuk memberi user informasi secepat mungkin 28 September 2005 Teknik-teknik Data Mining 26
  • 27. Contoh OLAP • Contoh database OLAP misalnya data penjualan yang dikumpulkan dari region, tipe produk dan cabang penjualan. • Queri OLAP harus mengakses database penjualan yang lebih dari satu tahun dan multi-gigabyte untuk menemukan penjualan produk di setiap region per-tipe produk. • Queri OLAP dapat dikarakterisasikan sebagai transaksi online yang ° Mengakses data dalam jumlah besar, mis: data penjualan beberapa tahun ° Menganalisis relationship antara tipe elemen bisnis mis: penjualan, wilayah, produk dan cabang ° Melibatkan data yang terkumpul mis: volume penjualan, dollar yang dianggarkan dan dollar yang dihabiskan 28 September 2005 Teknik-teknik Data Mining 27
  • 28. Contoh OLAP (lanjutan) ° Menyajikan data dalam berbagai perspektif, mis: penjualan berdasarkan wilayah vs penjualan berdasarkan cabang dari produk dalam setiap wilayah ° Membandingkan data yang terkumpul dalam periode waktu secara hirarki, mis: bulanan, tahunan ° Melibatkan kalkulasi kompleks antara elemen data , mis: keuntungan yang diharapkan sebagai fungsi dari pendapatan penjualan untuk setiap tipe dari cabang penjualan dalam suatu wilayah tertentu. ° Dapat merespon permohonan user secara cepat sehingga user dapat mengikuti proses pemikiran yang analitik tanpa masuk pada sistem 28 September 2005 Teknik-teknik Data Mining 28
  • 29. Visualisasi Data • Visualisasi data memungkinkan si analis menperoleh pemahaman yang dalam dan lebih intuitif mengenai data dan dapat bekerja sebaik mungkin pada data mining. • Data mining memperbolehkan si analis memfokuskan pola2 dan trend2 tertentu dan menjelajahi ke dalam menggunakan visualisasi. 28 September 2005 Teknik-teknik Data Mining 29
  • 30. Selesai 28 September 2005 Teknik-teknik Data Mining 30