Dokumen tersebut membahas teknik-teknik data mining yang meliputi analisis cluster, induksi (pohon keputusan dan aturan induksi), jaringan syaraf buatan, OLAP, dan visualisasi data. Metode-metode tersebut digunakan untuk menemukan pola dan hubungan di dalam data besar untuk tujuan klasifikasi, regresi, dan deteksi outlier.
Dokumen tersebut membahas tentang algoritma covering dan penerapannya dalam klasifikasi teks. Algoritma covering dapat digunakan untuk membentuk aturan klasifikasi berdasarkan nilai maksimal atribut. Jurnal lain membahas algoritma baru yaitu Cross Covering Algorithm Based on Simulated Annealing (SACCA) yang menggabungkan algoritma covering dan simulated annealing untuk mencari pusat domain yang lebih optimal dengan akurasi yang lebih tinggi. Hasil penelitian menunjukkan bahwa S
Pemanfaatan Stack Untuk Deteksi GerakanTeady Matius
Teks tersebut membahas tentang pemanfaatan stack untuk deteksi gerakan tangan berdasarkan citra yang ditangkap kamera. Metode ini memanfaatkan stack untuk menyimpan serangkaian citra sampai diperoleh citra yang dianggap memiliki gerakan yang sudah fix. Fitur yang diekstrak dari citra adalah matriks populasi piksel 5x5 dan diukur jaraknya menggunakan L1-metric untuk menentukan citra mana yang mirip dan yang berbeda. Cit
The document is a chapter from a textbook on data mining written by Akannsha A. Totewar, a professor at YCCE in Nagpur, India. It provides an introduction to data mining, including definitions of data mining, the motivation and evolution of the field, common data mining tasks, and major issues in data mining such as methodology, performance, and privacy.
Dokumen tersebut membahas arsitektur dan model data mining. Terdapat penjelasan mengenai komponen-komponen arsitektur data mining seperti data cleaning, data integration, data mining engine, dan graphical user interface. Juga dibahas model-model data mining seperti prediction methods dan description methods beserta contoh-contohnya seperti klasifikasi, regresi, dan clustering.
1. Unsupervised learning digunakan untuk pengelompokkan data tanpa label melalui clustering.
2. K-means clustering dan hierarchical clustering adalah dua pendekatan utama clustering.
3. Pemilihan parameter seperti jumlah cluster pada k-means mempengaruhi akurasi hasil clustering.
Jawaban No. 2 Tahap-Tahap Data Mining Karena DM adalah suatu ...butest
Tahapan data mining terdiri dari pembersihan data, integrasi data, transformasi data, teknik data mining, evaluasi pola, dan presentasi pengetahuan. Proses ini bersifat interaktif dengan pengguna untuk menemukan pola dan informasi menarik dari data.
Dokumen tersebut membahas tentang algoritma covering dan penerapannya dalam klasifikasi teks. Algoritma covering dapat digunakan untuk membentuk aturan klasifikasi berdasarkan nilai maksimal atribut. Jurnal lain membahas algoritma baru yaitu Cross Covering Algorithm Based on Simulated Annealing (SACCA) yang menggabungkan algoritma covering dan simulated annealing untuk mencari pusat domain yang lebih optimal dengan akurasi yang lebih tinggi. Hasil penelitian menunjukkan bahwa S
Pemanfaatan Stack Untuk Deteksi GerakanTeady Matius
Teks tersebut membahas tentang pemanfaatan stack untuk deteksi gerakan tangan berdasarkan citra yang ditangkap kamera. Metode ini memanfaatkan stack untuk menyimpan serangkaian citra sampai diperoleh citra yang dianggap memiliki gerakan yang sudah fix. Fitur yang diekstrak dari citra adalah matriks populasi piksel 5x5 dan diukur jaraknya menggunakan L1-metric untuk menentukan citra mana yang mirip dan yang berbeda. Cit
The document is a chapter from a textbook on data mining written by Akannsha A. Totewar, a professor at YCCE in Nagpur, India. It provides an introduction to data mining, including definitions of data mining, the motivation and evolution of the field, common data mining tasks, and major issues in data mining such as methodology, performance, and privacy.
Dokumen tersebut membahas arsitektur dan model data mining. Terdapat penjelasan mengenai komponen-komponen arsitektur data mining seperti data cleaning, data integration, data mining engine, dan graphical user interface. Juga dibahas model-model data mining seperti prediction methods dan description methods beserta contoh-contohnya seperti klasifikasi, regresi, dan clustering.
1. Unsupervised learning digunakan untuk pengelompokkan data tanpa label melalui clustering.
2. K-means clustering dan hierarchical clustering adalah dua pendekatan utama clustering.
3. Pemilihan parameter seperti jumlah cluster pada k-means mempengaruhi akurasi hasil clustering.
Jawaban No. 2 Tahap-Tahap Data Mining Karena DM adalah suatu ...butest
Tahapan data mining terdiri dari pembersihan data, integrasi data, transformasi data, teknik data mining, evaluasi pola, dan presentasi pengetahuan. Proses ini bersifat interaktif dengan pengguna untuk menemukan pola dan informasi menarik dari data.
Model klasifikasi dan evaluasi untuk data sains dasar dibahas. Metode klasifikasi seperti pohon keputusan, jaringan saraf, k-tetangga terdekat, dan Bayes digunakan untuk memprediksi label data baru. Matriks kekeliruan digunakan untuk mengevaluasi kinerja model dengan menghitung akurasi, presisi, dan recall. Studi kasus melibatkan pemodelan keputusan bermain golf dan penerimaan mobil menggunakan algoritma pohon keputusan.
Dokumen tersebut membahas tentang sistem komputer, paradigma rekayasa perangkat lunak, algoritma, struktur data, dan konsep antrian pada sistem operasi. Secara ringkas, dibahas tentang komponen utama sistem komputer, metode pengembangan perangkat lunak, pendekatan algoritma dan struktur organisasi data, serta pengelolaan antrian input/output pada sistem operasi berbasis partisi.
Dokumen tersebut membahas tentang sistem komputer, paradigma rekayasa perangkat lunak, algoritma, struktur data, dan konsep antrian pada sistem operasi. Secara ringkas, dibahas tentang komponen utama sistem komputer, metode pengembangan perangkat lunak, pendekatan algoritma dan struktur organisasi data, serta pengelolaan antrian input/output pada sistem operasi.
Dokumen tersebut membahas tentang sistem komputer, paradigma rekayasa perangkat lunak, algoritma, struktur data, dan konsep antrian pada sistem operasi. Secara ringkas, dibahas tentang komponen utama sistem komputer, metode pengembangan perangkat lunak, pendekatan algoritma dan struktur organisasi data, serta pengelolaan antrian input/output pada sistem operasi berbasis partisi.
Dokumen tersebut membahas tentang sistem komputer, paradigma rekayasa perangkat lunak, algoritma, struktur data, dan konsep antrian pada sistem operasi. Secara ringkas, dibahas tentang komponen utama sistem komputer, metode pengembangan perangkat lunak, pendekatan algoritma dan struktur organisasi data, serta pengelolaan antrian input/output pada sistem operasi berbasis partisi.
Dokumen tersebut membahas tentang praktikum analisis cluster. Terdapat beberapa tahapan dalam analisis cluster, yaitu mendefinisikan cluster, mengukur kesamaan antar objek, memilih algoritma cluster untuk membentuk kelompok, dan menentukan jumlah cluster. Dokumen ini juga menjelaskan beberapa metode cluster seperti hierarchical dan k-means clustering beserta ilustrasinya.
Dokumen ini membahas konsep dan arsitektur data mining serta metode-metode yang digunakan dalam data mining seperti predictive modeling, clustering, association rule, dan sequence analysis beserta contoh-contoh penerapannya.
Silabus mata kuliah ini membahas konsep dasar objek, kelas, dan objek dalam analisis dan perancangan berorientasi objek. Metodologi OOAD memiliki karakteristik seperti pengkapsulan, pewarisan, dan polimorfisme. Konsep-konsep ini digunakan untuk menganalisis sistem sebagai kumpulan objek dan kelas.
Modul ini membahas tentang transformasi data untuk proyek data science. Tujuannya adalah agar peserta dapat menjelaskan berbagai teknik transformasi data dan menerapkannya untuk menyelesaikan masalah data. Modul ini menjelaskan konsep representasi fitur, rekayasa fitur, dan berbagai teknik transformasi data seperti imputasi, normalisasi, dan seleksi fitur.
Dokumen tersebut membahas penggunaan WEKA untuk klasifikasi dan clustering data. Beberapa contoh kasus yang dijelaskan adalah klasifikasi bunga iris menggunakan k-Nearest Neighbor Classifier, deteksi penyakit Parkinson berdasarkan suara, dan klasifikasi jenis kanker berdasarkan ekspresi gen. Algoritma yang dapat digunakan antara lain k-Nearest Neighbor, Naive Bayes, Neural Network, dan Support Vector Machine.
Klasifikasi adalah proses menemukan pola yang menjelaskan atau membedakan konsep atau kelas data untuk memprediksi kelas objek baru. Model klasifikasi dibangun dengan melatih algoritma pada data pelatihan untuk memetakan atribut ke label kelas, lalu model diuji keakuratannya pada data uji. Pohon keputusan sering digunakan karena mudah diinterpretasi.
Dokumen tersebut membahas tentang metode pengiriman form (POST dan GET) serta penggunaan session dalam PHP. Metode POST menyembunyikan variabel yang dikirim di alamat web, sedangkan metode GET menampilkan variabelnya. Session digunakan untuk menyimpan sementara variabel antar halaman dengan mendaftarkan, mengisi, dan menampilkan variabel session. Contoh koding mendemonstrasikan penggunaan form dengan metode POST, penyimpanan variabel ke session, dan penampil
Model klasifikasi dan evaluasi untuk data sains dasar dibahas. Metode klasifikasi seperti pohon keputusan, jaringan saraf, k-tetangga terdekat, dan Bayes digunakan untuk memprediksi label data baru. Matriks kekeliruan digunakan untuk mengevaluasi kinerja model dengan menghitung akurasi, presisi, dan recall. Studi kasus melibatkan pemodelan keputusan bermain golf dan penerimaan mobil menggunakan algoritma pohon keputusan.
Dokumen tersebut membahas tentang sistem komputer, paradigma rekayasa perangkat lunak, algoritma, struktur data, dan konsep antrian pada sistem operasi. Secara ringkas, dibahas tentang komponen utama sistem komputer, metode pengembangan perangkat lunak, pendekatan algoritma dan struktur organisasi data, serta pengelolaan antrian input/output pada sistem operasi berbasis partisi.
Dokumen tersebut membahas tentang sistem komputer, paradigma rekayasa perangkat lunak, algoritma, struktur data, dan konsep antrian pada sistem operasi. Secara ringkas, dibahas tentang komponen utama sistem komputer, metode pengembangan perangkat lunak, pendekatan algoritma dan struktur organisasi data, serta pengelolaan antrian input/output pada sistem operasi.
Dokumen tersebut membahas tentang sistem komputer, paradigma rekayasa perangkat lunak, algoritma, struktur data, dan konsep antrian pada sistem operasi. Secara ringkas, dibahas tentang komponen utama sistem komputer, metode pengembangan perangkat lunak, pendekatan algoritma dan struktur organisasi data, serta pengelolaan antrian input/output pada sistem operasi berbasis partisi.
Dokumen tersebut membahas tentang sistem komputer, paradigma rekayasa perangkat lunak, algoritma, struktur data, dan konsep antrian pada sistem operasi. Secara ringkas, dibahas tentang komponen utama sistem komputer, metode pengembangan perangkat lunak, pendekatan algoritma dan struktur organisasi data, serta pengelolaan antrian input/output pada sistem operasi berbasis partisi.
Dokumen tersebut membahas tentang praktikum analisis cluster. Terdapat beberapa tahapan dalam analisis cluster, yaitu mendefinisikan cluster, mengukur kesamaan antar objek, memilih algoritma cluster untuk membentuk kelompok, dan menentukan jumlah cluster. Dokumen ini juga menjelaskan beberapa metode cluster seperti hierarchical dan k-means clustering beserta ilustrasinya.
Dokumen ini membahas konsep dan arsitektur data mining serta metode-metode yang digunakan dalam data mining seperti predictive modeling, clustering, association rule, dan sequence analysis beserta contoh-contoh penerapannya.
Silabus mata kuliah ini membahas konsep dasar objek, kelas, dan objek dalam analisis dan perancangan berorientasi objek. Metodologi OOAD memiliki karakteristik seperti pengkapsulan, pewarisan, dan polimorfisme. Konsep-konsep ini digunakan untuk menganalisis sistem sebagai kumpulan objek dan kelas.
Modul ini membahas tentang transformasi data untuk proyek data science. Tujuannya adalah agar peserta dapat menjelaskan berbagai teknik transformasi data dan menerapkannya untuk menyelesaikan masalah data. Modul ini menjelaskan konsep representasi fitur, rekayasa fitur, dan berbagai teknik transformasi data seperti imputasi, normalisasi, dan seleksi fitur.
Dokumen tersebut membahas penggunaan WEKA untuk klasifikasi dan clustering data. Beberapa contoh kasus yang dijelaskan adalah klasifikasi bunga iris menggunakan k-Nearest Neighbor Classifier, deteksi penyakit Parkinson berdasarkan suara, dan klasifikasi jenis kanker berdasarkan ekspresi gen. Algoritma yang dapat digunakan antara lain k-Nearest Neighbor, Naive Bayes, Neural Network, dan Support Vector Machine.
Klasifikasi adalah proses menemukan pola yang menjelaskan atau membedakan konsep atau kelas data untuk memprediksi kelas objek baru. Model klasifikasi dibangun dengan melatih algoritma pada data pelatihan untuk memetakan atribut ke label kelas, lalu model diuji keakuratannya pada data uji. Pohon keputusan sering digunakan karena mudah diinterpretasi.
Dokumen tersebut membahas tentang metode pengiriman form (POST dan GET) serta penggunaan session dalam PHP. Metode POST menyembunyikan variabel yang dikirim di alamat web, sedangkan metode GET menampilkan variabelnya. Session digunakan untuk menyimpan sementara variabel antar halaman dengan mendaftarkan, mengisi, dan menampilkan variabel session. Contoh koding mendemonstrasikan penggunaan form dengan metode POST, penyimpanan variabel ke session, dan penampil
Dokumen ini membahas penggunaan beberapa tag HTML penting untuk format tampilan dokumen seperti heading, paragraph, line break, dan daftar termasuk ordered list, unordered list, dan menu list.
The PHP script connects to a database to log website visitor statistics including the visitor's IP address, date, number of page hits, and time online. It checks if the IP address already exists for the current date, and if not, inserts a new entry, otherwise it updates the existing entry by incrementing the hits count and setting the online time. Various metrics are then calculated from the database like current visitors, total visitors, hits for the day, total hits, and current online users. These statistics are output in an HTML table.
Web/HTML Editor digunakan untuk membuat halaman web statis dan dinamis secara visual atau menggunakan teks editor. Editor web profesional menyediakan fitur yang mempercepat pembuatan halaman seperti GUI, otomatisasi kode, dan sambungan basis data. Browser menerjemahkan kode HTML menjadi tampilan yang diinginkan. Microsoft Internet Explorer, Firefox, dan Safari adalah contoh browser web. Ada dua model pembuatan halaman web statis yaitu secara lokal dan di server. Str
CSS digunakan untuk mengubah tampilan halaman website seperti warna dan format dengan mudah. CSS memungkinkan pengguna untuk mempercantik tampilan teks, tombol, tabel dan elemen lainnya. CSS dapat ditempatkan langsung di tag HTML, di dalam file HTML, atau di file CSS terpisah yang dapat digunakan untuk semua halaman website. Kelas CSS memungkinkan pengguna untuk menerapkan gaya yang sama pada elemen-elemen yang berbeda.
Dokumen ini membahas konsep dasar penggunaan basis data pada sistem berbasis web. Terdapat penjelasan tentang koneksi database, mengeksekusi query, dan fungsi-fungsi PHP untuk MySQL. Juga dijelaskan cara membuat database, tabel, dan file-file pendukung seperti config, connection, dan SQL. Selanjutnya dijelaskan cara menampilkan, menambahkan, mengubah, dan menghapus data kota pada tabel melalui beberapa file seperti form input, tampil, edit
This document discusses PHP control structures including if/else statements, switch statements, and looping structures like while, do-while and for loops.
If/else statements allow for conditional execution of code based on simple or compound expressions. Switch statements allow checking a variable against multiple case values.
While and do-while loops check a condition at the start or end of each loop iteration. For loops allow iterating with a counter variable through initialization, condition checking, and increment/decrement each loop.
HTML dikembangkan oleh Tim Berners-Lee di CERN dan dipopulerkan oleh browser Mosaic pada tahun 1990-an. HTML menggunakan tag yang diletakkan di antara tanda kurung siku untuk menandai teks dan elemen lainnya. Struktur dasar file HTML terdiri atas bagian Header dan Body.
The document discusses visualizing an HTML table containing poll results using Highcharts. It includes instructions to include necessary JavaScript libraries, initialize a chart on page load by passing the table and chart options to a Highcharts visualization function, and output the poll response counts from a database into the table. This will generate an interactive column chart of the poll results from the data in the HTML table.
"Jodoh Menurut Prespektif Al-Quran" (Kajian Tasir Ibnu Katsir Surah An-Nur ay...Muhammad Nur Hadi
Jurnal "Jodoh Menurut Prespektif Al-Quran" (Kajian Tasir Ibnu Katsir Surah An-Nur ayat 26 dan 32 dan Surah Al-Hujurat Ayat 13), Ditulis oleh Muhammmad Nur Hadi, Mahasiswa Program Studi Ilmu Hadist di UIN SUSKA RIAU.
2. Outline
Teknik-teknik data mining terdiri dari :
• Analisis cluster
• Induksi (pohon keputusan dan aturan induksi)
• Jaringan syaraf buatan (Neural Network)
• Online Analytical Processing (OLAP)
• Visualisasi data
28 September 2005 Teknik-teknik Data Mining 2
3. Analisis Cluster
• Dalam lingkungan ‘unsupervised learning’, sistem harus
mendapatkan klas2nya sendiri dan ini dilakukan dengan meng-cluster
data dalam database seperti tergambar pada gambar 1.
• Langkah pertama adalah dengan mendapatkan subset2 dari objek2
yang terhubung, kemudian mencari deskripsinya cth, D1, D2, D3,
dst., yang menggambarkan masing2 subset.
Gambar 1. Perolehan cluster dan deskripsi pada database
28 September 2005 Teknik-teknik Data Mining 3
4. Analisis Cluster (Lanjutan)
• Clustering dan segmentasi sebenarnya mempartisi database, karena
itu setiap partisi atau group adalah sama menurut kriteria atau
metrik tertentu. Jika pengukuran kesamaan tersedia, maka terdapat
sejumlah teknik untuk membentuk cluster.
• Kebanyakan aplikasi2 data mining menggunakan clusteing menurut
similarity (kesamaan), contohnya segmentasi basis klien. Clustering
menurut optimasi dari sekumpulan fungsi-fungsi digunakan pada
analisis data, misalnya ketika mensetting tarif asuransi klien dapat
disegmentasi menurut sejumlah parameter.
• Contoh aplikasi :
– Perangkat ‘stand-alone’ : explore data distribution
– Langkah preprocessing untuk algoritma lain
– Pengenalan pola, analisis data spasial, pengenalan citra, market
research, WWW, …
• clustering dokumen2
• clustering data log web untuk mendapatkan group dengan pola
akses yang sama
28 September 2005 Teknik-teknik Data Mining 4
5. Apa itu Clustering ?
• Penggelompokkan data ke cluster2
– Data yang sama satu sama lain berada pada cluster yang sama
– Yang tidak sama berada pada cluster lain
– ‘Unsupervised learning’: klas2 yang belum ditentukan
Outliers
Gambar 2. Clustering
Cluster 1
Cluster 2
28 September 2005 Teknik-teknik Data Mining 5
6. Clustering Yang Baik
• Intraclass similarity (Kesamaan di dalam klas) yang tinggi dan
interclass similarity (kesamaan antar klas) yang rendah
– Bergantung pada pengukuran kesamaan
• Kemampuan untuk memdapatkan beberapa atau semua pola yang
tersembunyi
28 September 2005 Teknik-teknik Data Mining 6
7. Kebutuhan Clustering
• Scalability
• Kemampuan mengerjakan atribut2 dari berbagai tipe
• Penemuan clusters dengan bentuk yang tidak tentu
• Kebutuhan minimal untuk pengetahuan domain untuk menentukan
parameter input
• Dapat menerima noise dan outlier
• Tidak mengindahkan susunan record dari input
• Dimensi yang tinggi
• Menyatu dengan batasan yang dispesifikasikan oleh user
• Interpretability and usability
28 September 2005 Teknik-teknik Data Mining 7
8. Tipe-tipe Data pada Clustering
• Variabel2 berskala interval
• Variabel biner
• Variabel nominal, ordinal dan rasio
• Variable2 dari berbagai tipe variabel
28 September 2005 Teknik-teknik Data Mining 8
9. Kategori Pendekatan Clustering
• Algoritma Partisi
– Mempartisi objek2 ke dalam k cluster
– Realokasi objek2 secara iteratif untuk memperbaiki clustering
• Algoritma Hirarkis
– Agglomerative: setiap objek merupakan cluster, gabungan dari cluster2
membentuk cluster yang besar
– Divisive: semua objek berada dalam suatu cluster, pembagian cluster
tsb membentuk cluster2 yang kecil
• Metode berbasis densitas
– Berbasis koneksitas dan fungsi densitas
– Noise disaring, kemudian temukan cluster2 dalam bentuk sembarang
• Metode berbasis grid
– Kuantisasi ruang objek ke dalam struktur grid
• Berbasis Model
– Gunakan model untuk menemukan keadaan data yang baik
28 September 2005 Teknik-teknik Data Mining 9
10. Algoritma Partisi : Konsep Dasar
• Partisi n objek ke dalam k cluster
– Optimasi kriteria partisi yang dipilih
• Global optimal: dicoba semua partisi
– (kn-(k-1)n-…-1) partisi yang mungkin
• Metode heuristik : k-means dan k-medoids
– K-means: cluster direpresentasikan oleh pusat
– K-medoids or PAM (partition around medoids): setiap cluster
direpresentasikan oleh salah satu objek pada cluster
28 September 2005 Teknik-teknik Data Mining 10
11. K-means
• Pilih k objek sembarang sebagai inisial pusat cluster
• Sampai tidak ada perubahan, kerjakan
– Tunjukkan setiap objek pada cluster dimana objeknya hampir
sama, berdasarkan nilai tengah dari objek2 pada cluster
– Update the cluster means, i.e., calculate the mean value of the
objects for each cluster
28 September 2005 Teknik-teknik Data Mining 11
12. Gambar 3. Contoh : K-Means
10
9
8
7
6
5
4
3
2
1
0
0 1 2 3 4 5 6 7 8 9 10
10
9
8
7
6
5
4
3
2
1
0
0 1 2 3 4 5 6 7 8 9 10
reassign reassign
10
9
8
7
6
5
4
3
2
1
0
0 1 2 3 4 5 6 7 8 9 10
10
9
8
7
6
5
4
3
2
1
0
0 1 2 3 4 5 6 7 8 9 10
28 September 2005 Teknik-teknik Data Mining 12
10
9
8
7
6
5
4
3
2
1
0
0 1 2 3 4 5 6 7 8 9 10
K=2
Arbitrarily choose K
object as initial
cluster center
Assign
each
objects
to most
similar
center
Update
the
cluster
means
Update
the
cluster
means
13. Induksi
• Induksi merupakan salah satu teknik inferensi informasi pada
database.
• Ada dua teknik inferensi yakni
– Induksi merupakan teknik inferensi informasi yang digeneralisasi dari
database, contohnya setiap pegawai mempunyai manajer.
– Deduksi merupakan teknik inferensi informasi dari konsekuensi logis
informasi pada database, contohnya operasi join pada dua tabel;
dimana yang pertama mengenai pegawai dan departemen sedangkan
yang kedua mengenai departemen dan manajer, menghasilkan relasi
antara pegawai dan manajer.
28 September 2005 Teknik-teknik Data Mining 13
14. Pohon Keputusan
• Pohon keputusan merupakan representasi pengetahuan yang
simpel. Pohon keputusan ini mengklasifikasikan contoh2 pada klas2
dengan angka finit, node diberi nama atribut, edge di beri nilai
atribut sedangkan leave diberi nama klas. Objek2 diklasifikasikan
dengan struktur pohon, dengan menggunakan dahan2nya sebagai
nilai atribut dari objek.
• Gambar berikut mengenai keadaan cuaca. Objek2 berisikan
informasi mengenai suasana cuaca, kelembaban dll. Beberapa
objek merupakan contoh positif dinotasikan dengan P sedangkan
yang lain negatif atau N.
28 September 2005 Teknik-teknik Data Mining 14
15. Gambar 4. Struktur Pohon Keputusan
28 September 2005 Teknik-teknik Data Mining 15
16. Induksi Aturan
• Sistem data mining harus dapat menyimpulkan suatu model dari
database dimana model ini mendefinisikan klas2 seperti halnya
database yang terdiri atas satu atau lebih atribut yang menunjukkan
klas dari tupel. Klas dapat didefinisikan oleh kondisi atribut.
• Aturan produksi dipergunakan untuk merepresentasikan
pengetahuan sistem pakar dan keuntungannya mudah
diinterpretasikan oleh kepakaran manusia dikarenakan modularitas
yakni aturan yang tunggal dapat dipahami dengan sendirinya dan
tidak perlu referensi aturan lain.
28 September 2005 Teknik-teknik Data Mining 16
17. Jaringan Syaraf Buatan
• Merupakan pendekatan perhitungan yang melibatkan
pengembangan struktur secara matematis dengan kemampuan
untuk ‘belajar’.
• Mampu menurunkan pengertian dari data yang kompleks dan tidak
jelas dan dapat digunakan pula untuk mengekstrak pola dan
mendeteksi tren2 yang sangat kompleks untuk dibicarakan baik
oleh manusia maupun teknik komputer lainnya.
• Jaringan syaraf buatan yang terlatih dapat dianggap sebagai ‘pakar’
dalam kategori informasi yang akan dianalisis. Pakar ini dapat
digunakan untuk memproyeksi situasi baru dari ketertarikan dan
jawaban dari pertanyaan ‘what if’
28 September 2005 Teknik-teknik Data Mining 17
18. Jaringan Syaraf Buatan (Lanjutan)
• Dikarenakan jaringan syaraf buatan adalah terbaik dalam
mengidentifikasikan pola atau tren dalam data, maka cocok pula
digunakan untuk kebutuhan memprediksi antara lain:
– Prediksi penjualan
– Pengontrolan proses industri
– Riset Pelanggan
– Validasi data
– Manajemen resiko
– Pemasaran target
– dll
28 September 2005 Teknik-teknik Data Mining 18
19. Jaringan Syaraf Buatan (Lanjutan)
• Jaringan ini menggunakan sekumpulan elemen2 pemrosesan
(node) analog pada syaraf otak manusia. Elemen2 pemrosesan ini
terhubung dalam jaringan dimana dapat mengidentifikasikan pola2
dalam data sewaktu dipertunjukkan pada data, artinya jaringan
belajar dari pengalaman seperti halnya manusia.
• Pada gambar 5, layer bawah adalah lapisan input dengan x1 – x5.
Layer tengah disebut juga layer tersembunyi dengan sejumlah
variabel node. Layer atas merupakan layer output dengan node z1
– z2 yang diperoleh dari input yang dicobakan.
• Contoh, prediksi penjualan (output) berdasarkan penjualan lama,
harga dan cuaca (input).
28 September 2005 Teknik-teknik Data Mining 19
20. Gambar 5. Struktur Jaringan Syaraf Buatan
28 September 2005 Teknik-teknik Data Mining 20
21. Jaringan Syaraf Buatan (Lanjutan)
• Setiap node yang ada pada layer tersembunyi, secara keseluruhan
terhubung dengan input, berarti setiap yg dipelajari didasarkan pada
semua input yg diambil bersamaan. Hal ini terlihat pada gambar 6.
• Pada gambar 7. dijelaskan mengenai jaringan syaraf buatan The
Clementine User Guide untuk mengidentifikasikan resiko kanker
dari berbagai faktor input.
28 September 2005 Teknik-teknik Data Mining 21
22. Gambar 6. Di dalam Node
28 September 2005 Teknik-teknik Data Mining 22
23. Gambar 7. Jaringan Syaraf Buatan
The Clementine User Guide
28 September 2005 Teknik-teknik Data Mining 23
24. OLAP (On-line Analytical Processing)
Definisi Menurut E.F. Codd
• OLAP atau On line Analytical Processing merupakan salah satu
aplikasi database untuk memproses database yang sangat besar
dengan data yang kompleks.
• OLAP didefinisikan oleh E.F. Codd (1993) sebagai sintesis dinamik,
analisis dan konsolidasi dari data multidimensional yang sangat
besar.
• Aturan atau kebutuhan dari sistem OLAP :
- View konseptual multidimensional - Penanganan dynamic sparse matrix
- Transparansi - Pendukung multi-user
- Aksesibilitas - Operasi unrestricted cross dimensional
- Kinerja reporting yang konsisten - Manipulasi data intuitif
- Arsitektur client/server - Reporting yang fleksibel
- Dimensionalitas generik - Level agregasi dan dimensi yang tidak
terbatas
28 September 2005 Teknik-teknik Data Mining 24
25. Definisi OLAP Menurut Nigel Pendse
• OLAP didefinisikan oleh Nigel Pendse sebagai Fast Analysis of
Shared Multidimensional Information, artinya
Fast dimana pemakai memperoleh respon dalam detik sehingga tidak
terputus rantai pemikirannya
Analysis dimana sistem menyediakan fungsi2 analisis dan lingkup
intuitif dan fungsi2 ini dapat mensuplai logika bisnis dan analisis
statistikal yang relevan dengan aplikasi user
Shared dimana sistem mendukung user yang banyak secara konkurensi
Multidimensional merupakan kebutuhan utama sehingga sistem
mensuplai view konseptual multidimensional dari data termasuk
pendukung untuk hirarki multiple
Information merupakan data dan informasi yang diwariskan, dimana
dibutuhkan oleh aplikasi user
28 September 2005 Teknik-teknik Data Mining 25
26. Komponen OLAP Menurut Kirk Cruikshank
• Kirk Cruikshank dari Arbor Software mengidentifikasikan ada 3
komponen OLAP :
Database multidimensional harus dapat mengekspresikan
kalkulasi bisnis yang kompleks dengan mudah. Data harus
bereferensi dan didefinisikan matematis
Navigasi intuitatif dalam penyusunan data ‘roam around’ yang
mana membutuhkan hirarki mining
Respons instan, yang artinya kebutuhan untuk memberi user
informasi secepat mungkin
28 September 2005 Teknik-teknik Data Mining 26
27. Contoh OLAP
• Contoh database OLAP misalnya data penjualan yang dikumpulkan
dari region, tipe produk dan cabang penjualan.
• Queri OLAP harus mengakses database penjualan yang lebih dari
satu tahun dan multi-gigabyte untuk menemukan penjualan produk
di setiap region per-tipe produk.
• Queri OLAP dapat dikarakterisasikan sebagai transaksi online yang
° Mengakses data dalam jumlah besar, mis: data penjualan beberapa
tahun
° Menganalisis relationship antara tipe elemen bisnis mis: penjualan,
wilayah, produk dan cabang
° Melibatkan data yang terkumpul mis: volume penjualan, dollar yang
dianggarkan dan dollar yang dihabiskan
28 September 2005 Teknik-teknik Data Mining 27
28. Contoh OLAP (lanjutan)
° Menyajikan data dalam berbagai perspektif, mis: penjualan berdasarkan
wilayah vs penjualan berdasarkan cabang dari produk dalam setiap
wilayah
° Membandingkan data yang terkumpul dalam periode waktu secara
hirarki, mis: bulanan, tahunan
° Melibatkan kalkulasi kompleks antara elemen data , mis: keuntungan
yang diharapkan sebagai fungsi dari pendapatan penjualan untuk setiap
tipe dari cabang penjualan dalam suatu wilayah tertentu.
° Dapat merespon permohonan user secara cepat sehingga user dapat
mengikuti proses pemikiran yang analitik tanpa masuk pada sistem
28 September 2005 Teknik-teknik Data Mining 28
29. Visualisasi Data
• Visualisasi data memungkinkan si analis menperoleh pemahaman
yang dalam dan lebih intuitif mengenai data dan dapat bekerja
sebaik mungkin pada data mining.
• Data mining memperbolehkan si analis memfokuskan pola2 dan
trend2 tertentu dan menjelajahi ke dalam menggunakan visualisasi.
28 September 2005 Teknik-teknik Data Mining 29