The document discusses topics related to rule-based machine learning, clustering, and association rules. It covers the following key points:
- The learning objectives of the course, which include understanding decision trees, entropy, information gain, clustering, and association rules.
- The course materials, which cover introduction to decision trees, entropy and information gain, clustering, and association rules.
- An introduction to decision trees, including how they represent classification problems using nodes and branches to represent attributes and values. Information theory helps determine the role of attributes in tree construction.
Call Us -/9953056974- Call Girls In Vikaspuri-/- Delhi NCR
Machine Learning Techniques
1. Topik 7
Rule-Based Machine Learning, Clustering,
dan Association Rules
Dr. Sunu Wibirama
Modul Kuliah Kecerdasan Buatan
Kode mata kuliah: UGMx 001001132012
June 28, 2022
2. June 28, 2022
1 Capaian Pembelajaran Mata Kuliah
Topik ini akan memenuhi CPMK 5, yakni mampu mendefinisikan beberapa teknik ma-
chine learning klasik (linear regression, rule-based machine learning, probabilistic machine
learning, clustering) dan konsep dasar deep learning serta implementasinya dalam penge-
nalan citra (convolutional neural network).
Adapun indikator tercapainya CPMK tersebut adalah memahami konsep dasar deci-
sion tree, dapat melakukan penghitungan entropi dan information gain, memahami konsep
clustering dan association rules.
2 Cakupan Materi
Cakupan materi dalam topik ini sebagai berikut:
a) Introduction to Decision Tree: materi ini membahas tentang konsep generalisasi dalam
machine learning. Hal mendasar dalam machine learning adalah menghasilkan rules
atau aturan dari sekolompok data. Rules ini akan digunakan untuk memprediksi kelas
atau kategori dari data yang belum pernah dilihat sebelumnya oleh sistem. Meskipun
demikian, pada beberapa kasus ada lebih dari satu opsi untuk melakukan klasifikasi.
Tree yang dihasilkan dari rules tersebut memiliki berbagai kemungkinan. Di sinilah
peran dari teori informasi dalam menentukan peran dan posisi atribut dalam pemben-
tukan tree.
b) Entropy and Information Gain: materi ini membahas konsep teori informasi untuk
menentukan tingkat ketidakteraturan dalam sebuah data. Semakin besar entropi dari
sebuah atribut, maka peran atribut tersebut dalam membagi kelas atau kategori se-
makin kecil. Semakin kecil nilai entropi, semakin besar peran tersebut dalam membagi
kelas atau kategori dari data yang kita miliki. Atribut yang memiliki penurunan en-
tropi terendah—atau memiliki information gain tertinggi—adalah atribut yang akan
menempati root node dalam decision tree.
c) Clustering: materi ini membahas salah satu teknik unsupervised learning yang sangat
terkenal, yakni konsep clustering. Clustering biasa dimanfaatkan untuk mencari pola
atau kesamaan karakteristik pada data. Dengan clustering, data dapat dibagi menjadi
beberapa kategori. Clustering menjadi langkah awal untuk melakukan labeling pada
data.
d) Association Rules: teknik ini adalah bagian dari unsupervised learning yang sering
digunakan untuk memberikan rekomendasi bagi pelanggan e-commerce berdasarkan
frekuensi kemunculan sebuah produk atau seberapa sering sebuah dua buah produk
dibeli bersamaan. Pada materi ini akan dibahas tiga buah ukuran (metrics) yang
sering digunakan dalam association rules, yakni support, confidence, dan lift.
1