Dokumen tersebut membahas tentang data mining khususnya metode association rule untuk mengekstraksi pola hubungan antar item dalam sejumlah besar data transaksi. Metode ini digunakan untuk memprediksi item mana yang cenderung dibeli bersamaan berdasarkan transaksi sebelumnya."
4. Ekstraksi pengetahuan yang menarik dalam bentuk
rule, regularities, pola, constraint, dan lain-lain dari data yang
tersimpan dalam sejumlah besar basis data
20. Gambaran Hubungan Asosiatif Antar Item
if then
Sebagai contoh:
if antecedent then consequent
Artinya:
1. Ada hubungan asosiatif antara roti dengan selai.
2. Jika seseorang membeli roti maka dia berkemungkinan juga sebesar n% untuk membeli selai dalam satu pembelian
21. Ada dua parameter yang perlu
diketahui pada metode
Association Rule, yaitu nilai
support dan nilai confidence
22. Nilai support:
Rasio antara jumlah transaksi yang memuat antecedent
dan consequent terhadap jumlah transaksi
Nilai confidence:
Rasio antara jumlah transaksi yang memuat antecedent
dan consequent terhadap jumlah transaksi yang meliputi
semua item dalam antecedent
23. IF A THEN B,C
Support = 0.5 (50%)
Confidence = 1 (100%)
IF B THEN C
Support = 1 (100%)
Confidence = 1 (100%)
IF B THEN C,A
Support = 0.5 (50%)
Confidence = 0.5 (50%)
Cara menghitung nilai support dan confidence
Terdapat dua transaksi yang terjadi:
31. Minimum support:
Menyatakan nilai minimum kemunculan itemset pada
suatu kumpulan transaksi
Minimum confidence:
Menyatakan nilai minimum kepercayaan terhadap rule
yang dihasilkan
32. Dalam kasus ini, ditentukan
nilai minimum support = 2
(22%) dan minimum
confidence = 70%
36. 1. C2 adalah hasil dari L1 join L1
2. L2 adalah itemset C2 yang memenuhi aturan minimum support
L1
37. Langkah 4:
Generate frequent pattern 3-itemset.
Lakukan untuk n-itemset apabila masih
mungkin terbentuk itemset.
38. 1. Algoritma apriori mulai berjalan di langkah ini
2. Join step: {{I1, I2, I3}, {I1, I2, I5}, {I1, I3, I5}, {I2, I3, I4}, {I2, I3, I5}, {I2, I4, I5}}
3. {I1, I3, I5}, {I2, I3, I4}, {I2, I3, I5}, {I2, I4, I5} tidak dijadikan itemset karena ada
subset dari set tersebut yang tidak memenuhi minimum support (prune)
39. Langkah 5:
Bentuk Association Rule dari frequent
itemset yang sudah dibentuk. Rule yang
nilai confidencenya lebih dari minimum
confidence akan digunakan (Strong
Association Rule).
45. Representasi pengetahuan
No. Strong Association Rule Representasi Pengetahuan
1 if {I1,I2} then {I5} Item I1, I2, dan I5 harus ditempatkan
pada rak yang berdekatan/pada satu
lorong rak
2 if {I3} then {I1,I2} Item I3, I1, dan I2 harus ditempatkan
pada rak yang berdekatan/pada satu
lorong rak
.. .. ..
Misalkan tujuan data mining adalah penempatan item yang memiliki hubungan
asosiatif harus ditempatkan berdekatan agar keuntungan lebih optimal
53. Langkah 3:
Urutkan tabel transaksi berdasarkan
frequent 1-itemset yang sudah diurutkan
support count-nya secara descending
54. Apabila ada dua item atau lebih yang memiliki support count yang sama maka urutan didasarkan
pada item mana yang ada di transaksi yang lebih awal muncul (T1 terjadi lebih dahulu dibanding T2)
Sort menurut support count (Descending):
𝐿 = { 𝐼2: 7 , 𝐼1: 6 , 𝐼3: 6 , 𝐼4: 2 , 𝐼5: 2 }
TID List of Items
T1 I2, I1, I5
T2 I2, I4
T3 I2, I3
T4 I2, I1, I4
T5 I1, I3
T6 I2, I3
T7 I1, I3
T8 I2, I1, I3, I5
T9 I2, I1, I3
56. null akan menjadi root dan child dari root dipilih berdasarkan scan List of Items
TID List of Items
T1 I2, I1, I5
T2 I2, I4
T3 I2, I3
T4 I2, I1, I4
T5 I1, I3
T6 I2, I3
T7 I1, I3
T8 I2, I1, I3, I5
T9 I2, I1, I3
null
I2:1
I1:1
I5:1
72. Langkah 6:
Bentuk Conditional FP-Tree dimulai dari
item dengan support count terendah ke
item dengan support count tertinggi
(gunakan konsep minimum support)
80. Langkah 8:
Cari Strong Association Rule
berdasarkan Frequent Pattern yang
terbentuk dengan cara yang sama
dengan apriori sampai terbentuk
representasi pengetahuan
82. Transaction ID Items
1 Bread, Milk
2 Bread, Diaper, Beer, Eggs
3 Milk, Diaper, Beer, Coke
4 Bread, Milk, Diaper, Beer
5 Bread, Milk, Diaper, Coke
Terdapat 5 transaksi yang terjadi:
Kasus:
1. Tujuan data mining adalah membentuk paket ekonomis dari item yang punya hubungan asosiasi
2. Ditentukan minimum support 2 dan minimum confidence 70%