Artikel ini membahas penggunaan algoritma Apriori dan FP-Growth untuk menganalisis data penjualan laptop berdasarkan merk yang populer di kalangan konsumen di Indocomputer Payakumbuh. Kedua algoritma digunakan untuk menemukan aturan asosiasi dan mengelompokkan data penjualan laptop berdasarkan merk agar dapat digunakan sebagai pertimbangan dalam strategi pemasaran dan persediaan stok laptop."
1. JURNAL J – CLICK
Jurnal Sistem Informasi Dan Manajemen Informatika
1
E-ISSN : 2541 – 2469
P-ISSN : 2355 – 7958
Vol. 6 No. 1 Juli 2019
ALGORITMA APRIORI DAN FP-GROWTH UNTUK ANALISA
PERBANDINGAN DATA PENJUALAN LEPTOP BERDASARKAN
MERK YANG DIMINATI KONSUMEN
(STUDI KASUS : INDOCOMPUTER PAYAKUMBUH)
Luki Henando
Teknik Komputer, Institut Teknologi Batam,
Jl. Gajah Mada Kompleks Vitka City, Tiban Ayu – Sekupang Batam
Email : luki.hernando04@gmail.com
Abstract
Data Mining is a process in an analysis of data on a large scale or in large quantities that aims to find
patterns that have meanings in decision support. In Finding these patterns can use the Algorithm Apriori
and FP-Growth algorithm which very popular in finding frequent itemset also determine or find the rule
of large database. In this study, using two algorithms that are Algorithm Apriori and FP-Growth that
can be used in for search the itemsets and find the association rules or rule of the results of selling
Laptop in Indocomputer Payakumbuh, in determining the brand of Laptop that is dominantly liked by
consumers, so it can use as consideration in increasing sales strategy in an effective and efficient.
Keywords: Knowledge Discovery Database, Data Mining, Apriori, FP-growth, Frequent itemset, Rule.
Abstrak
Data Mining Adalah suatu proses dalam sebuah analisa data dalam skala besar atau dalam jumlah besar
yang bertujuan untuk menemukan pola-pola yang mempunyai arti dalam pendukung keputusan. Dalam
Menemukan pola-pola tersebut bisa menggunakan Algoritma Apriori dan FP-Growth kedua Algoritma
ini sangat populer dalam mencari frequent itemset juga menentukan atau menemukan rule dari basis
data yang besar. Dalam penelitian ini, menggunakan kedua Algortima tersebut yaitu Algoritma Apriori
dan FP-Growth yang bisa digunakan dalam mencari itemset dan menemukan aturan asosiasi atau rule
dari hasil penjualan Laptop di Indocomputer Payakumbuh, dalam menentukasssn merk Laptop apa yang
dominan diminti oleh konsumen, sehingga dapat digunaan sebagai pertimbangan dalam meningkatkan
strategi dalam penjualan Laptop yang efektif dan efisien.
Kata kunci : Knowledge Discovery Database, Data Mining, Apriori, FP-growth, Frequent itemset,
Rule
2. JURNAL J – CLICK
Jurnal Sistem Informasi Dan Manajemen Informatika
2
E-ISSN : 2541 – 2469
P-ISSN : 2355 – 7958
Vol. 6 No. 1 Juli 2019
PENDAHULUAN
Perkembangan teknologi informasi
telah memungkinkan proses analisa data
untuk menemukan suatu pola dari
kumpulan data sehingga dapat dilakukan
dengan lebih cepat dan cermat. Data mining
mampu menganalisa data yang besar
menjadi informasi berupa pola yang
mempunyai arti bagi pendukung keputusan.
Indocomputer merupakan salah satu
perusahaan yang sudah cukup lama
berkembang. Indocomputer menyediakan
bermacam-macam jenis dan tipe Laptop.
Dengan adanya perkembangan teknologi
yang sangat pesat pada saat ini membuat
banyaknya jumlah transaksi penjualan yang
diterima setiap harinya. Jumlah kenaikan
penjualan tentunya membawa kebaikan.
Namun dengan adanya kegiatan penjualan
Laptop di Indocomputer membuat data
penjualan Laptop semakin lama semakin
tambah banyak. Dan data tersebut hanya
berfungsi sebagai arsip saja oleh
perusahaan Sehingga terjadi penumpukan
data yang tidak diketahui manfaatnya,
Indocomputer sering kehabisan stok Laptop
karena tidak terlalu meperhatikan merk
Laptop apa yang laris dipasaran. Dan data
penjualan Laptop tersebut dapat
dimanfaatkan, diolah menjadi informasi
yang berguna untuk meningkatkan strategi
penjualan juga dapat mengetahui merk
Laptop yang laris dipasaran. Sehingga
Indocomputer tidak kehabisan merk Laptop
yang banyak diminimati dikalangan
masyarakat.
Untuk itu diperlukan suatu penelitian
guna mengetahui bagaimana penjualan
Laptop dan stok yang harus disediakan oleh
Indocomputer Payakumbuh dengan
metode Data Mining memudahkan dalam
menganalisa penjualan merk Laptop yang
lebih akurat sebagai bahan pengambilan
keputusan dalam melakukan strategi,
promosi dan persedian stok Laptop
berdasarkan merk yang banyak diminati
konsumen.
Dengan Algoritma Apriori dan
Algoritma Fp-Growth kita dapat
membandingkan kedua algoritma dalam
menentukan aturan asosiasi dan melakukan
pengelompokan data penjualan Laptop
berdasarkan merk di Indocomputer
Payakumbuh sehingga dapat digunakan
sebagai pertimbangan dalam pengembilan
keputusan seperti membuat strategi
promosi, dan persedian stok Laptop di
Indocomputer Payakumbuh.
Knowledge Discovery in Database (KDD)
Knowledge Discovery in Database
(KDD) yang semua prosesnya adalah
kegiatan yang meliputi pengumpulan,
pemakaian data historis untuk menemukan
keteraturan, pola atau hubungan dengan set
data yang berukuran besar (Tacbir Hendro
Pudjiantoro et al, 2011).
Proses dalam KDD adalah proses
yang terdiri dari rangkaian proses iteratif
sebagai berikut :
1. Pembersihan Data (Data Cleaning)
Proses ini dapat digunakan untuk
membuang atau menghilangkan noise
yang bersifat tidak konsisten.
2. Integrasi Data (Data Integration)
Proses ini digunakan untuk
menggabungkan data dari sumber yang
berbeda format maupun platform yang
kemudaian dapat diintegrasikan dalam
suatu database.
3. JURNAL J – CLICK
Jurnal Sistem Informasi Dan Manajemen Informatika
3
E-ISSN : 2541 – 2469
P-ISSN : 2355 – 7958
Vol. 6 No. 1 Juli 2019
3. Seleksi Data (Data Selection)
Data yang terdapat di dalam database
kemudian diseleksi atau direduksi
dengan berbagai teknik agar data yang
diambil data yang relevan dengan
tugas analis dari database.
4. Transformasi Data (Data
Transformation)
Proses ini bertugas mentransformasi
atau menggabungkan data ke dalam
bentuk yang sesuai untuk penggalian
lewat operasi summary atau
aggregation.
5. Penambangan Data (Data Mining)
Data-data yang telah ada diseleksi atau
ditransformasi ditimbang dengan
berbagai teknik, proses esensial untuk
mengekstrak pola dari data dengan
metode cerdas.. Proses Data Mining
merupakan proses mencari pola atau
informasi menarik dalam data dengan
menggunakan fungsi-fungsi tertentu.
6. Evaluasi Pola dan Presentasi
Pengetahuan (Pattern evaluation and
Knowledge presentation)
Tahap ini merupakan bagian dari
proses pencarian pengetahuan yang
mencakup pemeriksaan pola-pola,
apakah pola atau informasi yang
ditemukan bertentangan dengan fakta
atau hipotesa yang sebelumnya.
Serangkaian proses dan tahap tersebut
dapat dilihat pada gambar 1 yang mana
tahap itu adalah sebagai berikut
Gambar 1 Tahap - tahap Knowledge Discovery in
Database
Definisi Data Mining
Data Mining merupakan suatu
metode menemukan suatu pengetahuan
dalam suatu database yang cukup besar.
Data Mining adalah proses menggali dan
menganalisa sejumlah data yang sangat
besar untuk memperoleh sesuatu yang
benar, baru, sangat bermanfaat dan
akhirnya dapat dimengerti suatu corak atau
pola dalam data tersebut (Han & Kamber
dalam Eko Nur Wahyudi et al, 2011).
Saat ini, konsep Data Mining semakin
dikenal sebagai tools penting dalam
manajemen informasi karena jumlah
informasi yang semakin besar jumlahnya.
Data Mining sendiri sering disebut sebagai
knowledge discovery in database (KDD)
adalah kegiatan yang meliputi
pengumpulan, pemakaian data historis
untuk menemukan keteraturan, pola
hubungan dalam set data berukuran besar.
Output dari Data Mining ini dapat
digunakan untuk pengambilan keputusan di
masa depan (Tahta Alfina et al, 2012).
Data mining, dikenal sebagai
Knowledge Discovery Database (KDD),
adalah ekstraksi trivial informasi implisit,
yang sebelumnya tidak diketahui dan
berpotensi yang berguna dari data dalam
4. JURNAL J – CLICK
Jurnal Sistem Informasi Dan Manajemen Informatika
4
E-ISSN : 2541 – 2469
P-ISSN : 2355 – 7958
Vol. 6 No. 1 Juli 2019
database. Padahal, Data Mining dan (KDD)
sering diperlakukan sebagai sinonim, Data
Mining sebenarnya bagian dari proses
penemuan pengetahuan . (Despande and
Thakare, 2010).
Secara garis besar Data Mining
dibagi menjadi dua kategori utama, yaitu :
1. Descriptive Mining, yaitu proses untuk
menemukan karakteristik penting dari
data dalam suatu basis data. Teknik
Data Mining yang termasuk dalam
Descriotive Mining adalah Clustering,
Association, dan Sequential Mining.
2. Predictive, yaitu proses untuk
menemukan pola dari data dengan
menggunakan beberapa variabel lain di
masa depan. Salah satu teknik yang
terdapat dalam Predictive Mining
adalah klasifikasi.
Teknik - Teknik Data Mining
Data Mining dibagi menjadi beberapa
teknik berdasarkan tugas yang dapat
dilakukan :
1. Asosiasi
Tugas asosiasi dalam Data Mining
adalah menemukan atribut yang
muncul dalam satu waktu. Dalam dunia
bisnis lebih umum disebut analisis
keranjang belanja.
2. Prediksi
Prediksi hampir sama dengan
klasifikasi dan estimasi, kecuali bahwa
dalam prediksi nilai dari hasil akan ada
di masa mendatang. Beberapa metode
dan teknik yang digunakan dalam
klasifikasi dan estimasi dapat pula
digunakan (untuk keadaan yang tepat)
untuk prediksi.
3. Deskripsi
Terkadang peneliti dan analis secara
sederhana ingin mencoba mencari cara
untuk menggambarkan pola dan
kecenderungan yang terdapat dalam
data. Deskripsi dari pola dan
kecenderungan sering memberikan
kemungkinan penjelasan untuk suatu
pola atau kecenderungan.
4. Estimasi
Estimasi hampir sama dengan
klasifikasi, kecuali variabel target
estimasi lebih kearah numerik daripada
ke arah kategori. Model dibangun
menggunakan record lengkap yang
menyediakan nilai dari variabel target
sebagai nilai prediksi. Selanjutnya, pada
peninjauan berikutnya estimasi nilai
dari variabel target dibuat berdasarkan
nilai variabel prediksi.
5. Klasifikasi
Dalam klasifikasi, terdapat target
variabel kategori. Sebagai contoh,
penggolongan pendapatan dapat
dipisahkan dalam tiga kategori, yaitu
pendapatan tinggi, pendapatan sedang,
dan pendapatan rendah.
6. Pengklusteran
Pengklusteran merupakan
pengelompokan record, pengamatan,
atau memperhatikan dan membentuk
kelas objek-objek yang memiliki
kemiripan. Kluster adalah kumpulan
record yang memiliki kemiripan satu
dengan yang lainnya dan memiliki
ketidakmiripan dengan record-record
dalam kluster lain.
Association Rule
Aturan asosiasi akan menggunakan
data latihan, sesuai dengan pengertian data
5. JURNAL J – CLICK
Jurnal Sistem Informasi Dan Manajemen Informatika
5
E-ISSN : 2541 – 2469
P-ISSN : 2355 – 7958
Vol. 6 No. 1 Juli 2019
mining, untuk menghasilkan pengetahuan.
Pengetahuan untuk mengetahui item-item
belanja yang sering dibeli secara bersamaan
dalam suatu waktu. Aturan asosiasi yang
berbentuk “if…then…” atau
“Jika…Maka…” merupakan pengetahuan
yang dihasilkan dari fungsi Aturan Asosiasi
(Seni Susanto dan Dedy Suryadi dalam
Kennedi et al, 2013).
Pada transaksi yang terdapat item X
terdapat kemungkinan ada item Y juga di
dalamnya, dinotasikan, di mana X dan Y
adalah disjoint itemset, dinotasikan .
Kumpulan dari transaksi-transaksi ini
disebut dengan itemset, yang dinotasikan
dengan Ik (k=1, 2, … m). Jika terdapat
itemset yang mempunyai item sebanyak k,
maka disebut dengan k-itemset.
Association Rule adalah teknik Data
Mining yang berguna untuk menemukan
suatu korelasi atau pola yang
terpenting/menarik dari sekumpulan data
besar (Dwina Kuswardani et al , 2011).
Association rule ini nantinya akan
menghasilkan rules yang menentukan
seberapa besar hubungan antar X dan Y tadi,
dan diperlukan dua ukuran untuk rules ini,
yakni support dan confidence. Support
merupakan kemungkinan X dan Y muncul
bersamaan yang dinotasikan( Nugroho
Wandi et al, 2012 ).
Sedangkan confidence merupakan
kemungkinan munculnya Y ketika X juga
muncul, dinotasikan
Association rules merupakan salah
satu teknik yang ada di dalam Data Mining
untuk menentukan hubungan antar item
dalam suatau dataset yang telah ditentukan.
Teknik ini mencari kemungkinan
kombinasi yang sering muncul dari suatu
itemset. Dalam menggunakan metode
Association Rules, terdapat tiga kriteria
ukuran yaitu :
1. Support : ukuran yang menunjukkan
tingkas dominasi itemset dari
keseluruhan transaksi (misalkan dari
seluruh transaksi yang ada, seberapa
besar kemungkinan item A dan item B
dibeli secara bersamaan). Support
({A,B}) = Number of Transaction
(A,B).
2. Confidence (Probility) : ukuran yang
menyatakan hubungan antara dua item
secera conditional (misalkan seberapa
sering item A dibeli, jika pelanggan
membeli item B. Confidencde (A U B)
= Probability (B | A) = Support (A | B)
/ Support (A).
3. Improvement (Importance) : ukuran
yang menyatakan besarnya
kemungkinan dua item dapat dibeli
secara bersamaan. Importance ({A,B})
= Probability (A,B) / Probability (A) *
Probability (B)).
Algoritma Apriori
Algoritma apriori adalah algoritma
pengambilan data dengan aturan asosiatif
(Association rule) untuk menentukan
hubungan asosiatif suatu kombinasi item.
Association Rule yang dimaksud dilakukan
melalui mekanisme penghitungan support
dan confidence dari suatu hubungan item.
Sebuah rule asosiasi dikatakan interesting
jika nilai support adalah lebih besar dari
6. JURNAL J – CLICK
Jurnal Sistem Informasi Dan Manajemen Informatika
6
E-ISSN : 2541 – 2469
P-ISSN : 2355 – 7958
Vol. 6 No. 1 Juli 2019
minimum support dan juga nilai confidence
adalah lebih besar dari minimum confidence
(Robi Yanto and Riri Khoiriah, 2015).
Algoritma Apriori dibagi menjadi
beberapa tahap yaitu :
1. Pembentukan kandidat itemset.
2. Perhitungan Support dari tiap kandidat
ke intemset.
3. Tetapkan pola frekuensi tinggi, Pola
frekuensi tinggi yang memuat k-item
atau k-itemset ditetapkan dari kandidat
k-itemset yang support nya lebih besar
dari Minimum Support.
4. Bila tidak didapat pola frekuensi tinggi
maka seluruh proses dihentikan.
Proses Utama dalam Algoritma Apriori
Algoritma Apriori adalah suatu
algoritma dasar yang diusulkan oleh
Agrawal & Srikant pada tahun 1994 untuk
penentuan frequent itemsets untuk aturan
asosiasi boolean. Algoritma apriori
termasuk jenis aturan asosiasi pada Data
Mining.Aturan yang menyatakan asosiasi
antara beberapa atribut sering disebut
affinity analysis atau market basket analysis
(Mohammad Badrul, 2016).
Apriori merupakan algoritma yang
sudah sangat banyak dikenal dalam
melakukan pencarian frequent itemset
dengan menggunakan teknik Association
Rule. Algoritma Apriori menggunakan
knowledge mengenai frequent itemset yang
telah diketahui sebelumnya, untuk
memproses informasi selanjutnya.
Algoritma Apriori menentukan kandidat-
kandidat yang mungkin muncul dengan
cara memperhatikan Minimum Support.
Adapun dua proses utama yang dilakukan
dalam pemrosesan algoritma Apriori,
yaitu):
1. Join (penggabungan).
Pada proses ini setiap item
dikombinasikan dengan item yang
lainnya sampai tidak terbentuk
kombinasi lagi.
2. Prune (pemangkasan).
Pada proses ini, hasil dari item yang
telah dikombinasikan tadi lalu
dipangkas dengan menggunakan
Minimum Support yang telah
ditentukan oleh user.
Dua proses utama tersebut merupakan
langkah yang akan dilakukan untuk
mendapat frequent itemset, yang dapat
dilihat pada Gambar 2 berikut ini.
Gambar 2 Algoritma Apriori
Algoritma Fp-Growth
Algoritma FP-Growth merupakan
salah satu alternatife algoritma yang cukup
efektif untuk mencari himpunan data yang
paling sering muncul (frequent itemset)
dalam sebuah kumpulan data yang besar.
Algoritma FP-Growth merupakan
algoritma Association Rules yang cukup
sering dipakai. Algoritma FP-Growth ini
dikembangkan dari algoritma apriori.
Algoritma apriori menghasilkan kombinasi
yang sangat banyak sehingga data yang
dihasilkan tidak efisien (Kezia Sumangkut,
et al, 2016).
7. JURNAL J – CLICK
Jurnal Sistem Informasi Dan Manajemen Informatika
7
E-ISSN : 2541 – 2469
P-ISSN : 2355 – 7958
Vol. 6 No. 1 Juli 2019
Gambar 3. Algoritma FP-Growth
Pembuatan FP-Tree
FP-tree merupakan kompak struktur
data yang mewakali set data dalam bentuk
pohon yang mewakili cabang. Setiap
transaksi dibaca dan kemudian dipetakan ke
jalur FP-Tree. Hal ini dilakukan sampai
semua transaksi sudah dibaca. FP-tree
merupakan struktur penyimpanan data yang
dimampatkan. FP-tree dibangun dengan
memetakan setiap data transaksi ke dalam
setiap lintasan tertentu dalam FP-tree.
Semakin banyak data transaksi yang
memiliki item yang sama, maka proses
pemampatan dengan struktur data FP-tree
semakin efektif. Adapun Pembangunan FP-
Tree dapat dibagi menjadi tiga langkah
utama, yaitu :
1. Scanning data set untuk menentukan
jumlah dukungan dari setiap item.
2. Membuang data yang tidak perlu dan
membuat order list dari item yang
paling banyak muncul dengan urutan
menurun.
3. Scanning data menetapkan satu
transaksi pada suatu waktu FP-Tree,
membentuk jalur yang baru dan node
baru.
Tahapan-tahapan tersebut merupakan
langkah yang akan dilakukan untuk
mendapat frequent itemset, yang dapat
dilihat pada Algoritma berikut :
Gambar 4. Contoh FP-tree dan Tabel Header
Pembentukan Aturan Asosiasi
Setelah semua pola ditemukan,
barulah dicari aturan asosiasi yang
memenuhi syarat minimum untuk
confidence dengan menghitung confidence
aturan asosiatif A & B. Nilai confidence
dari aturan A & B diperoleh dengan rumus
berikut.
Rumus diatas menjelaskan bahwa
nilai confidance diperoleh dengan cara
mencari jumlah transaksi yang
mengandung nilai A dan B (item pertama
bersamaan dengan item yang lain) dibagi
dengan jumlah transaksi yang mengandung
A (Item pertama). Dan Untuk menentukan
aturan asosiasi yang akan dipilih maka
harus diurutkan berdasarkan Support ×
Confidence. Aturan diambil sebanyak n
aturan yang memiliki hasil atau nilai yang
terbesar .
Penerapan Algoritma FP-Growth
Algoritma Fp-Growth merupakan
algoritma pencarian frequent yang efisien
karena menggunakan struktur data tree
(FP-Tree). Algoritma FP-Grrowth
menentukan frequent itemset yang berakir
suffix tertentu dengan menggunakan
metode divid dan conquer untuk memecah
problem menjadi sub-problem yang lebih
8. JURNAL J – CLICK
Jurnal Sistem Informasi Dan Manajemen Informatika
8
E-ISSN : 2541 – 2469
P-ISSN : 2355 – 7958
Vol. 6 No. 1 Juli 2019
kecil. Kemudian setelah tahap
pembangunan FP-tree dari sekumpulan
data transaksi, akan diterapkan Algoritma
FP-growth dibagi menjadi tiga langkah
utama, yaitu :
1. Tahap Pembangkitan Conditional
Pattern Base
Conditional Pattern Base merupakan
subdatabase yang berisi prefix path
(lintasan prefix) dan suffix pattern (pola
akhiran). Pembangkitan conditional
pattern base didapatkan melalui FP-
tree yang telah dibangun sebelumnya.
2. Tahap Pembangkitan Conditional
Fptree
Pada tahap ini, support count dari setiap
item pada setiap conditional pattern
base dijumlahkan, lalu setiap item yang
memiliki jumlah support count lebih
besar sama dengan minimum support
count ξ akan dibangkitkan dengan
conditional FPtree.
3. Tahap Pencarian frequent itemset
Apabila Conditional FP-tree
merupakan lintasan tunggal (single
path), maka didapatkan frequent itemset
dengan melakukan kombinasi item
untuk setiap conditional FP-tree. Jika
bukan lintasan tunggal, maka dilakukan
pembangkitan FP-growth secara
rekursif.
METODOLOGI PENELITIAN
Beberapa tahapan yang akan
dilakukan untuk dapat mengatasi
permasalahan yang ada, menganalisa
masalah, menentukan tujuan, mempelajaari
literature, teknik pengumpulan data,
menganalisa teknik yang digunakan, cara
mendesain sistem, implementasi algoritma
apriori dan fp-Growth dan pengujian Hasil.
Tahapan ini merupakan gambaran
penelitian secara terstruktur yang akan
dilakukan dan di bab ini juga dijelaskan
bagaimana tiap-tiap kegiatan penelitian
tersebut dikerjakan.. Tahap-tahap kerangka
kerja ini dibuat agar penelitian menjadi
terarah.
Gambar 5. Kerangka Penelitian
PEMBAHASAN DAN HASIL
Persiapan Data
Data utama yang digunakan dalam
penelitian ini adalah data penjualan Laptop
di Indocomputer Payakumbuh tahun 2016
merupakan data yang akan dijadikan
sampel dalam penerapan Algoritma Apriori
dan FP - Growth untuk penentuan merk
Laptop yang laris dipasaran. Atribut-atribut
yang digunakan dalam penelitian ini adalah
tahun penjualan dan merk Laptop.
9. JURNAL J – CLICK
Jurnal Sistem Informasi Dan Manajemen Informatika
9
E-ISSN : 2541 – 2469
P-ISSN : 2355 – 7958
Vol. 6 No. 1 Juli 2019
Tabel 1. Sample Data
Tabel 2. Bulan Penjualan
Tabel 3. Data Pembelian Laptop Setelah
dikonversi berdasarkan merk Laptop yang
sering dibeli.
Tabel 4. Data Item Merk Laptop
Tabel 5. Jumlah Kemunculan Item Yang Sering
Muncul
Tahapan Perhitungan Algoritma Apriori
Dalam perhitungan Algoritma
Apriori dimulai dengan mendefinisikan
masing-masing itemset. Tahapan dalam
perhitungan Algoritma Apriori untuk
menemukan association rules yaitu
menuliskan data transaksi yang terjadi
dalam periode tertentu.
Mendefinisikan Masing – Masing
Itemset
Langkah Pertama adalah membuat
kombinasi 1 itemset pada setiap table dan
frekuensi masing-masing merk Laptop
Support sesuai dengan data tabular pada
Table. Pola yang didapatkan dapat dilihat
pada Table 5.
Rumus support dapat dilihat pada rumus
(1):
10. JURNAL J – CLICK
Jurnal Sistem Informasi Dan Manajemen Informatika
10
E-ISSN : 2541 – 2469
P-ISSN : 2355 – 7958
Vol. 6 No. 1 Juli 2019
Nilai Support K01 = (jumlah data
mengandung K01/ Total data) x 100%
= 9/12 x 100% = 75
Nilai Support K02 = (jumlah data
mengandung K02/ Total data) x 100%
= 6/12 x 100% = 50
…dan seterusnya.
Tabel 6. Nilai Support Untuk 1 Item Set
Langkah berikutnya adalah
menentukan minimum support Dengan
Nilai ≥ 70. tentukan itemset yang memenuhi
minimum support. Hasilnya dapat
ditunjukkan pada tabel 7.
Tabel 7 ItemSet yang Memenuhi Minimum
Support
Kombinasi 2 Itemset
Langkah berikutnya adalah membuat
kombinasi 2 itemsets pada setiap frekuensi
masing-masing kombinasi dihitung sesuai
dengan data tabular pada tabel 6 di atas.
Pola kombinasi yang didapatkan dapat
dilihat pada tabel 8. berikut :
Tabel 8 Tabulasi Pola Kombinasi 2 itemset
Pada tabel 8. di atas akan dipisahkan
kandidat yang tidak termasuk ke dalam nilai
minimum support. Itemset yang memenuhi
minimum support dan perhitungan nilai
confidence dapat dilihat pada tabel 8.
Contoh perhitungan Confidence :
- Confidence (K01,K09)= s ({K01,K09})
/ s ({K01})
= 75/75 = 100 %
- Confidence (K01,K12) = s
({K01,K012}) / s ({K01})
=75/75 = 100 % …dan seterusnya.
Tabel 9. Kombinasi 2 Item Set yang Memenuhi
Minimum Support
Kombinasi 3 Itemsets
Berikutnya adalah kombinasi 3
itemsets pada setiap frekuensi masing-
masing kombinasi dihitung sesuai dengan
data tabular pada tabel 7. di atas. Pola
kombinasi terdapat pada tabel 10. berikut:
Tabel 10. Tabulasi Pola Kombinasi 3 itemset
Dari penghitungan di atas, maka
itemset yang memenuhi minimum support
dapat dilihat pada tabel 11. berikut :
11. JURNAL J – CLICK
Jurnal Sistem Informasi Dan Manajemen Informatika
11
E-ISSN : 2541 – 2469
P-ISSN : 2355 – 7958
Vol. 6 No. 1 Juli 2019
Tabel 11. Kombinasi 3 ItemSet yang Memenuhi
Minimum Support
Rule Asosiasi Algoritma Apriori
Untuk mencari aturan asosiasi
diperlukan juga minimal Confidence Misal
minimal confidence : 70 %, aturan asosiasi
yang mungkin terbentuk dapat ditunjukkan
pada Tabel 12.
Tabel 12. Nilai Confidence >70 % Untuk Tiap
ItemSet
Dilihat dari hasil di atas, ternyata
itemset yang tersisa, adalah K01,K09,K12
dan K14 (Lenovo AMD A8, Toshiba C840
– I3, HP AMD A8 dan NB ASUS X 200
MA) yang selanjutnya dapat dinyatakan
sebagai frequent itemset. Langkah
selanjutnya adalah dengan membentuk
association rule yang kuat berdasarkan
frequent itemset yang dihasilkan tersebut
berdasarkan nilai confidence.
Rule 1: {K01} → {K09}
c= s({K01,K09}) /s ({K01}) = 9/9= 100 %
Rule 2 : {K09} → {K01}
c =s ({K09,K01}) /s({K09}) = 9/10= 90 %
Rule 3: {K01} → {K12}
c=s ({K01,K12}) /s ({K01}) = 9/9 =100%
Rule 4: {K12} → {K01}
c= s ({K12,K01}) /s ({K12}) = 9/9=100%
Rule 5: { K09} → { K12}
c= s({K09,K12}) /s({K09}) = 9/10 = 90%
Rule 6: { K12} → { K09}
c= s ({K12,K09}) /s ({K12})= 9/10= 90%
Rule 7: {K09} → {K14}
c=s ({K09,K14}) / s ({K09})= 9/9=100 %
Rule 8: {K14} → {K09}
c=s ({K14,K09}) /s ({K14})= 9/9 =100 %
Rule 9: {K14} → { K12 }
c=s ({K14,K12}) /s({K14}) =10/11= 90%
Rule 10: {K12} → { K14}
c=s ({K12,K14})/s({K12}) = 10/11= 90%
Rule 11: {K01,K12} → { K09 }
c=s({K01,K12,K09}) /s({K01,K12}) = 9/9
= 100%
Rule 12: {K01,K09} → { K12 }
c = s ({K01,K09,K12}) / s ({K01,K09}) =
9/9 = 100%
Rule 13: {K01} → { K09,K12 }
c = s ({K01,K09,K12}) / s ({K01}) = 9/9
= 100%
Rule 14: {K09,K12} → { K01}
c = s ({K01,K12,K01}) / s ({K09,K12}) =
9/9 = 100%
Rule 15: {K09} → {K01 ,K12 }
c = s ({K01,K01,K12}) / s ({K09}) = 10/9
= 90%
Rule 16: {K12} → { K01,K09 }
c = s ({K12,K01,K09}) / s (K12}) = 9/11
= 82%
Tahapan Perhitungan Algoritma Fp-
Growth
Tabel 13. berikut mendata
kemunculan item yang frequent dalam
setiap data penjulan Laptop , diurut
berdasarkan frekuensi yang paling tinggi.
Tabel 13. Kemunculan Item Diurut
Berdasarkan Frekuensi Tertinggi
12. JURNAL J – CLICK
Jurnal Sistem Informasi Dan Manajemen Informatika
12
E-ISSN : 2541 – 2469
P-ISSN : 2355 – 7958
Vol. 6 No. 1 Juli 2019
Setelah dilakukan Pengurutan
didapat item yang memiliki frekuensi di
atas support count > 8 adalah
K01,K09,K14 dan K12. Ke empat item
inilah yang akan berpengaruh dan akan
dimasukkan ke dalam FP-tree, selebihnya
(K02,K03,K04,K05,K06,K07,K08,K10,K1
1 dan K15) dapat dibuang karena tidak
berpengaruh signifikan. Sehingga
menghasilkan tabel 14.
Tabel 14 Kemunculan Item Yang Memenuhi
Support Count
Tabel 15. mendata kemunculan item
yang frequent dalam setiap penjualan
Laptop, diurut berdasarkan yang
frekuensinya paling tinggi dan Minimal
Support >8.
Tabel 15. Kemunculan Item Setiap Merk Laptop
Di Urut Bedasarkan Frekuensi Paling Tinggi
Tahap Pembangunan FP-tree
Pada tahapan ini, akan dilakukan
pembangunan FP-Tree dengan
menggunakan data transaksi yang telah
dipangkas dan diurutkan berdasarkan nilai
support count. Dengan perolehan Frequent
Items setelah dipangkas dan diurutkan,
maka akan dibangun FP-Tree.
Data penjualan yang terdiri dari 12
(Dua Belas) Bulan data penjualan dengan 4
jenis item seperti pada tabel 16 di atas yang
akan dipindahkan ke dalam pohon yang
menunjukkan proses terbentuknya FP-tree
setiap tahun penjualan Laptop yang dibaca.
Setiap simpul pada FP-tree mengandung
nama sebuah item dan counter support yang
berfungsi untuk menghitung frekuensi
kemunculan item tersebut dalam tiap
lintasan setiap tahunnya. Kumpulan data
dipindai pertama kali untuk menentukan
support count dari setiap item. Item yang
tidak frequent dibuang, sedangkan frequent
item dimasukkan dan disusun dengan
urutan menurun, seperti yang terlihat pada
Gambar dibawah ini :
Null
K12=1
K14=1
K09=1
K01=1
Gambar 6. Hasil Pembentukan FP –Tree Setelah
Pembacaan TA01(K12,K14,K09,K01)
Pemindaian kedua, yaitu pembacaan
Transaksi pertama B01{
K12,K14,K09,K01} akan membuat simpul
K12,K14,K09 dan K01, sehingga terbentuk
lintasan transaksi
Null→K12→K14→K09→K01. Support
count dari setiap simpul bernilai awal 1
(satu).
Null
K12=2
K14=2
K09=2
K01=2
Gambar 7. Hasil Pembentukan FP–Tree Setelah
Pembacaan B02 (K12,K14,K09,K01)
13. JURNAL J – CLICK
Jurnal Sistem Informasi Dan Manajemen Informatika
13
E-ISSN : 2541 – 2469
P-ISSN : 2355 – 7958
Vol. 6 No. 1 Juli 2019
Null
K12=3
K14=3
K09=3
K01=3
Gambar 8. Hasil Pembentukan FP–Tree Setelah
Pembacaan B03 (K12,K14,K09,K01)
Null
K12=4
K14=4
K09=4
K01=4
Gambar 9. Hasil Pembentukan FP –Tree Setelah
Pembacaan B04 (K12,K14,K09,K01)
Null
K12=5
K14=5
K09=4
K01=4
K14=1
K09=1
Gambar 10. Hasil Pembentukan FP –Tree
Setelah Pembacaan B06, B04 (K14,K09)
Null
K12=6
K14=6
K09=4
K01=4
K14=1
K09=1
Gambar 11. Hasil Pembentukan FP –Tree
Setelah Pembacaan B07, B07 (K12,K14)
Null
K12=7
K14=7
K09=5
K01=5
K14=1
K09=1
Gambar 12. Hasil Pembentukan FP –Tree
Setelah Pembacaan B08 B08 (K12,K14,K09,K01)
Null
K12=8
K14=8
K09=6
K01=6
K14=1
K09=1
Gambar 13. Hasil Pembentukan FP –Tree
Setelah Pembacaan B09, B09 (K12,K14,K09,K01)
Null
K12=9
K14=9
K09=7
K01=7
K14=1
K09=1
Gambar 14. Hasil Pembentukan FP –Tree
Setelah Pembacaan B10, B10 (K12,K14,K09,K01)
Null
K12=11
K14=11
K09=10
K01=9
K14=1
K09=1
K09=1
K01=1
Gambar 15. Hasil Pembentukan FP –Tree
Setelah Pembacaan B12, B12 (K12,K09,K01)
Tahap Pencarian Frequent Itemset
Untuk menemukan frequent itemset
maka perlu ditentukan upapohon (pohon
yang akarnya adalah keturunan dari akar
pohon induknya) dengan lintasan yang
berakhir dengan support count terkecil,
yaitu K01. Berturut-turut ditentukan juga
yang berakhir di K09,K14 dan K12 .Proses
pembentukan dapat dilihat pada gambar 16
sampai dengan 19 berikut :
14. JURNAL J – CLICK
Jurnal Sistem Informasi Dan Manajemen Informatika
14
E-ISSN : 2541 – 2469
P-ISSN : 2355 – 7958
Vol. 6 No. 1 Juli 2019
Null
K12=11
K14=11
K09=10
K01=9
K14=1
K09=1
K09=1
K01=1
Gambar 16. Lintasan Yang Mengandung
Simpul K01
Gambar 17. Lintasan Yang Mengandung
Simpul K09
Null
K12=11
K14=11 K14=1
Gambar 18. Lintasan Yang Mengandung
Simpul K14
Gambar 19. Lintasan Yang Mengandung
Simpul K12
Rule Asosiasi Algoritma Fp-Growth
Langkah pertama Untuk menentukan
Rule Asosiasi Algoritma Fp-Growth adalah
menemukan semua frequent itemset yang
berakhiran K12,K14,K09 dan K01 maka
kita harus mengecek apakah support count
dari K12,K14,K09 dan K01 memenuhi
minimum support count >8.
Dari pembangkitan FP-tree yang
telah dilakukan maka didapatkan hasil
Conditional Pattern Base Seperti
ditampilkan dalam tabel 16.
Tabel 16. Tabel Hasil Conditional Pattern Base
Dari pembangkitan conditional FP-
Tree telah dilakukan sebelumnya maka,
didapatkan hasil conditional FP-Tree dan
hasil frequent itemset yang dapat dilihat
pada tabel 17.
Tabel 17. Tabel Hasil Conditional FP-Tree dan
Frequent Itemset
Setelah didapatkan frequent itemset,
selanjutnya adalah membuat rule dengan
cara menghitung nilai support dan
confidence-nya. maka itemset yang dihitung
minimal berisi dua item. Maka yang akan
dihitung nilai support dan confidence-nya,
yaitu: (K01,K12), (K12,K01), (K01,K09),
(K09,K01), (K14,K12), (K12,K14),
(K09,K14), (K14,K09), (K09,K12),
(K12,K09), (K01,K09,K14),
(K09,K12,K01), (K12,K09,K01),
(K09,K01,K12), (K09,K12,K01),
(K12,K09,K01).
Dari ke-16 subsets yang dihasilkan
selanjutnya akan dihitung nilai support dan
confidence-nya. Hanya kombinasi yang
15. JURNAL J – CLICK
Jurnal Sistem Informasi Dan Manajemen Informatika
15
E-ISSN : 2541 – 2469
P-ISSN : 2355 – 7958
Vol. 6 No. 1 Juli 2019
lebih besar sama dengan minimum
confidence yang akan diambil atau strong
association rule nya saja. Berdasarkan
frequent itemset di atas maka confident
yang dihasilkan adalah :
1. Confidence({K01}{K12}) = 9/11 =
82 %
2. Confidence({K12}{K01}) = 9/11 =
82 %
3. Confidence({K01}{K09}) =
9/10 = 90 %
4. Confidence({K09}{ K01}) = 9/10 =
90 %
5. Confidence({K14}{ K12}) = 11/11
= 100 %
6. Confidence({K12}{ K14}) = 11/11
= 100 %
7. Confidence({K09}{ K14}) = 10/11
= 90 %
8. Confidence({K14}{ K09}) = 10/11
= 90 %
9. Confidence({K09}{ K12}) = 10/11
= 90 %
10. Confidence({K12}{ K09}) = 10/11
= 90 %
11. Confidence({K01}{ K09,K14})
= 9/9 = 100 %
12. Confidence({K09}{K12,K01})
= 9/9 = 100 %
13. Confidence({K12}{(K09,K01})
= 9/11= 82 %
14. Confidence({K12,K09}{ K01})
= 9/9 = 100 %
15. Confidence({K12,K01}{K09})
= 9/9 = 100%
16. Confidence({K09,K01}{(K12})
= 9/11= 82 %
Jika dimisalkan minimum confidence
adalah 70 %, minimum confidence ini
diambil di atas > 70% agar tingkat
akurasinya tinggi, maka yang termasuk
association rule adalah K01 K12, yang
artinya jika membeli Laptop dari item K01,
maka membeli Laptop dari item K12 juga.
Berikut hasil lengkap pola-pola atau rules
yang dihasilkan:
1. Rule 1: {K01 12}
c = s ({K01,K12}) / s ({K09}) = 9/9 =
100%
2. Rule 2: {K12 01}
c = s ({K12,K01}) / s ({K12}) = 9/9 =
100%
3. Rule 3: {K01 09}
c = s ({K01,K09}) / s ({K09}) = 9/9=
100%
4. Rule 4: {K09 01}
c = s ({K09,K01}) / s ({K09}) = 9/10=
90%
5. Rule 5: {K14 12}
c = s ({K14,K12}) / s ({K14}) = 10/11
= 91%
6. Rule 6: {K12 14}
c = s ({K12,K14}) / s ({K14}) = 10/11
= 91%
7. Rule 7: {K09 14}
c = s ({K09,K14}) / s ({K09}) = 9/10 =
90 %
8. Rule 8: {K14 09}
c = s ({K14,K09}) / s ({K14}) = 9/11 =
82 %
9. Rule 9: {K09 12}
c = s ({K09,K12}) / s ({K09}) = 9/10 =
90%
10. Rule 10: {K12 09}
c = s ({K12,K09}) / s ({K12}) = 9/11=
82%
11. Rule 11: {K01 K12,K09}
c = s ({K01,K12,K09}) / s ({K09}) =
9/9= 100%
12. Rule 12: {K09 K12,K01}
c = s ({K19,K12,K01}) / s ({K09}) =
10/9=90%
16. JURNAL J – CLICK
Jurnal Sistem Informasi Dan Manajemen Informatika
16
E-ISSN : 2541 – 2469
P-ISSN : 2355 – 7958
Vol. 6 No. 1 Juli 2019
13. Rule 13: {K12 K09,K01}
c = s ({K12,K09,K01}) / s ({K12}) =
11/9=82%
14. Rule 14: {K12,K09} K01}
c = s ({K12,K09,K01}) / s
({K12,K09}) = 9/9= 100%
15. Rule 12: {K12,K01 K09}
c = s ({K12,K01,K09}) / s
({K12,K01}) = 9/9=100%
16. Rule 13: {K09,K01 K12}
c = s ({K09,K01,K12}) / s
({K09,K01}) = 9/9=100%
Terhadap data penjualan Laptop di
Indocomputer dapat diperoleh informasi
merk Laptop yang paling banyak diminati
oleh masyarakat yaitu : K01(Lenovo AMD
A8), K09(Toshiba C840-I3), K12(HP
AMD A8) dan K14(NB Asus x200 MA).
Hasil ini didapatkan berdasarkan
kemunculan itemset dari data penjualan
Laptop.
SIMPULAN
Dari uraian yang sudah dibahas
sebelumnya dapat ditarik kesimpulan :
1. Dengan menggunakan Algoritma
Apriori Dan FP-Growth dengan
bantuan software WEKA 3.7.4
didapatkan hasil berupa aturan (rules)
yang merupakan kumpulan frequent
itemset dengan nilai confidence yang
tinggi.
2. Dengan didapatkannya rules ini maka
pimpinan dapat menggunakan aturan
(rules) dalam membuat suatu strategi
yang dapat meningkatkan jumlah
penjualan Laptop setiap harinya.
3. Penentuan Variabel yang akan
digunakan dalam memprediksi juga
sangat mempengaruhi rule atau
knowledge yang dihasilkan.
4. Sistem yang dibangun dapat membantu
dalam menghasilkan rule yang
umumnya masih dilakukan secara
manual. Algoritma Apriori dan
Algorithma FP-Growth dapat
memberikan informasi eksekutif dan
sistem digunakan untuk
menggambarkan proses yang terkait
dengan menentukan merk Laptop yang
laris di pasaran.
5. Sistem asosiasi rule penjualan Laptop
berdasarkan merk menggunakan
Algoritma Apriori dan Algoritma FP-
Growth dapat digunakan dalam
pengambilan keputusan untuk mencari
alternatif merk laptop apa saja yang
banyak dinikmati konsumen.
DAFTAR PUSTAKA
Tacbir Hendro Pudjiantoro et al, 2011,
Konferensi Nasional Sistem dan
Informatika 2011, November 2011,
hlm. 12 “Penerapan Data Mining
Untuk Menganalisa Kemungkinan
Pengunduran Diri Calon
Mahasiswa Baru”.
Han & Kamber dalam Eko Nur Wahyudi et
al, 2011. Jurnal Teknologi Informasi
DINAMIK Volume 16, No.1, Januari
2011, hl, 29 – 43 “Analisa Profil
Data Mahasiswa Baru terhadap
Program Studi yang dipilih di
perguruan tinggi swasta jawa
Tengah dengan menggunakan
Teknik Data Mining”.
Tahta Alfina et al, 2012. JURNAL
TEKNIK ITS Vol. 1, Sept, 2012,
Analisa Profil Data Mahasiswa
Baru terhadap Program Studi yang
dipilih di perguruan tinggi swasta
jawa Tengah dengan menggunakan
Teknik Data Mining”.
Despande and Thakare, 2010. International
Journal of Distributed and Parallel
systems (IJDPS) Vol.1, No.1,
17. JURNAL J – CLICK
Jurnal Sistem Informasi Dan Manajemen Informatika
17
E-ISSN : 2541 – 2469
P-ISSN : 2355 – 7958
Vol. 6 No. 1 Juli 2019
September 2010. “Data Mining
System And Applications: A
Review”.
Kennedi et al, 2013. Volume : I, Nomor : 1,
Oktober 2013. “Implementasi Data
Mining Algoritma Apriori Pada
Sistem Persediaan Alat-Alat
Kesehatan”.
Dwina Kuswardani et al , 2011. Jurnal
Ilmiah Menuju Solusi Teknologi
Informasi, Vol.6, No. 2, Juli 2011.
“Metode Association Rule Untuk
Analisis Citra Ct Organ Pasien
Kanker Ovarium”.
Nugroho Wandi et al, 2012. JURNAL
TEKNIK ITS Vol. 1, Sept, 2012.
“Pengembangan Sistem
Rekomendasi Penelusuran Buku
dengan Penggalian Association
Rule Menggunakan Algoritma
Apriori (Studi Kasus Badan
Perpustakaan dan Kearsipan
Provinsi Jawa Timur)”.
Robi Yanto and Riri Khoiriah, 2015. “
Implementasi Data Mining dengan
Metode Algoritma Apriori dalam
Menentukan Pola Pembelian Obat”.
Mohammad Badrul, 2016. Jurnal Pilar Nusa
Mandiri Vol.XII, No.2 September
2016. “Algoritma Asosiasi Dengan
Algoritma Apriori Untuk Analisa
Data Penjualan”.
Kezia Sumangkut, et al, 2016. E-Journal
Teknik Informatika Vol.8, No.1,
April 2016. “ Analisa Pola Belanja
Swalayan Daily Mart Untuk
Menentukan Tata Letak Barang
Menggunakan Algoritma FP-
Growth”.