Penerapan Metode Apriori Untuk Identifikasi Pola Data Transaksi Pada Customer Di Supermarket

PENERAPAN METODE APRIORI UNTUK IDENTIFIKASI POLA
DATA TRANSAKSI PADA CUSTOMER DI SUPERMARKET
Mochamad Al Hafizh Zachari1
Feri Sulianta2
Program Studi Informatika
Fakultas Teknik
Universitas Widyatama, Jl. Cikutra 204A Bandung 40125, Indonesia
mochamad.zachari@widyatama.ac.id, feri.sulianta@widyatama.ac.id
Abstrak Supermarket merpuakan tempat
berbelanja dari seseorang terhadap suatu daerah
masyarakat setempat. Dengan pelayanan yang
maksimal untuk mengetahui pola data
pembelian yang diberikan dan mengantisipasi
persediaan bahan pokok didaerah tertentu agar
tidak mengalami keterlambatan kesediaan
barangt. Maka diperlukan pencarian pola atau
hubungan Association rule (aturan asosiatif).
Association rule merupakan salah satu teknik
data mining yang sangat penting, dapat
diartikan bahwa hubungan antara sejumlah item
dengan menentukan nilai support dan
confidence pada basis data, penting tidaknya
aturan asosiasi dapat diketahui dengan nilai
support atau nilai penunjang dan confidence
(nilai kepastian) algoritma apriori menghitung
seringnnya item-set yang muncul dalam
database melalui beberapa iterasi, setiap iterasi
tersebut memiliki dua tahapan yaitu
menentukan kandidat dan menghitung
kandidat. Tahap pertama pada iterasi pertama ,
himpunan yang dihasilkan dari kandidat item-
set berisikan seluruh 1-item-set. Tahap kedua
algoritma apriori menghitung support-nya
melalui seluruh item-set dengan batas
minimum tertentu saja yang dianggap sering
muncul (frequent), sehingga dapat diketahui
item-set yang sering muncul.. Penghapusan ini
berdasarkan pengamatan yaitu apakah item-set
tersebut sering muncul atau tidak. Dari hasil
penelitian dengan menggunakan nilai minimum
support dan minimum confident tertinggi akan
membentuk nilai akhir, yaitu nilai paling besar
yang melebihi batas minimal support dan
confidence. Dalam penelitian ini dengan
menggunakan kombinasi 2 item set dengan
minimum support 2 dan minimum confidence
35 pada super market di daerah tebet selatan
adalah “jika pembeli membeli Telur dan daging
giling maka pembeli akan membeli air mineral
” dengan Support 7,333% dan confidence
50,66%
Kata Kunci : super market, association rule,
algoritma apriori

1. LANDASAN TEORI
1.1 Data Mining
Data mining merupakan suatu metode
untuk menemukan pengetahuan dalam
suatu tumpukan data yang cukup besar.
Data mining adalah proses menggali dan
menganalisa sejumlah data yang sangat
besar untuk memperoleh sesuatu yang
benar, baru dan bermanfaat dan akhirnya
dapat ditemukan suatu corak atau pola
dalam data tersebut. (Han dan Kamber,
2006). Data mining adalah bagian integral
dari knowledge discovery database (KDD)
yang merupakan proses keseluruhan
mengubah data mentah menjadi pola-pola
data yang menarik yang merupakan
informasi yang dibutuhkan oleh pengguna
sebagai pengetahuan, seperti yang
ditunjukan pada.
Terdapat empat tugas utama data mining
yang terlihat pada gambar 3 yaitu :
1.1.1 Predictive modelling
Predictive modelling digunakan untuk
membangun sebuah model untuk target
variabel sebagai fungsi dari explanatory
variabel. Explanatory variabel dalam hal ini
merupakan semua atribut yang digunakan
untuk melakukan prediksi, sedangkan
variable target merupakan atribut yang
akan diprediksi nilainya. Predictive
modelling dibagi menjadi dua tipe yaitu :
Classification yang digunakan untuk
memprediksi nilai dari target variabel yang
diskrit dan regresi yang digunakan untuk
memprediksi nilai dari target variabel yang
kontinyu.
1.1.2 Association analysis
Association analysis adalah penemuan
association rule yang menunjukan pola-
pola yang sering muncul dalam data.
Terdapat nilai support dan confidence yang
dapat menunjukan seberapa besar suatu
rule dapat dipercaya. Support adalah
ukuran dimana seberapa besar tingkat
dominasi suatu item atau itemset terhadap
keseluruhan transaksi. Sedangkan
confidence adalah ukuran yang
menunjukan hubungan antara dua item
secara conditional. Association analysis
digunakan untuk menemukan aturan-
aturan asosiasi yang memperlihatkan
kondisi-kondisi nilai atribut yang sering
muncul secara bersamaan dalam sebuah
himpunan data.
1.1.3 Cluster analysis
Tidak seperti klasifikasi yang menganalisa
kelas data objek yang mengandung label.
Clustering digunakan untuk menganalisa
objek dari data tanpa memeriksa kelas
label yang diketahui. Label-label kelas
dilibatkan di dalam data training karena
belun diketahui sebelumnya. Clustering
merupakan proses mengelompokan
sekumpulan objek yang sangat mirip.

1.1.4 Anomaly detection/outlier
mining
Sebuah database dapat mengandung data
objek yang tidak sesuai atau menyimpang
dari model data. Data objek ini disebut
outlier. Banyak metode data mining yang
menghilangkan outlier ini. Padahal, pada
beberapa aplikasi seperti fraud detection,
kejadian yang jarang terjadi tersebut justru
lebih menarik untuk dianalisa daripada
kejadian yang sering terjadi. Analisa dari
outlier data tersebut disebut sebagai
outlier mining. Outlier mining juga sering
disebut dengan anomaly detection yang
merupakan metode pendeteksian suatu
data dimana tujuannya adalah
menemukan objek yang berbeda dari
sebagian besar objek lain. Anomaly dapat
dideteksi dengan menggunakan uji statistik
yang menerapkan model distribusi atau
probabilitas untuk data.
1.2 Asociation Rule
Menurut tempubulon, Association rule
mining merupakan teknik data mining untuk
menemukan aturan asosiasi antar kombinasi
item, salah satu contoh dari aturan asosiasi
disuatu pasar swalayan adalah dapat
diketahui berapa besar kemungkinan
seseorang membeli sikat gigi bersamaan
dengan pasta gigi. Dengan informasi
tersebut pihak pasar swalayan dapat
mengatur ketersediaan stok barang, supaya
tidak terjadi keterlambatan stok barang yang
sering dibeli bersamaan. Aturan asosiasi
menggunakan data latihan sehingga
diketahui item-item belanja yang sering
dibeli secara bersamaan dalam suatu waktu.
Aturan asosiasi yang terbentuk “if...then...,
atau, jika..., maka.”.
1.3 Algoritma Apriori
Algoritma apriori atau sering disebut juga
dengan analisis asosiasi (association rule
mining) adalah teknik data mining untuk
menemukan aturan asosiasi antara suatu
kombinasi item. (Han & Kamber, 2006)
Misalkan I={i1,i2,i3,.. in} merupakan himpunan
items dan D merupakan himpunan database
transaksi yang setiap transasi T merupakan
himpunan item yang terkandung dalam
transaksi T. Setiap transaksi diasosiasikan
dengan identifier yang disebut TID. Aturan
yang memenuhi minimum support (min_sup)
dan minimum confidence (min_conf) disebut
kandidat rule yang kuat. Berdasarkan konvensi,
nilai support dan nilai confidence adalah nilai
antara 0% sampai 100% sebanding dengan 0
sampai 1,0 (Linof, 2004). Himpunan item
disebut dengan itemset. Itemset yang
mengandung k items disebut kitemsets.
Sebagai contoh himpunan {kopi, gula}
merupakan 2-itemset. Kecenderungan
kemunculan itemset dalam sejumlah transaksi
disebut frequency, support count atau count
itemset. Aturan asosiasi dilakukan dengan
melalui dua langkah, yaitu :
1. Temukan semua frequent itemset. Hasil
dari proses ini adalah sejumlah itemset dengan
nilai support lebih besar atau sama dengan

minimum support yang diberikan. Nilai support
dari itemset {A,B} dihitung dengan
menggunakan persamaan 1.
2. Menentukan strong rule dari frequent
itemset. Hasil dari proses ini adalah semua
rule yang memenuhi minimum support dan
minimum confidence. Nilai confidence dari
suatu kandidat rule A B dihitung dengan
menggunakan persamaan 2.
1.4 Pola Frekuensi Tinggi
Tahap ini akan mencari item yang memenuhi
minimal support dari item-set. Nilai support
didapat dari rumus 1 berikut : Support h
pembelian mengandung A)/(Total ….[rumus 1]
Kemudian nilai support dari 2 item diperoleh
dari rumus 2 berikut: mengandung A dan
B)/(Total Item)...............[rumus 2].
2. METODE PENELITIAN
2.1. Kerangka Penelitian
Gambar 2.1 Alur Metode Penelitian
2.2 Use Case Diagram
Dibawah ini adalah diagram usecase,
usecase akan menjelaskan bagaimana suatu
perilaku (behaviour) berlangsung dalam
super market.
Gambar 2.2 Use case diagram pada system
transaksi
PROBLEM ANALYSIS
DATA PREPARATION
DATA MINING
PATTERN GENERATION
PATERN MONITORING

2.3 Analisa Pola Frekuensi tinggi
Tahap ini akan mencari item menggunakan
dataset dengan algoritma apriori yang
memenuhi minimal support dari item-set.
Nilai support didapat dari rumus 1 berikut
Support(A) 𝐽𝑢𝑚𝑙𝑎ℎ transaksi
𝑚𝑒𝑛𝑔𝑎𝑛𝑑𝑢𝑛𝑔 𝐴 𝑇𝑜𝑡𝑎𝑙 transaksi [rumus 1]
Kemudian nilai support dari 2 item
diperoleh dari rumus 2 berikut:
Support(A,B)=P(A∩B) 𝐽𝑢𝑚𝑙𝑎ℎ Transaksi
𝑚𝑒𝑛𝑔𝑎𝑛𝑑𝑢𝑛𝑔 𝐴 𝑑𝑎𝑛 𝐵 𝑇𝑜𝑡𝑎𝑙 transaksi
[rumus 2] Contoh perhitungan algoritma
apriori dengan data set pola data Bahan
baku yang didapat diSuper Market jatiroto
seperti pada tabel 1 berikut :
Tabel Pola Frekuensi pada dataset
Data tersebut diatas dalam database
Customers direpresentasikan dalam bentuk
seperti tampak pada tabel 2 berikut:
Tabel frekuensi tinggi pada item
No Nama Total
Transaksi
0 air mineral 968
1 telur 748
2 spaghetti 738
3 coklat 691
4 kentang 687
5 teh hijau 565
6 susu sapi 530
7 daging sapi 419
8 pancake 384
9 sayuran 384
Selanjutnya mencari candidat 2 -itemset
seperti pada tabel 3 berikut :
Tabel frekuensi transaksi tinggi
Tabel diatas menujukkan hasil calon 2-
itemset dari pola data Bahan baku pembeli
pada tabel 4. Dari data tersebut diatas, jika
ditetapkan nilai ф yang telah ditentukan
oleh user yaitu = 3 maka F2 = {{air
mineral,telur}, {chocolate,air mineral}}.
Yang tidak memenuhi nilai ф = 3 maka
akan dihapus. Langkah selanjutnya
membentuk 3 item set seperti pada tabel 4
berikut :
Tabel nilai support pada itemset
Support Itemset length
0.050933 (telur, air
mineral)
2
0.059733 (coklat, mineral
water)
2
0.052667 (spageti, air
mineral)
2
Dengan demikian F3= {}, karena lebih
kecil dari nilai yang ditetapkan ф = 3, jadi
untuk F4, F5,F6, dan seterusnya merupakan
himpunan kosong
Setelah didapat support dan confidence
untuk masing-masing kandidat, lakukan
perkalian antara support dan confidence,
dimana confidence-nya diambil 70%
keatas, sehingga didapat seperti pada tabel
berikut :

Tabel nilai support dan confidence pada
itemset
Ifantece
dent
then
consequ
ent
Suppor
t
Confide
nce
Support
x
Confide
nce
Jika
Telur
maka
air
minera
l
0.5093
3
50% 0,4
Jika
Spageti
maka
air
minera
l
0.5973
3
50% 0,4
Jika
Coklat
maka
air
minera
l
0.5267
7
50% 0,4
Setelah didapat hasil perkalian antara
support dan confidence, pilihlah yang hasil
perkalianya paling besar. Hasil paling besar
dari perkalian-perkalian tersebut
merupakan rule yang dipakai pada saat
transaksi, karena hasil perkalian dari ke-3
item diatas bernilai sama, maka semuanya
bisa dijadikan rule.
- Jika item telur maka akan air mineral
dengan support 40% dan confidence 50%
- Jika item coklat maka akan air mineral
dengan support 40% dan confidence 50%
3. KESIMPULAN DAN SARAN
3.1 Kesimpulan
Berdasarkan pengujian data yang telah
dilakukan pada kedua dataset. Untuk pola
item yang terbentuk pada transaksi dengan
kombinasi 2 yaitu “ jika Telur maka akan
ada Air Mineral” dengan support 0.50933
dan Confidence 50,308%. Sedangkan
untuk kombinasi 3 item didapat “ jika
Spageti dan Air mineral, maka akan ada
coklat ” dengan support 4% dan
confidence 22,222%. 2. Untuk pola item
yang terbentuk dengan kombinasi 2 yaitu “
jika Telur maka akan ada air mineral”
dengan support 12% dan Confidence
33,962%. Sedangkan untuk kombinasi 3
item didapat “ jika coklat dan spageti,
maka akan ada air mineral” dengan
support 4,667% dan Confidence 13,208%.
3.2 Saran
Berdasarkan hasil penelitian dan
kesimpulan yang telah dijelaskan
sebelumnya, peneliti memberikan
beberapa saran, diantaranya sebagai
berikut:
1. Bagi peneliti yang ingin melanjutlan
penelitian ini diharapkan mempunyai data
set yang kompleks dan tidak banyak
memiliki attribut
2. Gunakanlah tools visualisasi yang
mudah digunakan unuk memvisualisasi
kan data hasil mining

3. Saran saya untuk peneliti
selanjutnya, gunakan lah bahasa
pemrograman pyhton untuk membuat
algoritma ini, karena python sangat
reliable untuk interpretasi bigdata.
DAFTAR PUSTAKA
[1] Anief, M. (1991). Apa yang Perlu
Diketahui Tentang Bahan baku. Yogyakarta:
PenerbitGajah Mada University Press.
Halaman 3.
[2] Agrawal,dalam
simanjuntak.2010.”Aplikasi data mining
untuk pemodelan pembelian barang dengan
menggunakan Algoritma Apriori.”jurnal
teknik informatika.Hlm 1- 31.
[3] Dewati,S.2014.”Analisis pola
transaksi Bahan baku menggunakan
Algoritma Apriori”.jurnal teknik
informatika. Hlm 1-9.
[4] Kurniawan, H.2014.”Analisa pola
penyakit swalayan dengan menerapakan
association rule menggunakan algoritma
apriori”.seminar nasional informatika.
Hlm195- 201.
[5] Kusrini. 2009.Algoritma Data
Mining.Yogyakarta:Andi offset.
Simanjuntak.2010.”Aplikasi Data mining
untuk pemodelan pembelian Barang
menggunakan algoritma apriori.”jurnal
teknik informatika. Hlm1- 31.
[6] Algoritma Apriori untuk Analisis
Keranjang Belanja pada Data Transaksi
Penjualan Sandi Fajar Rodiyansyah
https://media.neliti.com/media/publications/2
36599-algoritma-apriori-untuk-analisis-
keranja-1ad5198e.pdf
[7] Sunarti, F. Handayanna, dan E.
Irfiani, “Analisa Pola Penjualan Makanan
dengan Penerapan Algoritma Apriori”, Vol.
20, No. 4, pp. 478-488, November. 2021.
[8] A.V. Putri, “Analisa Pola Belanja
Konsumen Menggunakan Algoritma Apriori
Pada Toko Buku Al-Mumtaz”, juli. 2019.
[9] W. Dari, “Analisis Metode Apriori
Untuk Memprediksi Persediaan Barang
Pada Warung”, Vol. 1, No. 4, pp. 438-447,
Agustus. 2022.
[10] Sunarti, F. Handayanna, dan E.
Irfiani, “Analisa Pola Penjualan Makanan
dengan Penerapan Algoritma Apriori”, Vol.
20, No. 4, pp. 478-488, November. 2021.
[11] A.V. Putri, “Analisa Pola Belanja
Konsumen Menggunakan Algoritma Apriori
Pada Toko Buku Al-Mumtaz”, juli. 2019.
[12] W. Dari, “Analisis Metode Apriori
Untuk Memprediksi Persediaan Barang
Pada Warung”, Vol. 1, No. 4, pp. 438-
447, Agustus. 2022.
[13] Kusrini., Luthfi, E. T., 2009. Algoritma
Data Mining, Andi Publisher, Yogyakarta.
[14] Turban, E., 2005, Decision Support
Systems and Intelligent Systems Edisi Bahasa
Indonesia. Andi Publisher, Yogyakarta.
[15] Hermawati, F. A., 2013, Data Mining.
Andi, Yogyakarta.

Penerapan Metode Apriori Untuk Identifikasi Pola Data Transaksi Pada Customer Di Supermarket

Recommended

Recommended

More Related Content

Similar to Penerapan Metode Apriori Untuk Identifikasi Pola Data Transaksi Pada Customer Di Supermarket

Similar to Penerapan Metode Apriori Untuk Identifikasi Pola Data Transaksi Pada Customer Di Supermarket (20)

More from ferisulianta.com

More from ferisulianta.com (20)

Recently uploaded

Recently uploaded (7)

Penerapan Metode Apriori Untuk Identifikasi Pola Data Transaksi Pada Customer Di Supermarket