Artikel ini membahas penggunaan algoritma Apriori dan FP-Growth untuk menganalisis data penjualan laptop berdasarkan merk yang populer di kalangan konsumen di Indocomputer Payakumbuh. Kedua algoritma digunakan untuk menemukan aturan asosiasi dan mengelompokkan data penjualan laptop berdasarkan merk agar dapat digunakan sebagai pertimbangan dalam strategi pemasaran dan persediaan stok laptop."
Dokumen membahas konsep data statistik, termasuk pengertian data statistik, jenis-jenisnya berdasarkan sumber, bentuk, sifat, dan waktu pengumpulan, serta materi pokok ajar tentang data statistik.
Analisa klasifikasi biaya pasien rawat inap menggunakan teknik data mining at...Koltiva
Sistem Informasi Manajemen Rumah Sakit (SIMRS) secara umum telah digunakan oleh para staf rumah sakit untuk mendukung operasional sehari-hari. Sebagian besar informasi yang didapat pada operasional SIMRS berasal dari pengolahan transactional database. Sedangkan untuk mendukung pengambilan keputusan ditingkat manajerial, diperlukan akses ke database dalam ukuran besar dan dimensi yang lebih kompleks, sehingga diperlukan teknik data mining. Pendekatan data mining biasa dilakukan untuk menggali informasi, pengetahuan, pola-pola baru dan tren dengan menganalisis database dalam ukuran besar, menggunakan teknologi pengenalan pola, teknik statistik dan matematik.
Salahsatu potensi yang dapat dimanfaatkan pada penerapan data mining di rumah sakit adalah mengidentifikasi atribut-atribut penentu biaya pasien rawat inap. Dengan mengetahui atribut penentu biaya rawat, diharapkan pihak manajemen rumah sakit dapat melakukan kontrol terhadap biaya, sehingga ongkos perawatan pasien dapat ditekan tanpa mengurangi kualitas pelayanan.
Untuk mengidentifikasi atribut penentu biaya pasien rawat inap, digunakan data kunjungan pasien rawat inap RSUP Dr. Cipto Mangunkusumo dengan jaminan Jamkesmas periode 1 Januari 2009 s/d 30 September 2010 dari database SIMRS sebanyak 2022 kunjungan (jumlah sebelum dilakukan data cleaning 8383). Dengan teknik analisa Atttibute Importance (AI) didapatkan atribut-atribut penentu biaya dengan urutan sebagai berikut: prosedur medis 1 (AI=0,16), prosedur medis 4 (AI=0,15), prosedur medis 3 (AI=0,14), LOS (AI=0,13), prosedur medis 2 (AI=0,13), organisasi (AI=0.10), diagnosa utama (AI=0,08), jenis kelamin (AI=0.02) dan status kawin (AI=0.01). Hasil klasifikasi dengan teknik Algoritma Naive Bayes menunjukkan model yang dibuat memiliki predictive confidence sebesar 50,41%.
ANALISIS KERANJANG BELANJA DENGAN ALGORITMA APRIORI PADA PERUSAHAAN RETAILDwi Putra Asana
Sering terjadinya kekosongan salah satu stok barang yang sering dibeli secara bersamaan oleh pelanggan merupakan akibat dari tidak adanya informasi mengenai kebiasaan belanja pelanggan. Sehingga perlu dilakukan penggalian informasi pada data transaksi dengan teknik association rule mining (aturan asosiasi) untuk mengetahui barang yang sering dibeli secara bersamaan oleh pelanggan. association rule mining juga sering dinamakan market basket analysis (analisis keranjang belanja). Algoritma yang digunakan dalam association rule mining pada penelitian ini adalah algoritma apriori. Kombinasi barang dicari berdasarkan nilai minimum support, nilai minimum confidence, dan rentang data transaksi penjualan yang dimasukan. Salah satu informasi yang dihasilkan adalah Jika membeli Cakra Kembar 25 Kg maka akan membeli Segitiga Biru 25 Kg dengan nilai support 11,76 % dan nilai confidence 43,24 %. Berdasarkan beberapa hasil uji coba dapat diketahui bahwa nilai minimum support yang dimasukan mempengaruhi banyak frequent itemset yang dihasilkan. Nilai minimum support dan minimum confidence yang dimasukan mempengaruhi waktu proses sistem dalam penggalian informasi.
Dokumen tersebut membahas konsep data statistik yang dibedakan berdasarkan sumber, bentuk, sifat, dan waktu pengumpulannya. Ada dua jenis data statistik berdasarkan sumbernya, yaitu data primer yang dikumpulkan secara langsung dan data sekunder yang diperoleh dari sumber yang ada. Secara bentuk dibedakan menjadi data kuantitatif berupa angka dan data kualitatif berupa kategori. Berdasarkan sifatnya ada
Artikel ini membahas penggunaan algoritma Apriori dan FP-Growth untuk menganalisis data penjualan laptop berdasarkan merk yang populer di kalangan konsumen di Indocomputer Payakumbuh. Kedua algoritma digunakan untuk menemukan aturan asosiasi dan mengelompokkan data penjualan laptop berdasarkan merk agar dapat digunakan sebagai pertimbangan dalam strategi pemasaran dan persediaan stok laptop."
Dokumen membahas konsep data statistik, termasuk pengertian data statistik, jenis-jenisnya berdasarkan sumber, bentuk, sifat, dan waktu pengumpulan, serta materi pokok ajar tentang data statistik.
Analisa klasifikasi biaya pasien rawat inap menggunakan teknik data mining at...Koltiva
Sistem Informasi Manajemen Rumah Sakit (SIMRS) secara umum telah digunakan oleh para staf rumah sakit untuk mendukung operasional sehari-hari. Sebagian besar informasi yang didapat pada operasional SIMRS berasal dari pengolahan transactional database. Sedangkan untuk mendukung pengambilan keputusan ditingkat manajerial, diperlukan akses ke database dalam ukuran besar dan dimensi yang lebih kompleks, sehingga diperlukan teknik data mining. Pendekatan data mining biasa dilakukan untuk menggali informasi, pengetahuan, pola-pola baru dan tren dengan menganalisis database dalam ukuran besar, menggunakan teknologi pengenalan pola, teknik statistik dan matematik.
Salahsatu potensi yang dapat dimanfaatkan pada penerapan data mining di rumah sakit adalah mengidentifikasi atribut-atribut penentu biaya pasien rawat inap. Dengan mengetahui atribut penentu biaya rawat, diharapkan pihak manajemen rumah sakit dapat melakukan kontrol terhadap biaya, sehingga ongkos perawatan pasien dapat ditekan tanpa mengurangi kualitas pelayanan.
Untuk mengidentifikasi atribut penentu biaya pasien rawat inap, digunakan data kunjungan pasien rawat inap RSUP Dr. Cipto Mangunkusumo dengan jaminan Jamkesmas periode 1 Januari 2009 s/d 30 September 2010 dari database SIMRS sebanyak 2022 kunjungan (jumlah sebelum dilakukan data cleaning 8383). Dengan teknik analisa Atttibute Importance (AI) didapatkan atribut-atribut penentu biaya dengan urutan sebagai berikut: prosedur medis 1 (AI=0,16), prosedur medis 4 (AI=0,15), prosedur medis 3 (AI=0,14), LOS (AI=0,13), prosedur medis 2 (AI=0,13), organisasi (AI=0.10), diagnosa utama (AI=0,08), jenis kelamin (AI=0.02) dan status kawin (AI=0.01). Hasil klasifikasi dengan teknik Algoritma Naive Bayes menunjukkan model yang dibuat memiliki predictive confidence sebesar 50,41%.
ANALISIS KERANJANG BELANJA DENGAN ALGORITMA APRIORI PADA PERUSAHAAN RETAILDwi Putra Asana
Sering terjadinya kekosongan salah satu stok barang yang sering dibeli secara bersamaan oleh pelanggan merupakan akibat dari tidak adanya informasi mengenai kebiasaan belanja pelanggan. Sehingga perlu dilakukan penggalian informasi pada data transaksi dengan teknik association rule mining (aturan asosiasi) untuk mengetahui barang yang sering dibeli secara bersamaan oleh pelanggan. association rule mining juga sering dinamakan market basket analysis (analisis keranjang belanja). Algoritma yang digunakan dalam association rule mining pada penelitian ini adalah algoritma apriori. Kombinasi barang dicari berdasarkan nilai minimum support, nilai minimum confidence, dan rentang data transaksi penjualan yang dimasukan. Salah satu informasi yang dihasilkan adalah Jika membeli Cakra Kembar 25 Kg maka akan membeli Segitiga Biru 25 Kg dengan nilai support 11,76 % dan nilai confidence 43,24 %. Berdasarkan beberapa hasil uji coba dapat diketahui bahwa nilai minimum support yang dimasukan mempengaruhi banyak frequent itemset yang dihasilkan. Nilai minimum support dan minimum confidence yang dimasukan mempengaruhi waktu proses sistem dalam penggalian informasi.
Dokumen tersebut membahas konsep data statistik yang dibedakan berdasarkan sumber, bentuk, sifat, dan waktu pengumpulannya. Ada dua jenis data statistik berdasarkan sumbernya, yaitu data primer yang dikumpulkan secara langsung dan data sekunder yang diperoleh dari sumber yang ada. Secara bentuk dibedakan menjadi data kuantitatif berupa angka dan data kualitatif berupa kategori. Berdasarkan sifatnya ada
20. implementasi data mining pada penjualan produk elektronik dengan algoritm...ym.ygrex@comp
Dokumen ini membahas implementasi algoritma apriori pada penjualan produk elektronik, khususnya laptop, untuk mengetahui merek mana yang paling banyak terjual. Algoritma apriori digunakan untuk menemukan pola frekuensi tinggi dari data penjualan dengan menghitung nilai support dan confidence. Hasilnya menunjukkan merek Acer, Toshiba, dan Samsung memiliki nilai support di atas 30% sehingga merupakan merek laptop terlaris.
Dokumen tersebut merangkum tentang machine learning dan data mining. Machine learning adalah ilmu yang mempelajari cara memberikan kemampuan kepada komputer untuk menyelesaikan masalah secara mandiri tanpa bantuan user, sedangkan data mining adalah proses ekstraksi pengetahuan dari database besar menggunakan teknik statistik dan machine learning. Dokumen ini juga membahas perbedaan antara supervised learning dan unsupervised learning serta beberapa algoritma machine learning seperti klasifikasi, regresi, kl
The document discusses the benefits of exercise for mental health. Regular physical activity can help reduce anxiety and depression and improve mood and cognitive function. Exercise causes chemical changes in the brain that may help protect against developing mental illness and improve symptoms for those who already suffer from conditions like anxiety and depression.
Set instruksi merupakan spesifikasi dari semua kode biner (opcode) yang diimplementasikan dalam bentuk asli dalam sebuah desain prosesor tertentu. Set instruksi mencakup jenis operasi, format instruksi, dan teknik pengalamatan yang digunakan oleh CPU. Jenis-jenis bus sistem digunakan untuk menghubungkan komponen utama komputer seperti CPU, memori, dan perangkat I/O.
The document discusses the benefits of exercise for mental health. Regular physical activity can help reduce anxiety and depression and improve mood and cognitive functioning. Exercise causes chemical changes in the brain that may help boost feelings of calmness and well-being.
Penerapan Metode Apriori Untuk Identifikasi Pola Data Transaksi Pada Customer...ferisulianta.com
Supermarket merpuakan tempat berbelanja dari seseorang terhadap suatu daerah masyarakat setempat. Dengan pelayanan yang maksimal untuk mengetahui pola data pembelian yang diberikan dan mengantisipasi persediaan bahan pokok didaerah tertentu agar tidak mengalami keterlambatan kesediaan barangt. Maka diperlukan pencarian pola atau hubungan Association rule (aturan asosiatif). Association rule merupakan salah satu teknik data mining yang sangat penting, dapat diartikan bahwa hubungan antara sejumlah item dengan menentukan nilai support dan confidence pada basis data, penting tidaknya aturan asosiasi dapat diketahui dengan nilai support atau nilai penunjang dan confidence (nilai kepastian) algoritma apriori menghitung seringnnya item-set yang muncul dalam database melalui beberapa iterasi, setiap iterasi tersebut memiliki dua tahapan yaitu menentukan kandidat dan menghitung kandidat. Tahap pertama pada iterasi pertama , himpunan yang dihasilkan dari kandidat item-set berisikan seluruh 1-item-set. Tahap kedua algoritma apriori menghitung support-nya melalui seluruh item-set dengan batas minimum tertentu saja yang dianggap sering muncul (frequent), sehingga dapat diketahui item-set yang sering muncul.. Penghapusan ini berdasarkan pengamatan yaitu apakah item-set tersebut sering muncul atau tidak. Dari hasil penelitian dengan menggunakan nilai minimum support dan minimum confident tertinggi akan membentuk nilai akhir, yaitu nilai paling besar yang melebihi batas minimal support dan confidence. Dalam penelitian ini dengan menggunakan kombinasi 2 item set dengan minimum support 2 dan minimum confidence 35 pada super market di daerah tebet selatan adalah “jika pembeli membeli Telur dan daging giling maka pembeli akan membeli air mineral ” dengan Support 7,333% dan confidence 50,66%
Kata Kunci : super market, association rule, algoritma apriori
Statistika adalah metode untuk mengumpulkan, menganalisis, dan menginterpretasi data numerik untuk membantu pengambilan keputusan. Langkah-langkahnya meliputi pengumpulan data, pengorganisasian data, analisis data, dan interpretasi hasil analisis. Statistika dibedakan menjadi deskriptif untuk menggambarkan karakteristik data dan induktif untuk menarik kesimpulan tentang populasi berdasarkan sampel.
20. implementasi data mining pada penjualan produk elektronik dengan algoritm...ym.ygrex@comp
Dokumen ini membahas implementasi algoritma apriori pada penjualan produk elektronik, khususnya laptop, untuk mengetahui merek mana yang paling banyak terjual. Algoritma apriori digunakan untuk menemukan pola frekuensi tinggi dari data penjualan dengan menghitung nilai support dan confidence. Hasilnya menunjukkan merek Acer, Toshiba, dan Samsung memiliki nilai support di atas 30% sehingga merupakan merek laptop terlaris.
Dokumen tersebut merangkum tentang machine learning dan data mining. Machine learning adalah ilmu yang mempelajari cara memberikan kemampuan kepada komputer untuk menyelesaikan masalah secara mandiri tanpa bantuan user, sedangkan data mining adalah proses ekstraksi pengetahuan dari database besar menggunakan teknik statistik dan machine learning. Dokumen ini juga membahas perbedaan antara supervised learning dan unsupervised learning serta beberapa algoritma machine learning seperti klasifikasi, regresi, kl
The document discusses the benefits of exercise for mental health. Regular physical activity can help reduce anxiety and depression and improve mood and cognitive function. Exercise causes chemical changes in the brain that may help protect against developing mental illness and improve symptoms for those who already suffer from conditions like anxiety and depression.
Set instruksi merupakan spesifikasi dari semua kode biner (opcode) yang diimplementasikan dalam bentuk asli dalam sebuah desain prosesor tertentu. Set instruksi mencakup jenis operasi, format instruksi, dan teknik pengalamatan yang digunakan oleh CPU. Jenis-jenis bus sistem digunakan untuk menghubungkan komponen utama komputer seperti CPU, memori, dan perangkat I/O.
The document discusses the benefits of exercise for mental health. Regular physical activity can help reduce anxiety and depression and improve mood and cognitive functioning. Exercise causes chemical changes in the brain that may help boost feelings of calmness and well-being.
Penerapan Metode Apriori Untuk Identifikasi Pola Data Transaksi Pada Customer...ferisulianta.com
Supermarket merpuakan tempat berbelanja dari seseorang terhadap suatu daerah masyarakat setempat. Dengan pelayanan yang maksimal untuk mengetahui pola data pembelian yang diberikan dan mengantisipasi persediaan bahan pokok didaerah tertentu agar tidak mengalami keterlambatan kesediaan barangt. Maka diperlukan pencarian pola atau hubungan Association rule (aturan asosiatif). Association rule merupakan salah satu teknik data mining yang sangat penting, dapat diartikan bahwa hubungan antara sejumlah item dengan menentukan nilai support dan confidence pada basis data, penting tidaknya aturan asosiasi dapat diketahui dengan nilai support atau nilai penunjang dan confidence (nilai kepastian) algoritma apriori menghitung seringnnya item-set yang muncul dalam database melalui beberapa iterasi, setiap iterasi tersebut memiliki dua tahapan yaitu menentukan kandidat dan menghitung kandidat. Tahap pertama pada iterasi pertama , himpunan yang dihasilkan dari kandidat item-set berisikan seluruh 1-item-set. Tahap kedua algoritma apriori menghitung support-nya melalui seluruh item-set dengan batas minimum tertentu saja yang dianggap sering muncul (frequent), sehingga dapat diketahui item-set yang sering muncul.. Penghapusan ini berdasarkan pengamatan yaitu apakah item-set tersebut sering muncul atau tidak. Dari hasil penelitian dengan menggunakan nilai minimum support dan minimum confident tertinggi akan membentuk nilai akhir, yaitu nilai paling besar yang melebihi batas minimal support dan confidence. Dalam penelitian ini dengan menggunakan kombinasi 2 item set dengan minimum support 2 dan minimum confidence 35 pada super market di daerah tebet selatan adalah “jika pembeli membeli Telur dan daging giling maka pembeli akan membeli air mineral ” dengan Support 7,333% dan confidence 50,66%
Kata Kunci : super market, association rule, algoritma apriori
Statistika adalah metode untuk mengumpulkan, menganalisis, dan menginterpretasi data numerik untuk membantu pengambilan keputusan. Langkah-langkahnya meliputi pengumpulan data, pengorganisasian data, analisis data, dan interpretasi hasil analisis. Statistika dibedakan menjadi deskriptif untuk menggambarkan karakteristik data dan induktif untuk menarik kesimpulan tentang populasi berdasarkan sampel.
Kelompok 4 collecting data and analisis method.pptxArwanDiana
Dokumen ini membahas tentang pengumpulan dan analisis data dalam praktik kebidanan. Ia menjelaskan definisi pengumpulan data dan tujuannya, teknik-teknik pengumpulan data kuantitatif dan kualitatif, serta metode-metode analisis data seperti kualitatif, kuantitatif, dan kombinasi kualitatif dan kuantitatif. Dokumen ini juga membahas teknik dan metode analisis data kuantitatif dan kualitatif seperti analisis deskriptif,
Konsumen Sebagai Co-Creation untuk Menentukan Strategi.pdfferisulianta.com
Industri retail skala internasional menjual banyak variasi produk yang didapat dari berbagai vendor, transaksi penjualan yang terjadi membentuk gudang data yang tersimpan pada basis data Sistem Enterprise Resource Planning. Ketersediaan data historis hasil transaksi yang terdokumentasi dapat manfaaatkan lebih lanjut untuk ditambang dengan menganalisa keranjang belanja konsumen. dengan mencari korelasi antara produk-produk dalam kumpulan transaksi penjualan yang sudah terjadi dalam kurun waktu tertentu. Algoritma apriori digunakan untuk membangun aturan asosiasi yang berfokus pada memetakan perilaku konsumen retail sebagai co-creation manajemen startegi perusahaan dan dapat menghasilkan hubungan dan aturan yang akan mengungkapkan pola preferensi pelanggan terhadap berbagai jenis produk, yang sebelumnya tersembunyi dan sulit diukur. Aturan asosiasi yang dihasilkan melalui serangkaian proses teknik data mining diujikan lebih lanjut untuk mengukur keberhasilkan aturan asosiasi menggunakan data transaksional pada periode berikutnya. Hasil pengujian aturan asosiasi dengan nilai minimum confidence 70% digunakan sebagai dasar membangun strategi bisnis diantaranya: memperkuat penjualan paket, strategi penempatan produk, segmentasi pasar berdasarkan preferensi warna,
mengelola stok dan ketersediaan produk.
Penerapan Data Mining dengan Algoritma C4.5 dalam Pemesanan Obat Guna Meningk...Gede Surya Mahendra
Dokumen tersebut membahas penerapan teknik data mining dengan algoritma C4.5 dalam memprediksi pemesanan obat di apotek untuk meningkatkan keuntungan. Data penjualan obat selama sebulan diapotek dikelompokkan berdasarkan kategori, tipe, harga dan status obat lalu dianalisis menggunakan algoritma C4.5. Hasilnya menunjukkan kategori obat generik paling laku terjual sedangkan kategori minuman dan makanan
Sipi, iis dewi herawati, prof. dr. ir. h. hapzi ali, pre m sc, mm, cma, sist...IISDEWI
Sistem informasi dan organisasi saling terkait. Sistem informasi membantu bisnis mencapai keunggulan kompetitif dengan menyediakan informasi yang mendukung pengambilan keputusan manajemen dan operasional bisnis. Sistem informasi juga dapat meningkatkan efisiensi dan efektivitas bisnis serta mengurangi risiko dengan merekam dan memproses data secara digital.
1. Dokumen membahas empat dimensi kecerdasan agen yaitu acting humanly, acting rationally, thinking humanly, dan thinking rationally.
2. Belajar pada konteks pembelajaran mesin adalah menyesuaikan parameter berdasarkan fungsi utilitas sesuai data lingkungan.
3. Teori pembelajaran statistik digunakan untuk memprediksi masa depan dan menyimpulkan pengetahuan dari data secara rasional berdasarkan lingkungan berupa data.
Sipi, irena fatya, prof. dr. ir. h. hapzi ali, pre m sc, mm, cma, sistem inf...irenafatya
Dokumen tersebut membahas tentang sistem informasi dan pengendalian internal serta peranannya dalam organisasi dan strategi bisnis. Secara ringkas, sistem informasi adalah kombinasi antara teknologi informasi dan aktivitas manusia yang digunakan untuk mendukung operasi dan manajemen. Sistem informasi berperan untuk meminimalkan risiko, meningkatkan efisiensi, dan mendukung pengambilan keputusan untuk mencapai keunggulan kompetitif dan tuju
Ringkasan dokumen tersebut adalah:
1. Dokumen tersebut membahas pendekatan metode pohon keputusan menggunakan algoritma ID3 untuk mengukur kinerja PNS
2. Algoritma ID3 digunakan untuk membangun pohon keputusan dari data pelatihan untuk mengelompokkan kinerja PNS menjadi bagus dan buruk
3. Sistem informasi yang dibangun dapat membantu manajemen dalam melakukan penilaian kinerja PNS secara le
Membangun Aturan Asosiasi menggunakan Algoritma Apriori untuk Rekomendasi Fil...ferisulianta.com
Rekomendasi film berperan penting dalam membantu penonton memilih film yang sesuai dengan minat mereka, terutama di tengah banyaknya pilihan yang tersedia. Dalam penelitian ini, kami menggunakan algoritma Apriori untuk memberikan rekomendasi film berdasarkan data IMDb. Algoritma Apriori digunakan untuk menemukan hubungan antara film-film berdasarkan informasi seperti genre, aktor, dan peringkat pengguna. Dengan menerapkan algoritma ini, kami dapat mengidentifikasi pola-pola yang sering muncul di antara item-item film dalam dataset IMDb. Misalnya, jika seorang pengguna sering menonton film-film aksi dengan aktor tertentu, algoritma Apriori dapat merekomendasikan film-film serupa dengan genre yang sama dan melibatkan aktor yang serupa. Diharapkan bahwa implementasi algoritma Apriori ini dapat membantu pengguna menemukan film-film yang relevan dan sesuai dengan minat mereka dalam pengalaman menonton mereka.
preferensi pengguna. Hasil penelitian ini diharapkan dapat memberikan panduan yang berguna bagi penonton dalam menemukan film-film yang menarik dan sesuai dengan minat mereka berdasarkan informasi IMDb yang relevan.
Keywords—association rules, dataset, Movies,apriori, IMDb
Membangun Aturan Asosiasi menggunakan Algoritma Apriori untuk Rekomendasi Fil...
Document
1. Penerapan Data Mining dengan Algoritma Apriori untuk
Mendukung Strategi Promosi Pendidikan
Gunadi Widi Nurcahyo1
Universitas Putra Indonesia “YPTK”
Jl. Raya Lubuk Begalung Padang. Sumatera Barat, Telp (0751)- 775246 Fax. (0751)-71913
e-mail: gunadiwidi@yahoo.co.id
Abstrak
Setiap perusahaan maupun organisasi yang ingin tetap bertahan perlu untuk menentukan
strategi promosi yang tepat. Penentuan strategi promosi yang tepat akan dapat mengurangi biaya
promosi dan mencapai sasaran promosi yang tepat. Salah satu cara yang dapat dilakukan untuk
penentuan strategi promosi adalah dengan menggunakan teknik data mining. Teknik data mining yang
digunakan dalam hal ini adalah dengan menggunakan algoritma Apriori. Algoritma Apriori adalah
algoritma pengambilan data dengan aturan asosiatif untuk menentukan hubungan asosiatif suatu
kombinasi item. Penelitian dilakukan dengan mengamati beberapa variabel penelitian yang sering
dipertimbangkan oleh perguruan tinggi dalam menentukan sasaran promosinya yaitu asal sekolah,
daerah, jurusan, dan waktu sekolah. Hasil penelitian ini adalah berupa suatu perangkat lunak dengan
mengimplementasikan algoritma Apriori yang dapat digunakan untuk menentukan nilai support dan
confidence untuk tiap item.
Kata kunci: Data Mining, Algoritma Apriori
Abstract
Any company or organization that wants to survive needs to determine the appropriate
promotional strategies. Determination of appropriate promotional strategies will be able to reduce costs
and achieve targeted promotional campaign proper. One way that can be done to determine campaign
strategy is to use data mining techniques. Data mining techniques used in this case is to use the Apriori
algorithm. Apriori algorithm is a sampling algorithm with associative rules to determine the associative
relationships of a combination of items. The study was conducted by observing some variables that are
considered by colleges to determine the origin of the promotion targeting schools, regions, departments ,
and school time. The results are in the form of a software to implement the Apriori algorithm that can be
used to determine the value of support and confidence for each item.
Keywords: Data Mining, Apriori Algorithm
1. Pendahuluan
Data Mining adalah proses ekstraksi informasi dari kumpulan data melalui penggunaan algoritma
dan teknik yang melibatkan bidang ilmu statistik, mesin pembelajaran, dan sistem manajemen database
(Feelders, Daniels, dan Holsheimer, 2000 dalam jayanthi Ranjan, 2005). Data Mining digunakan untuk
ekstraksi informasi penting yang tersembunyi dari dataset yang besar. Dengan adanya data mining maka
akan didapatkan suatu permata berupa pengetahuan di dalam kumpulan data – data yang banyak
jumlahnya.
Salah satu area penerapan data mining adalah di dalam bidang promosi. Bila sasaran promosi tidak
ditentukan secara baik, dalam arti tidak diupayakan mencari sasaran promosi yang potensial, maka hanya
akan menghabiskan banyak waktu dan biaya yang seharusnya bisa diminimalisir melalui pemilihan target
promosi yang baik. Salah satu cara yang dapat diterapkan adalah dengan menerapkan penggunaan data
mining.
Algoritma apriori adalah algoritma pengambilan data dengan aturan asosiatif (Association rule )
untuk menentukan hubungan asosiatif suatu kombinasi item (Kusrini, 2007). Association Rule yang
dimaksud dilakukan melalui mekanisme penghitungan support dan confidence dari suatu hubungan item.
Sebuah rule asosiasi dikatakan interesting jika nilai support adalah lebih besar dari minimum support dan
juga nilai confidence adalah lebih besar dari minimum confidence. Algoritma apriori ini akan cocok untuk
2. 68
diterapkan bila terdapat beberapa hubungan item yang ingin dianalisa. Salah satunya yang bisa diterapkan
adalah di dalam bidang promosi dan penentuan strategi pemasaran.
Pada saat ini tiap perguruan tinggi pasti berusaha untuk mendapatkan strategi promosi yang efektif
dan efisien dalam mendapatkan calon mahasiswa baru ditengah ketatnya persaingan antar Perguruan
Tinggi. Untuk promosi pada Perguruan Tinggi dapat didukung dengan menggunakan algoritma Apriori
untuk menentukan target promosi yang potensial. Variabel atau item yang dapat dijadikan sebagai tolok
ukur penganalisaan data diantaranya adalah asal sekolah, daerah asal, jurusan, dan waktu sekolah. Melalui
penerapan algoritma apriori maka akan dapat disajikan suatu gambaran mengenai hubungan antara asal
sekolah, daerah asal, jurusan, dan waktu sekolah terhadap keputusan mahasiswa untuk menjadi
mahasiswa suatu perguruan tinggi. Sehingga ke depan setiap perguruan tinggi bisa lebih memfokuskan
diri terhadap target promosi yang dirasakan cukup potensial.
Agar penelitian ini lebih terarah dan tujuan yang diharapkan dapat tercapai, maka peneliti
menetapkan batasan – batasan terhadap masalah yang diteliti. Dalam penelitian ini peneliti memberikan
batasan sebagai berikut : penelitian ini khusus membahas tentang strategi promosi pendidikan pada suatu
perguruan tinggi, data yang diamati diharapkan adalah data selama 6 tahun terakhir. kriteria peniliaian
yang akan dikaji adalah untuk mengkaji sasaran promosi pendidikan yang efektif bagi perguruan tinggi,
dan variabel yang dipakai di dalam penilaian ini adalah mengenai asal sekolah, Daerah asal, jurusan, dan
Waktu sekolah. Nilai confidence yang akan dihitung adalah nilai confidence untuk 2 itemset dan 3
itemset. Untuk kategori 2 itemset yang akan dijadikan tolok ukur dalam pencarian nilai support dan
confidence adalah variabel: Asal Sekolah – Jurusan, Asal Sekolah – Waktu, Daerah – Jurusan, Daerah –
Waktu, dan Jurusan – Waktu. Untuk kategori 3 itemset yang akan dijadikan tolok ukur dalam pencarian
nilai support dan confidence adalah variabel: Sekolah – Jurusan – Waktu dan Daerah – Jurusan – Waktu.
2. Metodologi Penelitian
Metodologi penelitian dilakukan dengan mengumpulkan data terlebih dahulu. Proses
pengumpulan data dilakukan dengan dua cara yaitu : studi kepustakaan dan studi lapangan. Studi
kepustakaan dilakukan untuk memahami penerapan data mining seperti mengumpulkan teori-teori yang
berhubungan dengan data mining dan studi lapangan dilakukan mendapatkan data penelitian. data yang
diamati diharapkan adalah data selama 6 tahun terakhir. Data penelitian seperti : Asal Sekolah – Jurusan,
Asal Sekolah – Waktu, Daerah – Jurusan, Daerah – Waktu, dan Jurusan – Waktu.
3. Analisis dan Hasil
3.1 Analisis
Data Mining adalah proses ekstraksi informasi dari kumpulan data melalui penggunaan
algoritma dan teknik yang melibatkan bidang ilmu statistik, mesin pembelajaran, dan sistem manajemen
database (Feelders, Daniels, dan Holsheimer, 2000 dalam jayanthi Ranjan, 2005). Data Mining adalah
digunakan untuk ekstraksi informasi penting yang tersembunyi dari dataset yang besar. Pada beberapa
tahun belakangan ini, kemajuan dari beberapa bidang ilmu pengetahuan seperti science, business, dan lain
– lain telah melahirkan koleksi database yang terus meningkat. Kumpulan data yang demikian banyak
dapat didayagunakan untuk mendukung pengambilan keputusan (Lamine, Nhien, dan Tahar, 2007).
Menurut Jurnal ”Penerapan Algoritma Apriori pada Data Mining Untuk Mengelompokkan
Barang Berdasarkan Kecenderungan Kemunculan Bersama Dalam Satu Transaksi” (Kusrini, 2007),
Algoritma apriori termasuk jenis aturan assosiasi pada data mining.
Analisis asosiasi atau association rule mining adalah teknik data mining untuk menemukan
aturan assosiatif antara suatu kombinasi item. Contoh dari aturan assosiatif dari analisa pembelian di
suatu pasar swalayan adalah dapat diketahuinya berapa besar kemungkinan seorang pelanggan membeli
roti bersamaan dengan susu. Dengan pengetahuan tersebut pemilik pasar swalayan dapat mengatur
penempatan barangnya atau merancang kampanye pemasaran dengan memakai kupon diskon untuk
kombinasi barang tertentu.
Karena analisis asosiasi menjadi terkenal karena aplikasinya untuk menganalisa isi keranjang
belanja di pasar swalayan, analisis asosiasi juga sering disebut dengan istilah market basket analysis.
Analisis asosiasi didefinisikan sebagai suatu proses untuk menemukan semua aturan assosiatif
yang memenuhi syarat minimum untuk support (minimum support) dan syarat minimum untuk
confidence (minimum confidence).
3. 69
Penerapan Data Mining untuk Strategi Promosi Pendidikan (Gunadi Widi Nurcahyo)
Metodologi dasar analisis asosiasi terbagi menjadi dua tahap :
3.1.1 Analisa pola frekuensi tinggi
Tahap ini mencari kombinasi item yang memenuhi syarat minimum dari nilai support dalam
database. Nilai support item diperoleh dengan Persamaan 1.
Support (A) = ……………...................[Persamaan 1]
sedangkan nilai support dari 2 item diperoleh dari Persamaan 2.
Support (A, B) = P ( A ∩ B) = ………….[Persamaan 2]
3.1.2 Pembentukan aturan assosiatif
Setelah semua pola frekuensi tinggi ditemukan, barulah dicari aturan assosiatif yang memenuhi
syarat minimum untuk confidence dengan menghitung confidence aturan assosiatif A → B. Nilai
confidence dari aturan A → B diperoleh dari Persamaan 3.
Confidence = P (A | B) = …………..[Persamaan 3]
3.1.3 Contoh Algoritma Apriori untuk Pencarian Association Rule
Misalkan terdapat data transaksi seperti yang ditunjukkan pada Tabel 1
Tabel 1 Data Item Transaksi
Transaction ID Item Set
1 Item A, Item C, Item D
2 Item B, Item C, Item E
3 Item A, Item B, Item C, Item E
4 Item B, Item E
Misalkan diinginkan minimum support : 50% (2 dari 4 transaksi)
Langkah 1: Mencari nilai support untuk masing – masing itemset. Seperti yang ditunjukkan pada Tabel 2
L1={large 1-itemset}
Tabel 2 Nilai Support untuk 1 Item Set
Itemset Support
A 50%
B 75%
C 75%
D 25%
E 75%
Langkah 2: Mencari kandidat itemset untuk L2:
2.1 : Gabungkan itemset pada L1 (algoritma apriori-gen)
{ A B, A C, A D, A E, B C, B D, B E, C D, C E, D E}
2.2 : Hapus yang tidak ada dalam itemset
Itemset { B D, DE} dihapus karena tidak ada dalam itemset
Langkah 3: Hitung nilai Support untuk masing- masing itemset. Hasilnya dapat ditunjukkan pada Tabel 3.
Jumlah Transaksi Mengandung A
Total Transaksi
Jumlah Transaksi Mengandung A dan B
Total Transaksi
Jumlah Transaksi Mengandung A dan B
Jumlah Transaksi Mengandung A
4. 70
Tabel 3 Nilai Support untuk 2 Item Set
Itemset Support
A B 25 %
A C 50 %
A D 25 %
A E 25%
B C 50%
B E 75%
C D 25%
C E 50%
Langkah 4: tentukan item set yang memenuhi minimum support. Hasilnya dapat ditunjukkan pada tabel 4.
L2 { large 2-itemset}
Tabel 4 Anggota 2 Item Set yang Memenuhi Minimum Support
Itemset Support
A C 50 %
B C 50%
B E 75%
C E 50%
Langkah 5 : Ulangi langkah 2-4
Langkah 5.1, Gabungkan itemset pada L2 & L2. Hasilnya dapat ditunjukkan pada Tabel 5.
Tabel 5 Anggota 3 Item Set
Itemset Hasil Gabungan (3 itemset)
A C + B C A C B
A C + B E A C B, A C E, A B E
A C + C E A C E
B C + B E B C E
B C + C E B C E
B E + C E B C E
Langkah, 5. 2, Hapus yang tidak ada dalam itemset : { A C E }
Langkah 6 : Hitung support dari setiap kandidat itemset L3
Hasilnya dapat ditunjukkan pada Tabel 6
Tabel 6 Nilai Support untuk 3 Item Set
Itemset Support
A B C 25 %
A B E 25 %
B C E 50 %
Langkah 7 : L3 { large 3-itemset } { B C E}
Langkah 8 : STOP karena sudah tidak ada lagi kandidat untuk 4-itemset.
Untuk mencari aturan asosiasi diperlukan juga minconf
Misal minconf : 75 %, aturan asosiasi yang mungkin terbentuk dapat ditunjukkan pada Tabel 7.
Tabel 7 Nilai confidence untuk Tiap Item Set
Aturan (X Y) Sup(X Y) Sup(X) Confidence
B C E 50% 50% 100%
B E C 50% 75% 66.67%
5. 71
Penerapan Data Mining untuk Strategi Promosi Pendidikan (Gunadi Widi Nurcahyo)
C E B 50% 50% 100%
A C 50% 50% 100 %
C A 50% 75% 66.67%
B C 50% 75% 66.67%
C B 50% 75% 66.67%
B E 75% 75% 100%
E B 75% 75% 100%
C E 50% 75% 66.67%
E C 50% 75% 66.67%
Proses kerja dari Algoritma Apriori dapat dilihat pada gambar 1.
Gambar 1 Rancangan Umum Penerapan Algoritma Apriori
Gambar 1 memperlihatkan rancangan umum dari sistem yang menerapkan algoritma apriori
yang akan dirancang dalam mendukung strategi promosi pendidikan pada suatu perguruan tinggi. Dalam
rancangan ini dapat digambarkan bahwa proses dimulai dari pemasukan data mahasiswa, di mana atribut
utama yang akan dianalisa adalah meliputi data asal sekolah, daerah asal, jurusan, dan waktu sekolah.
Berdasarkan data – data yang ada, kemudian akan dicari nilai support untuk masing – masing item. Hasil
pencarian dari nilai support ini kemudian akan bisa ditentukan frequent item set. Berdasarkan pada
frequent item set yang ada kemudian akan dihitung nilai confidence untuk masing – masing frequent item
set. Kemudian berdasarkan nilai support dan confidence untuk frequent item set akan dihasilkan suatu
association rule.
3.2 Hasil
Pada saat pertama kali menjalankan Perangkat Lunak Apriori ini, maka akan dijumpai tampilan
berikut ini seperti yang dapat dilihat pada Gambar 2.
Gambar 2 Tampilan Menu Utama
Menu utama pada program di atas terdiri dari menu File, Menu Data, Menu Laporan, dan Setting.
Menu File terdiri dari sub menu Log In, Log Out dan Keluar. Menu Data terdiri dari sub menu
6. 72
Mahasiswa, 1 Item set, 2 Item set, 3 Item set, dan 4 Item Set. Menu Laporan terdiri dari sub menu Nilai
Support / Confidence Total, Rule / Knowledge. Menu Setting terdiri dari sub menu Pengguna.
Terlebih dahulu diisikan data mahasiswa pada form yang sudah disediakan seperti yang diperlihatkan
pada gambar 3.
Gambar 3 Tampilan form pengisian data mahasiswa
Kemudian berdasarkan data mahasiswa yang telah diketikkan sebelumnya, maka dapat dianalisa nilai
support untuk 1 item set seperti yang terlihat pada gambar 4
Gambar 4 Nilai support untuk 1 item set
Langkah berikutnya, adalah menghitung nilai support untuk 2 item set berdasarkan frequent item set yang
telah diperoleh pada langkah 2. Seperti yang diperlihatkan pada gambar 5.
Gambar 5 Tampilan nilai support untuk 2 item set
Setelah dihitung nilai support untuk 2 item set, maka langkah selanjutnya adalah mencari nilai support
untuk 3 item set, berdasarkan frequent item set yang telah diperoleh pada langkah 3. Seperti yang
diperlihatkan pada gambar 6.
7. 73
Penerapan Data Mining untuk Strategi Promosi Pendidikan (Gunadi Widi Nurcahyo)
Gambar 6 Tampilan nilai support untuk 3 item set
Kemudian kita juga dapat melihat nilai support dan confidence masing – masing item set seperti yang
diperlihatkan pada gambar 7 dan melihat rule yang dihasilkan seperti yang diperlihatkan pada gambar 8.
Gambar 7 Nilai Support / Confidence Gambar 8 Tampilan Rule yang Dihasilkan
3. Hasil dan Diskusi
Setelah dilakukan perbandingan ternyata sistem yang dirancang dengan menggunakan algoritma
apriori dapat menghasilkan keputusan promosi yang singkat dan tepat. Karena knowledge yang dihasilkan
dapat memberikan laporan yang bermanfaat untuk bagian akademik dan pihak yayasan serta pihak –
pihak lain yang membutuhkannya. Dibandingkan dengan sistem lama maka sistem dengan menggunakan
algoritma Apriori ini mempunyai beberapa kelebihan sebagai berikut. Pada hal pengolahan Data,
penggunaan Algoritma Apriori untuk pengolahan data promosi pada perguruan tinggi dapat dilakukan
dengan lebih cepat dibandingkan dengan pengolahan data secara manual / tidak menggunakan suatu
teknik tertentu. Pada hal pencarian Informasi, penggunaan algoritma apriori membuat pencarian informasi
cepat, karena pada laporan yang didapat sudah disajikan suatu bentuk rule yang berisikan nilai support
dan confidence sehingga dapat semakin membantu dalam penentuan keputusan promosi. Pada sistem
yang lama pencarian informasi memakan waktu yang lama, karena bentuk laporan yang ada tidak memuat
data yang lengkap, dan tidak terperinci.
Dari rule yang ada dapat dijelaskan sebagai berikut: hasil pengujian dilakukan untuk mencari nilai
support dan confidence untuk masing – masing item. Dari hasil pengujian menunjukkan bahwa tidak
terdapat perbedaan antara hasil perhitungan manual dengan hasil perhitungan dengan menggunakan
perangkat lunak. Untuk memastikan apakah hasil perhitungan dengan perangkat lunak telah mendapatkan
hasil yang diinginkan maka penulis kemudian membandingkannya dengan program algoritma hasil
unduhan yang sifatnya non customized. Berdasarkan hasil perbandingan juga tidak menunjukkan adanya
perbedaan. Nilai confidence yang dicari adalah merupakan nilai confidence untuk 2 item set dan 3 item
set. Dengan adanya nilai support dan confidence maka akan dapat membantu pihak manajemen
perguruan tinggi dalam hal pengambilan keputusan di bidang promosi pendidikan. Sebagai contoh, SMA
A menjadi target promosi yang sangat potensial karena memiliki nilai minimum support yang cukup
besar yaitu 25% artinya adalah bahwa dari seluruh mahasiswa perguruan tinggi, maka 25 % nya adalah
berasal dari SMA. Bila fokus promosi mau lebih dipertajam lagi maka kita dapat melihat bahwa
8. 74
konsentrasi yang cukup dominan di SMA A adalah di bidang IPS yang memiliki nilai minimum
confidence sebesar 75%. Artinya dari keseluruhan siswa SMA A yang masuk ke suatu perguran tinggi
maka 75% nya adalah berasal dari jurusan IPS sedangkan jurusan IPA hanya mencapai 25% dari total
keseluruhan siswa SMA A yang masuk ke perguruan tinggi. Dengan adanya hasil analisis dengan
menggunakan Algoritma Apriori ini maka pihak manajemen dapat lebih memfokuskan diri pada sasaran
promosi yang paling potensial sehingga dapat lebih menghemat anggaran untuk biaya promosi.
4. Kesimpulan dan Saran
Adapun kesimpulan dari hasil penelitian adalah sebagai berikut. algoritma Apriori dapat
diterapkan untuk mendukung strategi promosi pendidikan pada Perguruan Tinggi. Informasi yang
berkaitan dengan pelaksanaan promosi dapat tersedia dengan cepat, sehingga pihak manajemen dapat
melakukan pengambilan keputusan dengan cepat. Pelaksanaan promosi pendidikan pada perguruan tinggi
sangat dibantu dengan adanya penerapan algoritma Apriori ini sehingga diharapkan efektifitas
pelaksanaan promosi pendidikan akan dapat semakin ditingkatkan. Penerapan algoritma Apriori yang
dilakukan melalui perangkat lunak yang dirancang terbukti menujukkan hasil yang sama dibandingkan
dengan melakukan perhitungan secara manual ataupun dengan perangkat lunak sejenis. Hal ini dibuktikan
melalui perhitungan nilai support dan confidence yang menunjukkan hasil yang sama. Adapun saran
dari hasil penelitian adalah sebagai berikut : algoritma apriori ini dapat diterapkan dalam proses
pelaksanaan promosi dan proses lainnya yang dapat melibatkan hubungan antar beberapa item dalam
lingkungan lainnya tidak hanya terbatas pada lembaga pendidikan saja seperti misalnya pada strategi
cross market analysis. Selanjutnya penulis juga menyarankan agar dapat membandingkan metode
pengambilan keputusan dengan menggunakan algoritma apriori ini dengan teknik yang lainnya.
Daftar Pustaka
[1] Abdallah Alashqur, “Mining Association Rule: A Database Perspective”, International Journal of
Computer Science and Network Security, Vol 8 No. 12, December 2008, Page 69 – 74, HTTP://
paper.ijcsns.org/07_book/200812/20081211.pdf
[2] David J. Hand, “Data Mining: Statistic and More?”, American Statistical Association, May 1998 Vol.
52, No. 2, Page 112 – 118, HTTP:// amscampus.cib.unibo.it/archive/00001164/01/Hand98.pdf
[3] E.W.T. Ngai, Li Xiu, dan D.C.K. Chau, “Application of Data Mining Technique in Customer
Relationship Management: A Literature Review and classification”, Journal Elsevier (2009), Page
2592 – 2602, HTTP://
163.17.12.2/.../Application%20of%20data%20mining%20techniques%20%20%20%20in%
[4] Jayanthi Ranjan (2007), “Application of Data Mining Technique in Pharmaceutical Industry”,
Journal of Theoritical and Applied Information Technology, Page 61 – 67, HTTP://
www.jatit.org/volumes/research-papers/Vol3No4/7vol3no4.pdf
[5] Kusrini (2007), “Penerapan Algoritma Apriori pada Data Mining untuk Mengelompokkan Barang
Berdasarkan Kecenderungan Kemunculan Bersama dalam Satu Transaksi”, Page 1 – 16, HTTP://
dosen.amikom.ac.id/.../Publikasi%20Apriori-Kusrini_Feb-07_.pdf
[6] Kusrini and Emha Taufiq Luthfi, “Algoritma Data Mining”, Yogyakarta: Penerbit Andi, 2009, Page
149 – 176
[7] Lamine, M.A, Nhien-An LK, and Tahar M.K, “Distributed Frequent Itemsets Mining in
Heterogenous Platforms”, Journal of Engineering, Computing, and Architecture Volume 1, Issue 2,
2007, Page 1 – 12, HTTP:// www.scientificjournals.org/journals2007/articles/1239.pdf
[8] Sarjon D. and Mohd Noor MD Sap (2001), “Mining Association Rule From Large Databases”, Jurnal
Tekologi Maklumat Jilid 13, Bil. 2, page 16 – 37, HTTP://
eprints.utm.my/8764/1/MohdNoorMdSap2001_MiningAssociationRuleFromLarge.pdf
[9] U. Fayyad, Gregory P.S, and P. Smyth, “From Data Mining to Knowledge Discovery in Database”,
American Association for Artificial Intelligence (1996), Page 37 – 54,
HTTP://citeseer.ist.psu.edu/283224.html
[10]Yudho Giri Sucahyo (2003), “Pengantar Data Mining”, IlmuKomputer.Com,
HTTP://ilmukomputer.com/2008/11/25 mengenal-data-mining/