SlideShare a Scribd company logo
TUGAS DATA MINING 
Algoritma Covering dan Penerapannya 
Khairul Sani ( 13/359750/PTK/9462) 
Syamsul Mujahidin (13/359465/PTK/9440) 
S2 Teknologi Informasi 
Teknik Elektro dan Teknologi Informasi 
Universitas Gadjah Mada 
Dalam teknik klasifikasi ada banyak pendekatan yang dapat dilakukan, antara lain separate and conquer, divide and conquer, dan covering and statistical. Algoritma covering memiliki karakteristik yaitu mepertimbangkan hubungan antara nilai atribut dan spesifikasi klasifikasinya. Algoritma ini akan mengklasifikasi data berdasarkan nilai maksimal dari tiap kemungkinan nilai atribut. Nilai maksimal antribut didapat dari banyak data dalam tiap katagori dibagi dengan banyak data keseluruhan. Prolehan nilai maksimal dari tiap atribut kemudian akan dikombinasikan. Hasil yang didapatkan berupa kumpulan aturan-aturan dari atribut yang diproses. 
Algortima ini digunakan karena memiliki tingkat akurasi yang bagus, daya belajar yang cepat, kapasitas dalam hal proses data secara masif, dan kemudahan dalam menganalisis aturan-aturan yang dibentuk sehingga sering digunakan untuk menangani kasus tertentu. Salah satu bentuk penerapan dari algoritma covering adalah penangan pada masalah klasifikasi teks. Klasifikasi teks merupakan kegiatan mengurutkan kumpulan dokumen secara otomatis ke dalam kategori yang sudah didefinisikan. Dalam hal ini metode yang biasa digunakan adalah metode machine learning dan statistical learning. Metode tersebut memiliki keunggulan efektif dalam menangani noise data. Namun demikian, algoritma ini masih lemah dalam hal pembentukan aturan-aturan yang kuat dari domain pengetahuan sehingga digunakanlah algoritma covering untuk mengatasi masalah tersebut. 
Prosedur dari algoritma covering untuk mengatasi masalah klasifikasi teks adalah ekstrasi dari sejumlah prase yang akan menjadi calon aturan. Kemudian
melakukan klasifikasi terhadap prase tersebut, apakah masuk dalam sempel positif atau negatif. Sempel positif akan dimaksukkan dalam data latihan, sementara negatif sempel akan dibuang. Masing - masing data training (prase) akan dihitung frekuensi kenampakannya dalam dokumen kemudian dibagi dengan jumlah dokumen yang ada. Nilai maksimum dari perhitungan tersebut akan digunakan sebagai dasar untuk membentu aturan - aturan. Aturan – aturan tersebut nantinya akan digunakan untuk klasifikasi teks pada data yang baru. 
Pada jurnal lainnya yang berjudul Cross Covering Algorithm Based on Simulated Annealing mendeskripsikan terkait algoritma untuk untuk optimisasi yang bersifat generic. Simulated annealing (SA) adalah salah satu algoritma untuk untuk optimisasi yang bersifat generik. Berbasiskan probabilitas dan mekanika statistik, algoritma ini dapat digunakan untuk mencari pendekatan terhadap solusi optimum global dari suatu permasalahan. Masalah yang membutuhkan pendekatan SA adalah masalah-masalah optimisasi kombinatorial, di mana ruang pencarian solusi yang ada terlalu besar, sehingga hampir tidak mungkin ditemukan solusi eksak terhadap permasalahan itu. Publikasi tentang pendekatan ini pertama kali dilakukan oleh S. Kirkpatrick, C. D. Gelatt dan M. P. Vecchi, diaplikasikan pada desain optimal hardware komputer, dan juga pada salah satu masalah klasik ilmu komputer yaitu Traveling Salesman Problem. Annealing adalah satu teknik yang dikenal dalam bidang metalurgi, digunakan dalam mempelajari proses pembentukan kristal dalam suatu materi. Agar dapat terbentuk susunan kristal yang sempurna, diperlukan pemanasan sampai suatu tingkat tertentu, kemudian dilanjutkan dengan pendinginan yang perlahan-lahan dan terkendali dari materi tersebut. Pemanasan materi di awal proses annealing, memberikan kesempatan pada atom-atom dalam materi itu untuk bergerak secara bebas, mengingat tingkat energi dalam kondisi panas ini cukup tinggi. Proses pendinginan yang perlahan-lahan memungkinkan atom-atom yang tadinya bergerak bebas itu, pada akhirnya menemukan tempat yang optimum, di mana energi internal
yang dibutuhkan atom itu untuk mempertahankan posisinya adalah minimum, Metropolis et al. pada tahun 1953. 
Profesor Zhang menyatakan bahwa arti geometri M-Ps neuron, dan menunjukkan bahwa tiga lapis saraf pada jaringan untuk membangun classifier yang sama dengan mencari dan mengumpulkan domain yang mampu untuk dipartisi dari berbagai jenis masukan seperti vektor, dan disediakan covering algoritma yang lebih lanjut: Inti dari covering algoritma adalah menggunakan covering domain sebagai lapisan tersembunyi dari tiga lapisan jaringan saraf, yang diinput pada lapisan sampel set, hasil output berdasarkan hasil klasifikasi. Oleh karena itu, keutamaan dari covering algoritma adalah untuk membangun covering cluster. Adapun konsep dari covering model sebagai berikut : 
Pada penelitian tersebut menggunakan suatu algoritma covering karena memiliki kecepatan lebih rendah, dengan kompleksitas lebih rendah, tetapi dengan presisi yang tinggi. Tetapi pada construction berat pusat neuron biasanya domainnya memiliki kriteria sendiri, dan tidak dapat mengikuti distribusi sample untuk mencapai solusi yang omptimal. Pada penelitian tersebut membuat suatu algoritma baru menggabungkan antara cross covering algorithm dan penyajian dalam simulated annealing. Pada tahapan ini didapat pusat covering berdasarkan pencarian teori simulasi annealing. Hasil penelitian ini menampilkan algoritma dapat mengurangi jumlah dari covering dengan pengenalan akurasi yang lebih tinggi.
Pada penelitian ini untuk mengevaluasi kinerja algortima, mengambil empat data set dari University of california untuk repository mechine learning yang diterapkan. 
Dalam simulasi komputer, semua nilai atribut dalam set data linear berubah menjadi interval satuan. Dengan demikian, kita dapat menangani setiap set data sebagai masalah klasifikasi pola dalam n-dimensi satuan kubus [0,1] n. Pada exsperiment ini menggunakan sepuluh kali lipat crossvalidation (10-CV) teknik untuk setiap data set 10 kali, dengan menggunakan partisi yang berbeda dari kumpulan data. Dalam 10-CV, kumpulan data dibagi menjadi 10 subset dari ukuran yang sama. Sembilan subset digunakan sebagai pola pelatihan, dan bagian lainnya digunakan sebagai pola uji. Hasilnya ditunjukkan pada Gambar dibawah. Akurasi pengenalan pada Gambar dibawah ini menunjukan rata-rata dari sepuluh kali pelatihan dan pengujian. 
Hal ini dapat dilihat dari Gambar tersebut bahwa akurasi pengenalan rata-rata Sacca jelas lebih baik daripada CCA dan LIBSVM. Terutama pada dataset Kaca, kinerja Sacca ditingkatkan 9.55 poin persentase dari CCA, dan 10.91 persen dibanding classifier LIBSVM terkenal. Ini menunjukkan bahwa dengan titik yang mendapatkan dari penelusuran dari teori simulated annealing untuk pusat meliputi bisa memberikan perintah yang lebih baik untuk studi sampel, dan membuat pusat sampel keterwakilan sehingga domain meliputi dapat mencakup informasi lebih lanjut tentang predikasi. Pada penelitian mendapatkan kesimpulan dari data publik
hanya set, pada percobaan berikutnya, kita akan membuktikan algoritma praktis meskipun memilih data yang memiliki nilai lebih praktis. Dengan menggunakan data, kita akan menunjukkan keuntungan dari Sacca dalam aplikasi praktis. 
Gambar : results for LIBSVM, CCA and SACCA 
Kesimpulan: 
Dalam jurnal tersebut, konstruktif algoritma, cross covering algoritma dan berdasarkan simulasi annealing (Sacca) menunjukkan, hasil pada beberapa UCI database dan teks kategorisasi menunjukkan bahwa Sacca adalah performas yang bagus untuk classifier. Dapat digunakan simulasi annealing algoritma untuk mencari pusat covering, secara efektif dapat meningkatkan daerah covering serta mengurangi jumlah covering. 
Algoritma ini mengurangi kompleksitas dan meningkatkan kemampuan generalisasi dan menjaga kinerja pada tingkat tinggi. Penelitian tersebut dapat digunakan pada search enggine untuk melakukan penelitian serta pengembangan pada masa depan.
Referensi : 
[1] Cheng-Gang He, Yan-ping Zhang, Hui Sun, and Jin-Wei Gen, “A Novel Regression Method Research Based on Covering Algorithm,” Intell. Inf. Process. Trust. Comput. IPTC 2010 Int. Symp. On, pp. 41–44, Oct. 2010. 
[2] Jin-Hong Liu and Yu-Liang Lu, “Strong Rules Learning Algorithm for Ensemble Text Classification,” Mach. Learn. Cybern. 2007 Int. Conf. On, vol. 6, pp. 3601– 3606, Aug. 2007. 
[3] Zhang Yanping , Liu Chao,"Cross covering algoritma based on Simulated annealing," School of Computer Science and Technology, Anhui University, Hefei, China,2010.

More Related Content

Similar to Data mining algoritma covering dan penerapannya

PPT-Wildan Nadiyal Ahsan Thesis Python Graph.pptx
PPT-Wildan Nadiyal Ahsan Thesis Python Graph.pptxPPT-Wildan Nadiyal Ahsan Thesis Python Graph.pptx
PPT-Wildan Nadiyal Ahsan Thesis Python Graph.pptx
20206052011
 
Jawaban No. 2 Tahap-Tahap Data Mining Karena DM adalah suatu ...
Jawaban No. 2 Tahap-Tahap Data Mining Karena  DM adalah suatu ...Jawaban No. 2 Tahap-Tahap Data Mining Karena  DM adalah suatu ...
Jawaban No. 2 Tahap-Tahap Data Mining Karena DM adalah suatu ...butest
 
Pertemuan 4.pdf
Pertemuan 4.pdfPertemuan 4.pdf
Pertemuan 4.pdf
HasanulFahmi2
 
DATA MINING : RSITEKTUR & MODEL DATA MINING
DATA MINING : RSITEKTUR & MODEL DATA MININGDATA MINING : RSITEKTUR & MODEL DATA MINING
DATA MINING : RSITEKTUR & MODEL DATA MINING
YudaPerwira5
 
PTLF PPT.pptx
PTLF PPT.pptxPTLF PPT.pptx
PTLF PPT.pptx
MuhammadTaslim19
 
Modul klasifikasi decission tree modul klasifikasi
Modul klasifikasi decission tree modul klasifikasiModul klasifikasi decission tree modul klasifikasi
Modul klasifikasi decission tree modul klasifikasi
Universitas Bina Darma Palembang
 
MAKALAH TENTANG ALGORITMA GENETIKA
MAKALAH TENTANG ALGORITMA GENETIKAMAKALAH TENTANG ALGORITMA GENETIKA
MAKALAH TENTANG ALGORITMA GENETIKA
ImanSihaloho
 
Makalah Algoritma DAA 1
Makalah Algoritma DAA 1Makalah Algoritma DAA 1
Makalah Algoritma DAA 1
asep lufian
 
Pengantar komputasi modern: tugas 2
Pengantar komputasi modern: tugas 2Pengantar komputasi modern: tugas 2
Pengantar komputasi modern: tugas 2
Ajeng Jan
 
perbandingan analisis data mining klasifikasi sentiment berita indonesia
perbandingan analisis data mining klasifikasi sentiment berita indonesiaperbandingan analisis data mining klasifikasi sentiment berita indonesia
perbandingan analisis data mining klasifikasi sentiment berita indonesia
BoyMorenaAllzytoroto
 
Ppt sidang 4 september 2017 sesi 2 nita tri andini
Ppt sidang 4 september 2017 sesi 2 nita tri andiniPpt sidang 4 september 2017 sesi 2 nita tri andini
Ppt sidang 4 september 2017 sesi 2 nita tri andini
Nita NTD
 
Procceding_KNIT_2_97-102_AndikaDwiHadiri
Procceding_KNIT_2_97-102_AndikaDwiHadiriProcceding_KNIT_2_97-102_AndikaDwiHadiri
Procceding_KNIT_2_97-102_AndikaDwiHadiriAndika Dwi Hadiri
 
Modul praktikum 3 cluster
Modul praktikum 3   clusterModul praktikum 3   cluster
Modul praktikum 3 clusterDeiHart DeiHart
 
Jurnal metode clustering dengan algoritma fuzzy c means untuk rekomendasi pem...
Jurnal metode clustering dengan algoritma fuzzy c means untuk rekomendasi pem...Jurnal metode clustering dengan algoritma fuzzy c means untuk rekomendasi pem...
Jurnal metode clustering dengan algoritma fuzzy c means untuk rekomendasi pem...
ym.ygrex@comp
 
Tugas 1 dm1
Tugas 1 dm1Tugas 1 dm1
A152 prediksi-nasabah-potensial-menggunakan-metode-klasifikasi-pohon-biner
A152 prediksi-nasabah-potensial-menggunakan-metode-klasifikasi-pohon-binerA152 prediksi-nasabah-potensial-menggunakan-metode-klasifikasi-pohon-biner
A152 prediksi-nasabah-potensial-menggunakan-metode-klasifikasi-pohon-biner
Epul Logariasmoú
 
1.Pendahuluan PO_1.ppt
1.Pendahuluan PO_1.ppt1.Pendahuluan PO_1.ppt
1.Pendahuluan PO_1.ppt
BagusSugiarto11
 
04-cara-pemakaian-weka.ppt
04-cara-pemakaian-weka.ppt04-cara-pemakaian-weka.ppt
04-cara-pemakaian-weka.ppt
Putrifitriasari1
 
Tutorial WEKA.ppt
Tutorial WEKA.pptTutorial WEKA.ppt
Tutorial WEKA.ppt
JurnalJTIM
 
Presentasi Pemakaian WEKA pada Data Mining
Presentasi Pemakaian WEKA pada Data MiningPresentasi Pemakaian WEKA pada Data Mining
Presentasi Pemakaian WEKA pada Data Mining
MatlubulKhairi
 

Similar to Data mining algoritma covering dan penerapannya (20)

PPT-Wildan Nadiyal Ahsan Thesis Python Graph.pptx
PPT-Wildan Nadiyal Ahsan Thesis Python Graph.pptxPPT-Wildan Nadiyal Ahsan Thesis Python Graph.pptx
PPT-Wildan Nadiyal Ahsan Thesis Python Graph.pptx
 
Jawaban No. 2 Tahap-Tahap Data Mining Karena DM adalah suatu ...
Jawaban No. 2 Tahap-Tahap Data Mining Karena  DM adalah suatu ...Jawaban No. 2 Tahap-Tahap Data Mining Karena  DM adalah suatu ...
Jawaban No. 2 Tahap-Tahap Data Mining Karena DM adalah suatu ...
 
Pertemuan 4.pdf
Pertemuan 4.pdfPertemuan 4.pdf
Pertemuan 4.pdf
 
DATA MINING : RSITEKTUR & MODEL DATA MINING
DATA MINING : RSITEKTUR & MODEL DATA MININGDATA MINING : RSITEKTUR & MODEL DATA MINING
DATA MINING : RSITEKTUR & MODEL DATA MINING
 
PTLF PPT.pptx
PTLF PPT.pptxPTLF PPT.pptx
PTLF PPT.pptx
 
Modul klasifikasi decission tree modul klasifikasi
Modul klasifikasi decission tree modul klasifikasiModul klasifikasi decission tree modul klasifikasi
Modul klasifikasi decission tree modul klasifikasi
 
MAKALAH TENTANG ALGORITMA GENETIKA
MAKALAH TENTANG ALGORITMA GENETIKAMAKALAH TENTANG ALGORITMA GENETIKA
MAKALAH TENTANG ALGORITMA GENETIKA
 
Makalah Algoritma DAA 1
Makalah Algoritma DAA 1Makalah Algoritma DAA 1
Makalah Algoritma DAA 1
 
Pengantar komputasi modern: tugas 2
Pengantar komputasi modern: tugas 2Pengantar komputasi modern: tugas 2
Pengantar komputasi modern: tugas 2
 
perbandingan analisis data mining klasifikasi sentiment berita indonesia
perbandingan analisis data mining klasifikasi sentiment berita indonesiaperbandingan analisis data mining klasifikasi sentiment berita indonesia
perbandingan analisis data mining klasifikasi sentiment berita indonesia
 
Ppt sidang 4 september 2017 sesi 2 nita tri andini
Ppt sidang 4 september 2017 sesi 2 nita tri andiniPpt sidang 4 september 2017 sesi 2 nita tri andini
Ppt sidang 4 september 2017 sesi 2 nita tri andini
 
Procceding_KNIT_2_97-102_AndikaDwiHadiri
Procceding_KNIT_2_97-102_AndikaDwiHadiriProcceding_KNIT_2_97-102_AndikaDwiHadiri
Procceding_KNIT_2_97-102_AndikaDwiHadiri
 
Modul praktikum 3 cluster
Modul praktikum 3   clusterModul praktikum 3   cluster
Modul praktikum 3 cluster
 
Jurnal metode clustering dengan algoritma fuzzy c means untuk rekomendasi pem...
Jurnal metode clustering dengan algoritma fuzzy c means untuk rekomendasi pem...Jurnal metode clustering dengan algoritma fuzzy c means untuk rekomendasi pem...
Jurnal metode clustering dengan algoritma fuzzy c means untuk rekomendasi pem...
 
Tugas 1 dm1
Tugas 1 dm1Tugas 1 dm1
Tugas 1 dm1
 
A152 prediksi-nasabah-potensial-menggunakan-metode-klasifikasi-pohon-biner
A152 prediksi-nasabah-potensial-menggunakan-metode-klasifikasi-pohon-binerA152 prediksi-nasabah-potensial-menggunakan-metode-klasifikasi-pohon-biner
A152 prediksi-nasabah-potensial-menggunakan-metode-klasifikasi-pohon-biner
 
1.Pendahuluan PO_1.ppt
1.Pendahuluan PO_1.ppt1.Pendahuluan PO_1.ppt
1.Pendahuluan PO_1.ppt
 
04-cara-pemakaian-weka.ppt
04-cara-pemakaian-weka.ppt04-cara-pemakaian-weka.ppt
04-cara-pemakaian-weka.ppt
 
Tutorial WEKA.ppt
Tutorial WEKA.pptTutorial WEKA.ppt
Tutorial WEKA.ppt
 
Presentasi Pemakaian WEKA pada Data Mining
Presentasi Pemakaian WEKA pada Data MiningPresentasi Pemakaian WEKA pada Data Mining
Presentasi Pemakaian WEKA pada Data Mining
 

More from Universitas Gadjah Mada

Jaringan Komputer - Analisis PDU
Jaringan Komputer - Analisis PDUJaringan Komputer - Analisis PDU
Jaringan Komputer - Analisis PDU
Universitas Gadjah Mada
 
Perkembangan Piranti Multimedia
Perkembangan Piranti MultimediaPerkembangan Piranti Multimedia
Perkembangan Piranti Multimedia
Universitas Gadjah Mada
 
Audit fraud and corruption
Audit   fraud and corruptionAudit   fraud and corruption
Audit fraud and corruption
Universitas Gadjah Mada
 
Information system in bussines today
Information system in bussines todayInformation system in bussines today
Information system in bussines today
Universitas Gadjah Mada
 
Tugas switching khairul sani
Tugas switching khairul saniTugas switching khairul sani
Tugas switching khairul sani
Universitas Gadjah Mada
 
Tugas 1 data mining publish
Tugas 1 data mining publishTugas 1 data mining publish
Tugas 1 data mining publish
Universitas Gadjah Mada
 

More from Universitas Gadjah Mada (6)

Jaringan Komputer - Analisis PDU
Jaringan Komputer - Analisis PDUJaringan Komputer - Analisis PDU
Jaringan Komputer - Analisis PDU
 
Perkembangan Piranti Multimedia
Perkembangan Piranti MultimediaPerkembangan Piranti Multimedia
Perkembangan Piranti Multimedia
 
Audit fraud and corruption
Audit   fraud and corruptionAudit   fraud and corruption
Audit fraud and corruption
 
Information system in bussines today
Information system in bussines todayInformation system in bussines today
Information system in bussines today
 
Tugas switching khairul sani
Tugas switching khairul saniTugas switching khairul sani
Tugas switching khairul sani
 
Tugas 1 data mining publish
Tugas 1 data mining publishTugas 1 data mining publish
Tugas 1 data mining publish
 

Recently uploaded

INSTRUMEN PENILAIAN PRAKTIK KINERJA KS Dok Rating Observasi (1).docx
INSTRUMEN PENILAIAN PRAKTIK KINERJA KS Dok Rating Observasi (1).docxINSTRUMEN PENILAIAN PRAKTIK KINERJA KS Dok Rating Observasi (1).docx
INSTRUMEN PENILAIAN PRAKTIK KINERJA KS Dok Rating Observasi (1).docx
lindaagina84
 
ppt profesionalisasi pendidikan Pai 9.pdf
ppt profesionalisasi pendidikan Pai 9.pdfppt profesionalisasi pendidikan Pai 9.pdf
ppt profesionalisasi pendidikan Pai 9.pdf
Nur afiyah
 
Form B1 Rubrik Observasi Presentasi Visi Misi -1.docx
Form B1 Rubrik Observasi Presentasi Visi Misi -1.docxForm B1 Rubrik Observasi Presentasi Visi Misi -1.docx
Form B1 Rubrik Observasi Presentasi Visi Misi -1.docx
EkoPutuKromo
 
PENGUMUMAN PPDB SMPN 4 PONOROGO TAHUN 2024.pdf
PENGUMUMAN PPDB SMPN 4 PONOROGO TAHUN 2024.pdfPENGUMUMAN PPDB SMPN 4 PONOROGO TAHUN 2024.pdf
PENGUMUMAN PPDB SMPN 4 PONOROGO TAHUN 2024.pdf
smp4prg
 
SOAL SHB PKN SEMESTER GENAP TAHUN 2023-2024.docx
SOAL SHB PKN SEMESTER GENAP TAHUN 2023-2024.docxSOAL SHB PKN SEMESTER GENAP TAHUN 2023-2024.docx
SOAL SHB PKN SEMESTER GENAP TAHUN 2023-2024.docx
MuhammadBagusAprilia1
 
PPT LANDASAN PENDIDIKAN.pptx tentang hubungan sekolah dengan masyarakat
PPT LANDASAN PENDIDIKAN.pptx tentang hubungan sekolah dengan masyarakatPPT LANDASAN PENDIDIKAN.pptx tentang hubungan sekolah dengan masyarakat
PPT LANDASAN PENDIDIKAN.pptx tentang hubungan sekolah dengan masyarakat
jodikurniawan341
 
MATERI SOSIALISASI PPDB JABAR- 4PAN052024.pdf
MATERI SOSIALISASI PPDB JABAR- 4PAN052024.pdfMATERI SOSIALISASI PPDB JABAR- 4PAN052024.pdf
MATERI SOSIALISASI PPDB JABAR- 4PAN052024.pdf
ssuser289c2f1
 
INDIKATOR KINERJA DAN FOKUS PERILAKU KS.pdf
INDIKATOR KINERJA DAN FOKUS PERILAKU KS.pdfINDIKATOR KINERJA DAN FOKUS PERILAKU KS.pdf
INDIKATOR KINERJA DAN FOKUS PERILAKU KS.pdf
NurSriWidyastuti1
 
Bab 3 Sejarah Kerajaan Hindu-Buddha.pptx
Bab 3 Sejarah Kerajaan Hindu-Buddha.pptxBab 3 Sejarah Kerajaan Hindu-Buddha.pptx
Bab 3 Sejarah Kerajaan Hindu-Buddha.pptx
nawasenamerta
 
Modul Ajar Bahasa Inggris Kelas 5 Fase C Kurikulum Merdeka
Modul Ajar Bahasa Inggris Kelas 5 Fase C Kurikulum MerdekaModul Ajar Bahasa Inggris Kelas 5 Fase C Kurikulum Merdeka
Modul Ajar Bahasa Inggris Kelas 5 Fase C Kurikulum Merdeka
Fathan Emran
 
PI 2 - Ratna Haryanti, S. Pd..pptx Visi misi dan prakarsa perubahan pendidika...
PI 2 - Ratna Haryanti, S. Pd..pptx Visi misi dan prakarsa perubahan pendidika...PI 2 - Ratna Haryanti, S. Pd..pptx Visi misi dan prakarsa perubahan pendidika...
PI 2 - Ratna Haryanti, S. Pd..pptx Visi misi dan prakarsa perubahan pendidika...
agusmulyadi08
 
Modul Ajar PAI dan Budi Pekerti Kelas 2 Fase A Kurikulum Merdeka
Modul Ajar PAI dan Budi Pekerti Kelas 2 Fase A Kurikulum MerdekaModul Ajar PAI dan Budi Pekerti Kelas 2 Fase A Kurikulum Merdeka
Modul Ajar PAI dan Budi Pekerti Kelas 2 Fase A Kurikulum Merdeka
Fathan Emran
 
Laporan Piket Guru untuk bukti dukung PMM.pdf
Laporan Piket Guru untuk bukti dukung PMM.pdfLaporan Piket Guru untuk bukti dukung PMM.pdf
Laporan Piket Guru untuk bukti dukung PMM.pdf
gloriosaesy
 
VISI MISI KOMUNITAS BELAJAR SDN 93 KOTA JAMBI
VISI MISI KOMUNITAS BELAJAR SDN 93 KOTA JAMBIVISI MISI KOMUNITAS BELAJAR SDN 93 KOTA JAMBI
VISI MISI KOMUNITAS BELAJAR SDN 93 KOTA JAMBI
gloriosaesy
 
SEMINAR PPG DAN PPL ppg prajabatan 2024.pptx
SEMINAR PPG DAN PPL ppg prajabatan 2024.pptxSEMINAR PPG DAN PPL ppg prajabatan 2024.pptx
SEMINAR PPG DAN PPL ppg prajabatan 2024.pptx
bobobodo693
 
LAPORAN TUGAS TAMBAHAN PEMBINA PRAMUKA..
LAPORAN TUGAS TAMBAHAN PEMBINA PRAMUKA..LAPORAN TUGAS TAMBAHAN PEMBINA PRAMUKA..
LAPORAN TUGAS TAMBAHAN PEMBINA PRAMUKA..
widyakusuma99
 
Paparan Kurikulum Satuan Pendidikan_LOKAKARYA TPK 2024.pptx.pdf
Paparan Kurikulum Satuan Pendidikan_LOKAKARYA TPK 2024.pptx.pdfPaparan Kurikulum Satuan Pendidikan_LOKAKARYA TPK 2024.pptx.pdf
Paparan Kurikulum Satuan Pendidikan_LOKAKARYA TPK 2024.pptx.pdf
SEMUELSAMBOKARAENG
 
LAPORAN EKSTRAKURIKULER SEKOLAH DASAR NEGERI
LAPORAN EKSTRAKURIKULER SEKOLAH DASAR NEGERILAPORAN EKSTRAKURIKULER SEKOLAH DASAR NEGERI
LAPORAN EKSTRAKURIKULER SEKOLAH DASAR NEGERI
PURWANTOSDNWATES2
 
ppt landasan pendidikan pai 9 revisi.pdf
ppt landasan pendidikan pai 9 revisi.pdfppt landasan pendidikan pai 9 revisi.pdf
ppt landasan pendidikan pai 9 revisi.pdf
setiatinambunan
 
LK 1 - 5T Keputusan Berdampak PERMATA BUNDA.pdf
LK 1 - 5T Keputusan Berdampak PERMATA BUNDA.pdfLK 1 - 5T Keputusan Berdampak PERMATA BUNDA.pdf
LK 1 - 5T Keputusan Berdampak PERMATA BUNDA.pdf
UditGheozi2
 

Recently uploaded (20)

INSTRUMEN PENILAIAN PRAKTIK KINERJA KS Dok Rating Observasi (1).docx
INSTRUMEN PENILAIAN PRAKTIK KINERJA KS Dok Rating Observasi (1).docxINSTRUMEN PENILAIAN PRAKTIK KINERJA KS Dok Rating Observasi (1).docx
INSTRUMEN PENILAIAN PRAKTIK KINERJA KS Dok Rating Observasi (1).docx
 
ppt profesionalisasi pendidikan Pai 9.pdf
ppt profesionalisasi pendidikan Pai 9.pdfppt profesionalisasi pendidikan Pai 9.pdf
ppt profesionalisasi pendidikan Pai 9.pdf
 
Form B1 Rubrik Observasi Presentasi Visi Misi -1.docx
Form B1 Rubrik Observasi Presentasi Visi Misi -1.docxForm B1 Rubrik Observasi Presentasi Visi Misi -1.docx
Form B1 Rubrik Observasi Presentasi Visi Misi -1.docx
 
PENGUMUMAN PPDB SMPN 4 PONOROGO TAHUN 2024.pdf
PENGUMUMAN PPDB SMPN 4 PONOROGO TAHUN 2024.pdfPENGUMUMAN PPDB SMPN 4 PONOROGO TAHUN 2024.pdf
PENGUMUMAN PPDB SMPN 4 PONOROGO TAHUN 2024.pdf
 
SOAL SHB PKN SEMESTER GENAP TAHUN 2023-2024.docx
SOAL SHB PKN SEMESTER GENAP TAHUN 2023-2024.docxSOAL SHB PKN SEMESTER GENAP TAHUN 2023-2024.docx
SOAL SHB PKN SEMESTER GENAP TAHUN 2023-2024.docx
 
PPT LANDASAN PENDIDIKAN.pptx tentang hubungan sekolah dengan masyarakat
PPT LANDASAN PENDIDIKAN.pptx tentang hubungan sekolah dengan masyarakatPPT LANDASAN PENDIDIKAN.pptx tentang hubungan sekolah dengan masyarakat
PPT LANDASAN PENDIDIKAN.pptx tentang hubungan sekolah dengan masyarakat
 
MATERI SOSIALISASI PPDB JABAR- 4PAN052024.pdf
MATERI SOSIALISASI PPDB JABAR- 4PAN052024.pdfMATERI SOSIALISASI PPDB JABAR- 4PAN052024.pdf
MATERI SOSIALISASI PPDB JABAR- 4PAN052024.pdf
 
INDIKATOR KINERJA DAN FOKUS PERILAKU KS.pdf
INDIKATOR KINERJA DAN FOKUS PERILAKU KS.pdfINDIKATOR KINERJA DAN FOKUS PERILAKU KS.pdf
INDIKATOR KINERJA DAN FOKUS PERILAKU KS.pdf
 
Bab 3 Sejarah Kerajaan Hindu-Buddha.pptx
Bab 3 Sejarah Kerajaan Hindu-Buddha.pptxBab 3 Sejarah Kerajaan Hindu-Buddha.pptx
Bab 3 Sejarah Kerajaan Hindu-Buddha.pptx
 
Modul Ajar Bahasa Inggris Kelas 5 Fase C Kurikulum Merdeka
Modul Ajar Bahasa Inggris Kelas 5 Fase C Kurikulum MerdekaModul Ajar Bahasa Inggris Kelas 5 Fase C Kurikulum Merdeka
Modul Ajar Bahasa Inggris Kelas 5 Fase C Kurikulum Merdeka
 
PI 2 - Ratna Haryanti, S. Pd..pptx Visi misi dan prakarsa perubahan pendidika...
PI 2 - Ratna Haryanti, S. Pd..pptx Visi misi dan prakarsa perubahan pendidika...PI 2 - Ratna Haryanti, S. Pd..pptx Visi misi dan prakarsa perubahan pendidika...
PI 2 - Ratna Haryanti, S. Pd..pptx Visi misi dan prakarsa perubahan pendidika...
 
Modul Ajar PAI dan Budi Pekerti Kelas 2 Fase A Kurikulum Merdeka
Modul Ajar PAI dan Budi Pekerti Kelas 2 Fase A Kurikulum MerdekaModul Ajar PAI dan Budi Pekerti Kelas 2 Fase A Kurikulum Merdeka
Modul Ajar PAI dan Budi Pekerti Kelas 2 Fase A Kurikulum Merdeka
 
Laporan Piket Guru untuk bukti dukung PMM.pdf
Laporan Piket Guru untuk bukti dukung PMM.pdfLaporan Piket Guru untuk bukti dukung PMM.pdf
Laporan Piket Guru untuk bukti dukung PMM.pdf
 
VISI MISI KOMUNITAS BELAJAR SDN 93 KOTA JAMBI
VISI MISI KOMUNITAS BELAJAR SDN 93 KOTA JAMBIVISI MISI KOMUNITAS BELAJAR SDN 93 KOTA JAMBI
VISI MISI KOMUNITAS BELAJAR SDN 93 KOTA JAMBI
 
SEMINAR PPG DAN PPL ppg prajabatan 2024.pptx
SEMINAR PPG DAN PPL ppg prajabatan 2024.pptxSEMINAR PPG DAN PPL ppg prajabatan 2024.pptx
SEMINAR PPG DAN PPL ppg prajabatan 2024.pptx
 
LAPORAN TUGAS TAMBAHAN PEMBINA PRAMUKA..
LAPORAN TUGAS TAMBAHAN PEMBINA PRAMUKA..LAPORAN TUGAS TAMBAHAN PEMBINA PRAMUKA..
LAPORAN TUGAS TAMBAHAN PEMBINA PRAMUKA..
 
Paparan Kurikulum Satuan Pendidikan_LOKAKARYA TPK 2024.pptx.pdf
Paparan Kurikulum Satuan Pendidikan_LOKAKARYA TPK 2024.pptx.pdfPaparan Kurikulum Satuan Pendidikan_LOKAKARYA TPK 2024.pptx.pdf
Paparan Kurikulum Satuan Pendidikan_LOKAKARYA TPK 2024.pptx.pdf
 
LAPORAN EKSTRAKURIKULER SEKOLAH DASAR NEGERI
LAPORAN EKSTRAKURIKULER SEKOLAH DASAR NEGERILAPORAN EKSTRAKURIKULER SEKOLAH DASAR NEGERI
LAPORAN EKSTRAKURIKULER SEKOLAH DASAR NEGERI
 
ppt landasan pendidikan pai 9 revisi.pdf
ppt landasan pendidikan pai 9 revisi.pdfppt landasan pendidikan pai 9 revisi.pdf
ppt landasan pendidikan pai 9 revisi.pdf
 
LK 1 - 5T Keputusan Berdampak PERMATA BUNDA.pdf
LK 1 - 5T Keputusan Berdampak PERMATA BUNDA.pdfLK 1 - 5T Keputusan Berdampak PERMATA BUNDA.pdf
LK 1 - 5T Keputusan Berdampak PERMATA BUNDA.pdf
 

Data mining algoritma covering dan penerapannya

  • 1. TUGAS DATA MINING Algoritma Covering dan Penerapannya Khairul Sani ( 13/359750/PTK/9462) Syamsul Mujahidin (13/359465/PTK/9440) S2 Teknologi Informasi Teknik Elektro dan Teknologi Informasi Universitas Gadjah Mada Dalam teknik klasifikasi ada banyak pendekatan yang dapat dilakukan, antara lain separate and conquer, divide and conquer, dan covering and statistical. Algoritma covering memiliki karakteristik yaitu mepertimbangkan hubungan antara nilai atribut dan spesifikasi klasifikasinya. Algoritma ini akan mengklasifikasi data berdasarkan nilai maksimal dari tiap kemungkinan nilai atribut. Nilai maksimal antribut didapat dari banyak data dalam tiap katagori dibagi dengan banyak data keseluruhan. Prolehan nilai maksimal dari tiap atribut kemudian akan dikombinasikan. Hasil yang didapatkan berupa kumpulan aturan-aturan dari atribut yang diproses. Algortima ini digunakan karena memiliki tingkat akurasi yang bagus, daya belajar yang cepat, kapasitas dalam hal proses data secara masif, dan kemudahan dalam menganalisis aturan-aturan yang dibentuk sehingga sering digunakan untuk menangani kasus tertentu. Salah satu bentuk penerapan dari algoritma covering adalah penangan pada masalah klasifikasi teks. Klasifikasi teks merupakan kegiatan mengurutkan kumpulan dokumen secara otomatis ke dalam kategori yang sudah didefinisikan. Dalam hal ini metode yang biasa digunakan adalah metode machine learning dan statistical learning. Metode tersebut memiliki keunggulan efektif dalam menangani noise data. Namun demikian, algoritma ini masih lemah dalam hal pembentukan aturan-aturan yang kuat dari domain pengetahuan sehingga digunakanlah algoritma covering untuk mengatasi masalah tersebut. Prosedur dari algoritma covering untuk mengatasi masalah klasifikasi teks adalah ekstrasi dari sejumlah prase yang akan menjadi calon aturan. Kemudian
  • 2. melakukan klasifikasi terhadap prase tersebut, apakah masuk dalam sempel positif atau negatif. Sempel positif akan dimaksukkan dalam data latihan, sementara negatif sempel akan dibuang. Masing - masing data training (prase) akan dihitung frekuensi kenampakannya dalam dokumen kemudian dibagi dengan jumlah dokumen yang ada. Nilai maksimum dari perhitungan tersebut akan digunakan sebagai dasar untuk membentu aturan - aturan. Aturan – aturan tersebut nantinya akan digunakan untuk klasifikasi teks pada data yang baru. Pada jurnal lainnya yang berjudul Cross Covering Algorithm Based on Simulated Annealing mendeskripsikan terkait algoritma untuk untuk optimisasi yang bersifat generic. Simulated annealing (SA) adalah salah satu algoritma untuk untuk optimisasi yang bersifat generik. Berbasiskan probabilitas dan mekanika statistik, algoritma ini dapat digunakan untuk mencari pendekatan terhadap solusi optimum global dari suatu permasalahan. Masalah yang membutuhkan pendekatan SA adalah masalah-masalah optimisasi kombinatorial, di mana ruang pencarian solusi yang ada terlalu besar, sehingga hampir tidak mungkin ditemukan solusi eksak terhadap permasalahan itu. Publikasi tentang pendekatan ini pertama kali dilakukan oleh S. Kirkpatrick, C. D. Gelatt dan M. P. Vecchi, diaplikasikan pada desain optimal hardware komputer, dan juga pada salah satu masalah klasik ilmu komputer yaitu Traveling Salesman Problem. Annealing adalah satu teknik yang dikenal dalam bidang metalurgi, digunakan dalam mempelajari proses pembentukan kristal dalam suatu materi. Agar dapat terbentuk susunan kristal yang sempurna, diperlukan pemanasan sampai suatu tingkat tertentu, kemudian dilanjutkan dengan pendinginan yang perlahan-lahan dan terkendali dari materi tersebut. Pemanasan materi di awal proses annealing, memberikan kesempatan pada atom-atom dalam materi itu untuk bergerak secara bebas, mengingat tingkat energi dalam kondisi panas ini cukup tinggi. Proses pendinginan yang perlahan-lahan memungkinkan atom-atom yang tadinya bergerak bebas itu, pada akhirnya menemukan tempat yang optimum, di mana energi internal
  • 3. yang dibutuhkan atom itu untuk mempertahankan posisinya adalah minimum, Metropolis et al. pada tahun 1953. Profesor Zhang menyatakan bahwa arti geometri M-Ps neuron, dan menunjukkan bahwa tiga lapis saraf pada jaringan untuk membangun classifier yang sama dengan mencari dan mengumpulkan domain yang mampu untuk dipartisi dari berbagai jenis masukan seperti vektor, dan disediakan covering algoritma yang lebih lanjut: Inti dari covering algoritma adalah menggunakan covering domain sebagai lapisan tersembunyi dari tiga lapisan jaringan saraf, yang diinput pada lapisan sampel set, hasil output berdasarkan hasil klasifikasi. Oleh karena itu, keutamaan dari covering algoritma adalah untuk membangun covering cluster. Adapun konsep dari covering model sebagai berikut : Pada penelitian tersebut menggunakan suatu algoritma covering karena memiliki kecepatan lebih rendah, dengan kompleksitas lebih rendah, tetapi dengan presisi yang tinggi. Tetapi pada construction berat pusat neuron biasanya domainnya memiliki kriteria sendiri, dan tidak dapat mengikuti distribusi sample untuk mencapai solusi yang omptimal. Pada penelitian tersebut membuat suatu algoritma baru menggabungkan antara cross covering algorithm dan penyajian dalam simulated annealing. Pada tahapan ini didapat pusat covering berdasarkan pencarian teori simulasi annealing. Hasil penelitian ini menampilkan algoritma dapat mengurangi jumlah dari covering dengan pengenalan akurasi yang lebih tinggi.
  • 4. Pada penelitian ini untuk mengevaluasi kinerja algortima, mengambil empat data set dari University of california untuk repository mechine learning yang diterapkan. Dalam simulasi komputer, semua nilai atribut dalam set data linear berubah menjadi interval satuan. Dengan demikian, kita dapat menangani setiap set data sebagai masalah klasifikasi pola dalam n-dimensi satuan kubus [0,1] n. Pada exsperiment ini menggunakan sepuluh kali lipat crossvalidation (10-CV) teknik untuk setiap data set 10 kali, dengan menggunakan partisi yang berbeda dari kumpulan data. Dalam 10-CV, kumpulan data dibagi menjadi 10 subset dari ukuran yang sama. Sembilan subset digunakan sebagai pola pelatihan, dan bagian lainnya digunakan sebagai pola uji. Hasilnya ditunjukkan pada Gambar dibawah. Akurasi pengenalan pada Gambar dibawah ini menunjukan rata-rata dari sepuluh kali pelatihan dan pengujian. Hal ini dapat dilihat dari Gambar tersebut bahwa akurasi pengenalan rata-rata Sacca jelas lebih baik daripada CCA dan LIBSVM. Terutama pada dataset Kaca, kinerja Sacca ditingkatkan 9.55 poin persentase dari CCA, dan 10.91 persen dibanding classifier LIBSVM terkenal. Ini menunjukkan bahwa dengan titik yang mendapatkan dari penelusuran dari teori simulated annealing untuk pusat meliputi bisa memberikan perintah yang lebih baik untuk studi sampel, dan membuat pusat sampel keterwakilan sehingga domain meliputi dapat mencakup informasi lebih lanjut tentang predikasi. Pada penelitian mendapatkan kesimpulan dari data publik
  • 5. hanya set, pada percobaan berikutnya, kita akan membuktikan algoritma praktis meskipun memilih data yang memiliki nilai lebih praktis. Dengan menggunakan data, kita akan menunjukkan keuntungan dari Sacca dalam aplikasi praktis. Gambar : results for LIBSVM, CCA and SACCA Kesimpulan: Dalam jurnal tersebut, konstruktif algoritma, cross covering algoritma dan berdasarkan simulasi annealing (Sacca) menunjukkan, hasil pada beberapa UCI database dan teks kategorisasi menunjukkan bahwa Sacca adalah performas yang bagus untuk classifier. Dapat digunakan simulasi annealing algoritma untuk mencari pusat covering, secara efektif dapat meningkatkan daerah covering serta mengurangi jumlah covering. Algoritma ini mengurangi kompleksitas dan meningkatkan kemampuan generalisasi dan menjaga kinerja pada tingkat tinggi. Penelitian tersebut dapat digunakan pada search enggine untuk melakukan penelitian serta pengembangan pada masa depan.
  • 6. Referensi : [1] Cheng-Gang He, Yan-ping Zhang, Hui Sun, and Jin-Wei Gen, “A Novel Regression Method Research Based on Covering Algorithm,” Intell. Inf. Process. Trust. Comput. IPTC 2010 Int. Symp. On, pp. 41–44, Oct. 2010. [2] Jin-Hong Liu and Yu-Liang Lu, “Strong Rules Learning Algorithm for Ensemble Text Classification,” Mach. Learn. Cybern. 2007 Int. Conf. On, vol. 6, pp. 3601– 3606, Aug. 2007. [3] Zhang Yanping , Liu Chao,"Cross covering algoritma based on Simulated annealing," School of Computer Science and Technology, Anhui University, Hefei, China,2010.