Sistem Basis Data

581 views
479 views

Published on

Published in: Education, Technology, Business
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
581
On SlideShare
0
From Embeds
0
Number of Embeds
195
Actions
Shares
0
Downloads
15
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Sistem Basis Data

  1. 1. SISTEM BASIS DATAALGORITMA ECLATKELOMPOK 3SERTI LONDONGALLO (H12110003)KRISTI W. SAIYA (H12110255)BRYAN NAWANJAYA ARTIKA (H12110275)ABADI GUNAWAN AZIS (H12110287)JURUSAN MATEMATIKAFAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAMUNIVERSITAS HASANUDDIN2013
  2. 2. ALGORITMA ECLATAlgoritmaeclatdigunakanuntukmenampilkanitemset mining.Polafrekuensiitemset miningdapatditemuipada data sepertijikaseorangpelangganmembeli roti,pastijugaakanmembelisusu.Jenispolasepertiinidisebutkaidahasosiasi (association rules)danbanyakdigunakanpadaberbagaiaplikasi.Ide dasardarialgoritmaeclatialahmeggunakaninterseksi (titikpotong) tid set (tid =transaksi id) untukmenghitungsupport daricalonitemset yang jauhdari subset generasi yangtidakterdapatpadaprefix tree.Berbedapadaapriori yang metodepencarianitemsetnyadariumumkekhususdanmenyebar,metodepencarianalternatifpadaalgoritmaeclatialahdarikhususkeumum.Artinya prosespencarianitemsetnyadimulaidari yang paling seringdikunjungike yang palingjarangdikunjungitanpaharusmeperhatikanurutan. Selainitu prosespencariannyajugasecaramendalam (depth). Perbedaannyadapatdigambarkansepertiberikut.Frequentitemsetborder null{a1,a2,...,an}(a) General-to-specificnull{a1,a2,...,an}Frequentitemsetborder(b) Specific-to-general........Frequentitemsetbordernull{a1,a2,...,an}(c) Bidirectional....APRIORI ECLAT(a) Breadth first (b) Depth firstAPRIORI ECLAT
  3. 3. Dalamprosesnya, eclatjugadidefinisikansecararekursif.Artinya proses pencarianitemset yangdiinginkanakanterjadisecaraberkesinambungansepanjangmasihadaitemset yang tersisa. Ada 2poinutamadalamalgoritmaeclat, yakni :1. Menemukanitemset yang frequent (paling seringdikunjungi) dan2. Melibatkansemuaitemset yang tersediadalamartiansecararekursif.Metodepembentukanitemsetpadaalgoritmaeclat :1. nyatakansetiap item dalamtabeltransaksi id (tid) secara vertical2. menentukansupport (pendukung) darisetiap k-itemsetdenganmenyilangkantid-listdarikedua (k-1) subset. Pendekatanpenyilangannyadapatdimulaidariatas-bawah, bawah-atasataugabungankeduanya. Untuklebihjelasnyadapatdilihatpadagambarberikutini.A1456789B1257810AB1578TID Items1 A,B,E2 B,C,D3 C,E4 A,C,D5 A,B,C,D6 A,E7 A,B8 A,B,C9 A,C,D10 BHorizontalData LayoutA B C D E1 1 2 2 14 2 3 4 35 5 4 5 66 7 8 97 8 98 109Vertical Data Layout
  4. 4. Dari pemaparan di atasdapatdilihatbahwakeuntungandarialgoritmaeclatialah prosesperhitungansupport lebihcepatdibandingkandenganapriori. Haiinidikarenakan prosespencarianitemsetnyasecaramendalamdanketikatelahditemukanitemset yangseringdikunjungimaka proses berakhir.Berbedapadaapriori yang prosespencariannyasecaramelebarsehinggahalinimembutuhkanwaktu yang cukup lamauntukmenentukanitemset yang seringdikunjungikarenametodepencariannyasecaramenyeluruh(satu-satu). Meskipuntelahditemukanitemset yang seringdikunjunginamunjikamasihadaitemsetyang belumdieksekusimaka proses akandilanjutkan. Hal inilah yang menyebabkan prosesperhitungansupportpadaeclatjauhlebihcepatdibandingkanapriori.Namun di sisilain,eclatjugamemilikikekuranganyaitupenggunaanmemorinyajauhlebihbesardibandingkanapriori.Pada proses pembentukanitemsetpadaeclatdigambarkansecaravertikal. Artinyajikatransaksi yangterjadimisalkan 10 kali, danterdapat20 itemset, maka proses eksekusi yangterjadiialahsebanyakitemset yang adayaitusebanyak 20 kali eksekusi.Kalauaprioritidaklahdemikian, eksekusiterjadisebanyaktransaksi yang adayaitu 10 kalieksekusi.Hal inilah yang menyebabkanukuranmemoripadaeclatlebihbesardibandingkanapriori.Akan tetapi, akanmemudahkanuntukmengetahuiitemset yangseringdikunjungipadaalgoritmaeclat.Untukmemperjelas proses kerjadarialgoritmaeclat,berikutcontohimplementasinyamenggunakan FP-Tree.TID Items1 A B C E F O2 A C G3 E I4 A C D E G5 A C E G L6 E J7 A B C E F P8 A C D9 A C E G M10 A C E G NHeaderSupp. Count ≥ 2Item PointerA 8C 8E 8G 5B 2D 2F 2TransaksiTID Items1 A B C E F2 A C G3 E4 A C D E G5 A C E G6 E7 A B C E F8 A C D9 A C E G10 A C E GItemset yangbarusetelahpemangkasan
  5. 5. Dari data di atasterdapatitemset yang tidakmemenuhisupport count yangtelahditentukanyaitu I, J, L, M, N, O dan P karenahanyamuncul 1 kali padatransaksi yang terjadi.Item-item tersebutdiabaikansajasehinggadiperolehitemset yang baru.FP-Tree padatransaksipertamaFP-Tree padatransaksike-duaFP-Tree padatransaksike-tiga
  6. 6. FP-Tree padatransaksike-empatFP-Tree padatransaksike-limaFP-Tree padatransaksike-enam
  7. 7. FP-Tree padatransaksike-tujuhFP-Tree padatransaksike-delapanFP-Tree padatransaksike-sembilan
  8. 8. FP-Tree padatransaksike-sepuluhFP-Tree bersyaratuntuk FSekarangakandilakukaneksekusimulaidari item yang memilikifrekuensiterendahyaitu F.DarigambarFP-Tree padatransaksike-sepuluhterlihatjelasbahwahanyaterdapatsatucabang yangmempunyaiending F. Sehinggadiperolehgambarseperti di atas.Padatahapinihanyadifokuskanpadacabang yang memilikiending F danmengabaikancabang yangtidakmemilikiending F. Kemungkinankombinasi subset itemset yang megandung item Fyaitu{F} {A,F} {C,F} {E,F} {B,F} {A,C,F}, …, {A,C,E,F}
  9. 9. Pada header baru di atasdapatdilihatbahwa item A, B, C dan E termasuk item yangfrekuenatauseringdikunjungi. Namunmasihada item yang jugafrekuen yangbelumdieksekusiyaitu item D sehingga proses rekursifdilanjutkan.FP-Tree bersyaratuntuk DPadatahapinihanyadifokuskanpadacabang yang memilikiending Ddanmengabaikancabanglainnyatanpaending D. Sesuaidengan support count yangtelahditentukanpadapohon di atasterdapatbeberapa item yang tidakfrekuenyaitu D, G dan E. Padaheader baruterlihatjelas item A dan C merupakan item yang paling frekuendarisemua item yangada. Kemungkinankombinasi subset itemset yang megandung item D yaitu{D} {A,D} {C,D}{A,C,D}.Berikutinimerupakancontohimplementasidarialgoritmaeclatmenggunakan program R.
  10. 10. Implementasi## 1041 transaksiyang terjadi, list di bawahmerupakanpotongandari data## beberapatransaksi yang diduplikasidimasukkanuntukmenghasilkan outputdarialgoritmadata = list(c("2","3","4","6","7","8","10","12","13","14","16","20","23","32","39","41","46","52","55","60","64","66","73","75","77"),c("11","42","72"),c("14","51"),c("41","51","65"),c("22","57","65"),...)itemsets<- eclat(data, parameter = list(support = 0.1, minlen=2, tidLists =TRUE, target="frequent itemsets"))parameter specification:tidLists support minlenmaxlen target extTRUE 0.1 2 5 frequent itemsets FALSEalgorithmic control:sparse sort verbose7 -2 TRUEeclat - find frequent item sets with the eclat algorithmversion 2.6 (2004.08.16) (c) 2002-2004 Christian Borgeltcreateitemset ...set transactions ...[78 item(s), 1041 transaction(s)] done [0.00s].sorting and recoding items ... [3 item(s)] done [0.00s].creating bit matrix ... [3 row(s), 1041 column(s)] done [0.00s].writing ... [4 set(s)] done [0.00s].Creating S4 object ... done [0.00s].Output data :inspect(itemsets)items support1 {11,42,72} 0.1940442
  11. 11. 2 {42,72} 0.19404423 {11,42} 0.19404424 {11,72} 0.1959654AnalisisDari hasil di atasdapatdilihatbahwaterdapat 4 itemset yangfrekuensebagaihasildarialgoritmaeclat.Hasiloutputnyamerujukpadareplikasidaritransaksi {11, 42,72} yang seringmunculpada data.Hasiloutputnyamenunjukkanbahwahimpunantransaksi {11, 42,72},{42, 72}, {11, 42} mempunyaisupportsebesar 19,40 % dantransaksi {11, 72}mempunyaisupportsebesar 19.60%. Produk id 11, 42 dan 72 secaraberturut-turutmewakiliprodukQuesoCabrales, Singaporean Hokkien Fried Mee and Mozzarella diGiovanni.
  12. 12. DAFTAR PUSTAKAhttp://en.wikibooks.org/wiki/Data_Mining_Algorithms_In_R/Frequent_Pattern_Mining/The_Eclat_Algorithm

×