SlideShare a Scribd company logo
1 of 8
Download to read offline
142
EKSTRAKSI FITUR MENGGUNAKAN METODE LDA
DAN PEMILIHAN EIGEN VALUE PADA CACAT KERTAS
DUPLEK
Aeri Rachmad
Fakultas Teknik – Universitas Trunojoyo Madura
aery_r@yahoo.com
ABSTRAK
Industri kertas masih menggunakan proses yang manual dengan menggunakan peralatan yang manual
untuk mendeteksi cacat yang terdapat pada kertas.Dalam peneletian ini bertujuan untuk mereduksi cacat
pada kertas dengan menggunakan LDA, berbeda dengan penelitian sebelumnya yang menggunakan metode
PCA.
Linear Discriminant Analysis merupakan salah satu metode untuk melakukan reduksi dan ekstraksi cacat
yang ada pada kertas. Metode ini akan mereduksi dimensi yang ada agar lebih kecil serta mencari nilai
eigen yang terbesar untuk mempercepat proses pengujian. Dalam pengujian menggunakan euclidian
distance terdapat error minimal sebesar 4% dan error maksimal sebesar 12%.
Kata kunci: Linear DiscriminantAnalysis, nilai eigen, euclidian distance
ABSTRACT
The paper industry is still using manual processes and manual equipment to detect
defects contained in the paper. In this research aims to reduce defects in the paper by
using LDA, in contrast to previous studies that use PCA method.
Linear Discriminant Analysis is a methods to perform the reduction and extraction of
defects that exist on paper. This method will reduce the existing dimensions that are
smaller and look for the largest eigenvalues to accelerate the testing process. In testing
using the euclidian distance errors are minimum of 4% and maximum error of 12%.
Keywords: Linear Discriminant Analysis, eigenvalues, euclidian distance
Vol 3, No 3 Desember 2013 ISSN 2088-2130
143
PENDAHULUAN
Latar Belakang
Pendeteksian kecacatan pada kertas
merupakan salah satu bidang penelitian yang
penting bagi perusahaan kertas yang karena
bias menurunkan tingkat kesalahan kertas
sebelum distribusi ke konsumen atau pada
distributor. Meskipun tidak banyak
mendapatkan perhatian dari para peneliti,
sistem pendeteksian kecacatan pada kertas
dapat dipergunakan untuk aplikasi
pendeteksian dini pada kertas sehingga
komplain yang disebabkan karena kecacatan
kertas bisa menurun atau bahkan tidak ada.
Komputer Vision memegang peranan
penting dalam Human Computer Interaction
Technology (HCI) yang meliputi deteksi
wajah, penjejakan wajah/badan, deteksi aksi
(gesture), estimasi umur, etnik dan deteksi
cacat pada kertas. Sistem deteksi dan
identifikasi kertas dapat dipergunakan dalam
banyak hal, seperti yang berhubungan
dengan kecacatan kertas
Penelitian deteksi kecacatan kertas jarang
sekali dilakukan apalagi warna yang dimiliki
kertas hanya bewarna kertas adalah putih
saja (Homogen). Penenilitian kali ini akan
melihat seberapa jauh kemampuan komputer
dan algoritma yang digunakan untuk
mendeteksi kecacatan kertas serta
mengklasifikasikan hasil cetakan kertas
berdasarkan tingkat kecacatannya.
Sistem deteksi kecacatan pada kertas melalui
beberapa tahapan proses, yaitu deteksi
kecacatan kertas, ekstraksi ciri / fitur dan
tahapan terakhir terakhir adalah pengenalan
cacat kertas[1].
Tujuan
Tujuan dilakukan penelitian ini adalah
mengembangkan dari penelitian sebelumnya
sehingga pengenalan terhadap klasifikasi
kecacatan kertas duplek menjadi lebih baik
dari sebelumnya. untukmengetahui hasil dari
pengenalan cacat dari sebuah kertas
berdasarkan tingkat kecacatan pada kertas
dengan menggunakan metode LDA.
Permasalahan
Bagaimana mambandingkan penggunaan
ekstraksi fitur LDA dan PCA dalam
melakukan pengenalan cacatpada kertas
Duplek.
Tinjauan Pustaka
Data Kertas Duplex
Data citra yang digunakan berasal dari dari
data natural kertas dupleks hasil produksi
pabrik kertas PT. Pakerin Prambon
Mojokerto yang kemudian dipindai dengan
parameter pemindai sbb:
1. Scan Mode: Color/Greyscale.
2. Image Quality: 300 dpi
Pemilihan Scan Mode menggunakan moda
Color/Greyscale adalah karena kedua
modetersebutmemberikankemungkinanwarn
a yang lebihbanyakdaripadacitrabiner.Pada
sistem ini, baik citra color ataupun greyscale
akan dikonversi menjadi greyscale.
Sedangkan pemilihan Image Quality
menggunakan 300 dpi supaya cacat-cacat
yang tidak nampak oleh mata, bisa „terlihat„
oleh program pendeteksi cacat.
DenganImage Quality 300 dpi, output dari
pemindaian kertas berukuran A4 adalah
2430x3483 piksel.
Linear Discriminant Analysis (LDA)
Ide dasar dari LDA adalah menemukan
sebuah transformasi linear sehingga
pengklasteran dapat dipisahkan setelah
transformasi. Ini dapat diperoleh melalui
analisa matriks scatter. LDA lebih
bertujuan untuk mengoptimalkan
diskriminan sedangkan PCA lebih pada
pengoptimalan representasi. Sama dengan
proyeksi pada PCA, pada LDA vektor data
diproyeksikan ke dalam sub ruang.
Demikian pula apabila ada data uji maka
Vol3, No 3Desember 2013
144
akan diproyeksikan ke sub ruang yang sama
dengan melakukan perkalian vektor eigen
hasil training dengan vektor data uji.
LDA mengelompokkan vektor data dari
kelas yang sama dan memisahkan kelas
yang berbeda. Vektor data diproyeksi dari
ruang N-dimensi (dimana N ada jumlah
Kertas Duplex yang diproses) ke ruang C-1
dimensi (dimana C adalah jumlah kelas
dalam vektor data).
Metode LDA memilih W dengan cara
memaksimalkan rasio antara between-class
scatter (SB) (1)dan within-class scatter
(SW)(2). Berikut ini definisi dari kedua kelas
scatter :
Tii
l
i
iB nS ))(( )()(
1
  
(1)
  









l
i
n
j
Tii
j
ii
jw
i
xxS
1 1
)()()()(
))((  (2)
dimana adalahvektor rata-rata jumlah
sample, niadalah jumlah sample dalam kelas
ke-i,  (i)
adalah vektor rata-rata kelas ke-i,
xj
(i)
adalah sample ke-j pada kelas ke-i, dan l
adalah jumlah kelas.
Jika SW tidak singular, proyeksi optimal
Wopt dipilih sebagai matriks dengan kolom
yang orthonormal yang memaksimalkan
rasio dari matriks between-class scatter ke
matriks within-class scatter dari sample
yang telah diproyeksikan, yaitu (3):
wSw
wSw
W
w
T
B
T
w
opt maxarg  mwww ,...,, 21
dimana {wi| i=1, 2, ..., m} adalah
sekumpulan vektor eigen yang digeneralisasi
dari SB dan SW yang bersesuaian dengan m
nilai eigen terbesar { i
 | i=1, 2, ..., m },
yaitu (4):
iwiiB wSwS  i = 1, 2, ..., m
METODOLOGI
Metodologi penelitian yang
digunakanuntukmendukungpenyelesaianper
ancangandanpembuatansistemdeteksicacatke
rtasadalah :
1. Deteksi dan segmentasi cacat kertas
duplek
2. Normalisasi data cacat kertas duplek
3. Perbandingan metode ekstraksi fitur
PCA dan LDA
4. Pengenalan cacat kertas duplek
menggunakan euclidian distance
HASIL DAN PEMBAHASAN
Deteksi dan Segmentasi Cacat
Dalam penelitian ini kami melakukan
deteksi cacat kertas duplek pada selembar
kertas dengan ukuran A4 dengan multi cacat
yang terdapat pada kertas duplek tersebut.
Proses deteksi cacat kertas duplex terdiri
dari: proses greyscale, threshold, edge
detection, menyambung pixel yang
mempunyai jarak kurang dari sama dengan 6
pixel, mengkrop area cacat dengan ukuran
31 x 31 pixel. Algoritma deteksi cacat dan
cropping pada citra adalah sbb[1]:
Gambar 1. Proyeksi data 2 kelas
menggunakan metode LDA
Aeri Rachmad dkk,Ekstraksi Fitur...
145
1. Membaca gambar kertas duplek dengan
ukuran yang ditentukan.
2. Melakukan threshold pada kertas duplek
sesuai dengan intensitas dari kertas.
3. Mengubah image menjadi hitam dan
putih saja.
4. Melakukan edge detection.
5. Menyambung pixel yang mempunyai
jarak kurang dari sama dengan 6 pixel.
6. Mengindex area yang mempunyai
kemungkinan merupakan cacat kertas
Duplek yang berbentuk polygone dan
polyline .
Pada Gambar 2 menunjukkan nilai sebaran
data training dari 80 data masing – masing
cacat yang sudah di pilih yang paling jelas
cacatnya dan pada Gambar 4 menunjukkan
sebaran 20 data testing masing – masing
cacat pada Gambar 3.
Gambar 2.Data Training yang Diplot dalam
2-Dimensi
Gambar 3.Data Testing yang Diplot dalam
2-Dimensi
Normalisasi Data Cacat Kertas
Normalisasi data cacat kertas tersebut
bertujuan agar ukuran dari cacat kertas yang
terdeteksi menjadi lebih standart. Ukuran
yang telah ditentukan yaitu 31x31 pixel
yang didalamnya terdapat hanya satu jenis
cacat saja seperti tampak pada gambar 4.
Algorithma untuk melakukan normalisasi
cacat kertas[1]:
1. Membaca data cacat yang sudah
terdeteksi sebelumnya.
2. Merubah data cacat menjadi hitam dan
putih
3. Mendeteksi ukuran image 31 x 31 pixel
4. Melakukan threshold sesuai dengan
intensitas cacat kertas yang sudah
terdeteksi
5. Mencari keliling dan luasan cacat kertas
6. Mencari cacat poliline dengan membagi
luas dibagi dengan keliling
210 215 220 225 230 235 240 245 250 255
215
220
225
230
235
240
245
250
255
Dimensi pertama
Dimensikedua
Polyline
Polygon
246 247 248 249 250 251 252 253 254 255
230
235
240
245
250
255
Dimensi pertama
Dimensikedua
Polyline
Polygon
Vol 3, No 3 Desember 2013
146
Gambar 4. Normalisasi Cacat Polyline dan
Polygone
Proses Linier Discriminat Analysis (LDA)
Vektor data hasil proses PCA merupakan
data yang representasinya telah optimal
karenapada proses PCA akan diambil data
yang mempunyai varians dominan,
namundemikian proses tersebut tidak
bertujuan untuk diskriminan data. Untuk
mendapatkan sebaran data yang tingkat
diskriminannya optimal, maka dilakukan
proses analisa diskriminan menggunakan
metodeLinier Discriminant Analysis (LDA).
Proses LDA akan meningkatkan rasio antara
between-class scatter (SB) danwithin-class
scatter (SW), jadi semakin besar jarak
sebaran data yang berlainan kelas dan
semakin dekat jarak sebaran data yang
sekelas maka tingkat diskriminan data akan
semakin baik. Untuk meningkatkan
diskriminan data dapat diproses berdasarkan
algoritma LDA berikut:
ALGORITMA: LDA(X,Y)
1. Vektor data masukan:
],...,,,........,...,,,,...,,[ 21,2222111211 mnmmnn xxxxxxxxxX 
2. Menghitung rata-rata vektor data ()
berdasarkan rata-rata
keseluruhanobjekdarimasing-masingcacat.
3. Menghitung rata-rata vektor data (1,2,
…n) dari masing-masing objek.
4. Mengurangkan data masing-masing
kelas dengan rata-ratanya.
5. Mengurangkan masing-masing rata-rata
kelas dengan rata-rata keseluruhan.
6. Menghitungbetween-class scatter :
Tii
l
i
iB nS ))(( )()(
1
  
7. Menghitungwithin-class scatter :
  









l
i
n
j
Tii
j
ii
jw
i
xxS
1 1
)()()()(
))(( 
8. Menghitung proyeksi optimal Wopt :
wSw
wSw
maxargW
w
T
B
T
w
opt 
 mwww ,...,, 21
Pemilihan W optimal
berdasarkanpadanilaieigenterbesar,
haltersebutdapatdijelaskanberdasarkanpersa
maan:
VSVS wB 
dimana V adalah vektor eigen dan  adalah
nilai eigen.
Persamaan diatas dapat dituliskan ulang
menjadi:
VV
S
S
W
B
 atau VV 
dimana
W
B
S
S
 .
Vektor eigen dan nilai eigen didapatkan dari
matrik kovarian  dan pemilihan eigen
vektor optimalnya berdasarkan dengan nilai
eigen terbesar.
Aeri Rachmad dkk,Ekstraksi Fitur...
147
LDA.m
Pengujian dan Analisa Menggunakan
Metode LDA
Seperti yang telah dilakukan pada proses
PCA mentraining 80 data cacat polyline dan
80 cacat polygon kemudian baru di olah
dengan PCA dan LDA seperti yang
ditunjukkan pada gambar 5 dan 40 data
testing seperti pada gambar 6. Setelah data
diolah dengan metode PCA maka dilakukan
reduksi dimensidengan LDA menggunakan
metode five-fold cross validation (CV).Yaitu
data dibagi menjadi 5 kelompok, dengan 4/5
data pertama dijadikan data training dan 1/5
data terakhir untuk testing. 5 kelompok ini
kemudian di rotasi tanpa terjadi overlapping
sehingga semua kelompok pernah menjadi
data testing. Dengan 5 kelompok, berarti 1
kelompok terdiri dari 40 data (20 cacat
polyline dan 20 polygone).
Untuk data uji, 1 kelompok terdiri dari 40
data (20 cacat polyline dan 20 polygone).
‘ErrPlgn’adalah errorcacat polygone, yaitu
terdeteksinya cacat polygone pada kelompok
10 data cacat polyline. Sebaliknya,
‘ErrPln’ adalah errorpolyline, yaitu
terdeteksinya cacat polyline pada kelompok
10 data cacat polygone. ‘ErrM’adalah
nilai rata-rata dari ErrPlgn dan ErrPln.
ErrPlgn,
Errpln dan ErrM ditampilkan dalam jumlah
dan persen. Jika dalam persen, maka (misal
ErrP) nilai ErrP adalah
(ErrP/10)*Gambar5.HasilProyeksi
Data Training dengan LDA yang
Diplotdalam 2-dimensi
Vol3, No 3Desember 2013
148
-100 0 100 200 300 400 500
-60
-40
-20
0
20
40
60
80
100
120
140
Dimensi pertama
Dimensikedua
Polyline
Polygon
Gambar 6.HasilProyeksi Data Testing
dengan LDA yang Diplotdalam 2-dimensi
Pada gambar 7 dan 8 menunjukkan error pada
euclidian distance dan city distance dimana
rata-rata nilai terendah pada nilai 5% yang
terjadi pada group 1 dan
SIMPULAN
Berdasarkan hasil pengujian dan analisa dari
sistem yang telah dilakukan didapatkan
beberapa kesimpulan dalam proses pengenalan
cacat kertas menggunakan metode LDA yaitu:
1. Deteksi cacat kertas dapat dilakukan
lebih baik di bandingkan dengan proses
manual.
2. LDA dapat digunakan sebagai ekstraksi
dan reduksi dimensi serta pengenalan
cacat kertas dengan memilih eigen
value yang mempunyai error yang kecil
dibandingkan dengan metode PCA
Aeri Rachmad dkk,Ekstraksi Fitur...
Table 1Hasil error City distance dan error Euclidian distance dengan LDA
Error Euclidian Distance
0
2
4
6
8
10
12
14
1 2 3 4 5
Jumlah Group
Persentase
ErrorPolyline
ErrorPolygone
ErrorRata-Rata
0
2
4
6
8
10
12
14
1 2 3 4 5
Persentase
Jumlahgroup
Error City Distance
ErrorPolylin
e
ErrorPolyg
one
Gambar 7. Error Euclidian Distance tiap
Group
Gambar 8.ErrorCity Distance tiap Group
149
DAFTAR PUSTAKA
[1] Rachmad A, “Pengenalan kecacatan
kertas Duplek menggunakan Ekstraksi fitur
PCA”
[2] HaryantiRivai, MauridhiHery P, Supeno
Mardi S N, “ PengenalanCiri –
CiriTeksturKain Sutra menggunkanMetode
GMRF denganKlasifikasi SOM-
KOHONEN”,
InstitutTeknologiSepuluhNopermber
Surabaya, 2005.
[3] Hua-Long Bu, Guo-Zheng Li, Xue-
QiangZeng, “Reducing Error of Tumor
Classification by Using Dimension
Reduction with Feature Selection”, School
of Computer Engineering and Science,
ShanghaiUniversityShanghai 200072,
China, 2007
[4]E.Ramaraj and M.Punithavalli,
“Taxonomically Clustering Organisms
Based on the Profiles of Gene Sequences
Using PCA” 1Department of Computer
Science and Engineering, Alagappa
University, TN, India,2006
[5] Viola, Paul; Jones, Michael J., “Fast
Multi-view Face Detection”, Demo at then
IEEE Conference on Computer Vision and
Pattern Recognition (CVPR), 2003
[6] Meiching Fong, “Dimension Reduction
on Hyperspectral Images” , UCLA
Department of Mathematics, 2007.
[7] Zehang Sun, Xiaojing Yuan, and
G.Bebis, Ronald Miller, ”Object detection
using feature subset selection” , Department
of Computer Science, University of Nevada,
Reno 2004
Vol3, No 3Desember 2013

More Related Content

Similar to LDA Kertas

Naskah%20 publikasi
Naskah%20 publikasiNaskah%20 publikasi
Naskah%20 publikasiCahyaUPN97
 
Jurnal 15398 ilmplementasi k-nearest neighbor untuk mengenali pola citra dala...
Jurnal 15398 ilmplementasi k-nearest neighbor untuk mengenali pola citra dala...Jurnal 15398 ilmplementasi k-nearest neighbor untuk mengenali pola citra dala...
Jurnal 15398 ilmplementasi k-nearest neighbor untuk mengenali pola citra dala...ym.ygrex@comp
 
Pengenalan Wajah Dua Dimensi Menggunakan Multi-Layer Perceptron Berdasarkan N...
Pengenalan Wajah Dua Dimensi Menggunakan Multi-Layer Perceptron Berdasarkan N...Pengenalan Wajah Dua Dimensi Menggunakan Multi-Layer Perceptron Berdasarkan N...
Pengenalan Wajah Dua Dimensi Menggunakan Multi-Layer Perceptron Berdasarkan N...Noor Azizah
 
Deteksi iris mata untuk menentukan kelebihan kolesterol
Deteksi iris mata untuk menentukan kelebihan kolesterolDeteksi iris mata untuk menentukan kelebihan kolesterol
Deteksi iris mata untuk menentukan kelebihan kolesterolAmiliya Emil
 
clustering
clusteringclustering
clusteringdewi2093
 
Jurnal 15235 pengelompokan kayu kelapa menggunakan algoritma k-means
Jurnal 15235 pengelompokan kayu kelapa menggunakan algoritma k-meansJurnal 15235 pengelompokan kayu kelapa menggunakan algoritma k-means
Jurnal 15235 pengelompokan kayu kelapa menggunakan algoritma k-meansym.ygrex@comp
 
INFORMATIKA RUMPUN KESEHATAN SMK KELAS X_BAB 6 ANALISIS DATA DAN DAMPAK SOSIA...
INFORMATIKA RUMPUN KESEHATAN SMK KELAS X_BAB 6 ANALISIS DATA DAN DAMPAK SOSIA...INFORMATIKA RUMPUN KESEHATAN SMK KELAS X_BAB 6 ANALISIS DATA DAN DAMPAK SOSIA...
INFORMATIKA RUMPUN KESEHATAN SMK KELAS X_BAB 6 ANALISIS DATA DAN DAMPAK SOSIA...andiekuA
 
Pertemuan 2_Menentukan Objek_Membersihkan_Memvalidasi_Data.pdf
Pertemuan 2_Menentukan Objek_Membersihkan_Memvalidasi_Data.pdfPertemuan 2_Menentukan Objek_Membersihkan_Memvalidasi_Data.pdf
Pertemuan 2_Menentukan Objek_Membersihkan_Memvalidasi_Data.pdfallucanbuyyy
 
A152 prediksi-nasabah-potensial-menggunakan-metode-klasifikasi-pohon-biner
A152 prediksi-nasabah-potensial-menggunakan-metode-klasifikasi-pohon-binerA152 prediksi-nasabah-potensial-menggunakan-metode-klasifikasi-pohon-biner
A152 prediksi-nasabah-potensial-menggunakan-metode-klasifikasi-pohon-binerEpul Logariasmoú
 
6.1.4.08.09 copy
6.1.4.08.09   copy6.1.4.08.09   copy
6.1.4.08.09 copyrusmawanto
 
Deteksi, pelacakan dan jumlah kendaraan dengan moving average subtraction dan...
Deteksi, pelacakan dan jumlah kendaraan dengan moving average subtraction dan...Deteksi, pelacakan dan jumlah kendaraan dengan moving average subtraction dan...
Deteksi, pelacakan dan jumlah kendaraan dengan moving average subtraction dan...Amran Simamora
 
Pencarian Rute Terpendek Dengan Menggunakan Algoritma Djikstrak
Pencarian Rute Terpendek Dengan Menggunakan Algoritma DjikstrakPencarian Rute Terpendek Dengan Menggunakan Algoritma Djikstrak
Pencarian Rute Terpendek Dengan Menggunakan Algoritma DjikstrakArinten Hidayat
 
Implementasi Algoritma Genetika pada Temu Kembali Citra
Implementasi Algoritma Genetika pada Temu Kembali CitraImplementasi Algoritma Genetika pada Temu Kembali Citra
Implementasi Algoritma Genetika pada Temu Kembali CitraRepository Ipb
 
5. jurnal jones pandiangan perancangan aplikasi segmentasi citra dengan metod...
5. jurnal jones pandiangan perancangan aplikasi segmentasi citra dengan metod...5. jurnal jones pandiangan perancangan aplikasi segmentasi citra dengan metod...
5. jurnal jones pandiangan perancangan aplikasi segmentasi citra dengan metod...ym.ygrex@comp
 

Similar to LDA Kertas (20)

Naskah%20 publikasi
Naskah%20 publikasiNaskah%20 publikasi
Naskah%20 publikasi
 
9 f43e4d cd01
9 f43e4d cd019 f43e4d cd01
9 f43e4d cd01
 
Jurnal 15398 ilmplementasi k-nearest neighbor untuk mengenali pola citra dala...
Jurnal 15398 ilmplementasi k-nearest neighbor untuk mengenali pola citra dala...Jurnal 15398 ilmplementasi k-nearest neighbor untuk mengenali pola citra dala...
Jurnal 15398 ilmplementasi k-nearest neighbor untuk mengenali pola citra dala...
 
Pengenalan Wajah Dua Dimensi Menggunakan Multi-Layer Perceptron Berdasarkan N...
Pengenalan Wajah Dua Dimensi Menggunakan Multi-Layer Perceptron Berdasarkan N...Pengenalan Wajah Dua Dimensi Menggunakan Multi-Layer Perceptron Berdasarkan N...
Pengenalan Wajah Dua Dimensi Menggunakan Multi-Layer Perceptron Berdasarkan N...
 
Bab 5
Bab 5Bab 5
Bab 5
 
DATA MINING
DATA MININGDATA MINING
DATA MINING
 
Deteksi iris mata untuk menentukan kelebihan kolesterol
Deteksi iris mata untuk menentukan kelebihan kolesterolDeteksi iris mata untuk menentukan kelebihan kolesterol
Deteksi iris mata untuk menentukan kelebihan kolesterol
 
clustering
clusteringclustering
clustering
 
Jurnal 15235 pengelompokan kayu kelapa menggunakan algoritma k-means
Jurnal 15235 pengelompokan kayu kelapa menggunakan algoritma k-meansJurnal 15235 pengelompokan kayu kelapa menggunakan algoritma k-means
Jurnal 15235 pengelompokan kayu kelapa menggunakan algoritma k-means
 
INFORMATIKA RUMPUN KESEHATAN SMK KELAS X_BAB 6 ANALISIS DATA DAN DAMPAK SOSIA...
INFORMATIKA RUMPUN KESEHATAN SMK KELAS X_BAB 6 ANALISIS DATA DAN DAMPAK SOSIA...INFORMATIKA RUMPUN KESEHATAN SMK KELAS X_BAB 6 ANALISIS DATA DAN DAMPAK SOSIA...
INFORMATIKA RUMPUN KESEHATAN SMK KELAS X_BAB 6 ANALISIS DATA DAN DAMPAK SOSIA...
 
Pcd 10
Pcd 10Pcd 10
Pcd 10
 
Pertemuan 2_Menentukan Objek_Membersihkan_Memvalidasi_Data.pdf
Pertemuan 2_Menentukan Objek_Membersihkan_Memvalidasi_Data.pdfPertemuan 2_Menentukan Objek_Membersihkan_Memvalidasi_Data.pdf
Pertemuan 2_Menentukan Objek_Membersihkan_Memvalidasi_Data.pdf
 
A152 prediksi-nasabah-potensial-menggunakan-metode-klasifikasi-pohon-biner
A152 prediksi-nasabah-potensial-menggunakan-metode-klasifikasi-pohon-binerA152 prediksi-nasabah-potensial-menggunakan-metode-klasifikasi-pohon-biner
A152 prediksi-nasabah-potensial-menggunakan-metode-klasifikasi-pohon-biner
 
6.1.4.08.09 copy
6.1.4.08.09   copy6.1.4.08.09   copy
6.1.4.08.09 copy
 
Deteksi, pelacakan dan jumlah kendaraan dengan moving average subtraction dan...
Deteksi, pelacakan dan jumlah kendaraan dengan moving average subtraction dan...Deteksi, pelacakan dan jumlah kendaraan dengan moving average subtraction dan...
Deteksi, pelacakan dan jumlah kendaraan dengan moving average subtraction dan...
 
9868 22329-1-pb
9868 22329-1-pb9868 22329-1-pb
9868 22329-1-pb
 
Pencarian Rute Terpendek Dengan Menggunakan Algoritma Djikstrak
Pencarian Rute Terpendek Dengan Menggunakan Algoritma DjikstrakPencarian Rute Terpendek Dengan Menggunakan Algoritma Djikstrak
Pencarian Rute Terpendek Dengan Menggunakan Algoritma Djikstrak
 
Pertemuan 4.pdf
Pertemuan 4.pdfPertemuan 4.pdf
Pertemuan 4.pdf
 
Implementasi Algoritma Genetika pada Temu Kembali Citra
Implementasi Algoritma Genetika pada Temu Kembali CitraImplementasi Algoritma Genetika pada Temu Kembali Citra
Implementasi Algoritma Genetika pada Temu Kembali Citra
 
5. jurnal jones pandiangan perancangan aplikasi segmentasi citra dengan metod...
5. jurnal jones pandiangan perancangan aplikasi segmentasi citra dengan metod...5. jurnal jones pandiangan perancangan aplikasi segmentasi citra dengan metod...
5. jurnal jones pandiangan perancangan aplikasi segmentasi citra dengan metod...
 

Recently uploaded

MATERI SESI 2 KONSEP ETIKA KOMUNIKASI.pptx
MATERI SESI 2 KONSEP ETIKA KOMUNIKASI.pptxMATERI SESI 2 KONSEP ETIKA KOMUNIKASI.pptx
MATERI SESI 2 KONSEP ETIKA KOMUNIKASI.pptxrikosyahputra0173
 
Manajemen Lalu Lintas Baru Di Jalan Selamet Riyadi
Manajemen Lalu Lintas Baru Di Jalan Selamet RiyadiManajemen Lalu Lintas Baru Di Jalan Selamet Riyadi
Manajemen Lalu Lintas Baru Di Jalan Selamet RiyadiCristianoRonaldo185977
 
pertemuan-3-distribusi pada-frekuensi.ppt
pertemuan-3-distribusi pada-frekuensi.pptpertemuan-3-distribusi pada-frekuensi.ppt
pertemuan-3-distribusi pada-frekuensi.pptAhmadSyajili
 
MARIA NOVILIA BOISALA FASILITATOR PMM.pptx
MARIA NOVILIA BOISALA FASILITATOR PMM.pptxMARIA NOVILIA BOISALA FASILITATOR PMM.pptx
MARIA NOVILIA BOISALA FASILITATOR PMM.pptxmariaboisala21
 
UKURAN PENTYEBARAN DATA PPT KELOMPOK 2.pptx
UKURAN PENTYEBARAN DATA PPT KELOMPOK 2.pptxUKURAN PENTYEBARAN DATA PPT KELOMPOK 2.pptx
UKURAN PENTYEBARAN DATA PPT KELOMPOK 2.pptxzidanlbs25
 
Menggunakan Data matematika kelas 7.pptx
Menggunakan Data matematika kelas 7.pptxMenggunakan Data matematika kelas 7.pptx
Menggunakan Data matematika kelas 7.pptxImahMagwa
 
Geologi Jawa Timur-Madura Kelompok 6.pdf
Geologi Jawa Timur-Madura Kelompok 6.pdfGeologi Jawa Timur-Madura Kelompok 6.pdf
Geologi Jawa Timur-Madura Kelompok 6.pdfAuliaAulia63
 

Recently uploaded (7)

MATERI SESI 2 KONSEP ETIKA KOMUNIKASI.pptx
MATERI SESI 2 KONSEP ETIKA KOMUNIKASI.pptxMATERI SESI 2 KONSEP ETIKA KOMUNIKASI.pptx
MATERI SESI 2 KONSEP ETIKA KOMUNIKASI.pptx
 
Manajemen Lalu Lintas Baru Di Jalan Selamet Riyadi
Manajemen Lalu Lintas Baru Di Jalan Selamet RiyadiManajemen Lalu Lintas Baru Di Jalan Selamet Riyadi
Manajemen Lalu Lintas Baru Di Jalan Selamet Riyadi
 
pertemuan-3-distribusi pada-frekuensi.ppt
pertemuan-3-distribusi pada-frekuensi.pptpertemuan-3-distribusi pada-frekuensi.ppt
pertemuan-3-distribusi pada-frekuensi.ppt
 
MARIA NOVILIA BOISALA FASILITATOR PMM.pptx
MARIA NOVILIA BOISALA FASILITATOR PMM.pptxMARIA NOVILIA BOISALA FASILITATOR PMM.pptx
MARIA NOVILIA BOISALA FASILITATOR PMM.pptx
 
UKURAN PENTYEBARAN DATA PPT KELOMPOK 2.pptx
UKURAN PENTYEBARAN DATA PPT KELOMPOK 2.pptxUKURAN PENTYEBARAN DATA PPT KELOMPOK 2.pptx
UKURAN PENTYEBARAN DATA PPT KELOMPOK 2.pptx
 
Menggunakan Data matematika kelas 7.pptx
Menggunakan Data matematika kelas 7.pptxMenggunakan Data matematika kelas 7.pptx
Menggunakan Data matematika kelas 7.pptx
 
Geologi Jawa Timur-Madura Kelompok 6.pdf
Geologi Jawa Timur-Madura Kelompok 6.pdfGeologi Jawa Timur-Madura Kelompok 6.pdf
Geologi Jawa Timur-Madura Kelompok 6.pdf
 

LDA Kertas

  • 1. 142 EKSTRAKSI FITUR MENGGUNAKAN METODE LDA DAN PEMILIHAN EIGEN VALUE PADA CACAT KERTAS DUPLEK Aeri Rachmad Fakultas Teknik – Universitas Trunojoyo Madura aery_r@yahoo.com ABSTRAK Industri kertas masih menggunakan proses yang manual dengan menggunakan peralatan yang manual untuk mendeteksi cacat yang terdapat pada kertas.Dalam peneletian ini bertujuan untuk mereduksi cacat pada kertas dengan menggunakan LDA, berbeda dengan penelitian sebelumnya yang menggunakan metode PCA. Linear Discriminant Analysis merupakan salah satu metode untuk melakukan reduksi dan ekstraksi cacat yang ada pada kertas. Metode ini akan mereduksi dimensi yang ada agar lebih kecil serta mencari nilai eigen yang terbesar untuk mempercepat proses pengujian. Dalam pengujian menggunakan euclidian distance terdapat error minimal sebesar 4% dan error maksimal sebesar 12%. Kata kunci: Linear DiscriminantAnalysis, nilai eigen, euclidian distance ABSTRACT The paper industry is still using manual processes and manual equipment to detect defects contained in the paper. In this research aims to reduce defects in the paper by using LDA, in contrast to previous studies that use PCA method. Linear Discriminant Analysis is a methods to perform the reduction and extraction of defects that exist on paper. This method will reduce the existing dimensions that are smaller and look for the largest eigenvalues to accelerate the testing process. In testing using the euclidian distance errors are minimum of 4% and maximum error of 12%. Keywords: Linear Discriminant Analysis, eigenvalues, euclidian distance Vol 3, No 3 Desember 2013 ISSN 2088-2130
  • 2. 143 PENDAHULUAN Latar Belakang Pendeteksian kecacatan pada kertas merupakan salah satu bidang penelitian yang penting bagi perusahaan kertas yang karena bias menurunkan tingkat kesalahan kertas sebelum distribusi ke konsumen atau pada distributor. Meskipun tidak banyak mendapatkan perhatian dari para peneliti, sistem pendeteksian kecacatan pada kertas dapat dipergunakan untuk aplikasi pendeteksian dini pada kertas sehingga komplain yang disebabkan karena kecacatan kertas bisa menurun atau bahkan tidak ada. Komputer Vision memegang peranan penting dalam Human Computer Interaction Technology (HCI) yang meliputi deteksi wajah, penjejakan wajah/badan, deteksi aksi (gesture), estimasi umur, etnik dan deteksi cacat pada kertas. Sistem deteksi dan identifikasi kertas dapat dipergunakan dalam banyak hal, seperti yang berhubungan dengan kecacatan kertas Penelitian deteksi kecacatan kertas jarang sekali dilakukan apalagi warna yang dimiliki kertas hanya bewarna kertas adalah putih saja (Homogen). Penenilitian kali ini akan melihat seberapa jauh kemampuan komputer dan algoritma yang digunakan untuk mendeteksi kecacatan kertas serta mengklasifikasikan hasil cetakan kertas berdasarkan tingkat kecacatannya. Sistem deteksi kecacatan pada kertas melalui beberapa tahapan proses, yaitu deteksi kecacatan kertas, ekstraksi ciri / fitur dan tahapan terakhir terakhir adalah pengenalan cacat kertas[1]. Tujuan Tujuan dilakukan penelitian ini adalah mengembangkan dari penelitian sebelumnya sehingga pengenalan terhadap klasifikasi kecacatan kertas duplek menjadi lebih baik dari sebelumnya. untukmengetahui hasil dari pengenalan cacat dari sebuah kertas berdasarkan tingkat kecacatan pada kertas dengan menggunakan metode LDA. Permasalahan Bagaimana mambandingkan penggunaan ekstraksi fitur LDA dan PCA dalam melakukan pengenalan cacatpada kertas Duplek. Tinjauan Pustaka Data Kertas Duplex Data citra yang digunakan berasal dari dari data natural kertas dupleks hasil produksi pabrik kertas PT. Pakerin Prambon Mojokerto yang kemudian dipindai dengan parameter pemindai sbb: 1. Scan Mode: Color/Greyscale. 2. Image Quality: 300 dpi Pemilihan Scan Mode menggunakan moda Color/Greyscale adalah karena kedua modetersebutmemberikankemungkinanwarn a yang lebihbanyakdaripadacitrabiner.Pada sistem ini, baik citra color ataupun greyscale akan dikonversi menjadi greyscale. Sedangkan pemilihan Image Quality menggunakan 300 dpi supaya cacat-cacat yang tidak nampak oleh mata, bisa „terlihat„ oleh program pendeteksi cacat. DenganImage Quality 300 dpi, output dari pemindaian kertas berukuran A4 adalah 2430x3483 piksel. Linear Discriminant Analysis (LDA) Ide dasar dari LDA adalah menemukan sebuah transformasi linear sehingga pengklasteran dapat dipisahkan setelah transformasi. Ini dapat diperoleh melalui analisa matriks scatter. LDA lebih bertujuan untuk mengoptimalkan diskriminan sedangkan PCA lebih pada pengoptimalan representasi. Sama dengan proyeksi pada PCA, pada LDA vektor data diproyeksikan ke dalam sub ruang. Demikian pula apabila ada data uji maka Vol3, No 3Desember 2013
  • 3. 144 akan diproyeksikan ke sub ruang yang sama dengan melakukan perkalian vektor eigen hasil training dengan vektor data uji. LDA mengelompokkan vektor data dari kelas yang sama dan memisahkan kelas yang berbeda. Vektor data diproyeksi dari ruang N-dimensi (dimana N ada jumlah Kertas Duplex yang diproses) ke ruang C-1 dimensi (dimana C adalah jumlah kelas dalam vektor data). Metode LDA memilih W dengan cara memaksimalkan rasio antara between-class scatter (SB) (1)dan within-class scatter (SW)(2). Berikut ini definisi dari kedua kelas scatter : Tii l i iB nS ))(( )()( 1    (1)             l i n j Tii j ii jw i xxS 1 1 )()()()( ))((  (2) dimana adalahvektor rata-rata jumlah sample, niadalah jumlah sample dalam kelas ke-i,  (i) adalah vektor rata-rata kelas ke-i, xj (i) adalah sample ke-j pada kelas ke-i, dan l adalah jumlah kelas. Jika SW tidak singular, proyeksi optimal Wopt dipilih sebagai matriks dengan kolom yang orthonormal yang memaksimalkan rasio dari matriks between-class scatter ke matriks within-class scatter dari sample yang telah diproyeksikan, yaitu (3): wSw wSw W w T B T w opt maxarg  mwww ,...,, 21 dimana {wi| i=1, 2, ..., m} adalah sekumpulan vektor eigen yang digeneralisasi dari SB dan SW yang bersesuaian dengan m nilai eigen terbesar { i  | i=1, 2, ..., m }, yaitu (4): iwiiB wSwS  i = 1, 2, ..., m METODOLOGI Metodologi penelitian yang digunakanuntukmendukungpenyelesaianper ancangandanpembuatansistemdeteksicacatke rtasadalah : 1. Deteksi dan segmentasi cacat kertas duplek 2. Normalisasi data cacat kertas duplek 3. Perbandingan metode ekstraksi fitur PCA dan LDA 4. Pengenalan cacat kertas duplek menggunakan euclidian distance HASIL DAN PEMBAHASAN Deteksi dan Segmentasi Cacat Dalam penelitian ini kami melakukan deteksi cacat kertas duplek pada selembar kertas dengan ukuran A4 dengan multi cacat yang terdapat pada kertas duplek tersebut. Proses deteksi cacat kertas duplex terdiri dari: proses greyscale, threshold, edge detection, menyambung pixel yang mempunyai jarak kurang dari sama dengan 6 pixel, mengkrop area cacat dengan ukuran 31 x 31 pixel. Algoritma deteksi cacat dan cropping pada citra adalah sbb[1]: Gambar 1. Proyeksi data 2 kelas menggunakan metode LDA Aeri Rachmad dkk,Ekstraksi Fitur...
  • 4. 145 1. Membaca gambar kertas duplek dengan ukuran yang ditentukan. 2. Melakukan threshold pada kertas duplek sesuai dengan intensitas dari kertas. 3. Mengubah image menjadi hitam dan putih saja. 4. Melakukan edge detection. 5. Menyambung pixel yang mempunyai jarak kurang dari sama dengan 6 pixel. 6. Mengindex area yang mempunyai kemungkinan merupakan cacat kertas Duplek yang berbentuk polygone dan polyline . Pada Gambar 2 menunjukkan nilai sebaran data training dari 80 data masing – masing cacat yang sudah di pilih yang paling jelas cacatnya dan pada Gambar 4 menunjukkan sebaran 20 data testing masing – masing cacat pada Gambar 3. Gambar 2.Data Training yang Diplot dalam 2-Dimensi Gambar 3.Data Testing yang Diplot dalam 2-Dimensi Normalisasi Data Cacat Kertas Normalisasi data cacat kertas tersebut bertujuan agar ukuran dari cacat kertas yang terdeteksi menjadi lebih standart. Ukuran yang telah ditentukan yaitu 31x31 pixel yang didalamnya terdapat hanya satu jenis cacat saja seperti tampak pada gambar 4. Algorithma untuk melakukan normalisasi cacat kertas[1]: 1. Membaca data cacat yang sudah terdeteksi sebelumnya. 2. Merubah data cacat menjadi hitam dan putih 3. Mendeteksi ukuran image 31 x 31 pixel 4. Melakukan threshold sesuai dengan intensitas cacat kertas yang sudah terdeteksi 5. Mencari keliling dan luasan cacat kertas 6. Mencari cacat poliline dengan membagi luas dibagi dengan keliling 210 215 220 225 230 235 240 245 250 255 215 220 225 230 235 240 245 250 255 Dimensi pertama Dimensikedua Polyline Polygon 246 247 248 249 250 251 252 253 254 255 230 235 240 245 250 255 Dimensi pertama Dimensikedua Polyline Polygon Vol 3, No 3 Desember 2013
  • 5. 146 Gambar 4. Normalisasi Cacat Polyline dan Polygone Proses Linier Discriminat Analysis (LDA) Vektor data hasil proses PCA merupakan data yang representasinya telah optimal karenapada proses PCA akan diambil data yang mempunyai varians dominan, namundemikian proses tersebut tidak bertujuan untuk diskriminan data. Untuk mendapatkan sebaran data yang tingkat diskriminannya optimal, maka dilakukan proses analisa diskriminan menggunakan metodeLinier Discriminant Analysis (LDA). Proses LDA akan meningkatkan rasio antara between-class scatter (SB) danwithin-class scatter (SW), jadi semakin besar jarak sebaran data yang berlainan kelas dan semakin dekat jarak sebaran data yang sekelas maka tingkat diskriminan data akan semakin baik. Untuk meningkatkan diskriminan data dapat diproses berdasarkan algoritma LDA berikut: ALGORITMA: LDA(X,Y) 1. Vektor data masukan: ],...,,,........,...,,,,...,,[ 21,2222111211 mnmmnn xxxxxxxxxX  2. Menghitung rata-rata vektor data () berdasarkan rata-rata keseluruhanobjekdarimasing-masingcacat. 3. Menghitung rata-rata vektor data (1,2, …n) dari masing-masing objek. 4. Mengurangkan data masing-masing kelas dengan rata-ratanya. 5. Mengurangkan masing-masing rata-rata kelas dengan rata-rata keseluruhan. 6. Menghitungbetween-class scatter : Tii l i iB nS ))(( )()( 1    7. Menghitungwithin-class scatter :             l i n j Tii j ii jw i xxS 1 1 )()()()( ))((  8. Menghitung proyeksi optimal Wopt : wSw wSw maxargW w T B T w opt   mwww ,...,, 21 Pemilihan W optimal berdasarkanpadanilaieigenterbesar, haltersebutdapatdijelaskanberdasarkanpersa maan: VSVS wB  dimana V adalah vektor eigen dan  adalah nilai eigen. Persamaan diatas dapat dituliskan ulang menjadi: VV S S W B  atau VV  dimana W B S S  . Vektor eigen dan nilai eigen didapatkan dari matrik kovarian  dan pemilihan eigen vektor optimalnya berdasarkan dengan nilai eigen terbesar. Aeri Rachmad dkk,Ekstraksi Fitur...
  • 6. 147 LDA.m Pengujian dan Analisa Menggunakan Metode LDA Seperti yang telah dilakukan pada proses PCA mentraining 80 data cacat polyline dan 80 cacat polygon kemudian baru di olah dengan PCA dan LDA seperti yang ditunjukkan pada gambar 5 dan 40 data testing seperti pada gambar 6. Setelah data diolah dengan metode PCA maka dilakukan reduksi dimensidengan LDA menggunakan metode five-fold cross validation (CV).Yaitu data dibagi menjadi 5 kelompok, dengan 4/5 data pertama dijadikan data training dan 1/5 data terakhir untuk testing. 5 kelompok ini kemudian di rotasi tanpa terjadi overlapping sehingga semua kelompok pernah menjadi data testing. Dengan 5 kelompok, berarti 1 kelompok terdiri dari 40 data (20 cacat polyline dan 20 polygone). Untuk data uji, 1 kelompok terdiri dari 40 data (20 cacat polyline dan 20 polygone). ‘ErrPlgn’adalah errorcacat polygone, yaitu terdeteksinya cacat polygone pada kelompok 10 data cacat polyline. Sebaliknya, ‘ErrPln’ adalah errorpolyline, yaitu terdeteksinya cacat polyline pada kelompok 10 data cacat polygone. ‘ErrM’adalah nilai rata-rata dari ErrPlgn dan ErrPln. ErrPlgn, Errpln dan ErrM ditampilkan dalam jumlah dan persen. Jika dalam persen, maka (misal ErrP) nilai ErrP adalah (ErrP/10)*Gambar5.HasilProyeksi Data Training dengan LDA yang Diplotdalam 2-dimensi Vol3, No 3Desember 2013
  • 7. 148 -100 0 100 200 300 400 500 -60 -40 -20 0 20 40 60 80 100 120 140 Dimensi pertama Dimensikedua Polyline Polygon Gambar 6.HasilProyeksi Data Testing dengan LDA yang Diplotdalam 2-dimensi Pada gambar 7 dan 8 menunjukkan error pada euclidian distance dan city distance dimana rata-rata nilai terendah pada nilai 5% yang terjadi pada group 1 dan SIMPULAN Berdasarkan hasil pengujian dan analisa dari sistem yang telah dilakukan didapatkan beberapa kesimpulan dalam proses pengenalan cacat kertas menggunakan metode LDA yaitu: 1. Deteksi cacat kertas dapat dilakukan lebih baik di bandingkan dengan proses manual. 2. LDA dapat digunakan sebagai ekstraksi dan reduksi dimensi serta pengenalan cacat kertas dengan memilih eigen value yang mempunyai error yang kecil dibandingkan dengan metode PCA Aeri Rachmad dkk,Ekstraksi Fitur... Table 1Hasil error City distance dan error Euclidian distance dengan LDA Error Euclidian Distance 0 2 4 6 8 10 12 14 1 2 3 4 5 Jumlah Group Persentase ErrorPolyline ErrorPolygone ErrorRata-Rata 0 2 4 6 8 10 12 14 1 2 3 4 5 Persentase Jumlahgroup Error City Distance ErrorPolylin e ErrorPolyg one Gambar 7. Error Euclidian Distance tiap Group Gambar 8.ErrorCity Distance tiap Group
  • 8. 149 DAFTAR PUSTAKA [1] Rachmad A, “Pengenalan kecacatan kertas Duplek menggunakan Ekstraksi fitur PCA” [2] HaryantiRivai, MauridhiHery P, Supeno Mardi S N, “ PengenalanCiri – CiriTeksturKain Sutra menggunkanMetode GMRF denganKlasifikasi SOM- KOHONEN”, InstitutTeknologiSepuluhNopermber Surabaya, 2005. [3] Hua-Long Bu, Guo-Zheng Li, Xue- QiangZeng, “Reducing Error of Tumor Classification by Using Dimension Reduction with Feature Selection”, School of Computer Engineering and Science, ShanghaiUniversityShanghai 200072, China, 2007 [4]E.Ramaraj and M.Punithavalli, “Taxonomically Clustering Organisms Based on the Profiles of Gene Sequences Using PCA” 1Department of Computer Science and Engineering, Alagappa University, TN, India,2006 [5] Viola, Paul; Jones, Michael J., “Fast Multi-view Face Detection”, Demo at then IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2003 [6] Meiching Fong, “Dimension Reduction on Hyperspectral Images” , UCLA Department of Mathematics, 2007. [7] Zehang Sun, Xiaojing Yuan, and G.Bebis, Ronald Miller, ”Object detection using feature subset selection” , Department of Computer Science, University of Nevada, Reno 2004 Vol3, No 3Desember 2013