Proposal tesis ini mengusulkan metode sederhana dan cepat untuk mendeteksi dan menghitung obyek bergerak dalam video menggunakan jaringan syaraf tiruan. Metode ini melibatkan pengurangan latar belakang, ekstraksi fitur, dan klasifikasi obyek bergerak menggunakan jaringan syaraf tiruan yang dilatih secara supervised.
tugas 1 tutorial online anak berkebutuhan khusus di SD
Tesis deal print ok 1
1. MENGHITUNG OBYEK BERGERAK
PADA PEDESTRIAN BERBASIS BACKGROUND SUBTRACTION
MENGGUNAKAN NEURAL NETWORK
Oleh:
RINO GUPITHA
P31.2011.00998
Tesis diajukan sebagai salah satu syarat
untuk memperoleh gelar
Magister Komputer
PROGRAM PASCA SARJANA
MAGISTER TEKNIK INFORMATIKA
UNIVERSITAS DIAN NUSWANTORO
SEMARANG
2015
2. i
UNIVERSITAS DIAN NUSWANTORO
PENGESAHAN STATUS TESIS
JUDUL : MENGHITUNG OBYEK BERGERAK
PADA PEDESTRIAN BERBASIS BACKGROUND SUBTRACTION
MENGGUNAKAN NEURAL NETWORK
NAMA : RINO GUPITHA
Mengijinkan Tesis Magister Komputer ini disimpan di Perpustakaan Universitas
Dian Nuswantoro dengan syarat-syarat dan kegunaan sebagai berikut:
1. Tesis adalah hak milik Universitas Dian Nuswantoro.
2. Perpustakaan Universitas Dian Nuswantoro dibenarkan membuat salinan untuk
tujuan referensi saja.
3. Perpustakaan juga dibenarkan membuat salinan Tesis ini sebagai bahan
pertukaran antar institusi pendidikan tinggi.
4. Beri tanda sesuai dengan kategori Tesis
Sangat Rahasia
Rahasia
Biasa
Disahkan oleh:
Rino Gupitha Dr. -Ing. Vincent Suhartono
Alamat Tetap :
Bumi Abdi Praja Blok D3 No.11 RT 61 RW 16
Kelurahan Sukamelang Subang Jawa Barat
Tanggal : Oktober 2015 Tanggal : Oktober 2015
3. ii
UNIVERSITAS DIAN NUSWANTORO
PERNYATAAN PENULIS
JUDUL : MENGHITUNG OBYEK BERGERAK
PADA PEDESTRIAN BERBASIS BACKGROUND SUBTRACTION
MENGGUNAKAN NEURAL NETWORK
NAMA : RINO GUPITHA
NPM : P31.2011.00998
“Saya menyatakan dan bertanggung jawab dengan sebenarnya bahwa Tesis ini
merupakan hasil karya sendiri, kecuali untuk cuplikan dan ringkasan yang masing-
masing telah saya jelaskan sumbernya. Jika pada waktu selanjutnya ada pihak lain
yang mengklaim bahwa tesis ini hasil karyanya, yang disertai dengan bukti-bukti
yang cukup, maka saya bersedia untuk dibatalkan gelar Magister Komputer saya
beserta segala hak dan kewajiban yang melekat pada gelar tersebut.”
Semarang, Oktober 2015
RINO GUPITHA
Penulis
4. iii
UNIVERSITAS DIAN NUSWANTORO
PERSETUJUAN TESIS
JUDUL : MENGHITUNG OBYEK BERGERAK
PADA PEDESTRIAN BERBASIS BACKGROUND
SUBTRACTION MENGGUNAKAN NEURAL NETWORK
NAMA : RINO GUPITHA
NPM : P31.2011.00998
Tesis ini telah diperiksa dan disetujui,
Semarang, Oktober 2015
Dr.-Ing. Vincent Suhartono M. Arief Soeleman, M.Kom
Pembimbing Utama Pembimbing Pembantu
Purwanto, Ph.D
Ketua Program Studi Magister Teknik Informatika Universitas Dian Nuswantoro
5. iv
UNIVERSITAS DIAN NUSWANTORO
PENGESAHAN TESIS
JUDUL : MENGHITUNG OBYEK BERGERAK
PADA PEDESTRIAN BERBASIS BACKGROUND
SUBTRACTION MENGGUNAKAN NEURAL NETWORK
NAMA : RINO GUPITHA
NPM : P31.2011.00998
Tesis ini telah diujikan dan dipertahankan dihadapan Dewan Penguji pada Sidang
Tesis Tanggal Oktober 2015. Menurut pandangan kami, Tesis ini mamadai dari
segi kualitas maupun kuantitas untuk tujuan penganugerahan gelar Magister
Komputer (M. Kom.).
Semarang, Oktober 2015
Dewan Penguji :
Purwanto, Ph.D Ricardus Anggi Pramunendar, M.C.S
Ketua Anggota 1
M. Arief Soeleman, M.Kom Aris Marjuni, S.Si., M.Kom
Pendamping Pembantu Anggota 2
6. v
ABSTRACT
Detect and count moving objects is a key component of automated visual
surveillance and tracking system. Formerly based detection of moving object soften
use background subtraction and frame difference are complex and take a long time.
In this thesis proposal, the authors propose a simple and fast method to detect and
count moving objects using neural networks. The main idea in neural networks is
that the connections are allowed between adjacent units only.This proposal consists
of the implementation of the basic templates available in Neural Networks. There are
some rules in neural networks that should be implemented when programming
template, such as object equations, output equations, boundary conditions and initial
values. These template sare combined to create the most ideal algorithm to calculate
the moving objects in the film. A moving object film using the handycam. The film
then segmented into images that are used to count moving object. The algorithm used
to detect and count moving objects. The proposal also includes the use of Computer
Vision Toolbox in MATLAB. The analysis was done by comparing the position of
objects in each frame according to the time. This analysis indicates whether the
object has increased or decreased.
Keywords : Moving Object Detection; Background Subtraction; Matlab; Neural
Network.ealing;
7. vi
ABSTRAK
Mendeteksi dan menghitung obyek bergerak adalah komponen kunci dari
pengawasan visual otomatis dan sistem pelacakan. Sebelumnya deteksi berbasis
obyek bergerak sering menggunakan latar belakang pengurangan dan perbedaan
frame yang rumit dan membutuhkan waktu yang lama. Dalam proposal tesis ini,
penulis mengusulkan sebuah metode yang sederhana dan cepat untuk mendeteksi dan
menghitung obyek bergerak menggunakan JaringanSyaraf. Gagasan utama dalam
Jaringan Syaraf adalah bahwa koneksi diperbolehkan antara unit yang berdekatan
saja. Proposal ini terdiri dari pelaksanaan template dasar yang tersediadalam Jaringan
Syaraf. Ada beberapa aturan dalam Jaringan Syaraf yang harus dilaksanakan ketika
pemrograman template, seperti persamaan object, persamaan output, kondisi batas
dan juga nilai awal. Template ini digabungkan untuk membuat algoritma yang paling
ideal untuk menghitung obyek bergerak dalam film. Sebuah obyek yang bergerak di
film menggunakan kamera tangan. Film kemudian tersegmentasi menjadi gambar
yang digunakan untuk menghitung object bergerak. Algoritma digunakan untuk
mendeteksi dan menghitung object bergerak. Proposal ini juga mencakup
penggunaan Toolbox Computer Vision di MATLAB. Analisis dilakukan dengan
membandingkan posisi object disetiap frame sesuai dengan waktu. Analisis in
imenunjukkan apakah obyek telah bertambah atau berkurang.
Kata kunci : Deteksi Obyek Bergerak; Pengurangan Latar Belakang; Matlab;
Jaringan Syaraf Tiruan.
8. vii
ACKNOWLEDGEMENT
Tesis dengan judul “MENGHITUNG OBYEK BERGERAK PADA PEDESTRIAN
BERBASIS BACKGROUND SUBTRACTION MENGGUNAKAN NEURAL
NETWORK” ini dapat penulis selesaikan sesuai rencana karena dukungan dari
berbagai pihak yang tidak ternilai besarnya. Oleh karena itu penulis menyampaikan
terima kasih kepada:
1. Allah S.W.T yang telah memberikan jalan dan mukjizat-Nya kepada penulis
yang saya alami hingga saat ini.
2. Bapak Dr. Ir. Edi Noersasongko, M.Kom selaku Rektor Universitas Dian
Nuswantoro.
3. Bapak Dr. Abdul Syukur, MM selaku Dekan Fakultas Ilmu Komputer
Universitas Dian Nuswantoro.
4. Bapak Purwanto, Ph.D selaku Kaprodi Magister Teknik Informatika
Universitas Dian Nuswantoro.
5. Bapak Dr.-Ing. Vincent Suhartono dan Bapak M. Arief Soeleman, M.Kom
selaku Dosen dan Pembimbing Tesis, yang telah memberikan pengetahuan
dan bimbingannya dalam menyelesaikan Tesis ini.
6. Bapak-bapak Penguji yang telah banyak memberikan masukan dalam
penyempurnaan Tesis ini.
7. Bapak A.a. Zezen Zaenal Abidin, S.Pd., S.T., M.C.S. selaku Ketua STMIK
Subang.
8. Keempat orang tuaku tercinta, saudara-saudariku beserta keponakan-
keponakanku yang telah memberikan dukungan kepada penulis sepanjang
masa.
9. Istri tercinta Nita Novita, SE dan puteriku Sri Pujiyanti yang selalu menjadi
motivator dan setia mendampingi dalam menyelesaikan tesis ini.
10. Seluruh dosen dan staff dilingkungan Universitas Dian Nuswantoro yang
telah membantu selama proses studi.
11. Rekan-rekan angkatan XIX – BU2 JABAR MTI Universitas Dian
Nuswantoro atas kelancaran dan kenyamanan, serta support yang telah
diberikan selama proses perkuliahan hingga selesai.
9. viii
12. Semua pihak yang telah membantu penulis dan tidak dapat disebutkan satu
persatu.
Atas keterbatasan penulis, tentunya masih banyak kekurangan dan masih jauh dari
kesempurnaan. Oleh sebab itu, kritik, saran, dan masukan yang membangun akan
sangat membantu penulis dalam penelitian selanjutnya. Semoga Tesis ini dapat
bermanfaat bagi ilmu pengetahuan dan pembaca.
Semarang, Oktober 2015
Penulis
10. ix
DAFTAR ISI
PENGESAHAN STATUS TESIS ................................................................................i
PERNYATAAN PENULIS .........................................................................................ii
PERSETUJUAN TESIS..............................................................................................iii
PENGESAHAN TESIS ..............................................................................................iv
ABSTRACT................................................................................................................... v
ABSTRAK..................................................................................................................vi
ACKNOWLEDGEMENT .........................................................................................vii
DAFTAR ISI...............................................................................................................ix
DAFTAR TABEL.......................................................................................................xi
DAFTAR GAMBAR .................................................................................................xii
BAB I PENDAHULUAN........................................................................................... 1
1.1 Latar Belakang Masalah................................................................................ 1
1.2 Rumusan Masalah ......................................................................................... 2
1.3 Tujuan Penelitian........................................................................................... 3
1.4 Manfaat Penelitian......................................................................................... 3
BAB II TINJAUAN PUSTAKA................................................................................. 4
2.1 Penelitian Terkait........................................................................................... 4
2.2 Landasan Teori............................................................................................ 13
2.2.1 Obyek Bergerak ................................................................................... 13
2.2.2 Pedestrian (Pejalan Kaki) .................................................................... 13
2.2.3 Computer Vision................................................................................... 13
2.2.4 Video.................................................................................................... 14
2.2.5 Image.................................................................................................... 15
2.2.6 Image Processing................................................................................. 16
2.2.7 Frame................................................................................................... 20
11. x
2.2.8 Background Subtraction....................................................................... 20
2.2.9 Morfologi ............................................................................................. 25
2.3 Pengolahan Image ....................................................................................... 33
2.4 Kerangka Pemikiran.................................................................................... 34
BAB III METODE PENELITIAN............................................................................ 35
3.1 Metode Penelitian........................................................................................ 35
3.2 Pengumpulan Data....................................... Error! Bookmark not defined.
3.3 Pengolahan Data.......................................................................................... 37
BAB IV HASIL DAN PEMBAHASAN .................................................................. 39
4.1 Analisis........................................................................................................ 39
4.2 Hasil Eksperimen......................................................................................... 56
BAB V PENUTUP.................................................................................................... 60
5.1 Kesimpulan.................................................................................................. 60
5.2 Saran............................................................................................................ 61
DAFTAR PUSTAKA ................................................................................................ 63
12. xi
DAFTAR TABEL
Tabel 2.1 : State Of Art................................................................................................ 7
Tabel 2.2 : Tabel standar boadcast video atau film.................................................... 14
13. xii
DAFTAR GAMBAR
Gambar 2.1 : (a) background, (b) foreground,........................................................... 23
Gambar 2.2 : (a) frame, (b) model background, ....................................................... 23
Gambar 2.3 : Contoh frame dengan pengurangan latar belakang ............................. 24
Gambar 2.4 : Susunan saraf manusia ........................................................................ 27
Gambar 2.5 : Sebuah Sel Syaraf Sederhana .............................................................. 28
Gambar 2.6 : Jaringan Syaraf Tiruan Feedforward ................................................... 29
Gambar 2.7 : Jaringan Syaraf Tiruan Feedforward.................................................... 30
Gambar 2.8 : Ilustrasi proses JST ............................................................................. 31
Gambar 2.9 : Pengolahan Image ................................................................................ 33
Gambar 2.10 : Kerangka Pemikiran........................................................................... 34
Gambar 3.1 : Dataset yang digunakan (citra obyek didalam sebuah ruangan)...Error!
Bookmark not defined.
Gambar 3.2 : Citra hasil ektraksi video..................... Error! Bookmark not defined.
Gambar 4.1 : Citra hasil ekstraksi video .................................................................... 39
Gambar 4.2 : Merubah frame RGB to Gray............................................................... 41
Gambar 4. 3 : (a) Frame sebagai background (b) Frame yang terdapat obyek.......... 42
Gambar 4.4 : Obyek bergerak pada video original .................................................... 43
Gambar 4.5 : (a) Frame original 1 (b) Frame motion vector ..................................... 44
Gambar 4.6 : Video hasil, obyek bergerak dengan boundaries.................................. 45
Gambar 4.7 : Video hasil, obyek bergerak yang terdeteksi ....................................... 45
Gambar 4.8 : Threshold.............................................................................................. 47
Gambar 4.9 : Ilustrasi backgroud subtraction ............................................................ 48
Gambar 4.10 : (a) Frame cluster (b) Frame obyek hasil cluster ................................ 49
14. xiii
Gambar 4.11 : Langkah hail deteksi .......................................................................... 50
Gambar 4.12 : Frame hasil cluster ............................................................................. 51
Gambar 4.13 : Frame hasil diubah ke biner ............................................................... 51
Gambar 4.14 : Frame hasil morfologi........................................................................ 52
Gambar 4.15 : Kerangka untuk melatih JST.............................................................. 53
Gambar 4.16 : Representasi dari video .................... 5Error! Bookmark not defined.
Gambar 4.17 : Ekstraksi foreground dari aslinya....................................................... 55
15. 1
BAB I
PENDAHULUAN
1.1 Latar Belakang Masalah
Saat ini, pemanfaatan sensor kamera pada instrumentasi telah cukup meluas,
mulai dari penghitungan obyek mikroskopis, pengukuran kecepatan obyek bergerak,
dan lain sebagainya. Selain itu kamera video juga telah diterapkan untuk kepentingan
keamanan dan kenyamanan. Misalnya seperti di tempat wisata, perkantoran,
pertokoan, perpustakaan dan lain sebagainya. Bahkan kamera video telah pula
dimanfaatkan untuk pengukuran jarak obyek bergerak, yang pada pemanfaatannya
digunakan sebagai alat bantu kemudi mobil otomatis [1]. Dalam tulisan ini akan
dibahas tentang pemanfaatan kamera video untuk menghitung obyek bergerak dalam
hal ini adalah pejalan kaki.
Pada setiap ruas jalan sudah pasti memiliki permasalahan dengan pejalan kaki.
Pejalan kaki terlihat ramai ketika orang-orang mulai beraktifitas di siang hari.
Informasi keramaian pejalan kaki di suatu tempat untuk saat ini masih didapatkan
secara manual. Kebutuhan ini belum didukung dengan metode yang mampu
memberikan informasi secara akurat dan berkala.
Informasi yang didapat di suatu tempat melalui kamera-kamera sebenarnya
dapat dikembangkan lagi menjadi sebuah informasi lain seperti penghitungan jumlah
pejalan kaki di suatu tempat. Sejarah penghitungan jumlah orang yang berjalan kaki,
hanya dilihat dan dicatat berapa orang yang lewat dengan berjalan kaki pada suatu
tempat tertentu. Kemudian berkembang dengan menggunakan alat penghitung
volume yang dibantu dengan sensor.
Pengenalan pergerakan tubuh manusia (human motion) dari kamera video
memiliki beberapa aplikasi dalam video surveillance, dunia hiburan, user interface,
olahraga dan bidang lainnya. Jika terdefinisikan beberapa jenis gerakan tubuh, maka
problem pengenalan gerakan tubuh manusia bisa digunakan untuk memisahkan
antara gerakan manusia dengan latar belakangnya (background subtraction). Cara
bergerak manusia merupakan suatu ruang lingkup yang lebih kecil dari begitu
banyak dan kompleksnya tipe gerakan manusia. Karena terdapat berbagai macam
gerakan tubuh manusia, analisa dan pengenalan gerakan tubuh biasanya difokuskan
16. 2
pada domain atau ruang lingkup yang lebih spesifik/khusus. Misalnya saja cara
berjalan atau tipe gerakan kaki, gerakan ibu jari tangan, gerakan bagian kepala,
gerakan badan.
Penelitian ini akan fokus pada cara bergerak yang berdasarkan gerakan kaki
misalnya berjalan. Karena berhubungan dengan gerakan, maka yang menjadi input
dalam sistem deteksi adalah klip video atau kumpulan frame.
Penelitian ini menyajikan jumlah orang berjalan kaki menggunakan neural
network atau jaringan saraf tiruan. Deteksi benda bergerak termasuk kendaraan,
manusia, dll dalam video dapat dicapai dalam tiga pendekatan : Perbedaan Temporal,
aliran optik, dan pengurangan latar belakang. Dalam perbedaan temporal, perbedaan
citra dua frame gambar secara berturut-turut [2]. Namun, pendekatan ini memiliki
beberapa keterbatasan seperti visual homogenitas kebutuhan dan efektivitasnya
tergantung pada kecepatan benda bergerak [3]. Metode aliran optik dikembangkan
untuk memperoleh modifikasi latar belakang yang efektif, yang mendasarkan pada
deteksi perubahan intensitas. Namun, perubahan karena cuaca atau refleksi cahaya
matahari mengurangi efektivitasnya [3]. Metode ketiga, pengurangan latar belakang,
adalah sebagian besar metode yang efektif untuk pelacakan dan penghitungan obyek
bergerak [3].
Penelitian ini akan dipelajari teknik-teknik yang digunakan untuk analisa
gerakan manusia pada kamera video dengan menggunakan software Matlab. Analisa
gerakan tersebut berupa object tracking (pelacakan obyek bergerak). Proses analisa
gerakannya melalui beberapa tahap yaitu pemodelan lingkungan, memisahkan antara
obyek bergerak dengan latar belakangnya (background subtraction), segmentasi
gerakan obyek, object detection dan object tracking. Hasil yang didapatkan dari
analisa gerakan manusia tersebut adalah berupa analisa dari gerakan–gerakan obyek
tersebut (terutama dalam gerakan berjalan) yang tertangkap oleh video kamera.
1.2 Rumusan Masalah
Dari latar belakang di atas, maka permasalahan yang dirumuskan bahwa
deteksi obyek bergerak menjadi landasan untuk proses pelacakan video. Teknik
deteksi obyek yang diterapkan adalah Background Subtraction. Dalam beberapa
penelitian di temukan beberapa permasalahan dalam teknik pengurangan background
17. 3
seperti : kualitas citra yang buruk, peralihan pencahayaan, bayangan dari obyek.
Permasalahan ini akan mempengaruhi akurasi dalam deteksi obyek bergerak. Untuk
meningkatkan akurasi menghitung obyek bergerak, maka jaringan saraf tiruan akan
diterapkan dalam teknik Background Subtraction. Sedangkan pernyataan penelitian
(research questions) pada penelitian ini adalah : “Bagaimana menentukan dan
menghitung obyek bergerak pedestrian dengan menerapkan background subtraction
dan jaringan saraf tiruan dari sebuah video.
1.3 Tujuan Penelitian
Berdasarkan latar belakang dan rumusan masalah diatas, maka penelitian
ini bertujuan untuk menghitung obyek bergerak pejalan kaki dengan melakukan
deteksi, tracking, dan pemisahan antara obyek bergerak dengan latar belakangnya
(background subtraction) menggunakan jaringan saraf tiruan.
1.4 Manfaat Penelitian
Manfaat yang didapat dari penelitian ini adalah :
1. Manfaat praktis
Manfaat hasil penelitian ini adalah agar dapat diketahui jumlah pejalan kaki
yang melewati suatu tempat secara akurat.
2. Manfaat teoritis
Hasil penelitian ini diharapkan dapat dijadikan referensi untuk menerapkan
model pemisahan obyek bergerak dengan latar belakangnya dan pemahaman
penerapan jaringan saraf tiruan untuk penghitungan obyek bergerak pejalan kaki.
3. Manfaat kebijakan
Hasil penelitian ini diharapkan mampu menjadi alat prediksi penghitungan
jumlah obyek bergerak pejalan kaki.
18. 4
BAB II
TINJAUAN PUSTAKA
2.1 Penelitian Terkait
Banyak penelitian yang membahas mengenai penghitungan obyek bergerak
berbasis background subtraction dengan menggunakan jaringan saraf tiruan.
Dibawah ini ada beberapa penelitian yang berkaitan dengan menghitung obyek
bergerak, yaitu :
a. Achmad Solichin, Agus Harjoko [4] mengatakan : berdasarkan hasil penelitian
dan percobaan yang telah dilakukan, dapat disimpulkan bahwa teknik
pengurangan latar belakang (background subtraction) menghasilkan proses
deteksi yang cukup baik. Pada lingkungan statis dengan lokasi didalam ruangan
dimana intensitas pencahayaan yang relatif tetap, latar belakang yang digunakan
dapat dimodelkan secara manual. Namun pada lingkungan dengan kondidi
dinamis, diperlukan latar belakang yang adaptif terhadap kondisi lingkungan.
Penelitian ini juga dapat mendeteksi obyek pejalan kaki dengan cukup baik hanya
dengan menggunakan teknik seleksi berdasarkan ukuran dari obyek. Untuk
meningkatkan akurasi, dapat dilakukan teknik perbandingan dengan data training
yang telah disiapkan sebelumnya. Selain itu berdasarkan uji coba yang telah
dilakukan, metode yang diusulkan metode pemisahan obyek lainnya yang banyak
digunakan adalah pengurangan citra latar belakang/background subtraction.
Metode yang diusulkan pada penelitian ini sangat dipengaruhi oleh intensitas
cahaya ruangan. Pada intensitas cahaya yang berbeda antara citra latar dengan
citra berobyek, proses deteksi pejalan kaki tidak menunjukkan hasil yang baik.
b. Idhawati Hestiningsih, Tri Raharjo Yudantoro [5] menyimpulkan :
1. Aplikasi penghitung jumlah pengunjung obyek wisata dengan webcam telah
berhasil diimplementasikan dengan metode deteksi gerak pada video secara
real time menggunakan komponen Vision Lab VCL 4.5.
2. Jumlah pengunjung yang masuk maupun yang keluar dapat diketahui sehingga
jumlah orang yang masih ada di dalam obyek wisata dapat terdeteksi.
19. 5
3. Aplikasi ini dapat menggantikan sistem penghitungan pengunjung secara
manual yang dilakukan pegawai pada pintu masuk obyek wisata, sehingga
dapat mengurangi kebutuhan tenaga pegawai.
4. Aplikasi ini juga dapat menampilkan frekuensi jumlah pengunjung dalam
bentuk grafik sehingga dapat diketahui kepadatan pengunjung obyek wisata
pada waktu tertentu.
c. Rakesh Kumar, Tapesh Parashar, Gopal Verma [6] menyatakan bahwa dalam
penelitian ini, sistem diuji dengan skenario yang berbeda dengan waktu pengujian
24 * 7 jam. Penghitungan waktu nyata dilakukan dengan mesin I3 3.06 GHz dan
sistem menjalankan 15 fps pada 640 * 480 piksel gambar. Sistem ini mencapai
tingkat akurasi 99% untuk memperkirakan pergerakan orang.
d. Rachana V. Modi, Tejas B. Mehta [7] mengatakan dalam penelitiannya, teknik
yang diusulkan untuk dikembangkan dengan cara melakukan pengamatan video
menggunakan kamera stasioner. Kami mengusulkan pendekatan dengan
menggunakan perbedaan frame sebagai tahap preprocessing. Dengan
menggunakan perbedaan frame hasilnya lebih baik. Dari frame yang diekstrak,
diproses dan menunjukkan classifier seperti sebuah jaringan saraf yang dapat
diterapkan untuk mengenali obyek manusia melalui beberapa gerakan.
e. Helmy Fitriawan, Ouriz Pucu2, Yohanes Baptista [8] meyimpulkan :
1. Pada tahap pelatihan jaringan syaraf tiruan, digunakan 220 neuron input,
dengan satu hidden layer dan 40 buah neuron, 37 neuron output dengan nilai
goal yang ingin dicapai adalah 10-5.
2. Proses pelatihan untuk 100 set sampel data didapatkan rata-rata error pelatihan
sekitar 1,1%, dengan waktu komputasi sekitar 1070,143 detik atau 17,836
menit.
3. Hasil pengujian memperlihatkan sistem dapat mengenali sebanyak 96% data
citra plat nomor yang diikutkan dalam tahap pelatihan dan 90% dari data citra
play nomor yang tidka diikutkan dalam tahap pelatihan.
4. Dari hasil pengujian data citra plat nomor kendaraan didapatkan bahwa sistem
beberapa kali tidak dapat mengenali beberapa huruf. Kesalahan tersebut dapat
terjadi diantaranya karena beberapa faktor seperti usia plat nomor kendaraan
20. 6
yang diujikan, pengaruh pengolahan citra dan algoritma pelatihan jaringan,
serta kesamaan sifat dari karakter (huruf atau angka) yang dibaca.
f. Kurniawan Dwi Irianto [26] menyimpulkan hasil penelitiannya :
1. Pendeteksi gerakan berbasis kamera ini dapat bekerja dengan menggunakan
kamera maupun dengan rekaman video untuk mendeteksi gerakan yang terjadi.
2. Kepekaan kamera dalam mendeteksi objek tergantung kepada nilai
thresholdnya. Semakin rendah nilai threshold maka semakin tinggi kepekaan
kamera dan semakin tinggi nilai threshold maka semakin rendah kepekaan
kamera.
3. Pendeteksi gerakan berbasis kamera ini lebih efektif karena hanya merekam
ketika terjadi gerakan saja dan tidak merekam sepanjang waktu.
4. Perubahan cahaya dianggap obyek yang bergerak.
5. Objek yang memiliki warna yang sama dengan background dianggap sama,
sehingga walaupun obyek tersebut bergerak tidak dianggap gerakan.
6. Teknik Background Subtraction mengurangi antara frame sekarang (Fi) dengan
backgroundnya untuk menghasilkan obyek yang bergerak.
7. Teknik Frame Differencing mengurangi antara frame sekarang (Fi) dengan
frame sebelumnya (Fi-1) untuk menghasilkan obyek yang bergerak.
21. 7
Tabel 2.1 State Of Art
Peneliti Masalah Metode Hasil
Achmad
Solichin,
Agus Harjoko
(2013)
Metode Background Subtraction
untuk Deteksi Obyek Pejalan Kaki
pada Lingkungan Statis
Background Subtraction
Berdasarkan hasil penelitian dan
percobaan yang dilakukan, dapat
disimpulkan bahwa teknik pengurangan
latar belakang (background subtraction)
Menghasilkan proses deteksi yang
cukup baik. Penelitian ini juga dapat
mendeteksi obyek pejalan kaki dengan
cukup baik hanya dengan menggunakan
teknik seleksi berdasarkan ukuran
obyek.
Idhawati
Hestiningsih,
Tri Raharjo
Yudantoro
(2011)
Aplikasi Penghitung Jumlah
Pengunjung Obyek Wisata Dengan
Webcam
Deteksi gerak pada video
Aplikasi penghitung jumlah pengunjung
obyek wisata dengan webcam telah
berhasil diimplementasikan dengan
metode deteksi gerak pada video secara
real time menggunakan komponen
Vision Lab VCL 4.5.
22. 8
Rakesh
Kumar,
Tapesh
Parashar,
Gopal Verma
(2012)
Pemodelan Menghitung Orang
Berbasis Pengurangan Latar
Belakang secara Waktu Nyata dengan
Pengamatan Video
Background Subtraction
Sistem diuji dengan skenario yang
berbeda dengan waktu pengujian 24 * 7
jam. Penghitungan waktu nyata
dilakukan dengan mesin I3 3.06 GHz
dan sistem menjalankan 15 fps pada 640
* 480 piksel gambar. Sistem ini
mencapai tingkat akurasi 99% untuk
memperkirakan pergerakan orang.
Rachana V.
Modi, Tejas
B. Mehta
(2011)
Pendekatan Berbasis Jaringan Saraf
Tiruan untuk Pengenalan
Gerak manusia Menggunakan
Kamera Stationary
Jaringan Saraf Tiruan
Dalam tulisan ini, teknik yang diusulkan
untuk dikembangkan dengan
pengamatan video menggunakan
kamera stasioner. Kami mengusulkan
pendekatan dengan menggunakan
perbedaan frame sebagai tahap
preprocessing. Dengan menggunakan
perbedaan frame hasilnya lebih baik.
Dari hasil yang diekstrak, diproses dan
menunjukkan classifier seperti jaringan
saraf yang dapat diterapkan untuk
23. 9
mengenali obyek manusia melalui
beberapa gerakan .
Helmy
Fitriawan,
Ouriz Pucu2,
Yohanes
Baptista
(2012)
Mengenali plat nomor kendaraan
secara cepat.
Pengolahan citra, Jaringan Saraf
tiruan
1.Pada tahap pelatihan jaringan syaraf
tiruan, digunakan 220 neuron input,
dengan satu hidden layer dan 40 buah
neuron, 37 neuron output dengan nilai
goal yang ingin dicapai adalah 10-5.
2.Proses pelatihan untuk 100 set sampel
data didapatkan rata-rata error
pelatihan sekitar 1,1%, dengan waktu
komputasi sekitar 1070,143 detik atau
17,836 menit.
3.Hasil pengujian memperlihatkan
sistem dapat mengenali sebanyak 96%
data citra plat nomor yang diikutkan
dalam tahap pelatihan dan 90% dari
data citra play nomor yang tidak
24. 10
diikutkan dalam tahap pelatihan.
4.Dari hasil pengujian data citra plat
nomor kendaraan didapatkan bahwa
sistem beberapa kali tidak dapat
mengenali beberapa huruf. Kesalahan
tersebut dapat terjadi diantaranya
karena beberapa faktor seperti usia
plat nomor kendaraan yang diujikan,
pengaruh pengolahan citra dan
algoritma pelatihan jaringan, serta
kesamaan sifat dari karakter (huruf
atau angka) yang dibaca.
Kurniawan
Dwi Irianto
(2010)
Mendeteksi gerakan secara akurat
Background subtraction dan frame
differencing
1. Pendeteksi gerakan berbasis kamera
ini dapat bekerja dengan
menggunakan kamera maupun
dengan rekaman video untuk
mendeteksi gerakan yang terjadi.
2. Kepekaan kamera dalam
mendeteksi objek tergantung
25. 11
kepada nilai thresholdnya.
Semakin rendah nilai threshold
maka semakin tinggi kepekaan
kamera dan semakin tinggi nilai
threshold maka semakin rendah
kepekaan kamera.
3. Pendeteksi gerakan berbasis
kamera ini lebih efektif karena
hanya merekam ketika terjadi
gerakan saja dan tidak merekam
sepanjang waktu.
4. Perubahan cahaya dianggap obyek
yang bergerak.
5. Objek yang memiliki warna yang
sama dengan background
dianggap sama, sehingga
walaupun obyek tersebut bergerak
tidak dianggap gerakan.
6. Teknik Background Subtraction
26. 12
mengurangi antara frame sekarang
(Fi) dengan backgroundnya untuk
menghasilkan obyek yang
bergerak.
7. Teknik Frame Differencing
mengurangi antara frame sekarang
(Fi) dengan frame sebelumnya
(Fi-1) untuk menghasilkan obyek
yang bergerak.
27. 13
2.2 Landasan Teori
2.2.1 Obyek Bergerak
Dalam kehidupan kita mengenal dengan apa yang dinamakan obyek. Obyek
itu adalah benda yang dijadikan sasaran untuk diteliti, diperhatikan [9]. Sedangkan
untuk gerak menurut ilmu fisika Gerak adalah proses berpindahnya suatu benda dari
suatu kedudukan ke kedudukan yang lain [10]. Menurut Kamus Besar Bahasa
Indonesia Gerak adalah peralihan tempat atau kedudukan, baik hanya sekali maupun
berkali-kali [9]. Beberapa ahli seperti Kamajaya mengatakan Gerak adalah
perubahan kedudukan atau tempat suatu benda terhadap titik acuan atau titik asal
tertentu [10]. Dan Sri Murtono mengatakan Gerak adalah berpindahnya posisi atau
tempat dari satu posisi ke posisi lain [10].
2.2.2 Pedestrian (Pejalan Kaki)
Ketika kita sedang berada dijalan, kita dapat melihat banyaknya obyek
bergerak. Terlebih lagi di kota-kota besar banyak terdapat obyek bergerak seperti
kendaraan roda 2 dan 4. Selain kendaraan roda 2 dan 4, ada pula pedestrian.
Pengertian pedestrian berasal dari kata pedestres – pedestris yang diartikan orang
yang berjalan kaki (Dody Darmawan, dari Liza Maneli, Skripsi; Pedestrian dan Jalur
Pedestrian) [11]. Walaupun di Indonesia masih banyak pejalan kaki, namun tetap
saja masih kurang terperhatikan keselamatannya. Terutama kurang tersedianya
tempat-tempat khusus bagi pejalan kaki [11]. Untuk melindungi pejalan kaki dalam
berlalu-lintas, pejalan kaki wajib berjalan pada bagian jalan dan menyeberang pada
tempat penyeberangan yang telah disediakan bagi pejalan kaki [11].
2.2.3 Computer Vision
Vision secara bahasa bisa diartikan penglihatan. Vision juga bisa diartikan
sebagai suatu proses pengamatan apa yang ada pada dunia nyata melalui panca indra
penglihatan manusia [26]. Adapun computer vision adalah suatu pembelajaran
menganalisa gambar dan video untuk memperoleh hasil sebagaimana yang bisa
dilakukan manusia. Pada hakikatnya, Computer vision mencoba meniru cara kerja
sistem visual manusia (Human Vision) [26].
28. 14
Manusia melihat objek dengan indera penglihaan (mata), lalu citra objek
diteruskan ke otak untuk diinterpretasi sehingga manusia mengerti objek apa yang
tampak dalam pandangan matanya [12]. Hasil interpretasi ini mungkin digunakan
untuk pengambilan keputusan (misalnya menghindar kalau melihat mobil melaju di
depan) [26].
Gambar 2.1 : Proses computer vision mendapatkan suatu persepsi [26]
Computer vision merupakan proses otomatis yang mengintegrasikan sejumlah
besar proses untuk persepsi visual, seperti akuisisi citra, pengolahan citra,
pengenalan dan membuat keputusan [12]. Computer vision mencoba meniru cara
kerja sistem visual manusia (human vision) yang sesungguhnya sangat kompleks
[12]. Untuk itu, computer vision diharapkan memiliki kemampuan yang tinggi
sebagaimana pengelihatan manusia.
2.2.4 Video
Video atau film adalah rangkaian banyak frame gambar yang diputar dengan
cepat [13]. Masing-masing frame merupakan rekaman dari tahapan suatu gerakan.
Kita sebagai manusia tidak dapat menangkap jeda antar frame yang diputar dengan
kecepatan tinggi, karena rata-rata kecepatan diatas 20 frame per detik [13].
Tabel 2.2 : Tabel standar boadcast video atau film
Standar Region
Frame per
Second
SECAM Prancis, Timur Tengah, Afrika 25 fps
PAL Indonesia, Cina, Australia, Uni Eropa 25 fps
NTSC
Amerika Serikat, Jepang, Kanada,
Meksiko, dan Korea
29,97 fps
OtakDunia nyata
Mata
Manusia
PersepsiGambar
29. 15
a. Jenis-jenis Video
Video dapat dibedakan menjadi 2, antara lain:
Video Analog Gambar dan audio (suara) direkam dalam bentuk sinyal
magnetik pada pita magnetik.
Video Digital Serupa dengan video analog, gambar dan suara digital
direkam pita magnetik. Tetapi menggunakan sinyal digital berupa
kombinasi angka 0 dan 1 [14].
b. Format Data Video
Video Analog : VHS, S-VHS, Beta, Hi-8 Video Digital : Digital 8, AVI,
Mov, MPEG 1 (VCD), MPEG 2 (DVD) DV, MPEG 4 dan lainnya.
Perbedaan data format tersebut ditentukan oleh ukuran rekaman gambar atau
resolusi, dan data rate-nya [14].
2.2.5 Image
Secara harfiah, citra (image) adalah gambar pada bidang Dwimatra (dua
dimensi). Ditinjau dari sudut pandang matematis, image merupakan fungsi menerus
(continue) dari intensitas cahaya dari bidang Dwimatra [26]. Sumber cahaya
menerangi obyek, obyek memantulkan kembali sebagian dari berkas cahaya tersebut.
Pantulan cahaya ini ditangkap oleh alat-alat optik, misalnya mata pada manusia,
kamera, scanner, dan sebagainya. Sehingga bayangan obyek yang disebut image
tersebut terekam [26].
“A picture is more a thousand words”, artinya “sebuah gambar bermakna lebih
dari seribu kata”, maksudnya sebuah gambar akan memberikan informasi lebih
banyak daripada informasi yang disajikan dalam bentuk kata-kata [16]. Citra atau
Image merupakan istilah lain dari gambar, yang merupakan informasi berbentuk
visual [16].
Meskipun sebuah image kaya informasi, namun seringkali image yang kita
miliki mengalami penurunan mutu (degradasi), misalnya mengandung cacat atau
derau (noise), warnanya terlalu kontras, kurang tajam, kabur (blurring) dan
sebagainya [26]. Tentu saja image semacam ini menjadi lebih sulit dinterpretasikan
karena informasi yang disampaikan oleh image tersebut menjadi berkurang. Agar
image yang mengalami gangguan mudah diinterpretasikan (baik oleh manusia
30. 16
maupun mesin), maka image tersebut perlu dimanipulasi menjadi image lain yang
kualitasnya lebih baik [26]. Bidang studi yang menyangkut hal ini adalah pengolahan
image (image processing).
2.2.6 Image Processing
Dengan mengikuti perkembangan zaman, tentunya teknologi juga semakin
berkembang. Semakin banyak penemuan-penemuan baru dan juga pengembangan
dari teknologi yang sudah pernah ada sebelumnya yang memberikan berbagai
dampak positif bagi kehidupan manusia. Salah satunya adalah dalam hal image
processing. Kata image yang berarti gambar, memiliki banyak kegunaan dalam
kehidupan sehari-hari. Gambar memberikan suatu informasi, interpretasi, ilustrasi,
evaluasi, komunikasi dan hiburan bagi kita [19].
Image processing adalah suatu bentuk pengolahan atau pemrosesan sinyal
dengan input berupa gambar (image) dan ditransformasikan menjadi gambar lain
sebagai keluarannya dengan teknik tertentu [19]. Image processing dilakukan untuk
memperbaiki kesalahan data sinyal gambar yang terjadi akibat transmisi dan selama
akuisisi sinyal, serta untuk meningkatkan kualitas penampakan gambar agar lebih
mudah diinterpretasi oleh sistem penglihatan manusia baik dengan melakukan
manipulasi dan juga penganalisisan terhadap gambar [19].
Operasi image processing dapat dikelompokkan berdasarkan dari tujuan
transformasinya, yaitu [19]:
1. Image Enhancement (peningkatan kualitas gambar)
Tahap ini seringkali dikenal dengan pre-processing. Operasi peningkatan kualitas
gambar berfungsi untuk meningkatkan fitur tertentu pada citra sehingga tingkat
keberhasilan dalam pengolahan gambar berikutnya menjadi tinggi. Operasi ini
lebih banyak berhubungan dengan penajaman dari fitur tertentu pada gambar.
Peningkatan kualitas gambar ini dapat dilakukan “secara manual”, dengan
menggunakan program lukis atau dengan pertolongan rutin software [19].
Metoda untuk memperluas gambar grafis antara lain memperbaiki kontras
diantara bidang-bidang yang terang dan yang gelap; menambahkan warna,
menyaring ketidak seragaman sinyal kiriman yang membawa gambar,
menghaluskan garis-garis yang bergerigi sehingga tampak lebih bersih;
31. 17
mempertajam sudut-sudut yang kabur dan mengkoreksi distorsi yang disebabkan
alat optis atau tampilan. Untuk melakukan proses image enhancement, ada
beberapa teknik yang dapat dicoba berdasarkan cakupan pada operasinya [19] :
a. Operasi Titik
Operasi titik dalam image enhancement dilakukan dengan memodifikasi
histogram citra masukan agar sesuai dengan karakteristik yang diharapkan.
Histogram dari suatu citra adalah grafik yang menunjukkan distribusi frekuensi
dari nilai intensitas piksel dalam citra tersebut. Teknik enhancement
berdasarkan operasi titik dibagi tiga, yaitu :
Intensity Adjustment
Intensity adjusment bekerja dengan cara melakukan pemetaan linear terhadap
nilai intensitas pada histogram awal menjadi nilai intensitas pada histogram
yang baru.
Histogram Equalization
Teknik histogram equalization bertujuan untuk menghasilkan suatu citra
keluaran yang memiliki nilai histogram yang relatif sama.
Thresholding
Thresholding merupakan proses pemisahan piksel-piksel berdasarkan derajat
keabuan yang dimilikinya. Piksel yang memiliki derajat keabuan lebih kecil
dari nilai batas yang ditentukan akan diberikan nilai 0, sementara piksel yang
memiliki derajat keabuan yang lebih besar dari batas akan diubah menjadi
bernilai 1.
b. Operasi Spasial
Operasi spasial dalam pengolahan citra digital dilakukan melalui penggunaan
suatu kernel konvolusi 2-dimensi. Teknik enhancement berdasarkan operasi
titik dibagi tiga, yaitu :
Neighborhood Averaging
Pada prinsipnya, filter yang digunakan dalam neighborhood averaging
merupakan salah satu jenis low-pass filter, yang bekerja dengan cara
mengganti nilai suatu piksel pada citra asal dengan nilai rata-rata dari piksel
tersebut dan lingkungan tetangganya.
Median Filtering
32. 18
Median filter merupakan salah satu jenis low-pass filter, yang bekerja dengan
mengganti nilai suatu piksel pada citra asal dengan nilai median dari piksel
tersebut dan lingkungan tetangganya.
High-Pass Filtering
Sebagaimana pada proses pengolahan sinyal satu dimensi, high-pass filter dua
dimensi akan melewatkan komponen citra frekuensi tinggi dan meredam
komponen citra frekuensi rendah.
c. Operasi Transformasi
Operasi transformasi ini dilakukan dengan cara mentransformasi citra asal ke
dalam domain yang sesuai bagi proses enhancement, melakukan proses
enhancement pada domain tersebut, mengembalikan citra ke dalam domain
spasial untuk ditampilkan/diproses lebih lanjut.
Fast Fourier Transform (FFT)
Transformasi ini memindahkan informasi citra dari domain spasial ke dalam
domain frekuensi, yaitu dengan merepresentasikan citra spasial sebagai suatu
penjumlahan eksponensial kompleks dari beragam frekuensi, magnituda, dan
fasa.
2. Image Restoration (pemulihan gambar)
Operasi pemulihan gambar bertujuan untuk mengembalikan kondisi gambar yang
telah rusak atau cacat (merekonstruksi gambar) yang sebelumnya telah diketahui
menjadi gambar seperti pada kondisi awal, karena adanya gangguan yang
menyebabkan penurunan kualitas gambar, misalnya mengalami suatu degradasi.
Degradasi dalam hal ini maksudnya, gambar menjadi agak kabur (blur) sehingga
menurunkan kualitas gambar. Blur dapat terjadi karena banyak factor. Bisa karena
misalnya pergerakan selama pengambilan gambar oleh alat optik seperti kamera,
penggunaan alat optik yang tidak fokus, pengguanaan lensa dengan sudut yang
lebar, gangguan atmosfir, pencahayaan yang singkat sehingga mengurangi jumlah
foton yang ditangkap oleh alat optik, dan sebagainya. Citra yang tertangkap oleh
alat-alat optik seperti mata, kamera, dan sebagainya sebenarnya merupakan citra
yang sudah mengalami degradasi. yang dalam hal ini jika f(x, y) adalah citra asli
dan g(x, y) adalah citra terdegradasi, maka g(x, y) adalah perkalian f(x, y) dengan
33. 19
operator distorsi H ditambah dengan derau aditif n(x, y): g(x, y) = Hf(x, y) + n(x,
y) [19].
Derau n(x, y) adalah sinyal aditif yang timbul selama akuisisi citra sehingga
menyebabkan image menjadi rusak (mengalami degradasi). Derau (Noise) adalah
gambar atau piksel yang mengganggu kualitas image. Derau dapat disebabkan
oleh gangguan fisis (optik) pada alat akuisisi maupun secara disengaja akibat
proses pengolahan yang tidak sesuai. Contohnya adalah bintik hitam atau putih
yang muncul secara acak yang tidak diinginkan di dalam citra. bintik acak ini
disebut dengan derau salt & pepper [19].
Restorasi gambar dapat dilakukan dengan melewatkan gambar masukan pada
penapis. Dan hasil dari restorasi ini seperti yang sudah dibahas sebelumnya,
gambar yang sudah cacat (blur) akan mendekati hasil gambar aslinya menjadi
lebih jelas.
3. Image Compression (kompresi gambar)
Kompresi gambar bertujuan untuk meminimalkan jumlah bit yang diperlukan
untuk merepresentasikan citra. Hal ini sangat berguna apabila anda ingin
mengirimkan gambar berukuran besar. Gambar yang berukuran besar akan
berpengaruh pada lamanya waktu pengiriman. Maka dari itu kompresi gambar
akan memadatkan ukuran gambar menjadi lebih kecil dari ukuran asli sehingga
waktu yang diperlukan untuk transfer data juga akan lebih cepat [19].
Ada dua tipe utama kompresi data, yaitu kompresi tipe lossless dan kompresi tipe
lossy. Kompresi tipe lossy adalah kompresi dimana terdapat data yang hilang
selama proses kompresi. Akibatnya kualitas data yang dihasilkan jauh lebih
rendah daripada kualitas data asli. Sementara itu, kompresi tipe lossless tidak
menghilangkan informasi setelah proses kompresi terjadi, akibatnya kualitas citra
hasil kompresi juga tidak berkurang [19].
Ada yang perlu diperhatikan dalam melakukan proses kompresi gambar ini, antara
lain [19] :
a. Resolusi
Resolusi adalah ukuran panjang kali lebar dalam suatu gambar yang
digambarkan dalam satuan pixel. Besar kecilnya resolusi akan berpengaruh
34. 20
pada kualitas gambar. Tetapi hal ini juga akan mempengaruhi jumlah bit
datanya dan proses transfer datanya.
b. Kedalaman bit
Kedalaman bit adalah banyak sedikitnya jumlah bit yang dibutuhkan unruk
menggambarkan suatu citra (gambar) dalam satuan bit/pixel. Tentu saja bila
dinalar, semakin banyak bit maka gambar yang dihasilkan akan lebih bagus.
c. Redundansi
Redundansi adalah keadaan di mana representasi suatu elemen data tidak
bernilai signifikan dalam menggambarkan keseluruhan data.
4. Image Refresention & Modelling (representasi dan permodelan gambar)
Representasi mengacu pada data konversi dari hasil segmentasi ke bentuk yang
lebih sesuai untuk proses pengolahan pada komputer. Keputusan pertama yang
harus sudah dihasilkan pada tahap ini adalah data yang akan diproses dalam
batasan-batasan atau daerah yang lengkap. Batas representasi digunakan ketika
penekanannya pada karakteristik bentuk luar, dan area representasi digunakan
ketika penekanannya pada karakteristik dalam, sebagai contoh tekstur. Setelah
data telah direpresentasikan ke bentuk tipe yang lebih sesuai, tahap selanjutnya
adalah menguraikan data [19].
2.2.7 Frame
Frame merupakan gambar diam dalam sebuah video. Seperti halnya gambar
digital, frame terdiri dari piksel (elemen gambar), dengan masing-masing pixel yang
mewakili warna dalam gambar [20].
Semakin tinggi jumlah piksel, semakin akurat gambar yang dapat dilihat. Ini
disebut juga dengan resolusi, dan diukur dalam megapixel [20].
2.2.8 Background Subtraction
Yang dimaksud background adalah sejumlah piksel-piksel gambar yang diam
dan tidak bergerak didepan kamera. Model background yang paling sederhana
mengasumsikan bahwa seluruh kecerahan piksel background berubah-ubah secara
bebas, tergantung pada distribusi normalnya [26]. Sedangkan foreground adalah
35. 21
semua objek yang ada selain background dan biasanya foreground ini ada setelah
didapatkannya background [26].
Background subtraction merupakan salah satu tugas penting yang pertama kali
di kerjakan pada aplikasi computer vision. Output dari background subtraction
biasanya adalah inputan yang akan diproses pada tingkat yang lebih lanjut lagi
seperti mentracking objek yang teridentifikasi [26]. Kualitas background subtraction
umumnya tergantung pada teknik pemodelan background yang digunakan untuk
mengambil background dari suatu layar kamera. Background subtraction biasanya
digunakan pada teknik segmentasi objek yang dikehendaki dari suatu layar, dan
sering diaplikasikan untuk sistem pengawasan [26].
Tujuan dari background subtraction itu sendiri adalah untuk menghasilkan
urutan frame dari kamera dan mendeteksi seluruh objek foreground. Suatu deskripsi
pendekatan yang telah ada tentang background subtraction adalah mendeteksi objek-
objek foreground sebagai perbedaan yang ada antara frame sekarang dan gambar
background dari layar statik [26].
Background subtraction adalah proses untuk menemukan obyek pada image
dengan cara membandingkan image yang ada dengan sebuah model latar belakang
[6]. Prosedur background subtraction terdiri dari 3 tahap, yaitu pre-processing,
background modeling, dan foreground detection [6].
Penambahan tahap post-processing setelah Background Subtraction dapat
meningkatkan akurasi deteksi objek. Tahap post-prosessing ini diisi dengan teknik
filtering. Fase background subtraction dimulai dengan membaca frame video, dari
frame video diinisialisasi model background [22]. Kemudian frame video masukan
selanjutnya dibandingkan dengan model background. Selisih nilai pixel merupakan
foreground yang terdeteksi. Selanjutnya foreground terdeteksi masuk dalam tahap
post-processing untuk memperbaiki kualitas foreground yang meningkatkan kualitas
deteksi objek[22].
Background subtraction, juga dikenal sebagai Foreground Detection, yang
merupakan suatu teknik di bidang pengolahan image dan visi komputer di mana latar
depan gambar diekstrak untuk diproses lebih lanjut (object recognition dll) [6].
Umumnya daerah image ini seperti benda (manusia, kendaraan, benda, teks) yang
berada di latar depannya. Pengurangan latar belakang merupakan pendekatan yang
36. 22
banyak digunakan untuk mendeteksi obyek bergerak dalam video dari kamera statis
[6]. Dasar pemikiran dalam pendekatan ini bahwa mendeteksi obyek bergerak dari
perbedaan antar frame dan kerangka acuan, yang sering disebut "gambar latar
belakang", atau "model latar belakang.
Salah satu penerapan yang sangat penting adalah menemukan obyek bergerak
yang merupakan sebuah foreground. Dalam foreground, model latar belakang
dikurangkan dari setiap frame untuk menemukan latar benda bergerak dalam video
[6]. Ada banyak tantangan yang berkaitan dengan latar belakang pemodelan. Model
latar belakang yang baik harus beradaptasi dengan perubahan kondisi seperti
pencahayaan, bayangan, dan benda-benda non-stasioner lain seperti hujan, daun dan
salju. Ada banyak aplikasi latar belakang pemodelan misal pemantauan lalu lintas,
menghitung orang, obyek pelacakan dll [21]. Dalam kasus sederhana, frame
sebelumnya dianggap sebagai frame latar belakang pada setiap frame.
Kemudian ada pendapat yang mengatakan Background Subtraction atau
pengurangan latar belakang adalah salah satu dari low-level operasi dasar dalam
analisis video [21]. Tujuannya adalah untuk memisahkan informasi statis yang
disebut "latar belakang" dari benda-benda bergerak yang disebut "latar depan". Latar
belakang perlu dimodelkan dan diperbarui dari waktu ke waktu untuk
memungkinkan deteksi foreground yang kuat [22]. Baru-baru ini, rekonstruksi model
pembelajaran, seperti analisis komponen utama telah digunakan untuk memodelkan
latar belakang, secara signifikan mengurangi dimensi data itu. Pendekatan ini
didasarkan pada asumsi bahwa informasi utama yang terkandung dalam urutan
pelatihan adalah latar belakang yang berarti bahwa latar depan memiliki kontribusi
rendah [22]. Namun, asumsi ini hanya diverifikasi ketika benda bergerak baik kecil
atau jauh dari kamera. Tujuan utama untuk mencakup variabilitas dari data pelatihan
dan sehingga mereka memberi lebih banyak usaha untuk memodelkan latar belakang
dengan cara terawasi daripada tepat mengklasifikasikan piksel sebagai latar depan
atau latar belakang dalam deteksi foreground [23].
37. 23
(a) (b) (c)
Gambar 2.1 : (a) background, (b) foreground,
(c) background subtraction [23]
(a) (b) (c)
Gambar 2.2 : (a) frame, (b) model background,
(c) hasil Background Subtraction [25]
38. 24
Gambar 2.3 : Contoh frame dengan pengurangan latar belakang [24]
Dalam survey tentang Background Subtraction, ada beberapa permasalahan
pokok atau bisa disebut tantangan dalam mengembangkan algoritma background
subtraction [24], yaitu:
Perubahan Cahaya : model background harus beradaptasi terhadap perubahan
pencahayaan
Background bergerak : model background harus mencakup perubahan pada
background, seperti pohon melambai
Bayangan : model background mencakup bayangan dari obyek bergerak, untuk
memiliki deteksi lebih akurat dari bentuk benda bergerak
Bootstrap : model background harus benar mengatur bahkan dalam adanya
pelatihan (bebas dari benda bergerak) lengkap dan statis ditetapkan pada awal
urutan;
Kamuflase : obyek bergerak tetap terdeteksi bahkan jika fitur kromatik obyek
mirip dengan model backgorund [24].
39. 25
2.2.9 Morfologi
R. C. Gonzalez and R. E. Woods mengatakan bahwa morfologi merupakan satu
cabang dari pengolahan citra yang sangat bermanfaat dalam analisis bentuk dalam
citra. Morfologi didasarkan pada bentuk segmen atau region dalam citra [25].
Morfologi atau kadang disebut mathematical morphology adalah alat untuk
mengekstrak komponen-komponen citra digital yang berguna dalam representasi dan
deskripsi dari suatu gambar [25]. Morfologi dapat diterapkan sebagai langkah awal
ataupun akhir dari proses analisis citra digital untuk jenis gambar biner (0 dan 1) atau
citra dengan skala keabuan (0-255) atau grayscale [25]. Namun, umumnya morfologi
biasanya diterapkan pada citra biner. Perbedaan pada pemrosesan image secara
morfologis adalah suatu image dipandang sebagi himpunan, yang sebelumnya
dipandang sebagai suatu fungsi intensitas terhadap posisi (x,y).
Secara umum, pemrosesan image secara morfologi dilakukan dengan cara
mem-passing sebuah structuring element (SE) terhadap sebuah image dengan cara
yang hampir sama dengan konvolusi [25]. Structuring element dapat diibaratkan
dengan mask pada pemrosesan image. Structuring element dapat berukuran
sembarang, namun Matlab menyediakan beberapa bentuk structuring element seperti
: line, disk, diamond, arbitary, square, rectangle.
Terdapat dua operasi dasar dalam morfologi yaitu dilasi dan erosi, operasi
lainnya dibangun dari kombinasi antara keduanya [25] :
1. Dilation (Dilasi)
Merupakan proses penggabungan titik-titik latar menjadi bagian dari objek
berdasarkan structuring element yang digunakan. Dilasi dilakukan dengan
meletakkan titik poros SE pada titik A kemudian diberi angka 1 untuk semua
titik(x,y) yang terkena/tertimpa oleh structuring element pada posisi tersebut.
2. Erotion (Erosi)
Merupakan proses penghapusan titik-titik objek(1) menjadi bagian dari latar(0),
berdasarkan stucturing elements (SE) yang digunakan. Erosi dilakukan dengan
meletakkan titik poros SE pada titik A kemudian jika ada bagian dari SE yang
berada diluar A, maka titik poros akan dihapus atau dijadikan latar.
40. 26
3. Opening
Operasi erosion sangat berguna dalam menghilangkan objek-objek kecil yang
terdapat dalam gambar, namun operasi ini memiliki kelemahan, yaitu terjadinya
penurunan ukuran objek yang lainnya. Untuk mengatasi hal tersebut, dapat
dilakukan operasi dilation setelah melakukan operasi erosion dengan
menggunakan structuring elements (SE) yang sama. Kombinasi dari kedua
operasi ini disebut opening [25].
4. Closing
Sama seperti opening, operasi closing merupakan penggabungan antara operasi
erosion dan dilation. Namun, pada closing operasi dilation dilakukan terlebih dulu
kemudian baru diikuti dengan operasi erosion [25].
Hasil operasi closing hampir mirip seperti hasil operasi dilation, yaitu
memperbesar batas luar dari foreground objek dan juga menutup lubang kecil
yang terletak di tengah objek. Akan tetapi, hasil operasi closing tidak sebesar
operasi dilation. Hasil dari operasi dilation akan menyebabkan pembengkakkan
bentuk keseluruhan objek. Efek ini dapat dikurangi dengan menerapkan proses
erosion setelah proses dilation [25].
2.2.10 Artificial Neural Network
Jaringan Syaraf Tiruan dibuat pertama kali pada tahun 1943 oleh
neurophysiologist Waren McCulloch dan logician Walter Pits, namun teknologi yang
tersedia pada saat itu belum memungkinkan mereka berbuat lebih jauh [18].
Jaringan Syaraf Tiruan adalah paradigma pemrosesan suatu informasi yang
terinspirasi oleh sistim sel syaraf biologi, sama seperti otak yang memproses suatu
informasi. Elemen mendasar dari paradigma tersebut adalah struktur yang baru dari
sistim pemrosesan informasi [18]. Jaringan Syaraf Tiruan, seperti manusia, belajar
dari suatu contoh.
Jaringan Syaraf Tiruan dibentuk untuk memecahkan suatu masalah tertentu
seperti pengenalan pola atau klasifikasi karena proses pembelajaran. Jaringan Syaraf
Tiruan berkembang secara pesat pada beberapa tahun terakhir [18]. Jaringan Syaraf
Tiruan telah dikembangkan sebelum adanya suatu komputer konvensional yang
41. 27
canggih dan terus berkembang walaupun pernah mengalami masa vakum selama
beberapa tahun [18].
Artificial Neural Network (ANN) sebagai cabang dari ilmu kecerdasan buatan
(artificial intelligence) merupakan salah satu sistem pemrosesan informasi yang
didesain dengan menirukan cara kerja otak manusia dalam menyelesaikan suatu
masalah. Alexander dan Morton dalam Suyanto [17] mendefinisikan ANN sebagai
prosesor tersebar paralel yang sangat besar yang memiliki kecendrungan untuk
menyimpan pengetahuan yang bersifat pengalaman dan membuatnya untuk siap
digunakan.
Otak terdiri dari sekitar (10.000.000.000) sel syaraf yang saling berhubungan.
Sel syaraf mempunyai cabang struktur input (dendrites), sebuah inti sel dan
percabangan struktur output (axon). Axon dari sebuah sel terhubung dengan
dendrites yang lain melalui sebuah synapse [18]. Ketika sebuah sel syaraf aktif,
kemudian menimbulkan suatu signal electrochemical pada axon. Signal ini melewati
synapses menuju ke sel syaraf yang lain. Sebuah sel syaraf lain akan mendapatkan
signal jika memenuhi batasan tertentu yang sering disebut dengan nilai ambang atau
(threshold) [18].
Gambar 2.4 : Susunan saraf manusia [18]
42. 28
Gambar 2.5 : Sebuah Sel Syaraf Sederhana [18]
Gambar 2.6 : Hubungan antara 2 buah neuron [18]
Gambar 2.7: Model neuron [18]
Berdasarkan dari arsitektur (pola koneksi), Jaringan Syaraf Tiruan dapat dibagi
kedalam dua kategori [18] :
a. Struktur feedforward
43. 29
Sebuah jaringan yang sederhana mempunyai struktur feedforward dimana signal
bergerak dari input kemudian melewati lapisan tersembunyi dan akhirnya
mencapai unit output (mempunyai struktur perilaku yang stabil).
Yang termasuk dalam struktur feedforward :
- Single-layer perceptron
- Multilayer perceptron
- Radial-basis function networks
- Higher-order networks
- Polynomial learning networks
Gambar 2.6 : Jaringan Syaraf Tiruan Feedforward [18]
b. Jika suatu jaringan berulang (mempunyai koneksi kembali dari output ke input)
akan menimbulkan ketidakstabilan dan akan menghasilkan dinamika yang sangat
kompleks.
Yang termasuk dalam stuktur recurrent (feedback) :
- Competitive networks
- Self-organizing maps
- Hopfield networks
- Adaptive-resonanse theory models
44. 30
Gambar 2.7 : Jaringan Syaraf Tiruan Feedback [18]
Lebih lanjut dijelaskan bahwa ANN dibentuk sebagai generalisasi model
matematika dari jaringan syaraf biologi dengan asumsi : pemrosesan informasi
terjadi pada banyak elemen sederhana (neuron); sinyal dikirimkan diantara neuron-
neron melalui penghubung-penghubung; penghubung antar neuron memiliki bobot
yang akan memperkuat atau memperlemah sinyal; dan untuk menentukan output
setiap neuron menggunakan fungsi aktivasi yang dikenakan pada jumlahan input
yang diterima, besarnya output ini selanjutnya dibandingkan dengan suatu batas
ambang [17]. Dengan demikian ANN ditentukan oleh tiga hal, yaitu : (1) pola
hubungan antar neuron (disebut arsitektur jaringan); metode untuk menentukan bobot
penghubung (disebut metode training/ learning/ algoritma); dan fungsi aktivasi [17].
ANN telah banyak diaplikasikan dan sangat sukses digunakan untuk
memecahkan berbagai masalah dalam berbagai disiplin ilmu seperti bidang
komputer, teknik, ilmu murni, perdagangan, financial dan lain-lain [15].
Menurut Zurada, J.M., Introduction To Artificial Neural Systems, Boston : PWS
Publishing Company, mendefinisikan sebagai berikut: “Sistem saraf tiruan atau
jaringan saraf tiruan adalah sistem selular fisik yang dapat memperoleh, menyimpan
dan menggunakan pengetahuan yang didapatkan dari pengalaman” [15].
DARPA Neural Network Study mendefinisikan jaringan syaraf buatan sebagai
berikut : Sebuah jaringan syaraf adalah sebuah sistem yang dibentuk dari sejumlah
elemen pemroses sederhana yang bekerja secara paralel di mana fungsinya
ditentukan oleh struktur jaringan, kekuatan hubungan, dan pengolahan dilakukan
pada komputasi elemen atau nodes [15].
45. 31
Gambar 2.8 : Ilustrasi proses JST [15]
Gambar 2.9 : Contoh model JST Single Layer [18]
Gambar 2.10 : Contoh model JST Single Layer [18]
46. 32
Gambar 2.11 : Contoh model JST Competitive Layer / Recurrent [18]
Jaringan Syaraf Tiruan dirancang agar komputer dapat bekerja seperti/layaknya
otak manusia. Berikut ini beberapa keunggulan dari Jaringan Syaraf Tiruan [18] :
1. Adaptive learning: Suatu kemampuan untuk melakukan suatu kegiatan yang
didasarkan atas data yang diberikan pada saat pembelajaran atau dari pengalaman
sebelumnya.
2. Self-Organisation: Dapat membuat organisasi sendiri atau me-representasikan
informasi yang didapat pada saat pembelajaran.
3. Real Time Operation: Dapat menghasilkan perhitungan parallel dan dengan
device hardware yang khusus yang dibuat akan memberikan keuntungan dengan
adanya kemampuan tersebut.
4. Fault Tolerance melalui Redundant Information Coding: Kerusakan pada bagian
tertentu dari jaringan akan mengakibatkan penurunan kemampuan. Beberapa
jaringan mempunyai kemampuan untuk menahan kerusakan besar pada jaringan.
5. Kelebihan Jaringan Syaraf Tiruan terletak pada kemampuan belajar yang
dimilikinya. Dengan kemampuan tersebut pengguna tidak perlu merumuskan
kaidah atau fungsinya. Jaringan Syaraf Tiruan akan belajar mencari sendiri kaidah
atau fungsi tersebut. Dengan demikian Jaringan Syaraf Tiruan mampu digunakan
untuk menyelesaikan masalah yang rumit dan atau masalah yang terdapat kaidah
atau fungsi yang tidak diketahui.
6. Kemampuan Jaringan Syaraf Tiruan dalam menyelesaikan masalah yang rumit
telah dibuktikan dalam berbagai macam penelitian [18].
47. 33
2.3 Pengolahan Image
Pengolahan yang diusulkan dibagi menjadi dua kategori, yaitu background
subtraction dan menggunakan jaringan saraf tiruan untuk mengklasifikasikan ekstrak
fitur. Fungsi keseluruhan sistem yang diusulkan direpresentasikan secara grafis.
Seperti pada gambar berikut.
Gambar 2.9 : Pengolahan Image
Background
Subtraction
Jumlah Obyek Bergerak
Input Video
Neural Network
Based People
Counting
ClosingOpening
Morfologi
ErotionDilation
48. 34
2.4 Kerangka Pemikiran
Gambar 2.10 : Kerangka Pemikiran
RESULT
Dapat diketahui jumlah
pedestrian di suatu tempat
PROPOSED APPROACH
Background Subtraction dan Neural
Network digunakan untuk menghitung
pejalan kaki
PROBLEMS
Belum diketahui jumlah pejalan
kaki disuatu tempat
METHOD TEST AND
EXPERIMENT
Data
Video
Eksperimen :
Simulasi dengan
MatLab
EVALUATION AND
VALIDATION
Mendapatkan
penghitungan
Pembuktian
eksperimen
49. 35
BAB III
METODE PENELITIAN
Sudut pandang seorang peneliti juga mengadopsi pengaruh-pengaruh segala
metode penelitian untuk digunakan sebagai bagian dari metodologi penelitian mereka
untuk memberikan bukti yang dapat diandalkan mengenai fenomena yang diteliti.
Untuk penelitian ini, mempergunakan cara penelitian eksperimen.
Tahapan dari metode penelitian tersebut adalah :
3.1 Pengumpulan Data
Pada penelitian ini menggunakan 1 data primer. Data ini berupa video
berformat .mpg yang diekstrak menjadi image. Data berupa video obyek orang
berjalan pada suatu ruangan yang berdurasi 36 detik dengan dimensi frame 352X240,
frame rate 29/detik. Data ini diambil pada tanggal 18 Februari 2012 di lobby Gedung
Pascasarjana Universitas Dian Nuswantoro Semarang.[23]
Konversi video menjadi citra menggunakan video2pic.m, yang dibuat dari
program mathlab. Data (video obyek dalam ruangan) diekstrak menjadi 100 buah
frame dan disimpan dengan format .JPG. Dari hasil ekstraksi data akan diambil 40
citra secara berurutan yang akan digunakan sebagai sampel pada eksperimen yang
akan dilakukan.
Gambar 3.1 : Dataset Video
50. 36
Gambar 3.2 : Hasil Ekstraksi Video
3.2 Pengolahan Data Awal
Dalam rangka mempermudah penggunaan data, dataset dsiapkan dengan nama
folder “hitung” yang berisi data frame 100 citra hasil ekstraksi dari video yang
digunakan untuk eksperimen. Citra ditandai pada bagian objeknya. Penandaan
berupa persegi atau yang lebih sering disebut bounding box.
Gambar 3.3 : Penandaan Objek
51. 37
3.3 Metode Yang Diusulkan
Metode yang diusulkan untuk penelitian ini menggunakan neural network pada
background substraction untuk mengelompokkan pixel pada citra termasuk sebagai
background atau foreground. Ditambahkan operasi morfologi dan median filtering dalam
rangka meningkatkan performa dari model yang diajukan. Berdasarkan Gambar 10 maka
metode yang diusulkan pada penelitian ini dapat dijelaskan antara lain :
Sebelum dilakukan eksperimen, maka peneliti mengusulkan sebuah model agar
dapat dilakukan secara bertahap. Usulan model ini sebagai berikut :
Gambar 3.4 : Usulan Model Eksperimen
Tahapan pada usulan penelitian ini :
3.3.1 Input image frame
Data image/citra yang di ambil dari data video disiapkan dalam pengolahan
data awal.
3.3.2 Preprosessing
Image frame hasil ekstraksi mempunyai ruang warna RGB. Setiap image
frame akan masuk proses inisialisasi. Kemudian didapatkan threshold. Tahap
preprocessing ini dilakukan sebagai persiapan dalam pendeteksian foreground
menggunakan Background Subtraction.
3.3.3 Background Substraction
Pada tahap background substraction berisi beberapa proses. Dimulai dengan
memilih cluster terbaik dari background yang dibandingkan dengan nilai threshold
yang telah ditetapkan, mengubah frame menjadi biner yang kemudian dilakukan
noise reduction dengan operasi morfologi agar mendapat hasil background dan
foreground.
Dataset Preprocessing Background
Subtraction
Neural
Network
Validasi
Hasil
52. 38
3.3.4 Neural network
Tahapan ini diaplikasikan teknik Morfologi dan filtering untuk memperbaiki
hasil segmentasi dari Background Substraction. Teknik yang dapat digunakan dalam
post-prosessing seperti Morfologi (Closing, Opening, Dilation, Erotion). Sehingga
Neural Network bisa digunakan dalam penghitungan orang.
3.3.5 Evaluasi dan validasi hasil (Result Evaluation)
Pada tahap ini dilakukan evaluasi terhadap model yang ditetapkan untuk
mengetahui tingkat performa model.
3.4 Eksperimen dan Pengujian Metode
Pada tahapan ini menjelaskan tentang teknik pengujian yang digunakan. Deteksi
objek dilakukan menggunakan metode background subtraction. Proses eksperimen
dan pengujian menggunakan dataset yang telah disiapkan dari tahap sebelumnya.
Tahap ini akan dijalankan deteksi objek menggunakan background subtraction pada
data set. Hasil deteksi akan dihitung menggunakan neural network dan dilakukan
pengaturan parameter unutk mendapatkan performance dan akurasi terbaik.
3.5 Evaluasi Hasil
Pada tahap ini dibahas tentang hasil evaluasi dari eksperimen yang telah
dilakukan. Dari dataset yang digunakan akan diperoleh klasifikasi Setelah itu dengan
dataset yang ada neural network dan tahap post-processing yang diajukan,
diaplikasikan dalam proses deteksi objek dengan dataset yang sama. Dari hasil yang
diperoleh kemudian diharapkan dalam penelitian ini background subtraction dan
neural network yang diajukan bekerja dengan baik.
.
53. 39
BAB IV
HASIL DAN PEMBAHASAN
4.1 Analisis
Penelitian ini berusaha untuk menghitung objek dari citra yang diujikan dengan
hasil akhir berupa perhitungan pejalan kaki. Penjelasan dilakukan dengan
background subtraction menggunakan jaringan syaraf tiruan dengan preprocessing
pada citra objek.
Selanjutnya didapatkan hasil langkah-langkah dari eksperimen yang dilakukan.
Seperti yang sudah dijelaskan pada bab sebelumnya, penelitian ini menggunakan 1
data sekunder berupa video obyek orang berjalan pada suatu ruangan yang berdurasi
1 menit 44 detik dengan dimensi frame 352X240, frame rate 29/detik dan format
MPG. Eksperimen menggunakan software tools matlab R2012a, dengan hardware
processor atom dan RAM 2 Gb.
4.2 Hasil Eksperimen
4.2.1 Pengumpulan Data
Data yang berupa video obyek berjalan dalam ruangan diekstrak menjadi 100
buah citra dan disimpan dengan format JPG. Dari hasil ekstraksi data, akan diambil
40 citra secara berurutan yang akan digunakan sebagai sampel pada eksperimen yang
akan dilakukan.
Gambar 4.1 : Image hasil ekstraksi video
54. 40
4.2.2 Pengolahan Data Awal
Langkah pengolahan awal yang telah dilakukan pada citra yaitu : hitung frame,
simpan frame, ubah frame RGB menjadi frame Gray.
1. Hitung frame
Setelah video diinput, maka video tersebut dihitung berapa jumlah
framenya. Ini dimaksudkan untuk memberiikan pelabelan/penomoran pada
frame.
%hitung jumlah frame
numFrames = get(readerobj, 'numberOfFrames');
2. Simpan frame
Setelah frame dihitung dan diberi pelabelan/penomoran, maka frame-frame
tersebut disimpan.
% simpan frame dalam bentuk structur
for k = 1 : numFrames-1
k
mov(k).cdata = vidFrames(:,:,:,k);
mov(k).colormap = [];
end
3. Ubah warna frame dari RGB menjadi Gray
Setelah video menjadi frame, maka dilakukan pengkonversian citra RGB
menjadi citra abu-abu (grayscale) dan hitam-putih (black & white). Pada
langkah ini citra RGB diubah terlebih dahulu menjadi citra abu-abu dan
kemudian diubah kembali menjadi citra hitam putih dan atau thresholding
untuk mendapatkan citra yang hanya terdiri atas 2 kondisi warna hitam atau
putih (0 atau 255).
%Keterangan proses mulai
g = rgb2gray(f(:, :, :, j));
% ubah frame rgb menjadi Gray
55. 41
Hasilnya akan terlihat pada gambar berikut :
(a) (b)
Gambar 4.2 : Merubah frame RGB to Gray
(a) Frame RGB (b) Frame Gray
Gambar diatas juga menunjukkan hasil dari olahan data awal, urutan video
dengan gerak pada aktifitas orang berjalan. Tampilan pada gambar (a)
adalah tampilan awal data yaitu image frame original pada awal frame
image, gambar (b) adalah tampilan frame setelah dirubah dari RGB menjadi
Gray.
4. Frame Difference
Sedangkan teknik frame differencing atau perbedaan frame adalah
menghitung selisih antara frame yang satu dengan frame yang lainnya,
dalam hal ini adalah frame sekarang dikurangi frame sebelumnya sehingga
mendapatkan objek yang diinginkan (26).
Proses awal pengolahan data dilakukan dengan proses frame difference
dengan proses klastering menggunakan algoritma K-means. Ditambahkan
dengan pola tahap post-prosessing dengan proses cleaning, pada proses
morfologi yang diterapkan yaitu proses dilasi dan proses rode. Pada
program yang dibuat dilakukan dari proses awal hingga akhir dalam satu
gerakkan objek.
| - | > Threshold …....(28)
Dalam hal ini, maka setelah frame menjadi diubah menjadi gray, maka
frame akan dibedakan antara frame background dan frame yang telah ada
56. 42
obyeknya. Sebelumnya kita telah menentukan dulu frame backgroundnya
dengan kode seperti berikut :
d = imabsdiff(rgb2gray(f(:, :, :, end)), g);
% hitung perbedaan abs frame background dgn motion
frame.
Pada hasil pengolahan awal dataset didapat hasil ekstrasi dari video berupa
frame image yang terurut. Inisialisasi model frame difference diperoleh dari
frame pertama yang kemudian akan beradaptasi sesuai dengan perubahan
pada scene. Foreground dideteksi dari hasil pengurangan frame masukan
dengan model background. Tujuan dari frame difference untuk menghapus
background gambar sehingga foreground dapat terlihat dengan jelas.
(a) (b)
Gambar 4.3 : (a) Frame sebagai background (b) Frame yang terdapat objek
Dalam penelitian ini hasil dari frame difference dapat dilihat pada tabel 4.1
yang terdiri dari gambar kolom (a) urutan frame image hasil ekstraksi video,
gambar kolom (b) frame image (i), gambar kolom (c) merupakan frame
image masukan (i+1), sedangkan gambar kolom (d) merupakan frame image
yang didapat dari pengurangan antara frame image (i) dengan frame image
masukkan (i+1). Berikut adalah hasil dari metode frame difference :
57. 43
Tabel 4.1 : Hasil dari proses frame difference
No Urut Frame
Image
(a)
Frame Image (i)
(b)
No Urut
Frame Image – 1
(c)
Frame Image
Hasil FD
(FD = (i) – (i+1))
(d)
Ke-10
Ke-20
Ke-30
4.2.3 Deteksi Obyek Bergerak
Dari data video yang telah dirubah kedalam frame, akan didapatkan sebuah
obyek yang bergerak dan sudah bisa untuk di identifikasi.
Gambar 4.4 : Obyek bergerak pada video original
58. 44
4.2.3.1 Motion Vector
Dalam data video yang ada, dilakukan motion vector dengan menyimpan
perubahan gambar dari satu frame ke frame yang berikutnya. Hal ini untuk
menentukan arah dari pergerakan obyek bergerak. Dalam sebuah data video, motion
vektor editing digunakan untuk mengkompres video dengan cara menyimpan
perubahan gambar dari satu frame ke yang berikutnya. Proses ini disebut dengan
pointer bi-dimensi, yang berkomunikasi dengan decoder berapa banyak kiri atau
kanan dan atas atau bawah, yang macroblock prediksi terletak dari posisi macroblock
dalam kerangka acuan atau lapangan. [29]
Sebuah motion vector menunjukkan perpindahan sebuah titik di antara frame
sekarang dengan frame referensi. Dari motion vector yang didapat, akan terlihat
pergerakan titik-titik yang terjadi antar frame yang diamati. Dari situlah akan terlihat
korelasi elemen temporal yang terjadi, yaitu berupa pergerakan obyek, perubahan
sudut pandang, atau pergerakan kamera.
(a) (b)
Gambar 4.5 : (a) Frame original (b) Frame motion vector
4.2.3.2 Deteksi dan Pelacakan
Dengan melakukan deteksi dan pelacakan obyek pada data video, maka
didapatkan hasil dari obyek bergerak yang ditandai oleh boundaries, dan objek
bergerak yang terdeteksi. Seperti yang terlihat pada gambar berikut ini.
59. 45
Gambar 4.6 : Video hasil, obyek bergerak dengan boundaries
Gambar 4.7 : Video hasil, obyek bergerak yang terdeteksi
4.2.4 Threshold
Thresholding merupakan salah satu teknik segmentasi yang baik digunakan
untuk citra dengan perbedaan nilai intensitas yang signifikan antara latar belakang
dan objek utama. Dalam pelaksanaannya Thresholding membutuhkan suatu nilai
yang digunakan sebagai nilai pembatas antara objek utama dengan latar belakang,
dan nilai tersebut dinamakan dengan threshold.
Untuk proses awal yang banyak dilakukan dalam image processing adalah
mengubah citra berwarna menjadi citra gray-scale, hal ini digunakan untuk
menyederhanakan model citra. Seperti telah dijelaskan di depan, citra berwarna
terdiri dari 3 layer matrik yaitu R- layer, G-layer dan B-layer. Sehingga untuk
60. 46
melakukan proses-proses selanjutnya tetap diperhatikan tiga layer di atas. Bila setiap
proses perhitungan dilakukan menggunakan tiga layer, berarti dilakukan tiga
perhitungan yang sama. Sehingga konsep itu diubah dengan mengubah 3 layer di atas
menjadi 1 layer matrik gray-scale dan hasilnya adalah citra gray-scale. Dalam citra
ini tidak ada lagi warna, yang ada adalah derajat keabuan. Untuk mengubah citra
berwarna yang mempunyai nilai matrik masing-masing r, g dan b menjadi citra gray
scale dengan nilai s, maka konversi dapat dilakukan dengan mengambil rata-rata dari
nilai r, g dan b sehingga dapat dituliskan menjadi :
Bisa juga dengan memberi bobot (w) pada RGB karena mata manusia lebih
sensitif pada warna hijau, kemudian merah, terakhir biru.
Ko = wr Ri + wg Gi + wb Bi
Berdasarkan NTSC (National Television System Committee), dimana :
wr = 0.299
wg = 0.587
wb = 0.144
Threshold atau ambang batas mempunyai pengaruh pada hasil pengujian
dimana threshold berhubungan dalam mendeteksi objek, semakin rendah nilai
threshold nya maka semakin tinggi hasil dari objek, sehingga jika ada perubahan
sedikit saja objek akan mendeteksi. Dikarenakan perubahan cahaya sekitar dianggap
gerakan maka tidak akan efektif apabila nilai threshold terlalu rendah. Sedangkan
semakin tinggi threshold nya maka semakin rendah pendeteksian objek sehingga
kamera sulit untuk mendeteksi gerakan. Oleh karena itu nilai threshold diatur sesuai
dengan keadaan sekitarnya. Pada inputan citra, objek yang bergerak menggunakan
pakaian yang memiliki corak sehingga ketika objek yang bergerak menggunakan
pakaian yang corak warnanya agak berbeda dengan gambar background, maka
mudah untuk mendeteksi gerakan.
61. 47
Gambar 4.8 : Threshold
4.2.5 Background Subtraction
Yang dimaksud background adalah sejumlah piksel-piksel gambar yang diam
dan tidak bergerak didepan kamera. Model background yang paling sederhana
mengasumsikan bahwa seluruh kecerahan piksel background berubah-ubah secara
bebas, tergantung pada distribusi normalnya (26). Karakteristik background dapat
dihitung dengan mengakumulasi beberapa jumlah frame sehingga akan menemukan
jumlah nilai-nilai piksel dalam lokasi s(x,y) dan jumlah square-square sq(x,y) yang
memiliki nilai untuk setiap lokasi piksel. Sedangkan foreground adalah semua objek
yang ada selain background dan biasanya foreground ini ada setelah didapatkannya
background. Background subtraction merupakan salah satu tugas penting yang
pertama kali di kerjakan pada computer vision (26). Output dari background
subtraction biasanya adalah inputan yang akan diproses pada tingkat yang lebih
lanjut lagi seperti mentracking objek yang teridentifikasi. Kualitas background
subtraction umumnya tergantung pada teknik pemodelan background yang
digunakan untuk mengambil background dari suatu citra. Background subtraction
biasanya digunakan pada teknik segmentasi objek yang dikehendaki dari suatu layar,
dan sering diaplikasikan untuk sistem pengawasan. Tujuan dari background
subtraction itu sendiri adalah untuk menghasilkan urutan frame dari kamera dan
mendeteksi seluruh objek foreground (26). Suatu deskripsi pendekatan yang telah
ada tentang background subtraction adalah mendeteksi objek-objek foreground
62. 48
sebagai perbedaan yang ada antara frame sekarang dan gambar background dari
layar statik. Suatu piksel dikatakan sebagai foreground jika :
| - | > Threshold ..(27)
Gambar 4.9 : Ilustrasi Background Subtraction
4.2.6 Langkah dari metode yang disulkan
Background subtraction dilakukan untuk pemisahan latar depan dengan latar
belakang. Sehingga didapat hasil dari obyek yang sudah dilakukan pemisahan.
Metode ini bisa digunakan untuk mendeteksi sebuah obyek dari data image. Untuk
melakukan pemisahan maka dialakukan dulu clustering dan boundary untuk
mendapatkan hasil dari obyek yang terdeteksi.
Frame 1 Frame 23 Frame 100
Video
Sumber
63. 49
RGB to
Gray
Cluster 1
Cluster 2
Cluster
Terbaik
Hasil
Cluster &
boundary
Gambar 4.10 : Langkah-langkah hasil deteksi metode yang diusulkan, yaitu
background subtraction.
4.2.6.1 Memilih cluster yang terbaik
Setelah dicluster sebanyak 2 kali, maka hasil masing-masing cluster tersebut
akan dibandingkan dengan mencari hasil cluster yang terbaik. Berikut kode
matlabnya :
[best,v]=maxns(avgf);
64. 50
(a) (b) (c)
Gambar 4.11 : (a) Frame hasil cluster 1 (b) Frame hasil cluster 2 obyek (c) Frame
hasil pemilihan yang terbaik antara cluster ke-1 dan cluster ke-2
4.2.6.2 Ubah frame menjadi Biner
Setelah mendapatkan hasil cluster yang terbaik maka tahapan selanjutnya,
frame tersebut diubah menjadi biner sehingga akan terlihat perbedaan. Background
akan berwarna hitam, sedangkan foreground/obyek akan berwarna putih.
trz=0.1;
bw=im2bw(segmented_images{v},trz);
(a) (b)
Gambar 4.12 : (a) Frame hasil cluster (b) Frame hasil diubah ke biner
4.2.7 Noice Reduction
Setelah dirubah kedalam citra biner, dilakukan teknik morphology untuk
penebalan. Fungsinya untuk mengantisipasi hasil biner yang kurang baik. Proses
morfologi dilakukan untuk mencari bentuk dari obyek yang ada pada citra. Proses
morfologi biasanya bekerja pada citra biner.
65. 51
Operasi dilasi dilakukan untuk memperbesar ukuran segmen obyek dengan
menambah lapisan di sekeliling obyek. Operasi dilasi dilakukan untuk memperbesar
ukuran segmen obyek dengan menambah lapisan di sekeliling obyek.
Operasi erosi adalah kebalikan dari operasi dilasi. Pada operasi ini, ukuran
obyek diperkecil dengan mengikis sekeliling obyek.
% noise reduction
bw = bwareaopen(bw,100);
% tutup area yang kosong/lobang biar rapi.
imagen = imfilk, l(bw,'holes');
4.2.7.1 Hasil Cleaning berupa frame image
Proses cleaning pada eksperimen ini menerapkan dilate dan imrode pada
metode morfologi.
Operasi morphology yang digunakan adalah erotion. Dengan menggunakan
coding matlab seperti dibawah ini :
% Apply morphological operations to remove noise and fill in holes.
mask = imopen(mask, strel('rectangle', [3,3]));
mask = imclose(mask, strel('rectangle', [15, 15]));
mask = imfill(mask, 'holes');
Gambar 4.13 : Frame hasil morfologi
4.2.8 Jaringan Saraf tiruan
Pada langkah ini barulah data-data citra yang sudah didapat pada langkah
sebelumnya dimasukkan ke neural network guna dilakukan pelatihan dan pengujian
66. 52
pada data yang ada. Selanjutnya akan dilakukan klasifikasi dari hasil pelatihan dan
pengujian terhadap data yang ada. Nantinya akan ditentukan berapa persen
keberhasilan sistem dalam mendeteksi objek-objek yang diujikan kepadanya.
Menghitung obyek bergerak dari metode background subtraction dengan
menggunakan neural network pada ekperimen dengan data video. Dengan metode
yang diterapkan bahwa metode ini dapat mendeteksi objek pada setiap frame.
Dimulai dari frame masukan, kemudian image hasil post-processing, menunjukkan
image terdeteksi yang ditandai dengan bounding box.
Jaringan saraf tiruan digunakan juga sebagai metode dalam menghitung obyek
bergerak yang didapat dari proses background subtraction pada eksperimen ini. Dari
data video yang telah diekstrasi menjadi frame dan dilakukan pemisahan latar
belakang dengan obyek, maka deteksi dan pelacakan obyek bergerak bisa
diklasifikasikan dengan menggunakan jaringan saraf tiruan dan perhitungan dapat
dilakukan dengan baik.
4.2.8.1 Pelatihan Jaringan Saraf Tiruan
Proses pelatihan ini dilakukan untuk mendapatkan tingkat prosentase
klasifikasi kelompok piksel yang tergolong ke objek bergerak. Data set yang
digunakan untuk analisa jaringan syaraf tiruan merupakan data set dengan pasangan
parameter-parameter input dan target.
Jaringan saraf tiruan (Fausett 1994) [30] secara luas digunakan untuk mencari
pola klasifikasi dan pendekatan fungsi. Dalam penelitian ini, digunakan jaringan
saraf tiruan back-propagation untuk melakukan penghitungan orang berdasarkan fitur
yang telah diekstraksi dari analisis tekstur yang dilakukan sebelumnya.
Data untuk pelatihan jaringan menggunakan data frame citra, data untuk
pengujian menggunakan data sampel. Aplikasi jaringan syaraf tiruan menggunakan
algoritma backpropagation, dengan menggunakan logistic constant bernilai satu dan
β (beta) atau learning rate
Back-propagation neural network digunakan dengan single layer neuron
tersembunyi yang memuat N neuron. Jaringan syaraf tiruan digunakan dengan
lapisan tunggal neuron N tersembunyi. Bobot jaringan saraf yang diinisialisasi secara
acak dan fitur yang dimasukkan ke lapisan input dari jaringan saraf dan lapisan
67. 53
output (jumlah orang dalam frame). Perkiraan menghitung orang ini dibandingkan
dengan jumlah sebenarnya dari orang sebenarnya yang ada didalam frame dan
menghitung yang bukan orang sebenarnya digunakan dengan bobot jaringan saraf
tiruan.
Gambar 4.14 : Menghitung orang berdasarkan kerangka latih neural network. [30]
Untuk bobot, setelah jaringan saraf tiruan dilatih oleh jumlah pelatihan pola
yang memadai, juga dapat digunakan untuk menghitung orang-orang di frame yang
tidak diketahui.
4.2.8.2 Input Layer
Untuk mengklasifikasi pejalan kaki, diperlukan data objek yang bergerak pada
data video yang telah dirubah menjadi frame citra. Input Layer terdiri dari neuron
yaitu frame dan obyek bergerak.
4.2.8.3 Output Layer
Output Layer terdiri dari neuron yaitu objek bergerak yang terdeteksi dan tidak
terdeteksi sebagai pejalan kaki.
4.2.8.4 Hidden layer
Pada proses nantinya, jumlah lapisan tersembunyi dapat dicoba (trial and error)
sampai diketemukan berapa ukuran untuk hasil yang cepat dan memenuhi galat yang
Fitur dari
pengolahan citra
Menghitung orang
menggunakan neural
network
Menghitung orang yang
sebenarnya
Error
68. 54
diinginkan. Jumlah hidden layer yang optimal tergantung pada faktor jumlah neuron
pada input layer, jumlah neuron pada output layer, jumlah traning set, besarnya noise
pada target, kompleksitas fungsi error, arsitektur jaringan dan algoritma training
(Sarles, 1997) [35].
4.2.8.5 Data Video Eksperimen
Penelitian dilakukan pada video pejalan kaki. Video memiliki resolusi 960 dan
720 piksel sepanjang sumbu horisontal dan vertikal.
Penelitian ini menggunakan frame dari video untuk pelatihan dan pengujian
algoritma. Penghitungan manual pejalan kaki untuk setiap frame baik terhadap
pelatihan dan pengujian dataset dilakukan untuk mencari yang terdeteksi dengan
tidak terdeteksi objek. Penghitungan manual dilakukan dua kali untuk memperbaiki
variabilitas intra-rater (yaitu, variabilitas yang terjadi bahkan saat penghitungan
dilakukan oleh penilai tunggal / individu) [30].
4.2.8.6 Hasil Pengujian
Untuk memvalidasi kerangka yang diusulkan, ground truth video dihitung dan
disimpan dalam file untuk 100 frame. Pada langkah pertama, frame background
dihitung melalui median filter menggunakan sejumlah frame. Frame latar belakang
ini dikurangi dari frame untuk segmentasi yang bergerak di video.
Gambar 4.15 : Representasi frame dari video
Gambar 4.16 (a) menunjukkan representatif dari data video asli. Gambar 4.16
(b) menunjukkan frame latar depan dari hasil background subtraction. Pada frame ini
orang berjalan disegmentasi, namun masih terdapat noise pada proses segmentasi.
Untuk menghilangkan noise tersebut proses erosi dilakukan. Untuk menghilangkan
69. 55
noise tersebut maka erosi digunakan pada frame foreground. Gambar 4.16 (c)
menunjukkan foreground setelah erosi.
(a) Representasi frame video asli
(b) Foreground segmentasi
(c) Erosi pada foreground
Gambar 4.16 : Ekstraksi foreground dari aslinya
Pada proses erosi, noise bisa dihilangkan, namun beberapa piksel yang baik
pun bisa terhapus. Analisis tekstur akan dilakukan pada frame ini untuk mengekstrak
tekstur fitur seperti kontras, korelasi, entropi dll Teknik lain seperti segmentasi
foreground digunakan berdasarkan pada deteksi tepi menggunakan homogenitas.
70. 56
Untuk mempelajari sensitivitas, setiap fitur diplot ground truth (jumlah objek
yang terdeteksi benar dalam frame). Untuk menguji kinerja jaringan saraf, kesalahan
prediksi dari menghitung orang dihitung dalam data set pengujian. Seluruh data
dibagi ke pelatihan dan pengujian data (100 frame masing-masing) 20 kali acak
untuk membuat hasil statistik yang dapat diterima. Kesalahan dari menghitung orang
ditemukan menjadi 4,03% ± 4,10% pada pengujian data set. Untuk satu pengujian
data, jaringan saraf tiruan digunakan menghitung orang terhadap jumlah yang
sebenarnya. Hal ini dapat dilihat dari angka yang berkorelasi kuat. Kesalahan
prediksi (dalam persentase) dari orang penghitungan juga diplot dan dapat dilihat
dari angka kesalahan di sebagian besar frame adalah di bawah 5%. Hasil ini
menunjukkan jaringan saraf yang diusulkan berdasarkan menghitung orang dari data
set video bisa dilakukan dengan baik.
4.3 Pengujian Model
Evaluasi model merupakan tahapan yang di kerjakan dalam penelitian dengan
tujuan untuk memperoleh informasi yang terdapat pada hasil klsifikasi yang
diperoleh dari algoritma yang digunakan. Dalam penelitian ini dipilih alat ukur
evaluasi berupa confusion matrix dengan tujuan untuk mempermudah dalam
menganalisis perfoma algoritma karena confusion matrix memberikan informasi
dalam bentuk angka sehinga dapat dihitung rasio keberhasilan klsifikasi.
Tabel 4.2 : Confusion matrix
Confusion Matrix Actual Class
Predicted Class
Positive Negative
Positive TP FP
Negative FN TN
4.3.1 Teknik Pengukuran Confusion Matrik
Klasifikasi adalah proses pembelajaran secara terbimbing (supervised
learning). Untuk melakukan klasifikasi, dibutuhkan training set sebagai data
pembelajaran.
71. 57
Precission rate adalah rasio jumlah frame obyek yang benar terdeteksi sebagai
obyek (true positive) dengan frame obyek yang benar tereteksi sebagai obyek (true
positive) dan jumlah frame obyek yang tidak benar terdeteksi sebagai obyek (false
positive).
Recall rate adalah rasio frame obyek yang benar terdeteksi sebagai obyek (true
positive) dengan jumlah frame obyek yang benar terdeteksi sebagai obyek (true
positive) dan jumlah frame obyek yeng tidak terdeteksi sebagai obyek (false
negative).
4.3.1.1 Alat ukur evaluasi
True positive (TP) adalah proporsi contoh yang diklasifikasikan sebagai :
Positive predictive value =
Positive predictive value =
False Positive =
False Negative =
The Precision =
The Recall =
F – Measure =
72. 58
4.3.1.2 Rumus Mencari Akurasi
Adapun rumus untuk menghitung akurasi adalah sebagai berikut :
Akurasi = =
Rumus untuk mencari nilai akurasi error rate
Error = =
Untuk atribut yang bernilai biner ( 0 atau 1) yang bisa mengandung arti “ya”
atau “tidak”, “setuju” atau “Tidak Setuju”, “absen” atau “hadir”, “Positif” atau
“negatif” dan lain sebagainya yang hanya menghasilkan dua kemungkian, maka
similaritas dan dissimilarity bisa dilakukan dengan cara menghitung jumlah atau
frekuensi dari kombinasi seluruh atribut yang bernilai 1 (positif) dan 0 (negatif), jika
kita mempunyai dua objek A dan B dengan jumlah atribut/variable n dan masing-
masing variable mempunyai nilai biner maka kombinasi nilai variable-nya
dinotasikan adalah sebagai berikut :
TP adalah representasi untuk total variable dimana A dan B mempunyai nilai 1
FN adalah representasi untuk total variable dimana A mempunyai nilai 0 sedangkan
dan B mempunyai nilai 1
FPadalah representasi untuk total variable dimana A mempunyai nilai 1 sedangkan
dan B mempunyai nilai 0
TN adalah representasi untuk total variable dimana A dan B mempunyai nilai 0
Dan TP+FN+FP+TN = n
Dimana :
True Positive : Objek pejalan kaki pada citra uji terdeteksi dengan tepat menurut
penglihatan manusia.
True Negative : Mendeteksi beberapa kesalahan pada citra uji seperti kotak yang
menandai pejalan kaki pada citra uji tidak tepat, satu kotak menandai lebih dari satu
objek dan jumlah pejalan kaki yang terdeteksi tidak tepat.
73. 59
False Positive : Dalam eksperimen berdasarkan data yang tersedia, ditemukan
kondisi false positive dimana ada objek yang terdeteksi sebagai orang namun pada
kenyataannya bukan merupakan orang.
False Negative : Nilai false negative adalah suatu kondisi dimana citra tidak
mengandung objek dan sistem pendeteksian memberikan hasil yang benar bahwa
tidak ada objek terdeteksi.
Dari hasil percobaan dengan 36 sampel, diperoleh tingkatan probabilitas seperti
terlihat pada tabel 1.
Tabel 4.3 . Hasil eksperimen
Jumlah Persentase
True Positive 27 75,00 %
True Negative 5 13,89 %
False Positive 3 8,33 %
False Negative 1 2,78 %
Dari hasil tabel 4.3 dapat disimpulkan bahwa tingkat sensitivitas (the test's
ability to identify positive results) dari metode yang digunakan bisa mendeteksi dan
menghitung objek bergerak pejalan kaki.
74. 60
BAB V
PENUTUP
5.1 Kesimpulan
Dari hasil pengamatan selama penelitian, implementasi, dan uji coba, dapat
diambil kesimpulan bahwa background subtraction terbukti efektif dalam mendeteksi
objek bergerak dari sekuen citra. Permasalahan umum dari background subtraction
seperti perubahan pencahayaan, bayangan, dan background bergerak juga dapat diatasi.
Penerapan algoritma neural network dan tahap post-processing yang diisi dengan operasi
morfologi dapat membantu meningkatkan akurasi dari segmentasi objek bergerak.
Dalam uji coba yang dilakukan pada dataset, metode background subtraction
menggunakan neural network terbukti menghasilkan akurasi segementasi citra yang
lebih baik. Dengan demikian terbukti bahwa penerapan neural network dan post-
processing yang berisi operasi morfologi berpengaruh dalam peningkatan akurasi deteksi
objek yang dalam penelitian ini diukur dengan kualitas segmentasi citra yang dihasilkan.
Metode backgorund subtraction dan neural network ini dengan kata lain
dapat digunakan sebagai salah satu metode penghitungan objek bergerak pejalan
kaki. Namun, untuk posisi objek yang berdekatan pada citra, metode ini mendeteksi
dua objek yang berdekatan menjadi satu obyek sehingga akurasi nilai jumlah
berkurang. Hal ini dikarenakan metode backgroud subtraction mendeteksi suatu
obyek berdasarkan citra biner yang dihasilkan. Oleh karena itu, pada penelitian
selanjutnya perlu ditambahkan metode yang lain pada pengolahan citra digital untuk
memisahkan obyek orang yang berdekatan sehingga meningkatkan nilai akurasi
pendeteksian.
Dari hasil eksperimen dapat disimpulkan bahwa tingkat sensitivitas metode
yang digunakan cukup tinggi namun tingkat spesifisitas, masih perlu ditingkatkan
lagi.
Berdasarkan hasil eksperimen dan evaluasi yang dilakukan maka dapat
disimpulkan bahwa obyek bergerak pejalan kaki dapat dihitung dengan
menggunakan background subtraction serta diterapkannya jaringan saraf tiruan
dengan uji latih. Hal ini sekaligus membuktikan bahwa background subtraction dan
jaringan saraf tiruan bisa diaplikasikan dan dikembangkan sesuai dengan kebutuhan.
75. 61
5.2 Saran
Metode background subtraction menggunakan neural network dengan dapat
mendeteksi objek bergerak dari dataset yang digunakan berupa objek orang bergerak
didalam ruangan. Namun diperlukan pengaturan parameter (threshold dan learning rate)
yang tepat dalam menghasilkan deteksi yang akurat. Dalam penelitian selanjutnya dapat
ditambahkan metode penentuan threshold atau sering disebut threshold adaptif atau
metode clustering lainya. Berdasarkan hasil penelitian ini, diharapkan dapat menjadi
kontribusi untuk pihak yang ingin menggunakan background subtraction dan
jaringan saraf tiruan untuk keperluan penghitungan orang pada suatu tempat.
76. 62
DAFTAR PUSTAKA
[1] S. Lande, R. Lim, K. Gunadi, Chandra K, “Program Penghitung Orang Lewat
Menggunakan Webcam”, Jurnal Informatika Vol. 5, No. 2, Nopember 2004.
[2] R. Waterfall, & K. Dickinson, Image processing applied to traffic. Traffic
Engineering Control, 25, 60–67, 1984
[3] X. Ji, Z. Wei, Y. Feng, Effective vehicle detection techniques for traffic
surveillence systems, J. Vis. Commun. Image R. 17, 647-658, 2006
[4] A. Solichin, A. Harjoko, Metode Background Subtraction untuk Deteksi Obyek
Pejalan Kaki pada Lingkungan Statis, Seminar Nasional Aplikasi Teknologi
Informasi (SNATI) Yogyakarta, 15 Juni 2013
[5] I. Hestiningsih, T. Raharjo Yudantoro, Aplikasi Penghitung Jumlah
Pengunjung Obyek Wisata Dengan Webcam, ORBITH Vol. 7 No. 3 November
2011: 422-428.
[6] R. Kumar, T. Parashar, G. Verma, Background Modeling and Subtraction
Based People Counting for Real Time Video Surveillance, International Journal
of Soft Computing and Engineering (IJSCE), Volume-2, Issue-5, November
2012
[7] R. V. Modi, T. B. Mehta, Neural Network based Approach for Recognition
Human Motion using Stationary Camera, International Journal of Computer
Applications, Volume 25– No.6, July 2011
[8] H. Fitriawan, O. Pucu2, Y. Baptista, Identifikasi Plat Nomor Kendaraan Secara
Off-Line Berbasis Pengolahan Citra Dan Jaringan Syaraf Tiruan, Electrician –
Jurnal Rekayasa dan Teknologi Elektro, Mei 2012
[9]
http://kbbi.web.id/obyek, Minggu 21 September 2014, 7.30
[10] http://carapedia.com/pengertian_definisi_gerak_info2129.html, Minggu 21
September 2014, 7.42
[11] L. Mauliani, Fungsi dan Peran Jalur Pedestrian bagi Pejalan Kaki, NALARs
Volume 9 No 2 Juli 2010 : 165-176
[12] R. Munir, “Pengolahan Citra Digital dengan Pendekatan Algoritmik”,
Informatika Bandung.
[13] http://antonzdeline.blogspot.com/2009/12/apa-itu-video-artikel-2.html,
Diposkan oleh antonz d'line di 17.19, Jumat 26-09-2014, 14.44
[14]
http://www.pressekatalog.de/background-subtraction-incremental-maximum
[15] I. R. Suprayogi, Identifikasi Bentuk Kendaraan Dengan Menggunakan
Jaringan Saraf Tiruan, Skripsi, 2010
[16] N. Ahmad, Pengolahan Citra Digital (Digital Image Processing), 10/20/2013
[17] Suyanto, Artfificial Intelligent : Searching, Reasoning, Plannning, and
Learning. Bandung : Penerbit Informatika, 2007.
[18] E. Yani, Pengantar Jaringan Syaraf Tiruan, Copyright MateriKuliah.Com, 2005
77. 63
[19] http://ndoware.com/image-processing.html, Ditulis oleh : Ade Dwi Harisna, 2
Mei 2009
[20] http://wsa.wikidot.com/tbm:video-basics, Sabtu 27/09/2014, 8.57
[21] K. Toyama, J. Krumm, B. Brumitt, B. Meyers, Wallflower : Principles and
Practice of Background Maintenance, International Conference on Computer
Vision, September 1999, Corfu, Greece
[22] S. Brutzer, B. Hoferlin, and G. Heidemann, “Evaluation of background
subtraction techniques for video surveillance,” in CVPR 2011, , pp. 1937–1944.
[23] Yun-fang Zhu, Moving Objects Detection and Segmentation Based on
Background Subtraction and Image Over-Segmentation, Journal Of Software,
Vol. 6, No. 7, July 2011
[24] T. Bouwmans, F. El Baf, B. Vachon, Background Modeling using Mixture of
Gaussians for Foreground Detection - A Survey, published in "Recent Patents
on Computer Science 1, 3 (2008)
[25] N. Wahyudi, Background Subtraction Berbasis Self Organizing Map Untuk
Deteksi Obyek Bergerak, Tesis, 2013
[26] K. D. Irianto, Pendeteksi Gerak Berbasis Kamera Menggunakan Opencv Pada
Ruangan, KomuniTi, Vol. 2, No. 1, Juni 2010
[27] Gurbuz,Zehra.2006.Traffic Flow Speed Detection.Yildiz Technical University
Electric-Electronic Faculty Computer Engineering Department.Istambul.
[28] Heikkila M,Pietikainen M,Heikkila J.A Texture-based Method for Detecting
Moving Objects.Machine Vision Group Infotech Oulu and Department of
Electrical and Information Engineering University of Oulu, Finland.
[29] Ari Kusumaningsih, Juli 2010, Estimasi Motion Vector Menggunakan
Algoritma Blockmatching Pada Video Animasi Kuno
[30] Muhammad Arif, Muhammad Saqib, Saleh Basalamah and Asad Naeem,
Counting of Moving People in the Video using Neural Network System, Life
Science Journal, 2012
[31] T. Mitchell, and McGraw Hill, "Machine Learning: Artificial Neural Network,"
, pp. 75-100, 1997.
[32] Andrzejak. R. G, Lehenertz. K, Rieke. C, Mormann. F, David. P, and Elger. C.
E, “Indications of Nonlinear Deterministic and finite Dimensional Sturctures in
Time ”,Physical Review E, 2001.
[33] K. Ng and E. Delp, “Object tracking initialization using automatic moving
object detection,” in Proc of SPIE/IS&T Conference on Visual Information
Processing and Communication, January 2010.
{34} Moch Arief Soeleman, S.Kom, M.Kom, Ricardus Anggi Pramunendar, M.CS,
Background Substraction Berbasis Algoritma K-Means Clustering Untuk
Deteksi Objek Bergerak, 2014
[35] Novi Hendriyanto, Penerapan Jaringan Syaraf Tiruan Untuk Memprediksi
Prakiraan Cuaca Menggunakan Algoritma Backpropagation
78. 64
LAMPIRAN
function PeopleTracking()
clear all;
close all;
clc;
% Create System objects used for reading video, detecting moving
objects,
% and displaying the results.
obj = setupSystemObjects();
tracks = initializeTracks(); % Create an empty array of tracks.
nextId = 1; % ID of the next track
% Detect moving objects, and track them across video frames.
while ~isDone(obj.reader)
frame = readFrame();
[centroids, bboxes, mask] = detectObjects(frame);
predictNewLocationsOfTracks();
[assignments, unassignedTracks, unassignedDetections] = ...
detectionToTrackAssignment();
updateAssignedTracks();
updateUnassignedTracks();
deleteLostTracks();
createNewTracks();
displayTrackingResults();
end
function obj = setupSystemObjects()
obj.reader = vision.VideoFileReader('dinus.mpg');
obj.videoPlayer = vision.VideoPlayer('Position', [10, 285,
700, 400]);
obj.maskPlayer = vision.VideoPlayer('Position', [725, 285,
700, 400]);
obj.detector = vision.ForegroundDetector('NumGaussians', 3, ...
'NumTrainingFrames', 40, 'MinimumBackgroundRatio', 0.7);
obj.blobAnalyser =
vision.BlobAnalysis('BoundingBoxOutputPort', true, ...
'AreaOutputPort', true, 'CentroidOutputPort', true, ...
'MinimumBlobArea', 400);
end
79. 65
function tracks = initializeTracks()
% create an empty array of tracks
tracks = struct(...
'id', {}, ...
'bbox', {}, ...
'kalmanFilter', {}, ...
'age', {}, ...
'totalVisibleCount', {}, ...
'consecutiveInvisibleCount', {});
end
% Read the next video frame from the video file.
function frame = readFrame()
frame = obj.reader.step();
end
function [centroids, bboxes, mask] = detectObjects(frame)
% Detect foreground.
mask = obj.detector.step(frame);
% Apply morphological operations to remove noise and fill in
holes.
mask = imopen(mask, strel('rectangle', [3,3]));
mask = imclose(mask, strel('rectangle', [15, 15]));
mask = imfill(mask, 'holes');
% Perform blob analysis to find connected components.
[~, centroids, bboxes] = obj.blobAnalyser.step(mask);
end
function predictNewLocationsOfTracks()
for i = 1:length(tracks)
bbox = tracks(i).bbox;
% Predict the current location of the track.
predictedCentroid = predict(tracks(i).kalmanFilter);
% Shift the bounding box so that its center is at
% the predicted location.
predictedCentroid = int32(predictedCentroid) - bbox(3:4) / 2;
tracks(i).bbox = [predictedCentroid, bbox(3:4)];
end
end
function [assignments, unassignedTracks, unassignedDetections] =
...
detectionToTrackAssignment()
nTracks = length(tracks);
nDetections = size(centroids, 1);