Kajian mengenai model Hidden Markov diskret dengan algoritma Rabiner dan aplikasinya untuk menganalisis urutan basa nitrogen pada DNA. Penelitian ini bertujuan untuk mempelajari HMM, melakukan estimasi parameter model, menerapkan HMM untuk analisis DNA, dan membuat program komputasi. Metode penelitian mencakup studi literatur, estimasi parameter, implementasi algoritma, dan simulasi komputer.
1. KAJIAN MODEL HIDDEN MARKOV DISKRET
DENGAN ALGORITMA RABINER
DAN APLIKASINYA PADA DNA
2. Latar Belakang
Masalah Real
(Ekonomi, Biologi, Parameter yang
Teknik dsb.) diperlukan :
• N, banyaknya hidden
Dengan ciri state dalam model.
membentuk suatu • M, banyaknya simbol Karakteristik
barisan state yang
tidak teramati (hidden
observasi yang berbeda
pada setiap state.
Model Hidden
state), Q=q1, q2,…,qN., • A= {aij } dengan Markov Diskret
dan mempengaruhi aij=P(qt+1=j |qt = i)
barisan state yang • B= {bj(k)}, dengan bj(k) = (A,B, ).
teramati (observable = P(vk pada waktu t|qt
state),V=v1, v2, …, vM. =j)
Q membentuk rantai • ={ I }, i =P(q1= i),
yaitu peluang pada
markov. V diskret. tahap awal berada
dalam state i.
3. Contoh Proses Hidden Markov Diskret
Terdapat N mangkuk besar yang terisi bola berbeda warna. Ada
sebanyak M warna bola yang berbeda. Awalnya dipilih sebuah
mangkuk secara acak, lalu dipilih bola secara acak dari mangkuk
yang terpilih dan selanjutnya dicatat sebagai pengamatan. Bola
dikembalikan ke mangkuk yang semula. Kembali dipilih mangkuk
secara acak dan dipilih bola dalam mangkuk tersebut, demikian
terus proses berjalan, dan bola yang terambil dicatat sebagai
barisan pengamatan yang finite dari warna-warna bola yang akan
kita modelkan sebagai hasil pengamatan dari HMM.
4. Tiga Masalah Dasar pada Model Hidden Markov:
Diberikan barisan O= O1, O2, .., OT. yang dibangkitkan oleh model
= (A, B, ). T banyaknya observasi dalam barisan.
Bagaimana menghitung peluang barisan
observasi yang diberikan oleh model?
Bagaimana memilih barisan state yang paling
cocok dengan model ?
Bagaimana kita menentukan pendugaan
parameter model untuk memaksimalkan P(O| )?
5. Solusi dari 3 masalah dasar HMM
dengan Algoritma Rabiner
Algoritma Forward- P(O| ), yaitu peluang
munculnya barisan O=
Backward
O1, O2, .., OT.
Model
Hidden Markov
Diskret Algoritma barisan terbaik
Viterbi dari state-state
model
= (A,B, )
Algoritma pendugaan
Baum-Welch parameter-parameter
re-restimation HMM
6. Solusi untuk masalah 1.
Algoritma Forward-Backward
Untuk suatu = (A,B, )tertentu, bagaimana kita menghitung P(O| ), yaitu
peluang munculnya barisan O= O1, O2, .., OT. Barisan state yang ditetapkanQ=q1,
q2, …, qT . Berdasarkan kaidah peluang bersyarat, nilai P(O| ) dapat dirumuskan
sebagai:
7. Pada algoritma ini didefinisikan suatu symbol baru,
t(i), yaitu peluang barisan observasi Ot+1, Ot+2, …, OT,
jika state pada periode t adalah Si. Peubah backward
dirumuskan sebagai
9. Solusi untuk masalah 2.
Pada masalah ini kita akan memilih barisan dari state Q= q1,
q2, …, qT, sehingga P(O,Q| ) yaitu peluang bersama ( joint
probability) dari barisan state Q dengan barisan
pengamatan O adalah maksimum. Atau dengan kata lain
mencari Q yang memaksimalkan P(O,Q| ).
Algoritma Viterbi (Rabiner, 1989)
Kita definisikan :
10. Sebagai kemungkinan yang paling baik untuk
rangkaian pengamatan parsial.
Algoritma Viterbi adalah sebagai berikut:
11. Mengkaji Model Hidden Markov
Diskret = (A,B, )
dengan Algoritma Rabiner
Aplikasikan MODEL
HIDDEN
MARKOV
Struktur urutan basa nitrogen DISKRET
pada bakteri Rhizobium
DENGAN
leguminosarum bv.viciae
ALGORITMA
(http:www.ncbi.nlm.gov/) RABINER
DAN
Pemrograman
Mathematica 07 APLIKASINYA
PADA DNA
Peluang munculnya barisan basa
nukleotida pada DNA.
Barisan terbaik dari state-state model
basa nukleotida pada DNA.
Pendugaan parameter model barisan
basa nukleotida pada DNA
12. DN A
DeoxyriboNucleic Acid ,
Asam deoksiribonukleat.
DNA adalah sejenis asam nukleat yang
tergolong biomulekul utama penyusun
berat kering setiap organisme.
Di dalam sel, DNA umumnya terletak di
dalam inti sel.
DNA berperan di dalam sebuah sel sebagai
materi genetik, artinya, DNA menyimpan
cetak biru bagi segala aktivitas sel dan
merupakan substansi penurun sifat.
13. STRUKTUR DNA.
DNA terbentuk dari 4 tipe nukleotida yang berikatan secara kovalen membentuk rantai
polinukleotida (rantai DNA) dengan tulang punggung gula fosfat tempat melekatnya basa-
basa. Dua rantai polinukleotida saling berikatan melalui ikatan hidrogen antara basa-basa
nitrogen dari rantai yang berbeda. Semua basa berada di dalam double helix dan tulang
punggung gula fosfat berada di bagian luar. Purin (Adenin dan Guanin) selalu berpasangan
dengan pirimidin (Sitosin dan Timin).
15. Tujuan dari penelitian ini
adalah :
1. Mengkaji Model Hidden Markov diskret dan
aplikasinya menggunakan algoritma Rabiner.
2. Melakukan pendugaan parameter HMM, yaitu:
a. Pendugaan untuk state.
b. Pendugaan lamanya rantai markov berada pada
suatu state.
c. Penduga proses observasi.
3. Mengimplemantasikan Model Hidden Markov untuk
masalah keteraturan struktur urutan basa nitrogen
DNA
4. Membuat program komputasi untuk model struktur
urutan basa nitrogen DNA.
16. Rencana Kegiatan Penelitian
April M ei Juni Juli
Kegiatan
I II III IV V I II III IV I II III IV I II III IV V
Penelitian:
a.Mengkaji HMM
b.Pendugaan Parameter
c.Implementasi HMM
d.Komputasi HMM
Kolokium
Sidang Komisi I
Sidang Komisi II
Seminar
Sidang
17. V Daftar Pustaka
[1] Cambbell NA. Reece JB. Mitchell LG. 2002.
Biologi. Edisi kelima-Jilid 1. Erlangga. Jakarta.
[2] L.R.Rabiner. 1989. Tutorial on Hidden Markov
Models and Selected Applications in Speech
Recognition. Proc. IEEE, Vol 77 No.2, pp 257-
289.
[3] Luz Abril Torres Mendez. 2000.Viterbi
Algorithm in Text Recognition. Term project for
course, McGill University,
[4] Rakesh D. 1996. A Tutorial on Hidden Markov
Model. Technical Report, Dept. of Electrical
Enginerring, Indian Institute of Technology,
Bombay.