1. ANALISIS PERBANDINGAN NILAI AKURASI
ALGORITMA SMOOTHING PADA MESIN PENERJEMAH STATISTIK
BAHASA INDONESIA KE BAHASA SAMBAS DENGAN LANGUAGE
MODEL TOOLKIT IRSTLM
DOSEN PEMBIMBING I
DR. HERRY SUJAINI, S.T., M.T.
NIP. 196806291997021001
SEMINAR OUTLINE
RONJA D1041151017
DOSEN PEMBIMBING II
Rudi Dwi Nyoto, S.T., M.Eng.
NIP. 197803302005011002
2. 1 • Latar Belakang
2 • Rumusan Masalah
3 • Tujuan Penelitian
4 • Batasan Masalah
5 • Kajian Terkait
6 • Metodologi Penelitian
7 • Sistematika Penulisan Skripsi
8 • Jadwal Penelitian
PEMBAHASAN
4. RUMUSAN MASALAH PENELITIAN
Bagaimana perbedaan hasil BLEU score dan Perplexity
yang dihasilkan Algoritma Smoothing terhadap akurasi
mesin penerjemah statistik bahasa Indonesia ke bahasa
Melayu Sambas.
5. TUJUAN PENELITIAN
Adapun tujuan dari penelitian yang dilakukan adalah untuk
menganalisis Algoritma Smoothing yang memiliki nilai
akurasi paling besar terhadap mesin penerjemah bahasa
Indonesia ke bahasa Melayu Sambas
6. BATASAN MASALAH PENELITIAN
Korpus yang digunakan adalah korpus Bahasa Melayu
Sambas
Jenis Language Model yang digunakan yaitu: IRSTLM
Membandingkan Algoritma smoothing berdasarkan Perplexity
dan BLEU Score
8. KAJIAN TERKAIT
Kenneth Heafield
(2011)
Judul : KenLM: Faster and Smaller Language Model Queries.
Penelitian ini untuk menguji model bahasa (language model)
mana yang paling cepat dan memerlukan penggunaan RAM serta
processor yang kecil, untuk perbandingan akurasi hanya
membandingkan KENLM dan RANDLM dengan hasil KENLM
sebesar 27,24% dan untuk RANDLM sebesar 25,54%.
9. KAJIAN TERKAIT
Kalyanee Kanchan Baruah (2014)
Judul : Assamese-English Billingual Machine Translation.
Penelitian ini menguji akurasi mesin penerjemah dari bahasa
Assamese ke bahasa Inggris dan sebaliknya dengan model
bahasa(language model) IRSTLM, untuk meneliti OOV(Out Of
Vocabulary) atau kata-kata yang jarang ditemui dikamus dengan
korpus paralel sebanyak 2500 kalimat. Dengan hasil nilai akurasi
9,72% bahasa Assamese ke bahasa Inggris dan 5,02% untuk
bahasa Inggris ke bahasa Assamese.
10. KAJIAN TERKAIT
Ibnu Hadi (2014)
Judul : Uji Akurasi Mesin Penerjemah Statistik (MPS) Bahasa
Indonesia ke Bahasa Melayu
Sambas dan Mesin Penerjemah Statistik (MPS) Bahasa Melayu
Sambas ke Bahasa Indonesia.
Penelitian ini menguji akurasi mesin penerjemah dari bahasa
Indonesia ke bahasa Melayu Sambas dan sebaliknya dengan
model bahasa(language model) SRILM, dengan hasil nilai akurasi
pengujian pertama 55%, pengujian kedua nilai akurasi 49% dan
untuk pengujian ahli bahasa pada pengujian pertama nilai akurasi
rata-rata 70,24%, pengujian kedua oleh ahli bahasa dihasil nilai
akurasi rata-rata 63,76%.
11. KAJIAN TERKAIT
Wenyang Zhang (2015)
Judul : Comparing the Effect of Smoothing and Order of N-gram for
Language Model : Find the Best Way to Combine the Smoothing and
Order of N-gram.
Pada penelitian ini dilakukan perbandingan Algoritma Smoothing :
Simple n-gram, Interpolation, Good turing discounting, Natural
discounting, Witten-Bell discounting, Modified kneser-ney discounting
dan Original kneser-ney discounting pada model bahasa (language
model) SRILM, dengan melakukan percocokan antara Algoritma
Smoothing dan penggunaan jumlah N-gram. Dengan hasil hasil
percobaan pertama dimana pencocokan terbaik adalah Witten-Bell
discounting dan 3 gram dengan hasil perplexity 311.097 percobaan
kedua yang paling cocok adalah Witten-Bell discounting dan 5 gram
dengan hasil perplexity 45.9748.
12. METODOLOGI PENELITIAN
1 • Mulai
2 • Observasi
3 • Pengumpulan Data Korpus
4 • Pembuatan Korpus Teks Paralel
5 • Membangun Mesin Penerjemah Statistik
6 • Implementasi Mesin Penerjemah Statistik Bahasa Indonesia-Bahasa
Melayu Sambas
7
• Implementasi Mesin Penerjemah Statistik dengan Language Model :
IRSTLM dan Algoritma Smoothing
8 • Pengujian Hasil Terjemahan Mesin Translasi oleh BLEU
9 • Analisis Hasil Pengujian
10 • Kesimpulan
11 • Selesai
14. JADWAL PENELITIAN
NO. KEGIATAN
BULAN
SEPTEMBER OKTOBER NOVEMBER DESEMBER
1. Penyusunan ProPosal I II III IV
a. Menyusun Proposal
b. Sidang Proposal
c. Perbaikan Proposal
2. Pelaksanaan Skripsi
a. Desain Percobaan (Bahan dan
Metode)
b. Percobaan/Hasil
c. Pembahasan Hasil
d. Penulisan Draft Skripsi
e. Bimbingan Skripsi
3. Sidang Skripsi
a. Persiapan Administrasi
b. Penyerahan Draft Skripsi ke Tim
Penguji