Dokumen tersebut merupakan laporan tugas akhir yang membahas model imputasi data longitudinal yang hilang dengan menggunakan distribusi bersyarat. Metode ini memanfaatkan struktur korelasi antar observasi untuk memprediksi data yang hilang."
Tugas akhir ini membahas pengelompokan mahasiswa ITS yang mengikuti organisasi kemahasiswaan dengan metode two-step cluster dan menganalisis faktor yang mempengaruhi keaktifan mahasiswa dalam berorganisasi menggunakan regresi logistik biner. Terdapat 11 variabel karakteristik mahasiswa yang digunakan dalam penelitian ini. Hasilnya menunjukkan bahwa mahasiswa dapat dikelompokan ke dalam dua cluster dan kebanyakan ber
Control chart based on median and median absolute deviationPutri Marlina
ย
Skripsi ini membahas bagan kendali berdasarkan median dan median absolute deviation sebagai modifikasi dari bagan kendali Shewhart ketika asumsi kenormalan sampel tidak sepenuhnya terpenuhi. Penelitian ini menggunakan penaksir robust median dan median absolute deviation untuk membuat batas kendali bagan dan menguji bagan kendali tersebut pada data simulasi dari distribusi normal standar.
Projeck based learning WIsma (1013011017)Wisma Morgans
ย
Skripsi ini membahas pengaruh model pembelajaran berbasis proyek (Project Based Learning/PjBL) terhadap kemampuan pemecahan masalah matematika siswa kelas X di SMK Negeri 3 Singaraja. Penelitian ini menggunakan desain quasi eksperimen dengan kelompok kontrol. Hasilnya menunjukkan bahwa siswa yang diajar dengan model PjBL memiliki kemampuan pemecahan masalah matematika yang lebih tinggi dibandingkan dengan model konvensional.
Modul elektronik berbasis website dikembangkan untuk mendukung pembelajaran pokok bahasan Relasi dan Fungsi kelas X SMK. Modul ini dibuat menggunakan aplikasi XAMPP dan diuji coba ke 30 siswa kelas X SMK. Hasil penelitian menunjukkan bahwa modul elektronik ini memiliki kualitas baik secara isi, instruksional, visual dan teknis.
Skripsi ini membahas penerapan strategi pembelajaran Think-Talk-Write (TTW) untuk meningkatkan kemampuan pemecahan masalah dan disposisi matematis siswa kelas VIII pada materi bangun ruang kubus dan balok. Penelitian ini merupakan penelitian tindakan kelas yang dilaksanakan dalam dua siklus dengan menggunakan tes, angket, dan observasi sebagai instrumennya. Hasil penelitian menunjukkan adanya peningkatan kemampuan
Tugas akhir ini membahas pengelompokan mahasiswa ITS yang mengikuti organisasi kemahasiswaan dengan metode two-step cluster dan menganalisis faktor yang mempengaruhi keaktifan mahasiswa dalam berorganisasi menggunakan regresi logistik biner. Terdapat 11 variabel karakteristik mahasiswa yang digunakan dalam penelitian ini. Hasilnya menunjukkan bahwa mahasiswa dapat dikelompokan ke dalam dua cluster dan kebanyakan ber
Control chart based on median and median absolute deviationPutri Marlina
ย
Skripsi ini membahas bagan kendali berdasarkan median dan median absolute deviation sebagai modifikasi dari bagan kendali Shewhart ketika asumsi kenormalan sampel tidak sepenuhnya terpenuhi. Penelitian ini menggunakan penaksir robust median dan median absolute deviation untuk membuat batas kendali bagan dan menguji bagan kendali tersebut pada data simulasi dari distribusi normal standar.
Projeck based learning WIsma (1013011017)Wisma Morgans
ย
Skripsi ini membahas pengaruh model pembelajaran berbasis proyek (Project Based Learning/PjBL) terhadap kemampuan pemecahan masalah matematika siswa kelas X di SMK Negeri 3 Singaraja. Penelitian ini menggunakan desain quasi eksperimen dengan kelompok kontrol. Hasilnya menunjukkan bahwa siswa yang diajar dengan model PjBL memiliki kemampuan pemecahan masalah matematika yang lebih tinggi dibandingkan dengan model konvensional.
Modul elektronik berbasis website dikembangkan untuk mendukung pembelajaran pokok bahasan Relasi dan Fungsi kelas X SMK. Modul ini dibuat menggunakan aplikasi XAMPP dan diuji coba ke 30 siswa kelas X SMK. Hasil penelitian menunjukkan bahwa modul elektronik ini memiliki kualitas baik secara isi, instruksional, visual dan teknis.
Skripsi ini membahas penerapan strategi pembelajaran Think-Talk-Write (TTW) untuk meningkatkan kemampuan pemecahan masalah dan disposisi matematis siswa kelas VIII pada materi bangun ruang kubus dan balok. Penelitian ini merupakan penelitian tindakan kelas yang dilaksanakan dalam dua siklus dengan menggunakan tes, angket, dan observasi sebagai instrumennya. Hasil penelitian menunjukkan adanya peningkatan kemampuan
Tesis ini membandingkan model pembelajaran TGT dan NHT untuk meningkatkan aktivitas belajar siswa pada mata pelajaran sejarah di SMA Negeri 4 Bandar Lampung. Penelitian ini menggunakan desain kuasi eksperimen dengan sampel satu kelas. Hasilnya menunjukkan bahwa aktivitas belajar siswa menggunakan model TGT lebih tinggi dibandingkan model NHT pada semua aspek yang diukur.
Skripsi ini membahas analisis data indeks kepuasan pelanggan menggunakan structural equation modeling dengan kasus perhitungan indeks kepuasan mahasiswa FMIPA UNY terhadap operator IM3. Metode pengumpulan data menggunakan angket kepuasan yang diisi oleh mahasiswa tersebut. Analisis data menggunakan software AMOS untuk menentukan model terbaik dalam mengukur indeks kepuasan pelanggan.
Skripsi ini membahas pengaruh kualitas pelayanan terhadap kepuasan konsumen yang menggunakan jasa penginapan villa di Agrowisata Kebun Teh Pagilaran. Kualitas pelayanan meliputi tangible, reliability, responsiveness, assurance, dan emphaty. Penelitian ini menggunakan metode survei dengan kuesioner kepada 100 responden untuk mengukur tingkat pengaruh setiap dimensi kualitas pelayanan terhadap kepuasan konsumen. Hasil analisis menunjukkan bah
Skripsi ini membahas pengaruh model pembelajaran Connecting Organizing Reflecting Extending (CORE) berbantuan Game Based Learning (GBL) terhadap kemampuan pemahaman konsep dan disposisi matematis siswa SMP. Penelitian ini menggunakan desain quasy eksperimental dengan sampel kelas eksperimen dan kontrol. Hasilnya menunjukkan bahwa terdapat pengaruh signifikan model pembelajaran CORE berbantuan GBL terhadap kemampuan pemahaman konsep dan peningkatan
Kontribusi kompetensi tutor terhadap mutu hasil belajar kesetaraan paket a, b...Non Formal Education
ย
Skripsi ini membahas kontribusi kompetensi tutor terhadap mutu hasil belajar paket A, B, dan C pada Sekolah Luar Biasa dan Pusat Kegiatan Belajar Masyarakat berbasis kearifan lokal di Provinsi Banten. Penelitian ini bertujuan untuk mengetahui kontribusi kompetensi tutor dan upaya meningkatkan kompetensi tutor. Penelitian menggunakan pendekatan kuantitatif dan kualitatif dengan sampel 94 tutor dan w
Mata kuliah Statistik Pendidikan membahas konsep statistika deskriptif dan inferensial yang digunakan dalam pengolahan data penelitian pendidikan. Materi pelajaran meliputi penyajian data, ukuran pemusatan dan penyebaran data, distribusi frekuensi, hipotesis statistik, uji statistik parametrik dan nonparametrik. Tujuannya agar mahasiswa mampu mengolah dan menganalisis data hasil penelitian secara benar.
Tesis ini membahas pengaruh model pembelajaran kooperatif tipe Numbered Heads Together (NHT) berbantuan handout bermuatan peta pemikiran terhadap kompetensi belajar biologi siswa kelas VIII SMPN 14 Padang. Penelitian ini menggunakan desain quasi eksperimen dengan kelompok kontrol randomize posttest only. Hasil penelitian menunjukkan bahwa kompetensi belajar kognitif, afektif, dan psikomotor siswa yang diajar men
Skripsi ini membahas penggunaan media virtual interaktif untuk meningkatkan hasil belajar siswa pada konsep tekanan di kelas X SMK Negeri 5 Telkom Banda Aceh. Penelitian ini bertujuan untuk mengetahui peningkatan hasil belajar siswa dan respon siswa terhadap pembelajaran menggunakan media virtual interaktif. Jenis penelitian ini adalah kuasi eksperimen dengan subjek penelitian siswa kelas X. Hasil penelitian menunjuk
Ringkasan dokumen tersebut adalah:
1. Laporan hasil penelitian tindakan kelas untuk meningkatkan hasil belajar membaca pemahaman murid kelas III SD melalui penerapan pembelajaran Sastra Anak Lintas Kurikulum.
2. Hasil penelitian menunjukkan penerapan pembelajaran SALK dapat meningkatkan aktivitas dan hasil belajar membaca murid, terlihat dari peningkatan rata-rata nilai tes belajar.
3. Pen
[Ringkasan]
Skripsi ini membahas pengaruh penggunaan metode word square terhadap hasil belajar IPS siswa kelas III SDN Pegangsaan 01 Pagi Jakarta Pusat. Penelitian ini menggunakan metode eksperimen dengan subjek penelitian 30 siswa. Hasil penelitian menunjukkan bahwa terdapat pengaruh yang signifikan antara metode word square terhadap hasil belajar IPS siswa.
Skripsi ini membahas pengaruh penggunaan handout IPA-Fisika berbasis Science Technology and Society (STS) terhadap pencapaian hasil belajar siswa kelas VIII SMP N 1 Canduang. Penelitian ini bertujuan untuk mengetahui apakah penggunaan handout berbasis STS berpengaruh signifikan terhadap hasil belajar siswa pada ranah kognitif, afektif, dan psikomotor. Metode penelitian yang digunakan adalah eksperimen semu
Statistik PRESS digunakan untuk mengetahui kemampuan suatu model regresi dalam memprediksi observasi yang tidak digunakan dalam pembuatan model. PRESS menghitung error prediksi dengan menghilangkan satu observasi sekaligus dari data untuk membangun model, lalu mengestimasi observasi yang dihilangkan tersebut. Semakin kecil nilai PRESS, semakin baik kemampuan model dalam memprediksi. Statistik Cp dan AIC digunakan untuk membanding
More Related Content
Similar to Model Imputasi Berbasis Distribusi Bersyarat (Conditional Distribution Based Imputation Model)
Tesis ini membandingkan model pembelajaran TGT dan NHT untuk meningkatkan aktivitas belajar siswa pada mata pelajaran sejarah di SMA Negeri 4 Bandar Lampung. Penelitian ini menggunakan desain kuasi eksperimen dengan sampel satu kelas. Hasilnya menunjukkan bahwa aktivitas belajar siswa menggunakan model TGT lebih tinggi dibandingkan model NHT pada semua aspek yang diukur.
Skripsi ini membahas analisis data indeks kepuasan pelanggan menggunakan structural equation modeling dengan kasus perhitungan indeks kepuasan mahasiswa FMIPA UNY terhadap operator IM3. Metode pengumpulan data menggunakan angket kepuasan yang diisi oleh mahasiswa tersebut. Analisis data menggunakan software AMOS untuk menentukan model terbaik dalam mengukur indeks kepuasan pelanggan.
Skripsi ini membahas pengaruh kualitas pelayanan terhadap kepuasan konsumen yang menggunakan jasa penginapan villa di Agrowisata Kebun Teh Pagilaran. Kualitas pelayanan meliputi tangible, reliability, responsiveness, assurance, dan emphaty. Penelitian ini menggunakan metode survei dengan kuesioner kepada 100 responden untuk mengukur tingkat pengaruh setiap dimensi kualitas pelayanan terhadap kepuasan konsumen. Hasil analisis menunjukkan bah
Skripsi ini membahas pengaruh model pembelajaran Connecting Organizing Reflecting Extending (CORE) berbantuan Game Based Learning (GBL) terhadap kemampuan pemahaman konsep dan disposisi matematis siswa SMP. Penelitian ini menggunakan desain quasy eksperimental dengan sampel kelas eksperimen dan kontrol. Hasilnya menunjukkan bahwa terdapat pengaruh signifikan model pembelajaran CORE berbantuan GBL terhadap kemampuan pemahaman konsep dan peningkatan
Kontribusi kompetensi tutor terhadap mutu hasil belajar kesetaraan paket a, b...Non Formal Education
ย
Skripsi ini membahas kontribusi kompetensi tutor terhadap mutu hasil belajar paket A, B, dan C pada Sekolah Luar Biasa dan Pusat Kegiatan Belajar Masyarakat berbasis kearifan lokal di Provinsi Banten. Penelitian ini bertujuan untuk mengetahui kontribusi kompetensi tutor dan upaya meningkatkan kompetensi tutor. Penelitian menggunakan pendekatan kuantitatif dan kualitatif dengan sampel 94 tutor dan w
Mata kuliah Statistik Pendidikan membahas konsep statistika deskriptif dan inferensial yang digunakan dalam pengolahan data penelitian pendidikan. Materi pelajaran meliputi penyajian data, ukuran pemusatan dan penyebaran data, distribusi frekuensi, hipotesis statistik, uji statistik parametrik dan nonparametrik. Tujuannya agar mahasiswa mampu mengolah dan menganalisis data hasil penelitian secara benar.
Tesis ini membahas pengaruh model pembelajaran kooperatif tipe Numbered Heads Together (NHT) berbantuan handout bermuatan peta pemikiran terhadap kompetensi belajar biologi siswa kelas VIII SMPN 14 Padang. Penelitian ini menggunakan desain quasi eksperimen dengan kelompok kontrol randomize posttest only. Hasil penelitian menunjukkan bahwa kompetensi belajar kognitif, afektif, dan psikomotor siswa yang diajar men
Skripsi ini membahas penggunaan media virtual interaktif untuk meningkatkan hasil belajar siswa pada konsep tekanan di kelas X SMK Negeri 5 Telkom Banda Aceh. Penelitian ini bertujuan untuk mengetahui peningkatan hasil belajar siswa dan respon siswa terhadap pembelajaran menggunakan media virtual interaktif. Jenis penelitian ini adalah kuasi eksperimen dengan subjek penelitian siswa kelas X. Hasil penelitian menunjuk
Ringkasan dokumen tersebut adalah:
1. Laporan hasil penelitian tindakan kelas untuk meningkatkan hasil belajar membaca pemahaman murid kelas III SD melalui penerapan pembelajaran Sastra Anak Lintas Kurikulum.
2. Hasil penelitian menunjukkan penerapan pembelajaran SALK dapat meningkatkan aktivitas dan hasil belajar membaca murid, terlihat dari peningkatan rata-rata nilai tes belajar.
3. Pen
[Ringkasan]
Skripsi ini membahas pengaruh penggunaan metode word square terhadap hasil belajar IPS siswa kelas III SDN Pegangsaan 01 Pagi Jakarta Pusat. Penelitian ini menggunakan metode eksperimen dengan subjek penelitian 30 siswa. Hasil penelitian menunjukkan bahwa terdapat pengaruh yang signifikan antara metode word square terhadap hasil belajar IPS siswa.
Skripsi ini membahas pengaruh penggunaan handout IPA-Fisika berbasis Science Technology and Society (STS) terhadap pencapaian hasil belajar siswa kelas VIII SMP N 1 Canduang. Penelitian ini bertujuan untuk mengetahui apakah penggunaan handout berbasis STS berpengaruh signifikan terhadap hasil belajar siswa pada ranah kognitif, afektif, dan psikomotor. Metode penelitian yang digunakan adalah eksperimen semu
Similar to Model Imputasi Berbasis Distribusi Bersyarat (Conditional Distribution Based Imputation Model) (20)
Statistik PRESS digunakan untuk mengetahui kemampuan suatu model regresi dalam memprediksi observasi yang tidak digunakan dalam pembuatan model. PRESS menghitung error prediksi dengan menghilangkan satu observasi sekaligus dari data untuk membangun model, lalu mengestimasi observasi yang dihilangkan tersebut. Semakin kecil nilai PRESS, semakin baik kemampuan model dalam memprediksi. Statistik Cp dan AIC digunakan untuk membanding
Analisis menggunakan metode analisis komponen utama untuk mereduksi 14 variabel akademik mahasiswa matematika menjadi beberapa variabel baru. Dua komponen utama pertama mampu menangkap 56% variasi data, yang mencerminkan prestasi umum mahasiswa di mata kuliah dasar dan lanjutan. Tiga komponen utama lebih baik karena menangkap 63% variasi dengan mudah divisualisasikan.
Dokumen tersebut membahas pemodelan data asuransi mobil menggunakan logistic regression. Terdapat beberapa bab yang membahas tentang landasan teori logistic regression, analisis data asuransi, dan pemilihan model terbaik. Variabel respon yang digunakan adalah apakah pemegang polis mengajukan klaim atau tidak.
Laporan praktikum termokimia mencakup 6 percobaan untuk menentukan tetapan kalorimeter, kalor reaksi, kalor pelarutan etanol dalam air, dan kalor penetralan beberapa asam dan basa. Hasilnya dianalisis menggunakan perhitungan kalor yang diserap dan dilepaskan oleh zat-zat yang bereaksi.
Model regresi linier umum digunakan untuk memprediksi kemungkinan pengajuan klaim asuransi kendaraan bermotor. Variabel prediktor utama adalah jenis kendaraan, nilai kendaraan, kategori usia pengemudi, dan wilayah tempat tinggal. Model terakhir juga mempertimbangkan faktor eksposur untuk memperbaiki akurasi perkiraan.
Dokumen tersebut merangkum konsep dasar regresi linier tunggal. Regresi linier digunakan untuk memodelkan hubungan antara variabel terikat dengan variabel bebas, memprediksi nilai variabel terikat berdasarkan variabel bebas, dan mengukur kekuatan hubungan antara keduanya. Model regresi linier tunggal mengasumsikan hubungan linier antara variabel terikat dan satu variabel bebas beserta komponen error.
Model Imputasi Berbasis Distribusi Bersyarat (Conditional Distribution Based Imputation Model)
1. MODEL IMPUTASI
BERBASIS DISTRIBUSI BERSYARAT
LAPORAN TUGAS AKHIR
Diajukan sebagai salah satu syarat
untuk memperoleh gelar Sarjana dari
Institut Teknologi Bandung
Oleh
INDAH NURINA FITRI HAPSARI
NIM: 10110094
(Program Studi Sarjana Matematika)
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT TEKNOLOGI BANDUNG
2015
2. i
MODEL IMPUTASI
BERBASIS DISTRIBUSI BERSYARAT
ABSTRAK
Data observasi merupakan sumber informasi yang mampu memberikan validasi
terhadap isu, masalah, dan dugaan yang ada di masyarakat. Sebagai sumber utama
analisa, kualitas data observasi sangatlah penting, sehingga masalah yang terjadi
selama pengambilan data berlangsung harus diperhatikan. Salah satu bentuk data
observasi yang memuat pengukuran berulang ialah bentuk data longitudinal. Pada
praktiknya, saat proses pengambilan data longitudinal berlangsung, fenomena
dropout kerap terjadi. Fenomena ini menyebabkan data longitudinal menjadi tidak
lengkap, sehingga dapat menyebabkan bias pada hasil analisa. Tugas akhir ini
akan membahas model imputasi untuk mengisi data yang hilang dengan meman-
faatkan distribusi bersyarat. Distribusi bersyarat dipilih karena observasi berulang
pada suatu subjek cenderung tidak saling bebas, sehingga dengan memanfaatkan
struktur korelasi beserta data terobservasi, data yang hilang dapat ditaksir. Distri-
busi bersyarat dapat dikonstruksi dengan menggunakan pendekatan copula, salah
satunya ialah copula Gaussian. Tiga struktur korelasi yang umum digunakan akan
dibahas dan diaplikasikan kedalam model, sehingga diperoleh empat formula
imputasi.
Kata kunci: data longitudinal, dropout, imputasi, copula Gaussian, distribusi ber-
syarat, dan struktur korelasi.
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
3. ii
CONDITIONAL DISTRIBUTION BASED
IMPUTATION MODEL
ABSTRACT
Observation data is a useful source of information which can be used to validate
various social issues, problems, and assumptions shared by people within a
society. As a prime source of analysis, its quality becomes highly important, so
that any problems happen during the data collection must be treated carefully. One
type of observation data which involves repeated measurement is longitudinal
data. In practice, the dropout phenomenon has often happened during the process
of data collection, resulting incomplete longitudinal data which can lead to bias
results of analysis. This final assignment discusses an imputation model to fill in
the lost data using conditional distribution. Conditional distribution is selected on
the ground that repeated measurements on certain subject tend to be dependent.
Hence, based on the observed data and its possible correlation structure, the lost
data can thus be estimated. Conditional distribution can be constructed through
copula approach, e.g. Gaussian copula. Three commonly used correlation struc-
ture would be explained and applied on the model such that four imputation
formulas are acquired.
Key words: longitudinal data, dropout, imputation, Gaussian copula, conditional
distribution, and correlation structure.
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
4. iii
MODEL IMPUTASI
BERBASIS DISTRIBUSI BERSYARAT
Oleh
INDAH NURINA FITRI HAPSARI
NIM:10110094
(Program Studi Sarjana Matematika)
Fakultas Matematika dan Ilmu Pengetahuan Alam
Institut Teknologi Bandung
Telah diperiksa dan disetujui,
Bandung, Agustus 2015
Dosen Pembimbing
Dr. Sapto Wahyu Indratno
NIP. 197508041999031003
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
5. iv
Prakata
Alhamdulillahirabbil โalamin, puji syukur penulis panjatkan ke hadirat Allah SWT
karena atas rahmat dan karunia-Nya penulis dapat menyelesaikan tugas akhir yang
berjudul โModel Imputasi Berbasis Distribusi Bersyaratโ.
Buku tugas akhir ini disusun untuk memenuhi persyaratan kurikulum pen-
didikan Program Studi Matematika, Fakultas Matematika dan Ilmu Pengetahuan
Alam, Institut Teknologi Bandung.
Penulis menyadari bahwa penyusunan buku tugas akhir ini masih jauh dari
sempurna dan masih terdapat banyak kekurangan dikarenakan oleh keterbatasan
kemampuan, pengalaman, dan pengetahuan yang dimiliki oleh penulis. Maka dari
itu, penulis menerima saran dan kritik sebagai masukan untuk perbaikan di masa
yang akan datang.
Penyusunan buku tugas akhir ini tidak akan terwujud tanpa adanya ban-
tuan dari berbagai pihak. Maka pada kesempatan ini, penulis menyampaikan rasa
terimakasih kepada :
1. Bapak, Ibu, dan Ayah yang penulis sayangi, Bapak Zaenal Abidin, Ibu
Suharti, dan Bapak Dodik Dwi Sasongko, yang selalu sabar dan terus
menerus memberikan semangat kepada penulis. Terimakasih atas perha-
tian, kepercayaan, dan kasih sayang yang telah diberikan kepada penulis.
2. Saudara-saudara penulis, Indah Kartika Buana Putri, Arsita Tiara Abidin,
dan Hidayat Ibnu Hadi. Terimakasih atas semangat dan surprise yang
sering diberikan untuk menghibur penulis.
3. Bapak Dr. Sapto Wahyu Indratno sebagai dosen pembimbing. Terimakasih
atas perhatian, kesabaran, semangat, pengalaman, ilmu, dan saran berharga
yang diberikan kepada penulis dalam pengerjaan tugas akhir ini. Penulis
memperoleh banyak pelajaran selama proses pengerjaan tugas akhir ini
berlangsung. Terimakasih telah menjadi tempat penulis berkeluh kesah.
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
6. v
Maaf kalau penulis sering merepotkan, labil, rame, dan heboh sendiri ya
Pak. Pak Sapto adalah orang paling sabar yang pernah penulis kenal.
4. Ibu RR Kurnia Novitasari, M.Si dan Ibu Dr. Hanni G. Yudhawisastra yang
telah bersedia menjadi dosen penguji dan memberikan banyak masukan
pada tugas akhir ini.
5. Ibu Dr. Rinovia Mery Garnierita Simanjuntak sebagai dosen wali penulis.
Terima kasih atas bimbingan dan nasehatnya selama ini.
6. Bapak Khreshna I.A. Syuhada, M.Sc, Ph.D yang telah menjadi tempat
penulis bercerita dan berkeluh kesah selama sekitar dua tahun terakhir.
Terimakasih atas perhatian, nasehat, semangat, keusilan, dan keperca-
yaanya ya Pak. Maaf sudah menjadi mahasiswa paling rame di dunia
maya. Sy akan selalu mengingat kata-kata motivasi pertama Bapak, โPasti
bisa!โ.
7. Seluruh dosen pengajar Program Studi Matematika ITB yang telah meng-
ajar saya dan memberikan ilmu yang bermanfaat, serta staf karyawan yang
telah membantu berlangsungnya kegiatan belajar mengajar di Program
Studi Matematika ITB.
8. Sahabat penulis, si bulet dan kurus Nur Cahyanti, yang selalu menemani di
kala suka dan duka. Terimakasih telah menerima penulis apa adanya dan
memberikan dorongan agar cepat menyelesaikan tugas akhir ini.
9. Geng lurus, Yanti dan Hestin, terima kasih atas kebersamaan, canda, dan
tawa selama ini. Semoga persahabatan kita menjadi persahabatan yang
langgeng. Sukses dan bahagia selalu ya Gengs!
10. Teman-teman kelas Topik Statistika IV dengan berbagai karakternya. Ka-
lian adalah teman-teman yang mengajarkan penulis banyak hal, terutama
mengenai kesabaran dan kasih sayang. Terimakasih sudah menjadi kakak-
kakak terbaik dan telah sabar menghadapi adik yang suka ngambek ini.
11. Teman-teman satu bimbingan, Tria, Mona, Tessa, Bernard, Vivan, Kak
Fuad, Kak Maria, Kak Milla, Kak Ani, dan lainnya yang telah bersedia
berbagi info dan cerita.
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
7. vi
12. Teman-teman seperjuangan, Kawan-kawan Matematika ITB 2010 dan
Saudara-saudara Loedroek ITB 2010 yang telah memberikan banyak pe-
ngalaman berwarna selama kuliah di ITB.
13. Semua pihak yang tidak dapat saya sebutkan namanya satu per satu, yang
memberikan dukungan dan bantuan baik secara langsung maupun tidak
langsung kepada penulis, sehingga penulis dapat menyelesaikan buku tu-
gas akhir ini dan menjalani seminar tugas akhir dengan baik.
Semoga Allah SWT membalas bantuan dan kebaikan pihak-pihak tersebut
dengan segala rahmat dan kasih sayang-Nya. Akhir kata, penulis berharap agar
buku tugas akhir ini dapat berguna bagi pembacanya.
Bandung, Agustus 2015
Penulis
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
8. vii
Daftar Isi
MODEL IMPUTASI BERBASIS DISTRIBUSI BERSYARAT i
CONDITIONAL DISTRIBUTION BASED IMPUTATION MODEL ii
Prakata iv
Daftar Isi vii
Daftar Gambar x
Daftar Tabel xi
Bab 1 Pendahuluan 1
1.1 Latar Belakang........................................................................................... 1
1.2 Tujuan........................................................................................................ 2
1.3 Sistematika Pembahasan............................................................................ 3
Bab 2 Landasan Teori 4
2.1 Data Longitudinal...................................................................................... 4
2.1.1 Dropout dan Klasifikasinya.............................................................. 4
2.1.2 Imputasi ............................................................................................ 7
2.2 Konsep Dasar Teori Copula ...................................................................... 8
2.2.1 Densitas Copula.............................................................................. 11
2.3 Distribusi Multivariat Normal Standar.................................................... 12
2.3.1 Korelasi Pearson............................................................................. 13
2.4 Copula Gaussian...................................................................................... 16
2.4.1 Konstruksi Copula Gaussian .......................................................... 17
2.4.2 Densitas Copula Gaussian .............................................................. 18
2.4.3 Konstruksi Distribusi Bersama....................................................... 19
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
9. Daftar Isi
viii
2.4.4 Konstruksi Distribusi Bersyarat...................................................... 19
2.5 Titik Maksimum ...................................................................................... 20
2.5.1 Titik Maksimum Fungsi Densitas Distribusi Normal..................... 21
Bab 3 Model Imputasi 23
3.1 Model Umum Imputasi............................................................................ 24
3.2 Struktur Korelasi...................................................................................... 30
3.2.1 Struktur Korelasi Compound Symmetry ......................................... 30
3.2.2 Struktur Korelasi First Order Autoregressive................................ 33
3.2.3 Struktur Korelasi 1-Banded Toeplitz.............................................. 36
3.3 Penaksiran Parameter Koefisien Korelasi ............................................... 38
3.4 Pemilihan Model Terbaik ........................................................................ 40
3.5 Interval Prediksi....................................................................................... 41
Bab 4 Algoritma Imputasi dan Simulasi 44
4.1 Algoritma Imputasi.................................................................................. 44
4.2 Simulasi ................................................................................................... 45
4.2.1 Simulasi pada Data Bangkitan........................................................ 45
4.2.1.1 Struktur Korelasi CS ......................................................... 47
4.2.1.2 Struktur Korelasi AR1 ...................................................... 50
4.2.1.3 Struktur Korelasi 1BT....................................................... 53
4.2.2 Simulasi pada Data Rill.................................................................. 56
4.2.2.1 Deskripsi Data................................................................... 56
4.2.2.2 Penerapan Algoritma Imputasi pada Data ........................ 58
Bab 5 Kesimpulan 64
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
11. x
Daftar Gambar
Gambar 2.1 Histogram data bangkitan dari distribusi ๐๐ฅ๐โก(2)............................ 10
Gambar 2.2 Histogram data hasil transformasi. .................................................. 10
Gambar 2.3 Pengaruh ukuran sampel terhadap distribusi korelasi empiris. ....... 15
Gambar 2.4 Pengaruh korelasi populasi terhadap distribusi korelasi empiris..... 16
Gambar 4.1 Histogram hasil PIT untuk data kadar timbal dalam darah. ............ 59
Gambar 4.2 Plot CDF empirik hasil PIT data kadar timbal dalam darah............ 59
Gambar 4.3 Grafik fungsi likelihood densitas Gaussian..................................... 60
Gambar 4.4 Plot data kadar timbal dalam darah. ................................................ 62
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
12. xi
Daftar Tabel
Tabel 2.1 Random dropout..................................................................................... 6
Tabel 2.2 Informative dropout................................................................................ 6
Tabel 3.1 Ilustrasi data longitudinal dengan dropout........................................... 23
Tabel 3.2 Interval ๐ untuk beberapa ukuran matriks ๐ซ........................................ 39
Tabel 3.3 Formula Var(๐๐|๐ฏ)ฬ .............................................................................. 42
Tabel 4.1 Hasil simulasi pada data bangkitan (CS, normal,โก๐ = 0,5).................. 47
Tabel 4.2 Frekuensi relatif pemilihan model (CS, normal, ๐ = 0,5)................... 48
Tabel 4.3 Hasil simulasi data bangkitan (CS, normal,โก๐ = 0,8). ......................... 48
Tabel 4.4 Frekuensi relatif pemilihan model (CS, normal,โก๐ = 0,8)................... 49
Tabel 4.5 Hasil simulasi data bangkitan (CS, skewed,โก๐ = 0,5).......................... 49
Tabel 4.6 Frekuensi relatif pemilihan model (CS, skewed,โก๐ = 0,5)................... 50
Tabel 4.7 Hasil simulasi data bangkitan (AR1, normal,โก๐ = 0,5)........................ 50
Tabel 4.8 Frekuensi relatif pemilihan model (AR1, normal,โก๐ = 0,5). ............... 51
Tabel 4.9 Hasil simulasi data bangkitan (AR1, normal,โก๐ = 0,8)....................... 52
Tabel 4.10 Frekuensi relatif pemilihan model (AR1, normal,โก๐ = 0,8). ............. 52
Tabel 4.11 Hasil simulasi data bangkitan (AR1, skewed,โก๐ = 0,5). .................... 53
Tabel 4.12 Frekuensi relatif pemilihan model (AR1, skewed,โก๐ = 0,5). ............. 53
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
13. Daftar Tabel
xii
Tabel 4.13 Hasil simulasi data bangkitan (1BT, normal,โก๐ = 0,5)...................... 54
Tabel 4.14 Frekuensi relatif pemilihan model (1BT, normal,โก๐ = 0,5)............... 54
Tabel 4.15 Hasil simulasi data bangkitan (1BT, normal,โก๐ = 0,2)...................... 55
Tabel 4.16 Frekuensi relatif pemilihan model (1BT, normal,โก๐ = 0,2)............... 55
Tabel 4.17 Hasil simulasi data bangkitan (1BT, skewed,โก๐ = 0,5)...................... 56
Tabel 4.18 Frekuensi relatif pemilihan model (1BT, skewed,โก๐ = 0,5)............... 56
Tabel 4.19 Data kadar timbal dalam darah (dalam ฮผg/dl).................................... 57
Tabel 4.20 Hasil fitting distribusi data kadar timbal dalam darah. ...................... 59
Tabel 4.21 Hasil taksiran ๐ฅ20,4............................................................................. 61
Tabel 4.22 Eror model.......................................................................................... 61
Tabel 4.23 Hasil simulasi imputasi kasus single dropout pada data kadar timbal
dalam darah........................................................................................................... 62
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
14. 1
Bab 1
Pendahuluan
1.1 Latar Belakang
Data observasi merupakan representasi dari sebuah keadaan, sehingga data obser-
vasi mampu memberikan validasi terhadap isu, masalah, dan dugaan yang ada di
masyarakat. Data observasi memiliki berbagai bentuk yang pemilihannya dise-
suaikan dengan tujuan dilaksanakannya studi. Salah satu bentuk data observasi
yang cukup sering digunakan ialah bentuk data longitudinal, dimana data memuat
observasi dari pengukuran berulang. Studi yang menggunakan data longitudinal
sebagai dasar penarikan kesimpulan disebut sebagai studi longitudinal. Dengan
adanya pengukuran berulang, studi longitudinal mampu mendeteksi perubahan
suatu variabel terhadap waktu, sehingga dapat digunakan untuk menarik inferensi
kausal.
Studi longitudinal telah banyak diterapkan di berbagai disiplin ilmu, seper-
ti kedokteran, psikologi, biologi, dan ekonomi. Salah satu contoh ialah studi di
bidang kedokteran yang diinisiasi oleh Lewis Terman pada tahun 1921. Studi
yang dikenal dengan nama โGenetics studies of Geniusโ ini bertujuan untuk
menentukan kurikulum pendidikan terbaik bagi orang-orang jenius.
Hingga saat ini, masalah besar yang kerap terjadi pada saat proses
pengambilan data longitudinal ialah adanya fenomena dropout (attrition), yaitu
hilangnya data karena subjek meninggalkan studi. Dropout dapat menyebabkan
adanya bias (kesalahan) dalam penarikan kesimpulan (lihat referenssi Fitzmaurice
dkk, 2004), sehingga dibutuhkan penanggulangan yang tepat. Salah satu metode
untuk menanggulangi dropout ialah dengan melakukan imputasi, yaitu mengisi
data yang hilang dengan menggunakan nilai taksiran.
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
15. Bab 1 Pendahuluan
2
Identifikasi struktur hilangnya data dan imputasi pertama kali dilakukan
oleh McKendrik pada tahun 1926. Kemudian teori mengenai data hilang mulai
berkembang pesat di tahun 1970-an yang ditandai dengan munculnya metode case
deletion dan metode single imputation. Sekitar tahun 1980, metode imputasi ber-
basis likelihood diperkenalkan. Bukan hanya single imputation, multiple imputa-
tion mulai dikembangkan di tahun 1990-an.
Pada tugas akhir ini, akan dibahas salah satu model imputasi yang tergo-
long sebagai single imputation. Berbeda dengan multiple imputation, sesuai de-
ngan namanya, single imputation menggunakan suatu nilai untuk mengisi data
yang hilang, sehingga hanya diperoleh satu data lengkap. Model imputasi yang
akan dibahas ialah model imputasi dengan memanfaatkan distribusi bersyarat.
Distribusi bersyarat dipilih karena pengukuran berulang pada suatu subjek
cenderung tidak saling bebas. Untuk memperoleh distribusi bersyarat dibutuhkan
distribusi bersama, dimana distribusi bersama dapat dikonstruksi menggunakan
pendekatan copula.
Istilah copula dalam bidang statistika dan matematika pertama kali diper-
kenalkan oleh Abe Sklar pada tahun 1959. Copula berasal dari bahasa latin yang
berarti ikatan. Sesuai dengan artinya, copula dapat menghubungkan distribusi-
distribusi marginal untuk memperoleh distribusi bersama. Copula yang akan
digunakan dalam tugas akhir ini adalah copula Gaussian.
1.2 Tujuan
1. Mengkonstruksi model imputasi dengan memanfaatkan distribusi bersya-
rat yang dikonstruksi dengan menggunakan copula Gaussian.
2. Menganalisis kebaikan model imputasi yang diperoleh berdasarkan tujuan
1.
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
16. Bab 1 Pendahuluan
3
1.3 Sistematika Pembahasan
Tugas akhir ini terdiri dari lima bab. Bab 1, yaitu pendahuluan memuat latar bela-
kang yang mendasari diangkatnya topik ini sebagai tugas akhir, tujuan yang ingin
dicapai, dan sistematika pembahasan.
Bab 2 berisi landasan teori yang dibutuhkan untuk mengkonstruksi model
imputasi. Sebelum mengkonstruksi model imputasi, dibutuhkan pemahaman lebih
dalam mengenai dropout dan imputasi, sehingga teori mengenai data longitudinal
diberikan di awal bab. Kemudian dilanjutkan dengan pembahasan mengenai kon-
sep dasar teori copula, distribusi multivariat normal standar, copula Gaussian, dan
konstruksi distribusi bersyarat dengan menggunakan copula Gaussian. Bab ini
ditutup dengan pembahasan mengenai titik maksimum sebagai salah satu bagian
dari teori optimisasi yang nantinya dibutuhkan dalam proses pemodelan.
Bab 3 berisi pembahasan mengenai langkah-langkah konstruksi model
imputasi. Setelah model umum imputasi diperoleh, beberapa struktur korelasi
yang umum digunakan dibahas dan diaplikasikan ke dalam model, sehingga di-
peroleh 4 formula (model) imputasi. Untuk memahami cara memperoleh penaksir
terbaik, bab ditutup dengan pembahasan mengenai penaksiran parameter koefisien
korelasi, pemilihan model terbaik, dan interval prediksi.
Bab 4 membahas mengenai algoritma imputasi yang dikonstruksi sesuai
dengan model imputasi yang telah diperoleh pada Bab 3. Kemudian untuk meng-
analisis kebaikan prosedur imputasi, algoritma imputasi tersebut diterapkan pada
data bangkitan dan data riil. Untuk simulasi pada data bangkitan, indikator
kebaikan model imputasi didasarkan pada perbandingan dengan hasil taksiran
dengan menggunakan metode yang sudah ada sebelumnya.
Bab 5 sebagai bab penutup memberikan kesimpulan mengenai kebaikan
model imputasi berbasis distribusi bersyarat yang didasarkan pada hasil analisa
penerapan algoritma imputasi pada data rill dan data bangkitan.
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
17. 4
Bab 2
Landasan Teori
2.1 Data Longitudinal
Data longitudinal merupakan data yang memuat nilai-nilai observasi dari pe-
ngukuran berulang pada sejumlah subjek (sampel) dalam suatu periode (masa
studi) tertentu. Data ini umumnya direpresentasikan dalam bentuk matriks beruku-
ran ๐ ร ๐, dimana ๐ dan ๐ secara berturut-turut menyatakan banyaknya sampel
dan titik waktu pengukuran yang ditetapkan sebelum masa studi dimulai. Dengan
adanya pengukuran berulang, data longitudinal mampu mengambil informasi me-
ngenai karakteristik suatu variabel terhadap perubahan waktu, sehingga seringkali
digunakan untuk menarik inferensi kausal.
Disamping keuntungan yang dimiliki oleh data longitudinal, terdapat be-
berapa kelemahan, yaitu waktu dan biaya yang dibutuhkan dalam pengambilan
data cukup besar dan adanya kerentanan terhadap dropout yang berakibat pada
validitas inferensi (lihat referensi Fitzmaurice dkk, 2004). Tugas akhir ini akan
membahas lebih lanjut mengenai dropout.
2.1.1 Dropout dan Klasifikasinya
Studi yang melibatkan data menarik kesimpulan berdasarkan analisis dari data,
sehingga masalah yang terjadi selama proses pengambilan data harus diperha-
tikan. Salah satu masalah yang kerap dialami dalam pengambilan data longitudi-
nal ialah terjadinya dropout yang menyebabkan data tidak lengkap.
Dropout/attrition ialah salah satu jenis hilangnya data yang terjadi karena
subjek meninggalkan studi sebelum masa studi berakhir. Misalkan terdapat ๐
subjek yang akan diukur sebanyak ๐ kali pada saat ๐ก1, ๐ก2, โฆ , ๐ก ๐. Definisikan
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
18. Bab 2 Landasan Teori
5
๐ฟ = (๐1, โฆ , ๐ ๐) ๐
sebagai vektor acak yang menyatakan pengukuran. Apabila
subjek ๐ mengalami dropout pada saat ๐ก ๐, maka data pada saat dan setelah ๐ก ๐
untuk subjek ๐, yaitu ๐ฅ๐๐ hingga ๐ฅ๐๐ tidak terobservasi. Untuk selanjutnya,
๐ก1, ๐ก2, โฆ , ๐ก ๐ dituliskan sebagai 1,2, โฆ , ๐.
Dropout dapat mengurangi efisiensi, menghilangkan informasi, dan ber-
potensi menyebabkan bias pada penarikan kesimpulan apabila karakteristik dari
individu yang mengalami dropout berbeda dengan individu yang tidak mengalami
dropout. Akibat ini akan lebih jelas terlihat apabila jumlah subjek yang terlibat
dalam studi cukup sedikit.
Ketika dropout terjadi, validitas dari inferensi bergantung pada keterkaitan
antara variabel yang ingin diteliti dengan penyebab dropout (lihat referensi
Fitzmaurice dkk, 2004). Keterkaitan ini selanjutnya akan disebut sebagai meka-
nisme dropout dan digunakan untuk mengklasifikasikan dropout. Pada umumnya,
mekanisme dropout berada diluar kontrol dari peneliti, sehingga sulit untuk dipa-
hami. Secara teoritis, dengan mengikuti analogi klasifikasi data hilang yang di-
perkenalkan oleh Rubin (1976), berdasarkan mekanisme dropout, dropout dapat
diklasifikasikan menjadi 3 jenis, yaitu:
1. Completely Random Dropout (CRD), yaitu ketika peluang terjadinya
dropout tidak bergantung pada nilai yang terobservasi maupun nilai spe-
sifik yang seharusnya dapat diobservasi. Dengan kata lain, dropout terjadi
secara acak, sehingga subjek yang tidak mengalami dropout dapat dikata-
kan sebagai sampel acak dari target populasi (๐ subjek). Dengan demikian,
inferensi berdasarkan analisis yang dibatasi pada data dari subjek yang
memiliki observasi lengkap dikatakan valid (lihat referensi Fitzmaurice
dkk, 2004).
2. Random Dropout (RD), yaitu ketika peluang terjadinya dropout bergan-
tung pada nilai yang terobservasi, tetapi tidak bergantung pada nilai spe-
sifik yang seharusnya dapat diobservasi. Kebergantungan peluang dropout
dengan nilai observasi historis untuk masing-masing subjek mengindikasi-
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
19. Bab 2 Landasan Teori
6
kan bahwa data yang hilang dapat ditaksir dengan memanfaatkan data his-
toris subjek.
Tabel 2.1 Random dropout.
๐๐ข๐๐๐๐
๐๐๐ก๐๐โก๐๐๐๐ก๐ข
1 2 โฆ ๐ โฆ ๐ โ 1 ๐ โฆ ๐
๐1 ๐2 โฆ ๐๐ โฆ ๐ ๐โ1 ๐ ๐ โฆ ๐ ๐
1 ๐ฅ11 ๐ฅ12 โฆ ๐ฅ1๐ โฆ ๐ฅ1๐โ1 ๐ฅ1๐ โฆ ๐ฅ1๐
2 ๐ฅ21 ๐ฅ22 โฆ ๐ฅ2๐ โฆ ๐ฅ2๐โ1 ๐ฅ2๐ โฆ ๐ฅ2๐
โฆ โฆ โฆ โฆ โฆ โฆ โฆ โฆ โฆ โฆ
๐ ๐ฅ๐1 ๐ฅ๐2 โฆ ๐ฅ๐๐ โฆ ๐ฅ๐๐โ1 โ โ โ
โฆ โฆ โฆ โฆ โฆ โฆ โฆ โฆ โฆ โฆ
๐ ๐ฅ ๐1 ๐ฅ ๐2 โฆ ๐ฅ ๐๐ โฆ ๐ฅ ๐๐โ1 ๐ฅ ๐๐ โฆ ๐ฅ ๐๐
Catatan: Dropout yang terjadi pada subjek ๐ pada waktu โก๐
bergantung pada observasi sebelumnya, yaitu ๐ฅ๐1 hingga ๐ฅ๐,๐โ1.
3. Informative Dropout (IF), yaitu ketika peluang terjadinya dropout bergan-
tung pada nilai yang terobservasi maupun nilai spesifik yang seharusnya
dapat diobservasi. Karena dropout bergantung pada nilai yang tidak terob-
servasi, maka informasi mengenai data historis saja tidak cukup untuk di-
jadikan dasar dalam memprediksi data yang hilang.
Tabel 2.2 Informative dropout.
๐๐ข๐๐๐๐
๐๐๐ก๐๐โก๐๐๐๐ก๐ข
1 2 โฆ ๐ โฆ ๐ โ 1 ๐ โฆ ๐
๐1 ๐2 โฆ ๐๐ โฆ ๐ ๐โ1 ๐ ๐ โฆ ๐ ๐
1 ๐ฅ11 ๐ฅ12 โฆ ๐ฅ1๐ โฆ ๐ฅ1๐โ1 ๐ฅ1๐ โฆ ๐ฅ1๐
2 ๐ฅ21 ๐ฅ22 โฆ ๐ฅ2๐ โฆ ๐ฅ2๐โ1 ๐ฅ2๐ โฆ ๐ฅ2๐
โฆ โฆ โฆ โฆ โฆ โฆ โฆ โฆ โฆ โฆ
๐ ๐ฅ๐1 ๐ฅ๐2 โฆ ๐ฅ๐๐ โฆ ๐ฅ๐๐โ1 โ โ โ
โฆ โฆ โฆ โฆ โฆ โฆ โฆ โฆ โฆ โฆ
๐ ๐ฅ ๐1 ๐ฅ ๐2 โฆ ๐ฅ ๐๐ โฆ ๐ฅ ๐๐โ1 ๐ฅ ๐๐ โฆ ๐ฅ ๐๐
Catatan: Dropout yang terjadi pada subjek ๐ pada waktuโกโก๐ ber-
gantung pada ๐ฅ๐1 hingga ๐ฅ๐,๐โ1 dan pada nilai spesifik dari data
yang seharusnya dapat diobservasi.
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
20. Bab 2 Landasan Teori
7
2.1.2 Imputasi
Melihat besarnya risiko yang ditimbulkan oleh dropout, dibutuhkan strategi pe-
nanggulangan yang tepat. Salah satu metode primitif sederhana yang dahulu
digunakan untuk menanggulangi data tidak lengkap ialah metode listwise deletion.
Metode ini dapat diterapkan pada data longitudinal dengan dropout, yaitu dengan
membuang data dari subjek yang tidak mengikuti studi hingga akhir. Dengan
demikian, analisis hanya didasarkan pada subjek yang memiliki data lengkap.
Metode listwise deletion mengasumsikan bahwa subjek yang mengalami
dropout relatif sedikit dan data yang digunakan dalam analisis cukup repre-
sentatif. Asumsi representatif hanya dapat dipastikan terpenuhi apabila dropout
yang terjadi mengikuti mekanisme CRD dan jumlah subjek yang terlibat dalam
studi tidak telalu sedikit. Selain itu, metode ini dapat menyebabkan hilangnya
banyak informasi. Keterbatasan metode listwise deletion menyebabkan metode ini
sudah banyak ditinggalkan dan digantikan oleh metode berbasis imputasi.
Imputasi ialah strategi untuk mengisi data yang hilang dengan menggu-
nakan nilai taksiran. Nilai taksiran yang dimaksud diperoleh dari suatu model
dengan memanfaatkan data-data terobservasi. Setelah nilai yang hilang ditaksir,
data dapat dianalisis menggunakan metode yang umum digunakan untuk menga-
nalisis data longitudinal lengkap.
Terdapat dua jenis imputasi, yaitu single imputation dan multiple imputa-
tion. Berbeda dengan multiple imputation, sesuai dengan namanya, single imputa-
tion menggunakan suatu nilai untuk mengisi data yang hilang, sehingga hanya
diperoleh satu data lengkap. Beberapa metode single imputation yang sering digu-
nakan ialah:
1. Mean subtitution, yaitu mengisi data hilang dari suatu subjek dengan
menggunakan rata-rata dari seluruh observasi sebelumnya untuk subjek
tersebut. Metode ini tidak mempertimbangkan trend dari data dan dapat
menggeser nilai-nilai ekstrim ke tengah ditribusi, sehingga mengurangi
variansi sampel dari variabel acak yang diimput, yaitu ๐ ๐.
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
21. Bab 2 Landasan Teori
8
2. Regression-based imputation, yaitu mengisi data hilang dengan menggu-
nakan persamaan regresi yang diperoleh dari subjek yang memiliki data
lengkap hingga waktu ๐. Metode ini mengasumsikan bahwa model regresi
yang sama dapat menjelaskan data dari subjek yang tidak mengalami
dropout seperti halnya data dari subjek yang mengalami dropout.
3. Last Observation Carried Forward (LOCF), yaitu mengisi data hilang
dengan menggunakan nilai observasi sebelumnya. Metode ini dapat digu-
nakan apabila nilai pengukuran relatif konstan terhadap waktu. Walaupun
metode LOCF hampir selalu menyebabkan adanya bias, kemudahan
penerapannya membuat metode ini masih banyak diterapkan di bidang
kedokteran.
4. Hot deck, yaitu mengisi data hilang dengan nilai observasi dari subjek lain
yang memiliki kemiripan nilai pada observasi-observasi sebelumnya.
Metode ini sulit diimplementasikan pada data kontinu dan lebih mudah
diimplementasikan pada data kategorikal. Semakin banyak titik waktu
yang dicocokkan, imputasi semakin akurat, namun kecocokan akan sema-
kin jarang.
2.2 Konsep Dasar Teori Copula
Copula merupakan alat untuk mengkonstruksi distribusi bersama dari marginal-
marginal yang tidak harus berasal dari distribusi yang sama. Kontruksi dilakukan
dengan mempertimbangkan struktur kebergantungan (asosiasi) antar marginal-
marginalnya, sehingga dengan marginal yang sama dapat dibentuk beberapa dis-
tribusi bersama yang berbeda.
Menurut Ene Kรครคrik (2006b), konstruksi distribusi bersama menggunakan
pendekatan copula memiliki beberapa keuntungan, yaitu:
1. Dengan menggunakan copula, distribusi marginal dapat diestimasi terlebih
dahulu, kemudian mengkonstruksi distribusi bersamanya.
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
22. Bab 2 Landasan Teori
9
2. Fungsi kebergantungan dapat diperoleh secara eksplisit sehingga lebih mu-
dah untuk melihat kebergantungan secara spesifik.
3. Keluarga copula sangat banyak, sehingga dapat digunakan untuk memo-
delkan distribusi secara luas.
Berikut teorema yang menjadi dasar aplikasi teori copula pada bidang
statistika (lihat referensi Nelsen, 2006):
Teorema Sklar
Misalkan terdapat distribusi bersamaโก๐น dengan marginal univariat ๐น1,โฆ,๐น๐.
Maka terdapat sebuah copula ๐ถ sedemikian sehingga untuk semua ๐ฑโกdiโกโฬ ๐
,
๐น(๐ฅ1, โฆ , ๐ฅ ๐) = ๐ถ(๐น1(๐ฅ1), โฆ , ๐น๐(๐ฅ ๐)).
Jika ๐น1, โฆ , ๐น๐ kontinu, makaโก๐ถ unik.โ
Teorema Sklar secara eksplisit mengatakan bahwa setiap fungsi distribusi ber-
sama dapat dituliskan dalam bentuk copula, dimana copula merupakan fungsi
distribusi. Pada tugas akhir ini, pembahasan mengenai distribusi bersama dibatasi
hanya pada distribusi bersama dengan marginal-marginal kontinu. ๐น digunakan
untuk menotasikan fungsi distribusi dari suatu variabel acak kontinu.
Misalkan ๐น๐ merupakan fungsi distribusi dari variabel acak ๐๐ dan ๐๐
merupakan Probability Integral Transform (PIT) dari ๐๐, yaitu ๐๐ = ๐น๐(๐๐). De-
ngan menggunakan metode fungsi distribusi, akan dibuktikan bahwa ๐๐ berdistri-
busi uniform (0,1).
๐(๐๐ โค ๐ข)โกโกโกโก= ๐(๐น๐(๐๐) โค ๐ข)
= ๐ (๐๐ โค ๐น๐
โ1
(๐ข))
= ๐น๐ (๐น๐
โ1
(๐ข))
= ๐ข
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
23. Bab 2 Landasan Teori
10
Fungsi distribusi merupakan fungsi monoton naik dengan nilai fungsi yang berada
pada interval [0,1], sehingga ๐ข โ [0,1]. Dapat disimpulkan bahwa ๐๐~๐(0,1).
Dengan demikian, copula dapat dikatakan sebagai fungsi distribusi yang memiliki
marginal-marginal uniform (0,1). Untuk lebih memahami PIT, akan dibangkitkan
10.000 data dari variabel acak ๐ yang berdistribusi ๐๐ฅ๐โก(2). Berikut disajikan
histogram dari data bangkitan:
Gambar 2.1 Histogram data bangkitan dari distribusi ๐๐ฅ๐โก(2).
Data yang telah dibangkitkan ditransformasikan menggunakan fungsi berikut:
1. ๐น1(๐ฅ) = 1 โ ๐โ2๐ฅ
,
2. ๐น2(๐ฅ) =โกโซ
1
โ2๐
exp [
โโก( ๐ฅโ0.5)2
2
]
๐ฅ
โโ
.
Berikut disajikan histogram dari data hasil transformasi dengan kedua fungsi:
Gambar 2.2 Histogram data hasil transformasi:
(a) Menggunakan fungsi distribusi ๐๐ฅ๐โก(2); (b) Menggunakan fungsi distribusi ๐(0,5; 1).
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
24. Bab 2 Landasan Teori
11
Berdasarkan Gambar 2.2, histogram dari hasil tranformasi data menggunakan
fungsi distribusi ๐๐ฅ๐(2) mengindikasikan bahwa ๐น1(๐) berdistribusi uniform, di-
mana densitas frekuensi tersebar merata pada interval (0,1). Histogram dari hasil
tranformasi data menggunakan fungsi distribusi ๐(0,5; 1) tidak mengindikasikan
bahwa ๐น2(๐) berdistribusi uniform. Dengan demikian, variabel acak ๐ = ๐น(๐)
akan berdistribusi uniform jika dan hanya jika ๐น merupakan fungsi distribusi dari
๐.
2.2.1 Densitas Copula
Copula merupakan fungsi distribusi bersama, sehingga copula juga memiliki den-
sitas bersama yang selanjutnya disebut sebagai densitas copula. Misalkan
๐ฟ = (๐1, โฆ , ๐ ๐) ๐
merupakan vektor acak dengan fungsi distribusi marginal
๐น1, ๐น2, โฆ , ๐น๐ dan fungsi distribusi bersama ๐น, sedemikian sehingga ๐๐~๐น๐ dan
๐ฟ~๐น. Jika copula ๐ถ dan ๐น1, ๐น2, โฆ , ๐น๐ memiliki turunan, maka dengan memanfaat-
kan teorema Sklar diperoleh
โก๐(๐ฅ1, โฆ , ๐ฅ ๐)โกโก=โก
๐ ๐
โก๐น(๐ฅ1, โฆ , ๐ฅ ๐)
๐๐ฅ1 โฆ . ๐๐ฅ ๐
=โก
๐ ๐
โก๐ถ(๐น1(๐ฅ1), โฆ , ๐น๐(๐ฅ ๐))โก
๐๐ฅ1โก๐๐ฅ2 โฆ โก๐๐ฅ ๐
=โก
๐ ๐
โก๐ถ(๐น1(๐ฅ1), โฆ , ๐น๐(๐ฅ ๐))โก
๐๐น1(๐ฅ1) โฆ โก๐๐น๐(๐ฅ ๐)
รโกโกโ
๐๐น๐(๐ฅ๐)
๐๐ฅ๐
โก
๐
๐=1
= โก๐(๐น1(๐ฅ1), โฆ , ๐น๐(๐ฅ ๐))โกรโก ๐1(๐ฅ1)โกร โฆ .ร ๐๐(๐ฅ ๐),โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก(2. 1)
dimana ๐(๐น1(๐ฅ1), โฆ , ๐น๐(๐ฅ ๐)) merupakan turunan dari copula yang disebut seba-
gai densitas copula dan ๐๐ merupakan densitas dari variabel acak ๐๐. Misalkan ๐ฟ
merupakan vektor acak dengan marginal-marginal yang saling bebas, maka
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
25. Bab 2 Landasan Teori
12
โก๐(๐น1(๐ฅ1), โฆ , ๐น๐(๐ฅ ๐)) =โก
๐(๐ฅ1, โฆ , ๐ฅ ๐)
๐1(๐ฅ1)โกร โฆ .ร ๐๐(๐ฅ ๐)
=
๐1(๐ฅ1)โกร โฆ .ร ๐๐(๐ฅ ๐)
๐1(๐ฅ1)โกร โฆ .ร ๐๐(๐ฅ ๐)
= 1.
Dengan demikian, copula dapat dianggap sebagai ukuran asosiasi yang memban-
dingkan antara densitas bersama dengan perkalian densitas marginalnya.
2.3 Distribusi Multivariat Normal Standar
Distribusi multivariat normal standar merupakan distribusi yang memiliki mar-
ginal-marginal normal standar. Misalkan ๐ฎ~๐๐(๐, ๐ฐ ๐) dan ๐นk merupakan matriks
kovariansi Pearson berukuran ๐ ร ๐โกyang bersifat simetri dan definit positif,
dengan ๐๐๐๐(๐นk) = (1,1, โฆ , 1)T
. Untuk mengkonstruksi distribusi multivariat
normal standar dengan kovariansi ๐น ๐, definisikan ๐ = ๐น ๐
1
2
๐ฎ. Dengan demikian,
โก๐~โก๐๐(๐, ๐นk). Karena ๐ memiliki marginal normal standar, maka matriks ๐นk
dapat dikatakan sebagai matriks korelasi Pearson.
Akan dibuktikan bahwa matriks ๐นk harus memenuhi sifat simetri dan semi
definit positif. Berikut definisi dari matriks simetri yang bersifat semi definit
positif (lihat referensi Anton dan Rorres, 2005):
Definisi
Suatu matriks simetriโก๐จ โ โnxn
dikatakan bersifat semi definit positif apabila
untuk seluruh ๐ฎ โ ๐ dan ๐โก โ โn
berlakuโก๐T
๐จโก๐ โฅ 0.โ
Untuk membuktikan bahwa ๐นk bersifat semi definit positif, akan dicari selang
nilai dari ๐ ๐
โก๐นkโก๐. Pada kasus ini, distribusi marginal ๐๐ ialah distribusi yang
terpusat dan ๐นk merupakan matriks kovariansi, sehingga
๐นk = ๐ถ๐๐ฃโก(๐) = ๐ธ[๐๐ ๐].
Dari definisi matriks kovariansi, dapat dilihat bahwa ๐น ๐ bersifat simetri. Kemudi-
an dengan memanfaatkan sifat kelinieran ekspektasi, diperoleh
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
26. Bab 2 Landasan Teori
13
๐ ๐
โก๐ถ๐๐ฃโก(๐)โก๐ = โก๐ธ[๐ ๐ป
โก๐๐ ๐
โก๐]โก= ๐ธ[(๐ ๐ป
โก๐) ๐].
Definisikan ๐บ =โก(๐ ๐ป
โก๐). ๐บ merupakan variabel acak terpusat di 0, sehingga
๐ ๐
โก๐ถ๐๐ฃโก(๐)โก๐ = โก๐ธ[๐บ ๐] =โก ๐๐
2
โฅ 0.
Dapat disimpulkan bahwa ๐นk bersifat semi definit positif. Namun, agar densitas
distribusi multivariat normal berdasarkan definisi vector acak ๐ dapat diperoleh,
matriks ๐นk dibatasi memiliki sifat simetri dan definit positif (lihat referensi Hogg
dan Craig, 2005).
2.3.1 Korelasi Pearson
Korelasi Pearson merupakan ukuran kebergantungan linier (asosiasi linier) antara
dua variabel acak. Korelasi Pearson untuk dua variabel acak ๐ dan ๐ didefinisikan
sebagai
๐ ๐๐ =
๐ถ๐๐ฃ(๐, ๐)
โ๐๐๐(๐)๐๐๐(๐)
=
๐ธ[๐๐] โ ๐ธ[๐]๐ธ[๐]
โ(๐ธ[๐2] โ (๐ธ[๐])2)(๐ธ[๐2] โ (๐ธ[๐])2)
.โกโก
Beberapa hal yang harus dipahami mengenai korelasi Pearson adalah (Embrechts
dkk, 1999):
1. Interval dari nilai korelasi Pearson yang mungkin bergantung pada distri-
busi marginalnya (dalam hal ini distribusi dari ๐ dan distribusi dari ๐).
|๐ ๐๐| โค 1 untuk seluruh (๐, ๐) yang merupakan bivariat eliptical distribu-
tion, yaitu distribusi bivariat yang memiliki densitas konstan pada suatu
elipsoid, contohnya distribusi bivariat normal. Secara umum, interval dari
nilai korelasi Pearson yang mungkin merupakan subset dari [-1,1].
2. Misalkan [๐ ๐๐๐, ๐ ๐๐๐ฅ] menyatakan interval dari nilai korelasi Pearson
yang mungkin dari dua peubah acak ๐ dan ๐, maka ๐ ๐๐ = ๐ ๐๐๐ฅ menyata-
kan bahwa ๐ dan ๐ saling bergantung secara positif sempurna, sedangkan
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
27. Bab 2 Landasan Teori
14
๐ ๐๐ = ๐ ๐๐๐ menyatakan bahwa ๐ dan ๐ saling bergantung secara negatif
sempurna.
3. Korelasi Pearson hanya mengukur kebergantungan linier, sehingga apabila
dua peubah acak saling bebas, maka ๐ ๐๐ = 0, tetapi tidak berlaku seba-
liknya. ๐ ๐๐ = 0 menyatakan bahwa ๐ dan ๐ saling bebas jika dan hanya
jika (๐, ๐) berdistribusi bivariat normal.
4. Korelasi Pearson bersifat tidak invarian terhadap transformasi tak linier
naik murni (nonlinear strictly increasing transformation).
5. Korelasi Pearson hanya terdefinisi jika dan hanya jika kedua variabel acak
memiliki varansi yang berhingga.
Korelasi Pearson menggambarkan bagaimana dua variabel bergerak ber-
sama-sama. Hal yang sering disalahartikan ialah bahwa korelasi Pearson mengu-
kur hubungan kausalitas. Penyataan ini tidak selalu benar karena variabel ๐ dapat
dipengaruhi oleh ๐, variabel ๐ dapat dipengaruhi oleh ๐, atau variabel ๐ dan ๐
dipengaruhi oleh variabel ketiga, misalkan ๐.
Secara empiris, korelasi Pearson dapat diperoleh dengan menggunakan
formula
๐ ๐๐ฬ = ๐ ๐๐ =
๐ ๐๐
โ๐ ๐ ๐ ๐
=
โ (๐ฅ๐ โ ๐ฅฬ )(๐ฆ๐ โ ๐ฆฬ )๐
๐=1
โโ (๐ฅ๐ โ ๐ฅฬ )2๐
๐=1 โกโ (๐ฆ๐ โ ๐ฆฬ )2๐
๐=1
โก,
dimana ๐ menyatakan banyaknya sampel. Untuk selanjutnya, korelasi yang
dimaksud dalam tugas akhir ini adalah korelasi Pearson. Korelasi empiris meru-
pakan fungsi dari sampel (statistik) sehingga memiliki distribusi. Hotelling (1953)
menyatakan bahwa apabila (๐, ๐) berdistribusi bivariat normal, fungsi distribusi
dari korelasi sampel dapat dituliskan sebagai berikut:
๐๐ ๐๐
(๐) =
(๐ โ 2)ฮ(๐ โ 1)
โ2๐ฮ (๐ โ
1
2
) (1 โ ๐๐) ๐โ
3
2
โก(1 โ ๐2)
๐โ1
2
ร (1 โ ๐2)
๐โ4
2 [1 +
1
4
(
๐๐ + 1
2๐ โ 1
) +
9
32
(๐๐ + 1)2
(2๐ โ 1)(2๐ + 1)
+ โฏ ].
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
28. Bab 2 Landasan Teori
15
Dapat dilihat bahwa distribusi dari korelasi empiris bergantung pada korelasi po-
pulasi dan jumlah (ukuran) sampel. Kebergantungan dari masing-masing faktor
dapat dilihat melalui perbandingan bentuk kurva densitas apabila faktor lainnya
ditetapkan konstan.
Pengaruh ukuran sampel terhadap distribusi dari korelasi empiris dapat di-
lihat pada gambar berikut:
Gambar 2.3 Pengaruh ukuran sampel terhadap distribusi korelasi empiris:
(a) ๐ = 0.2 ; (b) ๐ = 0.5 ; (c) ๐ = โ0.2 ; (d) ๐ = โ0.5
Gambar 2.3 menunjukkan bahwa semakin besar ukuran sampel, maka peluang
๐๐๐ = ๐ ๐๐ semakin besar. Ukuran sampel yang sedikit cenderung menyebabkan
korelasi empiris salah dalam memprediksi korelasi populasi. Hal ini dapat dilihat
dari grafik densitas peluang korelasi empiris untukโก๐ = 3, dimana nilai densitas-
nya semakin membesar ketika mendekati 1 untuk nilai korelasi populasi positif
dan semakin membesar ketika mendekati -1 untuk nilai korelasi populasi negatif.
(d)(c)
(b)(a)
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
29. Bab 2 Landasan Teori
16
Pengaruh nilai korelasi populasi terhadap distribusi dari korelasi empiris
dapat dilihat pada gambar berikut:
Gambar 2.4 Pengaruh korelasi populasi terhadap distribusi korelasi empiris.
Gambar 2.4 memperlihatkan bahwa apabila korelasi populasi mendekati -1 atau 1,
maka dengan jumlah sampel yang sama, fungsi densitas di titik ๐๐๐ = ๐ ๐๐ sema-
kin besar.
Berdasarkan Pham-Gia dan Choulakian (2014), distribusi dari matriks ko-
relasi sampel juga bergantung pada jumlah sampel. Apabila ๐~๐ต ๐(๐, ๐บ ๐) dimana
matriks korelasi populasi ๐ฒ ๐ โ ๐ฐ dan ๐ฒ ๐
โ1
memiliki elemen diagonal ๐๐๐, maka
matriks korelasi sampel ๐ฒ dari suatu sampel acak berukuran ๐ memiliki fungsi
peluang sebagai berikut :
๐๐จ(๐ฒ) =
[ฮ (
๐ โ 1
2
)]
๐
exp {โ โ
๐๐๐ ๐ ๐๐
โ ๐๐๐ ๐๐๐โก๐<๐ }
๐
๐(๐โ1)
4 โ ฮ (
n โ i
2
)๐
๐=1 โก[|๐ฒ ๐| โ ๐๐๐
๐
๐=1 ]
๐โ1
2
|๐ฒ|
๐โ๐โ2
2 .
2.4 Copula Gaussian
Untuk memperoleh distribusi bersama, selain dibutuhkan distribusi marginal dan
nilai asosiasi (misalnya korelasi sebagai asosiasi linier), dibutuhkan pula struktur
kebergantungan. Gaussian copula merupakan alat untuk mengkontruksi distribusi
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
30. Bab 2 Landasan Teori
17
bersama dengan memanfaatkan struktur kebergantungan yang dimiliki oleh distri-
busi multivariat normal standar.
2.4.1 Konstruksi Copula Gaussian
Definisikan ฮฆ ๐ dan ๐ ๐ berturut-turut sebagai fungsi distribusi dan fungsi densitas
dari distribusi normal standar ๐-variat. Apabila ๐~โก๐๐(๐, ๐นk), maka sesuai de-
ngan Teorema Sklar berlaku
ฮฆ ๐(๐ง1, โฆ , ๐ง ๐|๐นk) = ๐ถ ๐๐๐ข๐ ๐ (ฮฆ1(๐ง1), โฆ , ฮฆ1(๐งk)|๐นk).โกโกโกโกโกโกโกโกโกโกโกโกโกโก(2. 2)
Selanjutnya, definisikan ๐๐ = ฮฆ1(๐๐) untuk ๐ = 1, . . . , ๐. Dengan mendefinisikan
variabel acak ๐๐, persamaan 2.2 dapat dituliskan sebagai berikut:
๐ถ ๐๐๐ข๐ ๐ (๐ข1, โฆ , ๐ขk|๐นk) = ฮฆ ๐(ฮฆ1
โ1
(๐ข1), โฆ , ฮฆ1
โ1
(๐ขk)|๐นk).โกโกโกโกโกโกโก(2. 3)
Sesuai dengan bukti yang telah dipaparkan pada sub bab 2.2, ๐๐ berdistri-
busi ๐(0,1). Dengan memanfaatkan PIT, distribusi ๐(0,1) dapat dibentuk dengan
mentrasformasikan suatu variabel acak kontinu sebarang dengan menggunakan
fungsi distribusinya sendiri. Dengan demikian, masing-masing ๐๐ dapat dibentuk
dari suatu variabel acak ๐๐, dimana ๐๐~๐น๐. Langkah ini merupakan basis dari
proses konstruksi copula Gaussian.
Definisikan
๐พ ๐ = (๐1, โฆ , ๐๐) ๐
= (ฮฆ1
โ1
(๐น1(๐1)), โฆ , ฮฆ1
โ1
(๐น๐(๐ ๐)))
๐
,
sehingga ๐๐~๐(0,1). Secara umum, matriks korelasi Pearson memiliki sifat tidak
invarian terhadap transformasi monoton. Akibatnya, apabila ๐ฟ = (๐1, โฆ , ๐ ๐) ๐
tidak berdistribusi multivariat normal standar, maka ๐ถ๐๐๐(๐ฟ) โ ๐ถ๐๐๐(๐พ ๐).
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
31. Bab 2 Landasan Teori
18
Definisikan ๐ถ๐๐๐(๐พ ๐) = ๐ซ ๐, sehingga ๐พk~๐๐(๐, ๐ซk). Dengan demiki-
an, persamaan 2.3 dapat dituliskan sebagai berikut:
๐ถ ๐๐๐ข๐ ๐ (๐ข1, โฆ , ๐ขk|๐ซk)โกโกโกโกโกโก= ฮฆ ๐(ฮฆ1
โ1
(๐น1(๐ฅ1)), โฆ , ฮฆ1
โ1
(๐นk(๐ฅk))|๐ซk)
= ฮฆ ๐(๐ฆ1, โฆ , ๐ฆk|๐ซk).โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก(2. 4)
Dapat dilihat pada persamaan 2.4, apabila ๐๐ = (๐ฅ๐1, โฆ , ๐ฅ๐๐) ๐
merupakan sampel
ke-๐ dari vektor acak ๐ฟ, pasangan nilai pada vektor ๐๐ mendefinisikan pasangan
nilai pada vektor ๐๐ = (๐ฆ๐1, โฆ , ๐ฆ๐๐) ๐
. Proses pembentukan pasangan nilai pada
vektor ๐๐ = (๐ฆ๐1, โฆ , ๐ฆ๐๐) ๐
termuat dalam parameter copula ๐ซ ๐.
2.4.2 Densitas Copula Gaussian
Sesuai dengan persamaan 2.4, melalui proses perhitungan yang serupa dengan
persamaan 2.1, densitas copula Gaussian dapat dituliskan sebagai berikut:
๐ ๐๐๐ข๐ ๐ (๐ข1, โฆ , ๐ขk)โกโก=
๐ ๐(๐ฆ1, โฆ , ๐ฆk|๐ซk)
๐1(๐ฆ1)โกร โฆ .ร ๐1(๐ฆk)
=
1
(2๐)
๐
2|๐ซk|
1
2
exp (โ
1
2
๐ ๐
๐
๐ซk
โ1
๐ ๐)
โ
1
(2๐)
1
2
๐
๐=1 ๐๐ฅ๐ (โ
1
2
โก๐ฆ๐
2
)
=
|๐ซk|โ
1
2 โกโกexp (โ
1
2
๐ ๐
๐
๐ซk
โ1
๐ ๐)
exp (โ
1
2
โก๐ ๐
๐ ๐ ๐)
=โก|๐ซk|โ
1
2 โกโกexp {โ
1
2
๐ ๐
๐
(๐ซk
โ1
โ ๐ฐ)๐ ๐}โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก(2. 5)
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
32. Bab 2 Landasan Teori
19
2.4.3 Konstruksi Distribusi Bersama
Densitas distribusi bersama merupakan perkalian antara densitas marginal dengan
densitas copula. Dengan demikian, sesuai persamaan 2.1 dan 2.5, densitas dari
suatu vector acak ๐ฟ yang dikonstruksi dengan menggunakan copula Gaussian
ialah
๐(๐ฅ1, โฆ , ๐ฅ ๐) = ๐1(๐ฅ1)โกร โฆโกรโก ๐๐(๐ฅ ๐)โก|๐ซk|โ
1
2โกโก๐
{โ
1
2
๐ ๐
๐(๐ซk
โ1
โ๐ฐ)๐ ๐}
โกโกโกโกโก(2. 6)
2.4.4 Konstruksi Distribusi Bersyarat
Distribusi bersyarat ialah distribusi dari suatu variabel acak ketika variabel acak
lainnya diasumsikan telah memiliki nilai. Distribusi bersyarat diturunkan melalui
analogi dari peluang bersyarat. Peluang bersyarat dapat dianggap sebagai pem-
bentukan ruang sampel yang baru sebagai himpunan yang merupakan subset tak
kosong dari ruang sampel sebelumnya tanpa mengubah bentuk distribusi dari sub-
set tersebut.
Misalkan terdapat sebuah eksperimen acak yang memiliki ruang sampel ๐ .
๐1 dan ๐2 merupakan subset dari ๐ sedemikian sehingga ๐(๐1) > 0. Untuk men-
cari peluang dari ๐2 dibawah kondisi bahwa hasil yang muncul merupakan
anggota dari ๐1, maka yang menjadi perhatian ialah irisan dari ๐2 dengan ๐1.
Sesuai dengan definisi frekuensi relatif, maka kerelatifan diukur terhadap ๐1,
sehingga
๐(๐2|โก๐1) =
๐(๐2 โฉ ๐1)
๐(๐1)
.โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก(2. 7)
Untuk menghitung densitas dari distribusi bersyarat, digunakan analogi
dari persamaan 2.7. Definisikan ๐(๐ฅ1, โฆ , ๐ฅ ๐) sebagai densitas bersama dari vektor
acak ๐ฟ = (๐1, โฆ , ๐ ๐) ๐
dan ๐(๐ฅ ๐|๐ฅ1, โฆ , ๐ฅ ๐โ1) sebagai densitas peluang variabel
acak ๐ ๐ diberikan ๐1, โฆ , ๐ ๐โ1. Sesuai dengan persamaan 2.7, maka
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
33. Bab 2 Landasan Teori
20
๐(๐ฅ ๐|๐ฅ1, โฆ , ๐ฅ ๐โ1) =โก
๐(๐ฅ1, โฆ , ๐ฅ ๐)
โก๐(๐ฅ1, โฆ , ๐ฅ ๐โ1)
.โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก(2. 8)
Sesuai persamaan 2.8, dapat disimpulkan bahwa untuk mencari distribusi ber-
syarat dibutuhkan distribusi bersama. Dengan menggunakan persamaan 2.1, 2.5,
dan 2.8, diperoleh
๐(๐ฅ ๐|๐ฅ1, โฆ , ๐ฅ ๐โ1)โก=โก
๐ ๐๐๐ข๐ ๐ (๐ข1, โฆ , ๐ข ๐)โกโก๐1(๐ฅ1)โกโฆโก๐๐(๐ฅ ๐)
๐ ๐๐๐ข๐ ๐ (๐ข1, โฆ , ๐ข ๐โ1)โกโก๐1(๐ฅ1)โกโฆโก๐๐โ1(๐ฅ ๐โ1)
= ๐๐(๐ฅ ๐)
๐ ๐๐๐ข๐ ๐ (๐ข1, โฆ , ๐ข ๐)
๐ ๐๐๐ข๐ ๐ (๐ข1, โฆ , ๐ข ๐โ1)
=
๐๐(๐ฅ ๐)โก๐ ๐(y1, โฆ , yk|๐ซk)๐1(y1)โกโฆ ๐1(ykโ1)
๐1(y1)โกโฆโก๐1(yk)๐ ๐โ1(y1, โฆ , ykโ1|๐ซkโ1)
=
๐๐(๐ฅ ๐)โก๐ ๐(y1, โฆ , yk|๐ซk)
๐1(yk)๐ ๐โ1(y1, โฆ , ykโ1|๐ซkโ1)
.โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก(2. 9)
Karena ๐๐ = ฮฆ1
โ1
(๐น๐(๐๐)), maka ๐1(๐ฆ๐) = ๐๐(๐ฅ๐). Dengan demikian, persamaan
2.9 dapat dituliskan sebagai berikut:
๐(๐ฆ ๐|๐ฆ1, โฆ , ๐ฆ ๐โ1; ๐ซ ๐)โกโก= ๐1(๐ฆ ๐)โก
๐ ๐(๐ฆ1, โฆ , ๐ฆ ๐; ๐ซ ๐)
๐ ๐โ1(๐ฆ1, โฆ , ๐ฆ ๐โ1; ๐ซ ๐โ1) ร ๐1(๐ฆ ๐)
โกโก.โกโกโกโก(2. 10)
2.5 Titik Maksimum
Misalkan ๐ด merupakan domain dari suatu fungsi ๐, dimana titik ๐ termuat dalam
๐ด. ๐(๐) merupakan titik maksimum dari fungsi ๐ di ๐ด apabila ๐(๐) โฅ ๐(๐ฅ) untuk
semua ๐ฅ๐๐ด. Apabila ๐ kontinu pada interval [๐, ๐], maka ๐ memiliki titik maksi-
mum (lihat referensi Purcell dkk, 2007). Titik maksimum yang didefinisikan pada
interval tutup dapat berupa titik stasioner, titik ujung, maupun titik singular.
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
34. Bab 2 Landasan Teori
21
Titik singular ialah titik interior dari domain fungsi dimana ๐โฒ(๐ฅ) tidak
terdefinisi. Sedangkan titik stasioner merupakan titik dimana
๐โฒ(๐ฅ) =
๐๐(๐ฅ)
๐๐ฅ
= 0.โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก(2. 11)
Tidak semua titik stasioner merupakan titik maksimum. Terdapat beberapa jenis
titik stasioner pada fungsi satu variabel, yaitu titik maksimum, titik minimum, dan
titik belok. Titik maksimum akan didapatkan apabila grafik ๐(๐ฅ) terbuka ke
bawah. Berikut teorema mengenai turunan kedua dari fungsi ๐ (lihat referensi
Purcell dkk, 2007):
Teorema
Misal fungsi ๐ memiliki turunan kedua pada interval buka I.
1. Jika ๐โฒโฒ(๐ฅ) > 0 untuk semua ๐ฅ di I, maka kurva ๐ terbuka ke atas
pada interval I.
2. Jika ๐โฒโฒ(๐ฅ) < 0โกuntuk semua ๐ฅ di I, maka kurva ๐ terbuka ke bawah
pada interval I.โกโ
2.5.1 Titik Maksimum Fungsi Densitas Distribusi Normal
Distribusi normal merupakan distribusi yang memiliki densitas bersifat log-con-
cave karena memiliki fungsi densitas yang memenuhi
๐2
log ๐(๐ฅ)
๐๐ฅ2
=
โ1
๐2
< 0,
dimana yang dimaksud dengan fungsi log disini ialah fungsi logaritma natural.
Distribusi yang bersifat log-concave bersifat unimodal, yaitu memiliki satu titik
dimana fungsi densitasnya bernilai maksimum. Hal ini dapat dilihat dari teorema
mengenai turunan kedua dan sifat fungsi logaritma, yaitu bersifat monoton naik
murni. Dengan demikian, untuk distribusi yang memiliki densitas bersifat log-
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
35. Bab 2 Landasan Teori
22
concave, titik dimana fungsi densitas peluang bernilai maksimum merupakan titik
stasioner dan dapat ditentukan dengan menggunakan turunan pertama.
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
36. 23
Bab 3
Model Imputasi
Sebelum mengkonstruksi model imputasi, terlebih dahulu akan dijelaskan skema
imputasi yang dilakukan. Skema imputasi bergantung pada struktur dropout pada
data. Beberapa struktur dropout yang mungkin terjadi pada proses pengambilan
data longitudinal ialah :
1. Dropout terjadi pada beberapa subjek sekaligus dalam suatu waktu pengu-
kuran,
2. Dropout terjadi pada beberapa subjek, dimana waktu terjadinya dropout
antar subjek yang berbeda tidak beririsan,
3. Dropout terjadi pada beberapa subjek, dimana beberapa diantara subjek
tersebut mengalami dropout di waktu yang sama.
Dari ketiga struktur dropout diatas, struktur dropout ke-3 memuat dua struktur
lainnya, sehingga struktur ini yang akan digunakan untuk mengilustrasikan skema
imputasi yang akan dilakukan. Akan diberikan contoh kasus dimana proses drop-
out mengikuti struktur dropout ke-3.
Misalkan terdapat 10 subjek yang akan diobservasi sebanyak 6 kali. ๐ฅ๐๐
menyatakan nilai observasi untuk subjek ๐ pada waktu ๐. Selama proses pengam-
bilan data, beberapa individu mengalami dropout, sehingga data yang diperoleh
seperti pada tabel berikut:
Tabel 3.1 Ilustrasi data longitudinal dengan dropout.
๐๐ข๐๐๐๐
๐๐๐ก๐๐โก๐๐๐๐ก๐ข
1 2 3 4 5 6
๐1 ๐2 ๐3 ๐4 ๐5 ๐6
1 ๐ฅ11 ๐ฅ12 ๐ฅ13 ๐ฅ14 ๐ฅ15 ๐ฅ16
2 ๐ฅ21 ๐ฅ22 ๐ฅ23 โ โ โ
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
37. Bab 3 Model Imputasi
24
Definisikan variabel ๐ sebagai variabel yang menyatakan titik waktu ter-
jadinya dropout pertama. Untuk kasus pada Tabel 3.1, ๐ = 3. Imputasi dilakukan
pada data hilang untuk masing-masing individu yang mengalami dropout pada
saat ๐. Setelah semua data hilang pada saat ๐ diimput, proses imputasi dilanjutkan
dengan mengimput data yang hilang pada saat ๐ + 1, dan seterusnya. Proses ini
disebut dengan sequential imputation.
Untuk mengisi nilai-nilai yang hilang pada tiap proses imputasi berda-
sarkan skema imputasi yang telah dijelaskan, akan dibahas salah satu model single
imputation yang dikonstruksi dengan memanfaatkan distribusi bersyarat. Menurut
Ene Kรครคrik (2006b), dengan meggunakan distribusi bersyarat, karakteristik dari
distribusi seperti mean, deviasi standard, dan kuantil dapat dengan mudah
dijelaskan secara analitik. Selain itu, dengan memanfaatkan distribusi bersyarat,
sampel acak dari data hilang dapat dibangkitkan, sehingga dengan kata lain,
model yang dihasilkan dapat dikembangkan menjadi model multiple imputation.
3.1 Model Umum Imputasi
Pada sub bab ini, akan dikonstruksi sebuah model umum imputasi untuk meng-
imput nilai ๐ฅ๐๐, yaitu data hilang dari individu ๐ pada saat ๐. Untuk mempermudah
penulisan, selanjutnya ๐ฅ๐๐ dituliskan sebagai ๐ฅ ๐. Misalkan terdapat ๐ subjek yang
akan diukur sebanyak ๐ kali. ๐ฟ = (๐1, โฆ , ๐ ๐) ๐
merupakan vektor acak peng-
ukuran pada titik waktu diskrit 1,2, โฆ , ๐. Apabila masing-masing subjek diang-
3 ๐ฅ31 ๐ฅ32 ๐ฅ33 ๐ฅ34 ๐ฅ35 ๐ฅ36
4 ๐ฅ41 ๐ฅ42 โ โ โ โ
5 ๐ฅ51 ๐ฅ52 ๐ฅ53 ๐ฅ54 ๐ฅ55 ๐ฅ56
6 ๐ฅ61 ๐ฅ62 ๐ฅ63 โ โ โ
7 ๐ฅ71 ๐ฅ72 ๐ฅ73 ๐ฅ74 ๐ฅ75 ๐ฅ76
8 ๐ฅ81 ๐ฅ82 โ โ โ โ
9 ๐ฅ91 ๐ฅ92 ๐ฅ93 ๐ฅ94 ๐ฅ95 ๐ฅ96
10 ๐ฅ10,1 ๐ฅ10,2 ๐ฅ10,3 ๐ฅ10,4 ๐ฅ10,5 ๐ฅ10,6
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
38. Bab 3 Model Imputasi
25
gap sebagai sampel acak dari ๐ฟ, maka data dari masing-masing subjek dapat
dikatakan sebagai realisasi dari vektor acak ๐ฟ. Dengan demikian, untuk mencari
nilai ๐ฅ ๐ berdasarkan observasi sebelumnya, yaitu ๐ฅ1, โฆ , ๐ฅ ๐โ1, setara dengan men-
cari distribusi dari ๐ ๐ bersyarat ๐1, . . . , ๐ ๐โ1.
Sesuai persamaan 2.9 dan 2.10, densitas ๐ ๐ bersyarat ๐1, . . . , ๐ ๐โ1 dapat
dituliskan sebagai densitas ๐๐ bersyarat ๐1, . . . , ๐๐โ1. Definisikan
๐ฏ = (๐1, โฆ , ๐๐โ1) ๐
sebagai vektor acak historis. Dengan demikian, matriks ๐ซ ๐ dapat dipartisi menja-
di
๐ซ ๐ = (
๐ซ ๐โ1 ๐
๐ ๐
1
),
dimana ๐ซ ๐โ1 merupakan matriks korelasi dari vektor acak historis ๐ฏ yang
berukuran (๐ โ 1) ร (๐ โ 1) dan ๐ merupakan matriks korelasi antara variabel
acak pada vektor historis dengan ๐๐. Kemudian, dengan mensubstitusikan fungsi
densitas distribusi normal ke persamaan 2.10, diperoleh
๐(๐ฆ ๐|๐ฏ; ๐ซ ๐)โก=
๐1(๐ฆ ๐)โก
1
(2๐)
๐
2|๐ซ ๐|
1
2
๐
{โ
1
2
๐ ๐
๐ ๐ซ ๐
โ1
๐ ๐}
(
1
(2๐)
๐โ1
2 |๐ซ ๐โ1|
1
2
๐
{โ
1
2
๐ ๐โ1
๐ ๐ซ ๐โ1
โ1 ๐ ๐โ1} 1
(2๐)
1
2
๐
{โ
1
2
๐ฆk
2}
)
=
๐1(๐ฆ ๐)|๐ซ ๐โ1|
1
2 ๐โ
1
2
(๐ ๐
๐ป ๐ซ ๐
โ1
๐ ๐โ๐ ๐โ1
๐ป ๐ซ ๐โ1
โ1
๐ ๐โ1โ๐ฆk
2)
|๐ซ ๐|
1
2
.โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก(3. 1)
Untuk mendapatkan taksiran terbaik dari ๐ฅ ๐, akan dicari nilai ๐ฆ ๐ yang me-
maksimumkan densitas bersyarat pada persamaan 3.1. Sesuai dengan pembahasan
pada bab 2.5.1, titik maksimum dari fungsi densitas distribusi normal merupakan
titik stasioner. Dengan demikian, nilai ๐ฆ ๐ yang memaksimumkan densitas ber-
syarat pada persamaan 3.1 ialah titik yang memenuhi persamaan berikut:
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
39. Bab 3 Model Imputasi
26
๐๐(๐ฆ ๐|๐ฏ; ๐ซ ๐)
๐๐ฆ ๐
= 0.โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก(3. 2)
Untuk mempermudah mencari titik stasioner dengan menggunakan formula 3.2
akan dicari bentuk sederhana dari ๐ ๐
๐ป
๐ซ ๐
โ1
๐ ๐ โ ๐ ๐โ1
๐ป
๐ซ ๐โ1
โ1
๐ ๐โ1. Penyeder-
hanaan ini digunakan untuk memisahkan ๐ฆ ๐ dari matriks ๐ ๐. Selain itu, akan
dicari bentuk sederhana dari
โก|๐ซ ๐โ1|
1
2
|๐ซ ๐|
1
2
. Untuk mencari bentuk sederhana dari
|๐ซ ๐โ1|
1
2
|๐ซ ๐|
1
2
,
mula-mula ๐ซ ๐ dituliskan dalam bentuk matriks partisi, sehingga
|๐ซ ๐โ1|
1
2
|๐ซ ๐|
1
2
dapat
dituliskan dalam bentuk berikut:
|๐ซ ๐โ1|
1
2
|๐ซ ๐|
1
2
=
|๐ซ ๐โ1|
1
2
|
๐ซ ๐โ1 ๐
๐ ๐ 1
|
1
2
= (
|
๐ซ ๐โ1 ๐
๐ ๐
1
|
|๐ซ ๐โ1|
)
โ
1
2
โก.โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก(3. 3)
Selanjutnya, akan dicari nilai dari |
๐ซ ๐โ1 ๐
๐ ๐
1
| terlebih dahulu. Sesuai de-
ngan Silvester (1999),
(
๐ซ ๐โ1 ๐
๐ ๐
1
) (
๐ฐ ๐โ1 ๐ ๐โ1,1
โ๐ ๐
1
) = (
๐ซ ๐โ1 โ ๐๐ ๐
๐
๐1,๐โ1 1
).
Kemudian, dengan mengaplikasikan determinan terhadap kedua ruas, diperoleh
|
๐ซ ๐โ1 ๐
๐ ๐
1
| |
๐ฐ ๐โ1 ๐ ๐โ1,1
โ๐ ๐
1
| = |
๐ซ ๐โ1 โ ๐๐ ๐
๐
๐1,๐โ1 1
|
โก|
๐ซ ๐โ1 ๐
๐ ๐
1
| 1 = |
๐ซ ๐โ1 โ ๐๐ ๐
๐
๐1,๐โ1 1
|
|
๐ซ ๐โ1 ๐
๐ ๐
1
| = |๐ซ ๐โ1 โ ๐๐ ๐|.โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก(3. 4)
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
40. Bab 3 Model Imputasi
27
Dengan menggunakan persamaan 3.3 dan 3.4, maka bentuk sederhana dari
|๐ซ ๐โ1|
1
2
|๐ซ ๐|
1
2
adalah
|๐ซ ๐โ1|
1
2
|๐ซ ๐|
1
2
โก= {|๐ซ ๐โ1 โ ๐๐ ๐|โกโก|๐ซ ๐โ1|โ1}โ
1
2
=โก{|๐ซ ๐โ1 โ ๐๐ ๐|โก|๐ซ ๐โ1
โ1 |}โโก
1
2
= |(๐ซ ๐โ1 โ ๐๐ ๐
)(๐ซ ๐โ1
โ1
)|โ
1
2โก
= |1 โ ๐ ๐
โก๐ซ ๐โ1
โ1
๐|โ
1
2
= (1 โ ๐ ๐ป
โก๐ซ ๐โ๐
โ๐
๐)
โโก
1
2.โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก(3. 5)
Selanjutnya, akan dicari bentuk sederhana dari ๐ ๐
๐ป
๐ซ ๐
โ1
๐ ๐ โ ๐ ๐โ1
๐ป
๐ซ ๐โ1
โ1
๐ ๐โ1.
Sebagai langkah awal dari proses penyederhanaan, tuliskan ๐ซ ๐
โ1
sebagai matriks
partisi yang memuat ๐ซ ๐โ1
โ1
, yaitu
๐ซ ๐
โ1
= (
(๐ซ ๐โ1 โ ๐๐ ๐)โ1
โ๐ซ ๐โ1
โ1
๐(1 โ ๐ ๐
๐ซ ๐โ1
โ1
๐)โ1
โ(1 โ ๐ ๐
๐ซ ๐โ1
โ1
๐)โ1
๐ ๐
๐ซ ๐โ1
โ1
(1 โ ๐ ๐
๐ซ ๐โ1
โ1
๐)โ1 ).โกโกโกโกโก(3. 6)
Penurunan persamaan 3.6 dapat dilihat pada Lampiran A.1. Kemudian dengan
menggunakan persamaan 3.5 dan 3.6, diperoleh
๐ ๐
๐ป
๐ซ ๐
โ1
๐ ๐ โ ๐ ๐โ1
๐ป
๐ซ ๐โ1
โ1
๐ ๐โ1 =
(๐ฆ ๐ โ ๐ ๐
๐ซ ๐โ1
โ1
๐ ๐โ1)2
1 โ ๐ ๐โก๐ซkโ1
โ1
๐
โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก(3. 7)
(untuk lebih jelasnya, lihat Lampiran A.2). Selanjutnya, dengan mensubstitusikan
persamaan 3.7 dan 3.5 ke persamaan 3.1, diperoleh
๐(๐ฆ ๐|๐ฏ; ๐ซ ๐) =
๐1(๐ฆ ๐)โกexp {โ
1
2
(
(๐ฆ ๐ โ ๐ ๐
๐ซ ๐โ1
โ1
๐ ๐โ1)2
1 โ ๐ ๐โก๐ซkโ1
โ1
๐
โ ๐ฆk
2
)}
(1 โ ๐ ๐โก๐ซkโ1
โ1
๐ซ)
1
2
.โกโกโกโกโกโก(3. 8)
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
41. Bab 3 Model Imputasi
28
Karena persamaaan 3.8 memuat fungsi eksponen, maka untuk mempermudah
mencari turunan dari ๐(๐ฆ ๐|๐ฏ; ๐ซ ๐) terhadap variabel ๐ฆ ๐, definisikan ๐(๐ฆ ๐) =
ln ๐(๐ฆ ๐|๐ฏ; ๐ซ ๐), sehingga
๐(๐ฆ ๐) = ln (โก
๐โ
1
2
๐ฆk
2
(2๐)
1
2
) โ
1
2
ln(1 โ ๐ ๐
โก๐ซkโ1
โ1
๐) โ
1
2
(
(๐ฆ ๐ โ ๐ ๐
๐ซ ๐โ1
โ1
๐ ๐โ1)2
1 โ ๐ ๐โก๐ซkโ1
โ1
๐
โ ๐ฆk
2
)
= โ
1
2
๐ฆk
2
โ
1
2
ln(2ฯ) โ
1
2
lnโก(1 โ ๐ ๐
โก๐ซkโ1
โ1
๐) โ
1
2
(
(๐ฆ ๐โ๐ ๐ ๐ซ ๐โ1
โ1
๐ ๐โ1)
2
1โ๐ ๐โก๐ซkโ1
โ1 ๐
โ ๐ฆk
2
).
Fungsi logaritma merupakan fungsi monoton naik murni, sehingga memak-
simumkan nilai suatu fungsi sama saja dengan memaksimumkan nilai dari
logaritma fungsi tersebut. Turunan dari ๐(๐ฆ ๐) terhadap variabel ๐ฆ ๐ adalah
๐๐(๐ฆ ๐)
๐๐ฆ ๐
=
โ๐ฆ ๐ + ๐ ๐
๐ซ ๐โ1
โ1
๐ ๐โ1
1 โ ๐ ๐โก๐ซkโ1
โ1
๐
.โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก(3. 9)
Sesuai dengan formula 3.2, dengan menyelesaikan persamaan
โ๐ฆ ๐ + ๐ ๐
๐ซ ๐โ1
โ1
๐ ๐โ1
1 โ ๐ ๐โก๐ซkโ1
โ1
๐
= 0,
diperoleh titik stasioner dari fungsi ๐(๐ฆ ๐|๐ฏ; ๐ซ ๐), yaitu
๐ฆ ๐ = ๐ ๐
๐ซ ๐โ1
โ1
๐ ๐โ1.
Teorema pada sub bab 2.5 menyatakan bahwa titik maksimum akan di-
dapatkan apabila grafik ๐(๐ฆ ๐) terbuka ke bawah, sehingga turunan kedua dapat
dimanfaatkan untuk menentukan apakah โก๐ฆ ๐ = ๐ ๐
๐ซ ๐โ1
โ1
๐ ๐โ1 adalah titik maksi-
mum. Berikut turunan kedua dari fungsi ๐(๐ฆ ๐) terhadap ๐ฆ ๐:
๐2
๐(๐ฆ ๐)
๐๐ฆ ๐
2 =โก
โ1
1 โ ๐ ๐โก๐ซkโ1
โ1
๐
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
42. Bab 3 Model Imputasi
29
Akan dibuktikan bahwa โ(1 โ ๐ ๐
โก๐ซkโ1
โ1
๐)
โ1
selalu bernilai negatif. Sesuai de-
ngan persamaan 3.5,
1
1 โ ๐ ๐โก๐ซkโ1
โ1
๐
=โก
|๐ซ ๐โ1|
|๐ซ ๐|
(1 โ ๐ ๐
โก๐ซkโ1
โ1
๐)โก|๐ซ ๐โ1| =โก|๐ซ ๐|.โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก(3. 10)
Persamaan 3.10 dapat dimanfaatkan untuk mengetahui rentang nilai dari
(1 โ ๐ ๐
โก๐ซkโ1
โ1
๐)
โ1
. Akan dicari terlebih dahulu rentang nilai untuk |๐ซ ๐|โก, |๐ซ ๐โ1|โก,
dan ๐ ๐
โก๐ซkโ1
โ1
๐. Misal ๐ = ๐ซ ๐โ1
โ1
๐. Karena matriks ๐ซ ๐โ1 bersifat definit positif dan
simetri, maka berlaku
๐ ๐
๐ซ ๐โ1 ๐ > 0
(๐ซ ๐โ1
โ1
๐) ๐
โก๐ซ ๐โ1โก(๐ซ ๐โ1
โ1
๐) > 0โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก
(๐ซ ๐โ1
โ1
๐) ๐
โกโก๐ > 0โกโกโกโกโกโก
๐ ๐
๐ซ ๐โ1
โ1
โกโก๐ > 0.
Kemudian karena ๐ซ ๐ merupakan matriks definit positif, maka |๐ซ ๐|, |๐ซ ๐โ1| > 0,
sehingga selang nilai yang mungkin dari 1 โ ๐ ๐
โก๐ซkโ1
โ1
๐ ialah
0 < 1 โ ๐ ๐
โก๐ซkโ1
โ1
๐ < 1.
Dengan demikian, โ(1 โ ๐ ๐
โก๐ซkโ1
โ1
๐โก)
โ1
selalu bernilai negatif untuk sebarang
matriks korelasi. Dapat disimpulkan bahwa ๐ฆ ๐ = ๐ ๐
๐ซ ๐โ1
โ1
๐ ๐โ1 adalah titik di-
mana fungsi densitas ๐(๐ฆ ๐|๐ฏ; ๐ซ ๐) mencapai nilai maksimum. Karena telah
memenuhi kriteria penaksir untuk ๐ฆ ๐, maka taksiran dari ๐ฆ ๐ adalah
๐ฆ ๐ฬ = ๐ ๐
๐ซ ๐โ1
โ1
๐ ๐โ1.โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก(3. 11)
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
43. Bab 3 Model Imputasi
30
Dengan demikian, formula umum imputasi untuk ๐ฅ ๐ adalah
๐ฅ ๐ฬ โก= ๐น๐
โ1
(ฮฆ1(๐ฆ ๐ฬ))
โกโก=โก ๐น๐
โ1
(ฮฆ1(๐ ๐
๐ซ ๐โ1
โ1
๐ ๐โ๐)).โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก(3. 12)
3.2 Struktur Korelasi
Untuk menaksir nilai ๐ฆ ๐ menggunakan formula 3.11, dibutuhkan matriks ๐ ๐
yang
memuat korelasi antara variabel pada vektor acak historis dengan ๐๐. Karena ๐๐
merupakan variabel acak yang memuat sampel tak terobservasi, korelasi sampel
tidak dapat dihitung.
Salah satu cara agar korelasi sampel dapat dihitung ialah dengan menge-
luarkan seluruh data subjek tak terobservasi dari perhitungan. Namun, karena
karakteristik dari subjek yang mengalami dropout mungkin saja berbeda dari
subjek yang tidak mengalami dropout, korelasi sampel yang dihitung dari subjek
yang tidak mengalami dropout dapat menyebabkan bias pada hasil imputasi.
Tanpa mengeluarkan subjek dengan dropout dari perhitungan, matriks korelasi
dapat ditaksir dengan mengasumsikan struktur korelasi tertentu. Apabila struktur
korelasi telah diasumsikan, taksiran matriks ๐ ๐
dapat ditentukan setelah matriks
korelasi historis, ๐ซ ๐โ1 ditaksir.
3.2.1 Struktur Korelasi Compound Symmetry
Matriks dengan struktur compound symmetry (CS) memiliki nilai 1 pada seluruh
elemen diagonalnya dan memiliki nilai konstan untuk elemen lainnya. Apabila
matriks korelasi mengikuti struktur matriks CS, maka korelasi antara dua variabel
acak yang berbeda selalu bernilai sama.
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
44. Bab 3 Model Imputasi
31
Apabila ๐ didefinisikan sebagai koefisien korelasi, bentuk matriks ๐ซ ๐โ1
dibawah struktur CS adalah
๐ซ ๐โ1
๐ถ๐
= (
1 ๐ โฆ ๐
๐ โฑ โฑ โฎ
โฎ โฑ 1 ๐
๐ โฆ ๐ 1
)โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก๐ ๐ถ๐
= (
๐
โฎ
๐
).
Untuk mencari nilai taksiran ๐ฆ ๐ dengan menggunakan formula 3.11 akan
dicari terlebih dahulu invers dari matriks ๐ซ ๐โ1
๐ถ๐
. Matriks ๐ซ ๐โ1
๐ถ๐
dapat dituliskan
sebagai berikut:
๐ซ ๐โ1
๐ถ๐
= ๐โก๐ ๐โ1 + (1 โ ๐)๐ฐ ๐โ1.
Dengan demikian, (๐ซ ๐โ1
๐ถ๐
)โ1
dapat diperoleh dengan menggunakan persamaan be-
rikut:
โก๐โก๐ ๐โ1(๐ซ ๐โ1
๐ถ๐
)โ1
+ (1 โ ๐)(๐ซ ๐โ1
๐ถ๐
)โ1
= ๐ฐ ๐โ1.โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก(3. 13)
Dengan menggunakan persamaan 3.13 dan persamaan
(๐ ๐โ1)2
= (๐ โ 1)(๐ ๐โ1),
akan dicari terlebih dahulu bentuk lain dari ๐ ๐โ1(๐ซ ๐โ1
๐ถ๐
)โ1
.
๐(๐ โ 1)๐ ๐โ1(๐ซ ๐โ1
๐ถ๐
)โ1
+ (1 โ ๐)๐ ๐โ1(๐ซ ๐โ1
๐ถ๐
)โ1
= ๐ ๐โ1
โกโก๐ ๐โ1(๐ซ ๐โ1
๐ถ๐
)โ1
=
๐ ๐โ1
(1 โ 2๐ + ๐๐)
โกโกโกโกโกโกโกโกโกโกโกโก(3. 14)
Dengan mensubstitusikan persamaan 3.14 ke persamaan 3.13, diperoleh
๐โก
๐ ๐โ1
(1 โ 2๐ + ๐๐)
+ (1 โ ๐)(๐ซ ๐โ1
๐ถ๐
)โ1
= ๐ฐ ๐โ1
(๐ซ ๐โ1
๐ถ๐
)โ1
=
๐ฐ ๐โ1 โ ๐โก
๐ ๐โ1
(1 โ 2๐ + ๐๐)
(1 โ ๐)
โก.โกโกโกโกโกโกโกโกโกโกโกโกโก(3. 15)
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
46. Bab 3 Model Imputasi
33
Kemudian, dengan mensubstitusikan persamaan 3.17 ke persamaan 3.16, diper-
oleh
๐ฆ ๐
๐ถ๐ฬ = ๐ (
1
1 + (๐ โ 2)๐
โฆ
1
1 + (๐ โ 2)๐
) (
๐ฆ1
โฎ
โฎ
๐ฆ ๐โ1
) =
๐
1 + (๐ โ 2)๐
โ ๐ฆ๐
๐โ1
๐=1
โก,โก
sehingga formula (model) imputasi untuk ๐ฅ ๐ dibawah asumsi struktur korelasi CS
adalah
๐ฅ ๐
๐ถ๐ฬ =โก ๐น๐
โ1
(ฮฆ1 (
๐
1 + (๐ โ 2)๐
โ ๐ฆ๐
๐โ1
๐=1
)).โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก(3. 18)
3.2.2 Struktur Korelasi First Order Autoregressive
Struktur first order autoregressive (AR1) merupakan struktur matriks dengan 2
parameter. Nilai elemen pada matriks korelasi AR1 bergantung pada suatu
koefisien korelasi ๐ dan selisih titik waktu pengukuran berdasarkan satuan
tertentu (lag). Korelasi antara dua variabel pengukuran pada titik waktu yang
berbeda akan semakin menurun apabila rentang waktu pengukuran semakin besar.
Bentuk matriks ๐ซ ๐โ1 dibawah struktur AR1 adalah
๐ซ ๐โ1
๐ด๐ 1
=
(
1 ๐ ๐2
โฆ ๐ ๐โ2
๐ 1 ๐ โฆ ๐ ๐โ3
๐2
๐ 1 โฆ ๐ ๐โ4
โฎ โฎ โฑ โฎ
๐ ๐โ2
๐ ๐โ3
๐ ๐โ4
โฆ 1 )
โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก๐ ๐ด๐ 1
=
(
๐ ๐โ1
๐ ๐โ2
โฎ
โฎ
๐ )
.
Untuk mencari nilai taksiran ๐ฆ ๐ dengan menggunakan formula 3.11 akan dicari
terlebih dahulu invers dari matriks korelasi AR1, yaitu (๐ซ ๐โ1
๐ด๐ 1)โ1
.
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
48. Bab 3 Model Imputasi
35
Dengan demikian, taksiran untuk ๐ฆ ๐ dibawah struktur AR1 adalah
๐ฆ ๐
๐ด๐ 1ฬ โก= (๐ ๐โ1
๐ด๐ 1) ๐(๐ซ ๐โ1
๐ด๐ 1
โก)โ1
โก๐ ๐โ1
=
1
๐2 โ 1
๐(๐2
โ 1)๐ฆ ๐โ1
= ๐๐ฆ ๐โ1,โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก(3. 19)
sehingga formula imputasi untuk ๐ฅ ๐ dibawah asumsi struktur korelasi AR1 adalah
๐ฅ ๐
๐ด๐ 1ฬ =โก ๐น๐
โ1
(ฮฆ1(๐๐ฆ ๐โ1)).โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก(3. 20)
Dari persamaan 3.19, dapat dilihat bahwa nilai ๐ฆ ๐
๐ด๐ 1ฬ hanya bergantung
pada ๐ dan ๐ฆ ๐โ1. Dengan demikian, distribusi ๐๐|๐๐โ1 dapat digunakan sebagai
salah satu model penaksir ๐ฆ ๐. Misalkan (๐๐โ1, ๐๐) ๐
berdistribusi bivariat normal
dengan
๐ = (
๐ ๐โ1
๐ ๐
)โกโกโกโกโกโกdanโกโกโกโก๐บ = (
๐๐โ1
2
๐๐๐โ1 ๐๐
๐๐๐โ1 ๐๐ ๐๐
2 ).
Dengan demikian, sesuai dengan teorema mengenai distribusi bersyarat yang
dibangun dari distribusi multivariat normal (lihat referensi Hogg dan Craig, 2005),
๐๐|๐๐โ1~๐2 (๐ ๐ +
๐๐๐
๐๐โ1
โก(๐ฆ ๐โ1 โ ๐ ๐โ1), ๐๐
2
(1 โ ๐2
)),
sehingga taksiran ๐ฆ ๐ juga dapat diperoleh dengan menggunakan formula berikut:
๐ฆ ๐
๐ด๐ 1๐ฬ โก= ๐ธ(๐๐|๐๐โ1)ฬ
= ๐ฬ ๐ + ๐
๐ ๐
๐ ๐โ1
โก(๐ฆ ๐โ1 โ ๐ฬ ๐โ1),โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก
dengan
๐ฬ ๐ : rataan dari sampel yang terobservasi pada waktu ๐,
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
49. Bab 3 Model Imputasi
36
๐ฬ ๐โ1 : rataan dari sampel yang terobservasi pada waktu (๐ โ 1),
๐ ๐โก : deviasi standar dari sampel yang terobservasi pada waktu ๐,
๐ ๐โ1 : deviasi standar dari sampel yang terobservasi pada waktu (๐ โ 1),
๐ : koefisien korelasi dibawah struktur AR1.
Dapat disimpulkan bahwa imputasi untuk ๐ฅ ๐ dibawah asumsi struktur korelasi
AR1 juga dapat diperoleh dengan menggunakan formula berikut:
๐ฅ ๐
๐ด๐ 1๐ฬ =โก ๐น๐
โ1
(ฮฆ1 (๐ฬ ๐ + ๐
๐ ๐
๐ ๐โ1
โก(๐ฆ ๐โ1 โ ๐ฬ ๐โ1))).โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก(3. 21)
Apabila ๐ ๐ = ๐ ๐โ1 dan ๐ฬ ๐ = ๐ฬ ๐โ1 = 0, maka formula 3.21 akan sesuai dengan
formula 3.20.
3.2.3 Struktur Korelasi 1-Banded Toeplitz
Struktur korelasi Toeplitz dan banded Toeplitz memuat nilai korelasi berbeda un-
tuk tiap pasang variabel acak dengan rentang waktu yang berbeda. Selain itu,
struktur ini tidak mengharuskan nilai korelasinya merupakan pangkat dari korelasi
basis (misal ๐). Matriks Toeplitz bernilai konstan sepanjang diagonal paralel ter-
hadap diagonal utama.
Struktur banded Toeplitz dapat digunakan dengan asumsi bahwa terdapat
struktur markovian, yaitu observasi terakhir mempengaruhi beberapa observasi
berikutnya (sejauh ๐โ
). Misal ๐โ
= 1, maka hanya 2 observasi yang berturutan
yang memiliki kebergantungan, sedemikian sehingga untuk ๐ = 1, โฆ , ๐ โ 2,
๐ท๐,๐+1 = ๐. Struktur ini disebut 1-banded Toeplitz Structure (1BT).
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
50. Bab 3 Model Imputasi
37
Bentuk matriks ๐ซ ๐โ1 dibawah struktur 1BT adalah
๐ซ ๐โ1
1๐ต๐
=
(
1 ๐ 0 โฆ 0
๐ 1 ๐ โฑ โฎ
0 ๐ โฑ โฑ 0
โฎ โฑ โฑ 1 ๐
0 โฆ 0 ๐ 1)
โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก๐1๐ต๐
= (
0
โฎ
๐
)
Selanjutnya, akan dicari formula imputasi untuk ๐ฆ ๐ dibawah asumsi struktur 1BT.
Berdasarkan formula 3.11,
๐ฆ ๐
1๐ต๐ฬ = ๐ ๐(๐ซ ๐โ1
1๐ต๐)โ1
๐ฆ ๐โ1 = (0 โฆ ๐)โก(๐ซ ๐โ1
1๐ต๐)โ1
โก(
๐ฆ1
โฎ
โฎ
๐ฆ ๐โ1
).
Misal ( ๐1 โฆ ๐ ๐โ1) merupakan baris terakhir dari matriks (๐ซ ๐โ1
1๐ต๐)โ1
, maka
โก๐ฆ ๐
1๐ต๐ฬ = (๐๐1 ๐๐2 โฆ ๐๐ ๐โ1)โก(
๐ฆ1
โฎ
โฎ
๐ฆ ๐โ1
),โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก(3. 22)
dengan
๐๐ ๐ = ๐(โ1) ๐โ1+๐ 1
|๐ซ ๐โ1
1๐ต๐|
|
๐ซ๐โ1
1๐ต๐
๐
๐ด ๐ฉ
|.
๐ฉ merupakan matriks segitiga bawah berukuran (๐ โ 1 โ ๐) dengan diagonal
utama ๐, sehingga
๐๐ ๐ = ๐(โ1) ๐โ1+๐
1
|๐ซ ๐โ1
1๐ต๐ |
๐๐๐ก |
๐ซ๐โ1
1๐ต๐
๐
๐ด ๐ฉ
|
โก= ๐(โ1) ๐โ1+๐
1
|๐ซ ๐โ1
1๐ต๐|
|๐ซ๐โ1
1๐ต๐
||๐ต|
โก= ๐(โ1) ๐โ1+๐
1
|๐ซ ๐โ1
1๐ต๐|
|๐ซ๐โ1
1๐ต๐
|โก๐ ๐โ1โ๐
โก=โก(โ1) ๐โ๐+1
1
|๐ซ ๐โ1
1๐ต๐ |
|๐ซ๐โ1
1๐ต๐
|โก๐ ๐โ๐
โก.โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก(3. 23)
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
51. Bab 3 Model Imputasi
38
Dengan menggunakan persamaan 3.22 dan 3.23 diperoleh taksiran untuk ๐ฆ ๐
dibawah asumsi struktur korelasi 1BT, yaitu
โก๐ฆ ๐
1๐ต๐ฬ =
1
|๐ซ ๐โ1
1๐ต๐ |
โ โก(โ1) ๐โ๐+1
|๐ซ๐โ1
1๐ต๐
|โก๐ ๐โ๐
๐โ1
๐=1
๐ฆ๐.โก
Kemudian, dengan memanfaatkan metode kofaktor, determinan dari |๐ซ๐โ1
1๐ต๐
| dapat
dituliskan sebagai
|๐ซ๐โ1
1๐ต๐
| = 1โก|๐ซ๐โ2
1๐ต๐
| โ ๐ |
๐ ๐ช
๐ ๐ซ๐โ2
1๐ต๐|.
Dengan demikian, determinan dari |๐ซ๐โ1
1๐ต๐
| dapat diperoleh secara rekursif
menggunakan formula
|๐ซ๐โ1
1๐ต๐
| = 1โก|๐ซ๐โ2
1๐ต๐
| โ ๐2
|๐ซ๐โ3
1๐ต๐
|โก,โกโกโกโก๐ = 3,4,5, โฆ , ๐ โ 1,โกโกโกโกโกโกโกโกโกโกโกโกโก(3. 24)
dengan nilai awal |๐ซ0
1๐ต๐| = |๐ซ1
1๐ต๐| = 1. Imputasi ๐ฅ ๐ dibawah asumsi struktur ko-
relasi 1BT dapat diperoleh dengan menggunakan formula berikut:
โก๐ฅ ๐
1๐ต๐ฬ =โก ๐น๐
โ1
(ฮฆ1 (
1
|๐ซ ๐โ1
1๐ต๐ |
โ โก(โ1) ๐โ๐+1
|๐ซ๐โ1
1๐ต๐
|โก๐ ๐โ๐
๐โ1
๐=1
๐ฆ๐)).โกโกโกโกโกโกโกโก(3. 25)
3.3 Penaksiran Parameter Koefisien Korelasi
Untuk masing-masing struktur, elemen dari matriks korelasi ๐ซ ๐ bergantung pada
koefisien korelasi ๐. Agar matriks korelasi ๐ซ ๐โ1 dan ๐ซ ๐ memenuhi syarat definit
positif, untuk setiap struktur korelasi, interval dari nilai ๐ yang memenuhi harus
dicari. Selain bergantung pada struktur matriks, interval ini bergantung pada uku-
ran matriks ๐ซ.
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
52. Bab 3 Model Imputasi
39
Suatu matriks bersifat definit positif jika dan hanya jika seluruh nilai
eigennya positif (lihat referensi Anton dan Rorres, 2005). Dengan demikian, in-
terval untuk ๐ dapat diperoleh dengan melakukan pengecekan terhadap seluruh
nilai eigen untuk masing-masing ๐ yang termuat pada interval [-1,1]. Berikut
disajikan tabel batas bawah dan batas atas interval dari masing-masing struktur
untuk beberapa ukuran matriks ๐ซ:
Tabel 3.2 Interval ๐ untuk beberapa ukuran matriks ๐ซ.
Ukuran Matriks ๐ซ Struktur Batas Bawah Batas Atas
2
CS -0.9995 0.9995
AR1 -0.9995 0.9995
1BT -0.9995 0.9995
3
CS -0.4995 0.9995
AR1 -0.9995 0.9995
1BT -0.7070 0.7070
4
CS -0.333 0.9995
AR1 -0.9995 0.9995
1BT -0.6180 0.618
5
CS -0.2495 0.9995
AR1 -0.9995 0.9995
1BT -0.577 0.577
6
CS -0.2 0.9995
AR1 -0.9995 0.9995
1BT -0.5545 0.5545
Sesuai dengan Tabel 3.2, dapat dilihat bahwa semakin besar ukuran ma-
triks, panjang interval dari ๐ yang memenuhi cenderung semakin sempit. Dengan
demikian, ukuran matriks yang dijadikan acuan untuk penentuan interval ialah ๐.
Setelah interval ๐ diperoleh, ๐ฬ untuk masing-masing struktur dapat diperoleh
dengan memilih salah satu nilai ๐ pada interval tersebut. Pemilihan dilakukan
dengan mencari nilai ๐ yang dapat memaksimumkan nilai fungsi likelihood dari
densitas copula sesuai persamaan berikut:
โ ๐ ๐๐๐ข๐ ๐
(๐ข๐1, โฆ , ๐ข๐,๐โ1)
๐
๐=1
= โ โก|๐ซkโ1|โ
1
2โกโก
๐
๐=1
๐
(โโก
1
2
โก๐๐,๐โ1
๐(๐ซkโ1
โ1
โ๐ฐ)๐ ๐,๐โ1)
.โกโก(3. 26)
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
53. Bab 3 Model Imputasi
40
Pada tugas akhir ini, nilai ๐ yang memaksimumkan persamaan 3.26 diper-
oleh secara numerik. Misalkan ๐ ๐ถ๐ฬ , โก๐ ๐ด๐ 1ฬ dan โก๐1๐ต๐ฬ berturut turut merupakan
taksiran koefisien korelasi untuk struktur CS, AR1, dan 1BT, maka taksiran ๐ฅ ๐
dengan menggunakan formula 3.18, 3.20, 3.21 dan 3.25 dapat diperoleh.
3.4 Pemilihan Model Terbaik
Model imputasi dikatakan baik apabila eror taksiran kecil. Nilai dari eror taksiran
bergantung pada satuan yang digunakan. Selain itu, apabila nilai eror taksiran
pada suatu data dikatakan kecil, maka belum tentu eror taksiran yang bernilai
sama untuk data yang berbeda juga dapat dikatakan kecil. Untuk itu, karena nilai
eror dapat dianggap sebagai jarak, nilai eror dihitung relatif terhadap deviasi
standar dari seluruh data terobservasi pada titik waktu imputasi. Untuk selanjut-
nya, nilai eror ini disebut sebagai eror imputasi.
Misalkan imputasi dilakukan untuk mengisi data hilang dari subjek ๐ pada
waktu ๐. ๐๐ menyatakan eror imputasi dari subjek ๐. Secara matematis, untuk
suatu subjek ๐, eror imputasi dapat ditulis sebagai berikut:
๐๐ =
๐ฅ๐๐ โ ๐ฅ๐๐ฬ
๐ ๐
โก.โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก(3. 27)
Pada kenyataannya, ๐๐ tidak dapat dihitung. Untuk itu, akan dijelaskan sebuah
metode pemilihan model yang cukup mampu menjamin bahwa model yang dipilih
memiliki ๐๐ yang kecil.
Berdasarkan persamaan 3.26, penaksiran parameter ๐ hanya melibatkan
data historis, sehingga apabila hasil taksiran parameter ๐ mampu mewakili para-
meter dari data lengkap, formula 3.18, 3.20, 3.21 dan 3.25 dapat dengan baik
menaksir nilai yang hilang pada saat ๐ dari sebarang subjek. Dengan demikian,
nilai ๐๐ untuk subjek-subjek yang terobservasi pada saat ๐ dapat dijadikan acuan
untuk memilih model terbaik. Untuk selanjutnya, nilai ๐๐ dari subjek yang terob-
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
54. Bab 3 Model Imputasi
41
servasi disebut dengan eror model dan dilambangkan dengan ๐๐. ๐๐ dapat dihitung
dengan mengasumikan bahwa fungsi distribusi ๐น๐ yang digunakan pada proses
perhitungan tidak berbeda dengan distribusi dari hasil fitting dengan menggu-
nakan seluruh data yang terobservasi pada saat ๐.
Misalkan ๐ฬ dan ๐ ๐ secara berturut turut menyatakan rata-rata dan deviasi
standar dari data ๐๐ untuk seluruh subjek ๐ yang terobservasi pada waktu ๐. Model
imputasi yang baik ialah model yang memiliki rata-rata dan deviasi standar eror
yang kecil, sehingga nilai eror taksiran lebih mudah diprediksi. Dengan demikian,
pemilihan model dapat didasarkan pada nilai ๐ฬ dan ๐ ๐ terkecil.
Untuk model autoregressive, selain bergantung pada parameter koefisien
korelasi ๐, elemen pada matriks korelasinya bergantung pada nilai pangkat yang
merupakan rentang antar titik waktu pengukuran yang diukur dengan menggu-
nakan satuan tertentu. Dengan demikian, apabila rentang waktu antar pengukuran
yang berurutan tidak konstan, model autoregressive tidak dapat digunakan
sehingga tidak perlu disertakan dalam pemilihan model.
3.5 Interval Prediksi
Selain memperoleh taksiran titik, dapat ditentukan pula taksiran selang (interval
prediksi) dari ๐ ๐. Sesuai dengan persamaan 3.8,
๐(๐ฆ ๐|๐ฏ; ๐ซ ๐) =
1
โ2๐
exp (โ
1
2
๐ฆ ๐
2
)โกexp {โ
1
2
(
(๐ฆ ๐ โ ๐ ๐
๐ซ ๐โ1
โ1
๐ ๐โ1)2
1 โ ๐ ๐โก๐ซkโ1
โ1
๐
โ ๐ฆk
2
)}
(1 โ ๐ ๐โก๐ซkโ1
โ1
๐ซ)
1
2
=
1
โ2๐
โกexp {โ
1
2
(
(๐ฆ ๐ โ ๐ ๐
๐ซ ๐โ1
โ1
๐ ๐โ1)2
1 โ ๐ ๐โก๐ซkโ1
โ1
๐
)}
(1 โ ๐ ๐โก๐ซkโ1
โ1
๐ซ)
1
2
.โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก(3. 28)
Dari persamaan 3.28,
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
55. Bab 3 Model Imputasi
42
๐๐|๐ฏ~๐(๐ ๐
๐ซ ๐โ1
โ1
๐ ๐โ1โก, 1 โ ๐ ๐
โก๐ซkโ1
โ1
๐ซ).
Dengan demikian, 100(1 โ ๐ผ)% interval prediksi dari ๐๐ ialah
[๐ ๐
๐ซ ๐โ1
โ1
๐ ๐โ1 โ ๐ง ๐ผ
2
โ1 โ ๐ ๐โก๐ซkโ1
โ1
๐ซโก, ๐ ๐
๐ซ ๐โ1
โ1
๐ ๐โ1 + ๐ง ๐ผ
2
โ1 โ ๐ ๐โก๐ซkโ1
โ1
๐ซโกโก]โก(3. 29)
dimana ๐ง ๐ผ
2
menyatakan kuantil
๐ผ
2
dari distribusi normal baku.
Sesuai dengan persamaan 3.12,โก๐ฅ ๐ฬ โก= ๐น๐
โ1
(ฮฆ1(๐ฆ ๐ฬ)). Pada kasus kontinu,
๐น๐ merupakan fungsi monoton naik murni, sehingga ๐น๐
โ1
juga merupakan fungsi
monoton naik murni. Misalkan
๐ = ๐ ๐
๐ซ ๐โ1
โ1
๐ ๐โ1 + ๐ง ๐ผ
2
โ1 โ ๐ ๐โก๐ซkโ1
โ1
๐ซ
๐ฟ = ๐ ๐
๐ซ ๐โ1
โ1
๐ ๐โ1 โ ๐ง ๐ผ
2
โ1 โ ๐ ๐โก๐ซkโ1
โ1
๐ซโก,
maka 100(1 โ ๐ผ)% interval prediksi ๐ ๐ adalah
[๐น๐
โ1
(ฮฆ1(๐ฟ)), ๐น๐
โ1
(ฮฆ1(๐))โก].โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก(3. 30)
Untuk masing-masing struktur korelasi, mean dan variansi dari ๐๐|๐ฏ dapat
ditaksir dari data. Taksiran dari Var(๐๐|๐ฏ) untuk masing-masing struktur dapat
diperoleh dengan menggunakan formula pada tabel berikut:
Tabel 3.3 Formula Var(๐๐|๐ฏ)ฬ .
Struktur Korelasi โกVar(๐๐|๐ฏ)ฬ = โก1 โ ๐ ๐โก๐ซkโ1
โ1
๐ซฬ
CS 1 โ
(๐ โ 1)๐2
1 + (๐ โ 2)๐
AR1 1 โ ๐2
1BT 1 โ ๐2
|๐ซ ๐โ1
1๐ต๐|
|๐ซ ๐
1๐ต๐|
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
56. Bab 3 Model Imputasi
43
Interval prediksi pada persamaan 3.29 berlaku untuk taksiran yang dihi-
tung dengan menggunakan formula 3.18, 3.20, dan 3.25. Untuk formula 3.21,
100(1 โ ๐ผ)% prediksi interval untuk ๐๐ diperoleh dengan menggunakan formula
berikut:
[๐ธ(๐๐|๐๐โ1) โ ๐ง ๐ผ
2
โ๐๐
2(1 โ ๐2)โก, ๐ธ(๐๐|๐๐โ1) + ๐ง ๐ผ
2
โ๐๐
2
(1 โ ๐2)โกโก].โกโก(3. 31)
Misalkan pada kasus ini,
๐ = โก๐ธ(๐๐|๐๐โ1) + ๐ง ๐ผ
2
โ๐๐
2(1 โ ๐2)โกโก
๐ฟ = ๐ธ(๐๐|๐๐โ1) โ ๐ง ๐ผ
2
โ๐๐
2(1 โ ๐2)โกโก,
maka 100(1 โ ๐ผ)% interval prediksi ๐ ๐ dapat dihitung dengan menggunakan for-
mula 3.30. Untuk memperoleh prediksi interval tersebut, mean dan variansi secara
berturut turut dapat ditaksir dengan menggunakan formula berikut:
๐๐๐(๐๐|๐๐โ1)ฬ = ๐ ๐
2
(1 โ ๐ ๐ด๐ 1ฬ)
๐ธ(๐๐|๐๐โ1)ฬ = ๐ฬ ๐ + ๐ ๐ด๐ 1ฬ ๐ ๐
๐ ๐โ1
โก(๐ฆ ๐โ1 โ ๐ฬ ๐โ1).
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
57. 44
Bab 4
Algoritma Imputasi dan Simulasi
Berdasarkan model imputasi pada bab 3, akan dikonstruksi sebuah algoritma im-
putasi untuk mengimput data hilang dari subjek ๐ pada saat ๐. Berdasarkan skema
imputasi pada bab 3, algoritma ini dapat diperumum, sehingga dapat digunakan
untuk mengimput seluruh data yang hilang. Untuk menganalisis kebaikan model,
algoritma imputasi disimulasikan pada data bangkitan dan data riil.
4.1 Algoritma Imputasi
Sebelum melakukan imputasi, langkah awal yang harus dilakukan ialah menen-
tukan nilai ๐ dan ๐. Setelah nilai ๐โกdan ๐ ditentukan, imputasi untuk mengisi nilai
๐ฅ ๐ dapat dilakukan dengan menerapkan langkah-langkah pada algoritma berikut:
1. Fitting distribusi data ๐ untuk tiap-tiap waktu ๐, sehingga diperoleh ๐น๐ un-
tuk ๐ = 1, โฆ , ๐.
2. Mentransformasikan data ๐ pada tiap tiap waktu dengan menggunakan
fungsi distribusinya sendiri (sesuai hasil fitting pada langkah 1), sehingga
diperoleh data hasil PIT berupa matriks ๐,โกdimana
๐ข๐๐ = ๐น๐(๐ฅ๐๐), ๐ = 1 โฆ . ๐โกโก; โกโก๐ = 1, โฆ , ๐โก.
Histogram dari matriks ๐ untuk data pada tiap-tiap titik waktu dapat
digunakan untuk melihat kebaikan hasil fiiting distribusi.
3. Mentransformasikan data pada matriks ๐ dengan menggunakan fungsi in-
vers kuantil dari distribusi normal baku, sehingga diperoleh data realisasi
dari vektor acak ๐พ ๐.
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
58. Bab 4 Algoritma Imputasi dan Simulasi
45
4. Mencari interval dari nilai ๐ yang memenuhi sifat matriks definit positif
untuk tiap-tiap struktur korelasi (CS, AR1, dan 1BT). Matriks korelasi
yang dijadikan acuan untuk menentukan interval berukuran ๐ ร ๐.
5. Menentukan nilai ๐ฬ ๐ถ๐
, ๐ฬ ๐ด๐ 1
,โกdan ๐ฬ1๐ต๐
dengan memilih salah satu nilai ๐
pada selang yang telah diperoleh pada langkah 4. Pemilihan dilakukan
dengan cara memaksimumkan fungsi likelihood pada persamaan 3.26.
6. Menghitung taksiran ๐ฆ ๐ dibawah asumsi masing-masing struktur korelasi,
kemudian menghitung taksiran dari ๐ฅ ๐ dengan menggunakan formula
3.18, 3.20, 3.21, dan 3.25.
7. Menghitung taksiran data pada waktu ๐ untuk seluruh subjek yang terob-
servasi dengan memanfaatkan koefisien korelasi dan hasil fitting distribusi
yang telah diperoleh, kemudian menghitung ๐ฬ dan ๐ ๐ untuk tiap-tiap struk-
tur korelasi.
8. Menentukan model terbaik berdasarkan ๐ฬ dan ๐ ๐ yang dihitung pada lang-
kah 7, kemudian mengimput ๐ฅ ๐ dengan menggunakan hasil taksiran dari
model terbaik.
4.2 Simulasi
4.2.1 Simulasi pada Data Bangkitan
Pada sub bab ini, untuk melihat kebaikan dari model yang telah diperoleh pada
Bab 3, prosedur imputasi yang termuat pada algoritma pada sub bab 4.1 akan
dibandingkan dengan prosedur imputasi berdasarkan metode imputasi yang sudah
ada sebelumnya, yaitu mean subtitution dan LOCF. Pembanding ini dipilih karena
pada praktiknya lebih sering digunakan.
Pada studi simulasi I, algoritma imputasi untuk masing-masing metode
akan disimulasikan pada data bangkitan berdistribusi normal 5 variat. Asumsikan
bahwa single dropout terjadi pada waktu m (titik waktu akhir). Simulasi akan
difokuskan pada data dengan jumlah subjek sedikit, yaitu ๐ = 10, dimana setiap
observasi menjadi penting.
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
59. Bab 4 Algoritma Imputasi dan Simulasi
46
Sesuai dengan definisi dari CRD, RD, dan ID, secara berturut-turut data
akan dihilangkan secara acak, data observasi pada waktu ๐ akan dihilangkan
apabila data observasi pada waktu 1 memiliki observasi maksimum, dan data ob-
servasi pada waktu m akan dihilangkan apabila data tersebut memiliki observasi
maksimum. Prosedur penghapusan data berdasarkan mekanisme dropout diterap-
kan untuk melihat pengaruh mekanisme dropout terhadap kebaikan prosedur im-
putasi.
Selain diuji pada data berdistribusi normal, pada studi simulasi II, prosedur
imputasi juga akan diuji pada data yang memiliki kemencengan (skewness). Akan
dilihat apakah asumsi normal pada data yang memiliki kemencengan tak nol akan
mempengaruhi kebaikan imputasi. Data yang memiliki kemencengan (skeweness)
dapat diperoleh dengan menerapkan transformasi berikut:
Misalkan ๐๐ berdistribusi normal. Definisikan suatu variabel acak baru ๐๐, dimana
๐๐ = {
๐๐, โโ <โก ๐๐ โค 1
๐๐
2
, 1 < ๐๐ < โโก
,
sehingga
๐๐ ๐
(๐ฃ) = {
๐๐ ๐
๐ฃ,โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก โ โ < ๐ฃ โค 1
1
2โ ๐ฃ
๐๐ ๐
(โ ๐ฃ),โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก1 < ๐ฃ < โ
โกโกโก.
Karena fungsi kuadrat merupakan fungsi konveks, maka distribusi ๐๐ akan memi-
liki ekor di kanan. Distribusi dari hasil transformasi di atas bergantung pada para-
meter dari distribusi ๐๐. Apabila mean dari ๐๐ bernilai negatif dan jauh dari nol,
transformasi di atas tidak akan memberikan pengaruh kemencengan yang besar.
Oleh sebab itu, pada studi simulasi II, parameter mean dari ๐๐ dipilih secara acak
pada interval di sekitar satu.
Analisis dari hasil simulasi akan didasarkan pada rata-rata dan deviasi
standar dari eror imputasi untuk masing-masing metode pada 500 kali pengulang-
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
60. Bab 4 Algoritma Imputasi dan Simulasi
47
an. Misalkan ๐ต1, ๐ต2, ๐ต3, ๐ต4 dan ๐1, ๐2, ๐3, ๐4 masing-masing berturut-turut menya-
takan rataan dan deviasi standar dari eror imputasi pada 500 pengulangan untuk
metode imputasi berdasarkan algoritma pada sub bab 4.1, metode imputasi
berdasarkan formula imputasi yang disesuaikan dengan struktur korelasi data
bangkitan (formula 3.18 untuk CS, 3.20 untuk AR1, dan 3.25 untuk 1BT), metode
mean subtitution, dan metode LOCF. Untuk struktur CS dan AR1, akan diguna-
kan ๐ = 0,5 dan ๐ = 0,8. Kemudian untuk struktur 1BT akan digunakan ๐ = 0,2
dan ๐ = 0,5.
4.2.1.1 Struktur Korelasi CS
Studi simulasi I
Sebagai langkah awal untuk menganalisis prosedur imputasi, algoritma imputasi
diterapkan pada data berdistribusi multivariat normal. Hasil simulasi dapat dilihat
pada tabel berikut:
Tabel 4.1 Hasil simulasi pada data bangkitan
(CS, normal,โก๐ = 0,5).
CRD RD ID
๐ต1 0,667 0,754 1,287
๐ต2 0,658 0,732 1,275
๐ต3 1,975 2,277 2,66
๐ต4 2,655 3,034 3,397
๐1 0,582 0,727 0,741
๐2 0,566 0,663 0,723
๐3 2,521 3,117 3,534
๐4 3,566 4,102 4,454
Hasil simulasi pada Tabel 4.1 mengindikasikan bahwa model imputasi dengan
memanfaatkan distribusi bersyarat memiliki nilai rata-rata error imputasi yang
kecil dan taksiran yang lebih stabil dibandingkan dengan metode mean subtitution
dan metode LOCF (๐ต1 < ๐ต2 < ๐ต3โกdanโก๐1 < ๐2 < ๐3). Selain itu, ketiga metode
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
61. Bab 4 Algoritma Imputasi dan Simulasi
48
menunjukkan bahwa untuk mekanisme CRD dan RD, seluruh metode lebih baik
dalam memprediksi data yang hilang dibanding pada mekanisme ID.
Selanjutnya dapat dilihat bahwa untuk ketiga mekanisme dropout, secara
berturut-turut nilai ๐ต1 dan ๐1 mendekati nilai ๐ต2 dan ๐2. Dengan kata lain,
prosedur pemilihan model pada metode imputasi dengan memanfaatkan distribusi
bersyarat sudah cukup baik. Frekuensi relatif dari pemilihan model untuk tiap-tiap
mekanisme dropoutโกdapat dilihat pada tabel berikut:
Tabel 4.2 Frekuensi relatif pemilihan model
(CS, normal, ๐ = 0,5).
Mekanisme Dropout CS AR1 AR1n 1BT
CRD 0,958 0,024 0,006 0,012
RD 0,966 0,012 0,004 0,018
ID 0,96 0,022 0,004 0,0140
Tabel 4.2 menunjukkan bahwa struktur korelasi CS yang merupakan struktur ko-
relasi yang digunakan untuk membangkitkan data lebih sering dipilih.
Selanjutnya akan dilihat pengaruh nilai koefisien korelasi populasi terha-
dap kebaikan prosedur imputasi. Pengaruh nilai koefisien korelasi populasi ter-
hadap kebaikan prosedur imputasi akan dianalisa melalui perbandingan dengan
hasil dari simulasi serupa untuk nilai ๐ = 0,8. Hasil simulasi imputasi pada data
pembanding dapat dilihat pada tabel berikut:
Tabel 4.3 Hasil simulasi data bangkitan
(CS, normal,โก๐ = 0,8).
CRD RD ID
๐ต1 0,433 0,55 0,825
๐ต2 0,432 0,548 0,822
๐ต3 2,020 2,661 2,854
๐ต4 2,455 3,162 3,497
๐1 0,393 0,546 0,587
๐2 0,392 0,541 0,581
๐3 2,093 4,197 4,329
๐4 3,569 4,707 5,095
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
62. Bab 4 Algoritma Imputasi dan Simulasi
49
Perbedaan hasil simulasi pada Tabel 4.1 dan Tabel 4.3 menunjukkan
bahwa kebaikan taksiran menggunakan prosedur imputasi dengan memanfaatkan
distribusi bersyarat dipengaruhi oleh nilai koefisien korelasi populasi. Semakin
tinggi koefisien korelasi populasi antar titik waktu, taksiran semakin baik. Seba-
liknya, imputasi dengan menggunakan metode mean subtitution dan LOCF tidak
begitu baik. Selain itu, apabila korelasi data antar titik waktu kuat, nilai ๐1dan ๐ต1
secara berturut turut makin mendekati nilai ๐2 dan ๐ต2. Artinya pemilihan model
akan semakin tepat apabila korelasi data antar titik waktu semakin tinggi. Fre-
kuensi relatif dari pemilihan model terbaik untuk tiap-tiap mekanisme drop-
outโกdapat dilihat pada tabel berikut:
Tabel 4.4 Frekuensi relatif pemilihan model
(CS, normal,โก๐ = 0,8).
Mekanisme Dropout CS AR1 AR1n 1BT
CRD 0,996 0,002 0,002 0
RD 0,996 0,004 0 0
ID 0,99 0,01 0 0
Studi simulasi II
Data pada kenyataannya hampir tidak pernah berdistribusi simetri dan asumsi
normal sering digunakan. Untuk itu, kebaikan prosedur imputasi akan diuji pada
data yang memiliki kemencengan (๐ ๐๐๐ค๐๐ data). Ukuran sampel yang digunakan
ialah ๐ = 10, sehingga pada saat fitting distribusi, asumsi kenormalan cenderung
tidak ditolak pada tingkat signifikansi ๐ผ = 0,05. Hasil simulasi pada skewed data
dapat dilihat pada tabel berikut:
Tabel 4.5 Hasil simulasi data bangkitan
(CS, skewed,โก๐ = 0,5).
CRD RD ID
๐ต1 0,887 1,33 2,727
๐ต2 0,86 1,265 2,648
๐ต3 2,415 4,823 4,620
๐ต4 2,813 4,943 5,376
๐1 1,287 2,681 2,609
๐2 1,255 2,578 2,553
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB