SlideShare a Scribd company logo
MODEL IMPUTASI
BERBASIS DISTRIBUSI BERSYARAT
LAPORAN TUGAS AKHIR
Diajukan sebagai salah satu syarat
untuk memperoleh gelar Sarjana dari
Institut Teknologi Bandung
Oleh
INDAH NURINA FITRI HAPSARI
NIM: 10110094
(Program Studi Sarjana Matematika)
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT TEKNOLOGI BANDUNG
2015
i
MODEL IMPUTASI
BERBASIS DISTRIBUSI BERSYARAT
ABSTRAK
Data observasi merupakan sumber informasi yang mampu memberikan validasi
terhadap isu, masalah, dan dugaan yang ada di masyarakat. Sebagai sumber utama
analisa, kualitas data observasi sangatlah penting, sehingga masalah yang terjadi
selama pengambilan data berlangsung harus diperhatikan. Salah satu bentuk data
observasi yang memuat pengukuran berulang ialah bentuk data longitudinal. Pada
praktiknya, saat proses pengambilan data longitudinal berlangsung, fenomena
dropout kerap terjadi. Fenomena ini menyebabkan data longitudinal menjadi tidak
lengkap, sehingga dapat menyebabkan bias pada hasil analisa. Tugas akhir ini
akan membahas model imputasi untuk mengisi data yang hilang dengan meman-
faatkan distribusi bersyarat. Distribusi bersyarat dipilih karena observasi berulang
pada suatu subjek cenderung tidak saling bebas, sehingga dengan memanfaatkan
struktur korelasi beserta data terobservasi, data yang hilang dapat ditaksir. Distri-
busi bersyarat dapat dikonstruksi dengan menggunakan pendekatan copula, salah
satunya ialah copula Gaussian. Tiga struktur korelasi yang umum digunakan akan
dibahas dan diaplikasikan kedalam model, sehingga diperoleh empat formula
imputasi.
Kata kunci: data longitudinal, dropout, imputasi, copula Gaussian, distribusi ber-
syarat, dan struktur korelasi.
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
ii
CONDITIONAL DISTRIBUTION BASED
IMPUTATION MODEL
ABSTRACT
Observation data is a useful source of information which can be used to validate
various social issues, problems, and assumptions shared by people within a
society. As a prime source of analysis, its quality becomes highly important, so
that any problems happen during the data collection must be treated carefully. One
type of observation data which involves repeated measurement is longitudinal
data. In practice, the dropout phenomenon has often happened during the process
of data collection, resulting incomplete longitudinal data which can lead to bias
results of analysis. This final assignment discusses an imputation model to fill in
the lost data using conditional distribution. Conditional distribution is selected on
the ground that repeated measurements on certain subject tend to be dependent.
Hence, based on the observed data and its possible correlation structure, the lost
data can thus be estimated. Conditional distribution can be constructed through
copula approach, e.g. Gaussian copula. Three commonly used correlation struc-
ture would be explained and applied on the model such that four imputation
formulas are acquired.
Key words: longitudinal data, dropout, imputation, Gaussian copula, conditional
distribution, and correlation structure.
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
iii
MODEL IMPUTASI
BERBASIS DISTRIBUSI BERSYARAT
Oleh
INDAH NURINA FITRI HAPSARI
NIM:10110094
(Program Studi Sarjana Matematika)
Fakultas Matematika dan Ilmu Pengetahuan Alam
Institut Teknologi Bandung
Telah diperiksa dan disetujui,
Bandung, Agustus 2015
Dosen Pembimbing
Dr. Sapto Wahyu Indratno
NIP. 197508041999031003
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
iv
Prakata
Alhamdulillahirabbil โ€˜alamin, puji syukur penulis panjatkan ke hadirat Allah SWT
karena atas rahmat dan karunia-Nya penulis dapat menyelesaikan tugas akhir yang
berjudul โ€œModel Imputasi Berbasis Distribusi Bersyaratโ€.
Buku tugas akhir ini disusun untuk memenuhi persyaratan kurikulum pen-
didikan Program Studi Matematika, Fakultas Matematika dan Ilmu Pengetahuan
Alam, Institut Teknologi Bandung.
Penulis menyadari bahwa penyusunan buku tugas akhir ini masih jauh dari
sempurna dan masih terdapat banyak kekurangan dikarenakan oleh keterbatasan
kemampuan, pengalaman, dan pengetahuan yang dimiliki oleh penulis. Maka dari
itu, penulis menerima saran dan kritik sebagai masukan untuk perbaikan di masa
yang akan datang.
Penyusunan buku tugas akhir ini tidak akan terwujud tanpa adanya ban-
tuan dari berbagai pihak. Maka pada kesempatan ini, penulis menyampaikan rasa
terimakasih kepada :
1. Bapak, Ibu, dan Ayah yang penulis sayangi, Bapak Zaenal Abidin, Ibu
Suharti, dan Bapak Dodik Dwi Sasongko, yang selalu sabar dan terus
menerus memberikan semangat kepada penulis. Terimakasih atas perha-
tian, kepercayaan, dan kasih sayang yang telah diberikan kepada penulis.
2. Saudara-saudara penulis, Indah Kartika Buana Putri, Arsita Tiara Abidin,
dan Hidayat Ibnu Hadi. Terimakasih atas semangat dan surprise yang
sering diberikan untuk menghibur penulis.
3. Bapak Dr. Sapto Wahyu Indratno sebagai dosen pembimbing. Terimakasih
atas perhatian, kesabaran, semangat, pengalaman, ilmu, dan saran berharga
yang diberikan kepada penulis dalam pengerjaan tugas akhir ini. Penulis
memperoleh banyak pelajaran selama proses pengerjaan tugas akhir ini
berlangsung. Terimakasih telah menjadi tempat penulis berkeluh kesah.
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
v
Maaf kalau penulis sering merepotkan, labil, rame, dan heboh sendiri ya
Pak. Pak Sapto adalah orang paling sabar yang pernah penulis kenal.
4. Ibu RR Kurnia Novitasari, M.Si dan Ibu Dr. Hanni G. Yudhawisastra yang
telah bersedia menjadi dosen penguji dan memberikan banyak masukan
pada tugas akhir ini.
5. Ibu Dr. Rinovia Mery Garnierita Simanjuntak sebagai dosen wali penulis.
Terima kasih atas bimbingan dan nasehatnya selama ini.
6. Bapak Khreshna I.A. Syuhada, M.Sc, Ph.D yang telah menjadi tempat
penulis bercerita dan berkeluh kesah selama sekitar dua tahun terakhir.
Terimakasih atas perhatian, nasehat, semangat, keusilan, dan keperca-
yaanya ya Pak. Maaf sudah menjadi mahasiswa paling rame di dunia
maya. Sy akan selalu mengingat kata-kata motivasi pertama Bapak, โ€Pasti
bisa!โ€.
7. Seluruh dosen pengajar Program Studi Matematika ITB yang telah meng-
ajar saya dan memberikan ilmu yang bermanfaat, serta staf karyawan yang
telah membantu berlangsungnya kegiatan belajar mengajar di Program
Studi Matematika ITB.
8. Sahabat penulis, si bulet dan kurus Nur Cahyanti, yang selalu menemani di
kala suka dan duka. Terimakasih telah menerima penulis apa adanya dan
memberikan dorongan agar cepat menyelesaikan tugas akhir ini.
9. Geng lurus, Yanti dan Hestin, terima kasih atas kebersamaan, canda, dan
tawa selama ini. Semoga persahabatan kita menjadi persahabatan yang
langgeng. Sukses dan bahagia selalu ya Gengs!
10. Teman-teman kelas Topik Statistika IV dengan berbagai karakternya. Ka-
lian adalah teman-teman yang mengajarkan penulis banyak hal, terutama
mengenai kesabaran dan kasih sayang. Terimakasih sudah menjadi kakak-
kakak terbaik dan telah sabar menghadapi adik yang suka ngambek ini.
11. Teman-teman satu bimbingan, Tria, Mona, Tessa, Bernard, Vivan, Kak
Fuad, Kak Maria, Kak Milla, Kak Ani, dan lainnya yang telah bersedia
berbagi info dan cerita.
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
vi
12. Teman-teman seperjuangan, Kawan-kawan Matematika ITB 2010 dan
Saudara-saudara Loedroek ITB 2010 yang telah memberikan banyak pe-
ngalaman berwarna selama kuliah di ITB.
13. Semua pihak yang tidak dapat saya sebutkan namanya satu per satu, yang
memberikan dukungan dan bantuan baik secara langsung maupun tidak
langsung kepada penulis, sehingga penulis dapat menyelesaikan buku tu-
gas akhir ini dan menjalani seminar tugas akhir dengan baik.
Semoga Allah SWT membalas bantuan dan kebaikan pihak-pihak tersebut
dengan segala rahmat dan kasih sayang-Nya. Akhir kata, penulis berharap agar
buku tugas akhir ini dapat berguna bagi pembacanya.
Bandung, Agustus 2015
Penulis
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
vii
Daftar Isi
MODEL IMPUTASI BERBASIS DISTRIBUSI BERSYARAT i
CONDITIONAL DISTRIBUTION BASED IMPUTATION MODEL ii
Prakata iv
Daftar Isi vii
Daftar Gambar x
Daftar Tabel xi
Bab 1 Pendahuluan 1
1.1 Latar Belakang........................................................................................... 1
1.2 Tujuan........................................................................................................ 2
1.3 Sistematika Pembahasan............................................................................ 3
Bab 2 Landasan Teori 4
2.1 Data Longitudinal...................................................................................... 4
2.1.1 Dropout dan Klasifikasinya.............................................................. 4
2.1.2 Imputasi ............................................................................................ 7
2.2 Konsep Dasar Teori Copula ...................................................................... 8
2.2.1 Densitas Copula.............................................................................. 11
2.3 Distribusi Multivariat Normal Standar.................................................... 12
2.3.1 Korelasi Pearson............................................................................. 13
2.4 Copula Gaussian...................................................................................... 16
2.4.1 Konstruksi Copula Gaussian .......................................................... 17
2.4.2 Densitas Copula Gaussian .............................................................. 18
2.4.3 Konstruksi Distribusi Bersama....................................................... 19
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
Daftar Isi
viii
2.4.4 Konstruksi Distribusi Bersyarat...................................................... 19
2.5 Titik Maksimum ...................................................................................... 20
2.5.1 Titik Maksimum Fungsi Densitas Distribusi Normal..................... 21
Bab 3 Model Imputasi 23
3.1 Model Umum Imputasi............................................................................ 24
3.2 Struktur Korelasi...................................................................................... 30
3.2.1 Struktur Korelasi Compound Symmetry ......................................... 30
3.2.2 Struktur Korelasi First Order Autoregressive................................ 33
3.2.3 Struktur Korelasi 1-Banded Toeplitz.............................................. 36
3.3 Penaksiran Parameter Koefisien Korelasi ............................................... 38
3.4 Pemilihan Model Terbaik ........................................................................ 40
3.5 Interval Prediksi....................................................................................... 41
Bab 4 Algoritma Imputasi dan Simulasi 44
4.1 Algoritma Imputasi.................................................................................. 44
4.2 Simulasi ................................................................................................... 45
4.2.1 Simulasi pada Data Bangkitan........................................................ 45
4.2.1.1 Struktur Korelasi CS ......................................................... 47
4.2.1.2 Struktur Korelasi AR1 ...................................................... 50
4.2.1.3 Struktur Korelasi 1BT....................................................... 53
4.2.2 Simulasi pada Data Rill.................................................................. 56
4.2.2.1 Deskripsi Data................................................................... 56
4.2.2.2 Penerapan Algoritma Imputasi pada Data ........................ 58
Bab 5 Kesimpulan 64
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
Daftar Isi
ix
Daftar Pustaka 66
Lampiran A 67
Lampiran B 71
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
x
Daftar Gambar
Gambar 2.1 Histogram data bangkitan dari distribusi ๐‘’๐‘ฅ๐‘โก(2)............................ 10
Gambar 2.2 Histogram data hasil transformasi. .................................................. 10
Gambar 2.3 Pengaruh ukuran sampel terhadap distribusi korelasi empiris. ....... 15
Gambar 2.4 Pengaruh korelasi populasi terhadap distribusi korelasi empiris..... 16
Gambar 4.1 Histogram hasil PIT untuk data kadar timbal dalam darah. ............ 59
Gambar 4.2 Plot CDF empirik hasil PIT data kadar timbal dalam darah............ 59
Gambar 4.3 Grafik fungsi likelihood densitas Gaussian..................................... 60
Gambar 4.4 Plot data kadar timbal dalam darah. ................................................ 62
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
xi
Daftar Tabel
Tabel 2.1 Random dropout..................................................................................... 6
Tabel 2.2 Informative dropout................................................................................ 6
Tabel 3.1 Ilustrasi data longitudinal dengan dropout........................................... 23
Tabel 3.2 Interval ๐œŒ untuk beberapa ukuran matriks ๐‘ซ........................................ 39
Tabel 3.3 Formula Var(๐‘Œ๐‘˜|๐‘ฏ)ฬ‚ .............................................................................. 42
Tabel 4.1 Hasil simulasi pada data bangkitan (CS, normal,โก๐œŒ = 0,5).................. 47
Tabel 4.2 Frekuensi relatif pemilihan model (CS, normal, ๐œŒ = 0,5)................... 48
Tabel 4.3 Hasil simulasi data bangkitan (CS, normal,โก๐œŒ = 0,8). ......................... 48
Tabel 4.4 Frekuensi relatif pemilihan model (CS, normal,โก๐œŒ = 0,8)................... 49
Tabel 4.5 Hasil simulasi data bangkitan (CS, skewed,โก๐œŒ = 0,5).......................... 49
Tabel 4.6 Frekuensi relatif pemilihan model (CS, skewed,โก๐œŒ = 0,5)................... 50
Tabel 4.7 Hasil simulasi data bangkitan (AR1, normal,โก๐œŒ = 0,5)........................ 50
Tabel 4.8 Frekuensi relatif pemilihan model (AR1, normal,โก๐œŒ = 0,5). ............... 51
Tabel 4.9 Hasil simulasi data bangkitan (AR1, normal,โก๐œŒ = 0,8)....................... 52
Tabel 4.10 Frekuensi relatif pemilihan model (AR1, normal,โก๐œŒ = 0,8). ............. 52
Tabel 4.11 Hasil simulasi data bangkitan (AR1, skewed,โก๐œŒ = 0,5). .................... 53
Tabel 4.12 Frekuensi relatif pemilihan model (AR1, skewed,โก๐œŒ = 0,5). ............. 53
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
Daftar Tabel
xii
Tabel 4.13 Hasil simulasi data bangkitan (1BT, normal,โก๐œŒ = 0,5)...................... 54
Tabel 4.14 Frekuensi relatif pemilihan model (1BT, normal,โก๐œŒ = 0,5)............... 54
Tabel 4.15 Hasil simulasi data bangkitan (1BT, normal,โก๐œŒ = 0,2)...................... 55
Tabel 4.16 Frekuensi relatif pemilihan model (1BT, normal,โก๐œŒ = 0,2)............... 55
Tabel 4.17 Hasil simulasi data bangkitan (1BT, skewed,โก๐œŒ = 0,5)...................... 56
Tabel 4.18 Frekuensi relatif pemilihan model (1BT, skewed,โก๐œŒ = 0,5)............... 56
Tabel 4.19 Data kadar timbal dalam darah (dalam ฮผg/dl).................................... 57
Tabel 4.20 Hasil fitting distribusi data kadar timbal dalam darah. ...................... 59
Tabel 4.21 Hasil taksiran ๐‘ฅ20,4............................................................................. 61
Tabel 4.22 Eror model.......................................................................................... 61
Tabel 4.23 Hasil simulasi imputasi kasus single dropout pada data kadar timbal
dalam darah........................................................................................................... 62
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
1
Bab 1
Pendahuluan
1.1 Latar Belakang
Data observasi merupakan representasi dari sebuah keadaan, sehingga data obser-
vasi mampu memberikan validasi terhadap isu, masalah, dan dugaan yang ada di
masyarakat. Data observasi memiliki berbagai bentuk yang pemilihannya dise-
suaikan dengan tujuan dilaksanakannya studi. Salah satu bentuk data observasi
yang cukup sering digunakan ialah bentuk data longitudinal, dimana data memuat
observasi dari pengukuran berulang. Studi yang menggunakan data longitudinal
sebagai dasar penarikan kesimpulan disebut sebagai studi longitudinal. Dengan
adanya pengukuran berulang, studi longitudinal mampu mendeteksi perubahan
suatu variabel terhadap waktu, sehingga dapat digunakan untuk menarik inferensi
kausal.
Studi longitudinal telah banyak diterapkan di berbagai disiplin ilmu, seper-
ti kedokteran, psikologi, biologi, dan ekonomi. Salah satu contoh ialah studi di
bidang kedokteran yang diinisiasi oleh Lewis Terman pada tahun 1921. Studi
yang dikenal dengan nama โ€œGenetics studies of Geniusโ€ ini bertujuan untuk
menentukan kurikulum pendidikan terbaik bagi orang-orang jenius.
Hingga saat ini, masalah besar yang kerap terjadi pada saat proses
pengambilan data longitudinal ialah adanya fenomena dropout (attrition), yaitu
hilangnya data karena subjek meninggalkan studi. Dropout dapat menyebabkan
adanya bias (kesalahan) dalam penarikan kesimpulan (lihat referenssi Fitzmaurice
dkk, 2004), sehingga dibutuhkan penanggulangan yang tepat. Salah satu metode
untuk menanggulangi dropout ialah dengan melakukan imputasi, yaitu mengisi
data yang hilang dengan menggunakan nilai taksiran.
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
Bab 1 Pendahuluan
2
Identifikasi struktur hilangnya data dan imputasi pertama kali dilakukan
oleh McKendrik pada tahun 1926. Kemudian teori mengenai data hilang mulai
berkembang pesat di tahun 1970-an yang ditandai dengan munculnya metode case
deletion dan metode single imputation. Sekitar tahun 1980, metode imputasi ber-
basis likelihood diperkenalkan. Bukan hanya single imputation, multiple imputa-
tion mulai dikembangkan di tahun 1990-an.
Pada tugas akhir ini, akan dibahas salah satu model imputasi yang tergo-
long sebagai single imputation. Berbeda dengan multiple imputation, sesuai de-
ngan namanya, single imputation menggunakan suatu nilai untuk mengisi data
yang hilang, sehingga hanya diperoleh satu data lengkap. Model imputasi yang
akan dibahas ialah model imputasi dengan memanfaatkan distribusi bersyarat.
Distribusi bersyarat dipilih karena pengukuran berulang pada suatu subjek
cenderung tidak saling bebas. Untuk memperoleh distribusi bersyarat dibutuhkan
distribusi bersama, dimana distribusi bersama dapat dikonstruksi menggunakan
pendekatan copula.
Istilah copula dalam bidang statistika dan matematika pertama kali diper-
kenalkan oleh Abe Sklar pada tahun 1959. Copula berasal dari bahasa latin yang
berarti ikatan. Sesuai dengan artinya, copula dapat menghubungkan distribusi-
distribusi marginal untuk memperoleh distribusi bersama. Copula yang akan
digunakan dalam tugas akhir ini adalah copula Gaussian.
1.2 Tujuan
1. Mengkonstruksi model imputasi dengan memanfaatkan distribusi bersya-
rat yang dikonstruksi dengan menggunakan copula Gaussian.
2. Menganalisis kebaikan model imputasi yang diperoleh berdasarkan tujuan
1.
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
Bab 1 Pendahuluan
3
1.3 Sistematika Pembahasan
Tugas akhir ini terdiri dari lima bab. Bab 1, yaitu pendahuluan memuat latar bela-
kang yang mendasari diangkatnya topik ini sebagai tugas akhir, tujuan yang ingin
dicapai, dan sistematika pembahasan.
Bab 2 berisi landasan teori yang dibutuhkan untuk mengkonstruksi model
imputasi. Sebelum mengkonstruksi model imputasi, dibutuhkan pemahaman lebih
dalam mengenai dropout dan imputasi, sehingga teori mengenai data longitudinal
diberikan di awal bab. Kemudian dilanjutkan dengan pembahasan mengenai kon-
sep dasar teori copula, distribusi multivariat normal standar, copula Gaussian, dan
konstruksi distribusi bersyarat dengan menggunakan copula Gaussian. Bab ini
ditutup dengan pembahasan mengenai titik maksimum sebagai salah satu bagian
dari teori optimisasi yang nantinya dibutuhkan dalam proses pemodelan.
Bab 3 berisi pembahasan mengenai langkah-langkah konstruksi model
imputasi. Setelah model umum imputasi diperoleh, beberapa struktur korelasi
yang umum digunakan dibahas dan diaplikasikan ke dalam model, sehingga di-
peroleh 4 formula (model) imputasi. Untuk memahami cara memperoleh penaksir
terbaik, bab ditutup dengan pembahasan mengenai penaksiran parameter koefisien
korelasi, pemilihan model terbaik, dan interval prediksi.
Bab 4 membahas mengenai algoritma imputasi yang dikonstruksi sesuai
dengan model imputasi yang telah diperoleh pada Bab 3. Kemudian untuk meng-
analisis kebaikan prosedur imputasi, algoritma imputasi tersebut diterapkan pada
data bangkitan dan data riil. Untuk simulasi pada data bangkitan, indikator
kebaikan model imputasi didasarkan pada perbandingan dengan hasil taksiran
dengan menggunakan metode yang sudah ada sebelumnya.
Bab 5 sebagai bab penutup memberikan kesimpulan mengenai kebaikan
model imputasi berbasis distribusi bersyarat yang didasarkan pada hasil analisa
penerapan algoritma imputasi pada data rill dan data bangkitan.
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
4
Bab 2
Landasan Teori
2.1 Data Longitudinal
Data longitudinal merupakan data yang memuat nilai-nilai observasi dari pe-
ngukuran berulang pada sejumlah subjek (sampel) dalam suatu periode (masa
studi) tertentu. Data ini umumnya direpresentasikan dalam bentuk matriks beruku-
ran ๐‘› ร— ๐‘š, dimana ๐‘› dan ๐‘š secara berturut-turut menyatakan banyaknya sampel
dan titik waktu pengukuran yang ditetapkan sebelum masa studi dimulai. Dengan
adanya pengukuran berulang, data longitudinal mampu mengambil informasi me-
ngenai karakteristik suatu variabel terhadap perubahan waktu, sehingga seringkali
digunakan untuk menarik inferensi kausal.
Disamping keuntungan yang dimiliki oleh data longitudinal, terdapat be-
berapa kelemahan, yaitu waktu dan biaya yang dibutuhkan dalam pengambilan
data cukup besar dan adanya kerentanan terhadap dropout yang berakibat pada
validitas inferensi (lihat referensi Fitzmaurice dkk, 2004). Tugas akhir ini akan
membahas lebih lanjut mengenai dropout.
2.1.1 Dropout dan Klasifikasinya
Studi yang melibatkan data menarik kesimpulan berdasarkan analisis dari data,
sehingga masalah yang terjadi selama proses pengambilan data harus diperha-
tikan. Salah satu masalah yang kerap dialami dalam pengambilan data longitudi-
nal ialah terjadinya dropout yang menyebabkan data tidak lengkap.
Dropout/attrition ialah salah satu jenis hilangnya data yang terjadi karena
subjek meninggalkan studi sebelum masa studi berakhir. Misalkan terdapat ๐‘›
subjek yang akan diukur sebanyak ๐‘š kali pada saat ๐‘ก1, ๐‘ก2, โ€ฆ , ๐‘ก ๐‘š. Definisikan
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
Bab 2 Landasan Teori
5
๐‘ฟ = (๐‘‹1, โ€ฆ , ๐‘‹ ๐‘š) ๐‘‡
sebagai vektor acak yang menyatakan pengukuran. Apabila
subjek ๐‘– mengalami dropout pada saat ๐‘ก ๐‘˜, maka data pada saat dan setelah ๐‘ก ๐‘˜
untuk subjek ๐‘–, yaitu ๐‘ฅ๐‘–๐‘˜ hingga ๐‘ฅ๐‘–๐‘š tidak terobservasi. Untuk selanjutnya,
๐‘ก1, ๐‘ก2, โ€ฆ , ๐‘ก ๐‘š dituliskan sebagai 1,2, โ€ฆ , ๐‘š.
Dropout dapat mengurangi efisiensi, menghilangkan informasi, dan ber-
potensi menyebabkan bias pada penarikan kesimpulan apabila karakteristik dari
individu yang mengalami dropout berbeda dengan individu yang tidak mengalami
dropout. Akibat ini akan lebih jelas terlihat apabila jumlah subjek yang terlibat
dalam studi cukup sedikit.
Ketika dropout terjadi, validitas dari inferensi bergantung pada keterkaitan
antara variabel yang ingin diteliti dengan penyebab dropout (lihat referensi
Fitzmaurice dkk, 2004). Keterkaitan ini selanjutnya akan disebut sebagai meka-
nisme dropout dan digunakan untuk mengklasifikasikan dropout. Pada umumnya,
mekanisme dropout berada diluar kontrol dari peneliti, sehingga sulit untuk dipa-
hami. Secara teoritis, dengan mengikuti analogi klasifikasi data hilang yang di-
perkenalkan oleh Rubin (1976), berdasarkan mekanisme dropout, dropout dapat
diklasifikasikan menjadi 3 jenis, yaitu:
1. Completely Random Dropout (CRD), yaitu ketika peluang terjadinya
dropout tidak bergantung pada nilai yang terobservasi maupun nilai spe-
sifik yang seharusnya dapat diobservasi. Dengan kata lain, dropout terjadi
secara acak, sehingga subjek yang tidak mengalami dropout dapat dikata-
kan sebagai sampel acak dari target populasi (๐‘› subjek). Dengan demikian,
inferensi berdasarkan analisis yang dibatasi pada data dari subjek yang
memiliki observasi lengkap dikatakan valid (lihat referensi Fitzmaurice
dkk, 2004).
2. Random Dropout (RD), yaitu ketika peluang terjadinya dropout bergan-
tung pada nilai yang terobservasi, tetapi tidak bergantung pada nilai spe-
sifik yang seharusnya dapat diobservasi. Kebergantungan peluang dropout
dengan nilai observasi historis untuk masing-masing subjek mengindikasi-
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
Bab 2 Landasan Teori
6
kan bahwa data yang hilang dapat ditaksir dengan memanfaatkan data his-
toris subjek.
Tabel 2.1 Random dropout.
๐‘†๐‘ข๐‘๐‘—๐‘’๐‘˜
๐‘‡๐‘–๐‘ก๐‘–๐‘˜โก๐‘Š๐‘Ž๐‘˜๐‘ก๐‘ข
1 2 โ€ฆ ๐‘— โ€ฆ ๐‘˜ โˆ’ 1 ๐‘˜ โ€ฆ ๐‘š
๐‘‹1 ๐‘‹2 โ€ฆ ๐‘‹๐‘— โ€ฆ ๐‘‹ ๐‘˜โˆ’1 ๐‘‹ ๐‘˜ โ€ฆ ๐‘‹ ๐‘š
1 ๐‘ฅ11 ๐‘ฅ12 โ€ฆ ๐‘ฅ1๐‘— โ€ฆ ๐‘ฅ1๐‘˜โˆ’1 ๐‘ฅ1๐‘˜ โ€ฆ ๐‘ฅ1๐‘š
2 ๐‘ฅ21 ๐‘ฅ22 โ€ฆ ๐‘ฅ2๐‘— โ€ฆ ๐‘ฅ2๐‘˜โˆ’1 ๐‘ฅ2๐‘˜ โ€ฆ ๐‘ฅ2๐‘š
โ€ฆ โ€ฆ โ€ฆ โ€ฆ โ€ฆ โ€ฆ โ€ฆ โ€ฆ โ€ฆ โ€ฆ
๐‘– ๐‘ฅ๐‘–1 ๐‘ฅ๐‘–2 โ€ฆ ๐‘ฅ๐‘–๐‘— โ€ฆ ๐‘ฅ๐‘–๐‘˜โˆ’1 โˆ’ โˆ’ โˆ’
โ€ฆ โ€ฆ โ€ฆ โ€ฆ โ€ฆ โ€ฆ โ€ฆ โ€ฆ โ€ฆ โ€ฆ
๐‘› ๐‘ฅ ๐‘›1 ๐‘ฅ ๐‘›2 โ€ฆ ๐‘ฅ ๐‘›๐‘— โ€ฆ ๐‘ฅ ๐‘›๐‘˜โˆ’1 ๐‘ฅ ๐‘›๐‘˜ โ€ฆ ๐‘ฅ ๐‘›๐‘š
Catatan: Dropout yang terjadi pada subjek ๐‘– pada waktu โก๐‘˜
bergantung pada observasi sebelumnya, yaitu ๐‘ฅ๐‘–1 hingga ๐‘ฅ๐‘–,๐‘˜โˆ’1.
3. Informative Dropout (IF), yaitu ketika peluang terjadinya dropout bergan-
tung pada nilai yang terobservasi maupun nilai spesifik yang seharusnya
dapat diobservasi. Karena dropout bergantung pada nilai yang tidak terob-
servasi, maka informasi mengenai data historis saja tidak cukup untuk di-
jadikan dasar dalam memprediksi data yang hilang.
Tabel 2.2 Informative dropout.
๐‘†๐‘ข๐‘๐‘—๐‘’๐‘˜
๐‘‡๐‘–๐‘ก๐‘–๐‘˜โก๐‘Š๐‘Ž๐‘˜๐‘ก๐‘ข
1 2 โ€ฆ ๐‘— โ€ฆ ๐‘˜ โˆ’ 1 ๐‘˜ โ€ฆ ๐‘š
๐‘‹1 ๐‘‹2 โ€ฆ ๐‘‹๐‘— โ€ฆ ๐‘‹ ๐‘˜โˆ’1 ๐‘‹ ๐‘˜ โ€ฆ ๐‘‹ ๐‘š
1 ๐‘ฅ11 ๐‘ฅ12 โ€ฆ ๐‘ฅ1๐‘— โ€ฆ ๐‘ฅ1๐‘˜โˆ’1 ๐‘ฅ1๐‘˜ โ€ฆ ๐‘ฅ1๐‘š
2 ๐‘ฅ21 ๐‘ฅ22 โ€ฆ ๐‘ฅ2๐‘— โ€ฆ ๐‘ฅ2๐‘˜โˆ’1 ๐‘ฅ2๐‘˜ โ€ฆ ๐‘ฅ2๐‘š
โ€ฆ โ€ฆ โ€ฆ โ€ฆ โ€ฆ โ€ฆ โ€ฆ โ€ฆ โ€ฆ โ€ฆ
๐‘– ๐‘ฅ๐‘–1 ๐‘ฅ๐‘–2 โ€ฆ ๐‘ฅ๐‘–๐‘— โ€ฆ ๐‘ฅ๐‘–๐‘˜โˆ’1 โˆ’ โˆ’ โˆ’
โ€ฆ โ€ฆ โ€ฆ โ€ฆ โ€ฆ โ€ฆ โ€ฆ โ€ฆ โ€ฆ โ€ฆ
๐‘› ๐‘ฅ ๐‘›1 ๐‘ฅ ๐‘›2 โ€ฆ ๐‘ฅ ๐‘›๐‘— โ€ฆ ๐‘ฅ ๐‘›๐‘˜โˆ’1 ๐‘ฅ ๐‘›๐‘˜ โ€ฆ ๐‘ฅ ๐‘›๐‘š
Catatan: Dropout yang terjadi pada subjek ๐‘– pada waktuโกโก๐‘˜ ber-
gantung pada ๐‘ฅ๐‘–1 hingga ๐‘ฅ๐‘–,๐‘˜โˆ’1 dan pada nilai spesifik dari data
yang seharusnya dapat diobservasi.
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
Bab 2 Landasan Teori
7
2.1.2 Imputasi
Melihat besarnya risiko yang ditimbulkan oleh dropout, dibutuhkan strategi pe-
nanggulangan yang tepat. Salah satu metode primitif sederhana yang dahulu
digunakan untuk menanggulangi data tidak lengkap ialah metode listwise deletion.
Metode ini dapat diterapkan pada data longitudinal dengan dropout, yaitu dengan
membuang data dari subjek yang tidak mengikuti studi hingga akhir. Dengan
demikian, analisis hanya didasarkan pada subjek yang memiliki data lengkap.
Metode listwise deletion mengasumsikan bahwa subjek yang mengalami
dropout relatif sedikit dan data yang digunakan dalam analisis cukup repre-
sentatif. Asumsi representatif hanya dapat dipastikan terpenuhi apabila dropout
yang terjadi mengikuti mekanisme CRD dan jumlah subjek yang terlibat dalam
studi tidak telalu sedikit. Selain itu, metode ini dapat menyebabkan hilangnya
banyak informasi. Keterbatasan metode listwise deletion menyebabkan metode ini
sudah banyak ditinggalkan dan digantikan oleh metode berbasis imputasi.
Imputasi ialah strategi untuk mengisi data yang hilang dengan menggu-
nakan nilai taksiran. Nilai taksiran yang dimaksud diperoleh dari suatu model
dengan memanfaatkan data-data terobservasi. Setelah nilai yang hilang ditaksir,
data dapat dianalisis menggunakan metode yang umum digunakan untuk menga-
nalisis data longitudinal lengkap.
Terdapat dua jenis imputasi, yaitu single imputation dan multiple imputa-
tion. Berbeda dengan multiple imputation, sesuai dengan namanya, single imputa-
tion menggunakan suatu nilai untuk mengisi data yang hilang, sehingga hanya
diperoleh satu data lengkap. Beberapa metode single imputation yang sering digu-
nakan ialah:
1. Mean subtitution, yaitu mengisi data hilang dari suatu subjek dengan
menggunakan rata-rata dari seluruh observasi sebelumnya untuk subjek
tersebut. Metode ini tidak mempertimbangkan trend dari data dan dapat
menggeser nilai-nilai ekstrim ke tengah ditribusi, sehingga mengurangi
variansi sampel dari variabel acak yang diimput, yaitu ๐‘‹ ๐‘˜.
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
Bab 2 Landasan Teori
8
2. Regression-based imputation, yaitu mengisi data hilang dengan menggu-
nakan persamaan regresi yang diperoleh dari subjek yang memiliki data
lengkap hingga waktu ๐‘˜. Metode ini mengasumsikan bahwa model regresi
yang sama dapat menjelaskan data dari subjek yang tidak mengalami
dropout seperti halnya data dari subjek yang mengalami dropout.
3. Last Observation Carried Forward (LOCF), yaitu mengisi data hilang
dengan menggunakan nilai observasi sebelumnya. Metode ini dapat digu-
nakan apabila nilai pengukuran relatif konstan terhadap waktu. Walaupun
metode LOCF hampir selalu menyebabkan adanya bias, kemudahan
penerapannya membuat metode ini masih banyak diterapkan di bidang
kedokteran.
4. Hot deck, yaitu mengisi data hilang dengan nilai observasi dari subjek lain
yang memiliki kemiripan nilai pada observasi-observasi sebelumnya.
Metode ini sulit diimplementasikan pada data kontinu dan lebih mudah
diimplementasikan pada data kategorikal. Semakin banyak titik waktu
yang dicocokkan, imputasi semakin akurat, namun kecocokan akan sema-
kin jarang.
2.2 Konsep Dasar Teori Copula
Copula merupakan alat untuk mengkonstruksi distribusi bersama dari marginal-
marginal yang tidak harus berasal dari distribusi yang sama. Kontruksi dilakukan
dengan mempertimbangkan struktur kebergantungan (asosiasi) antar marginal-
marginalnya, sehingga dengan marginal yang sama dapat dibentuk beberapa dis-
tribusi bersama yang berbeda.
Menurut Ene Kรครคrik (2006b), konstruksi distribusi bersama menggunakan
pendekatan copula memiliki beberapa keuntungan, yaitu:
1. Dengan menggunakan copula, distribusi marginal dapat diestimasi terlebih
dahulu, kemudian mengkonstruksi distribusi bersamanya.
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
Bab 2 Landasan Teori
9
2. Fungsi kebergantungan dapat diperoleh secara eksplisit sehingga lebih mu-
dah untuk melihat kebergantungan secara spesifik.
3. Keluarga copula sangat banyak, sehingga dapat digunakan untuk memo-
delkan distribusi secara luas.
Berikut teorema yang menjadi dasar aplikasi teori copula pada bidang
statistika (lihat referensi Nelsen, 2006):
Teorema Sklar
Misalkan terdapat distribusi bersamaโก๐น dengan marginal univariat ๐น1,โ€ฆ,๐น๐‘›.
Maka terdapat sebuah copula ๐ถ sedemikian sehingga untuk semua ๐ฑโกdiโกโ„ฬ… ๐‘›
,
๐น(๐‘ฅ1, โ€ฆ , ๐‘ฅ ๐‘›) = ๐ถ(๐น1(๐‘ฅ1), โ€ฆ , ๐น๐‘›(๐‘ฅ ๐‘›)).
Jika ๐น1, โ€ฆ , ๐น๐‘› kontinu, makaโก๐ถ unik.โˆŽ
Teorema Sklar secara eksplisit mengatakan bahwa setiap fungsi distribusi ber-
sama dapat dituliskan dalam bentuk copula, dimana copula merupakan fungsi
distribusi. Pada tugas akhir ini, pembahasan mengenai distribusi bersama dibatasi
hanya pada distribusi bersama dengan marginal-marginal kontinu. ๐น digunakan
untuk menotasikan fungsi distribusi dari suatu variabel acak kontinu.
Misalkan ๐น๐‘— merupakan fungsi distribusi dari variabel acak ๐‘‹๐‘— dan ๐‘ˆ๐‘—
merupakan Probability Integral Transform (PIT) dari ๐‘‹๐‘—, yaitu ๐‘ˆ๐‘— = ๐น๐‘—(๐‘‹๐‘—). De-
ngan menggunakan metode fungsi distribusi, akan dibuktikan bahwa ๐‘ˆ๐‘— berdistri-
busi uniform (0,1).
๐‘ƒ(๐‘ˆ๐‘— โ‰ค ๐‘ข)โกโกโกโก= ๐‘ƒ(๐น๐‘—(๐‘‹๐‘—) โ‰ค ๐‘ข)
= ๐‘ƒ (๐‘‹๐‘— โ‰ค ๐น๐‘—
โˆ’1
(๐‘ข))
= ๐น๐‘— (๐น๐‘—
โˆ’1
(๐‘ข))
= ๐‘ข
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
Bab 2 Landasan Teori
10
Fungsi distribusi merupakan fungsi monoton naik dengan nilai fungsi yang berada
pada interval [0,1], sehingga ๐‘ข โˆˆ [0,1]. Dapat disimpulkan bahwa ๐‘ˆ๐‘—~๐‘ˆ(0,1).
Dengan demikian, copula dapat dikatakan sebagai fungsi distribusi yang memiliki
marginal-marginal uniform (0,1). Untuk lebih memahami PIT, akan dibangkitkan
10.000 data dari variabel acak ๐‘‹ yang berdistribusi ๐‘’๐‘ฅ๐‘โก(2). Berikut disajikan
histogram dari data bangkitan:
Gambar 2.1 Histogram data bangkitan dari distribusi ๐‘’๐‘ฅ๐‘โก(2).
Data yang telah dibangkitkan ditransformasikan menggunakan fungsi berikut:
1. ๐น1(๐‘ฅ) = 1 โˆ’ ๐‘’โˆ’2๐‘ฅ
,
2. ๐น2(๐‘ฅ) =โกโˆซ
1
โˆš2๐œ‹
exp [
โˆ’โก( ๐‘ฅโˆ’0.5)2
2
]
๐‘ฅ
โˆ’โˆž
.
Berikut disajikan histogram dari data hasil transformasi dengan kedua fungsi:
Gambar 2.2 Histogram data hasil transformasi:
(a) Menggunakan fungsi distribusi ๐‘’๐‘ฅ๐‘โก(2); (b) Menggunakan fungsi distribusi ๐‘(0,5; 1).
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
Bab 2 Landasan Teori
11
Berdasarkan Gambar 2.2, histogram dari hasil tranformasi data menggunakan
fungsi distribusi ๐‘’๐‘ฅ๐‘(2) mengindikasikan bahwa ๐น1(๐‘‹) berdistribusi uniform, di-
mana densitas frekuensi tersebar merata pada interval (0,1). Histogram dari hasil
tranformasi data menggunakan fungsi distribusi ๐‘(0,5; 1) tidak mengindikasikan
bahwa ๐น2(๐‘‹) berdistribusi uniform. Dengan demikian, variabel acak ๐‘ˆ = ๐น(๐‘‹)
akan berdistribusi uniform jika dan hanya jika ๐น merupakan fungsi distribusi dari
๐‘‹.
2.2.1 Densitas Copula
Copula merupakan fungsi distribusi bersama, sehingga copula juga memiliki den-
sitas bersama yang selanjutnya disebut sebagai densitas copula. Misalkan
๐‘ฟ = (๐‘‹1, โ€ฆ , ๐‘‹ ๐‘˜) ๐‘‡
merupakan vektor acak dengan fungsi distribusi marginal
๐น1, ๐น2, โ€ฆ , ๐น๐‘˜ dan fungsi distribusi bersama ๐น, sedemikian sehingga ๐‘‹๐‘—~๐น๐‘— dan
๐‘ฟ~๐น. Jika copula ๐ถ dan ๐น1, ๐น2, โ€ฆ , ๐น๐‘˜ memiliki turunan, maka dengan memanfaat-
kan teorema Sklar diperoleh
โก๐‘“(๐‘ฅ1, โ€ฆ , ๐‘ฅ ๐‘˜)โกโก=โก
๐œ• ๐‘˜
โก๐น(๐‘ฅ1, โ€ฆ , ๐‘ฅ ๐‘˜)
๐œ•๐‘ฅ1 โ€ฆ . ๐œ•๐‘ฅ ๐‘˜
=โก
๐œ• ๐‘˜
โก๐ถ(๐น1(๐‘ฅ1), โ€ฆ , ๐น๐‘˜(๐‘ฅ ๐‘˜))โก
๐œ•๐‘ฅ1โก๐œ•๐‘ฅ2 โ€ฆ โก๐œ•๐‘ฅ ๐‘˜
=โก
๐œ• ๐‘˜
โก๐ถ(๐น1(๐‘ฅ1), โ€ฆ , ๐น๐‘˜(๐‘ฅ ๐‘˜))โก
๐œ•๐น1(๐‘ฅ1) โ€ฆ โก๐œ•๐น๐‘˜(๐‘ฅ ๐‘˜)
ร—โกโกโˆ
๐œ•๐น๐‘—(๐‘ฅ๐‘—)
๐œ•๐‘ฅ๐‘—
โก
๐‘˜
๐‘—=1
= โก๐‘(๐น1(๐‘ฅ1), โ€ฆ , ๐น๐‘˜(๐‘ฅ ๐‘˜))โกร—โก ๐‘“1(๐‘ฅ1)โกร— โ€ฆ .ร— ๐‘“๐‘˜(๐‘ฅ ๐‘˜),โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก(2. 1)
dimana ๐‘(๐น1(๐‘ฅ1), โ€ฆ , ๐น๐‘˜(๐‘ฅ ๐‘˜)) merupakan turunan dari copula yang disebut seba-
gai densitas copula dan ๐‘“๐‘— merupakan densitas dari variabel acak ๐‘‹๐‘—. Misalkan ๐‘ฟ
merupakan vektor acak dengan marginal-marginal yang saling bebas, maka
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
Bab 2 Landasan Teori
12
โก๐‘(๐น1(๐‘ฅ1), โ€ฆ , ๐น๐‘˜(๐‘ฅ ๐‘˜)) =โก
๐‘“(๐‘ฅ1, โ€ฆ , ๐‘ฅ ๐‘˜)
๐‘“1(๐‘ฅ1)โกร— โ€ฆ .ร— ๐‘“๐‘˜(๐‘ฅ ๐‘˜)
=
๐‘“1(๐‘ฅ1)โกร— โ€ฆ .ร— ๐‘“๐‘˜(๐‘ฅ ๐‘˜)
๐‘“1(๐‘ฅ1)โกร— โ€ฆ .ร— ๐‘“๐‘˜(๐‘ฅ ๐‘˜)
= 1.
Dengan demikian, copula dapat dianggap sebagai ukuran asosiasi yang memban-
dingkan antara densitas bersama dengan perkalian densitas marginalnya.
2.3 Distribusi Multivariat Normal Standar
Distribusi multivariat normal standar merupakan distribusi yang memiliki mar-
ginal-marginal normal standar. Misalkan ๐‘ฎ~๐‘๐‘˜(๐ŸŽ, ๐‘ฐ ๐‘˜) dan ๐‘นk merupakan matriks
kovariansi Pearson berukuran ๐‘˜ ร— ๐‘˜โกyang bersifat simetri dan definit positif,
dengan ๐‘‘๐‘–๐‘Ž๐‘”(๐‘นk) = (1,1, โ€ฆ , 1)T
. Untuk mengkonstruksi distribusi multivariat
normal standar dengan kovariansi ๐‘น ๐‘˜, definisikan ๐’ = ๐‘น ๐‘˜
1
2
๐‘ฎ. Dengan demikian,
โก๐’~โก๐‘๐‘˜(๐ŸŽ, ๐‘นk). Karena ๐’ memiliki marginal normal standar, maka matriks ๐‘นk
dapat dikatakan sebagai matriks korelasi Pearson.
Akan dibuktikan bahwa matriks ๐‘นk harus memenuhi sifat simetri dan semi
definit positif. Berikut definisi dari matriks simetri yang bersifat semi definit
positif (lihat referensi Anton dan Rorres, 2005):
Definisi
Suatu matriks simetriโก๐‘จ โˆˆ โ„nxn
dikatakan bersifat semi definit positif apabila
untuk seluruh ๐ฎ โ‰  ๐ŸŽ dan ๐’–โก โˆˆ โ„n
berlakuโก๐’–T
๐‘จโก๐’– โ‰ฅ 0.โˆŽ
Untuk membuktikan bahwa ๐‘นk bersifat semi definit positif, akan dicari selang
nilai dari ๐’– ๐‘‡
โก๐‘นkโก๐’–. Pada kasus ini, distribusi marginal ๐‘๐‘— ialah distribusi yang
terpusat dan ๐‘นk merupakan matriks kovariansi, sehingga
๐‘นk = ๐ถ๐‘œ๐‘ฃโก(๐’) = ๐ธ[๐’๐’ ๐‘‡].
Dari definisi matriks kovariansi, dapat dilihat bahwa ๐‘น ๐‘˜ bersifat simetri. Kemudi-
an dengan memanfaatkan sifat kelinieran ekspektasi, diperoleh
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
Bab 2 Landasan Teori
13
๐’– ๐‘‡
โก๐ถ๐‘œ๐‘ฃโก(๐’)โก๐’– = โก๐ธ[๐’– ๐‘ป
โก๐’๐’ ๐‘‡
โก๐’–]โก= ๐ธ[(๐’– ๐‘ป
โก๐’) ๐Ÿ].
Definisikan ๐‘บ =โก(๐’– ๐‘ป
โก๐’). ๐‘บ merupakan variabel acak terpusat di 0, sehingga
๐’– ๐‘‡
โก๐ถ๐‘œ๐‘ฃโก(๐’)โก๐’– = โก๐ธ[๐‘บ ๐Ÿ] =โก ๐œŽ๐’”
2
โ‰ฅ 0.
Dapat disimpulkan bahwa ๐‘นk bersifat semi definit positif. Namun, agar densitas
distribusi multivariat normal berdasarkan definisi vector acak ๐’ dapat diperoleh,
matriks ๐‘นk dibatasi memiliki sifat simetri dan definit positif (lihat referensi Hogg
dan Craig, 2005).
2.3.1 Korelasi Pearson
Korelasi Pearson merupakan ukuran kebergantungan linier (asosiasi linier) antara
dua variabel acak. Korelasi Pearson untuk dua variabel acak ๐‘‹ dan ๐‘Œ didefinisikan
sebagai
๐œŒ ๐‘‹๐‘Œ =
๐ถ๐‘œ๐‘ฃ(๐‘‹, ๐‘Œ)
โˆš๐‘‰๐‘Ž๐‘Ÿ(๐‘‹)๐‘‰๐‘Ž๐‘Ÿ(๐‘Œ)
=
๐ธ[๐‘‹๐‘Œ] โˆ’ ๐ธ[๐‘‹]๐ธ[๐‘Œ]
โˆš(๐ธ[๐‘‹2] โˆ’ (๐ธ[๐‘‹])2)(๐ธ[๐‘Œ2] โˆ’ (๐ธ[๐‘Œ])2)
.โกโก
Beberapa hal yang harus dipahami mengenai korelasi Pearson adalah (Embrechts
dkk, 1999):
1. Interval dari nilai korelasi Pearson yang mungkin bergantung pada distri-
busi marginalnya (dalam hal ini distribusi dari ๐‘‹ dan distribusi dari ๐‘Œ).
|๐œŒ ๐‘‹๐‘Œ| โ‰ค 1 untuk seluruh (๐‘‹, ๐‘Œ) yang merupakan bivariat eliptical distribu-
tion, yaitu distribusi bivariat yang memiliki densitas konstan pada suatu
elipsoid, contohnya distribusi bivariat normal. Secara umum, interval dari
nilai korelasi Pearson yang mungkin merupakan subset dari [-1,1].
2. Misalkan [๐œŒ ๐‘š๐‘–๐‘›, ๐œŒ ๐‘š๐‘Ž๐‘ฅ] menyatakan interval dari nilai korelasi Pearson
yang mungkin dari dua peubah acak ๐‘‹ dan ๐‘Œ, maka ๐œŒ ๐‘‹๐‘Œ = ๐œŒ ๐‘š๐‘Ž๐‘ฅ menyata-
kan bahwa ๐‘‹ dan ๐‘Œ saling bergantung secara positif sempurna, sedangkan
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
Bab 2 Landasan Teori
14
๐œŒ ๐‘‹๐‘Œ = ๐œŒ ๐‘š๐‘–๐‘› menyatakan bahwa ๐‘‹ dan ๐‘Œ saling bergantung secara negatif
sempurna.
3. Korelasi Pearson hanya mengukur kebergantungan linier, sehingga apabila
dua peubah acak saling bebas, maka ๐œŒ ๐‘‹๐‘Œ = 0, tetapi tidak berlaku seba-
liknya. ๐œŒ ๐‘‹๐‘Œ = 0 menyatakan bahwa ๐‘‹ dan ๐‘Œ saling bebas jika dan hanya
jika (๐‘‹, ๐‘Œ) berdistribusi bivariat normal.
4. Korelasi Pearson bersifat tidak invarian terhadap transformasi tak linier
naik murni (nonlinear strictly increasing transformation).
5. Korelasi Pearson hanya terdefinisi jika dan hanya jika kedua variabel acak
memiliki varansi yang berhingga.
Korelasi Pearson menggambarkan bagaimana dua variabel bergerak ber-
sama-sama. Hal yang sering disalahartikan ialah bahwa korelasi Pearson mengu-
kur hubungan kausalitas. Penyataan ini tidak selalu benar karena variabel ๐‘‹ dapat
dipengaruhi oleh ๐‘Œ, variabel ๐‘Œ dapat dipengaruhi oleh ๐‘‹, atau variabel ๐‘‹ dan ๐‘Œ
dipengaruhi oleh variabel ketiga, misalkan ๐‘.
Secara empiris, korelasi Pearson dapat diperoleh dengan menggunakan
formula
๐œŒ ๐‘‹๐‘Œฬ‚ = ๐‘ ๐‘‹๐‘Œ =
๐‘† ๐‘‹๐‘Œ
โˆš๐‘† ๐‘‹ ๐‘† ๐‘Œ
=
โˆ‘ (๐‘ฅ๐‘– โˆ’ ๐‘ฅฬ…)(๐‘ฆ๐‘– โˆ’ ๐‘ฆฬ…)๐‘›
๐‘–=1
โˆšโˆ‘ (๐‘ฅ๐‘– โˆ’ ๐‘ฅฬ…)2๐‘›
๐‘–=1 โกโˆ‘ (๐‘ฆ๐‘– โˆ’ ๐‘ฆฬ…)2๐‘›
๐‘–=1
โก,
dimana ๐‘› menyatakan banyaknya sampel. Untuk selanjutnya, korelasi yang
dimaksud dalam tugas akhir ini adalah korelasi Pearson. Korelasi empiris meru-
pakan fungsi dari sampel (statistik) sehingga memiliki distribusi. Hotelling (1953)
menyatakan bahwa apabila (๐‘‹, ๐‘Œ) berdistribusi bivariat normal, fungsi distribusi
dari korelasi sampel dapat dituliskan sebagai berikut:
๐‘“๐‘ƒ ๐‘‹๐‘Œ
(๐‘) =
(๐‘› โˆ’ 2)ฮ“(๐‘› โˆ’ 1)
โˆš2๐œ‹ฮ“ (๐‘› โˆ’
1
2
) (1 โˆ’ ๐œŒ๐‘) ๐‘›โˆ’
3
2
โก(1 โˆ’ ๐œŒ2)
๐‘›โˆ’1
2
ร— (1 โˆ’ ๐‘2)
๐‘›โˆ’4
2 [1 +
1
4
(
๐œŒ๐‘ + 1
2๐‘› โˆ’ 1
) +
9
32
(๐œŒ๐‘ + 1)2
(2๐‘› โˆ’ 1)(2๐‘› + 1)
+ โ‹ฏ ].
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
Bab 2 Landasan Teori
15
Dapat dilihat bahwa distribusi dari korelasi empiris bergantung pada korelasi po-
pulasi dan jumlah (ukuran) sampel. Kebergantungan dari masing-masing faktor
dapat dilihat melalui perbandingan bentuk kurva densitas apabila faktor lainnya
ditetapkan konstan.
Pengaruh ukuran sampel terhadap distribusi dari korelasi empiris dapat di-
lihat pada gambar berikut:
Gambar 2.3 Pengaruh ukuran sampel terhadap distribusi korelasi empiris:
(a) ๐œŒ = 0.2 ; (b) ๐œŒ = 0.5 ; (c) ๐œŒ = โˆ’0.2 ; (d) ๐œŒ = โˆ’0.5
Gambar 2.3 menunjukkan bahwa semakin besar ukuran sampel, maka peluang
๐‘ƒ๐‘‹๐‘Œ = ๐œŒ ๐‘‹๐‘Œ semakin besar. Ukuran sampel yang sedikit cenderung menyebabkan
korelasi empiris salah dalam memprediksi korelasi populasi. Hal ini dapat dilihat
dari grafik densitas peluang korelasi empiris untukโก๐‘› = 3, dimana nilai densitas-
nya semakin membesar ketika mendekati 1 untuk nilai korelasi populasi positif
dan semakin membesar ketika mendekati -1 untuk nilai korelasi populasi negatif.
(d)(c)
(b)(a)
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
Bab 2 Landasan Teori
16
Pengaruh nilai korelasi populasi terhadap distribusi dari korelasi empiris
dapat dilihat pada gambar berikut:
Gambar 2.4 Pengaruh korelasi populasi terhadap distribusi korelasi empiris.
Gambar 2.4 memperlihatkan bahwa apabila korelasi populasi mendekati -1 atau 1,
maka dengan jumlah sampel yang sama, fungsi densitas di titik ๐‘ƒ๐‘‹๐‘Œ = ๐œŒ ๐‘‹๐‘Œ sema-
kin besar.
Berdasarkan Pham-Gia dan Choulakian (2014), distribusi dari matriks ko-
relasi sampel juga bergantung pada jumlah sampel. Apabila ๐’€~๐‘ต ๐‘˜(๐, ๐šบ ๐‘˜) dimana
matriks korelasi populasi ๐šฒ ๐‘˜ โ‰  ๐‘ฐ dan ๐šฒ ๐‘˜
โˆ’1
memiliki elemen diagonal ๐œ†๐‘–๐‘–, maka
matriks korelasi sampel ๐‘ฒ dari suatu sampel acak berukuran ๐‘› memiliki fungsi
peluang sebagai berikut :
๐‘“๐‘จ(๐‘ฒ) =
[ฮ“ (
๐‘› โˆ’ 1
2
)]
๐‘˜
exp {โˆ’ โˆ‘
๐œ†๐‘–๐‘— ๐‘ ๐‘–๐‘—
โˆš ๐œŽ๐‘–๐‘– ๐œŽ๐‘—๐‘—โก๐‘–<๐‘— }
๐œ‹
๐‘˜(๐‘˜โˆ’1)
4 โˆ ฮ“ (
n โˆ’ i
2
)๐‘˜
๐‘–=1 โก[|๐šฒ ๐‘˜| โˆ ๐œ†๐‘–๐‘–
๐‘˜
๐‘–=1 ]
๐‘›โˆ’1
2
|๐‘ฒ|
๐‘›โˆ’๐‘˜โˆ’2
2 .
2.4 Copula Gaussian
Untuk memperoleh distribusi bersama, selain dibutuhkan distribusi marginal dan
nilai asosiasi (misalnya korelasi sebagai asosiasi linier), dibutuhkan pula struktur
kebergantungan. Gaussian copula merupakan alat untuk mengkontruksi distribusi
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
Bab 2 Landasan Teori
17
bersama dengan memanfaatkan struktur kebergantungan yang dimiliki oleh distri-
busi multivariat normal standar.
2.4.1 Konstruksi Copula Gaussian
Definisikan ฮฆ ๐‘˜ dan ๐œ™ ๐‘˜ berturut-turut sebagai fungsi distribusi dan fungsi densitas
dari distribusi normal standar ๐‘˜-variat. Apabila ๐’~โก๐‘๐‘˜(๐ŸŽ, ๐‘นk), maka sesuai de-
ngan Teorema Sklar berlaku
ฮฆ ๐‘˜(๐‘ง1, โ€ฆ , ๐‘ง ๐‘˜|๐‘นk) = ๐ถ ๐‘”๐‘Ž๐‘ข๐‘ ๐‘ (ฮฆ1(๐‘ง1), โ€ฆ , ฮฆ1(๐‘งk)|๐‘นk).โกโกโกโกโกโกโกโกโกโกโกโกโกโก(2. 2)
Selanjutnya, definisikan ๐‘ˆ๐‘— = ฮฆ1(๐‘๐‘—) untuk ๐‘— = 1, . . . , ๐‘˜. Dengan mendefinisikan
variabel acak ๐‘ˆ๐‘—, persamaan 2.2 dapat dituliskan sebagai berikut:
๐ถ ๐‘”๐‘Ž๐‘ข๐‘ ๐‘ (๐‘ข1, โ€ฆ , ๐‘ขk|๐‘นk) = ฮฆ ๐‘˜(ฮฆ1
โˆ’1
(๐‘ข1), โ€ฆ , ฮฆ1
โˆ’1
(๐‘ขk)|๐‘นk).โกโกโกโกโกโกโก(2. 3)
Sesuai dengan bukti yang telah dipaparkan pada sub bab 2.2, ๐‘ˆ๐‘— berdistri-
busi ๐‘ˆ(0,1). Dengan memanfaatkan PIT, distribusi ๐‘ˆ(0,1) dapat dibentuk dengan
mentrasformasikan suatu variabel acak kontinu sebarang dengan menggunakan
fungsi distribusinya sendiri. Dengan demikian, masing-masing ๐‘ˆ๐‘— dapat dibentuk
dari suatu variabel acak ๐‘‹๐‘—, dimana ๐‘‹๐‘—~๐น๐‘—. Langkah ini merupakan basis dari
proses konstruksi copula Gaussian.
Definisikan
๐‘พ ๐‘˜ = (๐‘Œ1, โ€ฆ , ๐‘Œ๐‘˜) ๐‘‡
= (ฮฆ1
โˆ’1
(๐น1(๐‘‹1)), โ€ฆ , ฮฆ1
โˆ’1
(๐น๐‘˜(๐‘‹ ๐‘˜)))
๐‘‡
,
sehingga ๐‘Œ๐‘—~๐‘(0,1). Secara umum, matriks korelasi Pearson memiliki sifat tidak
invarian terhadap transformasi monoton. Akibatnya, apabila ๐‘ฟ = (๐‘‹1, โ€ฆ , ๐‘‹ ๐‘˜) ๐‘‡
tidak berdistribusi multivariat normal standar, maka ๐ถ๐‘œ๐‘Ÿ๐‘Ÿ(๐‘ฟ) โ‰  ๐ถ๐‘œ๐‘Ÿ๐‘Ÿ(๐‘พ ๐‘˜).
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
Bab 2 Landasan Teori
18
Definisikan ๐ถ๐‘œ๐‘Ÿ๐‘Ÿ(๐‘พ ๐‘˜) = ๐‘ซ ๐‘˜, sehingga ๐‘พk~๐‘๐‘˜(๐ŸŽ, ๐‘ซk). Dengan demiki-
an, persamaan 2.3 dapat dituliskan sebagai berikut:
๐ถ ๐‘”๐‘Ž๐‘ข๐‘ ๐‘ (๐‘ข1, โ€ฆ , ๐‘ขk|๐‘ซk)โกโกโกโกโกโก= ฮฆ ๐‘˜(ฮฆ1
โˆ’1
(๐น1(๐‘ฅ1)), โ€ฆ , ฮฆ1
โˆ’1
(๐นk(๐‘ฅk))|๐‘ซk)
= ฮฆ ๐‘˜(๐‘ฆ1, โ€ฆ , ๐‘ฆk|๐‘ซk).โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก(2. 4)
Dapat dilihat pada persamaan 2.4, apabila ๐’™๐‘– = (๐‘ฅ๐‘–1, โ€ฆ , ๐‘ฅ๐‘–๐‘˜) ๐‘‡
merupakan sampel
ke-๐‘– dari vektor acak ๐‘ฟ, pasangan nilai pada vektor ๐’™๐‘– mendefinisikan pasangan
nilai pada vektor ๐’š๐‘– = (๐‘ฆ๐‘–1, โ€ฆ , ๐‘ฆ๐‘–๐‘˜) ๐‘‡
. Proses pembentukan pasangan nilai pada
vektor ๐’š๐‘– = (๐‘ฆ๐‘–1, โ€ฆ , ๐‘ฆ๐‘–๐‘˜) ๐‘‡
termuat dalam parameter copula ๐‘ซ ๐‘˜.
2.4.2 Densitas Copula Gaussian
Sesuai dengan persamaan 2.4, melalui proses perhitungan yang serupa dengan
persamaan 2.1, densitas copula Gaussian dapat dituliskan sebagai berikut:
๐‘ ๐‘”๐‘Ž๐‘ข๐‘ ๐‘ (๐‘ข1, โ€ฆ , ๐‘ขk)โกโก=
๐œ™ ๐‘˜(๐‘ฆ1, โ€ฆ , ๐‘ฆk|๐‘ซk)
๐œ™1(๐‘ฆ1)โกร— โ€ฆ .ร— ๐œ™1(๐‘ฆk)
=
1
(2๐œ‹)
๐‘˜
2|๐‘ซk|
1
2
exp (โˆ’
1
2
๐’˜ ๐‘˜
๐‘‡
๐‘ซk
โˆ’1
๐’˜ ๐‘˜)
โˆ
1
(2๐œ‹)
1
2
๐‘˜
๐‘—=1 ๐‘’๐‘ฅ๐‘ (โˆ’
1
2
โก๐‘ฆ๐‘—
2
)
=
|๐‘ซk|โˆ’
1
2 โกโกexp (โˆ’
1
2
๐’˜ ๐‘˜
๐‘‡
๐‘ซk
โˆ’1
๐’˜ ๐‘˜)
exp (โˆ’
1
2
โก๐’˜ ๐‘˜
๐‘‡ ๐’˜ ๐‘˜)
=โก|๐‘ซk|โˆ’
1
2 โกโกexp {โˆ’
1
2
๐’˜ ๐‘˜
๐‘‡
(๐‘ซk
โˆ’1
โˆ’ ๐šฐ)๐’˜ ๐‘˜}โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก(2. 5)
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
Bab 2 Landasan Teori
19
2.4.3 Konstruksi Distribusi Bersama
Densitas distribusi bersama merupakan perkalian antara densitas marginal dengan
densitas copula. Dengan demikian, sesuai persamaan 2.1 dan 2.5, densitas dari
suatu vector acak ๐‘ฟ yang dikonstruksi dengan menggunakan copula Gaussian
ialah
๐‘“(๐‘ฅ1, โ€ฆ , ๐‘ฅ ๐‘˜) = ๐‘“1(๐‘ฅ1)โกร— โ€ฆโกร—โก ๐‘“๐‘˜(๐‘ฅ ๐‘˜)โก|๐‘ซk|โˆ’
1
2โกโก๐‘’
{โˆ’
1
2
๐’˜ ๐‘˜
๐‘‡(๐‘ซk
โˆ’1
โˆ’๐šฐ)๐’˜ ๐‘˜}
โกโกโกโกโก(2. 6)
2.4.4 Konstruksi Distribusi Bersyarat
Distribusi bersyarat ialah distribusi dari suatu variabel acak ketika variabel acak
lainnya diasumsikan telah memiliki nilai. Distribusi bersyarat diturunkan melalui
analogi dari peluang bersyarat. Peluang bersyarat dapat dianggap sebagai pem-
bentukan ruang sampel yang baru sebagai himpunan yang merupakan subset tak
kosong dari ruang sampel sebelumnya tanpa mengubah bentuk distribusi dari sub-
set tersebut.
Misalkan terdapat sebuah eksperimen acak yang memiliki ruang sampel ๐œ….
๐‘˜1 dan ๐‘˜2 merupakan subset dari ๐œ… sedemikian sehingga ๐‘ƒ(๐‘˜1) > 0. Untuk men-
cari peluang dari ๐‘˜2 dibawah kondisi bahwa hasil yang muncul merupakan
anggota dari ๐‘˜1, maka yang menjadi perhatian ialah irisan dari ๐‘˜2 dengan ๐‘˜1.
Sesuai dengan definisi frekuensi relatif, maka kerelatifan diukur terhadap ๐‘˜1,
sehingga
๐‘ƒ(๐‘˜2|โก๐‘˜1) =
๐‘ƒ(๐‘˜2 โˆฉ ๐‘˜1)
๐‘ƒ(๐‘˜1)
.โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก(2. 7)
Untuk menghitung densitas dari distribusi bersyarat, digunakan analogi
dari persamaan 2.7. Definisikan ๐‘“(๐‘ฅ1, โ€ฆ , ๐‘ฅ ๐‘˜) sebagai densitas bersama dari vektor
acak ๐‘ฟ = (๐‘‹1, โ€ฆ , ๐‘‹ ๐‘˜) ๐‘‡
dan ๐‘“(๐‘ฅ ๐‘˜|๐‘ฅ1, โ€ฆ , ๐‘ฅ ๐‘˜โˆ’1) sebagai densitas peluang variabel
acak ๐‘‹ ๐‘˜ diberikan ๐‘‹1, โ€ฆ , ๐‘‹ ๐‘˜โˆ’1. Sesuai dengan persamaan 2.7, maka
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
Bab 2 Landasan Teori
20
๐‘“(๐‘ฅ ๐‘˜|๐‘ฅ1, โ€ฆ , ๐‘ฅ ๐‘˜โˆ’1) =โก
๐‘“(๐‘ฅ1, โ€ฆ , ๐‘ฅ ๐‘˜)
โก๐‘“(๐‘ฅ1, โ€ฆ , ๐‘ฅ ๐‘˜โˆ’1)
.โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก(2. 8)
Sesuai persamaan 2.8, dapat disimpulkan bahwa untuk mencari distribusi ber-
syarat dibutuhkan distribusi bersama. Dengan menggunakan persamaan 2.1, 2.5,
dan 2.8, diperoleh
๐‘“(๐‘ฅ ๐‘˜|๐‘ฅ1, โ€ฆ , ๐‘ฅ ๐‘˜โˆ’1)โก=โก
๐‘ ๐‘”๐‘Ž๐‘ข๐‘ ๐‘ (๐‘ข1, โ€ฆ , ๐‘ข ๐‘˜)โกโก๐‘“1(๐‘ฅ1)โกโ€ฆโก๐‘“๐‘˜(๐‘ฅ ๐‘˜)
๐‘ ๐‘”๐‘Ž๐‘ข๐‘ ๐‘ (๐‘ข1, โ€ฆ , ๐‘ข ๐‘˜โˆ’1)โกโก๐‘“1(๐‘ฅ1)โกโ€ฆโก๐‘“๐‘˜โˆ’1(๐‘ฅ ๐‘˜โˆ’1)
= ๐‘“๐‘˜(๐‘ฅ ๐‘˜)
๐‘ ๐‘”๐‘Ž๐‘ข๐‘ ๐‘ (๐‘ข1, โ€ฆ , ๐‘ข ๐‘˜)
๐‘ ๐‘”๐‘Ž๐‘ข๐‘ ๐‘ (๐‘ข1, โ€ฆ , ๐‘ข ๐‘˜โˆ’1)
=
๐‘“๐‘˜(๐‘ฅ ๐‘˜)โก๐œ™ ๐‘˜(y1, โ€ฆ , yk|๐‘ซk)๐œ™1(y1)โกโ€ฆ ๐œ™1(ykโˆ’1)
๐œ™1(y1)โกโ€ฆโก๐œ™1(yk)๐œ™ ๐‘˜โˆ’1(y1, โ€ฆ , ykโˆ’1|๐‘ซkโˆ’1)
=
๐‘“๐‘˜(๐‘ฅ ๐‘˜)โก๐œ™ ๐‘˜(y1, โ€ฆ , yk|๐‘ซk)
๐œ™1(yk)๐œ™ ๐‘˜โˆ’1(y1, โ€ฆ , ykโˆ’1|๐‘ซkโˆ’1)
.โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก(2. 9)
Karena ๐‘Œ๐‘— = ฮฆ1
โˆ’1
(๐น๐‘—(๐‘‹๐‘—)), maka ๐œ™1(๐‘ฆ๐‘—) = ๐‘“๐‘—(๐‘ฅ๐‘—). Dengan demikian, persamaan
2.9 dapat dituliskan sebagai berikut:
๐‘“(๐‘ฆ ๐‘˜|๐‘ฆ1, โ€ฆ , ๐‘ฆ ๐‘˜โˆ’1; ๐‘ซ ๐‘˜)โกโก= ๐œ™1(๐‘ฆ ๐‘˜)โก
๐œ™ ๐‘˜(๐‘ฆ1, โ€ฆ , ๐‘ฆ ๐‘˜; ๐‘ซ ๐‘˜)
๐œ™ ๐‘˜โˆ’1(๐‘ฆ1, โ€ฆ , ๐‘ฆ ๐‘˜โˆ’1; ๐‘ซ ๐‘˜โˆ’1) ร— ๐œ™1(๐‘ฆ ๐‘˜)
โกโก.โกโกโกโก(2. 10)
2.5 Titik Maksimum
Misalkan ๐ด merupakan domain dari suatu fungsi ๐‘“, dimana titik ๐‘ termuat dalam
๐ด. ๐‘“(๐‘) merupakan titik maksimum dari fungsi ๐‘“ di ๐ด apabila ๐‘“(๐‘) โ‰ฅ ๐‘“(๐‘ฅ) untuk
semua ๐‘ฅ๐œ–๐ด. Apabila ๐‘“ kontinu pada interval [๐‘Ž, ๐‘], maka ๐‘“ memiliki titik maksi-
mum (lihat referensi Purcell dkk, 2007). Titik maksimum yang didefinisikan pada
interval tutup dapat berupa titik stasioner, titik ujung, maupun titik singular.
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
Bab 2 Landasan Teori
21
Titik singular ialah titik interior dari domain fungsi dimana ๐‘“โ€ฒ(๐‘ฅ) tidak
terdefinisi. Sedangkan titik stasioner merupakan titik dimana
๐‘“โ€ฒ(๐‘ฅ) =
๐‘‘๐‘“(๐‘ฅ)
๐‘‘๐‘ฅ
= 0.โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก(2. 11)
Tidak semua titik stasioner merupakan titik maksimum. Terdapat beberapa jenis
titik stasioner pada fungsi satu variabel, yaitu titik maksimum, titik minimum, dan
titik belok. Titik maksimum akan didapatkan apabila grafik ๐‘“(๐‘ฅ) terbuka ke
bawah. Berikut teorema mengenai turunan kedua dari fungsi ๐‘“ (lihat referensi
Purcell dkk, 2007):
Teorema
Misal fungsi ๐‘“ memiliki turunan kedua pada interval buka I.
1. Jika ๐‘“โ€ฒโ€ฒ(๐‘ฅ) > 0 untuk semua ๐‘ฅ di I, maka kurva ๐‘“ terbuka ke atas
pada interval I.
2. Jika ๐‘“โ€ฒโ€ฒ(๐‘ฅ) < 0โกuntuk semua ๐‘ฅ di I, maka kurva ๐‘“ terbuka ke bawah
pada interval I.โกโˆŽ
2.5.1 Titik Maksimum Fungsi Densitas Distribusi Normal
Distribusi normal merupakan distribusi yang memiliki densitas bersifat log-con-
cave karena memiliki fungsi densitas yang memenuhi
๐‘‘2
log ๐‘“(๐‘ฅ)
๐‘‘๐‘ฅ2
=
โˆ’1
๐œŽ2
< 0,
dimana yang dimaksud dengan fungsi log disini ialah fungsi logaritma natural.
Distribusi yang bersifat log-concave bersifat unimodal, yaitu memiliki satu titik
dimana fungsi densitasnya bernilai maksimum. Hal ini dapat dilihat dari teorema
mengenai turunan kedua dan sifat fungsi logaritma, yaitu bersifat monoton naik
murni. Dengan demikian, untuk distribusi yang memiliki densitas bersifat log-
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
Bab 2 Landasan Teori
22
concave, titik dimana fungsi densitas peluang bernilai maksimum merupakan titik
stasioner dan dapat ditentukan dengan menggunakan turunan pertama.
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
23
Bab 3
Model Imputasi
Sebelum mengkonstruksi model imputasi, terlebih dahulu akan dijelaskan skema
imputasi yang dilakukan. Skema imputasi bergantung pada struktur dropout pada
data. Beberapa struktur dropout yang mungkin terjadi pada proses pengambilan
data longitudinal ialah :
1. Dropout terjadi pada beberapa subjek sekaligus dalam suatu waktu pengu-
kuran,
2. Dropout terjadi pada beberapa subjek, dimana waktu terjadinya dropout
antar subjek yang berbeda tidak beririsan,
3. Dropout terjadi pada beberapa subjek, dimana beberapa diantara subjek
tersebut mengalami dropout di waktu yang sama.
Dari ketiga struktur dropout diatas, struktur dropout ke-3 memuat dua struktur
lainnya, sehingga struktur ini yang akan digunakan untuk mengilustrasikan skema
imputasi yang akan dilakukan. Akan diberikan contoh kasus dimana proses drop-
out mengikuti struktur dropout ke-3.
Misalkan terdapat 10 subjek yang akan diobservasi sebanyak 6 kali. ๐‘ฅ๐‘–๐‘—
menyatakan nilai observasi untuk subjek ๐‘– pada waktu ๐‘—. Selama proses pengam-
bilan data, beberapa individu mengalami dropout, sehingga data yang diperoleh
seperti pada tabel berikut:
Tabel 3.1 Ilustrasi data longitudinal dengan dropout.
๐‘†๐‘ข๐‘๐‘—๐‘’๐‘˜
๐‘‡๐‘–๐‘ก๐‘–๐‘˜โก๐‘Š๐‘Ž๐‘˜๐‘ก๐‘ข
1 2 3 4 5 6
๐‘‹1 ๐‘‹2 ๐‘‹3 ๐‘‹4 ๐‘‹5 ๐‘‹6
1 ๐‘ฅ11 ๐‘ฅ12 ๐‘ฅ13 ๐‘ฅ14 ๐‘ฅ15 ๐‘ฅ16
2 ๐‘ฅ21 ๐‘ฅ22 ๐‘ฅ23 โˆ’ โˆ’ โˆ’
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
Bab 3 Model Imputasi
24
Definisikan variabel ๐‘˜ sebagai variabel yang menyatakan titik waktu ter-
jadinya dropout pertama. Untuk kasus pada Tabel 3.1, ๐‘˜ = 3. Imputasi dilakukan
pada data hilang untuk masing-masing individu yang mengalami dropout pada
saat ๐‘˜. Setelah semua data hilang pada saat ๐‘˜ diimput, proses imputasi dilanjutkan
dengan mengimput data yang hilang pada saat ๐‘˜ + 1, dan seterusnya. Proses ini
disebut dengan sequential imputation.
Untuk mengisi nilai-nilai yang hilang pada tiap proses imputasi berda-
sarkan skema imputasi yang telah dijelaskan, akan dibahas salah satu model single
imputation yang dikonstruksi dengan memanfaatkan distribusi bersyarat. Menurut
Ene Kรครคrik (2006b), dengan meggunakan distribusi bersyarat, karakteristik dari
distribusi seperti mean, deviasi standard, dan kuantil dapat dengan mudah
dijelaskan secara analitik. Selain itu, dengan memanfaatkan distribusi bersyarat,
sampel acak dari data hilang dapat dibangkitkan, sehingga dengan kata lain,
model yang dihasilkan dapat dikembangkan menjadi model multiple imputation.
3.1 Model Umum Imputasi
Pada sub bab ini, akan dikonstruksi sebuah model umum imputasi untuk meng-
imput nilai ๐‘ฅ๐‘–๐‘˜, yaitu data hilang dari individu ๐‘– pada saat ๐‘˜. Untuk mempermudah
penulisan, selanjutnya ๐‘ฅ๐‘–๐‘˜ dituliskan sebagai ๐‘ฅ ๐‘˜. Misalkan terdapat ๐‘› subjek yang
akan diukur sebanyak ๐‘š kali. ๐‘ฟ = (๐‘‹1, โ€ฆ , ๐‘‹ ๐‘š) ๐‘‡
merupakan vektor acak peng-
ukuran pada titik waktu diskrit 1,2, โ€ฆ , ๐‘š. Apabila masing-masing subjek diang-
3 ๐‘ฅ31 ๐‘ฅ32 ๐‘ฅ33 ๐‘ฅ34 ๐‘ฅ35 ๐‘ฅ36
4 ๐‘ฅ41 ๐‘ฅ42 โˆ’ โˆ’ โˆ’ โˆ’
5 ๐‘ฅ51 ๐‘ฅ52 ๐‘ฅ53 ๐‘ฅ54 ๐‘ฅ55 ๐‘ฅ56
6 ๐‘ฅ61 ๐‘ฅ62 ๐‘ฅ63 โˆ’ โˆ’ โˆ’
7 ๐‘ฅ71 ๐‘ฅ72 ๐‘ฅ73 ๐‘ฅ74 ๐‘ฅ75 ๐‘ฅ76
8 ๐‘ฅ81 ๐‘ฅ82 โˆ’ โˆ’ โˆ’ โˆ’
9 ๐‘ฅ91 ๐‘ฅ92 ๐‘ฅ93 ๐‘ฅ94 ๐‘ฅ95 ๐‘ฅ96
10 ๐‘ฅ10,1 ๐‘ฅ10,2 ๐‘ฅ10,3 ๐‘ฅ10,4 ๐‘ฅ10,5 ๐‘ฅ10,6
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
Bab 3 Model Imputasi
25
gap sebagai sampel acak dari ๐‘ฟ, maka data dari masing-masing subjek dapat
dikatakan sebagai realisasi dari vektor acak ๐‘ฟ. Dengan demikian, untuk mencari
nilai ๐‘ฅ ๐‘˜ berdasarkan observasi sebelumnya, yaitu ๐‘ฅ1, โ€ฆ , ๐‘ฅ ๐‘˜โˆ’1, setara dengan men-
cari distribusi dari ๐‘‹ ๐‘˜ bersyarat ๐‘‹1, . . . , ๐‘‹ ๐‘˜โˆ’1.
Sesuai persamaan 2.9 dan 2.10, densitas ๐‘‹ ๐‘˜ bersyarat ๐‘‹1, . . . , ๐‘‹ ๐‘˜โˆ’1 dapat
dituliskan sebagai densitas ๐‘Œ๐‘˜ bersyarat ๐‘Œ1, . . . , ๐‘Œ๐‘˜โˆ’1. Definisikan
๐‘ฏ = (๐‘Œ1, โ€ฆ , ๐‘Œ๐‘˜โˆ’1) ๐‘‡
sebagai vektor acak historis. Dengan demikian, matriks ๐‘ซ ๐‘˜ dapat dipartisi menja-
di
๐‘ซ ๐‘˜ = (
๐‘ซ ๐‘˜โˆ’1 ๐’“
๐’“ ๐‘‡
1
),
dimana ๐‘ซ ๐‘˜โˆ’1 merupakan matriks korelasi dari vektor acak historis ๐‘ฏ yang
berukuran (๐‘˜ โˆ’ 1) ร— (๐‘˜ โˆ’ 1) dan ๐’“ merupakan matriks korelasi antara variabel
acak pada vektor historis dengan ๐‘Œ๐‘˜. Kemudian, dengan mensubstitusikan fungsi
densitas distribusi normal ke persamaan 2.10, diperoleh
๐‘“(๐‘ฆ ๐‘˜|๐‘ฏ; ๐‘ซ ๐‘˜)โก=
๐œ™1(๐‘ฆ ๐‘˜)โก
1
(2๐œ‹)
๐‘˜
2|๐‘ซ ๐‘˜|
1
2
๐‘’
{โˆ’
1
2
๐’˜ ๐‘˜
๐‘‡ ๐‘ซ ๐‘˜
โˆ’1
๐’˜ ๐‘˜}
(
1
(2๐œ‹)
๐‘˜โˆ’1
2 |๐‘ซ ๐‘˜โˆ’1|
1
2
๐‘’
{โˆ’
1
2
๐’˜ ๐‘˜โˆ’1
๐‘‡ ๐‘ซ ๐‘˜โˆ’1
โˆ’1 ๐’˜ ๐‘˜โˆ’1} 1
(2๐œ‹)
1
2
๐‘’
{โˆ’
1
2
๐‘ฆk
2}
)
=
๐œ™1(๐‘ฆ ๐‘˜)|๐‘ซ ๐‘˜โˆ’1|
1
2 ๐‘’โˆ’
1
2
(๐’˜ ๐‘˜
๐‘ป ๐‘ซ ๐‘˜
โˆ’1
๐’˜ ๐‘˜โˆ’๐’˜ ๐‘˜โˆ’1
๐‘ป ๐‘ซ ๐‘˜โˆ’1
โˆ’1
๐’˜ ๐‘˜โˆ’1โˆ’๐‘ฆk
2)
|๐‘ซ ๐‘˜|
1
2
.โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก(3. 1)
Untuk mendapatkan taksiran terbaik dari ๐‘ฅ ๐‘˜, akan dicari nilai ๐‘ฆ ๐‘˜ yang me-
maksimumkan densitas bersyarat pada persamaan 3.1. Sesuai dengan pembahasan
pada bab 2.5.1, titik maksimum dari fungsi densitas distribusi normal merupakan
titik stasioner. Dengan demikian, nilai ๐‘ฆ ๐‘˜ yang memaksimumkan densitas ber-
syarat pada persamaan 3.1 ialah titik yang memenuhi persamaan berikut:
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
Bab 3 Model Imputasi
26
๐‘‘๐‘“(๐‘ฆ ๐‘˜|๐‘ฏ; ๐‘ซ ๐‘˜)
๐‘‘๐‘ฆ ๐‘˜
= 0.โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก(3. 2)
Untuk mempermudah mencari titik stasioner dengan menggunakan formula 3.2
akan dicari bentuk sederhana dari ๐’˜ ๐‘˜
๐‘ป
๐‘ซ ๐‘˜
โˆ’1
๐’˜ ๐‘˜ โˆ’ ๐’˜ ๐‘˜โˆ’1
๐‘ป
๐‘ซ ๐‘˜โˆ’1
โˆ’1
๐’˜ ๐‘˜โˆ’1. Penyeder-
hanaan ini digunakan untuk memisahkan ๐‘ฆ ๐‘˜ dari matriks ๐’˜ ๐‘˜. Selain itu, akan
dicari bentuk sederhana dari
โก|๐‘ซ ๐‘˜โˆ’1|
1
2
|๐‘ซ ๐‘˜|
1
2
. Untuk mencari bentuk sederhana dari
|๐‘ซ ๐‘˜โˆ’1|
1
2
|๐‘ซ ๐‘˜|
1
2
,
mula-mula ๐‘ซ ๐‘˜ dituliskan dalam bentuk matriks partisi, sehingga
|๐‘ซ ๐‘˜โˆ’1|
1
2
|๐‘ซ ๐‘˜|
1
2
dapat
dituliskan dalam bentuk berikut:
|๐‘ซ ๐‘˜โˆ’1|
1
2
|๐‘ซ ๐‘˜|
1
2
=
|๐‘ซ ๐‘˜โˆ’1|
1
2
|
๐‘ซ ๐‘˜โˆ’1 ๐’“
๐’“ ๐‘‡ 1
|
1
2
= (
|
๐‘ซ ๐‘˜โˆ’1 ๐’“
๐’“ ๐‘‡
1
|
|๐‘ซ ๐‘˜โˆ’1|
)
โˆ’
1
2
โก.โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก(3. 3)
Selanjutnya, akan dicari nilai dari |
๐‘ซ ๐‘˜โˆ’1 ๐’“
๐’“ ๐‘‡
1
| terlebih dahulu. Sesuai de-
ngan Silvester (1999),
(
๐‘ซ ๐‘˜โˆ’1 ๐’“
๐’“ ๐‘‡
1
) (
๐‘ฐ ๐‘˜โˆ’1 ๐ŸŽ ๐‘˜โˆ’1,1
โˆ’๐’“ ๐‘‡
1
) = (
๐‘ซ ๐‘˜โˆ’1 โˆ’ ๐’“๐’“ ๐‘‡
๐’“
๐ŸŽ1,๐‘˜โˆ’1 1
).
Kemudian, dengan mengaplikasikan determinan terhadap kedua ruas, diperoleh
|
๐‘ซ ๐‘˜โˆ’1 ๐’“
๐’“ ๐‘‡
1
| |
๐‘ฐ ๐‘˜โˆ’1 ๐ŸŽ ๐‘˜โˆ’1,1
โˆ’๐’“ ๐‘‡
1
| = |
๐‘ซ ๐‘˜โˆ’1 โˆ’ ๐’“๐’“ ๐‘‡
๐’“
๐ŸŽ1,๐‘˜โˆ’1 1
|
โก|
๐‘ซ ๐‘˜โˆ’1 ๐’“
๐’“ ๐‘‡
1
| 1 = |
๐‘ซ ๐‘˜โˆ’1 โˆ’ ๐’“๐’“ ๐‘‡
๐’“
๐ŸŽ1,๐‘˜โˆ’1 1
|
|
๐‘ซ ๐‘˜โˆ’1 ๐’“
๐’“ ๐‘‡
1
| = |๐‘ซ ๐‘˜โˆ’1 โˆ’ ๐’“๐’“ ๐‘‡|.โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก(3. 4)
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
Bab 3 Model Imputasi
27
Dengan menggunakan persamaan 3.3 dan 3.4, maka bentuk sederhana dari
|๐‘ซ ๐‘˜โˆ’1|
1
2
|๐‘ซ ๐‘˜|
1
2
adalah
|๐‘ซ ๐‘˜โˆ’1|
1
2
|๐‘ซ ๐‘˜|
1
2
โก= {|๐‘ซ ๐‘˜โˆ’1 โˆ’ ๐’“๐’“ ๐‘‡|โกโก|๐‘ซ ๐‘˜โˆ’1|โˆ’1}โˆ’
1
2
=โก{|๐‘ซ ๐‘˜โˆ’1 โˆ’ ๐’“๐’“ ๐‘‡|โก|๐‘ซ ๐‘˜โˆ’1
โˆ’1 |}โˆ’โก
1
2
= |(๐‘ซ ๐‘˜โˆ’1 โˆ’ ๐’“๐’“ ๐‘‡
)(๐‘ซ ๐‘˜โˆ’1
โˆ’1
)|โˆ’
1
2โก
= |1 โˆ’ ๐’“ ๐‘‡
โก๐‘ซ ๐‘˜โˆ’1
โˆ’1
๐’“|โˆ’
1
2
= (1 โˆ’ ๐’“ ๐‘ป
โก๐‘ซ ๐’Œโˆ’๐Ÿ
โˆ’๐Ÿ
๐’“)
โˆ’โก
1
2.โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก(3. 5)
Selanjutnya, akan dicari bentuk sederhana dari ๐’˜ ๐‘˜
๐‘ป
๐‘ซ ๐‘˜
โˆ’1
๐’˜ ๐‘˜ โˆ’ ๐’˜ ๐‘˜โˆ’1
๐‘ป
๐‘ซ ๐‘˜โˆ’1
โˆ’1
๐’˜ ๐‘˜โˆ’1.
Sebagai langkah awal dari proses penyederhanaan, tuliskan ๐‘ซ ๐‘˜
โˆ’1
sebagai matriks
partisi yang memuat ๐‘ซ ๐‘˜โˆ’1
โˆ’1
, yaitu
๐‘ซ ๐‘˜
โˆ’1
= (
(๐‘ซ ๐‘˜โˆ’1 โˆ’ ๐’“๐’“ ๐‘‡)โˆ’1
โˆ’๐‘ซ ๐‘˜โˆ’1
โˆ’1
๐’“(1 โˆ’ ๐’“ ๐‘‡
๐‘ซ ๐‘˜โˆ’1
โˆ’1
๐’“)โˆ’1
โˆ’(1 โˆ’ ๐’“ ๐‘‡
๐‘ซ ๐‘˜โˆ’1
โˆ’1
๐’“)โˆ’1
๐’“ ๐‘‡
๐‘ซ ๐‘˜โˆ’1
โˆ’1
(1 โˆ’ ๐’“ ๐‘‡
๐‘ซ ๐‘˜โˆ’1
โˆ’1
๐’“)โˆ’1 ).โกโกโกโกโก(3. 6)
Penurunan persamaan 3.6 dapat dilihat pada Lampiran A.1. Kemudian dengan
menggunakan persamaan 3.5 dan 3.6, diperoleh
๐’˜ ๐‘˜
๐‘ป
๐‘ซ ๐‘˜
โˆ’1
๐’˜ ๐‘˜ โˆ’ ๐’˜ ๐‘˜โˆ’1
๐‘ป
๐‘ซ ๐‘˜โˆ’1
โˆ’1
๐’˜ ๐‘˜โˆ’1 =
(๐‘ฆ ๐‘˜ โˆ’ ๐’“ ๐‘‡
๐‘ซ ๐‘˜โˆ’1
โˆ’1
๐’˜ ๐‘˜โˆ’1)2
1 โˆ’ ๐’“ ๐‘‡โก๐‘ซkโˆ’1
โˆ’1
๐’“
โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก(3. 7)
(untuk lebih jelasnya, lihat Lampiran A.2). Selanjutnya, dengan mensubstitusikan
persamaan 3.7 dan 3.5 ke persamaan 3.1, diperoleh
๐‘“(๐‘ฆ ๐‘˜|๐‘ฏ; ๐‘ซ ๐‘˜) =
๐œ™1(๐‘ฆ ๐‘˜)โกexp {โˆ’
1
2
(
(๐‘ฆ ๐‘˜ โˆ’ ๐’“ ๐‘‡
๐‘ซ ๐‘˜โˆ’1
โˆ’1
๐’˜ ๐‘˜โˆ’1)2
1 โˆ’ ๐’“ ๐‘‡โก๐‘ซkโˆ’1
โˆ’1
๐‘Ÿ
โˆ’ ๐‘ฆk
2
)}
(1 โˆ’ ๐’“ ๐‘‡โก๐‘ซkโˆ’1
โˆ’1
๐ซ)
1
2
.โกโกโกโกโกโก(3. 8)
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
Bab 3 Model Imputasi
28
Karena persamaaan 3.8 memuat fungsi eksponen, maka untuk mempermudah
mencari turunan dari ๐‘“(๐‘ฆ ๐‘˜|๐‘ฏ; ๐‘ซ ๐‘˜) terhadap variabel ๐‘ฆ ๐‘˜, definisikan ๐‘™(๐‘ฆ ๐‘˜) =
ln ๐‘“(๐‘ฆ ๐‘˜|๐‘ฏ; ๐‘ซ ๐‘˜), sehingga
๐‘™(๐‘ฆ ๐‘˜) = ln (โก
๐‘’โˆ’
1
2
๐‘ฆk
2
(2๐œ‹)
1
2
) โˆ’
1
2
ln(1 โˆ’ ๐’“ ๐‘‡
โก๐‘ซkโˆ’1
โˆ’1
๐’“) โˆ’
1
2
(
(๐‘ฆ ๐‘˜ โˆ’ ๐’“ ๐‘‡
๐‘ซ ๐‘˜โˆ’1
โˆ’1
๐’˜ ๐‘˜โˆ’1)2
1 โˆ’ ๐’“ ๐‘‡โก๐‘ซkโˆ’1
โˆ’1
๐’“
โˆ’ ๐‘ฆk
2
)
= โˆ’
1
2
๐‘ฆk
2
โˆ’
1
2
ln(2ฯ€) โˆ’
1
2
lnโก(1 โˆ’ ๐’“ ๐‘‡
โก๐‘ซkโˆ’1
โˆ’1
๐’“) โˆ’
1
2
(
(๐‘ฆ ๐‘˜โˆ’๐’“ ๐‘‡ ๐‘ซ ๐‘˜โˆ’1
โˆ’1
๐’˜ ๐‘˜โˆ’1)
2
1โˆ’๐’“ ๐‘‡โก๐‘ซkโˆ’1
โˆ’1 ๐’“
โˆ’ ๐‘ฆk
2
).
Fungsi logaritma merupakan fungsi monoton naik murni, sehingga memak-
simumkan nilai suatu fungsi sama saja dengan memaksimumkan nilai dari
logaritma fungsi tersebut. Turunan dari ๐‘™(๐‘ฆ ๐‘˜) terhadap variabel ๐‘ฆ ๐‘˜ adalah
๐‘‘๐‘™(๐‘ฆ ๐‘˜)
๐‘‘๐‘ฆ ๐‘˜
=
โˆ’๐‘ฆ ๐‘˜ + ๐’“ ๐‘‡
๐‘ซ ๐‘˜โˆ’1
โˆ’1
๐’˜ ๐‘˜โˆ’1
1 โˆ’ ๐’“ ๐‘‡โก๐‘ซkโˆ’1
โˆ’1
๐‘Ÿ
.โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก(3. 9)
Sesuai dengan formula 3.2, dengan menyelesaikan persamaan
โˆ’๐‘ฆ ๐‘˜ + ๐’“ ๐‘‡
๐‘ซ ๐‘˜โˆ’1
โˆ’1
๐’˜ ๐‘˜โˆ’1
1 โˆ’ ๐’“ ๐‘‡โก๐‘ซkโˆ’1
โˆ’1
๐‘Ÿ
= 0,
diperoleh titik stasioner dari fungsi ๐‘“(๐‘ฆ ๐‘˜|๐‘ฏ; ๐‘ซ ๐‘˜), yaitu
๐‘ฆ ๐‘˜ = ๐’“ ๐‘‡
๐‘ซ ๐‘˜โˆ’1
โˆ’1
๐’˜ ๐‘˜โˆ’1.
Teorema pada sub bab 2.5 menyatakan bahwa titik maksimum akan di-
dapatkan apabila grafik ๐‘™(๐‘ฆ ๐‘˜) terbuka ke bawah, sehingga turunan kedua dapat
dimanfaatkan untuk menentukan apakah โก๐‘ฆ ๐‘˜ = ๐’“ ๐‘‡
๐‘ซ ๐‘˜โˆ’1
โˆ’1
๐’˜ ๐‘˜โˆ’1 adalah titik maksi-
mum. Berikut turunan kedua dari fungsi ๐‘™(๐‘ฆ ๐‘˜) terhadap ๐‘ฆ ๐‘˜:
๐‘‘2
๐‘™(๐‘ฆ ๐‘˜)
๐‘‘๐‘ฆ ๐‘˜
2 =โก
โˆ’1
1 โˆ’ ๐’“ ๐‘‡โก๐‘ซkโˆ’1
โˆ’1
๐’“
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
Bab 3 Model Imputasi
29
Akan dibuktikan bahwa โˆ’(1 โˆ’ ๐’“ ๐‘‡
โก๐‘ซkโˆ’1
โˆ’1
๐’“)
โˆ’1
selalu bernilai negatif. Sesuai de-
ngan persamaan 3.5,
1
1 โˆ’ ๐’“ ๐‘‡โก๐‘ซkโˆ’1
โˆ’1
๐’“
=โก
|๐‘ซ ๐‘˜โˆ’1|
|๐‘ซ ๐‘˜|
(1 โˆ’ ๐’“ ๐‘‡
โก๐‘ซkโˆ’1
โˆ’1
๐’“)โก|๐‘ซ ๐‘˜โˆ’1| =โก|๐‘ซ ๐‘˜|.โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก(3. 10)
Persamaan 3.10 dapat dimanfaatkan untuk mengetahui rentang nilai dari
(1 โˆ’ ๐’“ ๐‘‡
โก๐‘ซkโˆ’1
โˆ’1
๐’“)
โˆ’1
. Akan dicari terlebih dahulu rentang nilai untuk |๐‘ซ ๐‘˜|โก, |๐‘ซ ๐‘˜โˆ’1|โก,
dan ๐’“ ๐‘‡
โก๐‘ซkโˆ’1
โˆ’1
๐’“. Misal ๐’š = ๐‘ซ ๐‘˜โˆ’1
โˆ’1
๐’“. Karena matriks ๐‘ซ ๐‘˜โˆ’1 bersifat definit positif dan
simetri, maka berlaku
๐’š ๐‘‡
๐‘ซ ๐‘˜โˆ’1 ๐’š > 0
(๐‘ซ ๐‘˜โˆ’1
โˆ’1
๐’“) ๐‘‡
โก๐‘ซ ๐‘˜โˆ’1โก(๐‘ซ ๐‘˜โˆ’1
โˆ’1
๐’“) > 0โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก
(๐‘ซ ๐‘˜โˆ’1
โˆ’1
๐’“) ๐‘‡
โกโก๐’“ > 0โกโกโกโกโกโก
๐’“ ๐‘‡
๐‘ซ ๐‘˜โˆ’1
โˆ’1
โกโก๐’“ > 0.
Kemudian karena ๐‘ซ ๐‘˜ merupakan matriks definit positif, maka |๐‘ซ ๐‘˜|, |๐‘ซ ๐‘˜โˆ’1| > 0,
sehingga selang nilai yang mungkin dari 1 โˆ’ ๐’“ ๐‘‡
โก๐‘ซkโˆ’1
โˆ’1
๐’“ ialah
0 < 1 โˆ’ ๐’“ ๐‘‡
โก๐‘ซkโˆ’1
โˆ’1
๐’“ < 1.
Dengan demikian, โˆ’(1 โˆ’ ๐’“ ๐‘‡
โก๐‘ซkโˆ’1
โˆ’1
๐’“โก)
โˆ’1
selalu bernilai negatif untuk sebarang
matriks korelasi. Dapat disimpulkan bahwa ๐‘ฆ ๐‘˜ = ๐’“ ๐‘‡
๐‘ซ ๐‘˜โˆ’1
โˆ’1
๐’˜ ๐‘˜โˆ’1 adalah titik di-
mana fungsi densitas ๐‘“(๐‘ฆ ๐‘˜|๐‘ฏ; ๐‘ซ ๐‘˜) mencapai nilai maksimum. Karena telah
memenuhi kriteria penaksir untuk ๐‘ฆ ๐‘˜, maka taksiran dari ๐‘ฆ ๐‘˜ adalah
๐‘ฆ ๐‘˜ฬ‚ = ๐’“ ๐‘‡
๐‘ซ ๐‘˜โˆ’1
โˆ’1
๐’˜ ๐‘˜โˆ’1.โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก(3. 11)
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
Bab 3 Model Imputasi
30
Dengan demikian, formula umum imputasi untuk ๐‘ฅ ๐‘˜ adalah
๐‘ฅ ๐‘˜ฬ‚ โก= ๐น๐‘˜
โˆ’1
(ฮฆ1(๐‘ฆ ๐‘˜ฬ‚))
โกโก=โก ๐น๐‘˜
โˆ’1
(ฮฆ1(๐’“ ๐‘‡
๐‘ซ ๐‘˜โˆ’1
โˆ’1
๐’˜ ๐’Œโˆ’๐Ÿ)).โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก(3. 12)
3.2 Struktur Korelasi
Untuk menaksir nilai ๐‘ฆ ๐‘˜ menggunakan formula 3.11, dibutuhkan matriks ๐’“ ๐‘‡
yang
memuat korelasi antara variabel pada vektor acak historis dengan ๐‘Œ๐‘˜. Karena ๐‘Œ๐‘˜
merupakan variabel acak yang memuat sampel tak terobservasi, korelasi sampel
tidak dapat dihitung.
Salah satu cara agar korelasi sampel dapat dihitung ialah dengan menge-
luarkan seluruh data subjek tak terobservasi dari perhitungan. Namun, karena
karakteristik dari subjek yang mengalami dropout mungkin saja berbeda dari
subjek yang tidak mengalami dropout, korelasi sampel yang dihitung dari subjek
yang tidak mengalami dropout dapat menyebabkan bias pada hasil imputasi.
Tanpa mengeluarkan subjek dengan dropout dari perhitungan, matriks korelasi
dapat ditaksir dengan mengasumsikan struktur korelasi tertentu. Apabila struktur
korelasi telah diasumsikan, taksiran matriks ๐’“ ๐‘‡
dapat ditentukan setelah matriks
korelasi historis, ๐‘ซ ๐‘˜โˆ’1 ditaksir.
3.2.1 Struktur Korelasi Compound Symmetry
Matriks dengan struktur compound symmetry (CS) memiliki nilai 1 pada seluruh
elemen diagonalnya dan memiliki nilai konstan untuk elemen lainnya. Apabila
matriks korelasi mengikuti struktur matriks CS, maka korelasi antara dua variabel
acak yang berbeda selalu bernilai sama.
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
Bab 3 Model Imputasi
31
Apabila ๐œŒ didefinisikan sebagai koefisien korelasi, bentuk matriks ๐‘ซ ๐‘˜โˆ’1
dibawah struktur CS adalah
๐‘ซ ๐‘˜โˆ’1
๐ถ๐‘†
= (
1 ๐œŒ โ€ฆ ๐œŒ
๐œŒ โ‹ฑ โ‹ฑ โ‹ฎ
โ‹ฎ โ‹ฑ 1 ๐œŒ
๐œŒ โ€ฆ ๐œŒ 1
)โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก๐’“ ๐ถ๐‘†
= (
๐œŒ
โ‹ฎ
๐œŒ
).
Untuk mencari nilai taksiran ๐‘ฆ ๐‘˜ dengan menggunakan formula 3.11 akan
dicari terlebih dahulu invers dari matriks ๐‘ซ ๐‘˜โˆ’1
๐ถ๐‘†
. Matriks ๐‘ซ ๐‘˜โˆ’1
๐ถ๐‘†
dapat dituliskan
sebagai berikut:
๐‘ซ ๐‘˜โˆ’1
๐ถ๐‘†
= ๐œŒโก๐Ÿ ๐‘˜โˆ’1 + (1 โˆ’ ๐œŒ)๐‘ฐ ๐‘˜โˆ’1.
Dengan demikian, (๐‘ซ ๐‘˜โˆ’1
๐ถ๐‘†
)โˆ’1
dapat diperoleh dengan menggunakan persamaan be-
rikut:
โก๐œŒโก๐Ÿ ๐‘˜โˆ’1(๐‘ซ ๐‘˜โˆ’1
๐ถ๐‘†
)โˆ’1
+ (1 โˆ’ ๐œŒ)(๐‘ซ ๐‘˜โˆ’1
๐ถ๐‘†
)โˆ’1
= ๐‘ฐ ๐‘˜โˆ’1.โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก(3. 13)
Dengan menggunakan persamaan 3.13 dan persamaan
(๐Ÿ ๐‘˜โˆ’1)2
= (๐‘˜ โˆ’ 1)(๐Ÿ ๐‘˜โˆ’1),
akan dicari terlebih dahulu bentuk lain dari ๐Ÿ ๐‘˜โˆ’1(๐‘ซ ๐‘˜โˆ’1
๐ถ๐‘†
)โˆ’1
.
๐œŒ(๐‘˜ โˆ’ 1)๐Ÿ ๐‘˜โˆ’1(๐‘ซ ๐‘˜โˆ’1
๐ถ๐‘†
)โˆ’1
+ (1 โˆ’ ๐œŒ)๐Ÿ ๐‘˜โˆ’1(๐‘ซ ๐‘˜โˆ’1
๐ถ๐‘†
)โˆ’1
= ๐Ÿ ๐‘˜โˆ’1
โกโก๐Ÿ ๐‘˜โˆ’1(๐‘ซ ๐‘˜โˆ’1
๐ถ๐‘†
)โˆ’1
=
๐Ÿ ๐‘˜โˆ’1
(1 โˆ’ 2๐œŒ + ๐‘˜๐œŒ)
โกโกโกโกโกโกโกโกโกโกโกโก(3. 14)
Dengan mensubstitusikan persamaan 3.14 ke persamaan 3.13, diperoleh
๐œŒโก
๐Ÿ ๐‘˜โˆ’1
(1 โˆ’ 2๐œŒ + ๐‘˜๐œŒ)
+ (1 โˆ’ ๐œŒ)(๐‘ซ ๐‘˜โˆ’1
๐ถ๐‘†
)โˆ’1
= ๐‘ฐ ๐‘˜โˆ’1
(๐‘ซ ๐‘˜โˆ’1
๐ถ๐‘†
)โˆ’1
=
๐‘ฐ ๐‘˜โˆ’1 โˆ’ ๐œŒโก
๐Ÿ ๐‘˜โˆ’1
(1 โˆ’ 2๐œŒ + ๐‘˜๐œŒ)
(1 โˆ’ ๐œŒ)
โก.โกโกโกโกโกโกโกโกโกโกโกโกโก(3. 15)
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
Bab 3 Model Imputasi
32
Untuk menyederhanakan formula imputasi, misalkan ๐‘Ž dan b berturut-
turut menyatakan elemen diagonal dan off-diagonal dari matriks (๐‘ซ ๐‘˜โˆ’1
๐ถ๐‘†
)โˆ’1
. De-
ngan demikian,
๐‘ฆ ๐‘˜
๐ถ๐‘†ฬ‚ โกโก= (๐’“ ๐‘˜โˆ’1
๐ถ๐‘†
) ๐‘‡(๐‘ซ ๐‘˜โˆ’1
๐ถ๐‘†
)โˆ’1
๐’˜ ๐‘˜โˆ’1
= (๐œŒ, โ€ฆ , ๐œŒ) (
๐‘Ž ๐‘ โ€ฆ ๐‘
๐‘ ๐‘Ž โ‹ฑ ๐‘
โ‹ฎ โ‹ฑ โ‹ฑ โ‹ฎ
๐‘ ๐‘ โ€ฆ ๐‘Ž
) (
๐‘ฆ1
โ‹ฎ
โ‹ฎ
๐‘ฆ ๐‘˜โˆ’1
)
= ๐œŒ(๐‘Ž + (๐‘˜ โˆ’ 2)๐‘ โ€ฆ ๐‘Ž + (๐‘˜ โˆ’ 2)๐‘) (
๐‘ฆ1
โ‹ฎ
โ‹ฎ
๐‘ฆ ๐‘˜โˆ’1
).โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก(3. 16)
Dengan menggunakan persamaan 3.15 diperoleh
๐‘Ž =
1
(1 โˆ’ ๐œŒ)
โˆ’
๐œŒ
(1 โˆ’ ๐œŒ)(1 โˆ’ 2๐œŒ + ๐‘˜๐œŒ)
= 1 +
(๐‘˜ โˆ’ 2)๐œŒ2
1 โˆ’ (๐‘˜ โˆ’ 2)๐œŒ2 + (๐‘˜ โˆ’ 3)๐œŒ
๐‘ = โˆ’
๐œŒ
(1 โˆ’ ๐œŒ)(๐œŒโก๐‘˜ + 1 โˆ’ 2๐œŒ)
=โกโˆ’
๐œŒ
1 โˆ’ (๐‘˜ โˆ’ 2)๐œŒ2 + (๐‘˜ โˆ’ 3)๐œŒ
,โกโกโกโกโกโกโก
sehingga
๐‘Ž + (๐‘˜ โˆ’ 2)๐‘โก = 1 +
(๐‘˜ โˆ’ 2)๐œŒ2
1 โˆ’ (๐‘˜ โˆ’ 2)๐œŒ2 + (๐‘˜ โˆ’ 3)๐œŒ
โˆ’
(๐‘˜ โˆ’ 2)๐œŒ
1 โˆ’ (๐‘˜ โˆ’ 2)๐œŒ2 + (๐‘˜ โˆ’ 3)๐œŒ
=
1 + (๐‘˜ โˆ’ 3)๐œŒ โˆ’ (๐‘˜ โˆ’ 2)๐œŒ
1 โˆ’ (๐‘˜ โˆ’ 2)๐œŒ2 + (๐‘˜ โˆ’ 3)๐œŒ
=
โˆ’(๐œŒ โˆ’ 1)
โˆ’(๐‘˜ โˆ’ 2)๐œŒ2 + (๐‘˜ โˆ’ 3)๐œŒ + 1
=
1
1 + (๐‘˜ โˆ’ 2)๐œŒ
.โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก(3. 17)
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
Bab 3 Model Imputasi
33
Kemudian, dengan mensubstitusikan persamaan 3.17 ke persamaan 3.16, diper-
oleh
๐‘ฆ ๐‘˜
๐ถ๐‘†ฬ‚ = ๐œŒ (
1
1 + (๐‘˜ โˆ’ 2)๐œŒ
โ€ฆ
1
1 + (๐‘˜ โˆ’ 2)๐œŒ
) (
๐‘ฆ1
โ‹ฎ
โ‹ฎ
๐‘ฆ ๐‘˜โˆ’1
) =
๐œŒ
1 + (๐‘˜ โˆ’ 2)๐œŒ
โˆ‘ ๐‘ฆ๐‘—
๐‘˜โˆ’1
๐‘—=1
โก,โก
sehingga formula (model) imputasi untuk ๐‘ฅ ๐‘˜ dibawah asumsi struktur korelasi CS
adalah
๐‘ฅ ๐‘˜
๐ถ๐‘†ฬ‚ =โก ๐น๐‘˜
โˆ’1
(ฮฆ1 (
๐œŒ
1 + (๐‘˜ โˆ’ 2)๐œŒ
โˆ‘ ๐‘ฆ๐‘—
๐‘˜โˆ’1
๐‘—=1
)).โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก(3. 18)
3.2.2 Struktur Korelasi First Order Autoregressive
Struktur first order autoregressive (AR1) merupakan struktur matriks dengan 2
parameter. Nilai elemen pada matriks korelasi AR1 bergantung pada suatu
koefisien korelasi ๐œŒ dan selisih titik waktu pengukuran berdasarkan satuan
tertentu (lag). Korelasi antara dua variabel pengukuran pada titik waktu yang
berbeda akan semakin menurun apabila rentang waktu pengukuran semakin besar.
Bentuk matriks ๐‘ซ ๐‘˜โˆ’1 dibawah struktur AR1 adalah
๐‘ซ ๐‘˜โˆ’1
๐ด๐‘…1
=
(
1 ๐œŒ ๐œŒ2
โ€ฆ ๐œŒ ๐‘˜โˆ’2
๐œŒ 1 ๐œŒ โ€ฆ ๐œŒ ๐‘˜โˆ’3
๐œŒ2
๐œŒ 1 โ€ฆ ๐œŒ ๐‘˜โˆ’4
โ‹ฎ โ‹ฎ โ‹ฑ โ‹ฎ
๐œŒ ๐‘˜โˆ’2
๐œŒ ๐‘˜โˆ’3
๐œŒ ๐‘˜โˆ’4
โ€ฆ 1 )
โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก๐’“ ๐ด๐‘…1
=
(
๐œŒ ๐‘˜โˆ’1
๐œŒ ๐‘˜โˆ’2
โ‹ฎ
โ‹ฎ
๐œŒ )
.
Untuk mencari nilai taksiran ๐‘ฆ ๐‘˜ dengan menggunakan formula 3.11 akan dicari
terlebih dahulu invers dari matriks korelasi AR1, yaitu (๐‘ซ ๐‘˜โˆ’1
๐ด๐‘…1)โˆ’1
.
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
Bab 3 Model Imputasi
34
Berdasarkan Kac dkk (1953), invers dari matriks korelasi AR1 adalah
(๐‘ซ ๐‘˜โˆ’1
๐ด๐‘…1
โก)
โˆ’1
=
1
๐œŒ2 โˆ’ 1
(
โˆ’1 โกโกโกโกโก๐œŒ 0
๐œŒ โˆ’(1 + ๐œŒ2
) ๐œŒ
0 โกโกโกโกโก๐œŒ โˆ’(1 + ๐œŒ2
)
โ€ฆ 0โก 0
โ€ฆ 0โก 0
โ€ฆ 0โก 0
โกโกโกโกโกโก
0โกโกโกโกโกโก 0โกโกโกโกโกโกโก ๐œŒโกโกโกโกโกโกโก
โ‹ฎโกโกโกโกโกโก โ‹ฎโกโกโกโกโกโกโก โ‹ฎโกโกโกโกโกโกโก
0
0
โกโกโกโกโกโก
0
0
โกโกโกโกโกโกโก
0
0
โกโกโกโกโกโกโก
โกโก
โ€ฆ 0 0
โ‹ฑ โ‹ฎ โ‹ฎ
โ€ฆ
โ€ฆ
โˆ’(1 + ๐œŒ2
)
๐œŒ
๐œŒ
โˆ’1 )
.โกโก
Dengan memanfaatkan (๐‘ซ ๐‘˜โˆ’1
๐ด๐‘…1
โก)โˆ’1
, akan dicari terlebih dahulu taksiran ๐‘ฆ ๐‘˜ di
bawah struktur AR1.
๐‘ฆ ๐‘˜
๐ด๐‘…1ฬ‚ โกโกโก= (๐’“ ๐‘˜โˆ’1
๐ด๐‘…1) ๐‘‡(๐‘ซ ๐‘˜โˆ’1
๐ด๐‘…1
โก)โˆ’1
โก๐’š ๐‘˜โˆ’1
โกโก=
1
๐œŒ2 โˆ’ 1
( ๐œŒ ๐‘˜โˆ’1
๐œŒ ๐‘˜โˆ’2 โ€ฆ ๐œŒ)
ร—
(
โˆ’1 โกโกโกโกโก๐œŒ 0
๐œŒ โˆ’(1 + ๐œŒ2
) ๐œŒ
0 โกโกโกโกโก๐œŒ โˆ’(1 + ๐œŒ2
)
โ€ฆ 0โก 0
โ€ฆ 0โก 0
โ€ฆ 0โก 0
โกโกโกโกโกโก
0โกโกโกโกโกโก 0โกโกโกโกโกโกโก ๐œŒโกโกโกโกโกโกโก
โ‹ฎโกโกโกโกโกโก โ‹ฎโกโกโกโกโกโกโก โ‹ฎโกโกโกโกโกโกโก
0
0
โกโกโกโกโกโก
0
0
โกโกโกโกโกโกโก
0
0
โกโกโกโกโกโกโก
โกโกโก
โ€ฆ 0 0
โ‹ฑ โ‹ฎ โ‹ฎ
โ€ฆ
โ€ฆ
โˆ’(1 + ๐œŒ2
)
๐œŒ
๐œŒ
โˆ’1 )
(
๐‘ฆ1
โ‹ฎ
โ‹ฎ
๐‘ฆ ๐‘˜โˆ’1
)
โกโก=
1
๐œŒ2 โˆ’ 1
(๐‘Ž1 ๐‘Ž2
โ€ฆ ๐‘Ž ๐‘˜โˆ’1) (
๐‘ฆ1
โ‹ฎ
โ‹ฎ
๐‘ฆ ๐‘˜โˆ’1
),
dimana ๐‘Ž1 = โˆ’๐œŒ ๐‘˜โˆ’1
+ ๐œŒ(๐œŒ ๐‘˜โˆ’2) = 0
๐‘Ž๐‘– = ๐œŒ(๐œŒ ๐‘˜โˆ’๐‘–+1
) โˆ’ (1 + ๐œŒ2)๐œŒ ๐‘˜โˆ’๐‘–
+ ๐œŒ(๐œŒ ๐‘˜โˆ’๐‘–โˆ’1
) = 0,
untukโกโก๐‘– = 2, โ€ฆ ๐‘˜ โˆ’ 2
โกโก๐‘Ž ๐‘˜โˆ’1 = ๐œŒ(๐œŒ ๐‘˜โˆ’(๐‘˜โˆ’2)
) โˆ’ ๐œŒ = ๐œŒ3
โˆ’ ๐œŒ = ๐œŒ(๐œŒ2
โˆ’ 1).
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
Bab 3 Model Imputasi
35
Dengan demikian, taksiran untuk ๐‘ฆ ๐‘˜ dibawah struktur AR1 adalah
๐‘ฆ ๐‘˜
๐ด๐‘…1ฬ‚ โก= (๐’“ ๐‘˜โˆ’1
๐ด๐‘…1) ๐‘‡(๐‘ซ ๐‘˜โˆ’1
๐ด๐‘…1
โก)โˆ’1
โก๐’š ๐‘˜โˆ’1
=
1
๐œŒ2 โˆ’ 1
๐œŒ(๐œŒ2
โˆ’ 1)๐‘ฆ ๐‘˜โˆ’1
= ๐œŒ๐‘ฆ ๐‘˜โˆ’1,โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก(3. 19)
sehingga formula imputasi untuk ๐‘ฅ ๐‘˜ dibawah asumsi struktur korelasi AR1 adalah
๐‘ฅ ๐‘˜
๐ด๐‘…1ฬ‚ =โก ๐น๐‘˜
โˆ’1
(ฮฆ1(๐œŒ๐‘ฆ ๐‘˜โˆ’1)).โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก(3. 20)
Dari persamaan 3.19, dapat dilihat bahwa nilai ๐‘ฆ ๐‘˜
๐ด๐‘…1ฬ‚ hanya bergantung
pada ๐œŒ dan ๐‘ฆ ๐‘˜โˆ’1. Dengan demikian, distribusi ๐‘Œ๐‘˜|๐‘Œ๐‘˜โˆ’1 dapat digunakan sebagai
salah satu model penaksir ๐‘ฆ ๐‘˜. Misalkan (๐‘Œ๐‘˜โˆ’1, ๐‘Œ๐‘˜) ๐‘‡
berdistribusi bivariat normal
dengan
๐ = (
๐œ‡ ๐‘˜โˆ’1
๐œ‡ ๐‘˜
)โกโกโกโกโกโกdanโกโกโกโก๐šบ = (
๐œŽ๐‘˜โˆ’1
2
๐œŒ๐œŽ๐‘˜โˆ’1 ๐œŽ๐‘˜
๐œŒ๐œŽ๐‘˜โˆ’1 ๐œŽ๐‘˜ ๐œŽ๐‘˜
2 ).
Dengan demikian, sesuai dengan teorema mengenai distribusi bersyarat yang
dibangun dari distribusi multivariat normal (lihat referensi Hogg dan Craig, 2005),
๐‘Œ๐‘˜|๐‘Œ๐‘˜โˆ’1~๐‘2 (๐œ‡ ๐‘˜ +
๐œŒ๐œŽ๐‘˜
๐œŽ๐‘˜โˆ’1
โก(๐‘ฆ ๐‘˜โˆ’1 โˆ’ ๐œ‡ ๐‘˜โˆ’1), ๐œŽ๐‘˜
2
(1 โˆ’ ๐œŒ2
)),
sehingga taksiran ๐‘ฆ ๐‘˜ juga dapat diperoleh dengan menggunakan formula berikut:
๐‘ฆ ๐‘˜
๐ด๐‘…1๐‘›ฬ‚ โก= ๐ธ(๐‘Œ๐‘˜|๐‘Œ๐‘˜โˆ’1)ฬ‚
= ๐‘Œฬ…๐‘˜ + ๐œŒ
๐‘  ๐‘˜
๐‘  ๐‘˜โˆ’1
โก(๐‘ฆ ๐‘˜โˆ’1 โˆ’ ๐‘Œฬ…๐‘˜โˆ’1),โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก
dengan
๐‘Œฬ…๐‘˜ : rataan dari sampel yang terobservasi pada waktu ๐‘˜,
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
Bab 3 Model Imputasi
36
๐‘Œฬ…๐‘˜โˆ’1 : rataan dari sampel yang terobservasi pada waktu (๐‘˜ โˆ’ 1),
๐‘  ๐‘˜โก : deviasi standar dari sampel yang terobservasi pada waktu ๐‘˜,
๐‘  ๐‘˜โˆ’1 : deviasi standar dari sampel yang terobservasi pada waktu (๐‘˜ โˆ’ 1),
๐œŒ : koefisien korelasi dibawah struktur AR1.
Dapat disimpulkan bahwa imputasi untuk ๐‘ฅ ๐‘˜ dibawah asumsi struktur korelasi
AR1 juga dapat diperoleh dengan menggunakan formula berikut:
๐‘ฅ ๐‘˜
๐ด๐‘…1๐‘›ฬ‚ =โก ๐น๐‘˜
โˆ’1
(ฮฆ1 (๐‘Œฬ…๐‘˜ + ๐œŒ
๐‘  ๐‘˜
๐‘  ๐‘˜โˆ’1
โก(๐‘ฆ ๐‘˜โˆ’1 โˆ’ ๐‘Œฬ…๐‘˜โˆ’1))).โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก(3. 21)
Apabila ๐‘  ๐‘˜ = ๐‘  ๐‘˜โˆ’1 dan ๐‘Œฬ…๐‘˜ = ๐‘Œฬ…๐‘˜โˆ’1 = 0, maka formula 3.21 akan sesuai dengan
formula 3.20.
3.2.3 Struktur Korelasi 1-Banded Toeplitz
Struktur korelasi Toeplitz dan banded Toeplitz memuat nilai korelasi berbeda un-
tuk tiap pasang variabel acak dengan rentang waktu yang berbeda. Selain itu,
struktur ini tidak mengharuskan nilai korelasinya merupakan pangkat dari korelasi
basis (misal ๐œŒ). Matriks Toeplitz bernilai konstan sepanjang diagonal paralel ter-
hadap diagonal utama.
Struktur banded Toeplitz dapat digunakan dengan asumsi bahwa terdapat
struktur markovian, yaitu observasi terakhir mempengaruhi beberapa observasi
berikutnya (sejauh ๐‘˜โˆ—
). Misal ๐‘˜โˆ—
= 1, maka hanya 2 observasi yang berturutan
yang memiliki kebergantungan, sedemikian sehingga untuk ๐‘— = 1, โ€ฆ , ๐‘˜ โˆ’ 2,
๐ท๐‘—,๐‘—+1 = ๐œŒ. Struktur ini disebut 1-banded Toeplitz Structure (1BT).
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
Bab 3 Model Imputasi
37
Bentuk matriks ๐‘ซ ๐‘˜โˆ’1 dibawah struktur 1BT adalah
๐‘ซ ๐‘˜โˆ’1
1๐ต๐‘‡
=
(
1 ๐œŒ 0 โ€ฆ 0
๐œŒ 1 ๐œŒ โ‹ฑ โ‹ฎ
0 ๐œŒ โ‹ฑ โ‹ฑ 0
โ‹ฎ โ‹ฑ โ‹ฑ 1 ๐œŒ
0 โ€ฆ 0 ๐œŒ 1)
โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก๐‘Ÿ1๐ต๐‘‡
= (
0
โ‹ฎ
๐œŒ
)
Selanjutnya, akan dicari formula imputasi untuk ๐‘ฆ ๐‘˜ dibawah asumsi struktur 1BT.
Berdasarkan formula 3.11,
๐‘ฆ ๐‘˜
1๐ต๐‘‡ฬ‚ = ๐’“ ๐‘‡(๐‘ซ ๐‘˜โˆ’1
1๐ต๐‘‡)โˆ’1
๐‘ฆ ๐‘˜โˆ’1 = (0 โ€ฆ ๐œŒ)โก(๐‘ซ ๐‘˜โˆ’1
1๐ต๐‘‡)โˆ’1
โก(
๐‘ฆ1
โ‹ฎ
โ‹ฎ
๐‘ฆ ๐‘˜โˆ’1
).
Misal ( ๐‘Ž1 โ€ฆ ๐‘Ž ๐‘˜โˆ’1) merupakan baris terakhir dari matriks (๐‘ซ ๐‘˜โˆ’1
1๐ต๐‘‡)โˆ’1
, maka
โก๐‘ฆ ๐‘˜
1๐ต๐‘‡ฬ‚ = (๐œŒ๐‘Ž1 ๐œŒ๐‘Ž2 โ€ฆ ๐œŒ๐‘Ž ๐‘˜โˆ’1)โก(
๐‘ฆ1
โ‹ฎ
โ‹ฎ
๐‘ฆ ๐‘˜โˆ’1
),โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก(3. 22)
dengan
๐œŒ๐‘Ž ๐‘— = ๐œŒ(โˆ’1) ๐‘˜โˆ’1+๐‘— 1
|๐‘ซ ๐‘˜โˆ’1
1๐ต๐‘‡|
|
๐‘ซ๐‘—โˆ’1
1๐ต๐‘‡
๐‘œ
๐ด ๐‘ฉ
|.
๐‘ฉ merupakan matriks segitiga bawah berukuran (๐‘˜ โˆ’ 1 โˆ’ ๐‘—) dengan diagonal
utama ๐œŒ, sehingga
๐œŒ๐‘Ž ๐‘— = ๐œŒ(โˆ’1) ๐‘˜โˆ’1+๐‘—
1
|๐‘ซ ๐‘˜โˆ’1
1๐ต๐‘‡ |
๐‘‘๐‘’๐‘ก |
๐‘ซ๐‘—โˆ’1
1๐ต๐‘‡
๐‘œ
๐ด ๐‘ฉ
|
โก= ๐œŒ(โˆ’1) ๐‘˜โˆ’1+๐‘—
1
|๐‘ซ ๐‘˜โˆ’1
1๐ต๐‘‡|
|๐‘ซ๐‘—โˆ’1
1๐ต๐‘‡
||๐ต|
โก= ๐œŒ(โˆ’1) ๐‘˜โˆ’1+๐‘—
1
|๐‘ซ ๐‘˜โˆ’1
1๐ต๐‘‡|
|๐‘ซ๐‘—โˆ’1
1๐ต๐‘‡
|โก๐œŒ ๐‘˜โˆ’1โˆ’๐‘—
โก=โก(โˆ’1) ๐‘˜โˆ’๐‘—+1
1
|๐‘ซ ๐‘˜โˆ’1
1๐ต๐‘‡ |
|๐‘ซ๐‘—โˆ’1
1๐ต๐‘‡
|โก๐œŒ ๐‘˜โˆ’๐‘—
โก.โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก(3. 23)
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
Bab 3 Model Imputasi
38
Dengan menggunakan persamaan 3.22 dan 3.23 diperoleh taksiran untuk ๐‘ฆ ๐‘˜
dibawah asumsi struktur korelasi 1BT, yaitu
โก๐‘ฆ ๐‘˜
1๐ต๐‘‡ฬ‚ =
1
|๐‘ซ ๐‘˜โˆ’1
1๐ต๐‘‡ |
โˆ‘ โก(โˆ’1) ๐‘˜โˆ’๐‘—+1
|๐‘ซ๐‘—โˆ’1
1๐ต๐‘‡
|โก๐œŒ ๐‘˜โˆ’๐‘—
๐‘˜โˆ’1
๐‘—=1
๐‘ฆ๐‘—.โก
Kemudian, dengan memanfaatkan metode kofaktor, determinan dari |๐‘ซ๐‘—โˆ’1
1๐ต๐‘‡
| dapat
dituliskan sebagai
|๐‘ซ๐‘—โˆ’1
1๐ต๐‘‡
| = 1โก|๐‘ซ๐‘—โˆ’2
1๐ต๐‘‡
| โˆ’ ๐œŒ |
๐œŒ ๐‘ช
๐‘œ ๐‘ซ๐‘—โˆ’2
1๐ต๐‘‡|.
Dengan demikian, determinan dari |๐‘ซ๐‘—โˆ’1
1๐ต๐‘‡
| dapat diperoleh secara rekursif
menggunakan formula
|๐‘ซ๐‘—โˆ’1
1๐ต๐‘‡
| = 1โก|๐‘ซ๐‘—โˆ’2
1๐ต๐‘‡
| โˆ’ ๐œŒ2
|๐‘ซ๐‘—โˆ’3
1๐ต๐‘‡
|โก,โกโกโกโก๐‘— = 3,4,5, โ€ฆ , ๐‘˜ โˆ’ 1,โกโกโกโกโกโกโกโกโกโกโกโกโก(3. 24)
dengan nilai awal |๐‘ซ0
1๐ต๐‘‡| = |๐‘ซ1
1๐ต๐‘‡| = 1. Imputasi ๐‘ฅ ๐‘˜ dibawah asumsi struktur ko-
relasi 1BT dapat diperoleh dengan menggunakan formula berikut:
โก๐‘ฅ ๐‘˜
1๐ต๐‘‡ฬ‚ =โก ๐น๐‘˜
โˆ’1
(ฮฆ1 (
1
|๐‘ซ ๐‘˜โˆ’1
1๐ต๐‘‡ |
โˆ‘ โก(โˆ’1) ๐‘˜โˆ’๐‘—+1
|๐‘ซ๐‘—โˆ’1
1๐ต๐‘‡
|โก๐œŒ ๐‘˜โˆ’๐‘—
๐‘˜โˆ’1
๐‘—=1
๐‘ฆ๐‘—)).โกโกโกโกโกโกโกโก(3. 25)
3.3 Penaksiran Parameter Koefisien Korelasi
Untuk masing-masing struktur, elemen dari matriks korelasi ๐‘ซ ๐‘˜ bergantung pada
koefisien korelasi ๐œŒ. Agar matriks korelasi ๐‘ซ ๐‘˜โˆ’1 dan ๐‘ซ ๐‘˜ memenuhi syarat definit
positif, untuk setiap struktur korelasi, interval dari nilai ๐œŒ yang memenuhi harus
dicari. Selain bergantung pada struktur matriks, interval ini bergantung pada uku-
ran matriks ๐‘ซ.
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
Bab 3 Model Imputasi
39
Suatu matriks bersifat definit positif jika dan hanya jika seluruh nilai
eigennya positif (lihat referensi Anton dan Rorres, 2005). Dengan demikian, in-
terval untuk ๐œŒ dapat diperoleh dengan melakukan pengecekan terhadap seluruh
nilai eigen untuk masing-masing ๐œŒ yang termuat pada interval [-1,1]. Berikut
disajikan tabel batas bawah dan batas atas interval dari masing-masing struktur
untuk beberapa ukuran matriks ๐‘ซ:
Tabel 3.2 Interval ๐œŒ untuk beberapa ukuran matriks ๐‘ซ.
Ukuran Matriks ๐‘ซ Struktur Batas Bawah Batas Atas
2
CS -0.9995 0.9995
AR1 -0.9995 0.9995
1BT -0.9995 0.9995
3
CS -0.4995 0.9995
AR1 -0.9995 0.9995
1BT -0.7070 0.7070
4
CS -0.333 0.9995
AR1 -0.9995 0.9995
1BT -0.6180 0.618
5
CS -0.2495 0.9995
AR1 -0.9995 0.9995
1BT -0.577 0.577
6
CS -0.2 0.9995
AR1 -0.9995 0.9995
1BT -0.5545 0.5545
Sesuai dengan Tabel 3.2, dapat dilihat bahwa semakin besar ukuran ma-
triks, panjang interval dari ๐œŒ yang memenuhi cenderung semakin sempit. Dengan
demikian, ukuran matriks yang dijadikan acuan untuk penentuan interval ialah ๐‘˜.
Setelah interval ๐œŒ diperoleh, ๐œŒฬ‚ untuk masing-masing struktur dapat diperoleh
dengan memilih salah satu nilai ๐œŒ pada interval tersebut. Pemilihan dilakukan
dengan mencari nilai ๐œŒ yang dapat memaksimumkan nilai fungsi likelihood dari
densitas copula sesuai persamaan berikut:
โˆ ๐‘ ๐‘”๐‘Ž๐‘ข๐‘ ๐‘ 
(๐‘ข๐‘–1, โ€ฆ , ๐‘ข๐‘–,๐‘˜โˆ’1)
๐‘›
๐‘–=1
= โˆ โก|๐‘ซkโˆ’1|โˆ’
1
2โกโก
๐‘›
๐‘–=1
๐‘’
(โˆ’โก
1
2
โก๐’˜๐‘–,๐‘˜โˆ’1
๐‘‡(๐‘ซkโˆ’1
โˆ’1
โˆ’๐šฐ)๐’˜ ๐‘–,๐‘˜โˆ’1)
.โกโก(3. 26)
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
Bab 3 Model Imputasi
40
Pada tugas akhir ini, nilai ๐œŒ yang memaksimumkan persamaan 3.26 diper-
oleh secara numerik. Misalkan ๐œŒ ๐ถ๐‘†ฬ‚ , โก๐œŒ ๐ด๐‘…1ฬ‚ dan โก๐œŒ1๐ต๐‘‡ฬ‚ berturut turut merupakan
taksiran koefisien korelasi untuk struktur CS, AR1, dan 1BT, maka taksiran ๐‘ฅ ๐‘˜
dengan menggunakan formula 3.18, 3.20, 3.21 dan 3.25 dapat diperoleh.
3.4 Pemilihan Model Terbaik
Model imputasi dikatakan baik apabila eror taksiran kecil. Nilai dari eror taksiran
bergantung pada satuan yang digunakan. Selain itu, apabila nilai eror taksiran
pada suatu data dikatakan kecil, maka belum tentu eror taksiran yang bernilai
sama untuk data yang berbeda juga dapat dikatakan kecil. Untuk itu, karena nilai
eror dapat dianggap sebagai jarak, nilai eror dihitung relatif terhadap deviasi
standar dari seluruh data terobservasi pada titik waktu imputasi. Untuk selanjut-
nya, nilai eror ini disebut sebagai eror imputasi.
Misalkan imputasi dilakukan untuk mengisi data hilang dari subjek ๐‘– pada
waktu ๐‘˜. ๐œ€๐‘– menyatakan eror imputasi dari subjek ๐‘–. Secara matematis, untuk
suatu subjek ๐‘–, eror imputasi dapat ditulis sebagai berikut:
๐œ€๐‘– =
๐‘ฅ๐‘–๐‘˜ โˆ’ ๐‘ฅ๐‘–๐‘˜ฬ‚
๐‘† ๐‘˜
โก.โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก(3. 27)
Pada kenyataannya, ๐œ€๐‘– tidak dapat dihitung. Untuk itu, akan dijelaskan sebuah
metode pemilihan model yang cukup mampu menjamin bahwa model yang dipilih
memiliki ๐œ€๐‘– yang kecil.
Berdasarkan persamaan 3.26, penaksiran parameter ๐œŒ hanya melibatkan
data historis, sehingga apabila hasil taksiran parameter ๐œŒ mampu mewakili para-
meter dari data lengkap, formula 3.18, 3.20, 3.21 dan 3.25 dapat dengan baik
menaksir nilai yang hilang pada saat ๐‘˜ dari sebarang subjek. Dengan demikian,
nilai ๐œ€๐‘– untuk subjek-subjek yang terobservasi pada saat ๐‘˜ dapat dijadikan acuan
untuk memilih model terbaik. Untuk selanjutnya, nilai ๐œ€๐‘– dari subjek yang terob-
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
Bab 3 Model Imputasi
41
servasi disebut dengan eror model dan dilambangkan dengan ๐œ–๐‘–. ๐œ–๐‘– dapat dihitung
dengan mengasumikan bahwa fungsi distribusi ๐น๐‘˜ yang digunakan pada proses
perhitungan tidak berbeda dengan distribusi dari hasil fitting dengan menggu-
nakan seluruh data yang terobservasi pada saat ๐‘˜.
Misalkan ๐œ–ฬ… dan ๐‘ ๐œ– secara berturut turut menyatakan rata-rata dan deviasi
standar dari data ๐œ–๐‘– untuk seluruh subjek ๐‘– yang terobservasi pada waktu ๐‘˜. Model
imputasi yang baik ialah model yang memiliki rata-rata dan deviasi standar eror
yang kecil, sehingga nilai eror taksiran lebih mudah diprediksi. Dengan demikian,
pemilihan model dapat didasarkan pada nilai ๐œ–ฬ… dan ๐‘ ๐œ– terkecil.
Untuk model autoregressive, selain bergantung pada parameter koefisien
korelasi ๐œŒ, elemen pada matriks korelasinya bergantung pada nilai pangkat yang
merupakan rentang antar titik waktu pengukuran yang diukur dengan menggu-
nakan satuan tertentu. Dengan demikian, apabila rentang waktu antar pengukuran
yang berurutan tidak konstan, model autoregressive tidak dapat digunakan
sehingga tidak perlu disertakan dalam pemilihan model.
3.5 Interval Prediksi
Selain memperoleh taksiran titik, dapat ditentukan pula taksiran selang (interval
prediksi) dari ๐‘‹ ๐‘˜. Sesuai dengan persamaan 3.8,
๐‘“(๐‘ฆ ๐‘˜|๐‘ฏ; ๐‘ซ ๐‘˜) =
1
โˆš2๐œ‹
exp (โˆ’
1
2
๐‘ฆ ๐‘˜
2
)โกexp {โˆ’
1
2
(
(๐‘ฆ ๐‘˜ โˆ’ ๐’“ ๐‘‡
๐‘ซ ๐‘˜โˆ’1
โˆ’1
๐’˜ ๐‘˜โˆ’1)2
1 โˆ’ ๐’“ ๐‘‡โก๐‘ซkโˆ’1
โˆ’1
๐’“
โˆ’ ๐‘ฆk
2
)}
(1 โˆ’ ๐’“ ๐‘‡โก๐‘ซkโˆ’1
โˆ’1
๐ซ)
1
2
=
1
โˆš2๐œ‹
โกexp {โˆ’
1
2
(
(๐‘ฆ ๐‘˜ โˆ’ ๐’“ ๐‘‡
๐‘ซ ๐‘˜โˆ’1
โˆ’1
๐’˜ ๐‘˜โˆ’1)2
1 โˆ’ ๐’“ ๐‘‡โก๐‘ซkโˆ’1
โˆ’1
๐’“
)}
(1 โˆ’ ๐’“ ๐‘‡โก๐‘ซkโˆ’1
โˆ’1
๐ซ)
1
2
.โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก(3. 28)
Dari persamaan 3.28,
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
Bab 3 Model Imputasi
42
๐‘Œ๐‘˜|๐‘ฏ~๐‘(๐’“ ๐‘‡
๐‘ซ ๐‘˜โˆ’1
โˆ’1
๐’˜ ๐‘˜โˆ’1โก, 1 โˆ’ ๐’“ ๐‘‡
โก๐‘ซkโˆ’1
โˆ’1
๐ซ).
Dengan demikian, 100(1 โˆ’ ๐›ผ)% interval prediksi dari ๐‘Œ๐‘˜ ialah
[๐’“ ๐‘‡
๐‘ซ ๐‘˜โˆ’1
โˆ’1
๐’˜ ๐‘˜โˆ’1 โˆ’ ๐‘ง ๐›ผ
2
โˆš1 โˆ’ ๐’“ ๐‘‡โก๐‘ซkโˆ’1
โˆ’1
๐ซโก, ๐’“ ๐‘‡
๐‘ซ ๐‘˜โˆ’1
โˆ’1
๐’˜ ๐‘˜โˆ’1 + ๐‘ง ๐›ผ
2
โˆš1 โˆ’ ๐’“ ๐‘‡โก๐‘ซkโˆ’1
โˆ’1
๐ซโกโก]โก(3. 29)
dimana ๐‘ง ๐›ผ
2
menyatakan kuantil
๐›ผ
2
dari distribusi normal baku.
Sesuai dengan persamaan 3.12,โก๐‘ฅ ๐‘˜ฬ‚ โก= ๐น๐‘˜
โˆ’1
(ฮฆ1(๐‘ฆ ๐‘˜ฬ‚)). Pada kasus kontinu,
๐น๐‘˜ merupakan fungsi monoton naik murni, sehingga ๐น๐‘˜
โˆ’1
juga merupakan fungsi
monoton naik murni. Misalkan
๐‘ˆ = ๐’“ ๐‘‡
๐‘ซ ๐‘˜โˆ’1
โˆ’1
๐’˜ ๐‘˜โˆ’1 + ๐‘ง ๐›ผ
2
โˆš1 โˆ’ ๐’“ ๐‘‡โก๐‘ซkโˆ’1
โˆ’1
๐ซ
๐ฟ = ๐’“ ๐‘‡
๐‘ซ ๐‘˜โˆ’1
โˆ’1
๐’˜ ๐‘˜โˆ’1 โˆ’ ๐‘ง ๐›ผ
2
โˆš1 โˆ’ ๐’“ ๐‘‡โก๐‘ซkโˆ’1
โˆ’1
๐ซโก,
maka 100(1 โˆ’ ๐›ผ)% interval prediksi ๐‘‹ ๐‘˜ adalah
[๐น๐‘˜
โˆ’1
(ฮฆ1(๐ฟ)), ๐น๐‘˜
โˆ’1
(ฮฆ1(๐‘ˆ))โก].โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก(3. 30)
Untuk masing-masing struktur korelasi, mean dan variansi dari ๐‘Œ๐‘˜|๐‘ฏ dapat
ditaksir dari data. Taksiran dari Var(๐‘Œ๐‘˜|๐‘ฏ) untuk masing-masing struktur dapat
diperoleh dengan menggunakan formula pada tabel berikut:
Tabel 3.3 Formula Var(๐‘Œ๐‘˜|๐‘ฏ)ฬ‚ .
Struktur Korelasi โกVar(๐‘Œ๐‘˜|๐‘ฏ)ฬ‚ = โก1 โˆ’ ๐’“ ๐‘‡โก๐‘ซkโˆ’1
โˆ’1
๐ซฬ‚
CS 1 โˆ’
(๐‘˜ โˆ’ 1)๐œŒ2
1 + (๐‘˜ โˆ’ 2)๐œŒ
AR1 1 โˆ’ ๐œŒ2
1BT 1 โˆ’ ๐œŒ2
|๐‘ซ ๐‘˜โˆ’1
1๐ต๐‘‡|
|๐‘ซ ๐‘˜
1๐ต๐‘‡|
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
Bab 3 Model Imputasi
43
Interval prediksi pada persamaan 3.29 berlaku untuk taksiran yang dihi-
tung dengan menggunakan formula 3.18, 3.20, dan 3.25. Untuk formula 3.21,
100(1 โˆ’ ๐›ผ)% prediksi interval untuk ๐‘Œ๐‘˜ diperoleh dengan menggunakan formula
berikut:
[๐ธ(๐‘Œ๐‘˜|๐‘Œ๐‘˜โˆ’1) โˆ’ ๐‘ง ๐›ผ
2
โˆš๐œŽ๐‘˜
2(1 โˆ’ ๐œŒ2)โก, ๐ธ(๐‘Œ๐‘˜|๐‘Œ๐‘˜โˆ’1) + ๐‘ง ๐›ผ
2
โˆš๐œŽ๐‘˜
2
(1 โˆ’ ๐œŒ2)โกโก].โกโก(3. 31)
Misalkan pada kasus ini,
๐‘ˆ = โก๐ธ(๐‘Œ๐‘˜|๐‘Œ๐‘˜โˆ’1) + ๐‘ง ๐›ผ
2
โˆš๐œŽ๐‘˜
2(1 โˆ’ ๐œŒ2)โกโก
๐ฟ = ๐ธ(๐‘Œ๐‘˜|๐‘Œ๐‘˜โˆ’1) โˆ’ ๐‘ง ๐›ผ
2
โˆš๐œŽ๐‘˜
2(1 โˆ’ ๐œŒ2)โกโก,
maka 100(1 โˆ’ ๐›ผ)% interval prediksi ๐‘‹ ๐‘˜ dapat dihitung dengan menggunakan for-
mula 3.30. Untuk memperoleh prediksi interval tersebut, mean dan variansi secara
berturut turut dapat ditaksir dengan menggunakan formula berikut:
๐‘‰๐‘Ž๐‘Ÿ(๐‘Œ๐‘˜|๐‘Œ๐‘˜โˆ’1)ฬ‚ = ๐‘  ๐‘˜
2
(1 โˆ’ ๐œŒ ๐ด๐‘…1ฬ‚)
๐ธ(๐‘Œ๐‘˜|๐‘Œ๐‘˜โˆ’1)ฬ‚ = ๐‘Œฬ…๐‘˜ + ๐œŒ ๐ด๐‘…1ฬ‚ ๐‘  ๐‘˜
๐‘  ๐‘˜โˆ’1
โก(๐‘ฆ ๐‘˜โˆ’1 โˆ’ ๐‘Œฬ…๐‘˜โˆ’1).
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
44
Bab 4
Algoritma Imputasi dan Simulasi
Berdasarkan model imputasi pada bab 3, akan dikonstruksi sebuah algoritma im-
putasi untuk mengimput data hilang dari subjek ๐‘– pada saat ๐‘˜. Berdasarkan skema
imputasi pada bab 3, algoritma ini dapat diperumum, sehingga dapat digunakan
untuk mengimput seluruh data yang hilang. Untuk menganalisis kebaikan model,
algoritma imputasi disimulasikan pada data bangkitan dan data riil.
4.1 Algoritma Imputasi
Sebelum melakukan imputasi, langkah awal yang harus dilakukan ialah menen-
tukan nilai ๐‘– dan ๐‘˜. Setelah nilai ๐‘–โกdan ๐‘˜ ditentukan, imputasi untuk mengisi nilai
๐‘ฅ ๐‘˜ dapat dilakukan dengan menerapkan langkah-langkah pada algoritma berikut:
1. Fitting distribusi data ๐’™ untuk tiap-tiap waktu ๐‘—, sehingga diperoleh ๐น๐‘— un-
tuk ๐‘— = 1, โ€ฆ , ๐‘˜.
2. Mentransformasikan data ๐’™ pada tiap tiap waktu dengan menggunakan
fungsi distribusinya sendiri (sesuai hasil fitting pada langkah 1), sehingga
diperoleh data hasil PIT berupa matriks ๐’–,โกdimana
๐‘ข๐‘–๐‘— = ๐น๐‘—(๐‘ฅ๐‘–๐‘—), ๐‘– = 1 โ€ฆ . ๐‘›โกโก; โกโก๐‘— = 1, โ€ฆ , ๐‘šโก.
Histogram dari matriks ๐’– untuk data pada tiap-tiap titik waktu dapat
digunakan untuk melihat kebaikan hasil fiiting distribusi.
3. Mentransformasikan data pada matriks ๐’– dengan menggunakan fungsi in-
vers kuantil dari distribusi normal baku, sehingga diperoleh data realisasi
dari vektor acak ๐‘พ ๐‘˜.
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
Bab 4 Algoritma Imputasi dan Simulasi
45
4. Mencari interval dari nilai ๐œŒ yang memenuhi sifat matriks definit positif
untuk tiap-tiap struktur korelasi (CS, AR1, dan 1BT). Matriks korelasi
yang dijadikan acuan untuk menentukan interval berukuran ๐‘˜ ร— ๐‘˜.
5. Menentukan nilai ๐œŒฬ‚ ๐ถ๐‘†
, ๐œŒฬ‚ ๐ด๐‘…1
,โกdan ๐œŒฬ‚1๐ต๐‘‡
dengan memilih salah satu nilai ๐œŒ
pada selang yang telah diperoleh pada langkah 4. Pemilihan dilakukan
dengan cara memaksimumkan fungsi likelihood pada persamaan 3.26.
6. Menghitung taksiran ๐‘ฆ ๐‘˜ dibawah asumsi masing-masing struktur korelasi,
kemudian menghitung taksiran dari ๐‘ฅ ๐‘˜ dengan menggunakan formula
3.18, 3.20, 3.21, dan 3.25.
7. Menghitung taksiran data pada waktu ๐‘˜ untuk seluruh subjek yang terob-
servasi dengan memanfaatkan koefisien korelasi dan hasil fitting distribusi
yang telah diperoleh, kemudian menghitung ๐œ–ฬ… dan ๐‘ ๐œ– untuk tiap-tiap struk-
tur korelasi.
8. Menentukan model terbaik berdasarkan ๐œ–ฬ… dan ๐‘ ๐œ– yang dihitung pada lang-
kah 7, kemudian mengimput ๐‘ฅ ๐‘˜ dengan menggunakan hasil taksiran dari
model terbaik.
4.2 Simulasi
4.2.1 Simulasi pada Data Bangkitan
Pada sub bab ini, untuk melihat kebaikan dari model yang telah diperoleh pada
Bab 3, prosedur imputasi yang termuat pada algoritma pada sub bab 4.1 akan
dibandingkan dengan prosedur imputasi berdasarkan metode imputasi yang sudah
ada sebelumnya, yaitu mean subtitution dan LOCF. Pembanding ini dipilih karena
pada praktiknya lebih sering digunakan.
Pada studi simulasi I, algoritma imputasi untuk masing-masing metode
akan disimulasikan pada data bangkitan berdistribusi normal 5 variat. Asumsikan
bahwa single dropout terjadi pada waktu m (titik waktu akhir). Simulasi akan
difokuskan pada data dengan jumlah subjek sedikit, yaitu ๐‘› = 10, dimana setiap
observasi menjadi penting.
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
Bab 4 Algoritma Imputasi dan Simulasi
46
Sesuai dengan definisi dari CRD, RD, dan ID, secara berturut-turut data
akan dihilangkan secara acak, data observasi pada waktu ๐‘š akan dihilangkan
apabila data observasi pada waktu 1 memiliki observasi maksimum, dan data ob-
servasi pada waktu m akan dihilangkan apabila data tersebut memiliki observasi
maksimum. Prosedur penghapusan data berdasarkan mekanisme dropout diterap-
kan untuk melihat pengaruh mekanisme dropout terhadap kebaikan prosedur im-
putasi.
Selain diuji pada data berdistribusi normal, pada studi simulasi II, prosedur
imputasi juga akan diuji pada data yang memiliki kemencengan (skewness). Akan
dilihat apakah asumsi normal pada data yang memiliki kemencengan tak nol akan
mempengaruhi kebaikan imputasi. Data yang memiliki kemencengan (skeweness)
dapat diperoleh dengan menerapkan transformasi berikut:
Misalkan ๐‘‹๐‘— berdistribusi normal. Definisikan suatu variabel acak baru ๐‘‰๐‘—, dimana
๐‘‰๐‘— = {
๐‘‹๐‘—, โˆ’โˆž <โก ๐‘‹๐‘— โ‰ค 1
๐‘‹๐‘—
2
, 1 < ๐‘‹๐‘— < โˆžโก
,
sehingga
๐‘“๐‘‰ ๐‘—
(๐‘ฃ) = {
๐‘“๐‘‹ ๐‘—
๐‘ฃ,โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก โˆ’ โˆž < ๐‘ฃ โ‰ค 1
1
2โˆš ๐‘ฃ
๐‘“๐‘‹ ๐‘—
(โˆš ๐‘ฃ),โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก1 < ๐‘ฃ < โˆž
โกโกโก.
Karena fungsi kuadrat merupakan fungsi konveks, maka distribusi ๐‘‰๐‘— akan memi-
liki ekor di kanan. Distribusi dari hasil transformasi di atas bergantung pada para-
meter dari distribusi ๐‘‹๐‘—. Apabila mean dari ๐‘‹๐‘— bernilai negatif dan jauh dari nol,
transformasi di atas tidak akan memberikan pengaruh kemencengan yang besar.
Oleh sebab itu, pada studi simulasi II, parameter mean dari ๐‘‹๐‘— dipilih secara acak
pada interval di sekitar satu.
Analisis dari hasil simulasi akan didasarkan pada rata-rata dan deviasi
standar dari eror imputasi untuk masing-masing metode pada 500 kali pengulang-
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
Bab 4 Algoritma Imputasi dan Simulasi
47
an. Misalkan ๐ต1, ๐ต2, ๐ต3, ๐ต4 dan ๐‘†1, ๐‘†2, ๐‘†3, ๐‘†4 masing-masing berturut-turut menya-
takan rataan dan deviasi standar dari eror imputasi pada 500 pengulangan untuk
metode imputasi berdasarkan algoritma pada sub bab 4.1, metode imputasi
berdasarkan formula imputasi yang disesuaikan dengan struktur korelasi data
bangkitan (formula 3.18 untuk CS, 3.20 untuk AR1, dan 3.25 untuk 1BT), metode
mean subtitution, dan metode LOCF. Untuk struktur CS dan AR1, akan diguna-
kan ๐œŒ = 0,5 dan ๐œŒ = 0,8. Kemudian untuk struktur 1BT akan digunakan ๐œŒ = 0,2
dan ๐œŒ = 0,5.
4.2.1.1 Struktur Korelasi CS
Studi simulasi I
Sebagai langkah awal untuk menganalisis prosedur imputasi, algoritma imputasi
diterapkan pada data berdistribusi multivariat normal. Hasil simulasi dapat dilihat
pada tabel berikut:
Tabel 4.1 Hasil simulasi pada data bangkitan
(CS, normal,โก๐œŒ = 0,5).
CRD RD ID
๐ต1 0,667 0,754 1,287
๐ต2 0,658 0,732 1,275
๐ต3 1,975 2,277 2,66
๐ต4 2,655 3,034 3,397
๐‘†1 0,582 0,727 0,741
๐‘†2 0,566 0,663 0,723
๐‘†3 2,521 3,117 3,534
๐‘†4 3,566 4,102 4,454
Hasil simulasi pada Tabel 4.1 mengindikasikan bahwa model imputasi dengan
memanfaatkan distribusi bersyarat memiliki nilai rata-rata error imputasi yang
kecil dan taksiran yang lebih stabil dibandingkan dengan metode mean subtitution
dan metode LOCF (๐ต1 < ๐ต2 < ๐ต3โกdanโก๐‘†1 < ๐‘†2 < ๐‘†3). Selain itu, ketiga metode
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
Bab 4 Algoritma Imputasi dan Simulasi
48
menunjukkan bahwa untuk mekanisme CRD dan RD, seluruh metode lebih baik
dalam memprediksi data yang hilang dibanding pada mekanisme ID.
Selanjutnya dapat dilihat bahwa untuk ketiga mekanisme dropout, secara
berturut-turut nilai ๐ต1 dan ๐‘†1 mendekati nilai ๐ต2 dan ๐‘†2. Dengan kata lain,
prosedur pemilihan model pada metode imputasi dengan memanfaatkan distribusi
bersyarat sudah cukup baik. Frekuensi relatif dari pemilihan model untuk tiap-tiap
mekanisme dropoutโกdapat dilihat pada tabel berikut:
Tabel 4.2 Frekuensi relatif pemilihan model
(CS, normal, ๐œŒ = 0,5).
Mekanisme Dropout CS AR1 AR1n 1BT
CRD 0,958 0,024 0,006 0,012
RD 0,966 0,012 0,004 0,018
ID 0,96 0,022 0,004 0,0140
Tabel 4.2 menunjukkan bahwa struktur korelasi CS yang merupakan struktur ko-
relasi yang digunakan untuk membangkitkan data lebih sering dipilih.
Selanjutnya akan dilihat pengaruh nilai koefisien korelasi populasi terha-
dap kebaikan prosedur imputasi. Pengaruh nilai koefisien korelasi populasi ter-
hadap kebaikan prosedur imputasi akan dianalisa melalui perbandingan dengan
hasil dari simulasi serupa untuk nilai ๐œŒ = 0,8. Hasil simulasi imputasi pada data
pembanding dapat dilihat pada tabel berikut:
Tabel 4.3 Hasil simulasi data bangkitan
(CS, normal,โก๐œŒ = 0,8).
CRD RD ID
๐ต1 0,433 0,55 0,825
๐ต2 0,432 0,548 0,822
๐ต3 2,020 2,661 2,854
๐ต4 2,455 3,162 3,497
๐‘†1 0,393 0,546 0,587
๐‘†2 0,392 0,541 0,581
๐‘†3 2,093 4,197 4,329
๐‘†4 3,569 4,707 5,095
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
Bab 4 Algoritma Imputasi dan Simulasi
49
Perbedaan hasil simulasi pada Tabel 4.1 dan Tabel 4.3 menunjukkan
bahwa kebaikan taksiran menggunakan prosedur imputasi dengan memanfaatkan
distribusi bersyarat dipengaruhi oleh nilai koefisien korelasi populasi. Semakin
tinggi koefisien korelasi populasi antar titik waktu, taksiran semakin baik. Seba-
liknya, imputasi dengan menggunakan metode mean subtitution dan LOCF tidak
begitu baik. Selain itu, apabila korelasi data antar titik waktu kuat, nilai ๐‘†1dan ๐ต1
secara berturut turut makin mendekati nilai ๐‘†2 dan ๐ต2. Artinya pemilihan model
akan semakin tepat apabila korelasi data antar titik waktu semakin tinggi. Fre-
kuensi relatif dari pemilihan model terbaik untuk tiap-tiap mekanisme drop-
outโกdapat dilihat pada tabel berikut:
Tabel 4.4 Frekuensi relatif pemilihan model
(CS, normal,โก๐œŒ = 0,8).
Mekanisme Dropout CS AR1 AR1n 1BT
CRD 0,996 0,002 0,002 0
RD 0,996 0,004 0 0
ID 0,99 0,01 0 0
Studi simulasi II
Data pada kenyataannya hampir tidak pernah berdistribusi simetri dan asumsi
normal sering digunakan. Untuk itu, kebaikan prosedur imputasi akan diuji pada
data yang memiliki kemencengan (๐‘ ๐‘˜๐‘’๐‘ค๐‘’๐‘‘ data). Ukuran sampel yang digunakan
ialah ๐‘› = 10, sehingga pada saat fitting distribusi, asumsi kenormalan cenderung
tidak ditolak pada tingkat signifikansi ๐›ผ = 0,05. Hasil simulasi pada skewed data
dapat dilihat pada tabel berikut:
Tabel 4.5 Hasil simulasi data bangkitan
(CS, skewed,โก๐œŒ = 0,5).
CRD RD ID
๐ต1 0,887 1,33 2,727
๐ต2 0,86 1,265 2,648
๐ต3 2,415 4,823 4,620
๐ต4 2,813 4,943 5,376
๐‘†1 1,287 2,681 2,609
๐‘†2 1,255 2,578 2,553
LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
Model Imputasi Berbasis Distribusi Bersyarat (Conditional Distribution Based Imputation Model)
Model Imputasi Berbasis Distribusi Bersyarat (Conditional Distribution Based Imputation Model)
Model Imputasi Berbasis Distribusi Bersyarat (Conditional Distribution Based Imputation Model)
Model Imputasi Berbasis Distribusi Bersyarat (Conditional Distribution Based Imputation Model)
Model Imputasi Berbasis Distribusi Bersyarat (Conditional Distribution Based Imputation Model)
Model Imputasi Berbasis Distribusi Bersyarat (Conditional Distribution Based Imputation Model)
Model Imputasi Berbasis Distribusi Bersyarat (Conditional Distribution Based Imputation Model)
Model Imputasi Berbasis Distribusi Bersyarat (Conditional Distribution Based Imputation Model)
Model Imputasi Berbasis Distribusi Bersyarat (Conditional Distribution Based Imputation Model)
Model Imputasi Berbasis Distribusi Bersyarat (Conditional Distribution Based Imputation Model)
Model Imputasi Berbasis Distribusi Bersyarat (Conditional Distribution Based Imputation Model)
Model Imputasi Berbasis Distribusi Bersyarat (Conditional Distribution Based Imputation Model)
Model Imputasi Berbasis Distribusi Bersyarat (Conditional Distribution Based Imputation Model)
Model Imputasi Berbasis Distribusi Bersyarat (Conditional Distribution Based Imputation Model)
Model Imputasi Berbasis Distribusi Bersyarat (Conditional Distribution Based Imputation Model)
Model Imputasi Berbasis Distribusi Bersyarat (Conditional Distribution Based Imputation Model)
Model Imputasi Berbasis Distribusi Bersyarat (Conditional Distribution Based Imputation Model)
Model Imputasi Berbasis Distribusi Bersyarat (Conditional Distribution Based Imputation Model)
Model Imputasi Berbasis Distribusi Bersyarat (Conditional Distribution Based Imputation Model)
Model Imputasi Berbasis Distribusi Bersyarat (Conditional Distribution Based Imputation Model)
Model Imputasi Berbasis Distribusi Bersyarat (Conditional Distribution Based Imputation Model)
Model Imputasi Berbasis Distribusi Bersyarat (Conditional Distribution Based Imputation Model)
Model Imputasi Berbasis Distribusi Bersyarat (Conditional Distribution Based Imputation Model)
Model Imputasi Berbasis Distribusi Bersyarat (Conditional Distribution Based Imputation Model)
Model Imputasi Berbasis Distribusi Bersyarat (Conditional Distribution Based Imputation Model)
Model Imputasi Berbasis Distribusi Bersyarat (Conditional Distribution Based Imputation Model)
Model Imputasi Berbasis Distribusi Bersyarat (Conditional Distribution Based Imputation Model)
Model Imputasi Berbasis Distribusi Bersyarat (Conditional Distribution Based Imputation Model)
Model Imputasi Berbasis Distribusi Bersyarat (Conditional Distribution Based Imputation Model)
Model Imputasi Berbasis Distribusi Bersyarat (Conditional Distribution Based Imputation Model)
Model Imputasi Berbasis Distribusi Bersyarat (Conditional Distribution Based Imputation Model)
Model Imputasi Berbasis Distribusi Bersyarat (Conditional Distribution Based Imputation Model)
Model Imputasi Berbasis Distribusi Bersyarat (Conditional Distribution Based Imputation Model)
Model Imputasi Berbasis Distribusi Bersyarat (Conditional Distribution Based Imputation Model)
Model Imputasi Berbasis Distribusi Bersyarat (Conditional Distribution Based Imputation Model)
Model Imputasi Berbasis Distribusi Bersyarat (Conditional Distribution Based Imputation Model)

More Related Content

Similar to Model Imputasi Berbasis Distribusi Bersyarat (Conditional Distribution Based Imputation Model)

Model pembelajaran nht dan tgt
Model pembelajaran nht dan tgtModel pembelajaran nht dan tgt
Model pembelajaran nht dan tgt
Vivii Charmeiliaa
ย 
Skripsi structural equation_modeling
Skripsi structural equation_modelingSkripsi structural equation_modeling
Skripsi structural equation_modeling
Rahmatdi Black
ย 
Kooperatif tipe inside outside circle dan kemampuan komunikasi
Kooperatif tipe inside outside circle dan kemampuan komunikasiKooperatif tipe inside outside circle dan kemampuan komunikasi
Kooperatif tipe inside outside circle dan kemampuan komunikasiUlfah Faoziyah
ย 
Pelayanan publik parasuraman
Pelayanan publik parasuramanPelayanan publik parasuraman
Pelayanan publik parasuraman
celotehlucu82
ย 
PERPUS PUSAT BAB 1 DAN 2 quizizz.pdf
PERPUS PUSAT BAB 1 DAN 2 quizizz.pdfPERPUS PUSAT BAB 1 DAN 2 quizizz.pdf
PERPUS PUSAT BAB 1 DAN 2 quizizz.pdf
VinaOktaviani17
ย 
Kontribusi kompetensi tutor terhadap mutu hasil belajar kesetaraan paket a, b...
Kontribusi kompetensi tutor terhadap mutu hasil belajar kesetaraan paket a, b...Kontribusi kompetensi tutor terhadap mutu hasil belajar kesetaraan paket a, b...
Kontribusi kompetensi tutor terhadap mutu hasil belajar kesetaraan paket a, b...
Non Formal Education
ย 
SP19030.pdf
SP19030.pdfSP19030.pdf
SP19030.pdf
sonyapanjaitan1
ย 
RPS-Statistika.docx
RPS-Statistika.docxRPS-Statistika.docx
RPS-Statistika.docx
yule891
ย 
Kti dwi
Kti dwiKti dwi
Kti dwi
DwiPudjiHandayani
ย 
Fitri endang srimulat
Fitri endang srimulatFitri endang srimulat
Fitri endang srimulat
Nining Nuraida
ย 
Skripsi analisis
Skripsi  analisisSkripsi  analisis
Skripsi analisis
Ahya Alamsyah
ย 
PTK 1.pdf
PTK 1.pdfPTK 1.pdf
PTK 1.pdf
harlen selan
ย 
Analisis Komponen Utama Kekar dan Regresi Kekar
Analisis Komponen Utama Kekar dan Regresi KekarAnalisis Komponen Utama Kekar dan Regresi Kekar
Analisis Komponen Utama Kekar dan Regresi Kekar
die_raa
ย 
Pra laporan rustina
Pra laporan rustinaPra laporan rustina
Pra laporan rustina
yusarch
ย 
Skripsi
Skripsi Skripsi
Skripsi
Maya Achya
ย 
Digital20181696 s34104-dywangga auliannis
Digital20181696 s34104-dywangga auliannisDigital20181696 s34104-dywangga auliannis
Digital20181696 s34104-dywangga auliannis
gnwn
ย 
Science Technology and Society (Skripsi)
Science Technology and Society (Skripsi)Science Technology and Society (Skripsi)
Science Technology and Society (Skripsi)
HudaAinul
ย 

Similar to Model Imputasi Berbasis Distribusi Bersyarat (Conditional Distribution Based Imputation Model) (20)

Model pembelajaran nht dan tgt
Model pembelajaran nht dan tgtModel pembelajaran nht dan tgt
Model pembelajaran nht dan tgt
ย 
Silabus statistik
Silabus statistikSilabus statistik
Silabus statistik
ย 
Skripsi structural equation_modeling
Skripsi structural equation_modelingSkripsi structural equation_modeling
Skripsi structural equation_modeling
ย 
Kooperatif tipe inside outside circle dan kemampuan komunikasi
Kooperatif tipe inside outside circle dan kemampuan komunikasiKooperatif tipe inside outside circle dan kemampuan komunikasi
Kooperatif tipe inside outside circle dan kemampuan komunikasi
ย 
Pelayanan publik parasuraman
Pelayanan publik parasuramanPelayanan publik parasuraman
Pelayanan publik parasuraman
ย 
PERPUS PUSAT BAB 1 DAN 2 quizizz.pdf
PERPUS PUSAT BAB 1 DAN 2 quizizz.pdfPERPUS PUSAT BAB 1 DAN 2 quizizz.pdf
PERPUS PUSAT BAB 1 DAN 2 quizizz.pdf
ย 
Silabus Statistik 2013
Silabus Statistik 2013Silabus Statistik 2013
Silabus Statistik 2013
ย 
Kontribusi kompetensi tutor terhadap mutu hasil belajar kesetaraan paket a, b...
Kontribusi kompetensi tutor terhadap mutu hasil belajar kesetaraan paket a, b...Kontribusi kompetensi tutor terhadap mutu hasil belajar kesetaraan paket a, b...
Kontribusi kompetensi tutor terhadap mutu hasil belajar kesetaraan paket a, b...
ย 
SP19030.pdf
SP19030.pdfSP19030.pdf
SP19030.pdf
ย 
RPS-Statistika.docx
RPS-Statistika.docxRPS-Statistika.docx
RPS-Statistika.docx
ย 
Kti dwi
Kti dwiKti dwi
Kti dwi
ย 
Fitri endang srimulat
Fitri endang srimulatFitri endang srimulat
Fitri endang srimulat
ย 
Skripsi analisis
Skripsi  analisisSkripsi  analisis
Skripsi analisis
ย 
Draf bm dan bi
Draf bm dan biDraf bm dan bi
Draf bm dan bi
ย 
PTK 1.pdf
PTK 1.pdfPTK 1.pdf
PTK 1.pdf
ย 
Analisis Komponen Utama Kekar dan Regresi Kekar
Analisis Komponen Utama Kekar dan Regresi KekarAnalisis Komponen Utama Kekar dan Regresi Kekar
Analisis Komponen Utama Kekar dan Regresi Kekar
ย 
Pra laporan rustina
Pra laporan rustinaPra laporan rustina
Pra laporan rustina
ย 
Skripsi
Skripsi Skripsi
Skripsi
ย 
Digital20181696 s34104-dywangga auliannis
Digital20181696 s34104-dywangga auliannisDigital20181696 s34104-dywangga auliannis
Digital20181696 s34104-dywangga auliannis
ย 
Science Technology and Society (Skripsi)
Science Technology and Society (Skripsi)Science Technology and Society (Skripsi)
Science Technology and Society (Skripsi)
ย 

More from Indah Fitri Hapsari

Tugas regresi sas
Tugas regresi sasTugas regresi sas
Tugas regresi sas
Indah Fitri Hapsari
ย 
Press dan satistik cp (regresi)
Press dan satistik cp (regresi)Press dan satistik cp (regresi)
Press dan satistik cp (regresi)
Indah Fitri Hapsari
ย 
Analisis komponen utama (Principal Component Analysis)
Analisis komponen utama (Principal Component Analysis)Analisis komponen utama (Principal Component Analysis)
Analisis komponen utama (Principal Component Analysis)
Indah Fitri Hapsari
ย 
Logistic regression (generalized linear model)
Logistic regression (generalized linear model)Logistic regression (generalized linear model)
Logistic regression (generalized linear model)
Indah Fitri Hapsari
ย 
Laporan kimia dasar ia termokimia
Laporan kimia dasar ia termokimiaLaporan kimia dasar ia termokimia
Laporan kimia dasar ia termokimia
Indah Fitri Hapsari
ย 
Generalized linear models (logistic regression)
Generalized linear models (logistic regression)Generalized linear models (logistic regression)
Generalized linear models (logistic regression)
Indah Fitri Hapsari
ย 
Catatan Regresi linier
Catatan Regresi linierCatatan Regresi linier
Catatan Regresi linier
Indah Fitri Hapsari
ย 

More from Indah Fitri Hapsari (7)

Tugas regresi sas
Tugas regresi sasTugas regresi sas
Tugas regresi sas
ย 
Press dan satistik cp (regresi)
Press dan satistik cp (regresi)Press dan satistik cp (regresi)
Press dan satistik cp (regresi)
ย 
Analisis komponen utama (Principal Component Analysis)
Analisis komponen utama (Principal Component Analysis)Analisis komponen utama (Principal Component Analysis)
Analisis komponen utama (Principal Component Analysis)
ย 
Logistic regression (generalized linear model)
Logistic regression (generalized linear model)Logistic regression (generalized linear model)
Logistic regression (generalized linear model)
ย 
Laporan kimia dasar ia termokimia
Laporan kimia dasar ia termokimiaLaporan kimia dasar ia termokimia
Laporan kimia dasar ia termokimia
ย 
Generalized linear models (logistic regression)
Generalized linear models (logistic regression)Generalized linear models (logistic regression)
Generalized linear models (logistic regression)
ย 
Catatan Regresi linier
Catatan Regresi linierCatatan Regresi linier
Catatan Regresi linier
ย 

Recently uploaded

Rangkuman Buku โ€œKORUPSI Melacak Arti, Menyimak Implikasiโ€ Oleh : B. HERRY PR...
Rangkuman Buku โ€œKORUPSI Melacak Arti, Menyimak Implikasiโ€  Oleh : B. HERRY PR...Rangkuman Buku โ€œKORUPSI Melacak Arti, Menyimak Implikasiโ€  Oleh : B. HERRY PR...
Rangkuman Buku โ€œKORUPSI Melacak Arti, Menyimak Implikasiโ€ Oleh : B. HERRY PR...
attikahgzl
ย 
Artificial Neural Network Backpropafation
Artificial Neural Network BackpropafationArtificial Neural Network Backpropafation
Artificial Neural Network Backpropafation
muhandhis1
ย 
Contoh pengisian Formulir metadataq.pptx
Contoh pengisian Formulir metadataq.pptxContoh pengisian Formulir metadataq.pptx
Contoh pengisian Formulir metadataq.pptx
4301170149rizkiekose
ย 
Dampak PD 2 zxxxxxxxxxxxxxxxxxxxxxx.pptx
Dampak PD 2 zxxxxxxxxxxxxxxxxxxxxxx.pptxDampak PD 2 zxxxxxxxxxxxxxxxxxxxxxx.pptx
Dampak PD 2 zxxxxxxxxxxxxxxxxxxxxxx.pptx
sidiqhardianto1181
ย 
13-14. P ORTOGONAL_13-30_5_2024 (#5).pptx
13-14. P ORTOGONAL_13-30_5_2024 (#5).pptx13-14. P ORTOGONAL_13-30_5_2024 (#5).pptx
13-14. P ORTOGONAL_13-30_5_2024 (#5).pptx
MSahrul7
ย 
anamnesa-dan-pemeriksaan-fisik-penderita-urologi.ppt
anamnesa-dan-pemeriksaan-fisik-penderita-urologi.pptanamnesa-dan-pemeriksaan-fisik-penderita-urologi.ppt
anamnesa-dan-pemeriksaan-fisik-penderita-urologi.ppt
DianIslamiatiIswan1
ย 

Recently uploaded (6)

Rangkuman Buku โ€œKORUPSI Melacak Arti, Menyimak Implikasiโ€ Oleh : B. HERRY PR...
Rangkuman Buku โ€œKORUPSI Melacak Arti, Menyimak Implikasiโ€  Oleh : B. HERRY PR...Rangkuman Buku โ€œKORUPSI Melacak Arti, Menyimak Implikasiโ€  Oleh : B. HERRY PR...
Rangkuman Buku โ€œKORUPSI Melacak Arti, Menyimak Implikasiโ€ Oleh : B. HERRY PR...
ย 
Artificial Neural Network Backpropafation
Artificial Neural Network BackpropafationArtificial Neural Network Backpropafation
Artificial Neural Network Backpropafation
ย 
Contoh pengisian Formulir metadataq.pptx
Contoh pengisian Formulir metadataq.pptxContoh pengisian Formulir metadataq.pptx
Contoh pengisian Formulir metadataq.pptx
ย 
Dampak PD 2 zxxxxxxxxxxxxxxxxxxxxxx.pptx
Dampak PD 2 zxxxxxxxxxxxxxxxxxxxxxx.pptxDampak PD 2 zxxxxxxxxxxxxxxxxxxxxxx.pptx
Dampak PD 2 zxxxxxxxxxxxxxxxxxxxxxx.pptx
ย 
13-14. P ORTOGONAL_13-30_5_2024 (#5).pptx
13-14. P ORTOGONAL_13-30_5_2024 (#5).pptx13-14. P ORTOGONAL_13-30_5_2024 (#5).pptx
13-14. P ORTOGONAL_13-30_5_2024 (#5).pptx
ย 
anamnesa-dan-pemeriksaan-fisik-penderita-urologi.ppt
anamnesa-dan-pemeriksaan-fisik-penderita-urologi.pptanamnesa-dan-pemeriksaan-fisik-penderita-urologi.ppt
anamnesa-dan-pemeriksaan-fisik-penderita-urologi.ppt
ย 

Model Imputasi Berbasis Distribusi Bersyarat (Conditional Distribution Based Imputation Model)

  • 1. MODEL IMPUTASI BERBASIS DISTRIBUSI BERSYARAT LAPORAN TUGAS AKHIR Diajukan sebagai salah satu syarat untuk memperoleh gelar Sarjana dari Institut Teknologi Bandung Oleh INDAH NURINA FITRI HAPSARI NIM: 10110094 (Program Studi Sarjana Matematika) FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT TEKNOLOGI BANDUNG 2015
  • 2. i MODEL IMPUTASI BERBASIS DISTRIBUSI BERSYARAT ABSTRAK Data observasi merupakan sumber informasi yang mampu memberikan validasi terhadap isu, masalah, dan dugaan yang ada di masyarakat. Sebagai sumber utama analisa, kualitas data observasi sangatlah penting, sehingga masalah yang terjadi selama pengambilan data berlangsung harus diperhatikan. Salah satu bentuk data observasi yang memuat pengukuran berulang ialah bentuk data longitudinal. Pada praktiknya, saat proses pengambilan data longitudinal berlangsung, fenomena dropout kerap terjadi. Fenomena ini menyebabkan data longitudinal menjadi tidak lengkap, sehingga dapat menyebabkan bias pada hasil analisa. Tugas akhir ini akan membahas model imputasi untuk mengisi data yang hilang dengan meman- faatkan distribusi bersyarat. Distribusi bersyarat dipilih karena observasi berulang pada suatu subjek cenderung tidak saling bebas, sehingga dengan memanfaatkan struktur korelasi beserta data terobservasi, data yang hilang dapat ditaksir. Distri- busi bersyarat dapat dikonstruksi dengan menggunakan pendekatan copula, salah satunya ialah copula Gaussian. Tiga struktur korelasi yang umum digunakan akan dibahas dan diaplikasikan kedalam model, sehingga diperoleh empat formula imputasi. Kata kunci: data longitudinal, dropout, imputasi, copula Gaussian, distribusi ber- syarat, dan struktur korelasi. LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
  • 3. ii CONDITIONAL DISTRIBUTION BASED IMPUTATION MODEL ABSTRACT Observation data is a useful source of information which can be used to validate various social issues, problems, and assumptions shared by people within a society. As a prime source of analysis, its quality becomes highly important, so that any problems happen during the data collection must be treated carefully. One type of observation data which involves repeated measurement is longitudinal data. In practice, the dropout phenomenon has often happened during the process of data collection, resulting incomplete longitudinal data which can lead to bias results of analysis. This final assignment discusses an imputation model to fill in the lost data using conditional distribution. Conditional distribution is selected on the ground that repeated measurements on certain subject tend to be dependent. Hence, based on the observed data and its possible correlation structure, the lost data can thus be estimated. Conditional distribution can be constructed through copula approach, e.g. Gaussian copula. Three commonly used correlation struc- ture would be explained and applied on the model such that four imputation formulas are acquired. Key words: longitudinal data, dropout, imputation, Gaussian copula, conditional distribution, and correlation structure. LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
  • 4. iii MODEL IMPUTASI BERBASIS DISTRIBUSI BERSYARAT Oleh INDAH NURINA FITRI HAPSARI NIM:10110094 (Program Studi Sarjana Matematika) Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Teknologi Bandung Telah diperiksa dan disetujui, Bandung, Agustus 2015 Dosen Pembimbing Dr. Sapto Wahyu Indratno NIP. 197508041999031003 LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
  • 5. iv Prakata Alhamdulillahirabbil โ€˜alamin, puji syukur penulis panjatkan ke hadirat Allah SWT karena atas rahmat dan karunia-Nya penulis dapat menyelesaikan tugas akhir yang berjudul โ€œModel Imputasi Berbasis Distribusi Bersyaratโ€. Buku tugas akhir ini disusun untuk memenuhi persyaratan kurikulum pen- didikan Program Studi Matematika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Teknologi Bandung. Penulis menyadari bahwa penyusunan buku tugas akhir ini masih jauh dari sempurna dan masih terdapat banyak kekurangan dikarenakan oleh keterbatasan kemampuan, pengalaman, dan pengetahuan yang dimiliki oleh penulis. Maka dari itu, penulis menerima saran dan kritik sebagai masukan untuk perbaikan di masa yang akan datang. Penyusunan buku tugas akhir ini tidak akan terwujud tanpa adanya ban- tuan dari berbagai pihak. Maka pada kesempatan ini, penulis menyampaikan rasa terimakasih kepada : 1. Bapak, Ibu, dan Ayah yang penulis sayangi, Bapak Zaenal Abidin, Ibu Suharti, dan Bapak Dodik Dwi Sasongko, yang selalu sabar dan terus menerus memberikan semangat kepada penulis. Terimakasih atas perha- tian, kepercayaan, dan kasih sayang yang telah diberikan kepada penulis. 2. Saudara-saudara penulis, Indah Kartika Buana Putri, Arsita Tiara Abidin, dan Hidayat Ibnu Hadi. Terimakasih atas semangat dan surprise yang sering diberikan untuk menghibur penulis. 3. Bapak Dr. Sapto Wahyu Indratno sebagai dosen pembimbing. Terimakasih atas perhatian, kesabaran, semangat, pengalaman, ilmu, dan saran berharga yang diberikan kepada penulis dalam pengerjaan tugas akhir ini. Penulis memperoleh banyak pelajaran selama proses pengerjaan tugas akhir ini berlangsung. Terimakasih telah menjadi tempat penulis berkeluh kesah. LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
  • 6. v Maaf kalau penulis sering merepotkan, labil, rame, dan heboh sendiri ya Pak. Pak Sapto adalah orang paling sabar yang pernah penulis kenal. 4. Ibu RR Kurnia Novitasari, M.Si dan Ibu Dr. Hanni G. Yudhawisastra yang telah bersedia menjadi dosen penguji dan memberikan banyak masukan pada tugas akhir ini. 5. Ibu Dr. Rinovia Mery Garnierita Simanjuntak sebagai dosen wali penulis. Terima kasih atas bimbingan dan nasehatnya selama ini. 6. Bapak Khreshna I.A. Syuhada, M.Sc, Ph.D yang telah menjadi tempat penulis bercerita dan berkeluh kesah selama sekitar dua tahun terakhir. Terimakasih atas perhatian, nasehat, semangat, keusilan, dan keperca- yaanya ya Pak. Maaf sudah menjadi mahasiswa paling rame di dunia maya. Sy akan selalu mengingat kata-kata motivasi pertama Bapak, โ€Pasti bisa!โ€. 7. Seluruh dosen pengajar Program Studi Matematika ITB yang telah meng- ajar saya dan memberikan ilmu yang bermanfaat, serta staf karyawan yang telah membantu berlangsungnya kegiatan belajar mengajar di Program Studi Matematika ITB. 8. Sahabat penulis, si bulet dan kurus Nur Cahyanti, yang selalu menemani di kala suka dan duka. Terimakasih telah menerima penulis apa adanya dan memberikan dorongan agar cepat menyelesaikan tugas akhir ini. 9. Geng lurus, Yanti dan Hestin, terima kasih atas kebersamaan, canda, dan tawa selama ini. Semoga persahabatan kita menjadi persahabatan yang langgeng. Sukses dan bahagia selalu ya Gengs! 10. Teman-teman kelas Topik Statistika IV dengan berbagai karakternya. Ka- lian adalah teman-teman yang mengajarkan penulis banyak hal, terutama mengenai kesabaran dan kasih sayang. Terimakasih sudah menjadi kakak- kakak terbaik dan telah sabar menghadapi adik yang suka ngambek ini. 11. Teman-teman satu bimbingan, Tria, Mona, Tessa, Bernard, Vivan, Kak Fuad, Kak Maria, Kak Milla, Kak Ani, dan lainnya yang telah bersedia berbagi info dan cerita. LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
  • 7. vi 12. Teman-teman seperjuangan, Kawan-kawan Matematika ITB 2010 dan Saudara-saudara Loedroek ITB 2010 yang telah memberikan banyak pe- ngalaman berwarna selama kuliah di ITB. 13. Semua pihak yang tidak dapat saya sebutkan namanya satu per satu, yang memberikan dukungan dan bantuan baik secara langsung maupun tidak langsung kepada penulis, sehingga penulis dapat menyelesaikan buku tu- gas akhir ini dan menjalani seminar tugas akhir dengan baik. Semoga Allah SWT membalas bantuan dan kebaikan pihak-pihak tersebut dengan segala rahmat dan kasih sayang-Nya. Akhir kata, penulis berharap agar buku tugas akhir ini dapat berguna bagi pembacanya. Bandung, Agustus 2015 Penulis LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
  • 8. vii Daftar Isi MODEL IMPUTASI BERBASIS DISTRIBUSI BERSYARAT i CONDITIONAL DISTRIBUTION BASED IMPUTATION MODEL ii Prakata iv Daftar Isi vii Daftar Gambar x Daftar Tabel xi Bab 1 Pendahuluan 1 1.1 Latar Belakang........................................................................................... 1 1.2 Tujuan........................................................................................................ 2 1.3 Sistematika Pembahasan............................................................................ 3 Bab 2 Landasan Teori 4 2.1 Data Longitudinal...................................................................................... 4 2.1.1 Dropout dan Klasifikasinya.............................................................. 4 2.1.2 Imputasi ............................................................................................ 7 2.2 Konsep Dasar Teori Copula ...................................................................... 8 2.2.1 Densitas Copula.............................................................................. 11 2.3 Distribusi Multivariat Normal Standar.................................................... 12 2.3.1 Korelasi Pearson............................................................................. 13 2.4 Copula Gaussian...................................................................................... 16 2.4.1 Konstruksi Copula Gaussian .......................................................... 17 2.4.2 Densitas Copula Gaussian .............................................................. 18 2.4.3 Konstruksi Distribusi Bersama....................................................... 19 LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
  • 9. Daftar Isi viii 2.4.4 Konstruksi Distribusi Bersyarat...................................................... 19 2.5 Titik Maksimum ...................................................................................... 20 2.5.1 Titik Maksimum Fungsi Densitas Distribusi Normal..................... 21 Bab 3 Model Imputasi 23 3.1 Model Umum Imputasi............................................................................ 24 3.2 Struktur Korelasi...................................................................................... 30 3.2.1 Struktur Korelasi Compound Symmetry ......................................... 30 3.2.2 Struktur Korelasi First Order Autoregressive................................ 33 3.2.3 Struktur Korelasi 1-Banded Toeplitz.............................................. 36 3.3 Penaksiran Parameter Koefisien Korelasi ............................................... 38 3.4 Pemilihan Model Terbaik ........................................................................ 40 3.5 Interval Prediksi....................................................................................... 41 Bab 4 Algoritma Imputasi dan Simulasi 44 4.1 Algoritma Imputasi.................................................................................. 44 4.2 Simulasi ................................................................................................... 45 4.2.1 Simulasi pada Data Bangkitan........................................................ 45 4.2.1.1 Struktur Korelasi CS ......................................................... 47 4.2.1.2 Struktur Korelasi AR1 ...................................................... 50 4.2.1.3 Struktur Korelasi 1BT....................................................... 53 4.2.2 Simulasi pada Data Rill.................................................................. 56 4.2.2.1 Deskripsi Data................................................................... 56 4.2.2.2 Penerapan Algoritma Imputasi pada Data ........................ 58 Bab 5 Kesimpulan 64 LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
  • 10. Daftar Isi ix Daftar Pustaka 66 Lampiran A 67 Lampiran B 71 LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
  • 11. x Daftar Gambar Gambar 2.1 Histogram data bangkitan dari distribusi ๐‘’๐‘ฅ๐‘โก(2)............................ 10 Gambar 2.2 Histogram data hasil transformasi. .................................................. 10 Gambar 2.3 Pengaruh ukuran sampel terhadap distribusi korelasi empiris. ....... 15 Gambar 2.4 Pengaruh korelasi populasi terhadap distribusi korelasi empiris..... 16 Gambar 4.1 Histogram hasil PIT untuk data kadar timbal dalam darah. ............ 59 Gambar 4.2 Plot CDF empirik hasil PIT data kadar timbal dalam darah............ 59 Gambar 4.3 Grafik fungsi likelihood densitas Gaussian..................................... 60 Gambar 4.4 Plot data kadar timbal dalam darah. ................................................ 62 LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
  • 12. xi Daftar Tabel Tabel 2.1 Random dropout..................................................................................... 6 Tabel 2.2 Informative dropout................................................................................ 6 Tabel 3.1 Ilustrasi data longitudinal dengan dropout........................................... 23 Tabel 3.2 Interval ๐œŒ untuk beberapa ukuran matriks ๐‘ซ........................................ 39 Tabel 3.3 Formula Var(๐‘Œ๐‘˜|๐‘ฏ)ฬ‚ .............................................................................. 42 Tabel 4.1 Hasil simulasi pada data bangkitan (CS, normal,โก๐œŒ = 0,5).................. 47 Tabel 4.2 Frekuensi relatif pemilihan model (CS, normal, ๐œŒ = 0,5)................... 48 Tabel 4.3 Hasil simulasi data bangkitan (CS, normal,โก๐œŒ = 0,8). ......................... 48 Tabel 4.4 Frekuensi relatif pemilihan model (CS, normal,โก๐œŒ = 0,8)................... 49 Tabel 4.5 Hasil simulasi data bangkitan (CS, skewed,โก๐œŒ = 0,5).......................... 49 Tabel 4.6 Frekuensi relatif pemilihan model (CS, skewed,โก๐œŒ = 0,5)................... 50 Tabel 4.7 Hasil simulasi data bangkitan (AR1, normal,โก๐œŒ = 0,5)........................ 50 Tabel 4.8 Frekuensi relatif pemilihan model (AR1, normal,โก๐œŒ = 0,5). ............... 51 Tabel 4.9 Hasil simulasi data bangkitan (AR1, normal,โก๐œŒ = 0,8)....................... 52 Tabel 4.10 Frekuensi relatif pemilihan model (AR1, normal,โก๐œŒ = 0,8). ............. 52 Tabel 4.11 Hasil simulasi data bangkitan (AR1, skewed,โก๐œŒ = 0,5). .................... 53 Tabel 4.12 Frekuensi relatif pemilihan model (AR1, skewed,โก๐œŒ = 0,5). ............. 53 LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
  • 13. Daftar Tabel xii Tabel 4.13 Hasil simulasi data bangkitan (1BT, normal,โก๐œŒ = 0,5)...................... 54 Tabel 4.14 Frekuensi relatif pemilihan model (1BT, normal,โก๐œŒ = 0,5)............... 54 Tabel 4.15 Hasil simulasi data bangkitan (1BT, normal,โก๐œŒ = 0,2)...................... 55 Tabel 4.16 Frekuensi relatif pemilihan model (1BT, normal,โก๐œŒ = 0,2)............... 55 Tabel 4.17 Hasil simulasi data bangkitan (1BT, skewed,โก๐œŒ = 0,5)...................... 56 Tabel 4.18 Frekuensi relatif pemilihan model (1BT, skewed,โก๐œŒ = 0,5)............... 56 Tabel 4.19 Data kadar timbal dalam darah (dalam ฮผg/dl).................................... 57 Tabel 4.20 Hasil fitting distribusi data kadar timbal dalam darah. ...................... 59 Tabel 4.21 Hasil taksiran ๐‘ฅ20,4............................................................................. 61 Tabel 4.22 Eror model.......................................................................................... 61 Tabel 4.23 Hasil simulasi imputasi kasus single dropout pada data kadar timbal dalam darah........................................................................................................... 62 LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
  • 14. 1 Bab 1 Pendahuluan 1.1 Latar Belakang Data observasi merupakan representasi dari sebuah keadaan, sehingga data obser- vasi mampu memberikan validasi terhadap isu, masalah, dan dugaan yang ada di masyarakat. Data observasi memiliki berbagai bentuk yang pemilihannya dise- suaikan dengan tujuan dilaksanakannya studi. Salah satu bentuk data observasi yang cukup sering digunakan ialah bentuk data longitudinal, dimana data memuat observasi dari pengukuran berulang. Studi yang menggunakan data longitudinal sebagai dasar penarikan kesimpulan disebut sebagai studi longitudinal. Dengan adanya pengukuran berulang, studi longitudinal mampu mendeteksi perubahan suatu variabel terhadap waktu, sehingga dapat digunakan untuk menarik inferensi kausal. Studi longitudinal telah banyak diterapkan di berbagai disiplin ilmu, seper- ti kedokteran, psikologi, biologi, dan ekonomi. Salah satu contoh ialah studi di bidang kedokteran yang diinisiasi oleh Lewis Terman pada tahun 1921. Studi yang dikenal dengan nama โ€œGenetics studies of Geniusโ€ ini bertujuan untuk menentukan kurikulum pendidikan terbaik bagi orang-orang jenius. Hingga saat ini, masalah besar yang kerap terjadi pada saat proses pengambilan data longitudinal ialah adanya fenomena dropout (attrition), yaitu hilangnya data karena subjek meninggalkan studi. Dropout dapat menyebabkan adanya bias (kesalahan) dalam penarikan kesimpulan (lihat referenssi Fitzmaurice dkk, 2004), sehingga dibutuhkan penanggulangan yang tepat. Salah satu metode untuk menanggulangi dropout ialah dengan melakukan imputasi, yaitu mengisi data yang hilang dengan menggunakan nilai taksiran. LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
  • 15. Bab 1 Pendahuluan 2 Identifikasi struktur hilangnya data dan imputasi pertama kali dilakukan oleh McKendrik pada tahun 1926. Kemudian teori mengenai data hilang mulai berkembang pesat di tahun 1970-an yang ditandai dengan munculnya metode case deletion dan metode single imputation. Sekitar tahun 1980, metode imputasi ber- basis likelihood diperkenalkan. Bukan hanya single imputation, multiple imputa- tion mulai dikembangkan di tahun 1990-an. Pada tugas akhir ini, akan dibahas salah satu model imputasi yang tergo- long sebagai single imputation. Berbeda dengan multiple imputation, sesuai de- ngan namanya, single imputation menggunakan suatu nilai untuk mengisi data yang hilang, sehingga hanya diperoleh satu data lengkap. Model imputasi yang akan dibahas ialah model imputasi dengan memanfaatkan distribusi bersyarat. Distribusi bersyarat dipilih karena pengukuran berulang pada suatu subjek cenderung tidak saling bebas. Untuk memperoleh distribusi bersyarat dibutuhkan distribusi bersama, dimana distribusi bersama dapat dikonstruksi menggunakan pendekatan copula. Istilah copula dalam bidang statistika dan matematika pertama kali diper- kenalkan oleh Abe Sklar pada tahun 1959. Copula berasal dari bahasa latin yang berarti ikatan. Sesuai dengan artinya, copula dapat menghubungkan distribusi- distribusi marginal untuk memperoleh distribusi bersama. Copula yang akan digunakan dalam tugas akhir ini adalah copula Gaussian. 1.2 Tujuan 1. Mengkonstruksi model imputasi dengan memanfaatkan distribusi bersya- rat yang dikonstruksi dengan menggunakan copula Gaussian. 2. Menganalisis kebaikan model imputasi yang diperoleh berdasarkan tujuan 1. LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
  • 16. Bab 1 Pendahuluan 3 1.3 Sistematika Pembahasan Tugas akhir ini terdiri dari lima bab. Bab 1, yaitu pendahuluan memuat latar bela- kang yang mendasari diangkatnya topik ini sebagai tugas akhir, tujuan yang ingin dicapai, dan sistematika pembahasan. Bab 2 berisi landasan teori yang dibutuhkan untuk mengkonstruksi model imputasi. Sebelum mengkonstruksi model imputasi, dibutuhkan pemahaman lebih dalam mengenai dropout dan imputasi, sehingga teori mengenai data longitudinal diberikan di awal bab. Kemudian dilanjutkan dengan pembahasan mengenai kon- sep dasar teori copula, distribusi multivariat normal standar, copula Gaussian, dan konstruksi distribusi bersyarat dengan menggunakan copula Gaussian. Bab ini ditutup dengan pembahasan mengenai titik maksimum sebagai salah satu bagian dari teori optimisasi yang nantinya dibutuhkan dalam proses pemodelan. Bab 3 berisi pembahasan mengenai langkah-langkah konstruksi model imputasi. Setelah model umum imputasi diperoleh, beberapa struktur korelasi yang umum digunakan dibahas dan diaplikasikan ke dalam model, sehingga di- peroleh 4 formula (model) imputasi. Untuk memahami cara memperoleh penaksir terbaik, bab ditutup dengan pembahasan mengenai penaksiran parameter koefisien korelasi, pemilihan model terbaik, dan interval prediksi. Bab 4 membahas mengenai algoritma imputasi yang dikonstruksi sesuai dengan model imputasi yang telah diperoleh pada Bab 3. Kemudian untuk meng- analisis kebaikan prosedur imputasi, algoritma imputasi tersebut diterapkan pada data bangkitan dan data riil. Untuk simulasi pada data bangkitan, indikator kebaikan model imputasi didasarkan pada perbandingan dengan hasil taksiran dengan menggunakan metode yang sudah ada sebelumnya. Bab 5 sebagai bab penutup memberikan kesimpulan mengenai kebaikan model imputasi berbasis distribusi bersyarat yang didasarkan pada hasil analisa penerapan algoritma imputasi pada data rill dan data bangkitan. LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
  • 17. 4 Bab 2 Landasan Teori 2.1 Data Longitudinal Data longitudinal merupakan data yang memuat nilai-nilai observasi dari pe- ngukuran berulang pada sejumlah subjek (sampel) dalam suatu periode (masa studi) tertentu. Data ini umumnya direpresentasikan dalam bentuk matriks beruku- ran ๐‘› ร— ๐‘š, dimana ๐‘› dan ๐‘š secara berturut-turut menyatakan banyaknya sampel dan titik waktu pengukuran yang ditetapkan sebelum masa studi dimulai. Dengan adanya pengukuran berulang, data longitudinal mampu mengambil informasi me- ngenai karakteristik suatu variabel terhadap perubahan waktu, sehingga seringkali digunakan untuk menarik inferensi kausal. Disamping keuntungan yang dimiliki oleh data longitudinal, terdapat be- berapa kelemahan, yaitu waktu dan biaya yang dibutuhkan dalam pengambilan data cukup besar dan adanya kerentanan terhadap dropout yang berakibat pada validitas inferensi (lihat referensi Fitzmaurice dkk, 2004). Tugas akhir ini akan membahas lebih lanjut mengenai dropout. 2.1.1 Dropout dan Klasifikasinya Studi yang melibatkan data menarik kesimpulan berdasarkan analisis dari data, sehingga masalah yang terjadi selama proses pengambilan data harus diperha- tikan. Salah satu masalah yang kerap dialami dalam pengambilan data longitudi- nal ialah terjadinya dropout yang menyebabkan data tidak lengkap. Dropout/attrition ialah salah satu jenis hilangnya data yang terjadi karena subjek meninggalkan studi sebelum masa studi berakhir. Misalkan terdapat ๐‘› subjek yang akan diukur sebanyak ๐‘š kali pada saat ๐‘ก1, ๐‘ก2, โ€ฆ , ๐‘ก ๐‘š. Definisikan LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
  • 18. Bab 2 Landasan Teori 5 ๐‘ฟ = (๐‘‹1, โ€ฆ , ๐‘‹ ๐‘š) ๐‘‡ sebagai vektor acak yang menyatakan pengukuran. Apabila subjek ๐‘– mengalami dropout pada saat ๐‘ก ๐‘˜, maka data pada saat dan setelah ๐‘ก ๐‘˜ untuk subjek ๐‘–, yaitu ๐‘ฅ๐‘–๐‘˜ hingga ๐‘ฅ๐‘–๐‘š tidak terobservasi. Untuk selanjutnya, ๐‘ก1, ๐‘ก2, โ€ฆ , ๐‘ก ๐‘š dituliskan sebagai 1,2, โ€ฆ , ๐‘š. Dropout dapat mengurangi efisiensi, menghilangkan informasi, dan ber- potensi menyebabkan bias pada penarikan kesimpulan apabila karakteristik dari individu yang mengalami dropout berbeda dengan individu yang tidak mengalami dropout. Akibat ini akan lebih jelas terlihat apabila jumlah subjek yang terlibat dalam studi cukup sedikit. Ketika dropout terjadi, validitas dari inferensi bergantung pada keterkaitan antara variabel yang ingin diteliti dengan penyebab dropout (lihat referensi Fitzmaurice dkk, 2004). Keterkaitan ini selanjutnya akan disebut sebagai meka- nisme dropout dan digunakan untuk mengklasifikasikan dropout. Pada umumnya, mekanisme dropout berada diluar kontrol dari peneliti, sehingga sulit untuk dipa- hami. Secara teoritis, dengan mengikuti analogi klasifikasi data hilang yang di- perkenalkan oleh Rubin (1976), berdasarkan mekanisme dropout, dropout dapat diklasifikasikan menjadi 3 jenis, yaitu: 1. Completely Random Dropout (CRD), yaitu ketika peluang terjadinya dropout tidak bergantung pada nilai yang terobservasi maupun nilai spe- sifik yang seharusnya dapat diobservasi. Dengan kata lain, dropout terjadi secara acak, sehingga subjek yang tidak mengalami dropout dapat dikata- kan sebagai sampel acak dari target populasi (๐‘› subjek). Dengan demikian, inferensi berdasarkan analisis yang dibatasi pada data dari subjek yang memiliki observasi lengkap dikatakan valid (lihat referensi Fitzmaurice dkk, 2004). 2. Random Dropout (RD), yaitu ketika peluang terjadinya dropout bergan- tung pada nilai yang terobservasi, tetapi tidak bergantung pada nilai spe- sifik yang seharusnya dapat diobservasi. Kebergantungan peluang dropout dengan nilai observasi historis untuk masing-masing subjek mengindikasi- LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
  • 19. Bab 2 Landasan Teori 6 kan bahwa data yang hilang dapat ditaksir dengan memanfaatkan data his- toris subjek. Tabel 2.1 Random dropout. ๐‘†๐‘ข๐‘๐‘—๐‘’๐‘˜ ๐‘‡๐‘–๐‘ก๐‘–๐‘˜โก๐‘Š๐‘Ž๐‘˜๐‘ก๐‘ข 1 2 โ€ฆ ๐‘— โ€ฆ ๐‘˜ โˆ’ 1 ๐‘˜ โ€ฆ ๐‘š ๐‘‹1 ๐‘‹2 โ€ฆ ๐‘‹๐‘— โ€ฆ ๐‘‹ ๐‘˜โˆ’1 ๐‘‹ ๐‘˜ โ€ฆ ๐‘‹ ๐‘š 1 ๐‘ฅ11 ๐‘ฅ12 โ€ฆ ๐‘ฅ1๐‘— โ€ฆ ๐‘ฅ1๐‘˜โˆ’1 ๐‘ฅ1๐‘˜ โ€ฆ ๐‘ฅ1๐‘š 2 ๐‘ฅ21 ๐‘ฅ22 โ€ฆ ๐‘ฅ2๐‘— โ€ฆ ๐‘ฅ2๐‘˜โˆ’1 ๐‘ฅ2๐‘˜ โ€ฆ ๐‘ฅ2๐‘š โ€ฆ โ€ฆ โ€ฆ โ€ฆ โ€ฆ โ€ฆ โ€ฆ โ€ฆ โ€ฆ โ€ฆ ๐‘– ๐‘ฅ๐‘–1 ๐‘ฅ๐‘–2 โ€ฆ ๐‘ฅ๐‘–๐‘— โ€ฆ ๐‘ฅ๐‘–๐‘˜โˆ’1 โˆ’ โˆ’ โˆ’ โ€ฆ โ€ฆ โ€ฆ โ€ฆ โ€ฆ โ€ฆ โ€ฆ โ€ฆ โ€ฆ โ€ฆ ๐‘› ๐‘ฅ ๐‘›1 ๐‘ฅ ๐‘›2 โ€ฆ ๐‘ฅ ๐‘›๐‘— โ€ฆ ๐‘ฅ ๐‘›๐‘˜โˆ’1 ๐‘ฅ ๐‘›๐‘˜ โ€ฆ ๐‘ฅ ๐‘›๐‘š Catatan: Dropout yang terjadi pada subjek ๐‘– pada waktu โก๐‘˜ bergantung pada observasi sebelumnya, yaitu ๐‘ฅ๐‘–1 hingga ๐‘ฅ๐‘–,๐‘˜โˆ’1. 3. Informative Dropout (IF), yaitu ketika peluang terjadinya dropout bergan- tung pada nilai yang terobservasi maupun nilai spesifik yang seharusnya dapat diobservasi. Karena dropout bergantung pada nilai yang tidak terob- servasi, maka informasi mengenai data historis saja tidak cukup untuk di- jadikan dasar dalam memprediksi data yang hilang. Tabel 2.2 Informative dropout. ๐‘†๐‘ข๐‘๐‘—๐‘’๐‘˜ ๐‘‡๐‘–๐‘ก๐‘–๐‘˜โก๐‘Š๐‘Ž๐‘˜๐‘ก๐‘ข 1 2 โ€ฆ ๐‘— โ€ฆ ๐‘˜ โˆ’ 1 ๐‘˜ โ€ฆ ๐‘š ๐‘‹1 ๐‘‹2 โ€ฆ ๐‘‹๐‘— โ€ฆ ๐‘‹ ๐‘˜โˆ’1 ๐‘‹ ๐‘˜ โ€ฆ ๐‘‹ ๐‘š 1 ๐‘ฅ11 ๐‘ฅ12 โ€ฆ ๐‘ฅ1๐‘— โ€ฆ ๐‘ฅ1๐‘˜โˆ’1 ๐‘ฅ1๐‘˜ โ€ฆ ๐‘ฅ1๐‘š 2 ๐‘ฅ21 ๐‘ฅ22 โ€ฆ ๐‘ฅ2๐‘— โ€ฆ ๐‘ฅ2๐‘˜โˆ’1 ๐‘ฅ2๐‘˜ โ€ฆ ๐‘ฅ2๐‘š โ€ฆ โ€ฆ โ€ฆ โ€ฆ โ€ฆ โ€ฆ โ€ฆ โ€ฆ โ€ฆ โ€ฆ ๐‘– ๐‘ฅ๐‘–1 ๐‘ฅ๐‘–2 โ€ฆ ๐‘ฅ๐‘–๐‘— โ€ฆ ๐‘ฅ๐‘–๐‘˜โˆ’1 โˆ’ โˆ’ โˆ’ โ€ฆ โ€ฆ โ€ฆ โ€ฆ โ€ฆ โ€ฆ โ€ฆ โ€ฆ โ€ฆ โ€ฆ ๐‘› ๐‘ฅ ๐‘›1 ๐‘ฅ ๐‘›2 โ€ฆ ๐‘ฅ ๐‘›๐‘— โ€ฆ ๐‘ฅ ๐‘›๐‘˜โˆ’1 ๐‘ฅ ๐‘›๐‘˜ โ€ฆ ๐‘ฅ ๐‘›๐‘š Catatan: Dropout yang terjadi pada subjek ๐‘– pada waktuโกโก๐‘˜ ber- gantung pada ๐‘ฅ๐‘–1 hingga ๐‘ฅ๐‘–,๐‘˜โˆ’1 dan pada nilai spesifik dari data yang seharusnya dapat diobservasi. LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
  • 20. Bab 2 Landasan Teori 7 2.1.2 Imputasi Melihat besarnya risiko yang ditimbulkan oleh dropout, dibutuhkan strategi pe- nanggulangan yang tepat. Salah satu metode primitif sederhana yang dahulu digunakan untuk menanggulangi data tidak lengkap ialah metode listwise deletion. Metode ini dapat diterapkan pada data longitudinal dengan dropout, yaitu dengan membuang data dari subjek yang tidak mengikuti studi hingga akhir. Dengan demikian, analisis hanya didasarkan pada subjek yang memiliki data lengkap. Metode listwise deletion mengasumsikan bahwa subjek yang mengalami dropout relatif sedikit dan data yang digunakan dalam analisis cukup repre- sentatif. Asumsi representatif hanya dapat dipastikan terpenuhi apabila dropout yang terjadi mengikuti mekanisme CRD dan jumlah subjek yang terlibat dalam studi tidak telalu sedikit. Selain itu, metode ini dapat menyebabkan hilangnya banyak informasi. Keterbatasan metode listwise deletion menyebabkan metode ini sudah banyak ditinggalkan dan digantikan oleh metode berbasis imputasi. Imputasi ialah strategi untuk mengisi data yang hilang dengan menggu- nakan nilai taksiran. Nilai taksiran yang dimaksud diperoleh dari suatu model dengan memanfaatkan data-data terobservasi. Setelah nilai yang hilang ditaksir, data dapat dianalisis menggunakan metode yang umum digunakan untuk menga- nalisis data longitudinal lengkap. Terdapat dua jenis imputasi, yaitu single imputation dan multiple imputa- tion. Berbeda dengan multiple imputation, sesuai dengan namanya, single imputa- tion menggunakan suatu nilai untuk mengisi data yang hilang, sehingga hanya diperoleh satu data lengkap. Beberapa metode single imputation yang sering digu- nakan ialah: 1. Mean subtitution, yaitu mengisi data hilang dari suatu subjek dengan menggunakan rata-rata dari seluruh observasi sebelumnya untuk subjek tersebut. Metode ini tidak mempertimbangkan trend dari data dan dapat menggeser nilai-nilai ekstrim ke tengah ditribusi, sehingga mengurangi variansi sampel dari variabel acak yang diimput, yaitu ๐‘‹ ๐‘˜. LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
  • 21. Bab 2 Landasan Teori 8 2. Regression-based imputation, yaitu mengisi data hilang dengan menggu- nakan persamaan regresi yang diperoleh dari subjek yang memiliki data lengkap hingga waktu ๐‘˜. Metode ini mengasumsikan bahwa model regresi yang sama dapat menjelaskan data dari subjek yang tidak mengalami dropout seperti halnya data dari subjek yang mengalami dropout. 3. Last Observation Carried Forward (LOCF), yaitu mengisi data hilang dengan menggunakan nilai observasi sebelumnya. Metode ini dapat digu- nakan apabila nilai pengukuran relatif konstan terhadap waktu. Walaupun metode LOCF hampir selalu menyebabkan adanya bias, kemudahan penerapannya membuat metode ini masih banyak diterapkan di bidang kedokteran. 4. Hot deck, yaitu mengisi data hilang dengan nilai observasi dari subjek lain yang memiliki kemiripan nilai pada observasi-observasi sebelumnya. Metode ini sulit diimplementasikan pada data kontinu dan lebih mudah diimplementasikan pada data kategorikal. Semakin banyak titik waktu yang dicocokkan, imputasi semakin akurat, namun kecocokan akan sema- kin jarang. 2.2 Konsep Dasar Teori Copula Copula merupakan alat untuk mengkonstruksi distribusi bersama dari marginal- marginal yang tidak harus berasal dari distribusi yang sama. Kontruksi dilakukan dengan mempertimbangkan struktur kebergantungan (asosiasi) antar marginal- marginalnya, sehingga dengan marginal yang sama dapat dibentuk beberapa dis- tribusi bersama yang berbeda. Menurut Ene Kรครคrik (2006b), konstruksi distribusi bersama menggunakan pendekatan copula memiliki beberapa keuntungan, yaitu: 1. Dengan menggunakan copula, distribusi marginal dapat diestimasi terlebih dahulu, kemudian mengkonstruksi distribusi bersamanya. LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
  • 22. Bab 2 Landasan Teori 9 2. Fungsi kebergantungan dapat diperoleh secara eksplisit sehingga lebih mu- dah untuk melihat kebergantungan secara spesifik. 3. Keluarga copula sangat banyak, sehingga dapat digunakan untuk memo- delkan distribusi secara luas. Berikut teorema yang menjadi dasar aplikasi teori copula pada bidang statistika (lihat referensi Nelsen, 2006): Teorema Sklar Misalkan terdapat distribusi bersamaโก๐น dengan marginal univariat ๐น1,โ€ฆ,๐น๐‘›. Maka terdapat sebuah copula ๐ถ sedemikian sehingga untuk semua ๐ฑโกdiโกโ„ฬ… ๐‘› , ๐น(๐‘ฅ1, โ€ฆ , ๐‘ฅ ๐‘›) = ๐ถ(๐น1(๐‘ฅ1), โ€ฆ , ๐น๐‘›(๐‘ฅ ๐‘›)). Jika ๐น1, โ€ฆ , ๐น๐‘› kontinu, makaโก๐ถ unik.โˆŽ Teorema Sklar secara eksplisit mengatakan bahwa setiap fungsi distribusi ber- sama dapat dituliskan dalam bentuk copula, dimana copula merupakan fungsi distribusi. Pada tugas akhir ini, pembahasan mengenai distribusi bersama dibatasi hanya pada distribusi bersama dengan marginal-marginal kontinu. ๐น digunakan untuk menotasikan fungsi distribusi dari suatu variabel acak kontinu. Misalkan ๐น๐‘— merupakan fungsi distribusi dari variabel acak ๐‘‹๐‘— dan ๐‘ˆ๐‘— merupakan Probability Integral Transform (PIT) dari ๐‘‹๐‘—, yaitu ๐‘ˆ๐‘— = ๐น๐‘—(๐‘‹๐‘—). De- ngan menggunakan metode fungsi distribusi, akan dibuktikan bahwa ๐‘ˆ๐‘— berdistri- busi uniform (0,1). ๐‘ƒ(๐‘ˆ๐‘— โ‰ค ๐‘ข)โกโกโกโก= ๐‘ƒ(๐น๐‘—(๐‘‹๐‘—) โ‰ค ๐‘ข) = ๐‘ƒ (๐‘‹๐‘— โ‰ค ๐น๐‘— โˆ’1 (๐‘ข)) = ๐น๐‘— (๐น๐‘— โˆ’1 (๐‘ข)) = ๐‘ข LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
  • 23. Bab 2 Landasan Teori 10 Fungsi distribusi merupakan fungsi monoton naik dengan nilai fungsi yang berada pada interval [0,1], sehingga ๐‘ข โˆˆ [0,1]. Dapat disimpulkan bahwa ๐‘ˆ๐‘—~๐‘ˆ(0,1). Dengan demikian, copula dapat dikatakan sebagai fungsi distribusi yang memiliki marginal-marginal uniform (0,1). Untuk lebih memahami PIT, akan dibangkitkan 10.000 data dari variabel acak ๐‘‹ yang berdistribusi ๐‘’๐‘ฅ๐‘โก(2). Berikut disajikan histogram dari data bangkitan: Gambar 2.1 Histogram data bangkitan dari distribusi ๐‘’๐‘ฅ๐‘โก(2). Data yang telah dibangkitkan ditransformasikan menggunakan fungsi berikut: 1. ๐น1(๐‘ฅ) = 1 โˆ’ ๐‘’โˆ’2๐‘ฅ , 2. ๐น2(๐‘ฅ) =โกโˆซ 1 โˆš2๐œ‹ exp [ โˆ’โก( ๐‘ฅโˆ’0.5)2 2 ] ๐‘ฅ โˆ’โˆž . Berikut disajikan histogram dari data hasil transformasi dengan kedua fungsi: Gambar 2.2 Histogram data hasil transformasi: (a) Menggunakan fungsi distribusi ๐‘’๐‘ฅ๐‘โก(2); (b) Menggunakan fungsi distribusi ๐‘(0,5; 1). LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
  • 24. Bab 2 Landasan Teori 11 Berdasarkan Gambar 2.2, histogram dari hasil tranformasi data menggunakan fungsi distribusi ๐‘’๐‘ฅ๐‘(2) mengindikasikan bahwa ๐น1(๐‘‹) berdistribusi uniform, di- mana densitas frekuensi tersebar merata pada interval (0,1). Histogram dari hasil tranformasi data menggunakan fungsi distribusi ๐‘(0,5; 1) tidak mengindikasikan bahwa ๐น2(๐‘‹) berdistribusi uniform. Dengan demikian, variabel acak ๐‘ˆ = ๐น(๐‘‹) akan berdistribusi uniform jika dan hanya jika ๐น merupakan fungsi distribusi dari ๐‘‹. 2.2.1 Densitas Copula Copula merupakan fungsi distribusi bersama, sehingga copula juga memiliki den- sitas bersama yang selanjutnya disebut sebagai densitas copula. Misalkan ๐‘ฟ = (๐‘‹1, โ€ฆ , ๐‘‹ ๐‘˜) ๐‘‡ merupakan vektor acak dengan fungsi distribusi marginal ๐น1, ๐น2, โ€ฆ , ๐น๐‘˜ dan fungsi distribusi bersama ๐น, sedemikian sehingga ๐‘‹๐‘—~๐น๐‘— dan ๐‘ฟ~๐น. Jika copula ๐ถ dan ๐น1, ๐น2, โ€ฆ , ๐น๐‘˜ memiliki turunan, maka dengan memanfaat- kan teorema Sklar diperoleh โก๐‘“(๐‘ฅ1, โ€ฆ , ๐‘ฅ ๐‘˜)โกโก=โก ๐œ• ๐‘˜ โก๐น(๐‘ฅ1, โ€ฆ , ๐‘ฅ ๐‘˜) ๐œ•๐‘ฅ1 โ€ฆ . ๐œ•๐‘ฅ ๐‘˜ =โก ๐œ• ๐‘˜ โก๐ถ(๐น1(๐‘ฅ1), โ€ฆ , ๐น๐‘˜(๐‘ฅ ๐‘˜))โก ๐œ•๐‘ฅ1โก๐œ•๐‘ฅ2 โ€ฆ โก๐œ•๐‘ฅ ๐‘˜ =โก ๐œ• ๐‘˜ โก๐ถ(๐น1(๐‘ฅ1), โ€ฆ , ๐น๐‘˜(๐‘ฅ ๐‘˜))โก ๐œ•๐น1(๐‘ฅ1) โ€ฆ โก๐œ•๐น๐‘˜(๐‘ฅ ๐‘˜) ร—โกโกโˆ ๐œ•๐น๐‘—(๐‘ฅ๐‘—) ๐œ•๐‘ฅ๐‘— โก ๐‘˜ ๐‘—=1 = โก๐‘(๐น1(๐‘ฅ1), โ€ฆ , ๐น๐‘˜(๐‘ฅ ๐‘˜))โกร—โก ๐‘“1(๐‘ฅ1)โกร— โ€ฆ .ร— ๐‘“๐‘˜(๐‘ฅ ๐‘˜),โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก(2. 1) dimana ๐‘(๐น1(๐‘ฅ1), โ€ฆ , ๐น๐‘˜(๐‘ฅ ๐‘˜)) merupakan turunan dari copula yang disebut seba- gai densitas copula dan ๐‘“๐‘— merupakan densitas dari variabel acak ๐‘‹๐‘—. Misalkan ๐‘ฟ merupakan vektor acak dengan marginal-marginal yang saling bebas, maka LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
  • 25. Bab 2 Landasan Teori 12 โก๐‘(๐น1(๐‘ฅ1), โ€ฆ , ๐น๐‘˜(๐‘ฅ ๐‘˜)) =โก ๐‘“(๐‘ฅ1, โ€ฆ , ๐‘ฅ ๐‘˜) ๐‘“1(๐‘ฅ1)โกร— โ€ฆ .ร— ๐‘“๐‘˜(๐‘ฅ ๐‘˜) = ๐‘“1(๐‘ฅ1)โกร— โ€ฆ .ร— ๐‘“๐‘˜(๐‘ฅ ๐‘˜) ๐‘“1(๐‘ฅ1)โกร— โ€ฆ .ร— ๐‘“๐‘˜(๐‘ฅ ๐‘˜) = 1. Dengan demikian, copula dapat dianggap sebagai ukuran asosiasi yang memban- dingkan antara densitas bersama dengan perkalian densitas marginalnya. 2.3 Distribusi Multivariat Normal Standar Distribusi multivariat normal standar merupakan distribusi yang memiliki mar- ginal-marginal normal standar. Misalkan ๐‘ฎ~๐‘๐‘˜(๐ŸŽ, ๐‘ฐ ๐‘˜) dan ๐‘นk merupakan matriks kovariansi Pearson berukuran ๐‘˜ ร— ๐‘˜โกyang bersifat simetri dan definit positif, dengan ๐‘‘๐‘–๐‘Ž๐‘”(๐‘นk) = (1,1, โ€ฆ , 1)T . Untuk mengkonstruksi distribusi multivariat normal standar dengan kovariansi ๐‘น ๐‘˜, definisikan ๐’ = ๐‘น ๐‘˜ 1 2 ๐‘ฎ. Dengan demikian, โก๐’~โก๐‘๐‘˜(๐ŸŽ, ๐‘นk). Karena ๐’ memiliki marginal normal standar, maka matriks ๐‘นk dapat dikatakan sebagai matriks korelasi Pearson. Akan dibuktikan bahwa matriks ๐‘นk harus memenuhi sifat simetri dan semi definit positif. Berikut definisi dari matriks simetri yang bersifat semi definit positif (lihat referensi Anton dan Rorres, 2005): Definisi Suatu matriks simetriโก๐‘จ โˆˆ โ„nxn dikatakan bersifat semi definit positif apabila untuk seluruh ๐ฎ โ‰  ๐ŸŽ dan ๐’–โก โˆˆ โ„n berlakuโก๐’–T ๐‘จโก๐’– โ‰ฅ 0.โˆŽ Untuk membuktikan bahwa ๐‘นk bersifat semi definit positif, akan dicari selang nilai dari ๐’– ๐‘‡ โก๐‘นkโก๐’–. Pada kasus ini, distribusi marginal ๐‘๐‘— ialah distribusi yang terpusat dan ๐‘นk merupakan matriks kovariansi, sehingga ๐‘นk = ๐ถ๐‘œ๐‘ฃโก(๐’) = ๐ธ[๐’๐’ ๐‘‡]. Dari definisi matriks kovariansi, dapat dilihat bahwa ๐‘น ๐‘˜ bersifat simetri. Kemudi- an dengan memanfaatkan sifat kelinieran ekspektasi, diperoleh LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
  • 26. Bab 2 Landasan Teori 13 ๐’– ๐‘‡ โก๐ถ๐‘œ๐‘ฃโก(๐’)โก๐’– = โก๐ธ[๐’– ๐‘ป โก๐’๐’ ๐‘‡ โก๐’–]โก= ๐ธ[(๐’– ๐‘ป โก๐’) ๐Ÿ]. Definisikan ๐‘บ =โก(๐’– ๐‘ป โก๐’). ๐‘บ merupakan variabel acak terpusat di 0, sehingga ๐’– ๐‘‡ โก๐ถ๐‘œ๐‘ฃโก(๐’)โก๐’– = โก๐ธ[๐‘บ ๐Ÿ] =โก ๐œŽ๐’” 2 โ‰ฅ 0. Dapat disimpulkan bahwa ๐‘นk bersifat semi definit positif. Namun, agar densitas distribusi multivariat normal berdasarkan definisi vector acak ๐’ dapat diperoleh, matriks ๐‘นk dibatasi memiliki sifat simetri dan definit positif (lihat referensi Hogg dan Craig, 2005). 2.3.1 Korelasi Pearson Korelasi Pearson merupakan ukuran kebergantungan linier (asosiasi linier) antara dua variabel acak. Korelasi Pearson untuk dua variabel acak ๐‘‹ dan ๐‘Œ didefinisikan sebagai ๐œŒ ๐‘‹๐‘Œ = ๐ถ๐‘œ๐‘ฃ(๐‘‹, ๐‘Œ) โˆš๐‘‰๐‘Ž๐‘Ÿ(๐‘‹)๐‘‰๐‘Ž๐‘Ÿ(๐‘Œ) = ๐ธ[๐‘‹๐‘Œ] โˆ’ ๐ธ[๐‘‹]๐ธ[๐‘Œ] โˆš(๐ธ[๐‘‹2] โˆ’ (๐ธ[๐‘‹])2)(๐ธ[๐‘Œ2] โˆ’ (๐ธ[๐‘Œ])2) .โกโก Beberapa hal yang harus dipahami mengenai korelasi Pearson adalah (Embrechts dkk, 1999): 1. Interval dari nilai korelasi Pearson yang mungkin bergantung pada distri- busi marginalnya (dalam hal ini distribusi dari ๐‘‹ dan distribusi dari ๐‘Œ). |๐œŒ ๐‘‹๐‘Œ| โ‰ค 1 untuk seluruh (๐‘‹, ๐‘Œ) yang merupakan bivariat eliptical distribu- tion, yaitu distribusi bivariat yang memiliki densitas konstan pada suatu elipsoid, contohnya distribusi bivariat normal. Secara umum, interval dari nilai korelasi Pearson yang mungkin merupakan subset dari [-1,1]. 2. Misalkan [๐œŒ ๐‘š๐‘–๐‘›, ๐œŒ ๐‘š๐‘Ž๐‘ฅ] menyatakan interval dari nilai korelasi Pearson yang mungkin dari dua peubah acak ๐‘‹ dan ๐‘Œ, maka ๐œŒ ๐‘‹๐‘Œ = ๐œŒ ๐‘š๐‘Ž๐‘ฅ menyata- kan bahwa ๐‘‹ dan ๐‘Œ saling bergantung secara positif sempurna, sedangkan LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
  • 27. Bab 2 Landasan Teori 14 ๐œŒ ๐‘‹๐‘Œ = ๐œŒ ๐‘š๐‘–๐‘› menyatakan bahwa ๐‘‹ dan ๐‘Œ saling bergantung secara negatif sempurna. 3. Korelasi Pearson hanya mengukur kebergantungan linier, sehingga apabila dua peubah acak saling bebas, maka ๐œŒ ๐‘‹๐‘Œ = 0, tetapi tidak berlaku seba- liknya. ๐œŒ ๐‘‹๐‘Œ = 0 menyatakan bahwa ๐‘‹ dan ๐‘Œ saling bebas jika dan hanya jika (๐‘‹, ๐‘Œ) berdistribusi bivariat normal. 4. Korelasi Pearson bersifat tidak invarian terhadap transformasi tak linier naik murni (nonlinear strictly increasing transformation). 5. Korelasi Pearson hanya terdefinisi jika dan hanya jika kedua variabel acak memiliki varansi yang berhingga. Korelasi Pearson menggambarkan bagaimana dua variabel bergerak ber- sama-sama. Hal yang sering disalahartikan ialah bahwa korelasi Pearson mengu- kur hubungan kausalitas. Penyataan ini tidak selalu benar karena variabel ๐‘‹ dapat dipengaruhi oleh ๐‘Œ, variabel ๐‘Œ dapat dipengaruhi oleh ๐‘‹, atau variabel ๐‘‹ dan ๐‘Œ dipengaruhi oleh variabel ketiga, misalkan ๐‘. Secara empiris, korelasi Pearson dapat diperoleh dengan menggunakan formula ๐œŒ ๐‘‹๐‘Œฬ‚ = ๐‘ ๐‘‹๐‘Œ = ๐‘† ๐‘‹๐‘Œ โˆš๐‘† ๐‘‹ ๐‘† ๐‘Œ = โˆ‘ (๐‘ฅ๐‘– โˆ’ ๐‘ฅฬ…)(๐‘ฆ๐‘– โˆ’ ๐‘ฆฬ…)๐‘› ๐‘–=1 โˆšโˆ‘ (๐‘ฅ๐‘– โˆ’ ๐‘ฅฬ…)2๐‘› ๐‘–=1 โกโˆ‘ (๐‘ฆ๐‘– โˆ’ ๐‘ฆฬ…)2๐‘› ๐‘–=1 โก, dimana ๐‘› menyatakan banyaknya sampel. Untuk selanjutnya, korelasi yang dimaksud dalam tugas akhir ini adalah korelasi Pearson. Korelasi empiris meru- pakan fungsi dari sampel (statistik) sehingga memiliki distribusi. Hotelling (1953) menyatakan bahwa apabila (๐‘‹, ๐‘Œ) berdistribusi bivariat normal, fungsi distribusi dari korelasi sampel dapat dituliskan sebagai berikut: ๐‘“๐‘ƒ ๐‘‹๐‘Œ (๐‘) = (๐‘› โˆ’ 2)ฮ“(๐‘› โˆ’ 1) โˆš2๐œ‹ฮ“ (๐‘› โˆ’ 1 2 ) (1 โˆ’ ๐œŒ๐‘) ๐‘›โˆ’ 3 2 โก(1 โˆ’ ๐œŒ2) ๐‘›โˆ’1 2 ร— (1 โˆ’ ๐‘2) ๐‘›โˆ’4 2 [1 + 1 4 ( ๐œŒ๐‘ + 1 2๐‘› โˆ’ 1 ) + 9 32 (๐œŒ๐‘ + 1)2 (2๐‘› โˆ’ 1)(2๐‘› + 1) + โ‹ฏ ]. LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
  • 28. Bab 2 Landasan Teori 15 Dapat dilihat bahwa distribusi dari korelasi empiris bergantung pada korelasi po- pulasi dan jumlah (ukuran) sampel. Kebergantungan dari masing-masing faktor dapat dilihat melalui perbandingan bentuk kurva densitas apabila faktor lainnya ditetapkan konstan. Pengaruh ukuran sampel terhadap distribusi dari korelasi empiris dapat di- lihat pada gambar berikut: Gambar 2.3 Pengaruh ukuran sampel terhadap distribusi korelasi empiris: (a) ๐œŒ = 0.2 ; (b) ๐œŒ = 0.5 ; (c) ๐œŒ = โˆ’0.2 ; (d) ๐œŒ = โˆ’0.5 Gambar 2.3 menunjukkan bahwa semakin besar ukuran sampel, maka peluang ๐‘ƒ๐‘‹๐‘Œ = ๐œŒ ๐‘‹๐‘Œ semakin besar. Ukuran sampel yang sedikit cenderung menyebabkan korelasi empiris salah dalam memprediksi korelasi populasi. Hal ini dapat dilihat dari grafik densitas peluang korelasi empiris untukโก๐‘› = 3, dimana nilai densitas- nya semakin membesar ketika mendekati 1 untuk nilai korelasi populasi positif dan semakin membesar ketika mendekati -1 untuk nilai korelasi populasi negatif. (d)(c) (b)(a) LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
  • 29. Bab 2 Landasan Teori 16 Pengaruh nilai korelasi populasi terhadap distribusi dari korelasi empiris dapat dilihat pada gambar berikut: Gambar 2.4 Pengaruh korelasi populasi terhadap distribusi korelasi empiris. Gambar 2.4 memperlihatkan bahwa apabila korelasi populasi mendekati -1 atau 1, maka dengan jumlah sampel yang sama, fungsi densitas di titik ๐‘ƒ๐‘‹๐‘Œ = ๐œŒ ๐‘‹๐‘Œ sema- kin besar. Berdasarkan Pham-Gia dan Choulakian (2014), distribusi dari matriks ko- relasi sampel juga bergantung pada jumlah sampel. Apabila ๐’€~๐‘ต ๐‘˜(๐, ๐šบ ๐‘˜) dimana matriks korelasi populasi ๐šฒ ๐‘˜ โ‰  ๐‘ฐ dan ๐šฒ ๐‘˜ โˆ’1 memiliki elemen diagonal ๐œ†๐‘–๐‘–, maka matriks korelasi sampel ๐‘ฒ dari suatu sampel acak berukuran ๐‘› memiliki fungsi peluang sebagai berikut : ๐‘“๐‘จ(๐‘ฒ) = [ฮ“ ( ๐‘› โˆ’ 1 2 )] ๐‘˜ exp {โˆ’ โˆ‘ ๐œ†๐‘–๐‘— ๐‘ ๐‘–๐‘— โˆš ๐œŽ๐‘–๐‘– ๐œŽ๐‘—๐‘—โก๐‘–<๐‘— } ๐œ‹ ๐‘˜(๐‘˜โˆ’1) 4 โˆ ฮ“ ( n โˆ’ i 2 )๐‘˜ ๐‘–=1 โก[|๐šฒ ๐‘˜| โˆ ๐œ†๐‘–๐‘– ๐‘˜ ๐‘–=1 ] ๐‘›โˆ’1 2 |๐‘ฒ| ๐‘›โˆ’๐‘˜โˆ’2 2 . 2.4 Copula Gaussian Untuk memperoleh distribusi bersama, selain dibutuhkan distribusi marginal dan nilai asosiasi (misalnya korelasi sebagai asosiasi linier), dibutuhkan pula struktur kebergantungan. Gaussian copula merupakan alat untuk mengkontruksi distribusi LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
  • 30. Bab 2 Landasan Teori 17 bersama dengan memanfaatkan struktur kebergantungan yang dimiliki oleh distri- busi multivariat normal standar. 2.4.1 Konstruksi Copula Gaussian Definisikan ฮฆ ๐‘˜ dan ๐œ™ ๐‘˜ berturut-turut sebagai fungsi distribusi dan fungsi densitas dari distribusi normal standar ๐‘˜-variat. Apabila ๐’~โก๐‘๐‘˜(๐ŸŽ, ๐‘นk), maka sesuai de- ngan Teorema Sklar berlaku ฮฆ ๐‘˜(๐‘ง1, โ€ฆ , ๐‘ง ๐‘˜|๐‘นk) = ๐ถ ๐‘”๐‘Ž๐‘ข๐‘ ๐‘ (ฮฆ1(๐‘ง1), โ€ฆ , ฮฆ1(๐‘งk)|๐‘นk).โกโกโกโกโกโกโกโกโกโกโกโกโกโก(2. 2) Selanjutnya, definisikan ๐‘ˆ๐‘— = ฮฆ1(๐‘๐‘—) untuk ๐‘— = 1, . . . , ๐‘˜. Dengan mendefinisikan variabel acak ๐‘ˆ๐‘—, persamaan 2.2 dapat dituliskan sebagai berikut: ๐ถ ๐‘”๐‘Ž๐‘ข๐‘ ๐‘ (๐‘ข1, โ€ฆ , ๐‘ขk|๐‘นk) = ฮฆ ๐‘˜(ฮฆ1 โˆ’1 (๐‘ข1), โ€ฆ , ฮฆ1 โˆ’1 (๐‘ขk)|๐‘นk).โกโกโกโกโกโกโก(2. 3) Sesuai dengan bukti yang telah dipaparkan pada sub bab 2.2, ๐‘ˆ๐‘— berdistri- busi ๐‘ˆ(0,1). Dengan memanfaatkan PIT, distribusi ๐‘ˆ(0,1) dapat dibentuk dengan mentrasformasikan suatu variabel acak kontinu sebarang dengan menggunakan fungsi distribusinya sendiri. Dengan demikian, masing-masing ๐‘ˆ๐‘— dapat dibentuk dari suatu variabel acak ๐‘‹๐‘—, dimana ๐‘‹๐‘—~๐น๐‘—. Langkah ini merupakan basis dari proses konstruksi copula Gaussian. Definisikan ๐‘พ ๐‘˜ = (๐‘Œ1, โ€ฆ , ๐‘Œ๐‘˜) ๐‘‡ = (ฮฆ1 โˆ’1 (๐น1(๐‘‹1)), โ€ฆ , ฮฆ1 โˆ’1 (๐น๐‘˜(๐‘‹ ๐‘˜))) ๐‘‡ , sehingga ๐‘Œ๐‘—~๐‘(0,1). Secara umum, matriks korelasi Pearson memiliki sifat tidak invarian terhadap transformasi monoton. Akibatnya, apabila ๐‘ฟ = (๐‘‹1, โ€ฆ , ๐‘‹ ๐‘˜) ๐‘‡ tidak berdistribusi multivariat normal standar, maka ๐ถ๐‘œ๐‘Ÿ๐‘Ÿ(๐‘ฟ) โ‰  ๐ถ๐‘œ๐‘Ÿ๐‘Ÿ(๐‘พ ๐‘˜). LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
  • 31. Bab 2 Landasan Teori 18 Definisikan ๐ถ๐‘œ๐‘Ÿ๐‘Ÿ(๐‘พ ๐‘˜) = ๐‘ซ ๐‘˜, sehingga ๐‘พk~๐‘๐‘˜(๐ŸŽ, ๐‘ซk). Dengan demiki- an, persamaan 2.3 dapat dituliskan sebagai berikut: ๐ถ ๐‘”๐‘Ž๐‘ข๐‘ ๐‘ (๐‘ข1, โ€ฆ , ๐‘ขk|๐‘ซk)โกโกโกโกโกโก= ฮฆ ๐‘˜(ฮฆ1 โˆ’1 (๐น1(๐‘ฅ1)), โ€ฆ , ฮฆ1 โˆ’1 (๐นk(๐‘ฅk))|๐‘ซk) = ฮฆ ๐‘˜(๐‘ฆ1, โ€ฆ , ๐‘ฆk|๐‘ซk).โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก(2. 4) Dapat dilihat pada persamaan 2.4, apabila ๐’™๐‘– = (๐‘ฅ๐‘–1, โ€ฆ , ๐‘ฅ๐‘–๐‘˜) ๐‘‡ merupakan sampel ke-๐‘– dari vektor acak ๐‘ฟ, pasangan nilai pada vektor ๐’™๐‘– mendefinisikan pasangan nilai pada vektor ๐’š๐‘– = (๐‘ฆ๐‘–1, โ€ฆ , ๐‘ฆ๐‘–๐‘˜) ๐‘‡ . Proses pembentukan pasangan nilai pada vektor ๐’š๐‘– = (๐‘ฆ๐‘–1, โ€ฆ , ๐‘ฆ๐‘–๐‘˜) ๐‘‡ termuat dalam parameter copula ๐‘ซ ๐‘˜. 2.4.2 Densitas Copula Gaussian Sesuai dengan persamaan 2.4, melalui proses perhitungan yang serupa dengan persamaan 2.1, densitas copula Gaussian dapat dituliskan sebagai berikut: ๐‘ ๐‘”๐‘Ž๐‘ข๐‘ ๐‘ (๐‘ข1, โ€ฆ , ๐‘ขk)โกโก= ๐œ™ ๐‘˜(๐‘ฆ1, โ€ฆ , ๐‘ฆk|๐‘ซk) ๐œ™1(๐‘ฆ1)โกร— โ€ฆ .ร— ๐œ™1(๐‘ฆk) = 1 (2๐œ‹) ๐‘˜ 2|๐‘ซk| 1 2 exp (โˆ’ 1 2 ๐’˜ ๐‘˜ ๐‘‡ ๐‘ซk โˆ’1 ๐’˜ ๐‘˜) โˆ 1 (2๐œ‹) 1 2 ๐‘˜ ๐‘—=1 ๐‘’๐‘ฅ๐‘ (โˆ’ 1 2 โก๐‘ฆ๐‘— 2 ) = |๐‘ซk|โˆ’ 1 2 โกโกexp (โˆ’ 1 2 ๐’˜ ๐‘˜ ๐‘‡ ๐‘ซk โˆ’1 ๐’˜ ๐‘˜) exp (โˆ’ 1 2 โก๐’˜ ๐‘˜ ๐‘‡ ๐’˜ ๐‘˜) =โก|๐‘ซk|โˆ’ 1 2 โกโกexp {โˆ’ 1 2 ๐’˜ ๐‘˜ ๐‘‡ (๐‘ซk โˆ’1 โˆ’ ๐šฐ)๐’˜ ๐‘˜}โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก(2. 5) LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
  • 32. Bab 2 Landasan Teori 19 2.4.3 Konstruksi Distribusi Bersama Densitas distribusi bersama merupakan perkalian antara densitas marginal dengan densitas copula. Dengan demikian, sesuai persamaan 2.1 dan 2.5, densitas dari suatu vector acak ๐‘ฟ yang dikonstruksi dengan menggunakan copula Gaussian ialah ๐‘“(๐‘ฅ1, โ€ฆ , ๐‘ฅ ๐‘˜) = ๐‘“1(๐‘ฅ1)โกร— โ€ฆโกร—โก ๐‘“๐‘˜(๐‘ฅ ๐‘˜)โก|๐‘ซk|โˆ’ 1 2โกโก๐‘’ {โˆ’ 1 2 ๐’˜ ๐‘˜ ๐‘‡(๐‘ซk โˆ’1 โˆ’๐šฐ)๐’˜ ๐‘˜} โกโกโกโกโก(2. 6) 2.4.4 Konstruksi Distribusi Bersyarat Distribusi bersyarat ialah distribusi dari suatu variabel acak ketika variabel acak lainnya diasumsikan telah memiliki nilai. Distribusi bersyarat diturunkan melalui analogi dari peluang bersyarat. Peluang bersyarat dapat dianggap sebagai pem- bentukan ruang sampel yang baru sebagai himpunan yang merupakan subset tak kosong dari ruang sampel sebelumnya tanpa mengubah bentuk distribusi dari sub- set tersebut. Misalkan terdapat sebuah eksperimen acak yang memiliki ruang sampel ๐œ…. ๐‘˜1 dan ๐‘˜2 merupakan subset dari ๐œ… sedemikian sehingga ๐‘ƒ(๐‘˜1) > 0. Untuk men- cari peluang dari ๐‘˜2 dibawah kondisi bahwa hasil yang muncul merupakan anggota dari ๐‘˜1, maka yang menjadi perhatian ialah irisan dari ๐‘˜2 dengan ๐‘˜1. Sesuai dengan definisi frekuensi relatif, maka kerelatifan diukur terhadap ๐‘˜1, sehingga ๐‘ƒ(๐‘˜2|โก๐‘˜1) = ๐‘ƒ(๐‘˜2 โˆฉ ๐‘˜1) ๐‘ƒ(๐‘˜1) .โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก(2. 7) Untuk menghitung densitas dari distribusi bersyarat, digunakan analogi dari persamaan 2.7. Definisikan ๐‘“(๐‘ฅ1, โ€ฆ , ๐‘ฅ ๐‘˜) sebagai densitas bersama dari vektor acak ๐‘ฟ = (๐‘‹1, โ€ฆ , ๐‘‹ ๐‘˜) ๐‘‡ dan ๐‘“(๐‘ฅ ๐‘˜|๐‘ฅ1, โ€ฆ , ๐‘ฅ ๐‘˜โˆ’1) sebagai densitas peluang variabel acak ๐‘‹ ๐‘˜ diberikan ๐‘‹1, โ€ฆ , ๐‘‹ ๐‘˜โˆ’1. Sesuai dengan persamaan 2.7, maka LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
  • 33. Bab 2 Landasan Teori 20 ๐‘“(๐‘ฅ ๐‘˜|๐‘ฅ1, โ€ฆ , ๐‘ฅ ๐‘˜โˆ’1) =โก ๐‘“(๐‘ฅ1, โ€ฆ , ๐‘ฅ ๐‘˜) โก๐‘“(๐‘ฅ1, โ€ฆ , ๐‘ฅ ๐‘˜โˆ’1) .โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก(2. 8) Sesuai persamaan 2.8, dapat disimpulkan bahwa untuk mencari distribusi ber- syarat dibutuhkan distribusi bersama. Dengan menggunakan persamaan 2.1, 2.5, dan 2.8, diperoleh ๐‘“(๐‘ฅ ๐‘˜|๐‘ฅ1, โ€ฆ , ๐‘ฅ ๐‘˜โˆ’1)โก=โก ๐‘ ๐‘”๐‘Ž๐‘ข๐‘ ๐‘ (๐‘ข1, โ€ฆ , ๐‘ข ๐‘˜)โกโก๐‘“1(๐‘ฅ1)โกโ€ฆโก๐‘“๐‘˜(๐‘ฅ ๐‘˜) ๐‘ ๐‘”๐‘Ž๐‘ข๐‘ ๐‘ (๐‘ข1, โ€ฆ , ๐‘ข ๐‘˜โˆ’1)โกโก๐‘“1(๐‘ฅ1)โกโ€ฆโก๐‘“๐‘˜โˆ’1(๐‘ฅ ๐‘˜โˆ’1) = ๐‘“๐‘˜(๐‘ฅ ๐‘˜) ๐‘ ๐‘”๐‘Ž๐‘ข๐‘ ๐‘ (๐‘ข1, โ€ฆ , ๐‘ข ๐‘˜) ๐‘ ๐‘”๐‘Ž๐‘ข๐‘ ๐‘ (๐‘ข1, โ€ฆ , ๐‘ข ๐‘˜โˆ’1) = ๐‘“๐‘˜(๐‘ฅ ๐‘˜)โก๐œ™ ๐‘˜(y1, โ€ฆ , yk|๐‘ซk)๐œ™1(y1)โกโ€ฆ ๐œ™1(ykโˆ’1) ๐œ™1(y1)โกโ€ฆโก๐œ™1(yk)๐œ™ ๐‘˜โˆ’1(y1, โ€ฆ , ykโˆ’1|๐‘ซkโˆ’1) = ๐‘“๐‘˜(๐‘ฅ ๐‘˜)โก๐œ™ ๐‘˜(y1, โ€ฆ , yk|๐‘ซk) ๐œ™1(yk)๐œ™ ๐‘˜โˆ’1(y1, โ€ฆ , ykโˆ’1|๐‘ซkโˆ’1) .โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก(2. 9) Karena ๐‘Œ๐‘— = ฮฆ1 โˆ’1 (๐น๐‘—(๐‘‹๐‘—)), maka ๐œ™1(๐‘ฆ๐‘—) = ๐‘“๐‘—(๐‘ฅ๐‘—). Dengan demikian, persamaan 2.9 dapat dituliskan sebagai berikut: ๐‘“(๐‘ฆ ๐‘˜|๐‘ฆ1, โ€ฆ , ๐‘ฆ ๐‘˜โˆ’1; ๐‘ซ ๐‘˜)โกโก= ๐œ™1(๐‘ฆ ๐‘˜)โก ๐œ™ ๐‘˜(๐‘ฆ1, โ€ฆ , ๐‘ฆ ๐‘˜; ๐‘ซ ๐‘˜) ๐œ™ ๐‘˜โˆ’1(๐‘ฆ1, โ€ฆ , ๐‘ฆ ๐‘˜โˆ’1; ๐‘ซ ๐‘˜โˆ’1) ร— ๐œ™1(๐‘ฆ ๐‘˜) โกโก.โกโกโกโก(2. 10) 2.5 Titik Maksimum Misalkan ๐ด merupakan domain dari suatu fungsi ๐‘“, dimana titik ๐‘ termuat dalam ๐ด. ๐‘“(๐‘) merupakan titik maksimum dari fungsi ๐‘“ di ๐ด apabila ๐‘“(๐‘) โ‰ฅ ๐‘“(๐‘ฅ) untuk semua ๐‘ฅ๐œ–๐ด. Apabila ๐‘“ kontinu pada interval [๐‘Ž, ๐‘], maka ๐‘“ memiliki titik maksi- mum (lihat referensi Purcell dkk, 2007). Titik maksimum yang didefinisikan pada interval tutup dapat berupa titik stasioner, titik ujung, maupun titik singular. LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
  • 34. Bab 2 Landasan Teori 21 Titik singular ialah titik interior dari domain fungsi dimana ๐‘“โ€ฒ(๐‘ฅ) tidak terdefinisi. Sedangkan titik stasioner merupakan titik dimana ๐‘“โ€ฒ(๐‘ฅ) = ๐‘‘๐‘“(๐‘ฅ) ๐‘‘๐‘ฅ = 0.โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก(2. 11) Tidak semua titik stasioner merupakan titik maksimum. Terdapat beberapa jenis titik stasioner pada fungsi satu variabel, yaitu titik maksimum, titik minimum, dan titik belok. Titik maksimum akan didapatkan apabila grafik ๐‘“(๐‘ฅ) terbuka ke bawah. Berikut teorema mengenai turunan kedua dari fungsi ๐‘“ (lihat referensi Purcell dkk, 2007): Teorema Misal fungsi ๐‘“ memiliki turunan kedua pada interval buka I. 1. Jika ๐‘“โ€ฒโ€ฒ(๐‘ฅ) > 0 untuk semua ๐‘ฅ di I, maka kurva ๐‘“ terbuka ke atas pada interval I. 2. Jika ๐‘“โ€ฒโ€ฒ(๐‘ฅ) < 0โกuntuk semua ๐‘ฅ di I, maka kurva ๐‘“ terbuka ke bawah pada interval I.โกโˆŽ 2.5.1 Titik Maksimum Fungsi Densitas Distribusi Normal Distribusi normal merupakan distribusi yang memiliki densitas bersifat log-con- cave karena memiliki fungsi densitas yang memenuhi ๐‘‘2 log ๐‘“(๐‘ฅ) ๐‘‘๐‘ฅ2 = โˆ’1 ๐œŽ2 < 0, dimana yang dimaksud dengan fungsi log disini ialah fungsi logaritma natural. Distribusi yang bersifat log-concave bersifat unimodal, yaitu memiliki satu titik dimana fungsi densitasnya bernilai maksimum. Hal ini dapat dilihat dari teorema mengenai turunan kedua dan sifat fungsi logaritma, yaitu bersifat monoton naik murni. Dengan demikian, untuk distribusi yang memiliki densitas bersifat log- LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
  • 35. Bab 2 Landasan Teori 22 concave, titik dimana fungsi densitas peluang bernilai maksimum merupakan titik stasioner dan dapat ditentukan dengan menggunakan turunan pertama. LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
  • 36. 23 Bab 3 Model Imputasi Sebelum mengkonstruksi model imputasi, terlebih dahulu akan dijelaskan skema imputasi yang dilakukan. Skema imputasi bergantung pada struktur dropout pada data. Beberapa struktur dropout yang mungkin terjadi pada proses pengambilan data longitudinal ialah : 1. Dropout terjadi pada beberapa subjek sekaligus dalam suatu waktu pengu- kuran, 2. Dropout terjadi pada beberapa subjek, dimana waktu terjadinya dropout antar subjek yang berbeda tidak beririsan, 3. Dropout terjadi pada beberapa subjek, dimana beberapa diantara subjek tersebut mengalami dropout di waktu yang sama. Dari ketiga struktur dropout diatas, struktur dropout ke-3 memuat dua struktur lainnya, sehingga struktur ini yang akan digunakan untuk mengilustrasikan skema imputasi yang akan dilakukan. Akan diberikan contoh kasus dimana proses drop- out mengikuti struktur dropout ke-3. Misalkan terdapat 10 subjek yang akan diobservasi sebanyak 6 kali. ๐‘ฅ๐‘–๐‘— menyatakan nilai observasi untuk subjek ๐‘– pada waktu ๐‘—. Selama proses pengam- bilan data, beberapa individu mengalami dropout, sehingga data yang diperoleh seperti pada tabel berikut: Tabel 3.1 Ilustrasi data longitudinal dengan dropout. ๐‘†๐‘ข๐‘๐‘—๐‘’๐‘˜ ๐‘‡๐‘–๐‘ก๐‘–๐‘˜โก๐‘Š๐‘Ž๐‘˜๐‘ก๐‘ข 1 2 3 4 5 6 ๐‘‹1 ๐‘‹2 ๐‘‹3 ๐‘‹4 ๐‘‹5 ๐‘‹6 1 ๐‘ฅ11 ๐‘ฅ12 ๐‘ฅ13 ๐‘ฅ14 ๐‘ฅ15 ๐‘ฅ16 2 ๐‘ฅ21 ๐‘ฅ22 ๐‘ฅ23 โˆ’ โˆ’ โˆ’ LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
  • 37. Bab 3 Model Imputasi 24 Definisikan variabel ๐‘˜ sebagai variabel yang menyatakan titik waktu ter- jadinya dropout pertama. Untuk kasus pada Tabel 3.1, ๐‘˜ = 3. Imputasi dilakukan pada data hilang untuk masing-masing individu yang mengalami dropout pada saat ๐‘˜. Setelah semua data hilang pada saat ๐‘˜ diimput, proses imputasi dilanjutkan dengan mengimput data yang hilang pada saat ๐‘˜ + 1, dan seterusnya. Proses ini disebut dengan sequential imputation. Untuk mengisi nilai-nilai yang hilang pada tiap proses imputasi berda- sarkan skema imputasi yang telah dijelaskan, akan dibahas salah satu model single imputation yang dikonstruksi dengan memanfaatkan distribusi bersyarat. Menurut Ene Kรครคrik (2006b), dengan meggunakan distribusi bersyarat, karakteristik dari distribusi seperti mean, deviasi standard, dan kuantil dapat dengan mudah dijelaskan secara analitik. Selain itu, dengan memanfaatkan distribusi bersyarat, sampel acak dari data hilang dapat dibangkitkan, sehingga dengan kata lain, model yang dihasilkan dapat dikembangkan menjadi model multiple imputation. 3.1 Model Umum Imputasi Pada sub bab ini, akan dikonstruksi sebuah model umum imputasi untuk meng- imput nilai ๐‘ฅ๐‘–๐‘˜, yaitu data hilang dari individu ๐‘– pada saat ๐‘˜. Untuk mempermudah penulisan, selanjutnya ๐‘ฅ๐‘–๐‘˜ dituliskan sebagai ๐‘ฅ ๐‘˜. Misalkan terdapat ๐‘› subjek yang akan diukur sebanyak ๐‘š kali. ๐‘ฟ = (๐‘‹1, โ€ฆ , ๐‘‹ ๐‘š) ๐‘‡ merupakan vektor acak peng- ukuran pada titik waktu diskrit 1,2, โ€ฆ , ๐‘š. Apabila masing-masing subjek diang- 3 ๐‘ฅ31 ๐‘ฅ32 ๐‘ฅ33 ๐‘ฅ34 ๐‘ฅ35 ๐‘ฅ36 4 ๐‘ฅ41 ๐‘ฅ42 โˆ’ โˆ’ โˆ’ โˆ’ 5 ๐‘ฅ51 ๐‘ฅ52 ๐‘ฅ53 ๐‘ฅ54 ๐‘ฅ55 ๐‘ฅ56 6 ๐‘ฅ61 ๐‘ฅ62 ๐‘ฅ63 โˆ’ โˆ’ โˆ’ 7 ๐‘ฅ71 ๐‘ฅ72 ๐‘ฅ73 ๐‘ฅ74 ๐‘ฅ75 ๐‘ฅ76 8 ๐‘ฅ81 ๐‘ฅ82 โˆ’ โˆ’ โˆ’ โˆ’ 9 ๐‘ฅ91 ๐‘ฅ92 ๐‘ฅ93 ๐‘ฅ94 ๐‘ฅ95 ๐‘ฅ96 10 ๐‘ฅ10,1 ๐‘ฅ10,2 ๐‘ฅ10,3 ๐‘ฅ10,4 ๐‘ฅ10,5 ๐‘ฅ10,6 LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
  • 38. Bab 3 Model Imputasi 25 gap sebagai sampel acak dari ๐‘ฟ, maka data dari masing-masing subjek dapat dikatakan sebagai realisasi dari vektor acak ๐‘ฟ. Dengan demikian, untuk mencari nilai ๐‘ฅ ๐‘˜ berdasarkan observasi sebelumnya, yaitu ๐‘ฅ1, โ€ฆ , ๐‘ฅ ๐‘˜โˆ’1, setara dengan men- cari distribusi dari ๐‘‹ ๐‘˜ bersyarat ๐‘‹1, . . . , ๐‘‹ ๐‘˜โˆ’1. Sesuai persamaan 2.9 dan 2.10, densitas ๐‘‹ ๐‘˜ bersyarat ๐‘‹1, . . . , ๐‘‹ ๐‘˜โˆ’1 dapat dituliskan sebagai densitas ๐‘Œ๐‘˜ bersyarat ๐‘Œ1, . . . , ๐‘Œ๐‘˜โˆ’1. Definisikan ๐‘ฏ = (๐‘Œ1, โ€ฆ , ๐‘Œ๐‘˜โˆ’1) ๐‘‡ sebagai vektor acak historis. Dengan demikian, matriks ๐‘ซ ๐‘˜ dapat dipartisi menja- di ๐‘ซ ๐‘˜ = ( ๐‘ซ ๐‘˜โˆ’1 ๐’“ ๐’“ ๐‘‡ 1 ), dimana ๐‘ซ ๐‘˜โˆ’1 merupakan matriks korelasi dari vektor acak historis ๐‘ฏ yang berukuran (๐‘˜ โˆ’ 1) ร— (๐‘˜ โˆ’ 1) dan ๐’“ merupakan matriks korelasi antara variabel acak pada vektor historis dengan ๐‘Œ๐‘˜. Kemudian, dengan mensubstitusikan fungsi densitas distribusi normal ke persamaan 2.10, diperoleh ๐‘“(๐‘ฆ ๐‘˜|๐‘ฏ; ๐‘ซ ๐‘˜)โก= ๐œ™1(๐‘ฆ ๐‘˜)โก 1 (2๐œ‹) ๐‘˜ 2|๐‘ซ ๐‘˜| 1 2 ๐‘’ {โˆ’ 1 2 ๐’˜ ๐‘˜ ๐‘‡ ๐‘ซ ๐‘˜ โˆ’1 ๐’˜ ๐‘˜} ( 1 (2๐œ‹) ๐‘˜โˆ’1 2 |๐‘ซ ๐‘˜โˆ’1| 1 2 ๐‘’ {โˆ’ 1 2 ๐’˜ ๐‘˜โˆ’1 ๐‘‡ ๐‘ซ ๐‘˜โˆ’1 โˆ’1 ๐’˜ ๐‘˜โˆ’1} 1 (2๐œ‹) 1 2 ๐‘’ {โˆ’ 1 2 ๐‘ฆk 2} ) = ๐œ™1(๐‘ฆ ๐‘˜)|๐‘ซ ๐‘˜โˆ’1| 1 2 ๐‘’โˆ’ 1 2 (๐’˜ ๐‘˜ ๐‘ป ๐‘ซ ๐‘˜ โˆ’1 ๐’˜ ๐‘˜โˆ’๐’˜ ๐‘˜โˆ’1 ๐‘ป ๐‘ซ ๐‘˜โˆ’1 โˆ’1 ๐’˜ ๐‘˜โˆ’1โˆ’๐‘ฆk 2) |๐‘ซ ๐‘˜| 1 2 .โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก(3. 1) Untuk mendapatkan taksiran terbaik dari ๐‘ฅ ๐‘˜, akan dicari nilai ๐‘ฆ ๐‘˜ yang me- maksimumkan densitas bersyarat pada persamaan 3.1. Sesuai dengan pembahasan pada bab 2.5.1, titik maksimum dari fungsi densitas distribusi normal merupakan titik stasioner. Dengan demikian, nilai ๐‘ฆ ๐‘˜ yang memaksimumkan densitas ber- syarat pada persamaan 3.1 ialah titik yang memenuhi persamaan berikut: LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
  • 39. Bab 3 Model Imputasi 26 ๐‘‘๐‘“(๐‘ฆ ๐‘˜|๐‘ฏ; ๐‘ซ ๐‘˜) ๐‘‘๐‘ฆ ๐‘˜ = 0.โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก(3. 2) Untuk mempermudah mencari titik stasioner dengan menggunakan formula 3.2 akan dicari bentuk sederhana dari ๐’˜ ๐‘˜ ๐‘ป ๐‘ซ ๐‘˜ โˆ’1 ๐’˜ ๐‘˜ โˆ’ ๐’˜ ๐‘˜โˆ’1 ๐‘ป ๐‘ซ ๐‘˜โˆ’1 โˆ’1 ๐’˜ ๐‘˜โˆ’1. Penyeder- hanaan ini digunakan untuk memisahkan ๐‘ฆ ๐‘˜ dari matriks ๐’˜ ๐‘˜. Selain itu, akan dicari bentuk sederhana dari โก|๐‘ซ ๐‘˜โˆ’1| 1 2 |๐‘ซ ๐‘˜| 1 2 . Untuk mencari bentuk sederhana dari |๐‘ซ ๐‘˜โˆ’1| 1 2 |๐‘ซ ๐‘˜| 1 2 , mula-mula ๐‘ซ ๐‘˜ dituliskan dalam bentuk matriks partisi, sehingga |๐‘ซ ๐‘˜โˆ’1| 1 2 |๐‘ซ ๐‘˜| 1 2 dapat dituliskan dalam bentuk berikut: |๐‘ซ ๐‘˜โˆ’1| 1 2 |๐‘ซ ๐‘˜| 1 2 = |๐‘ซ ๐‘˜โˆ’1| 1 2 | ๐‘ซ ๐‘˜โˆ’1 ๐’“ ๐’“ ๐‘‡ 1 | 1 2 = ( | ๐‘ซ ๐‘˜โˆ’1 ๐’“ ๐’“ ๐‘‡ 1 | |๐‘ซ ๐‘˜โˆ’1| ) โˆ’ 1 2 โก.โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก(3. 3) Selanjutnya, akan dicari nilai dari | ๐‘ซ ๐‘˜โˆ’1 ๐’“ ๐’“ ๐‘‡ 1 | terlebih dahulu. Sesuai de- ngan Silvester (1999), ( ๐‘ซ ๐‘˜โˆ’1 ๐’“ ๐’“ ๐‘‡ 1 ) ( ๐‘ฐ ๐‘˜โˆ’1 ๐ŸŽ ๐‘˜โˆ’1,1 โˆ’๐’“ ๐‘‡ 1 ) = ( ๐‘ซ ๐‘˜โˆ’1 โˆ’ ๐’“๐’“ ๐‘‡ ๐’“ ๐ŸŽ1,๐‘˜โˆ’1 1 ). Kemudian, dengan mengaplikasikan determinan terhadap kedua ruas, diperoleh | ๐‘ซ ๐‘˜โˆ’1 ๐’“ ๐’“ ๐‘‡ 1 | | ๐‘ฐ ๐‘˜โˆ’1 ๐ŸŽ ๐‘˜โˆ’1,1 โˆ’๐’“ ๐‘‡ 1 | = | ๐‘ซ ๐‘˜โˆ’1 โˆ’ ๐’“๐’“ ๐‘‡ ๐’“ ๐ŸŽ1,๐‘˜โˆ’1 1 | โก| ๐‘ซ ๐‘˜โˆ’1 ๐’“ ๐’“ ๐‘‡ 1 | 1 = | ๐‘ซ ๐‘˜โˆ’1 โˆ’ ๐’“๐’“ ๐‘‡ ๐’“ ๐ŸŽ1,๐‘˜โˆ’1 1 | | ๐‘ซ ๐‘˜โˆ’1 ๐’“ ๐’“ ๐‘‡ 1 | = |๐‘ซ ๐‘˜โˆ’1 โˆ’ ๐’“๐’“ ๐‘‡|.โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก(3. 4) LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
  • 40. Bab 3 Model Imputasi 27 Dengan menggunakan persamaan 3.3 dan 3.4, maka bentuk sederhana dari |๐‘ซ ๐‘˜โˆ’1| 1 2 |๐‘ซ ๐‘˜| 1 2 adalah |๐‘ซ ๐‘˜โˆ’1| 1 2 |๐‘ซ ๐‘˜| 1 2 โก= {|๐‘ซ ๐‘˜โˆ’1 โˆ’ ๐’“๐’“ ๐‘‡|โกโก|๐‘ซ ๐‘˜โˆ’1|โˆ’1}โˆ’ 1 2 =โก{|๐‘ซ ๐‘˜โˆ’1 โˆ’ ๐’“๐’“ ๐‘‡|โก|๐‘ซ ๐‘˜โˆ’1 โˆ’1 |}โˆ’โก 1 2 = |(๐‘ซ ๐‘˜โˆ’1 โˆ’ ๐’“๐’“ ๐‘‡ )(๐‘ซ ๐‘˜โˆ’1 โˆ’1 )|โˆ’ 1 2โก = |1 โˆ’ ๐’“ ๐‘‡ โก๐‘ซ ๐‘˜โˆ’1 โˆ’1 ๐’“|โˆ’ 1 2 = (1 โˆ’ ๐’“ ๐‘ป โก๐‘ซ ๐’Œโˆ’๐Ÿ โˆ’๐Ÿ ๐’“) โˆ’โก 1 2.โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก(3. 5) Selanjutnya, akan dicari bentuk sederhana dari ๐’˜ ๐‘˜ ๐‘ป ๐‘ซ ๐‘˜ โˆ’1 ๐’˜ ๐‘˜ โˆ’ ๐’˜ ๐‘˜โˆ’1 ๐‘ป ๐‘ซ ๐‘˜โˆ’1 โˆ’1 ๐’˜ ๐‘˜โˆ’1. Sebagai langkah awal dari proses penyederhanaan, tuliskan ๐‘ซ ๐‘˜ โˆ’1 sebagai matriks partisi yang memuat ๐‘ซ ๐‘˜โˆ’1 โˆ’1 , yaitu ๐‘ซ ๐‘˜ โˆ’1 = ( (๐‘ซ ๐‘˜โˆ’1 โˆ’ ๐’“๐’“ ๐‘‡)โˆ’1 โˆ’๐‘ซ ๐‘˜โˆ’1 โˆ’1 ๐’“(1 โˆ’ ๐’“ ๐‘‡ ๐‘ซ ๐‘˜โˆ’1 โˆ’1 ๐’“)โˆ’1 โˆ’(1 โˆ’ ๐’“ ๐‘‡ ๐‘ซ ๐‘˜โˆ’1 โˆ’1 ๐’“)โˆ’1 ๐’“ ๐‘‡ ๐‘ซ ๐‘˜โˆ’1 โˆ’1 (1 โˆ’ ๐’“ ๐‘‡ ๐‘ซ ๐‘˜โˆ’1 โˆ’1 ๐’“)โˆ’1 ).โกโกโกโกโก(3. 6) Penurunan persamaan 3.6 dapat dilihat pada Lampiran A.1. Kemudian dengan menggunakan persamaan 3.5 dan 3.6, diperoleh ๐’˜ ๐‘˜ ๐‘ป ๐‘ซ ๐‘˜ โˆ’1 ๐’˜ ๐‘˜ โˆ’ ๐’˜ ๐‘˜โˆ’1 ๐‘ป ๐‘ซ ๐‘˜โˆ’1 โˆ’1 ๐’˜ ๐‘˜โˆ’1 = (๐‘ฆ ๐‘˜ โˆ’ ๐’“ ๐‘‡ ๐‘ซ ๐‘˜โˆ’1 โˆ’1 ๐’˜ ๐‘˜โˆ’1)2 1 โˆ’ ๐’“ ๐‘‡โก๐‘ซkโˆ’1 โˆ’1 ๐’“ โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก(3. 7) (untuk lebih jelasnya, lihat Lampiran A.2). Selanjutnya, dengan mensubstitusikan persamaan 3.7 dan 3.5 ke persamaan 3.1, diperoleh ๐‘“(๐‘ฆ ๐‘˜|๐‘ฏ; ๐‘ซ ๐‘˜) = ๐œ™1(๐‘ฆ ๐‘˜)โกexp {โˆ’ 1 2 ( (๐‘ฆ ๐‘˜ โˆ’ ๐’“ ๐‘‡ ๐‘ซ ๐‘˜โˆ’1 โˆ’1 ๐’˜ ๐‘˜โˆ’1)2 1 โˆ’ ๐’“ ๐‘‡โก๐‘ซkโˆ’1 โˆ’1 ๐‘Ÿ โˆ’ ๐‘ฆk 2 )} (1 โˆ’ ๐’“ ๐‘‡โก๐‘ซkโˆ’1 โˆ’1 ๐ซ) 1 2 .โกโกโกโกโกโก(3. 8) LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
  • 41. Bab 3 Model Imputasi 28 Karena persamaaan 3.8 memuat fungsi eksponen, maka untuk mempermudah mencari turunan dari ๐‘“(๐‘ฆ ๐‘˜|๐‘ฏ; ๐‘ซ ๐‘˜) terhadap variabel ๐‘ฆ ๐‘˜, definisikan ๐‘™(๐‘ฆ ๐‘˜) = ln ๐‘“(๐‘ฆ ๐‘˜|๐‘ฏ; ๐‘ซ ๐‘˜), sehingga ๐‘™(๐‘ฆ ๐‘˜) = ln (โก ๐‘’โˆ’ 1 2 ๐‘ฆk 2 (2๐œ‹) 1 2 ) โˆ’ 1 2 ln(1 โˆ’ ๐’“ ๐‘‡ โก๐‘ซkโˆ’1 โˆ’1 ๐’“) โˆ’ 1 2 ( (๐‘ฆ ๐‘˜ โˆ’ ๐’“ ๐‘‡ ๐‘ซ ๐‘˜โˆ’1 โˆ’1 ๐’˜ ๐‘˜โˆ’1)2 1 โˆ’ ๐’“ ๐‘‡โก๐‘ซkโˆ’1 โˆ’1 ๐’“ โˆ’ ๐‘ฆk 2 ) = โˆ’ 1 2 ๐‘ฆk 2 โˆ’ 1 2 ln(2ฯ€) โˆ’ 1 2 lnโก(1 โˆ’ ๐’“ ๐‘‡ โก๐‘ซkโˆ’1 โˆ’1 ๐’“) โˆ’ 1 2 ( (๐‘ฆ ๐‘˜โˆ’๐’“ ๐‘‡ ๐‘ซ ๐‘˜โˆ’1 โˆ’1 ๐’˜ ๐‘˜โˆ’1) 2 1โˆ’๐’“ ๐‘‡โก๐‘ซkโˆ’1 โˆ’1 ๐’“ โˆ’ ๐‘ฆk 2 ). Fungsi logaritma merupakan fungsi monoton naik murni, sehingga memak- simumkan nilai suatu fungsi sama saja dengan memaksimumkan nilai dari logaritma fungsi tersebut. Turunan dari ๐‘™(๐‘ฆ ๐‘˜) terhadap variabel ๐‘ฆ ๐‘˜ adalah ๐‘‘๐‘™(๐‘ฆ ๐‘˜) ๐‘‘๐‘ฆ ๐‘˜ = โˆ’๐‘ฆ ๐‘˜ + ๐’“ ๐‘‡ ๐‘ซ ๐‘˜โˆ’1 โˆ’1 ๐’˜ ๐‘˜โˆ’1 1 โˆ’ ๐’“ ๐‘‡โก๐‘ซkโˆ’1 โˆ’1 ๐‘Ÿ .โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก(3. 9) Sesuai dengan formula 3.2, dengan menyelesaikan persamaan โˆ’๐‘ฆ ๐‘˜ + ๐’“ ๐‘‡ ๐‘ซ ๐‘˜โˆ’1 โˆ’1 ๐’˜ ๐‘˜โˆ’1 1 โˆ’ ๐’“ ๐‘‡โก๐‘ซkโˆ’1 โˆ’1 ๐‘Ÿ = 0, diperoleh titik stasioner dari fungsi ๐‘“(๐‘ฆ ๐‘˜|๐‘ฏ; ๐‘ซ ๐‘˜), yaitu ๐‘ฆ ๐‘˜ = ๐’“ ๐‘‡ ๐‘ซ ๐‘˜โˆ’1 โˆ’1 ๐’˜ ๐‘˜โˆ’1. Teorema pada sub bab 2.5 menyatakan bahwa titik maksimum akan di- dapatkan apabila grafik ๐‘™(๐‘ฆ ๐‘˜) terbuka ke bawah, sehingga turunan kedua dapat dimanfaatkan untuk menentukan apakah โก๐‘ฆ ๐‘˜ = ๐’“ ๐‘‡ ๐‘ซ ๐‘˜โˆ’1 โˆ’1 ๐’˜ ๐‘˜โˆ’1 adalah titik maksi- mum. Berikut turunan kedua dari fungsi ๐‘™(๐‘ฆ ๐‘˜) terhadap ๐‘ฆ ๐‘˜: ๐‘‘2 ๐‘™(๐‘ฆ ๐‘˜) ๐‘‘๐‘ฆ ๐‘˜ 2 =โก โˆ’1 1 โˆ’ ๐’“ ๐‘‡โก๐‘ซkโˆ’1 โˆ’1 ๐’“ LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
  • 42. Bab 3 Model Imputasi 29 Akan dibuktikan bahwa โˆ’(1 โˆ’ ๐’“ ๐‘‡ โก๐‘ซkโˆ’1 โˆ’1 ๐’“) โˆ’1 selalu bernilai negatif. Sesuai de- ngan persamaan 3.5, 1 1 โˆ’ ๐’“ ๐‘‡โก๐‘ซkโˆ’1 โˆ’1 ๐’“ =โก |๐‘ซ ๐‘˜โˆ’1| |๐‘ซ ๐‘˜| (1 โˆ’ ๐’“ ๐‘‡ โก๐‘ซkโˆ’1 โˆ’1 ๐’“)โก|๐‘ซ ๐‘˜โˆ’1| =โก|๐‘ซ ๐‘˜|.โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก(3. 10) Persamaan 3.10 dapat dimanfaatkan untuk mengetahui rentang nilai dari (1 โˆ’ ๐’“ ๐‘‡ โก๐‘ซkโˆ’1 โˆ’1 ๐’“) โˆ’1 . Akan dicari terlebih dahulu rentang nilai untuk |๐‘ซ ๐‘˜|โก, |๐‘ซ ๐‘˜โˆ’1|โก, dan ๐’“ ๐‘‡ โก๐‘ซkโˆ’1 โˆ’1 ๐’“. Misal ๐’š = ๐‘ซ ๐‘˜โˆ’1 โˆ’1 ๐’“. Karena matriks ๐‘ซ ๐‘˜โˆ’1 bersifat definit positif dan simetri, maka berlaku ๐’š ๐‘‡ ๐‘ซ ๐‘˜โˆ’1 ๐’š > 0 (๐‘ซ ๐‘˜โˆ’1 โˆ’1 ๐’“) ๐‘‡ โก๐‘ซ ๐‘˜โˆ’1โก(๐‘ซ ๐‘˜โˆ’1 โˆ’1 ๐’“) > 0โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก (๐‘ซ ๐‘˜โˆ’1 โˆ’1 ๐’“) ๐‘‡ โกโก๐’“ > 0โกโกโกโกโกโก ๐’“ ๐‘‡ ๐‘ซ ๐‘˜โˆ’1 โˆ’1 โกโก๐’“ > 0. Kemudian karena ๐‘ซ ๐‘˜ merupakan matriks definit positif, maka |๐‘ซ ๐‘˜|, |๐‘ซ ๐‘˜โˆ’1| > 0, sehingga selang nilai yang mungkin dari 1 โˆ’ ๐’“ ๐‘‡ โก๐‘ซkโˆ’1 โˆ’1 ๐’“ ialah 0 < 1 โˆ’ ๐’“ ๐‘‡ โก๐‘ซkโˆ’1 โˆ’1 ๐’“ < 1. Dengan demikian, โˆ’(1 โˆ’ ๐’“ ๐‘‡ โก๐‘ซkโˆ’1 โˆ’1 ๐’“โก) โˆ’1 selalu bernilai negatif untuk sebarang matriks korelasi. Dapat disimpulkan bahwa ๐‘ฆ ๐‘˜ = ๐’“ ๐‘‡ ๐‘ซ ๐‘˜โˆ’1 โˆ’1 ๐’˜ ๐‘˜โˆ’1 adalah titik di- mana fungsi densitas ๐‘“(๐‘ฆ ๐‘˜|๐‘ฏ; ๐‘ซ ๐‘˜) mencapai nilai maksimum. Karena telah memenuhi kriteria penaksir untuk ๐‘ฆ ๐‘˜, maka taksiran dari ๐‘ฆ ๐‘˜ adalah ๐‘ฆ ๐‘˜ฬ‚ = ๐’“ ๐‘‡ ๐‘ซ ๐‘˜โˆ’1 โˆ’1 ๐’˜ ๐‘˜โˆ’1.โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก(3. 11) LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
  • 43. Bab 3 Model Imputasi 30 Dengan demikian, formula umum imputasi untuk ๐‘ฅ ๐‘˜ adalah ๐‘ฅ ๐‘˜ฬ‚ โก= ๐น๐‘˜ โˆ’1 (ฮฆ1(๐‘ฆ ๐‘˜ฬ‚)) โกโก=โก ๐น๐‘˜ โˆ’1 (ฮฆ1(๐’“ ๐‘‡ ๐‘ซ ๐‘˜โˆ’1 โˆ’1 ๐’˜ ๐’Œโˆ’๐Ÿ)).โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก(3. 12) 3.2 Struktur Korelasi Untuk menaksir nilai ๐‘ฆ ๐‘˜ menggunakan formula 3.11, dibutuhkan matriks ๐’“ ๐‘‡ yang memuat korelasi antara variabel pada vektor acak historis dengan ๐‘Œ๐‘˜. Karena ๐‘Œ๐‘˜ merupakan variabel acak yang memuat sampel tak terobservasi, korelasi sampel tidak dapat dihitung. Salah satu cara agar korelasi sampel dapat dihitung ialah dengan menge- luarkan seluruh data subjek tak terobservasi dari perhitungan. Namun, karena karakteristik dari subjek yang mengalami dropout mungkin saja berbeda dari subjek yang tidak mengalami dropout, korelasi sampel yang dihitung dari subjek yang tidak mengalami dropout dapat menyebabkan bias pada hasil imputasi. Tanpa mengeluarkan subjek dengan dropout dari perhitungan, matriks korelasi dapat ditaksir dengan mengasumsikan struktur korelasi tertentu. Apabila struktur korelasi telah diasumsikan, taksiran matriks ๐’“ ๐‘‡ dapat ditentukan setelah matriks korelasi historis, ๐‘ซ ๐‘˜โˆ’1 ditaksir. 3.2.1 Struktur Korelasi Compound Symmetry Matriks dengan struktur compound symmetry (CS) memiliki nilai 1 pada seluruh elemen diagonalnya dan memiliki nilai konstan untuk elemen lainnya. Apabila matriks korelasi mengikuti struktur matriks CS, maka korelasi antara dua variabel acak yang berbeda selalu bernilai sama. LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
  • 44. Bab 3 Model Imputasi 31 Apabila ๐œŒ didefinisikan sebagai koefisien korelasi, bentuk matriks ๐‘ซ ๐‘˜โˆ’1 dibawah struktur CS adalah ๐‘ซ ๐‘˜โˆ’1 ๐ถ๐‘† = ( 1 ๐œŒ โ€ฆ ๐œŒ ๐œŒ โ‹ฑ โ‹ฑ โ‹ฎ โ‹ฎ โ‹ฑ 1 ๐œŒ ๐œŒ โ€ฆ ๐œŒ 1 )โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก๐’“ ๐ถ๐‘† = ( ๐œŒ โ‹ฎ ๐œŒ ). Untuk mencari nilai taksiran ๐‘ฆ ๐‘˜ dengan menggunakan formula 3.11 akan dicari terlebih dahulu invers dari matriks ๐‘ซ ๐‘˜โˆ’1 ๐ถ๐‘† . Matriks ๐‘ซ ๐‘˜โˆ’1 ๐ถ๐‘† dapat dituliskan sebagai berikut: ๐‘ซ ๐‘˜โˆ’1 ๐ถ๐‘† = ๐œŒโก๐Ÿ ๐‘˜โˆ’1 + (1 โˆ’ ๐œŒ)๐‘ฐ ๐‘˜โˆ’1. Dengan demikian, (๐‘ซ ๐‘˜โˆ’1 ๐ถ๐‘† )โˆ’1 dapat diperoleh dengan menggunakan persamaan be- rikut: โก๐œŒโก๐Ÿ ๐‘˜โˆ’1(๐‘ซ ๐‘˜โˆ’1 ๐ถ๐‘† )โˆ’1 + (1 โˆ’ ๐œŒ)(๐‘ซ ๐‘˜โˆ’1 ๐ถ๐‘† )โˆ’1 = ๐‘ฐ ๐‘˜โˆ’1.โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก(3. 13) Dengan menggunakan persamaan 3.13 dan persamaan (๐Ÿ ๐‘˜โˆ’1)2 = (๐‘˜ โˆ’ 1)(๐Ÿ ๐‘˜โˆ’1), akan dicari terlebih dahulu bentuk lain dari ๐Ÿ ๐‘˜โˆ’1(๐‘ซ ๐‘˜โˆ’1 ๐ถ๐‘† )โˆ’1 . ๐œŒ(๐‘˜ โˆ’ 1)๐Ÿ ๐‘˜โˆ’1(๐‘ซ ๐‘˜โˆ’1 ๐ถ๐‘† )โˆ’1 + (1 โˆ’ ๐œŒ)๐Ÿ ๐‘˜โˆ’1(๐‘ซ ๐‘˜โˆ’1 ๐ถ๐‘† )โˆ’1 = ๐Ÿ ๐‘˜โˆ’1 โกโก๐Ÿ ๐‘˜โˆ’1(๐‘ซ ๐‘˜โˆ’1 ๐ถ๐‘† )โˆ’1 = ๐Ÿ ๐‘˜โˆ’1 (1 โˆ’ 2๐œŒ + ๐‘˜๐œŒ) โกโกโกโกโกโกโกโกโกโกโกโก(3. 14) Dengan mensubstitusikan persamaan 3.14 ke persamaan 3.13, diperoleh ๐œŒโก ๐Ÿ ๐‘˜โˆ’1 (1 โˆ’ 2๐œŒ + ๐‘˜๐œŒ) + (1 โˆ’ ๐œŒ)(๐‘ซ ๐‘˜โˆ’1 ๐ถ๐‘† )โˆ’1 = ๐‘ฐ ๐‘˜โˆ’1 (๐‘ซ ๐‘˜โˆ’1 ๐ถ๐‘† )โˆ’1 = ๐‘ฐ ๐‘˜โˆ’1 โˆ’ ๐œŒโก ๐Ÿ ๐‘˜โˆ’1 (1 โˆ’ 2๐œŒ + ๐‘˜๐œŒ) (1 โˆ’ ๐œŒ) โก.โกโกโกโกโกโกโกโกโกโกโกโกโก(3. 15) LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
  • 45. Bab 3 Model Imputasi 32 Untuk menyederhanakan formula imputasi, misalkan ๐‘Ž dan b berturut- turut menyatakan elemen diagonal dan off-diagonal dari matriks (๐‘ซ ๐‘˜โˆ’1 ๐ถ๐‘† )โˆ’1 . De- ngan demikian, ๐‘ฆ ๐‘˜ ๐ถ๐‘†ฬ‚ โกโก= (๐’“ ๐‘˜โˆ’1 ๐ถ๐‘† ) ๐‘‡(๐‘ซ ๐‘˜โˆ’1 ๐ถ๐‘† )โˆ’1 ๐’˜ ๐‘˜โˆ’1 = (๐œŒ, โ€ฆ , ๐œŒ) ( ๐‘Ž ๐‘ โ€ฆ ๐‘ ๐‘ ๐‘Ž โ‹ฑ ๐‘ โ‹ฎ โ‹ฑ โ‹ฑ โ‹ฎ ๐‘ ๐‘ โ€ฆ ๐‘Ž ) ( ๐‘ฆ1 โ‹ฎ โ‹ฎ ๐‘ฆ ๐‘˜โˆ’1 ) = ๐œŒ(๐‘Ž + (๐‘˜ โˆ’ 2)๐‘ โ€ฆ ๐‘Ž + (๐‘˜ โˆ’ 2)๐‘) ( ๐‘ฆ1 โ‹ฎ โ‹ฎ ๐‘ฆ ๐‘˜โˆ’1 ).โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก(3. 16) Dengan menggunakan persamaan 3.15 diperoleh ๐‘Ž = 1 (1 โˆ’ ๐œŒ) โˆ’ ๐œŒ (1 โˆ’ ๐œŒ)(1 โˆ’ 2๐œŒ + ๐‘˜๐œŒ) = 1 + (๐‘˜ โˆ’ 2)๐œŒ2 1 โˆ’ (๐‘˜ โˆ’ 2)๐œŒ2 + (๐‘˜ โˆ’ 3)๐œŒ ๐‘ = โˆ’ ๐œŒ (1 โˆ’ ๐œŒ)(๐œŒโก๐‘˜ + 1 โˆ’ 2๐œŒ) =โกโˆ’ ๐œŒ 1 โˆ’ (๐‘˜ โˆ’ 2)๐œŒ2 + (๐‘˜ โˆ’ 3)๐œŒ ,โกโกโกโกโกโกโก sehingga ๐‘Ž + (๐‘˜ โˆ’ 2)๐‘โก = 1 + (๐‘˜ โˆ’ 2)๐œŒ2 1 โˆ’ (๐‘˜ โˆ’ 2)๐œŒ2 + (๐‘˜ โˆ’ 3)๐œŒ โˆ’ (๐‘˜ โˆ’ 2)๐œŒ 1 โˆ’ (๐‘˜ โˆ’ 2)๐œŒ2 + (๐‘˜ โˆ’ 3)๐œŒ = 1 + (๐‘˜ โˆ’ 3)๐œŒ โˆ’ (๐‘˜ โˆ’ 2)๐œŒ 1 โˆ’ (๐‘˜ โˆ’ 2)๐œŒ2 + (๐‘˜ โˆ’ 3)๐œŒ = โˆ’(๐œŒ โˆ’ 1) โˆ’(๐‘˜ โˆ’ 2)๐œŒ2 + (๐‘˜ โˆ’ 3)๐œŒ + 1 = 1 1 + (๐‘˜ โˆ’ 2)๐œŒ .โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก(3. 17) LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
  • 46. Bab 3 Model Imputasi 33 Kemudian, dengan mensubstitusikan persamaan 3.17 ke persamaan 3.16, diper- oleh ๐‘ฆ ๐‘˜ ๐ถ๐‘†ฬ‚ = ๐œŒ ( 1 1 + (๐‘˜ โˆ’ 2)๐œŒ โ€ฆ 1 1 + (๐‘˜ โˆ’ 2)๐œŒ ) ( ๐‘ฆ1 โ‹ฎ โ‹ฎ ๐‘ฆ ๐‘˜โˆ’1 ) = ๐œŒ 1 + (๐‘˜ โˆ’ 2)๐œŒ โˆ‘ ๐‘ฆ๐‘— ๐‘˜โˆ’1 ๐‘—=1 โก,โก sehingga formula (model) imputasi untuk ๐‘ฅ ๐‘˜ dibawah asumsi struktur korelasi CS adalah ๐‘ฅ ๐‘˜ ๐ถ๐‘†ฬ‚ =โก ๐น๐‘˜ โˆ’1 (ฮฆ1 ( ๐œŒ 1 + (๐‘˜ โˆ’ 2)๐œŒ โˆ‘ ๐‘ฆ๐‘— ๐‘˜โˆ’1 ๐‘—=1 )).โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก(3. 18) 3.2.2 Struktur Korelasi First Order Autoregressive Struktur first order autoregressive (AR1) merupakan struktur matriks dengan 2 parameter. Nilai elemen pada matriks korelasi AR1 bergantung pada suatu koefisien korelasi ๐œŒ dan selisih titik waktu pengukuran berdasarkan satuan tertentu (lag). Korelasi antara dua variabel pengukuran pada titik waktu yang berbeda akan semakin menurun apabila rentang waktu pengukuran semakin besar. Bentuk matriks ๐‘ซ ๐‘˜โˆ’1 dibawah struktur AR1 adalah ๐‘ซ ๐‘˜โˆ’1 ๐ด๐‘…1 = ( 1 ๐œŒ ๐œŒ2 โ€ฆ ๐œŒ ๐‘˜โˆ’2 ๐œŒ 1 ๐œŒ โ€ฆ ๐œŒ ๐‘˜โˆ’3 ๐œŒ2 ๐œŒ 1 โ€ฆ ๐œŒ ๐‘˜โˆ’4 โ‹ฎ โ‹ฎ โ‹ฑ โ‹ฎ ๐œŒ ๐‘˜โˆ’2 ๐œŒ ๐‘˜โˆ’3 ๐œŒ ๐‘˜โˆ’4 โ€ฆ 1 ) โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก๐’“ ๐ด๐‘…1 = ( ๐œŒ ๐‘˜โˆ’1 ๐œŒ ๐‘˜โˆ’2 โ‹ฎ โ‹ฎ ๐œŒ ) . Untuk mencari nilai taksiran ๐‘ฆ ๐‘˜ dengan menggunakan formula 3.11 akan dicari terlebih dahulu invers dari matriks korelasi AR1, yaitu (๐‘ซ ๐‘˜โˆ’1 ๐ด๐‘…1)โˆ’1 . LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
  • 47. Bab 3 Model Imputasi 34 Berdasarkan Kac dkk (1953), invers dari matriks korelasi AR1 adalah (๐‘ซ ๐‘˜โˆ’1 ๐ด๐‘…1 โก) โˆ’1 = 1 ๐œŒ2 โˆ’ 1 ( โˆ’1 โกโกโกโกโก๐œŒ 0 ๐œŒ โˆ’(1 + ๐œŒ2 ) ๐œŒ 0 โกโกโกโกโก๐œŒ โˆ’(1 + ๐œŒ2 ) โ€ฆ 0โก 0 โ€ฆ 0โก 0 โ€ฆ 0โก 0 โกโกโกโกโกโก 0โกโกโกโกโกโก 0โกโกโกโกโกโกโก ๐œŒโกโกโกโกโกโกโก โ‹ฎโกโกโกโกโกโก โ‹ฎโกโกโกโกโกโกโก โ‹ฎโกโกโกโกโกโกโก 0 0 โกโกโกโกโกโก 0 0 โกโกโกโกโกโกโก 0 0 โกโกโกโกโกโกโก โกโก โ€ฆ 0 0 โ‹ฑ โ‹ฎ โ‹ฎ โ€ฆ โ€ฆ โˆ’(1 + ๐œŒ2 ) ๐œŒ ๐œŒ โˆ’1 ) .โกโก Dengan memanfaatkan (๐‘ซ ๐‘˜โˆ’1 ๐ด๐‘…1 โก)โˆ’1 , akan dicari terlebih dahulu taksiran ๐‘ฆ ๐‘˜ di bawah struktur AR1. ๐‘ฆ ๐‘˜ ๐ด๐‘…1ฬ‚ โกโกโก= (๐’“ ๐‘˜โˆ’1 ๐ด๐‘…1) ๐‘‡(๐‘ซ ๐‘˜โˆ’1 ๐ด๐‘…1 โก)โˆ’1 โก๐’š ๐‘˜โˆ’1 โกโก= 1 ๐œŒ2 โˆ’ 1 ( ๐œŒ ๐‘˜โˆ’1 ๐œŒ ๐‘˜โˆ’2 โ€ฆ ๐œŒ) ร— ( โˆ’1 โกโกโกโกโก๐œŒ 0 ๐œŒ โˆ’(1 + ๐œŒ2 ) ๐œŒ 0 โกโกโกโกโก๐œŒ โˆ’(1 + ๐œŒ2 ) โ€ฆ 0โก 0 โ€ฆ 0โก 0 โ€ฆ 0โก 0 โกโกโกโกโกโก 0โกโกโกโกโกโก 0โกโกโกโกโกโกโก ๐œŒโกโกโกโกโกโกโก โ‹ฎโกโกโกโกโกโก โ‹ฎโกโกโกโกโกโกโก โ‹ฎโกโกโกโกโกโกโก 0 0 โกโกโกโกโกโก 0 0 โกโกโกโกโกโกโก 0 0 โกโกโกโกโกโกโก โกโกโก โ€ฆ 0 0 โ‹ฑ โ‹ฎ โ‹ฎ โ€ฆ โ€ฆ โˆ’(1 + ๐œŒ2 ) ๐œŒ ๐œŒ โˆ’1 ) ( ๐‘ฆ1 โ‹ฎ โ‹ฎ ๐‘ฆ ๐‘˜โˆ’1 ) โกโก= 1 ๐œŒ2 โˆ’ 1 (๐‘Ž1 ๐‘Ž2 โ€ฆ ๐‘Ž ๐‘˜โˆ’1) ( ๐‘ฆ1 โ‹ฎ โ‹ฎ ๐‘ฆ ๐‘˜โˆ’1 ), dimana ๐‘Ž1 = โˆ’๐œŒ ๐‘˜โˆ’1 + ๐œŒ(๐œŒ ๐‘˜โˆ’2) = 0 ๐‘Ž๐‘– = ๐œŒ(๐œŒ ๐‘˜โˆ’๐‘–+1 ) โˆ’ (1 + ๐œŒ2)๐œŒ ๐‘˜โˆ’๐‘– + ๐œŒ(๐œŒ ๐‘˜โˆ’๐‘–โˆ’1 ) = 0, untukโกโก๐‘– = 2, โ€ฆ ๐‘˜ โˆ’ 2 โกโก๐‘Ž ๐‘˜โˆ’1 = ๐œŒ(๐œŒ ๐‘˜โˆ’(๐‘˜โˆ’2) ) โˆ’ ๐œŒ = ๐œŒ3 โˆ’ ๐œŒ = ๐œŒ(๐œŒ2 โˆ’ 1). LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
  • 48. Bab 3 Model Imputasi 35 Dengan demikian, taksiran untuk ๐‘ฆ ๐‘˜ dibawah struktur AR1 adalah ๐‘ฆ ๐‘˜ ๐ด๐‘…1ฬ‚ โก= (๐’“ ๐‘˜โˆ’1 ๐ด๐‘…1) ๐‘‡(๐‘ซ ๐‘˜โˆ’1 ๐ด๐‘…1 โก)โˆ’1 โก๐’š ๐‘˜โˆ’1 = 1 ๐œŒ2 โˆ’ 1 ๐œŒ(๐œŒ2 โˆ’ 1)๐‘ฆ ๐‘˜โˆ’1 = ๐œŒ๐‘ฆ ๐‘˜โˆ’1,โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก(3. 19) sehingga formula imputasi untuk ๐‘ฅ ๐‘˜ dibawah asumsi struktur korelasi AR1 adalah ๐‘ฅ ๐‘˜ ๐ด๐‘…1ฬ‚ =โก ๐น๐‘˜ โˆ’1 (ฮฆ1(๐œŒ๐‘ฆ ๐‘˜โˆ’1)).โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก(3. 20) Dari persamaan 3.19, dapat dilihat bahwa nilai ๐‘ฆ ๐‘˜ ๐ด๐‘…1ฬ‚ hanya bergantung pada ๐œŒ dan ๐‘ฆ ๐‘˜โˆ’1. Dengan demikian, distribusi ๐‘Œ๐‘˜|๐‘Œ๐‘˜โˆ’1 dapat digunakan sebagai salah satu model penaksir ๐‘ฆ ๐‘˜. Misalkan (๐‘Œ๐‘˜โˆ’1, ๐‘Œ๐‘˜) ๐‘‡ berdistribusi bivariat normal dengan ๐ = ( ๐œ‡ ๐‘˜โˆ’1 ๐œ‡ ๐‘˜ )โกโกโกโกโกโกdanโกโกโกโก๐šบ = ( ๐œŽ๐‘˜โˆ’1 2 ๐œŒ๐œŽ๐‘˜โˆ’1 ๐œŽ๐‘˜ ๐œŒ๐œŽ๐‘˜โˆ’1 ๐œŽ๐‘˜ ๐œŽ๐‘˜ 2 ). Dengan demikian, sesuai dengan teorema mengenai distribusi bersyarat yang dibangun dari distribusi multivariat normal (lihat referensi Hogg dan Craig, 2005), ๐‘Œ๐‘˜|๐‘Œ๐‘˜โˆ’1~๐‘2 (๐œ‡ ๐‘˜ + ๐œŒ๐œŽ๐‘˜ ๐œŽ๐‘˜โˆ’1 โก(๐‘ฆ ๐‘˜โˆ’1 โˆ’ ๐œ‡ ๐‘˜โˆ’1), ๐œŽ๐‘˜ 2 (1 โˆ’ ๐œŒ2 )), sehingga taksiran ๐‘ฆ ๐‘˜ juga dapat diperoleh dengan menggunakan formula berikut: ๐‘ฆ ๐‘˜ ๐ด๐‘…1๐‘›ฬ‚ โก= ๐ธ(๐‘Œ๐‘˜|๐‘Œ๐‘˜โˆ’1)ฬ‚ = ๐‘Œฬ…๐‘˜ + ๐œŒ ๐‘  ๐‘˜ ๐‘  ๐‘˜โˆ’1 โก(๐‘ฆ ๐‘˜โˆ’1 โˆ’ ๐‘Œฬ…๐‘˜โˆ’1),โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก dengan ๐‘Œฬ…๐‘˜ : rataan dari sampel yang terobservasi pada waktu ๐‘˜, LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
  • 49. Bab 3 Model Imputasi 36 ๐‘Œฬ…๐‘˜โˆ’1 : rataan dari sampel yang terobservasi pada waktu (๐‘˜ โˆ’ 1), ๐‘  ๐‘˜โก : deviasi standar dari sampel yang terobservasi pada waktu ๐‘˜, ๐‘  ๐‘˜โˆ’1 : deviasi standar dari sampel yang terobservasi pada waktu (๐‘˜ โˆ’ 1), ๐œŒ : koefisien korelasi dibawah struktur AR1. Dapat disimpulkan bahwa imputasi untuk ๐‘ฅ ๐‘˜ dibawah asumsi struktur korelasi AR1 juga dapat diperoleh dengan menggunakan formula berikut: ๐‘ฅ ๐‘˜ ๐ด๐‘…1๐‘›ฬ‚ =โก ๐น๐‘˜ โˆ’1 (ฮฆ1 (๐‘Œฬ…๐‘˜ + ๐œŒ ๐‘  ๐‘˜ ๐‘  ๐‘˜โˆ’1 โก(๐‘ฆ ๐‘˜โˆ’1 โˆ’ ๐‘Œฬ…๐‘˜โˆ’1))).โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก(3. 21) Apabila ๐‘  ๐‘˜ = ๐‘  ๐‘˜โˆ’1 dan ๐‘Œฬ…๐‘˜ = ๐‘Œฬ…๐‘˜โˆ’1 = 0, maka formula 3.21 akan sesuai dengan formula 3.20. 3.2.3 Struktur Korelasi 1-Banded Toeplitz Struktur korelasi Toeplitz dan banded Toeplitz memuat nilai korelasi berbeda un- tuk tiap pasang variabel acak dengan rentang waktu yang berbeda. Selain itu, struktur ini tidak mengharuskan nilai korelasinya merupakan pangkat dari korelasi basis (misal ๐œŒ). Matriks Toeplitz bernilai konstan sepanjang diagonal paralel ter- hadap diagonal utama. Struktur banded Toeplitz dapat digunakan dengan asumsi bahwa terdapat struktur markovian, yaitu observasi terakhir mempengaruhi beberapa observasi berikutnya (sejauh ๐‘˜โˆ— ). Misal ๐‘˜โˆ— = 1, maka hanya 2 observasi yang berturutan yang memiliki kebergantungan, sedemikian sehingga untuk ๐‘— = 1, โ€ฆ , ๐‘˜ โˆ’ 2, ๐ท๐‘—,๐‘—+1 = ๐œŒ. Struktur ini disebut 1-banded Toeplitz Structure (1BT). LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
  • 50. Bab 3 Model Imputasi 37 Bentuk matriks ๐‘ซ ๐‘˜โˆ’1 dibawah struktur 1BT adalah ๐‘ซ ๐‘˜โˆ’1 1๐ต๐‘‡ = ( 1 ๐œŒ 0 โ€ฆ 0 ๐œŒ 1 ๐œŒ โ‹ฑ โ‹ฎ 0 ๐œŒ โ‹ฑ โ‹ฑ 0 โ‹ฎ โ‹ฑ โ‹ฑ 1 ๐œŒ 0 โ€ฆ 0 ๐œŒ 1) โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก๐‘Ÿ1๐ต๐‘‡ = ( 0 โ‹ฎ ๐œŒ ) Selanjutnya, akan dicari formula imputasi untuk ๐‘ฆ ๐‘˜ dibawah asumsi struktur 1BT. Berdasarkan formula 3.11, ๐‘ฆ ๐‘˜ 1๐ต๐‘‡ฬ‚ = ๐’“ ๐‘‡(๐‘ซ ๐‘˜โˆ’1 1๐ต๐‘‡)โˆ’1 ๐‘ฆ ๐‘˜โˆ’1 = (0 โ€ฆ ๐œŒ)โก(๐‘ซ ๐‘˜โˆ’1 1๐ต๐‘‡)โˆ’1 โก( ๐‘ฆ1 โ‹ฎ โ‹ฎ ๐‘ฆ ๐‘˜โˆ’1 ). Misal ( ๐‘Ž1 โ€ฆ ๐‘Ž ๐‘˜โˆ’1) merupakan baris terakhir dari matriks (๐‘ซ ๐‘˜โˆ’1 1๐ต๐‘‡)โˆ’1 , maka โก๐‘ฆ ๐‘˜ 1๐ต๐‘‡ฬ‚ = (๐œŒ๐‘Ž1 ๐œŒ๐‘Ž2 โ€ฆ ๐œŒ๐‘Ž ๐‘˜โˆ’1)โก( ๐‘ฆ1 โ‹ฎ โ‹ฎ ๐‘ฆ ๐‘˜โˆ’1 ),โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก(3. 22) dengan ๐œŒ๐‘Ž ๐‘— = ๐œŒ(โˆ’1) ๐‘˜โˆ’1+๐‘— 1 |๐‘ซ ๐‘˜โˆ’1 1๐ต๐‘‡| | ๐‘ซ๐‘—โˆ’1 1๐ต๐‘‡ ๐‘œ ๐ด ๐‘ฉ |. ๐‘ฉ merupakan matriks segitiga bawah berukuran (๐‘˜ โˆ’ 1 โˆ’ ๐‘—) dengan diagonal utama ๐œŒ, sehingga ๐œŒ๐‘Ž ๐‘— = ๐œŒ(โˆ’1) ๐‘˜โˆ’1+๐‘— 1 |๐‘ซ ๐‘˜โˆ’1 1๐ต๐‘‡ | ๐‘‘๐‘’๐‘ก | ๐‘ซ๐‘—โˆ’1 1๐ต๐‘‡ ๐‘œ ๐ด ๐‘ฉ | โก= ๐œŒ(โˆ’1) ๐‘˜โˆ’1+๐‘— 1 |๐‘ซ ๐‘˜โˆ’1 1๐ต๐‘‡| |๐‘ซ๐‘—โˆ’1 1๐ต๐‘‡ ||๐ต| โก= ๐œŒ(โˆ’1) ๐‘˜โˆ’1+๐‘— 1 |๐‘ซ ๐‘˜โˆ’1 1๐ต๐‘‡| |๐‘ซ๐‘—โˆ’1 1๐ต๐‘‡ |โก๐œŒ ๐‘˜โˆ’1โˆ’๐‘— โก=โก(โˆ’1) ๐‘˜โˆ’๐‘—+1 1 |๐‘ซ ๐‘˜โˆ’1 1๐ต๐‘‡ | |๐‘ซ๐‘—โˆ’1 1๐ต๐‘‡ |โก๐œŒ ๐‘˜โˆ’๐‘— โก.โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก(3. 23) LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
  • 51. Bab 3 Model Imputasi 38 Dengan menggunakan persamaan 3.22 dan 3.23 diperoleh taksiran untuk ๐‘ฆ ๐‘˜ dibawah asumsi struktur korelasi 1BT, yaitu โก๐‘ฆ ๐‘˜ 1๐ต๐‘‡ฬ‚ = 1 |๐‘ซ ๐‘˜โˆ’1 1๐ต๐‘‡ | โˆ‘ โก(โˆ’1) ๐‘˜โˆ’๐‘—+1 |๐‘ซ๐‘—โˆ’1 1๐ต๐‘‡ |โก๐œŒ ๐‘˜โˆ’๐‘— ๐‘˜โˆ’1 ๐‘—=1 ๐‘ฆ๐‘—.โก Kemudian, dengan memanfaatkan metode kofaktor, determinan dari |๐‘ซ๐‘—โˆ’1 1๐ต๐‘‡ | dapat dituliskan sebagai |๐‘ซ๐‘—โˆ’1 1๐ต๐‘‡ | = 1โก|๐‘ซ๐‘—โˆ’2 1๐ต๐‘‡ | โˆ’ ๐œŒ | ๐œŒ ๐‘ช ๐‘œ ๐‘ซ๐‘—โˆ’2 1๐ต๐‘‡|. Dengan demikian, determinan dari |๐‘ซ๐‘—โˆ’1 1๐ต๐‘‡ | dapat diperoleh secara rekursif menggunakan formula |๐‘ซ๐‘—โˆ’1 1๐ต๐‘‡ | = 1โก|๐‘ซ๐‘—โˆ’2 1๐ต๐‘‡ | โˆ’ ๐œŒ2 |๐‘ซ๐‘—โˆ’3 1๐ต๐‘‡ |โก,โกโกโกโก๐‘— = 3,4,5, โ€ฆ , ๐‘˜ โˆ’ 1,โกโกโกโกโกโกโกโกโกโกโกโกโก(3. 24) dengan nilai awal |๐‘ซ0 1๐ต๐‘‡| = |๐‘ซ1 1๐ต๐‘‡| = 1. Imputasi ๐‘ฅ ๐‘˜ dibawah asumsi struktur ko- relasi 1BT dapat diperoleh dengan menggunakan formula berikut: โก๐‘ฅ ๐‘˜ 1๐ต๐‘‡ฬ‚ =โก ๐น๐‘˜ โˆ’1 (ฮฆ1 ( 1 |๐‘ซ ๐‘˜โˆ’1 1๐ต๐‘‡ | โˆ‘ โก(โˆ’1) ๐‘˜โˆ’๐‘—+1 |๐‘ซ๐‘—โˆ’1 1๐ต๐‘‡ |โก๐œŒ ๐‘˜โˆ’๐‘— ๐‘˜โˆ’1 ๐‘—=1 ๐‘ฆ๐‘—)).โกโกโกโกโกโกโกโก(3. 25) 3.3 Penaksiran Parameter Koefisien Korelasi Untuk masing-masing struktur, elemen dari matriks korelasi ๐‘ซ ๐‘˜ bergantung pada koefisien korelasi ๐œŒ. Agar matriks korelasi ๐‘ซ ๐‘˜โˆ’1 dan ๐‘ซ ๐‘˜ memenuhi syarat definit positif, untuk setiap struktur korelasi, interval dari nilai ๐œŒ yang memenuhi harus dicari. Selain bergantung pada struktur matriks, interval ini bergantung pada uku- ran matriks ๐‘ซ. LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
  • 52. Bab 3 Model Imputasi 39 Suatu matriks bersifat definit positif jika dan hanya jika seluruh nilai eigennya positif (lihat referensi Anton dan Rorres, 2005). Dengan demikian, in- terval untuk ๐œŒ dapat diperoleh dengan melakukan pengecekan terhadap seluruh nilai eigen untuk masing-masing ๐œŒ yang termuat pada interval [-1,1]. Berikut disajikan tabel batas bawah dan batas atas interval dari masing-masing struktur untuk beberapa ukuran matriks ๐‘ซ: Tabel 3.2 Interval ๐œŒ untuk beberapa ukuran matriks ๐‘ซ. Ukuran Matriks ๐‘ซ Struktur Batas Bawah Batas Atas 2 CS -0.9995 0.9995 AR1 -0.9995 0.9995 1BT -0.9995 0.9995 3 CS -0.4995 0.9995 AR1 -0.9995 0.9995 1BT -0.7070 0.7070 4 CS -0.333 0.9995 AR1 -0.9995 0.9995 1BT -0.6180 0.618 5 CS -0.2495 0.9995 AR1 -0.9995 0.9995 1BT -0.577 0.577 6 CS -0.2 0.9995 AR1 -0.9995 0.9995 1BT -0.5545 0.5545 Sesuai dengan Tabel 3.2, dapat dilihat bahwa semakin besar ukuran ma- triks, panjang interval dari ๐œŒ yang memenuhi cenderung semakin sempit. Dengan demikian, ukuran matriks yang dijadikan acuan untuk penentuan interval ialah ๐‘˜. Setelah interval ๐œŒ diperoleh, ๐œŒฬ‚ untuk masing-masing struktur dapat diperoleh dengan memilih salah satu nilai ๐œŒ pada interval tersebut. Pemilihan dilakukan dengan mencari nilai ๐œŒ yang dapat memaksimumkan nilai fungsi likelihood dari densitas copula sesuai persamaan berikut: โˆ ๐‘ ๐‘”๐‘Ž๐‘ข๐‘ ๐‘  (๐‘ข๐‘–1, โ€ฆ , ๐‘ข๐‘–,๐‘˜โˆ’1) ๐‘› ๐‘–=1 = โˆ โก|๐‘ซkโˆ’1|โˆ’ 1 2โกโก ๐‘› ๐‘–=1 ๐‘’ (โˆ’โก 1 2 โก๐’˜๐‘–,๐‘˜โˆ’1 ๐‘‡(๐‘ซkโˆ’1 โˆ’1 โˆ’๐šฐ)๐’˜ ๐‘–,๐‘˜โˆ’1) .โกโก(3. 26) LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
  • 53. Bab 3 Model Imputasi 40 Pada tugas akhir ini, nilai ๐œŒ yang memaksimumkan persamaan 3.26 diper- oleh secara numerik. Misalkan ๐œŒ ๐ถ๐‘†ฬ‚ , โก๐œŒ ๐ด๐‘…1ฬ‚ dan โก๐œŒ1๐ต๐‘‡ฬ‚ berturut turut merupakan taksiran koefisien korelasi untuk struktur CS, AR1, dan 1BT, maka taksiran ๐‘ฅ ๐‘˜ dengan menggunakan formula 3.18, 3.20, 3.21 dan 3.25 dapat diperoleh. 3.4 Pemilihan Model Terbaik Model imputasi dikatakan baik apabila eror taksiran kecil. Nilai dari eror taksiran bergantung pada satuan yang digunakan. Selain itu, apabila nilai eror taksiran pada suatu data dikatakan kecil, maka belum tentu eror taksiran yang bernilai sama untuk data yang berbeda juga dapat dikatakan kecil. Untuk itu, karena nilai eror dapat dianggap sebagai jarak, nilai eror dihitung relatif terhadap deviasi standar dari seluruh data terobservasi pada titik waktu imputasi. Untuk selanjut- nya, nilai eror ini disebut sebagai eror imputasi. Misalkan imputasi dilakukan untuk mengisi data hilang dari subjek ๐‘– pada waktu ๐‘˜. ๐œ€๐‘– menyatakan eror imputasi dari subjek ๐‘–. Secara matematis, untuk suatu subjek ๐‘–, eror imputasi dapat ditulis sebagai berikut: ๐œ€๐‘– = ๐‘ฅ๐‘–๐‘˜ โˆ’ ๐‘ฅ๐‘–๐‘˜ฬ‚ ๐‘† ๐‘˜ โก.โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก(3. 27) Pada kenyataannya, ๐œ€๐‘– tidak dapat dihitung. Untuk itu, akan dijelaskan sebuah metode pemilihan model yang cukup mampu menjamin bahwa model yang dipilih memiliki ๐œ€๐‘– yang kecil. Berdasarkan persamaan 3.26, penaksiran parameter ๐œŒ hanya melibatkan data historis, sehingga apabila hasil taksiran parameter ๐œŒ mampu mewakili para- meter dari data lengkap, formula 3.18, 3.20, 3.21 dan 3.25 dapat dengan baik menaksir nilai yang hilang pada saat ๐‘˜ dari sebarang subjek. Dengan demikian, nilai ๐œ€๐‘– untuk subjek-subjek yang terobservasi pada saat ๐‘˜ dapat dijadikan acuan untuk memilih model terbaik. Untuk selanjutnya, nilai ๐œ€๐‘– dari subjek yang terob- LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
  • 54. Bab 3 Model Imputasi 41 servasi disebut dengan eror model dan dilambangkan dengan ๐œ–๐‘–. ๐œ–๐‘– dapat dihitung dengan mengasumikan bahwa fungsi distribusi ๐น๐‘˜ yang digunakan pada proses perhitungan tidak berbeda dengan distribusi dari hasil fitting dengan menggu- nakan seluruh data yang terobservasi pada saat ๐‘˜. Misalkan ๐œ–ฬ… dan ๐‘ ๐œ– secara berturut turut menyatakan rata-rata dan deviasi standar dari data ๐œ–๐‘– untuk seluruh subjek ๐‘– yang terobservasi pada waktu ๐‘˜. Model imputasi yang baik ialah model yang memiliki rata-rata dan deviasi standar eror yang kecil, sehingga nilai eror taksiran lebih mudah diprediksi. Dengan demikian, pemilihan model dapat didasarkan pada nilai ๐œ–ฬ… dan ๐‘ ๐œ– terkecil. Untuk model autoregressive, selain bergantung pada parameter koefisien korelasi ๐œŒ, elemen pada matriks korelasinya bergantung pada nilai pangkat yang merupakan rentang antar titik waktu pengukuran yang diukur dengan menggu- nakan satuan tertentu. Dengan demikian, apabila rentang waktu antar pengukuran yang berurutan tidak konstan, model autoregressive tidak dapat digunakan sehingga tidak perlu disertakan dalam pemilihan model. 3.5 Interval Prediksi Selain memperoleh taksiran titik, dapat ditentukan pula taksiran selang (interval prediksi) dari ๐‘‹ ๐‘˜. Sesuai dengan persamaan 3.8, ๐‘“(๐‘ฆ ๐‘˜|๐‘ฏ; ๐‘ซ ๐‘˜) = 1 โˆš2๐œ‹ exp (โˆ’ 1 2 ๐‘ฆ ๐‘˜ 2 )โกexp {โˆ’ 1 2 ( (๐‘ฆ ๐‘˜ โˆ’ ๐’“ ๐‘‡ ๐‘ซ ๐‘˜โˆ’1 โˆ’1 ๐’˜ ๐‘˜โˆ’1)2 1 โˆ’ ๐’“ ๐‘‡โก๐‘ซkโˆ’1 โˆ’1 ๐’“ โˆ’ ๐‘ฆk 2 )} (1 โˆ’ ๐’“ ๐‘‡โก๐‘ซkโˆ’1 โˆ’1 ๐ซ) 1 2 = 1 โˆš2๐œ‹ โกexp {โˆ’ 1 2 ( (๐‘ฆ ๐‘˜ โˆ’ ๐’“ ๐‘‡ ๐‘ซ ๐‘˜โˆ’1 โˆ’1 ๐’˜ ๐‘˜โˆ’1)2 1 โˆ’ ๐’“ ๐‘‡โก๐‘ซkโˆ’1 โˆ’1 ๐’“ )} (1 โˆ’ ๐’“ ๐‘‡โก๐‘ซkโˆ’1 โˆ’1 ๐ซ) 1 2 .โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก(3. 28) Dari persamaan 3.28, LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
  • 55. Bab 3 Model Imputasi 42 ๐‘Œ๐‘˜|๐‘ฏ~๐‘(๐’“ ๐‘‡ ๐‘ซ ๐‘˜โˆ’1 โˆ’1 ๐’˜ ๐‘˜โˆ’1โก, 1 โˆ’ ๐’“ ๐‘‡ โก๐‘ซkโˆ’1 โˆ’1 ๐ซ). Dengan demikian, 100(1 โˆ’ ๐›ผ)% interval prediksi dari ๐‘Œ๐‘˜ ialah [๐’“ ๐‘‡ ๐‘ซ ๐‘˜โˆ’1 โˆ’1 ๐’˜ ๐‘˜โˆ’1 โˆ’ ๐‘ง ๐›ผ 2 โˆš1 โˆ’ ๐’“ ๐‘‡โก๐‘ซkโˆ’1 โˆ’1 ๐ซโก, ๐’“ ๐‘‡ ๐‘ซ ๐‘˜โˆ’1 โˆ’1 ๐’˜ ๐‘˜โˆ’1 + ๐‘ง ๐›ผ 2 โˆš1 โˆ’ ๐’“ ๐‘‡โก๐‘ซkโˆ’1 โˆ’1 ๐ซโกโก]โก(3. 29) dimana ๐‘ง ๐›ผ 2 menyatakan kuantil ๐›ผ 2 dari distribusi normal baku. Sesuai dengan persamaan 3.12,โก๐‘ฅ ๐‘˜ฬ‚ โก= ๐น๐‘˜ โˆ’1 (ฮฆ1(๐‘ฆ ๐‘˜ฬ‚)). Pada kasus kontinu, ๐น๐‘˜ merupakan fungsi monoton naik murni, sehingga ๐น๐‘˜ โˆ’1 juga merupakan fungsi monoton naik murni. Misalkan ๐‘ˆ = ๐’“ ๐‘‡ ๐‘ซ ๐‘˜โˆ’1 โˆ’1 ๐’˜ ๐‘˜โˆ’1 + ๐‘ง ๐›ผ 2 โˆš1 โˆ’ ๐’“ ๐‘‡โก๐‘ซkโˆ’1 โˆ’1 ๐ซ ๐ฟ = ๐’“ ๐‘‡ ๐‘ซ ๐‘˜โˆ’1 โˆ’1 ๐’˜ ๐‘˜โˆ’1 โˆ’ ๐‘ง ๐›ผ 2 โˆš1 โˆ’ ๐’“ ๐‘‡โก๐‘ซkโˆ’1 โˆ’1 ๐ซโก, maka 100(1 โˆ’ ๐›ผ)% interval prediksi ๐‘‹ ๐‘˜ adalah [๐น๐‘˜ โˆ’1 (ฮฆ1(๐ฟ)), ๐น๐‘˜ โˆ’1 (ฮฆ1(๐‘ˆ))โก].โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก(3. 30) Untuk masing-masing struktur korelasi, mean dan variansi dari ๐‘Œ๐‘˜|๐‘ฏ dapat ditaksir dari data. Taksiran dari Var(๐‘Œ๐‘˜|๐‘ฏ) untuk masing-masing struktur dapat diperoleh dengan menggunakan formula pada tabel berikut: Tabel 3.3 Formula Var(๐‘Œ๐‘˜|๐‘ฏ)ฬ‚ . Struktur Korelasi โกVar(๐‘Œ๐‘˜|๐‘ฏ)ฬ‚ = โก1 โˆ’ ๐’“ ๐‘‡โก๐‘ซkโˆ’1 โˆ’1 ๐ซฬ‚ CS 1 โˆ’ (๐‘˜ โˆ’ 1)๐œŒ2 1 + (๐‘˜ โˆ’ 2)๐œŒ AR1 1 โˆ’ ๐œŒ2 1BT 1 โˆ’ ๐œŒ2 |๐‘ซ ๐‘˜โˆ’1 1๐ต๐‘‡| |๐‘ซ ๐‘˜ 1๐ต๐‘‡| LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
  • 56. Bab 3 Model Imputasi 43 Interval prediksi pada persamaan 3.29 berlaku untuk taksiran yang dihi- tung dengan menggunakan formula 3.18, 3.20, dan 3.25. Untuk formula 3.21, 100(1 โˆ’ ๐›ผ)% prediksi interval untuk ๐‘Œ๐‘˜ diperoleh dengan menggunakan formula berikut: [๐ธ(๐‘Œ๐‘˜|๐‘Œ๐‘˜โˆ’1) โˆ’ ๐‘ง ๐›ผ 2 โˆš๐œŽ๐‘˜ 2(1 โˆ’ ๐œŒ2)โก, ๐ธ(๐‘Œ๐‘˜|๐‘Œ๐‘˜โˆ’1) + ๐‘ง ๐›ผ 2 โˆš๐œŽ๐‘˜ 2 (1 โˆ’ ๐œŒ2)โกโก].โกโก(3. 31) Misalkan pada kasus ini, ๐‘ˆ = โก๐ธ(๐‘Œ๐‘˜|๐‘Œ๐‘˜โˆ’1) + ๐‘ง ๐›ผ 2 โˆš๐œŽ๐‘˜ 2(1 โˆ’ ๐œŒ2)โกโก ๐ฟ = ๐ธ(๐‘Œ๐‘˜|๐‘Œ๐‘˜โˆ’1) โˆ’ ๐‘ง ๐›ผ 2 โˆš๐œŽ๐‘˜ 2(1 โˆ’ ๐œŒ2)โกโก, maka 100(1 โˆ’ ๐›ผ)% interval prediksi ๐‘‹ ๐‘˜ dapat dihitung dengan menggunakan for- mula 3.30. Untuk memperoleh prediksi interval tersebut, mean dan variansi secara berturut turut dapat ditaksir dengan menggunakan formula berikut: ๐‘‰๐‘Ž๐‘Ÿ(๐‘Œ๐‘˜|๐‘Œ๐‘˜โˆ’1)ฬ‚ = ๐‘  ๐‘˜ 2 (1 โˆ’ ๐œŒ ๐ด๐‘…1ฬ‚) ๐ธ(๐‘Œ๐‘˜|๐‘Œ๐‘˜โˆ’1)ฬ‚ = ๐‘Œฬ…๐‘˜ + ๐œŒ ๐ด๐‘…1ฬ‚ ๐‘  ๐‘˜ ๐‘  ๐‘˜โˆ’1 โก(๐‘ฆ ๐‘˜โˆ’1 โˆ’ ๐‘Œฬ…๐‘˜โˆ’1). LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
  • 57. 44 Bab 4 Algoritma Imputasi dan Simulasi Berdasarkan model imputasi pada bab 3, akan dikonstruksi sebuah algoritma im- putasi untuk mengimput data hilang dari subjek ๐‘– pada saat ๐‘˜. Berdasarkan skema imputasi pada bab 3, algoritma ini dapat diperumum, sehingga dapat digunakan untuk mengimput seluruh data yang hilang. Untuk menganalisis kebaikan model, algoritma imputasi disimulasikan pada data bangkitan dan data riil. 4.1 Algoritma Imputasi Sebelum melakukan imputasi, langkah awal yang harus dilakukan ialah menen- tukan nilai ๐‘– dan ๐‘˜. Setelah nilai ๐‘–โกdan ๐‘˜ ditentukan, imputasi untuk mengisi nilai ๐‘ฅ ๐‘˜ dapat dilakukan dengan menerapkan langkah-langkah pada algoritma berikut: 1. Fitting distribusi data ๐’™ untuk tiap-tiap waktu ๐‘—, sehingga diperoleh ๐น๐‘— un- tuk ๐‘— = 1, โ€ฆ , ๐‘˜. 2. Mentransformasikan data ๐’™ pada tiap tiap waktu dengan menggunakan fungsi distribusinya sendiri (sesuai hasil fitting pada langkah 1), sehingga diperoleh data hasil PIT berupa matriks ๐’–,โกdimana ๐‘ข๐‘–๐‘— = ๐น๐‘—(๐‘ฅ๐‘–๐‘—), ๐‘– = 1 โ€ฆ . ๐‘›โกโก; โกโก๐‘— = 1, โ€ฆ , ๐‘šโก. Histogram dari matriks ๐’– untuk data pada tiap-tiap titik waktu dapat digunakan untuk melihat kebaikan hasil fiiting distribusi. 3. Mentransformasikan data pada matriks ๐’– dengan menggunakan fungsi in- vers kuantil dari distribusi normal baku, sehingga diperoleh data realisasi dari vektor acak ๐‘พ ๐‘˜. LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
  • 58. Bab 4 Algoritma Imputasi dan Simulasi 45 4. Mencari interval dari nilai ๐œŒ yang memenuhi sifat matriks definit positif untuk tiap-tiap struktur korelasi (CS, AR1, dan 1BT). Matriks korelasi yang dijadikan acuan untuk menentukan interval berukuran ๐‘˜ ร— ๐‘˜. 5. Menentukan nilai ๐œŒฬ‚ ๐ถ๐‘† , ๐œŒฬ‚ ๐ด๐‘…1 ,โกdan ๐œŒฬ‚1๐ต๐‘‡ dengan memilih salah satu nilai ๐œŒ pada selang yang telah diperoleh pada langkah 4. Pemilihan dilakukan dengan cara memaksimumkan fungsi likelihood pada persamaan 3.26. 6. Menghitung taksiran ๐‘ฆ ๐‘˜ dibawah asumsi masing-masing struktur korelasi, kemudian menghitung taksiran dari ๐‘ฅ ๐‘˜ dengan menggunakan formula 3.18, 3.20, 3.21, dan 3.25. 7. Menghitung taksiran data pada waktu ๐‘˜ untuk seluruh subjek yang terob- servasi dengan memanfaatkan koefisien korelasi dan hasil fitting distribusi yang telah diperoleh, kemudian menghitung ๐œ–ฬ… dan ๐‘ ๐œ– untuk tiap-tiap struk- tur korelasi. 8. Menentukan model terbaik berdasarkan ๐œ–ฬ… dan ๐‘ ๐œ– yang dihitung pada lang- kah 7, kemudian mengimput ๐‘ฅ ๐‘˜ dengan menggunakan hasil taksiran dari model terbaik. 4.2 Simulasi 4.2.1 Simulasi pada Data Bangkitan Pada sub bab ini, untuk melihat kebaikan dari model yang telah diperoleh pada Bab 3, prosedur imputasi yang termuat pada algoritma pada sub bab 4.1 akan dibandingkan dengan prosedur imputasi berdasarkan metode imputasi yang sudah ada sebelumnya, yaitu mean subtitution dan LOCF. Pembanding ini dipilih karena pada praktiknya lebih sering digunakan. Pada studi simulasi I, algoritma imputasi untuk masing-masing metode akan disimulasikan pada data bangkitan berdistribusi normal 5 variat. Asumsikan bahwa single dropout terjadi pada waktu m (titik waktu akhir). Simulasi akan difokuskan pada data dengan jumlah subjek sedikit, yaitu ๐‘› = 10, dimana setiap observasi menjadi penting. LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
  • 59. Bab 4 Algoritma Imputasi dan Simulasi 46 Sesuai dengan definisi dari CRD, RD, dan ID, secara berturut-turut data akan dihilangkan secara acak, data observasi pada waktu ๐‘š akan dihilangkan apabila data observasi pada waktu 1 memiliki observasi maksimum, dan data ob- servasi pada waktu m akan dihilangkan apabila data tersebut memiliki observasi maksimum. Prosedur penghapusan data berdasarkan mekanisme dropout diterap- kan untuk melihat pengaruh mekanisme dropout terhadap kebaikan prosedur im- putasi. Selain diuji pada data berdistribusi normal, pada studi simulasi II, prosedur imputasi juga akan diuji pada data yang memiliki kemencengan (skewness). Akan dilihat apakah asumsi normal pada data yang memiliki kemencengan tak nol akan mempengaruhi kebaikan imputasi. Data yang memiliki kemencengan (skeweness) dapat diperoleh dengan menerapkan transformasi berikut: Misalkan ๐‘‹๐‘— berdistribusi normal. Definisikan suatu variabel acak baru ๐‘‰๐‘—, dimana ๐‘‰๐‘— = { ๐‘‹๐‘—, โˆ’โˆž <โก ๐‘‹๐‘— โ‰ค 1 ๐‘‹๐‘— 2 , 1 < ๐‘‹๐‘— < โˆžโก , sehingga ๐‘“๐‘‰ ๐‘— (๐‘ฃ) = { ๐‘“๐‘‹ ๐‘— ๐‘ฃ,โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก โˆ’ โˆž < ๐‘ฃ โ‰ค 1 1 2โˆš ๐‘ฃ ๐‘“๐‘‹ ๐‘— (โˆš ๐‘ฃ),โกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโกโก1 < ๐‘ฃ < โˆž โกโกโก. Karena fungsi kuadrat merupakan fungsi konveks, maka distribusi ๐‘‰๐‘— akan memi- liki ekor di kanan. Distribusi dari hasil transformasi di atas bergantung pada para- meter dari distribusi ๐‘‹๐‘—. Apabila mean dari ๐‘‹๐‘— bernilai negatif dan jauh dari nol, transformasi di atas tidak akan memberikan pengaruh kemencengan yang besar. Oleh sebab itu, pada studi simulasi II, parameter mean dari ๐‘‹๐‘— dipilih secara acak pada interval di sekitar satu. Analisis dari hasil simulasi akan didasarkan pada rata-rata dan deviasi standar dari eror imputasi untuk masing-masing metode pada 500 kali pengulang- LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
  • 60. Bab 4 Algoritma Imputasi dan Simulasi 47 an. Misalkan ๐ต1, ๐ต2, ๐ต3, ๐ต4 dan ๐‘†1, ๐‘†2, ๐‘†3, ๐‘†4 masing-masing berturut-turut menya- takan rataan dan deviasi standar dari eror imputasi pada 500 pengulangan untuk metode imputasi berdasarkan algoritma pada sub bab 4.1, metode imputasi berdasarkan formula imputasi yang disesuaikan dengan struktur korelasi data bangkitan (formula 3.18 untuk CS, 3.20 untuk AR1, dan 3.25 untuk 1BT), metode mean subtitution, dan metode LOCF. Untuk struktur CS dan AR1, akan diguna- kan ๐œŒ = 0,5 dan ๐œŒ = 0,8. Kemudian untuk struktur 1BT akan digunakan ๐œŒ = 0,2 dan ๐œŒ = 0,5. 4.2.1.1 Struktur Korelasi CS Studi simulasi I Sebagai langkah awal untuk menganalisis prosedur imputasi, algoritma imputasi diterapkan pada data berdistribusi multivariat normal. Hasil simulasi dapat dilihat pada tabel berikut: Tabel 4.1 Hasil simulasi pada data bangkitan (CS, normal,โก๐œŒ = 0,5). CRD RD ID ๐ต1 0,667 0,754 1,287 ๐ต2 0,658 0,732 1,275 ๐ต3 1,975 2,277 2,66 ๐ต4 2,655 3,034 3,397 ๐‘†1 0,582 0,727 0,741 ๐‘†2 0,566 0,663 0,723 ๐‘†3 2,521 3,117 3,534 ๐‘†4 3,566 4,102 4,454 Hasil simulasi pada Tabel 4.1 mengindikasikan bahwa model imputasi dengan memanfaatkan distribusi bersyarat memiliki nilai rata-rata error imputasi yang kecil dan taksiran yang lebih stabil dibandingkan dengan metode mean subtitution dan metode LOCF (๐ต1 < ๐ต2 < ๐ต3โกdanโก๐‘†1 < ๐‘†2 < ๐‘†3). Selain itu, ketiga metode LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
  • 61. Bab 4 Algoritma Imputasi dan Simulasi 48 menunjukkan bahwa untuk mekanisme CRD dan RD, seluruh metode lebih baik dalam memprediksi data yang hilang dibanding pada mekanisme ID. Selanjutnya dapat dilihat bahwa untuk ketiga mekanisme dropout, secara berturut-turut nilai ๐ต1 dan ๐‘†1 mendekati nilai ๐ต2 dan ๐‘†2. Dengan kata lain, prosedur pemilihan model pada metode imputasi dengan memanfaatkan distribusi bersyarat sudah cukup baik. Frekuensi relatif dari pemilihan model untuk tiap-tiap mekanisme dropoutโกdapat dilihat pada tabel berikut: Tabel 4.2 Frekuensi relatif pemilihan model (CS, normal, ๐œŒ = 0,5). Mekanisme Dropout CS AR1 AR1n 1BT CRD 0,958 0,024 0,006 0,012 RD 0,966 0,012 0,004 0,018 ID 0,96 0,022 0,004 0,0140 Tabel 4.2 menunjukkan bahwa struktur korelasi CS yang merupakan struktur ko- relasi yang digunakan untuk membangkitkan data lebih sering dipilih. Selanjutnya akan dilihat pengaruh nilai koefisien korelasi populasi terha- dap kebaikan prosedur imputasi. Pengaruh nilai koefisien korelasi populasi ter- hadap kebaikan prosedur imputasi akan dianalisa melalui perbandingan dengan hasil dari simulasi serupa untuk nilai ๐œŒ = 0,8. Hasil simulasi imputasi pada data pembanding dapat dilihat pada tabel berikut: Tabel 4.3 Hasil simulasi data bangkitan (CS, normal,โก๐œŒ = 0,8). CRD RD ID ๐ต1 0,433 0,55 0,825 ๐ต2 0,432 0,548 0,822 ๐ต3 2,020 2,661 2,854 ๐ต4 2,455 3,162 3,497 ๐‘†1 0,393 0,546 0,587 ๐‘†2 0,392 0,541 0,581 ๐‘†3 2,093 4,197 4,329 ๐‘†4 3,569 4,707 5,095 LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB
  • 62. Bab 4 Algoritma Imputasi dan Simulasi 49 Perbedaan hasil simulasi pada Tabel 4.1 dan Tabel 4.3 menunjukkan bahwa kebaikan taksiran menggunakan prosedur imputasi dengan memanfaatkan distribusi bersyarat dipengaruhi oleh nilai koefisien korelasi populasi. Semakin tinggi koefisien korelasi populasi antar titik waktu, taksiran semakin baik. Seba- liknya, imputasi dengan menggunakan metode mean subtitution dan LOCF tidak begitu baik. Selain itu, apabila korelasi data antar titik waktu kuat, nilai ๐‘†1dan ๐ต1 secara berturut turut makin mendekati nilai ๐‘†2 dan ๐ต2. Artinya pemilihan model akan semakin tepat apabila korelasi data antar titik waktu semakin tinggi. Fre- kuensi relatif dari pemilihan model terbaik untuk tiap-tiap mekanisme drop- outโกdapat dilihat pada tabel berikut: Tabel 4.4 Frekuensi relatif pemilihan model (CS, normal,โก๐œŒ = 0,8). Mekanisme Dropout CS AR1 AR1n 1BT CRD 0,996 0,002 0,002 0 RD 0,996 0,004 0 0 ID 0,99 0,01 0 0 Studi simulasi II Data pada kenyataannya hampir tidak pernah berdistribusi simetri dan asumsi normal sering digunakan. Untuk itu, kebaikan prosedur imputasi akan diuji pada data yang memiliki kemencengan (๐‘ ๐‘˜๐‘’๐‘ค๐‘’๐‘‘ data). Ukuran sampel yang digunakan ialah ๐‘› = 10, sehingga pada saat fitting distribusi, asumsi kenormalan cenderung tidak ditolak pada tingkat signifikansi ๐›ผ = 0,05. Hasil simulasi pada skewed data dapat dilihat pada tabel berikut: Tabel 4.5 Hasil simulasi data bangkitan (CS, skewed,โก๐œŒ = 0,5). CRD RD ID ๐ต1 0,887 1,33 2,727 ๐ต2 0,86 1,265 2,648 ๐ต3 2,415 4,823 4,620 ๐ต4 2,813 4,943 5,376 ๐‘†1 1,287 2,681 2,609 ๐‘†2 1,255 2,578 2,553 LAPORANTUGASAKHIR-INDAHNURINA-10110094-MAITB