APG Pertemuan 4 : Multivariate Normal Distribution (2)

1. Mathematical Simplicity  distribusi ini relatif mudah
dikerjakan, sehingga mudah untuk mendapatkan
metode multivariat berdasarkan distribusi ini.
2. Multivariate version of the CTL  jika kita memiliki
koleksi vektor acak X1, X2, ..., Xn yang iid, maka vektor
mean sampel, 𝑥, akan menjadi multivariat yang
terdistribusi normal untuk sampel besar.
3. Banyak fenomena dapat dimodelkan menggunakan
distribusi

Random variabel X berdistribusi normal dengan
Rata-rata : µ Varians : 𝜎
PDF : 𝑓 𝑥 =
1
2𝜋𝜎2
exp{−
1
2𝜎2 (𝑥 − 𝜇)2
} untuk −∞ < 𝑥 < ∞

Random vektor X (𝑝 × 1) berdistribusi multivariat normal dengan
Vektor rata-rata populasi : µ Matriks varians-kovarians : ∑
Pdf : 𝒇 𝒙 =
𝟏
𝟐𝝅
𝒑/𝟐
∑ −𝟏/𝟐
𝒆𝒙𝒑 −
𝟏
𝟐
𝒙 − 𝝁 ′∑−𝟏
𝒙 − 𝝁
Notasi : 𝑋 𝑝~𝑁 𝑝(𝜇, ∑)
Jika 𝑝 = 2 maka X bersdistribusi Bivariate Normal

µ =
0
0
∑ =
1
1
−0.5
−0.5 1

1. Kombinasi linier dari semua komponen peubah x juga
menyebar normal.
𝑌 =
𝑗=1
𝑝
𝑐𝑗 𝑋𝐽 = 𝒄′𝑿
Jika 𝑿 𝑝~𝑁 𝑝(𝝁, ∑)maka Y berdistribusi normal dengan
Rata-rata : 𝒄′
𝝁 = ∑ 𝑗=1
𝑝
𝑐𝑗 𝜇 𝑗
Varians : 𝒄′
∑𝒄 = ∑ 𝑗=1
𝑝
∑ 𝑘=1
𝑝
𝑐𝑗 𝑐 𝑘 𝜎𝑗𝑘
Notasi : 𝒀~𝑁(𝒄′
𝝁, 𝒄′
∑𝒄)

2. Jika 𝑿 𝑝~𝑁 𝑝(𝝁, ∑) maka semua komponen dari X juga
berdistribusi normal.
3. Jika kovarian bernilai nol maka komponen yang
bersesuaian saling bebas
4. Sebaran bersyarat dari semua variabel berdistribusi
multivariate normal:
𝑋 =
𝑥1
𝑥2
~𝑁 𝑝(𝝁, ∑) dengan 𝜇 =
𝑥1
𝑥2
,
∑ =
∑11
∑21
∑12
∑22
dan ∑22 > 0

maka sebaran bersayarat X dengan X2 = x2 adalah normal
dengan
rata-rata = µ1 + ∑12∑22
−1
(x2- µ2)
kovarian = ∑11 − ∑12∑22
−1
∑21
5. Jika 𝑿 𝑝~𝑁 𝑝(𝝁, ∑) dengan ∑ > 0 maka
a. 𝒙 − 𝝁 ′∑−𝟏 𝒙 − 𝝁 ~ ᵡ 𝑝
b. Selang kepercayaan (1-α)  𝒙 − 𝝁 ′∑−𝟏 𝒙 − 𝝁 =
ᵡ(𝛼,𝑝)

Teorema:
Jika ∑ definit positif maka ∑ -1 ada
∑e = λe
∑ -1 e = (1/ λ) e,
sehinggga ( λ.e) adalah pasangan nilai akar ciri dan vektor ciri
bagi ∑ koresponden terhadap pasangan (1/ λ .e) untuk ∑-1 . ∑ -1
juga positif.

Kurva CI berbentuk elipsoid, dimana
c = permukaan ellips berpusat di µ
𝒙 − 𝝁 ′∑−𝟏
𝒙 − 𝝁 = 𝑐2
dan absis = ± c λi𝑒𝑖 dimana ∑ei = λiei , i = 1,2,..,p
semua x yang memenuhi

Diketahui 𝑥 ~ 𝑁2 𝑑𝑒𝑛𝑔𝑎𝑛
µ =
5
10 𝑎𝑛𝑑 ∑ =
1 0
0 1
→ 𝜌 = 0.67
Gambarkanprobabilitaskontur untuk 99%, 95%, 90%, 75%, 50%,
dan 20% !

𝜇 =
5
10
; Σ =
9 16
16 64
; 𝜌 = 0,667
Buatlah kontur dengan tingkat kepercayaan 95%!
(Pembahasan terlampir)

Dalam kasus univariate (p=1), kita tahu bahwa sebaran dari x adalah normal dengan
rata-rata 𝜇 dan varian 𝜎2
/n. Hal ini juga berlaku untuk kasus multivariate (p ≥2)
dimana vektor rata-rata X berdistribusi normal dengan rataan 𝝁 dan matriks kovarian
(1/n)∑ . Varians dari sampling (n-1) 𝑠2
= ∑ 𝑗=1
𝑛
(𝑥𝑖 − 𝑥)2
mengikuti distribusi chi
square dengan derajat besas n-1, dimana (n-1) 𝑠2
merupakan penjumlahan dari :
𝝈 𝟐 𝒁𝒊
𝟐
+ ⋯ + 𝒁 𝒏−𝟏
𝟐
= (𝝈𝒁𝒊) 𝟐 + ⋯ + (𝝈𝒁 𝒏−𝒊) 𝟐
𝜎𝑍𝑖, mengikuti distribusi N(0, 𝜎2
). Ini merupakan bentuk umum distribusi sampling
dari unsur-unsur matriks kovarian. Distribusi ini disebut dengan distribusi Wishart.

Ambil x1, x2, ..., xn sebagai contoh acak yang berukuran n dari
sebuah populasi normal ganda p dengan rata-rata 𝜇 dan
matriks kovarian ∑ , kemudian :
1. X mengikuti ditribusi Np (𝜇, (1/n) ∑ )
2. (n-1)S adalah menyebar Wishart dengan db = n – 1
3. X dan S adalah bebas.
Karena ∑ tidak diketahui, sebaran 𝑋 tidak dapat digunakan
langsung untuk mendapatkan 𝜇 . Sebagaimana S
memberikan informasi bebas tentang ∑ dan distribusi s tidak
tergantung pada 𝜇.

Hal-hal yang perlu diperhatikan dari distribusi Wishart:
1. Jika 𝐴1 menyebar W 𝑚1 (𝐴1| ∑ ) bebas dari 𝐴2, yang menyebar
Wm2 (A2 ), maka A1 + A2 menyebar Wm1+m2 (A1 + A2| ∑)
2. Jika A menyebar Wm (A|∑ ), maka CAC‟ menyebar Wm
(CAC’|C∑C‟).
Distribusi ini tidak ada jika ukuran contoh n tidak lebih besar dari
jumlah peubah (p). Jika ada maka sebaran Wishartnya adalah
𝑊 𝑚 (𝐴|∑ ) =
𝐴 (𝑛−𝑝−2)/2
𝑒−𝑡𝑟𝐴∑−1/2
∑ 𝑝(𝑛−1)/2∏ 𝑝(𝑝−1)/4 |∑|(𝑛−1)/2 ∏𝑖=1
𝑝
┌[
1
2 𝑛 − 1
]
Dimana matriks A definit ositif dan ┌ (.) adalah fungsi Gamma.

Beberapa tahapan yang harus dilakukan dalam menyusun Plot
Kuartil 2 adalah sebagai berikut:
1. Hitung:
𝑑𝑖𝑖
2
= 𝑥(𝑖) − 𝜇
′
∑−1
𝑥(𝑖) − 𝜇
2. Beri peringkat nilai 𝑑𝑖𝑖
2
3. Carilah nilai chi-Square dari nilai (i –1/2)/n dengan derajat bebas
p.
𝑋 𝑝
2
𝑖 −
1
2
𝑛

4. Buat plot
𝑋 𝑝
2
𝑖−
1
2
𝑛
dengan 𝑑𝑖𝑖
2
bila pola hubungannya mengikuti garis lurus maka data tersebut dapat
dikatakan menyebar normal ganda. Namun demikian untuk lebih
menyakinkan dapat dilakukan dengan menghitung nilai korelasi person
𝑋 𝑝
2
𝑖−
1
2
𝑛
dengan 𝑑𝑖𝑖
2
.
Apabila nilai korelasi ini nyata maka data tersebut mengikuti sebaran
normal ganda.

Diketahui data suatu pengamatan sebagai berikut.
No. X1 X2 X3
1 98 81 38
2 103 84 38
3 103 86 42
4 103 86 42
5 109 88 44
6 123 92 50
7 123 95 46
8 133 99 51
9 133 102 51
10 133 102 51
11 134 100 48
12 136 102 49
No. X1 X2 X3
13 138 98 51
14 138 99 51
15 141 105 53
16 147 108 57
17 149 107 55
18 153 107 56
19 155 115 63
20 155 117 60
21 158 115 62
22 159 118 63
23 162 124 61
24 177 132 67

Dengan menggunakan QQ-Plot, tunjukkan apakah data tersebut
berdistribusi normal ganda?

Langkah-langkah deteksi outlier:
1. Membuat dot plot di setiap variabel
2. Membuat scatter plot berpasangan setiap variabel
3. Menghitung nilai standarisasi 𝑧𝑗𝑘 = (𝑥𝑗𝑘 − 𝑥 𝑘) / 𝑠 𝑘𝑘 untuk j=
1,2…,n dan k = 1,2,…,p; jika nilai 𝑧𝑗𝑘 berada dalam selang -3 < 𝑧𝑗𝑘 <
3 maka data jk bukan oulier, sebaliknya jika nilai 𝑧𝑗𝑘 lebih kecil
dari -3 dan lebih besar dari 3 maka data ke-jk merupakan oulier.
4. Menghitung jarak kuadrat 𝑑𝑗
2
= 𝑥𝑗 − 𝑥
′
𝑠−1
𝑥𝑗 − 𝑥 , jika nilai
𝑑𝑗
2
melebihi 𝑋(𝑘)
2
maka data ke-jk merupakan outlier.

Diketahui data Ramus Bone sebagai berikut.
No. X1 X2 X3 X4
1 47.8 48.8 49 49.7
2 46.4 47.3 47.7 48.4
3 46.3 46.8 47.8 48.5
4 45.1 45.3 46.1 47.2
5 47.6 48.5 48.9 49.3
6 52.5 53.2 53.3 53.7
7 51.2 53 54.3 54.5
8 49.8 50 50.3 52.7
9 48.1 50.8 52.3 54.4
10 45 47 47.3 48.3
11 51.2 51.4 51.6 51.9
12 48.5 49.2 53 55.5
No. X1 X2 X3 X4
13 52.1 52.8 53.7 55
14 48.2 48.9 49.3 49.8
15 49.6 50.4 51.2 51.8
16 50.7 51.7 52.7 53.3
17 47.2 47.7 48.4 49.5
18 53.3 54.6 55.1 55.3
19 46.2 47.5 48.1 48.4
20 46.3 47.6 51.3 51.8
Deteksi outlier pada data diatas !

Let X be 𝑁3(𝜇,∑)with
1. Which of the following random variables
are independent?
a. X1 and X2
b. X2 and X3
c. (X1, X2) and X3
2. Find the mean vector and covariance matrix for 3X1 - 2X2 + X3!

APG Pertemuan 4 : Multivariate Normal Distribution (2)

APG Pertemuan 4 : Multivariate Normal Distribution (2)

More Related Content

What's hot

Similar to APG Pertemuan 4 : Multivariate Normal Distribution (2)

More from Rani Nooraeni

APG Pertemuan 4 : Multivariate Normal Distribution (2)