APG Pertemuan 4 : Multivariate Normal Distribution (2)
Data ramus bone tersebut tidak mengandung outlier berdasarkan analisis standarisasi dan jarak kuadrat. Semua nilai zjk dan dj2 berada dalam kisaran yang diizinkan untuk distribusi normal multivariate.
APG Pertemuan 4 : Multivariate Normal Distribution (2)
2.
1. Mathematical Simplicity distribusi ini relatif mudah
dikerjakan, sehingga mudah untuk mendapatkan
metode multivariat berdasarkan distribusi ini.
2. Multivariate version of the CTL jika kita memiliki
koleksi vektor acak X1, X2, ..., Xn yang iid, maka vektor
mean sampel, 𝑥, akan menjadi multivariat yang
terdistribusi normal untuk sampel besar.
3. Banyak fenomena dapat dimodelkan menggunakan
distribusi
3.
Random variabel Xberdistribusi normal dengan
Rata-rata : µ Varians : 𝜎
PDF : 𝑓 𝑥 =
1
2𝜋𝜎2
exp{−
1
2𝜎2 (𝑥 − 𝜇)2
} untuk −∞ < 𝑥 < ∞
5.
Random vektor X(𝑝 × 1) berdistribusi multivariat normal dengan
Vektor rata-rata populasi : µ Matriks varians-kovarians : ∑
Pdf : 𝒇 𝒙 =
𝟏
𝟐𝝅
𝒑/𝟐
∑ −𝟏/𝟐
𝒆𝒙𝒑 −
𝟏
𝟐
𝒙 − 𝝁 ′∑−𝟏
𝒙 − 𝝁
Notasi : 𝑋 𝑝~𝑁 𝑝(𝜇, ∑)
Jika 𝑝 = 2 maka X bersdistribusi Bivariate Normal
1. Kombinasi linierdari semua komponen peubah x juga
menyebar normal.
𝑌 =
𝑗=1
𝑝
𝑐𝑗 𝑋𝐽 = 𝒄′𝑿
Jika 𝑿 𝑝~𝑁 𝑝(𝝁, ∑)maka Y berdistribusi normal dengan
Rata-rata : 𝒄′
𝝁 = ∑ 𝑗=1
𝑝
𝑐𝑗 𝜇 𝑗
Varians : 𝒄′
∑𝒄 = ∑ 𝑗=1
𝑝
∑ 𝑘=1
𝑝
𝑐𝑗 𝑐 𝑘 𝜎𝑗𝑘
Notasi : 𝒀~𝑁(𝒄′
𝝁, 𝒄′
∑𝒄)
9.
2. Jika 𝑿𝑝~𝑁 𝑝(𝝁, ∑) maka semua komponen dari X juga
berdistribusi normal.
3. Jika kovarian bernilai nol maka komponen yang
bersesuaian saling bebas
4. Sebaran bersyarat dari semua variabel berdistribusi
multivariate normal:
𝑋 =
𝑥1
𝑥2
~𝑁 𝑝(𝝁, ∑) dengan 𝜇 =
𝑥1
𝑥2
,
∑ =
∑11
∑21
∑12
∑22
dan ∑22 > 0
10.
maka sebaran bersayaratX dengan X2 = x2 adalah normal
dengan
rata-rata = µ1 + ∑12∑22
−1
(x2- µ2)
kovarian = ∑11 − ∑12∑22
−1
∑21
5. Jika 𝑿 𝑝~𝑁 𝑝(𝝁, ∑) dengan ∑ > 0 maka
a. 𝒙 − 𝝁 ′∑−𝟏 𝒙 − 𝝁 ~ ᵡ 𝑝
b. Selang kepercayaan (1-α) 𝒙 − 𝝁 ′∑−𝟏 𝒙 − 𝝁 =
ᵡ(𝛼,𝑝)
11.
Teorema:
Jika ∑ definitpositif maka ∑ -1 ada
∑e = λe
∑ -1 e = (1/ λ) e,
sehinggga ( λ.e) adalah pasangan nilai akar ciri dan vektor ciri
bagi ∑ koresponden terhadap pasangan (1/ λ .e) untuk ∑-1 . ∑ -1
juga positif.
12.
Kurva CI berbentukelipsoid, dimana
c = permukaan ellips berpusat di µ
𝒙 − 𝝁 ′∑−𝟏
𝒙 − 𝝁 = 𝑐2
dan absis = ± c λi𝑒𝑖 dimana ∑ei = λiei , i = 1,2,..,p
semua x yang memenuhi
13.
Diketahui 𝑥 ~𝑁2 𝑑𝑒𝑛𝑔𝑎𝑛
µ =
5
10 𝑎𝑛𝑑 ∑ =
1 0
0 1
→ 𝜌 = 0.67
Gambarkanprobabilitaskontur untuk 99%, 95%, 90%, 75%, 50%,
dan 20% !
Dalam kasus univariate(p=1), kita tahu bahwa sebaran dari x adalah normal dengan
rata-rata 𝜇 dan varian 𝜎2
/n. Hal ini juga berlaku untuk kasus multivariate (p ≥2)
dimana vektor rata-rata X berdistribusi normal dengan rataan 𝝁 dan matriks kovarian
(1/n)∑ . Varians dari sampling (n-1) 𝑠2
= ∑ 𝑗=1
𝑛
(𝑥𝑖 − 𝑥)2
mengikuti distribusi chi
square dengan derajat besas n-1, dimana (n-1) 𝑠2
merupakan penjumlahan dari :
𝝈 𝟐 𝒁𝒊
𝟐
+ ⋯ + 𝒁 𝒏−𝟏
𝟐
= (𝝈𝒁𝒊) 𝟐 + ⋯ + (𝝈𝒁 𝒏−𝒊) 𝟐
𝜎𝑍𝑖, mengikuti distribusi N(0, 𝜎2
). Ini merupakan bentuk umum distribusi sampling
dari unsur-unsur matriks kovarian. Distribusi ini disebut dengan distribusi Wishart.
17.
Ambil x1, x2,..., xn sebagai contoh acak yang berukuran n dari
sebuah populasi normal ganda p dengan rata-rata 𝜇 dan
matriks kovarian ∑ , kemudian :
1. X mengikuti ditribusi Np (𝜇, (1/n) ∑ )
2. (n-1)S adalah menyebar Wishart dengan db = n – 1
3. X dan S adalah bebas.
Karena ∑ tidak diketahui, sebaran 𝑋 tidak dapat digunakan
langsung untuk mendapatkan 𝜇 . Sebagaimana S
memberikan informasi bebas tentang ∑ dan distribusi s tidak
tergantung pada 𝜇.
18.
Hal-hal yang perludiperhatikan dari distribusi Wishart:
1. Jika 𝐴1 menyebar W 𝑚1 (𝐴1| ∑ ) bebas dari 𝐴2, yang menyebar
Wm2 (A2 ), maka A1 + A2 menyebar Wm1+m2 (A1 + A2| ∑)
2. Jika A menyebar Wm (A|∑ ), maka CAC‟ menyebar Wm
(CAC’|C∑C‟).
Distribusi ini tidak ada jika ukuran contoh n tidak lebih besar dari
jumlah peubah (p). Jika ada maka sebaran Wishartnya adalah
𝑊 𝑚 (𝐴|∑ ) =
𝐴 (𝑛−𝑝−2)/2
𝑒−𝑡𝑟𝐴∑−1/2
∑ 𝑝(𝑛−1)/2∏ 𝑝(𝑝−1)/4 |∑|(𝑛−1)/2 ∏𝑖=1
𝑝
┌[
1
2 𝑛 − 1
]
Dimana matriks A definit ositif dan ┌ (.) adalah fungsi Gamma.
19.
Beberapa tahapan yangharus dilakukan dalam menyusun Plot
Kuartil 2 adalah sebagai berikut:
1. Hitung:
𝑑𝑖𝑖
2
= 𝑥(𝑖) − 𝜇
′
∑−1
𝑥(𝑖) − 𝜇
2. Beri peringkat nilai 𝑑𝑖𝑖
2
3. Carilah nilai chi-Square dari nilai (i –1/2)/n dengan derajat bebas
p.
𝑋 𝑝
2
𝑖 −
1
2
𝑛
20.
4. Buat plot
𝑋𝑝
2
𝑖−
1
2
𝑛
dengan 𝑑𝑖𝑖
2
bila pola hubungannya mengikuti garis lurus maka data tersebut dapat
dikatakan menyebar normal ganda. Namun demikian untuk lebih
menyakinkan dapat dilakukan dengan menghitung nilai korelasi person
𝑋 𝑝
2
𝑖−
1
2
𝑛
dengan 𝑑𝑖𝑖
2
.
Apabila nilai korelasi ini nyata maka data tersebut mengikuti sebaran
normal ganda.
Dengan menggunakan QQ-Plot,tunjukkan apakah data tersebut
berdistribusi normal ganda?
(Pembahasan terlampir)
23.
Langkah-langkah deteksi outlier:
1.Membuat dot plot di setiap variabel
2. Membuat scatter plot berpasangan setiap variabel
3. Menghitung nilai standarisasi 𝑧𝑗𝑘 = (𝑥𝑗𝑘 − 𝑥 𝑘) / 𝑠 𝑘𝑘 untuk j=
1,2…,n dan k = 1,2,…,p; jika nilai 𝑧𝑗𝑘 berada dalam selang -3 < 𝑧𝑗𝑘 <
3 maka data jk bukan oulier, sebaliknya jika nilai 𝑧𝑗𝑘 lebih kecil
dari -3 dan lebih besar dari 3 maka data ke-jk merupakan oulier.
4. Menghitung jarak kuadrat 𝑑𝑗
2
= 𝑥𝑗 − 𝑥
′
𝑠−1
𝑥𝑗 − 𝑥 , jika nilai
𝑑𝑗
2
melebihi 𝑋(𝑘)
2
maka data ke-jk merupakan outlier.
Let X be𝑁3(𝜇,∑)with
1. Which of the following random variables
are independent?
a. X1 and X2
b. X2 and X3
c. (X1, X2) and X3
2. Find the mean vector and covariance matrix for 3X1 - 2X2 + X3!
(Pembahasan terlampir)