1. Mathematical Simplicity  distribusi ini relatif mudah
dikerjakan, sehingga mudah untuk mendapatkan
metode multivariat berdasarkan distribusi ini.
2. Multivariate version of the CTL  jika kita memiliki
koleksi vektor acak X1, X2, ..., Xn yang iid, maka vektor
mean sampel, 𝑥, akan menjadi multivariat yang
terdistribusi normal untuk sampel besar.
3. Banyak fenomena dapat dimodelkan menggunakan
distribusi
Random variabel X berdistribusi normal dengan
Rata-rata : µ Varians : 𝜎
PDF : 𝑓 𝑥 =
1
2𝜋𝜎2
exp{−
1
2𝜎2 (𝑥 − 𝜇)2
} untuk −∞ < 𝑥 < ∞
Random vektor X (𝑝 × 1) berdistribusi multivariat normal dengan
Vektor rata-rata populasi : µ Matriks varians-kovarians : ∑
Pdf : 𝒇 𝒙 =
𝟏
𝟐𝝅
𝒑/𝟐
∑ −𝟏/𝟐
𝒆𝒙𝒑 −
𝟏
𝟐
𝒙 − 𝝁 ′∑−𝟏
𝒙 − 𝝁
Notasi : 𝑋 𝑝~𝑁 𝑝(𝜇, ∑)
Jika 𝑝 = 2 maka X bersdistribusi Bivariate Normal
µ =
0
0
∑ =
1 0
0 1
µ =
0
0
∑ =
1
1
−0.5
−0.5 1
1. Kombinasi linier dari semua komponen peubah x juga
menyebar normal.
𝑌 =
𝑗=1
𝑝
𝑐𝑗 𝑋𝐽 = 𝒄′𝑿
Jika 𝑿 𝑝~𝑁 𝑝(𝝁, ∑)maka Y berdistribusi normal dengan
Rata-rata : 𝒄′
𝝁 = ∑ 𝑗=1
𝑝
𝑐𝑗 𝜇 𝑗
Varians : 𝒄′
∑𝒄 = ∑ 𝑗=1
𝑝
∑ 𝑘=1
𝑝
𝑐𝑗 𝑐 𝑘 𝜎𝑗𝑘
Notasi : 𝒀~𝑁(𝒄′
𝝁, 𝒄′
∑𝒄)
2. Jika 𝑿 𝑝~𝑁 𝑝(𝝁, ∑) maka semua komponen dari X juga
berdistribusi normal.
3. Jika kovarian bernilai nol maka komponen yang
bersesuaian saling bebas
4. Sebaran bersyarat dari semua variabel berdistribusi
multivariate normal:
𝑋 =
𝑥1
𝑥2
~𝑁 𝑝(𝝁, ∑) dengan 𝜇 =
𝑥1
𝑥2
,
∑ =
∑11
∑21
∑12
∑22
dan ∑22 > 0
maka sebaran bersayarat X dengan X2 = x2 adalah normal
dengan
rata-rata = µ1 + ∑12∑22
−1
(x2- µ2)
kovarian = ∑11 − ∑12∑22
−1
∑21
5. Jika 𝑿 𝑝~𝑁 𝑝(𝝁, ∑) dengan ∑ > 0 maka
a. 𝒙 − 𝝁 ′∑−𝟏 𝒙 − 𝝁 ~ ᵡ 𝑝
b. Selang kepercayaan (1-α)  𝒙 − 𝝁 ′∑−𝟏 𝒙 − 𝝁 =
ᵡ(𝛼,𝑝)
Teorema:
Jika ∑ definit positif maka ∑ -1 ada
∑e = λe
∑ -1 e = (1/ λ) e,
sehinggga ( λ.e) adalah pasangan nilai akar ciri dan vektor ciri
bagi ∑ koresponden terhadap pasangan (1/ λ .e) untuk ∑-1 . ∑ -1
juga positif.
Kurva CI berbentuk elipsoid, dimana
c = permukaan ellips berpusat di µ
𝒙 − 𝝁 ′∑−𝟏
𝒙 − 𝝁 = 𝑐2
dan absis = ± c λi𝑒𝑖 dimana ∑ei = λiei , i = 1,2,..,p
semua x yang memenuhi
Diketahui 𝑥 ~ 𝑁2 𝑑𝑒𝑛𝑔𝑎𝑛
µ =
5
10 𝑎𝑛𝑑 ∑ =
1 0
0 1
→ 𝜌 = 0.67
Gambarkanprobabilitaskontur untuk 99%, 95%, 90%, 75%, 50%,
dan 20% !
𝜇 =
5
10
; Σ =
9 16
16 64
; 𝜌 = 0,667
Buatlah kontur dengan tingkat kepercayaan 95%!
(Pembahasan terlampir)
Dalam kasus univariate (p=1), kita tahu bahwa sebaran dari x adalah normal dengan
rata-rata 𝜇 dan varian 𝜎2
/n. Hal ini juga berlaku untuk kasus multivariate (p ≥2)
dimana vektor rata-rata X berdistribusi normal dengan rataan 𝝁 dan matriks kovarian
(1/n)∑ . Varians dari sampling (n-1) 𝑠2
= ∑ 𝑗=1
𝑛
(𝑥𝑖 − 𝑥)2
mengikuti distribusi chi
square dengan derajat besas n-1, dimana (n-1) 𝑠2
merupakan penjumlahan dari :
𝝈 𝟐 𝒁𝒊
𝟐
+ ⋯ + 𝒁 𝒏−𝟏
𝟐
= (𝝈𝒁𝒊) 𝟐 + ⋯ + (𝝈𝒁 𝒏−𝒊) 𝟐
𝜎𝑍𝑖, mengikuti distribusi N(0, 𝜎2
). Ini merupakan bentuk umum distribusi sampling
dari unsur-unsur matriks kovarian. Distribusi ini disebut dengan distribusi Wishart.
Ambil x1, x2, ..., xn sebagai contoh acak yang berukuran n dari
sebuah populasi normal ganda p dengan rata-rata 𝜇 dan
matriks kovarian ∑ , kemudian :
1. X mengikuti ditribusi Np (𝜇, (1/n) ∑ )
2. (n-1)S adalah menyebar Wishart dengan db = n – 1
3. X dan S adalah bebas.
Karena ∑ tidak diketahui, sebaran 𝑋 tidak dapat digunakan
langsung untuk mendapatkan 𝜇 . Sebagaimana S
memberikan informasi bebas tentang ∑ dan distribusi s tidak
tergantung pada 𝜇.
Hal-hal yang perlu diperhatikan dari distribusi Wishart:
1. Jika 𝐴1 menyebar W 𝑚1 (𝐴1| ∑ ) bebas dari 𝐴2, yang menyebar
Wm2 (A2 ), maka A1 + A2 menyebar Wm1+m2 (A1 + A2| ∑)
2. Jika A menyebar Wm (A|∑ ), maka CAC‟ menyebar Wm
(CAC’|C∑C‟).
Distribusi ini tidak ada jika ukuran contoh n tidak lebih besar dari
jumlah peubah (p). Jika ada maka sebaran Wishartnya adalah
𝑊 𝑚 (𝐴|∑ ) =
𝐴 (𝑛−𝑝−2)/2
𝑒−𝑡𝑟𝐴∑−1/2
∑ 𝑝(𝑛−1)/2∏ 𝑝(𝑝−1)/4 |∑|(𝑛−1)/2 ∏𝑖=1
𝑝
┌[
1
2 𝑛 − 1
]
Dimana matriks A definit ositif dan ┌ (.) adalah fungsi Gamma.
Beberapa tahapan yang harus dilakukan dalam menyusun Plot
Kuartil 2 adalah sebagai berikut:
1. Hitung:
𝑑𝑖𝑖
2
= 𝑥(𝑖) − 𝜇
′
∑−1
𝑥(𝑖) − 𝜇
2. Beri peringkat nilai 𝑑𝑖𝑖
2
3. Carilah nilai chi-Square dari nilai (i –1/2)/n dengan derajat bebas
p.
𝑋 𝑝
2
𝑖 −
1
2
𝑛
4. Buat plot
𝑋 𝑝
2
𝑖−
1
2
𝑛
dengan 𝑑𝑖𝑖
2
bila pola hubungannya mengikuti garis lurus maka data tersebut dapat
dikatakan menyebar normal ganda. Namun demikian untuk lebih
menyakinkan dapat dilakukan dengan menghitung nilai korelasi person
𝑋 𝑝
2
𝑖−
1
2
𝑛
dengan 𝑑𝑖𝑖
2
.
Apabila nilai korelasi ini nyata maka data tersebut mengikuti sebaran
normal ganda.
Diketahui data suatu pengamatan sebagai berikut.
No. X1 X2 X3
1 98 81 38
2 103 84 38
3 103 86 42
4 103 86 42
5 109 88 44
6 123 92 50
7 123 95 46
8 133 99 51
9 133 102 51
10 133 102 51
11 134 100 48
12 136 102 49
No. X1 X2 X3
13 138 98 51
14 138 99 51
15 141 105 53
16 147 108 57
17 149 107 55
18 153 107 56
19 155 115 63
20 155 117 60
21 158 115 62
22 159 118 63
23 162 124 61
24 177 132 67
Dengan menggunakan QQ-Plot, tunjukkan apakah data tersebut
berdistribusi normal ganda?
(Pembahasan terlampir)
Langkah-langkah deteksi outlier:
1. Membuat dot plot di setiap variabel
2. Membuat scatter plot berpasangan setiap variabel
3. Menghitung nilai standarisasi 𝑧𝑗𝑘 = (𝑥𝑗𝑘 − 𝑥 𝑘) / 𝑠 𝑘𝑘 untuk j=
1,2…,n dan k = 1,2,…,p; jika nilai 𝑧𝑗𝑘 berada dalam selang -3 < 𝑧𝑗𝑘 <
3 maka data jk bukan oulier, sebaliknya jika nilai 𝑧𝑗𝑘 lebih kecil
dari -3 dan lebih besar dari 3 maka data ke-jk merupakan oulier.
4. Menghitung jarak kuadrat 𝑑𝑗
2
= 𝑥𝑗 − 𝑥
′
𝑠−1
𝑥𝑗 − 𝑥 , jika nilai
𝑑𝑗
2
melebihi 𝑋(𝑘)
2
maka data ke-jk merupakan outlier.
Diketahui data Ramus Bone sebagai berikut.
No. X1 X2 X3 X4
1 47.8 48.8 49 49.7
2 46.4 47.3 47.7 48.4
3 46.3 46.8 47.8 48.5
4 45.1 45.3 46.1 47.2
5 47.6 48.5 48.9 49.3
6 52.5 53.2 53.3 53.7
7 51.2 53 54.3 54.5
8 49.8 50 50.3 52.7
9 48.1 50.8 52.3 54.4
10 45 47 47.3 48.3
11 51.2 51.4 51.6 51.9
12 48.5 49.2 53 55.5
No. X1 X2 X3 X4
13 52.1 52.8 53.7 55
14 48.2 48.9 49.3 49.8
15 49.6 50.4 51.2 51.8
16 50.7 51.7 52.7 53.3
17 47.2 47.7 48.4 49.5
18 53.3 54.6 55.1 55.3
19 46.2 47.5 48.1 48.4
20 46.3 47.6 51.3 51.8
Deteksi outlier pada data diatas !
Let X be 𝑁3(𝜇,∑)with
1. Which of the following random variables
are independent?
a. X1 and X2
b. X2 and X3
c. (X1, X2) and X3
2. Find the mean vector and covariance matrix for 3X1 - 2X2 + X3!
(Pembahasan terlampir)
APG Pertemuan 4 : Multivariate Normal Distribution (2)

APG Pertemuan 4 : Multivariate Normal Distribution (2)

  • 2.
    1. Mathematical Simplicity distribusi ini relatif mudah dikerjakan, sehingga mudah untuk mendapatkan metode multivariat berdasarkan distribusi ini. 2. Multivariate version of the CTL  jika kita memiliki koleksi vektor acak X1, X2, ..., Xn yang iid, maka vektor mean sampel, 𝑥, akan menjadi multivariat yang terdistribusi normal untuk sampel besar. 3. Banyak fenomena dapat dimodelkan menggunakan distribusi
  • 3.
    Random variabel Xberdistribusi normal dengan Rata-rata : µ Varians : 𝜎 PDF : 𝑓 𝑥 = 1 2𝜋𝜎2 exp{− 1 2𝜎2 (𝑥 − 𝜇)2 } untuk −∞ < 𝑥 < ∞
  • 5.
    Random vektor X(𝑝 × 1) berdistribusi multivariat normal dengan Vektor rata-rata populasi : µ Matriks varians-kovarians : ∑ Pdf : 𝒇 𝒙 = 𝟏 𝟐𝝅 𝒑/𝟐 ∑ −𝟏/𝟐 𝒆𝒙𝒑 − 𝟏 𝟐 𝒙 − 𝝁 ′∑−𝟏 𝒙 − 𝝁 Notasi : 𝑋 𝑝~𝑁 𝑝(𝜇, ∑) Jika 𝑝 = 2 maka X bersdistribusi Bivariate Normal
  • 6.
  • 7.
  • 8.
    1. Kombinasi linierdari semua komponen peubah x juga menyebar normal. 𝑌 = 𝑗=1 𝑝 𝑐𝑗 𝑋𝐽 = 𝒄′𝑿 Jika 𝑿 𝑝~𝑁 𝑝(𝝁, ∑)maka Y berdistribusi normal dengan Rata-rata : 𝒄′ 𝝁 = ∑ 𝑗=1 𝑝 𝑐𝑗 𝜇 𝑗 Varians : 𝒄′ ∑𝒄 = ∑ 𝑗=1 𝑝 ∑ 𝑘=1 𝑝 𝑐𝑗 𝑐 𝑘 𝜎𝑗𝑘 Notasi : 𝒀~𝑁(𝒄′ 𝝁, 𝒄′ ∑𝒄)
  • 9.
    2. Jika 𝑿𝑝~𝑁 𝑝(𝝁, ∑) maka semua komponen dari X juga berdistribusi normal. 3. Jika kovarian bernilai nol maka komponen yang bersesuaian saling bebas 4. Sebaran bersyarat dari semua variabel berdistribusi multivariate normal: 𝑋 = 𝑥1 𝑥2 ~𝑁 𝑝(𝝁, ∑) dengan 𝜇 = 𝑥1 𝑥2 , ∑ = ∑11 ∑21 ∑12 ∑22 dan ∑22 > 0
  • 10.
    maka sebaran bersayaratX dengan X2 = x2 adalah normal dengan rata-rata = µ1 + ∑12∑22 −1 (x2- µ2) kovarian = ∑11 − ∑12∑22 −1 ∑21 5. Jika 𝑿 𝑝~𝑁 𝑝(𝝁, ∑) dengan ∑ > 0 maka a. 𝒙 − 𝝁 ′∑−𝟏 𝒙 − 𝝁 ~ ᵡ 𝑝 b. Selang kepercayaan (1-α)  𝒙 − 𝝁 ′∑−𝟏 𝒙 − 𝝁 = ᵡ(𝛼,𝑝)
  • 11.
    Teorema: Jika ∑ definitpositif maka ∑ -1 ada ∑e = λe ∑ -1 e = (1/ λ) e, sehinggga ( λ.e) adalah pasangan nilai akar ciri dan vektor ciri bagi ∑ koresponden terhadap pasangan (1/ λ .e) untuk ∑-1 . ∑ -1 juga positif.
  • 12.
    Kurva CI berbentukelipsoid, dimana c = permukaan ellips berpusat di µ 𝒙 − 𝝁 ′∑−𝟏 𝒙 − 𝝁 = 𝑐2 dan absis = ± c λi𝑒𝑖 dimana ∑ei = λiei , i = 1,2,..,p semua x yang memenuhi
  • 13.
    Diketahui 𝑥 ~𝑁2 𝑑𝑒𝑛𝑔𝑎𝑛 µ = 5 10 𝑎𝑛𝑑 ∑ = 1 0 0 1 → 𝜌 = 0.67 Gambarkanprobabilitaskontur untuk 99%, 95%, 90%, 75%, 50%, dan 20% !
  • 14.
    𝜇 = 5 10 ; Σ= 9 16 16 64 ; 𝜌 = 0,667 Buatlah kontur dengan tingkat kepercayaan 95%! (Pembahasan terlampir)
  • 16.
    Dalam kasus univariate(p=1), kita tahu bahwa sebaran dari x adalah normal dengan rata-rata 𝜇 dan varian 𝜎2 /n. Hal ini juga berlaku untuk kasus multivariate (p ≥2) dimana vektor rata-rata X berdistribusi normal dengan rataan 𝝁 dan matriks kovarian (1/n)∑ . Varians dari sampling (n-1) 𝑠2 = ∑ 𝑗=1 𝑛 (𝑥𝑖 − 𝑥)2 mengikuti distribusi chi square dengan derajat besas n-1, dimana (n-1) 𝑠2 merupakan penjumlahan dari : 𝝈 𝟐 𝒁𝒊 𝟐 + ⋯ + 𝒁 𝒏−𝟏 𝟐 = (𝝈𝒁𝒊) 𝟐 + ⋯ + (𝝈𝒁 𝒏−𝒊) 𝟐 𝜎𝑍𝑖, mengikuti distribusi N(0, 𝜎2 ). Ini merupakan bentuk umum distribusi sampling dari unsur-unsur matriks kovarian. Distribusi ini disebut dengan distribusi Wishart.
  • 17.
    Ambil x1, x2,..., xn sebagai contoh acak yang berukuran n dari sebuah populasi normal ganda p dengan rata-rata 𝜇 dan matriks kovarian ∑ , kemudian : 1. X mengikuti ditribusi Np (𝜇, (1/n) ∑ ) 2. (n-1)S adalah menyebar Wishart dengan db = n – 1 3. X dan S adalah bebas. Karena ∑ tidak diketahui, sebaran 𝑋 tidak dapat digunakan langsung untuk mendapatkan 𝜇 . Sebagaimana S memberikan informasi bebas tentang ∑ dan distribusi s tidak tergantung pada 𝜇.
  • 18.
    Hal-hal yang perludiperhatikan dari distribusi Wishart: 1. Jika 𝐴1 menyebar W 𝑚1 (𝐴1| ∑ ) bebas dari 𝐴2, yang menyebar Wm2 (A2 ), maka A1 + A2 menyebar Wm1+m2 (A1 + A2| ∑) 2. Jika A menyebar Wm (A|∑ ), maka CAC‟ menyebar Wm (CAC’|C∑C‟). Distribusi ini tidak ada jika ukuran contoh n tidak lebih besar dari jumlah peubah (p). Jika ada maka sebaran Wishartnya adalah 𝑊 𝑚 (𝐴|∑ ) = 𝐴 (𝑛−𝑝−2)/2 𝑒−𝑡𝑟𝐴∑−1/2 ∑ 𝑝(𝑛−1)/2∏ 𝑝(𝑝−1)/4 |∑|(𝑛−1)/2 ∏𝑖=1 𝑝 ┌[ 1 2 𝑛 − 1 ] Dimana matriks A definit ositif dan ┌ (.) adalah fungsi Gamma.
  • 19.
    Beberapa tahapan yangharus dilakukan dalam menyusun Plot Kuartil 2 adalah sebagai berikut: 1. Hitung: 𝑑𝑖𝑖 2 = 𝑥(𝑖) − 𝜇 ′ ∑−1 𝑥(𝑖) − 𝜇 2. Beri peringkat nilai 𝑑𝑖𝑖 2 3. Carilah nilai chi-Square dari nilai (i –1/2)/n dengan derajat bebas p. 𝑋 𝑝 2 𝑖 − 1 2 𝑛
  • 20.
    4. Buat plot 𝑋𝑝 2 𝑖− 1 2 𝑛 dengan 𝑑𝑖𝑖 2 bila pola hubungannya mengikuti garis lurus maka data tersebut dapat dikatakan menyebar normal ganda. Namun demikian untuk lebih menyakinkan dapat dilakukan dengan menghitung nilai korelasi person 𝑋 𝑝 2 𝑖− 1 2 𝑛 dengan 𝑑𝑖𝑖 2 . Apabila nilai korelasi ini nyata maka data tersebut mengikuti sebaran normal ganda.
  • 21.
    Diketahui data suatupengamatan sebagai berikut. No. X1 X2 X3 1 98 81 38 2 103 84 38 3 103 86 42 4 103 86 42 5 109 88 44 6 123 92 50 7 123 95 46 8 133 99 51 9 133 102 51 10 133 102 51 11 134 100 48 12 136 102 49 No. X1 X2 X3 13 138 98 51 14 138 99 51 15 141 105 53 16 147 108 57 17 149 107 55 18 153 107 56 19 155 115 63 20 155 117 60 21 158 115 62 22 159 118 63 23 162 124 61 24 177 132 67
  • 22.
    Dengan menggunakan QQ-Plot,tunjukkan apakah data tersebut berdistribusi normal ganda? (Pembahasan terlampir)
  • 23.
    Langkah-langkah deteksi outlier: 1.Membuat dot plot di setiap variabel 2. Membuat scatter plot berpasangan setiap variabel 3. Menghitung nilai standarisasi 𝑧𝑗𝑘 = (𝑥𝑗𝑘 − 𝑥 𝑘) / 𝑠 𝑘𝑘 untuk j= 1,2…,n dan k = 1,2,…,p; jika nilai 𝑧𝑗𝑘 berada dalam selang -3 < 𝑧𝑗𝑘 < 3 maka data jk bukan oulier, sebaliknya jika nilai 𝑧𝑗𝑘 lebih kecil dari -3 dan lebih besar dari 3 maka data ke-jk merupakan oulier. 4. Menghitung jarak kuadrat 𝑑𝑗 2 = 𝑥𝑗 − 𝑥 ′ 𝑠−1 𝑥𝑗 − 𝑥 , jika nilai 𝑑𝑗 2 melebihi 𝑋(𝑘) 2 maka data ke-jk merupakan outlier.
  • 24.
    Diketahui data RamusBone sebagai berikut. No. X1 X2 X3 X4 1 47.8 48.8 49 49.7 2 46.4 47.3 47.7 48.4 3 46.3 46.8 47.8 48.5 4 45.1 45.3 46.1 47.2 5 47.6 48.5 48.9 49.3 6 52.5 53.2 53.3 53.7 7 51.2 53 54.3 54.5 8 49.8 50 50.3 52.7 9 48.1 50.8 52.3 54.4 10 45 47 47.3 48.3 11 51.2 51.4 51.6 51.9 12 48.5 49.2 53 55.5 No. X1 X2 X3 X4 13 52.1 52.8 53.7 55 14 48.2 48.9 49.3 49.8 15 49.6 50.4 51.2 51.8 16 50.7 51.7 52.7 53.3 17 47.2 47.7 48.4 49.5 18 53.3 54.6 55.1 55.3 19 46.2 47.5 48.1 48.4 20 46.3 47.6 51.3 51.8 Deteksi outlier pada data diatas !
  • 25.
    Let X be𝑁3(𝜇,∑)with 1. Which of the following random variables are independent? a. X1 and X2 b. X2 and X3 c. (X1, X2) and X3 2. Find the mean vector and covariance matrix for 3X1 - 2X2 + X3! (Pembahasan terlampir)