MULTIVARIATE NORMAL DISTRIBUTION

Oleh : Kelompok III
Multivariate
Normal
Distribution
1
Dosen Pengampu : Rani Nooraeni, S.ST., M.Stat..

Fungsi Normal Distribusi dan Fungsinya
Banyak variabel acak yang berdistribusi normal
Keuntungan Menggunakan Distribusi Normal
Semakin besar sampel akan semakin mendekati
distribusi normal ( berdasarkan CLT)
Menghasilkan perhitungan yang akurat/bagus
Banyak distribusi seperti poisson dan binomial bisa
diperkirakan dengan distribusi normal (CLT)
Univariate distribution
𝑓 𝑥 =
1
2𝜋𝜎2
𝑒
− (𝑥−𝜇 /𝜎)]2
2 ; −∞ < 𝑥 < ∞
Asumsi 𝑋~𝑁(𝜇, 𝜎2
)
Hanif Palupi 2

Example :
𝑎𝑠𝑢𝑚𝑠𝑖 𝑥1, 𝑥2~ 𝑁(𝜇, Σ) dan 𝑥1, 𝑥2 iid
Normal Bivariate
Distribution
s11 = s22, r12 = 0
| Σ |lebih besar
s11 = s22, r12 = 0.75
| Σ |lebih kecil
𝒇 𝒙 𝟏, 𝒙 𝟐 =
𝟏
|𝜮−𝟏|(𝟐𝝅) 𝒑/𝟐 𝐞𝐱𝐩[−
𝟏
𝟐
(𝒙 − 𝝁)𝜮−𝟏
(𝒙 − 𝝁)]
Hanif Palupi 3

Normal
Multivariate
Distribution
𝑎𝑠𝑢𝑚𝑠𝑖 𝑥1, … , 𝑥 𝑝~ 𝑁 𝑃(𝜇, Σ) dan 𝑥1, … , 𝑥 𝑝 𝑖𝑖𝑑
Bentuk grafik : Volume
Contour (𝑐2) adalah permukaan dimana kuadrat jarak (𝑥 − 𝜇 )Σ−1 (𝑥 − 𝜇 ) konstan
atau seluruh nilai variabel yang peluangnya konstan dan berbentuk elips.
𝑐2
= (𝑥 − 𝜇 )Σ−1
(𝑥 − 𝜇 )
Ellips berpusat di 𝜇 dan memiliki sumbu ±𝑐 𝜆𝑖 𝑒𝑖dimana Σ𝑒𝑖 = 𝜆𝑖 𝑒𝑖dimana i : 1,2,...,p
Selang kepercayaan distribusi normal multivariate
CI: 𝑋 ± 𝑐 𝜆𝑒
𝑓 𝑥1, … , 𝑥 𝑝 =
1
|Σ−1|(2𝜋) 𝑝/2 exp[−
1
2
(𝑥 − 𝜇 )Σ−1 (𝑥 − 𝜇 )]
Hanif Palupi
4

Result 4.1
Jika Σ definit positif maka Σ−1 ada, sehingga
Σ𝑒 = 𝜆𝑒menjadikan Σ−1 𝑒 =
1
𝜆
𝑒
Jadi 𝜆, 𝑒 adalah pasangan eigenvalue-eigenvector untuk
Σ yang bercoresponden dengan (
1
𝜆
, 𝑒) untuk Σ−1 .
Sehingga Σ−1 definit positif
Jika Matriks A simetris, maka nilai eigen riil dan memiliki
eigen vektor yang saling bebas (ortogonal)
Hanif Palupi
Pembuktian, buka link berikut ini !
http://bit.ly/PembuktianResult4
5

Hubungan peluang dengan kuadrat
P[(𝑥 − 𝜇)𝛴−1(𝑥 − 𝜇) ≤ 𝜒2
𝑝(𝛼)] = 1 − 𝛼
Contour 50% dan 90% untuk distribusi normal bivariate
Hanif Palupi 6

Sifat-Sifat Distribusi Normal
Kombinasi linear dari komponen X yang
berdistribusi normal. Syarat :
Distribusi dari komponen bersyarat berdistribusi
normal
Apabila kovarian sama dengan nol maka setiap
komponen didistribusikan secara independen.
Semua subset dari komponen X multivariat
berdistribusi normal
Mursalina Bia 7

Distribusi Kombinasi Linear dari Komponen Normal
Jika X berdistribusi 𝑁𝑝(𝜇, ), kemudian setiap variabel kombinasi linear
𝑎′
𝑿 = 𝑎1 𝑋1 + 𝑎2 𝑋2 + ⋯ + 𝑎 𝑝 𝑋 𝑝 berdistribusi N(𝑎′𝜇, 𝑎′ 𝑎) dan 𝑎′
𝑿 berdistribusi
N(𝑎′𝜇, 𝑎′ 𝑎) untuk setiap 𝑎, maka X berdistibusi 𝑁𝑝(𝜇, )
Jika 𝑿 = [ 𝑿 𝟏, 𝑿 𝟐, … , 𝑿 𝑷]′ berdistribusi 𝑁𝑝(𝜇, )
𝑎′
𝑿 = 1 0 ⋯ 0
𝑿 𝟏
𝑿 𝟐
⋮
𝑿 𝑷
= 𝑋1
𝑎′
𝜇 = 1 0 ⋯ 0
𝜇1
𝜇2
⋮
𝜇 𝑃
= 𝜇1
𝑎′
𝑎 = 1 0 ⋯ 0
𝜎11 ⋯ 𝜎1𝑃
⋮ ⋱ ⋮
𝜎 𝑃1 ⋯ 𝜎 𝑃𝑃
1
0
⋮
0
= 𝜎11
• Jika X berdistribusi 𝑁𝑝(𝜇, ), dengan q
kombinasi linear
𝐀𝐗 =
𝑎11 𝑋1 + ⋯ + 𝑎1𝑝 𝑋 𝑝
𝑎21 𝑋1 + ⋯ + 𝑎2𝑝 𝑋 𝑝
⋮
𝑎 𝑞1 𝑋1 + ⋯ + 𝑎 𝑞𝑝 𝑋 𝑝
: 𝑁𝑞(𝐀𝜇, 𝐀𝚺𝐀′)
d = vektor konstan
Pembuktian :
http://bit.ly/KombinasiLinear
Mursalina Bia
8

Distribusi Chi-Square
Distribusi chi square menentukkan keragaman dari sampel
varians 𝑠2
= 𝑠11 untuk sampel univariate normal population.
Jika X berdistribusi 𝑁 𝑃(𝜇, ) dengan > 0 maka
(𝑋 − 𝜇)′𝛴−1
(𝑋 − 𝜇)~𝜒 𝑝
2
dimana 𝜒 𝑝
2
merupakan distribusi chi
square dengan derajat bebas p
𝑁 𝑃(𝜇, ) distribusi dengan peluang 1 − 𝛼 untuk setiap
{𝑥 𝑥 − 𝜇
′
𝛴−1
𝑥 − 𝜇 ≤ 𝜒 𝑝
2
𝛼 } merupakan nilai atas
100𝛼 persentil dari distribusi 𝜒 𝑝
2
Mursalina Bia 9

Kombinasi Linear Vektor Random
𝑋1, 𝑋2, … , 𝑋 𝑛 𝑚𝑒𝑟𝑢𝑝𝑎𝑘𝑎𝑛 𝑚𝑢𝑡𝑢𝑎𝑙𝑙𝑦 𝑖𝑛𝑑𝑒𝑝𝑒𝑛𝑑𝑒𝑛𝑡 𝑡
𝑋𝑗 : 𝑁 𝑝(𝜇 𝑗, )
𝑉1 = 𝑐1 𝑋1 + 𝑐2 𝑋2 + ⋯ +
𝑐 𝑛 𝑋 𝑛 𝑏𝑒𝑟𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑠𝑖 𝑁 𝑝( 𝑗=1
𝑛
𝑐𝑗 𝜇 𝑗, ( 𝑗=1
𝑛
𝑐𝑗
2
) )
𝑉2 = 𝑏1 𝑋1 + 𝑏2 𝑋2 + ⋯ + 𝑏 𝑛 𝑋 𝑛 dan 𝑉1 merupakan joint
berdistrubusi normal dengan matrix kovariance
(
𝑗=1
𝑛
𝑐𝑗
2
) (𝑏′ 𝑐)
(𝑏′
𝑐) (
𝑗=1
𝑛
𝑏𝑗
2
)
Mursalina Bia
10

SAMPLING DARI DISTRIBUSI NORMAL MULTIVARIATE
Sufficient Statistics (STATISTIK CUKUP)
Dari persamaan
𝑳 𝝁, 𝜮 =
1
(2π) 𝑛𝑝/2 𝚺 𝑛/2
𝑒
−𝑡𝑟 𝜮−𝟏
𝑗=1
𝑛
𝑥 𝑗− 𝑥 𝑥 𝑗− 𝑥
′
+𝑛 𝑥−𝜇 𝑥−𝜇 ′ /2
joint density dari sekumpulan observasi 𝒙 𝟏, 𝒙 𝟐, . . , 𝒙 𝒏 bergantung hanya melalui mean
sampel 𝒙 dan matriks sum-of-squares-and-cross-product 𝒋=𝟏
𝒏
𝒙𝒋 − 𝒙 𝒙𝒋 − 𝒙
′
=
𝑛 − 1 𝑺
Sehingga dapat dikatakan bahwa 𝒙 dan 𝑛 − 1 𝑺 (atau 𝑺) adalah statistik yang sufficient
(cukup)
Untuk 𝑿 𝟏, 𝑿 𝟐, . . , 𝑿 𝒏 yang merupakan peubah acak dari populasi normal multivariate dengan
mean 𝝁 dan kovarians 𝚺 , maka 𝑿 dan 𝑺 adalah statistik yang sufficient (cukup) dari distribusi
normal multivariate.
Rizka Amalia Farentina 11

Distribusi Sampling untuk 𝑋 dan S
Kasus univariat : 1
𝑛 − 1 𝑠2
= 𝑗=1
𝑛
(𝑋𝑗 − 𝑋) ∶ 𝜎2
χ(𝑛−1)
2
𝑛 − 1 𝑠2
= 𝜎2
𝑗=1
𝑛
𝑍𝑗
2
, 𝜎𝑍𝑗: 𝑁(0, 𝜎2
)
Kasus multivariat :
𝑍𝑗 = 𝑋𝑗 − 𝑋 ∶ 𝑁 0, Σ
𝑛 − 1 𝑠 = 𝑗=1
𝑛
𝑍𝑗 𝑍𝑗
′
: 𝑤𝑖𝑠ℎ𝑎𝑟𝑡 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑡𝑖𝑜𝑛 𝑤 𝑛−1( 𝑛 − 1 𝑆|Σ)
𝑋1, 𝑋2, … , 𝑋 𝑛 adalah random sampel 𝑁𝑝(𝜇, Σ)
Distribusi Sampling untuk S
Kasus univariat : p=1
𝑋: 𝑁 𝜇,
𝜎2
𝑛
Kasus multivariat :
𝑋: 𝑁𝑝 𝜇,
Σ
𝑛
𝑋1, 𝑋2, … , 𝑋 𝑛 adalah random sampel 𝑁𝑝(𝜇, Σ)
Distribusi sampling untuk 𝑿
Akfarianti Nawangsih 12

KARAKTERISTIK SAMPEL BESAR DARI 𝑿 DAN 𝑺
𝑿 : ditentukan oleh large number independen yang menyebabkan
𝑽 𝟏, 𝑽 𝟐, … , 𝑽 𝒏
𝑽𝒊 : variabel acak yang mempunyai variabilitas yang hampir sama
𝑿 = 𝑽 𝟏+𝑽 𝟐+…+𝑽 𝒏
𝑿 mempunyai distribusi mendekati normal
𝑿 berdistribusi mendekati normal untuk sampel besar
Law of Large Number
𝒀 𝟏, 𝒀 𝟐, … , 𝒀 𝒏 : observasi independen dari sebuah populasi (mungkin tidak normal) dengan 𝐸 𝑌𝑖 = 𝜇
Untuk semua 𝜀 > 0,
𝑃 −𝜀 < 𝑌 − 𝜇 < 𝜀  1 ketika n∞
𝑌 =
𝑌1+𝑌2+..+𝑌𝑛
𝑛
berpeluang untuk konvergen menuju 𝜇
Rizka Amalia Farentina
Pembuktian : http://bit.ly/LawLargeNumber
14

Central Limit Theorem ( Ukuran Limit Pusat )
𝑿 𝟏, 𝑿 𝟐, … , 𝑿 𝒏 : observasi independen dari sebuah populasi dengan
mean 𝝁 dan finite (nonsingular) kovarians 𝜮
𝑛 𝑿 − 𝜇 mempunyai distribusi yang mendekati 𝑵 𝒑 𝟎, 𝜮 untuk
sampel besar
𝑿 berdistribusi 𝑵 𝒑 𝝁,
𝟏
𝒏
𝜮 untuk n-p besar
𝑛 𝑿 − 𝜇
′
𝜮−𝟏 𝑿 − 𝜇 mendekati distribusi 𝜒 𝑝
2 untuk n-p besar
𝑺 mendekati 𝜮 dengan peluang yang besar saat n besar
sehingga
𝑛 𝑿 − 𝜇
′
𝑺−𝟏 𝑿 − 𝜇 mendekati distribusi 𝜒 𝑝
2 untuk n-p besar
Pembuktian : http://bit.ly/ProofCLT
Rizka Amalia Farentina 15

Asumsi Normalitas
Kombinasi linear dari variabel normal
adalah normal dan kontur dari normal
multivariat adalah ellipsoid.
Untuk melihat kenormalan data, salah
satu cara yaitu Plot khusus yang disebut
plot Q-Q. Ketika poin terletak hampir
sepanjang garis lurus, asumsi normalitas
tetap dapat dipertahankan.
Q-Q Plot(untuk univariate)
x1 ≤ x2 ≤ … ≤ xn : observasi
Misalkan xj memiliki nilai yang berbeda-beda
dan n cukup besar, maka:
Proporsi nilai x ≤ xj ∶
𝑗
𝑛
→ ( j −
1
2
)/n
Fajari Ramadhan
Normalitas univariate
P Z ≤ q j = −∞
𝑞 𝑗 1
2⫪
𝑒− 𝑧2 2
dz = p(j) =
(𝑗−1/2)
𝑛
Dimana,
p(j) : probabilitas mendapatkan nilai kurang dari atau sama dengan qi dalam satu kurva normal standar.
q(j) : standard normal quantil
Plot (qj,xj) untuk meneliti kelinearnnya, dan jika xj ≈ δqj + µ maka data dapat diasumsikan normal. {example 4.9
hal 179}.
16

Langkah-langkah Q-Q plot :
First
Second
Third
Urutkan data x(1), x(2), …, x(n) dan nilai probabilitas yang sesuai (1 -
1
2
)/n, (2 -
1
2
)/n, ..., (n -
1
2
)/n;
Hitung standar kuantil normal q(1), q(2), … ,q(n); dan
Plot pasangan pengamatan (q(1), x(1)),(q(2), x(2)) ..., (q(n, x(n) ) dan periksa Kelinearan dari hasilnya.
Koefisien korelasi
rq=
𝑗=1
𝑛
(𝑥 𝑗 − 𝑥) (𝑞 𝑗 − 𝑞)
𝑗=1
𝑛 (𝑥 𝑗− 𝑥)2
𝑗=1
𝑛 (𝑞 𝑗− 𝑞)2
Bandingkan rq dengan table critical the Q-Q plot (table 4.2 hal 181:
http://bit.ly/tabel42). Data berdistribusi normal jika rq > rtabel
Fajari Ramadhan 17

Contoh:
sampel A sebanyak 10
observasi.
Misal P Z ≤ 0.385 = −∞
0.385 1
2⫪
𝑒− 𝑧2 2dz
= 0.65
 plot(q(j),x(j))→ linear(Normal)
 rq = 0.994369 , rq table = 0.9198
rq>rq table (gagal tolak H0, normal)
Ordered
obsevatio
n
Probability
levels
Standart
normal
quantiles
x(j) ( j -
1
2
)/n q(j)
-1.00 0.05 -1.645
-0.10 0.15 -1.036
0.16 0.25 -0.674
0.41 0.35 -0.385
0.62 0.45 -0.125
0.80 0.55 0.125
1.26 0.65 0.385
1.54 0.75 0.674
1.71 0.85 1.036
2.30 0.95 1.645
-1.5
-1
-0.5
0
0.5
1
1.5
2
2.5
-2 -1 0 1 2
x(j)
q(j)
Fajari Ramadhan
18

Normalitas Bivariate
Jika pengamatan dihasilkan dari distribusi normal,maka setiap distribusi
bivariat akan normal, dan konturnya adalah elips.
𝑑2
= 𝑥 − µ
′
−1
𝑥 − µ ≤ 𝟀 𝟎,𝟓
𝟐
Dengan demikian, kita harus mengharapkan kira-kira persentase yang
sama, 50% dari pengamatan sampel terletak pada elips.
{untuk semua x, (x- 𝑥)’𝑆−1(x- 𝑥) ≤ 𝟀2(0,5)
2
}
(example 4.12 hal 183: http://bit.ly/mvnexample412)
Fajari Ramadhan 19

Perusahaan
X1=sales
(million$)
X2=profit
(million$)
General motor 126,974 4224
Ford 96,933 3835
Exxon 86,656 3510
IBM 63,438 3758
General electric 55,264 3939
Mobil 50,976 1809
Philip morris 39,069 2946
Chrysler 36,156 359
Du pont 35,209 2480
Texaco 32,416 2413
𝑥 =
62,309
2927
𝑆 =
10005,2 255,76
255,76 14,3
𝑆−1
=
0,000184 −0,003293
−0,003293 0,128831
𝑋 10−5
Lakukan langkah berikut untuk setiap observasi:
obs pertama: 𝑑2
=(x− 𝑥)’𝑆−1
(x− 𝑥) = 4,34 > 𝟀2(0,5)
2
= 1,39 (dst…obs n)
Hasilnya 7 dari 10 observasi memiliki 𝑑2
< 1.39 (lebih dari 50%)
maka data tidak normal multivariate.
Fajari Ramadhan 20

Chi Square Plot (multivariate)
Urutkan kuadrat jarak dari yang terkecil-terbesar(𝑑1
2
, 𝑑2
2
dst)
qc,p
𝑗−
1
2
𝑛
:
100(𝑗−
1
2
)
𝑛
merupakan nilai kuantil untuk chi square distribusi dengan df = p.
kemudian gambarkan {qc,p (
𝑗−
1
2
𝑛
), 𝑑𝑗
2
}
(example 4.13 hal 184 : http://bit.ly/example413)
j d2 qc,p
1 0,59 0,10
2 0,81 0,33
3 0,83 0,58
4 0,97 0,86
5 1,01 1,20
6 1,02 1,60
7 1,20 2,10
8 1,88 2,77
9 4,34 3,79
10 5,33 5,99
0
1
2
3
4
5
6
0 2 4 6 8
d2
qc,p
Fajari Ramadhan
21

Mendeteksi Outlier dan Membersihkan Data
Membuat dot plot untuk setiap variabel.
Membuat scatter plot untuk setiap variabel.
Menghitung nilai standar (z) dan memeriksanya untuk nilai
yang kecil dan besar.
Menghitung jarak (𝑥 𝑗− 𝑥)′
𝑆−1
(𝑥 𝑗− 𝑥). Periksa apakah jaraknya
wajar atau tidak. Pada plot chi-square, outliernya akan berada
pada titik terjauh dari origin.
A
B
C
D
Kebanyakan data mengandung observasi yang tidak berada pada polanya (pencilan). Pencilan pada data dapat bernilai jauh lebih tinggi
atau lebih rendah daripada yang lain.
Ketika outlier teridentifikasi, maka harus diperiksa
terlebhi dahulu seperti yang terdapa pada contoh
sebelumnya. Outlier dapat dihapus atau dikira-kira
dengan penimbang pada analisis selanjutnya,
tergantung pada sifat outlier dan tujuan penelitian.
Mendeteksi outlier
Akfarianti Nawangsih
22

Contoh
Soal
Tabel 4.4 mengandung datayang
berada di tabel 4.3 termasuk nilai
terstandardnya. Data ini terdiri dari
empat ukuran stiffness (kekakuan)
yang berbeda x1, x2, x3,dan x4 pada
masing-masing 30 papan (n=30).
table 4.4 Four measurements of stiffness with standardized values
x1 x2 x3 x4 observation no. z1 z2 z3 z4 d2
1889 1651 1651 1778 1 -0,1 -0,3 0,2 0,2 0,6
2403 2048 2078 2197 2 1,5 0,9 1,9 1,5 5,48
2119 1700 1815 2222 3 0,7 -0,2 1 1,5 7,62
1645 1627 1110 1533 4 -0,8 -0,4 -1,3 -0,6 5,21
1976 1916 1614 1883 5 0,2 0,5 0,3 0,5 1,4
1712 1712 1439 1546 6 -0,6 -0,1 -0,2 -0,6 2,22
1943 1685 1271 1671 7 0,1 -0,2 -0,8 -0,2 4,99
2104 1820 1717 1874 8 0,6 0,2 0,7 0,5 1,49
2983 2794 2412 2581 9 3,3 3,3 3 2,7 12,26
1745 1600 1384 1508 10 -0,5 -0,5 -0,4 -0,7 0,77
1710 1591 1518 1667 11 -0,6 -0,5 0 -0,2 1,93
2046 1907 1627 1898 12 0,4 0,5 0,4 0,5 0,46
1840 1841 1595 1741 13 -0,2 0,3 0,3 0 2,7
1867 1685 1493 1678 14 -0,1 -0,2 -0,1 -0,1 0,13
1859 1649 1389 1714 15 -0,1 -0,3 -0,4 0 1,08
1954 2149 1180 1281 16 0,1 1,3 -1,1 -1,4 16,75
1325 1170 1002 1176 17 -1,8 -1,8 -1,7 -1,7 3,5
1419 1371 1252 1308 18 -1,5 -1,2 -0,8 -1,3 3,99
1828 1634 1602 1755 19 -0,2 -0,4 0,3 0,1 1,36
1725 1594 1313 1646 20 -0,6 -0,5 -0,6 -0,2 1,46
2276 2189 1547 2111 21 1,1 1,4 0,1 1,2 9,9
1899 1614 1422 1477 22 0 -0,4 -0,3 -0,8 5,06
1633 1513 1290 1516 23 -0,8 -0,7 -0,7 -0,6 0,8
2061 1867 1646 2037 24 0,5 0,4 0,5 1 2,54
1856 1493 1356 1533 25 -0,2 -0,8 -0,5 -0,6 4,58
1727 1412 1238 1469 26 -0,6 -1,1 -0,9 -0,8 3,4
2168 1896 1701 1834 27 0,8 0,5 0,6 0,3 2,38
1655 1675 1414 1597 28 -0,8 -0,2 -0,3 -0,4 3
2326 2301 2065 2234 29 1,3 1,7 1,8 1,6 6,28
1490 1382 1214 1284 30 -1,3 -1,2 -1 -1,4 2,58
Akfarianti Nawangsih
23

Kuadrat jarak 𝑑𝑗
2
= (𝑥𝑗 − 𝑥)𝑆−1
(𝑥𝑗 − 𝑥).
Kolom terakhir pada tabel 4.4 menunjukkan bahwa sampel ke-16
adalah pencilan karena ꭓ4;0,05
2
= 14,86, tetapi semua pengukuran
individu berada dalam jangkauan univariat masing-masng. Sampel
ke-9 juga memiliki nilai 𝑑2yang tinggi.
Kedua sampel (9 dan 16) dengan kuadrat jarak yang menonjol dari
pola lain pada scatter plot. Begitu dua titik dihilangkan, pola yang
ada akan sesuai dengan yang diharapkan (garis lurus).

Transformasi Mendekati Kenormalan
Data
Dengan
Asumsi
kenormalan
tidak
terpenuhi
Transformasi
Mendekati
Kenormalan
HELPFUL TRANSFORMATION TO NEAR
NORMALITY
Skala asli Skala hasil transformasi
Perhitungan, y 𝑦
Proporsi, 𝑝 𝐿𝑜𝑔𝑖𝑡 𝑝 =
1
2
log
𝑝
1 − 𝑝
Korelasi, r Fisher’s 𝑧 𝑟 =
1
2
𝑙𝑜𝑔
1+𝑟
1−𝑟
M.Abd.Aziz A.
25

Teknik
Menentukan
Pemilihan
Transformasi
yang Tepat
A. Penentuan transformasi hanya berdasarkan bentuk data
Menggunakan power transformation
Misal x adalah observasi acak, power transformation λ
Contoh: perhatikan 𝑋λ dengan λ= -1. karena 𝑋−1
= 1/x , pemilihan λ
berkorespondensi secara timbal balik dengan transformasi.. Kita dapat
mencari himpunan transformasi dengan menerapkan rentang λ dari yang
negatif sampai yang positif
Contoh: …., 𝑥−1 , 𝑥0 =lnx, 𝑥1/4 , 𝑥1/2 , 𝑥2 , 𝑥3 ,….
Ketika histogramnya terlalu lebar, maka perlu disusutkan dan begitu juga
sebaliknya
Hasil transformasi diuji lagi kenormalannya dengan membuat Q-Q plot
M.Abd.Aziz A.
26

B. Penentuan transformasi berdasarkan informasi dari data dan faktor-faktor di luar
Box and Cox’s univariate transformation
𝑥 𝜆
=
𝑥 𝜆−1
𝜆
, 𝜆 ≠ 0
ln 𝑥 , 𝜆 = 0
Cari λ yang memaksimumkan fungsi dengan
𝑙 𝜆 = −
𝑛
2
𝑙𝑛
1
𝑛
𝑗=1
𝑛
𝑥𝑗
𝜆
− 𝑥 𝜆
2
+ (𝜆 − 1)
𝑗=1
𝑛
𝑙𝑛𝑥𝑗
dengan 𝑥 𝜆 =
1
𝑛 𝑗=1
𝑛
𝑥𝑗
(𝜆)
M.Abd.Aziz A.
27

λ l(λ) λ l(λ) λ l(λ)
-1 70.52 -0.1 103.35 0.8 101.33
-0.9 75.65 0 104.83 0.9 99.34
-0.8 80.46 0.1 105.84 1 97.10
-0.7 84.94 0.2 106.39 1.1 94.64
-0.6 89.06 0.3 106.51 1.2 91.96
-0.5 92.79 0.4 106.20 1.3 89.10
-0.4 96.10 0.5 105.50 1.4 85.07
-0.3 98.97 0.6 104.43 1.5 82.88
-0.2 101.3
9
0.7 103.03
Untuk lamda = -1
𝑗=1
42
𝑥𝑗
−1
− 𝑥 −1
2
= 20249,30 ;
𝑗=1
42
𝑙𝑛𝑥𝑗 = −100,13
Contoh
Misalkan kita tentukan power transformation (λ) dari -1,0 sampai 1,5
no.
oven
Radiasi (xj)
no.
oven
Radiasi
(xj)
no.
oven
Radiasi
(xj)
no.
oven
Radiasi
(xj)
no.
oven
Radiasi
(xj)
no.
oven
Radiasi
(xj)
1 0.15 8 0.05 15 0.1 22 0.05 29 0.08 36 0.2
2 0.09 9 0.08 16 0.1 23 0.03 30 0.18 37 0.2
3 0.18 10 0.1 17 0.02 24 0.05 31 0.1 38 0.3
4 0.1 11 0.07 18 0.1 25 0.15 32 0.2 39 0.3
5 0.05 12 0.02 19 0.01 26 0.1 33 0.11 40 0.4
6 0.12 13 0.01 20 0.4 27 0.15 34 0.3 41 0.3
7 0.08 14 0.1 21 0.1 28 0.09 35 0.02 42 0.05
Data radiasi (pintu tertutup)
Nilai l(λ)
maksimum
Sehingga
𝑙 −1 = −
42
2
𝑙𝑛
1
42
𝑗=1
42
𝑥𝑗
−1
− 𝑥 −1
2
+ (−1 − 1)
𝑗=1
42
𝑙𝑛𝑥𝑗
= −21 ln[1
42 20249,30 + −2 (−100,13)]
= 70,52
Dst terdapat pada tabel berikut
M.Abd.Aziz A. 28
28

Berikut disajikan xj dan 𝒙𝒋
(𝝀)
; j= 1,2,…,42
No.
Oven
Radiasi
(xj)
𝒙𝒋
(𝝀)
=
𝒙 𝒋
𝟎.𝟐𝟓
−𝟏
𝟎.𝟐𝟓
No.
Oven
Radiasi
(xj) 𝑥𝑗
(𝜆)
=
𝑥 𝑗
0.25
−1
0.25
1 0.15 -1.51 22 0.05 -2.11
2 0.09 -1.81 23 0.03 -2.34
3 0.18 -1.39 24 0.05 -2.11
4 0.1 -1.75 25 0.15 -1.51
5 0.05 -2.11 26 0.1 -1.75
6 0.12 -1.65 27 0.15 -1.51
7 0.08 -1.87 28 0.09 -1.81
8 0.05 -2.11 29 0.08 -1.87
9 0.08 -1.87 30 0.18 -1.39
10 0.1 -1.75 31 0.1 -1.75
11 0.07 -1.94 32 0.2 -1.33
12 0.02 -2.50 33 0.11 -1.70
13 0.01 -2.74 34 0.3 -1.04
14 0.1 -1.75 35 0.02 -2.50
15 0.1 -1.75 36 0.2 -1.33
16 0.1 -1.75 37 0.2 -1.33
17 0.02 -2.50 38 0.3 -1.04
18 0.1 -1.75 39 0.3 -1.04
19 0.01 -2.74 40 0.4 -0.82
20 0.4 -0.82 41 0.3 -1.04
21 0.1 -1.75 42 0.05 -2.11
Q-Q Plot
0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
0.45
0 10 20 30 40 50
sebelum transformasi
-3
-2.5
-2
-1.5
-1
-0.5
0
0 10 20 30 40 50
sesudah transformasi
M.Abd.Aziz A. 29

Transformasi Multivariate
λ1, λ2,… λ 𝑝: power transformations untuk p karakteristik
Pilih λ 𝑘 untuk memaksimalkan
𝑙 𝑘 𝜆 = −
𝑛
2
𝑙𝑛
1
𝑛
𝑗=1
𝑛
𝑥𝑗𝑘
(𝜆 𝑘)
− 𝑥 𝑘
(𝜆 𝑘)
2
+ (𝜆 𝑘 − 1)
𝑗=1
𝑛
𝑙𝑛𝑥𝑗𝑘
Dengan 𝑥 𝑘
(𝜆 𝑘)
=
1
𝑛 𝑗=1
𝑛
𝑥𝑗𝑘
(𝜆 𝑘)
𝑋𝑗
( 𝜆)
=
𝑥𝑗1
( 𝜆1)
− 1
𝜆1
;
𝑥𝑗2
( 𝜆2)
− 1
𝜆2
; … ;
𝑥𝑗𝑝
( 𝜆 𝑝)
− 1
𝜆 𝑝
Lihat example 4.17 http://bit.ly/MultivarTransform
M.Abd.Aziz A.
30

MULTIVARIATE NORMAL DISTRIBUTION

Recommended

Recommended

More Related Content

What's hot

What's hot (20)

Similar to MULTIVARIATE NORMAL DISTRIBUTION

Similar to MULTIVARIATE NORMAL DISTRIBUTION (20)

More from Rani Nooraeni

More from Rani Nooraeni (12)

MULTIVARIATE NORMAL DISTRIBUTION