SlideShare a Scribd company logo
1 of 31
Oleh : Kelompok III
Multivariate
Normal
Distribution
1
Dosen Pengampu : Rani Nooraeni, S.ST., M.Stat..
Fungsi Normal Distribusi dan Fungsinya
Banyak variabel acak yang berdistribusi normal
Keuntungan Menggunakan Distribusi Normal
Semakin besar sampel akan semakin mendekati
distribusi normal ( berdasarkan CLT)
Menghasilkan perhitungan yang akurat/bagus
Banyak distribusi seperti poisson dan binomial bisa
diperkirakan dengan distribusi normal (CLT)
Univariate distribution
๐‘“ ๐‘ฅ =
1
2๐œ‹๐œŽ2
๐‘’
โˆ’ (๐‘ฅโˆ’๐œ‡ /๐œŽ)]2
2 ; โˆ’โˆž < ๐‘ฅ < โˆž
Asumsi ๐‘‹~๐‘(๐œ‡, ๐œŽ2
)
Hanif Palupi 2
Example :
๐‘Ž๐‘ ๐‘ข๐‘š๐‘ ๐‘– ๐‘ฅ1, ๐‘ฅ2~ ๐‘(๐œ‡, ฮฃ) dan ๐‘ฅ1, ๐‘ฅ2 iid
Normal Bivariate
Distribution
s11 = s22, r12 = 0
| ฮฃ |lebih besar
s11 = s22, r12 = 0.75
| ฮฃ |lebih kecil
๐’‡ ๐’™ ๐Ÿ, ๐’™ ๐Ÿ =
๐Ÿ
|๐œฎโˆ’๐Ÿ|(๐Ÿ๐…) ๐’‘/๐Ÿ ๐ž๐ฑ๐ฉ[โˆ’
๐Ÿ
๐Ÿ
(๐’™ โˆ’ ๐)๐œฎโˆ’๐Ÿ
(๐’™ โˆ’ ๐)]
Hanif Palupi 3
Normal
Multivariate
Distribution
๐‘Ž๐‘ ๐‘ข๐‘š๐‘ ๐‘– ๐‘ฅ1, โ€ฆ , ๐‘ฅ ๐‘~ ๐‘ ๐‘ƒ(๐œ‡, ฮฃ) dan ๐‘ฅ1, โ€ฆ , ๐‘ฅ ๐‘ ๐‘–๐‘–๐‘‘
Bentuk grafik : Volume
Contour (๐‘2) adalah permukaan dimana kuadrat jarak (๐‘ฅ โˆ’ ๐œ‡ )ฮฃโˆ’1 (๐‘ฅ โˆ’ ๐œ‡ ) konstan
atau seluruh nilai variabel yang peluangnya konstan dan berbentuk elips.
๐‘2
= (๐‘ฅ โˆ’ ๐œ‡ )ฮฃโˆ’1
(๐‘ฅ โˆ’ ๐œ‡ )
Ellips berpusat di ๐œ‡ dan memiliki sumbu ยฑ๐‘ ๐œ†๐‘– ๐‘’๐‘–dimana ฮฃ๐‘’๐‘– = ๐œ†๐‘– ๐‘’๐‘–dimana i : 1,2,...,p
Selang kepercayaan distribusi normal multivariate
CI: ๐‘‹ ยฑ ๐‘ ๐œ†๐‘’
๐‘“ ๐‘ฅ1, โ€ฆ , ๐‘ฅ ๐‘ =
1
|ฮฃโˆ’1|(2๐œ‹) ๐‘/2 exp[โˆ’
1
2
(๐‘ฅ โˆ’ ๐œ‡ )ฮฃโˆ’1 (๐‘ฅ โˆ’ ๐œ‡ )]
Hanif Palupi
4
Result 4.1
Jika ฮฃ definit positif maka ฮฃโˆ’1 ada, sehingga
ฮฃ๐‘’ = ๐œ†๐‘’menjadikan ฮฃโˆ’1 ๐‘’ =
1
๐œ†
๐‘’
Jadi ๐œ†, ๐‘’ adalah pasangan eigenvalue-eigenvector untuk
ฮฃ yang bercoresponden dengan (
1
๐œ†
, ๐‘’) untuk ฮฃโˆ’1 .
Sehingga ฮฃโˆ’1 definit positif
Jika Matriks A simetris, maka nilai eigen riil dan memiliki
eigen vektor yang saling bebas (ortogonal)
Hanif Palupi
Pembuktian, buka link berikut ini !
http://bit.ly/PembuktianResult4
5
Hubungan peluang dengan kuadrat
P[(๐‘ฅ โˆ’ ๐œ‡)๐›ดโˆ’1(๐‘ฅ โˆ’ ๐œ‡) โ‰ค ๐œ’2
๐‘(๐›ผ)] = 1 โˆ’ ๐›ผ
Contour 50% dan 90% untuk distribusi normal bivariate
Hanif Palupi 6
Sifat-Sifat Distribusi Normal
Kombinasi linear dari komponen X yang
berdistribusi normal. Syarat :
Distribusi dari komponen bersyarat berdistribusi
normal
Apabila kovarian sama dengan nol maka setiap
komponen didistribusikan secara independen.
Semua subset dari komponen X multivariat
berdistribusi normal
Mursalina Bia 7
Distribusi Kombinasi Linear dari Komponen Normal
Jika X berdistribusi ๐‘๐‘(๐œ‡, ), kemudian setiap variabel kombinasi linear
๐‘Žโ€ฒ
๐‘ฟ = ๐‘Ž1 ๐‘‹1 + ๐‘Ž2 ๐‘‹2 + โ‹ฏ + ๐‘Ž ๐‘ ๐‘‹ ๐‘ berdistribusi N(๐‘Žโ€ฒ๐œ‡, ๐‘Žโ€ฒ ๐‘Ž) dan ๐‘Žโ€ฒ
๐‘ฟ berdistribusi
N(๐‘Žโ€ฒ๐œ‡, ๐‘Žโ€ฒ ๐‘Ž) untuk setiap ๐‘Ž, maka X berdistibusi ๐‘๐‘(๐œ‡, )
Jika ๐‘ฟ = [ ๐‘ฟ ๐Ÿ, ๐‘ฟ ๐Ÿ, โ€ฆ , ๐‘ฟ ๐‘ท]โ€ฒ berdistribusi ๐‘๐‘(๐œ‡, )
๐‘Žโ€ฒ
๐‘ฟ = 1 0 โ‹ฏ 0
๐‘ฟ ๐Ÿ
๐‘ฟ ๐Ÿ
โ‹ฎ
๐‘ฟ ๐‘ท
= ๐‘‹1
๐‘Žโ€ฒ
๐œ‡ = 1 0 โ‹ฏ 0
๐œ‡1
๐œ‡2
โ‹ฎ
๐œ‡ ๐‘ƒ
= ๐œ‡1
๐‘Žโ€ฒ
๐‘Ž = 1 0 โ‹ฏ 0
๐œŽ11 โ‹ฏ ๐œŽ1๐‘ƒ
โ‹ฎ โ‹ฑ โ‹ฎ
๐œŽ ๐‘ƒ1 โ‹ฏ ๐œŽ ๐‘ƒ๐‘ƒ
1
0
โ‹ฎ
0
= ๐œŽ11
โ€ข Jika X berdistribusi ๐‘๐‘(๐œ‡, ), dengan q
kombinasi linear
๐€๐— =
๐‘Ž11 ๐‘‹1 + โ‹ฏ + ๐‘Ž1๐‘ ๐‘‹ ๐‘
๐‘Ž21 ๐‘‹1 + โ‹ฏ + ๐‘Ž2๐‘ ๐‘‹ ๐‘
โ‹ฎ
๐‘Ž ๐‘ž1 ๐‘‹1 + โ‹ฏ + ๐‘Ž ๐‘ž๐‘ ๐‘‹ ๐‘
: ๐‘๐‘ž(๐€๐œ‡, ๐€๐šบ๐€โ€ฒ)
d = vektor konstan
Pembuktian :
http://bit.ly/KombinasiLinear
Mursalina Bia
8
Distribusi Chi-Square
Distribusi chi square menentukkan keragaman dari sampel
varians ๐‘ 2
= ๐‘ 11 untuk sampel univariate normal population.
Jika X berdistribusi ๐‘ ๐‘ƒ(๐œ‡, ) dengan > 0 maka
(๐‘‹ โˆ’ ๐œ‡)โ€ฒ๐›ดโˆ’1
(๐‘‹ โˆ’ ๐œ‡)~๐œ’ ๐‘
2
dimana ๐œ’ ๐‘
2
merupakan distribusi chi
square dengan derajat bebas p
๐‘ ๐‘ƒ(๐œ‡, ) distribusi dengan peluang 1 โˆ’ ๐›ผ untuk setiap
{๐‘ฅ ๐‘ฅ โˆ’ ๐œ‡
โ€ฒ
๐›ดโˆ’1
๐‘ฅ โˆ’ ๐œ‡ โ‰ค ๐œ’ ๐‘
2
๐›ผ } merupakan nilai atas
100๐›ผ persentil dari distribusi ๐œ’ ๐‘
2
Mursalina Bia 9
Kombinasi Linear Vektor Random
๐‘‹1, ๐‘‹2, โ€ฆ , ๐‘‹ ๐‘› ๐‘š๐‘’๐‘Ÿ๐‘ข๐‘๐‘Ž๐‘˜๐‘Ž๐‘› ๐‘š๐‘ข๐‘ก๐‘ข๐‘Ž๐‘™๐‘™๐‘ฆ ๐‘–๐‘›๐‘‘๐‘’๐‘๐‘’๐‘›๐‘‘๐‘’๐‘›๐‘ก ๐‘ก
๐‘‹๐‘— : ๐‘ ๐‘(๐œ‡ ๐‘—, )
๐‘‰1 = ๐‘1 ๐‘‹1 + ๐‘2 ๐‘‹2 + โ‹ฏ +
๐‘ ๐‘› ๐‘‹ ๐‘› ๐‘๐‘’๐‘Ÿ๐‘‘๐‘–๐‘ ๐‘ก๐‘Ÿ๐‘–๐‘๐‘ข๐‘ ๐‘– ๐‘ ๐‘( ๐‘—=1
๐‘›
๐‘๐‘— ๐œ‡ ๐‘—, ( ๐‘—=1
๐‘›
๐‘๐‘—
2
) )
๐‘‰2 = ๐‘1 ๐‘‹1 + ๐‘2 ๐‘‹2 + โ‹ฏ + ๐‘ ๐‘› ๐‘‹ ๐‘› dan ๐‘‰1 merupakan joint
berdistrubusi normal dengan matrix kovariance
(
๐‘—=1
๐‘›
๐‘๐‘—
2
) (๐‘โ€ฒ ๐‘)
(๐‘โ€ฒ
๐‘) (
๐‘—=1
๐‘›
๐‘๐‘—
2
)
Mursalina Bia
10
SAMPLING DARI DISTRIBUSI NORMAL MULTIVARIATE
Sufficient Statistics (STATISTIK CUKUP)
Dari persamaan
๐‘ณ ๐, ๐œฎ =
1
(2ฯ€) ๐‘›๐‘/2 ๐šบ ๐‘›/2
๐‘’
โˆ’๐‘ก๐‘Ÿ ๐œฎโˆ’๐Ÿ
๐‘—=1
๐‘›
๐‘ฅ ๐‘—โˆ’ ๐‘ฅ ๐‘ฅ ๐‘—โˆ’ ๐‘ฅ
โ€ฒ
+๐‘› ๐‘ฅโˆ’๐œ‡ ๐‘ฅโˆ’๐œ‡ โ€ฒ /2
joint density dari sekumpulan observasi ๐’™ ๐Ÿ, ๐’™ ๐Ÿ, . . , ๐’™ ๐’ bergantung hanya melalui mean
sampel ๐’™ dan matriks sum-of-squares-and-cross-product ๐’‹=๐Ÿ
๐’
๐’™๐’‹ โˆ’ ๐’™ ๐’™๐’‹ โˆ’ ๐’™
โ€ฒ
=
๐‘› โˆ’ 1 ๐‘บ
Sehingga dapat dikatakan bahwa ๐’™ dan ๐‘› โˆ’ 1 ๐‘บ (atau ๐‘บ) adalah statistik yang sufficient
(cukup)
Untuk ๐‘ฟ ๐Ÿ, ๐‘ฟ ๐Ÿ, . . , ๐‘ฟ ๐’ yang merupakan peubah acak dari populasi normal multivariate dengan
mean ๐ dan kovarians ๐šบ , maka ๐‘ฟ dan ๐‘บ adalah statistik yang sufficient (cukup) dari distribusi
normal multivariate.
Rizka Amalia Farentina 11
Distribusi Sampling untuk ๐‘‹ dan S
Kasus univariat : 1
๐‘› โˆ’ 1 ๐‘ 2
= ๐‘—=1
๐‘›
(๐‘‹๐‘— โˆ’ ๐‘‹) โˆถ ๐œŽ2
ฯ‡(๐‘›โˆ’1)
2
๐‘› โˆ’ 1 ๐‘ 2
= ๐œŽ2
๐‘—=1
๐‘›
๐‘๐‘—
2
, ๐œŽ๐‘๐‘—: ๐‘(0, ๐œŽ2
)
Kasus multivariat :
๐‘๐‘— = ๐‘‹๐‘— โˆ’ ๐‘‹ โˆถ ๐‘ 0, ฮฃ
๐‘› โˆ’ 1 ๐‘  = ๐‘—=1
๐‘›
๐‘๐‘— ๐‘๐‘—
โ€ฒ
: ๐‘ค๐‘–๐‘ โ„Ž๐‘Ž๐‘Ÿ๐‘ก ๐‘‘๐‘–๐‘ ๐‘ก๐‘Ÿ๐‘–๐‘๐‘ข๐‘ก๐‘–๐‘œ๐‘› ๐‘ค ๐‘›โˆ’1( ๐‘› โˆ’ 1 ๐‘†|ฮฃ)
๐‘‹1, ๐‘‹2, โ€ฆ , ๐‘‹ ๐‘› adalah random sampel ๐‘๐‘(๐œ‡, ฮฃ)
Distribusi Sampling untuk S
Kasus univariat : p=1
๐‘‹: ๐‘ ๐œ‡,
๐œŽ2
๐‘›
Kasus multivariat :
๐‘‹: ๐‘๐‘ ๐œ‡,
ฮฃ
๐‘›
๐‘‹1, ๐‘‹2, โ€ฆ , ๐‘‹ ๐‘› adalah random sampel ๐‘๐‘(๐œ‡, ฮฃ)
Distribusi sampling untuk ๐‘ฟ
Akfarianti Nawangsih 12
Karakteristik Distribusi Wishart
Jika A berdistribusi W (A|โˆ‘), maka CACโ€™ berdistribusi Wm
(CACโ€™|Cโˆ‘Cโ€™)
Jika A1 berdistribusi Wm1 (A1|โˆ‘) independen dari A2 yang
berdistribusi Wm2 (A2|โˆ‘), lalu A1 dan A2 berdistribusi
Wm1+m2 (A1+ A2|โˆ‘) adalah derajat bebas yang
ditambahkan.
1 2
A = Definit Positiif
๐‘ค ๐‘›โˆ’1 ๐ด ฮฃ =
|๐ด|(๐‘›โˆ’๐‘โˆ’2)
๐‘’โˆ’๐‘ก๐‘Ÿ[๐ดฮฃโˆ’1]/2
2 ๐‘(๐‘›โˆ’1)/2 ๐œ‹ ๐‘(๐‘โˆ’1)/4|ฮฃ| ๐‘›โˆ’1/2
๐‘–=1
๐‘
ฮ“(
1
2
(๐‘› โˆ’ ๐‘–))
Akfarianti Nawangsih 13
KARAKTERISTIK SAMPEL BESAR DARI ๐‘ฟ DAN ๐‘บ
๐‘ฟ : ditentukan oleh large number independen yang menyebabkan
๐‘ฝ ๐Ÿ, ๐‘ฝ ๐Ÿ, โ€ฆ , ๐‘ฝ ๐’
๐‘ฝ๐’Š : variabel acak yang mempunyai variabilitas yang hampir sama
๐‘ฟ = ๐‘ฝ ๐Ÿ+๐‘ฝ ๐Ÿ+โ€ฆ+๐‘ฝ ๐’
๐‘ฟ mempunyai distribusi mendekati normal
๐‘ฟ berdistribusi mendekati normal untuk sampel besar
Law of Large Number
๐’€ ๐Ÿ, ๐’€ ๐Ÿ, โ€ฆ , ๐’€ ๐’ : observasi independen dari sebuah populasi (mungkin tidak normal) dengan ๐ธ ๐‘Œ๐‘– = ๐œ‡
Untuk semua ๐œ€ > 0,
๐‘ƒ โˆ’๐œ€ < ๐‘Œ โˆ’ ๐œ‡ < ๐œ€ ๏ƒ  1 ketika n๏ƒ โˆž
๐‘Œ =
๐‘Œ1+๐‘Œ2+..+๐‘Œ๐‘›
๐‘›
berpeluang untuk konvergen menuju ๐œ‡
Rizka Amalia Farentina
Pembuktian : http://bit.ly/LawLargeNumber
14
Central Limit Theorem ( Ukuran Limit Pusat )
๐‘ฟ ๐Ÿ, ๐‘ฟ ๐Ÿ, โ€ฆ , ๐‘ฟ ๐’ : observasi independen dari sebuah populasi dengan
mean ๐ dan finite (nonsingular) kovarians ๐œฎ
๐‘› ๐‘ฟ โˆ’ ๐œ‡ mempunyai distribusi yang mendekati ๐‘ต ๐’‘ ๐ŸŽ, ๐œฎ untuk
sampel besar
๐‘ฟ berdistribusi ๐‘ต ๐’‘ ๐,
๐Ÿ
๐’
๐œฎ untuk n-p besar
๐‘› ๐‘ฟ โˆ’ ๐œ‡
โ€ฒ
๐œฎโˆ’๐Ÿ ๐‘ฟ โˆ’ ๐œ‡ mendekati distribusi ๐œ’ ๐‘
2 untuk n-p besar
๐‘บ mendekati ๐œฎ dengan peluang yang besar saat n besar
sehingga
๐‘› ๐‘ฟ โˆ’ ๐œ‡
โ€ฒ
๐‘บโˆ’๐Ÿ ๐‘ฟ โˆ’ ๐œ‡ mendekati distribusi ๐œ’ ๐‘
2 untuk n-p besar
Pembuktian : http://bit.ly/ProofCLT
Rizka Amalia Farentina 15
Asumsi Normalitas
Kombinasi linear dari variabel normal
adalah normal dan kontur dari normal
multivariat adalah ellipsoid.
Untuk melihat kenormalan data, salah
satu cara yaitu Plot khusus yang disebut
plot Q-Q. Ketika poin terletak hampir
sepanjang garis lurus, asumsi normalitas
tetap dapat dipertahankan.
Q-Q Plot(untuk univariate)
x1 โ‰ค x2 โ‰ค โ€ฆ โ‰ค xn : observasi
Misalkan xj memiliki nilai yang berbeda-beda
dan n cukup besar, maka:
Proporsi nilai x โ‰ค xj โˆถ
๐‘—
๐‘›
โ†’ ( j โˆ’
1
2
)/n
Fajari Ramadhan
Normalitas univariate
P Z โ‰ค q j = โˆ’โˆž
๐‘ž ๐‘— 1
2โซช
๐‘’โˆ’ ๐‘ง2 2
dz = p(j) =
(๐‘—โˆ’1/2)
๐‘›
Dimana,
p(j) : probabilitas mendapatkan nilai kurang dari atau sama dengan qi dalam satu kurva normal standar.
q(j) : standard normal quantil
Plot (qj,xj) untuk meneliti kelinearnnya, dan jika xj โ‰ˆ ฮดqj + ยต maka data dapat diasumsikan normal. {example 4.9
hal 179}.
16
Langkah-langkah Q-Q plot :
First
Second
Third
Urutkan data x(1), x(2), โ€ฆ, x(n) dan nilai probabilitas yang sesuai (1 -
1
2
)/n, (2 -
1
2
)/n, ..., (n -
1
2
)/n;
Hitung standar kuantil normal q(1), q(2), โ€ฆ ,q(n); dan
Plot pasangan pengamatan (q(1), x(1)),(q(2), x(2)) ..., (q(n, x(n) ) dan periksa Kelinearan dari hasilnya.
Koefisien korelasi
rq=
๐‘—=1
๐‘›
(๐‘ฅ ๐‘— โˆ’ ๐‘ฅ) (๐‘ž ๐‘— โˆ’ ๐‘ž)
๐‘—=1
๐‘› (๐‘ฅ ๐‘—โˆ’ ๐‘ฅ)2
๐‘—=1
๐‘› (๐‘ž ๐‘—โˆ’ ๐‘ž)2
Bandingkan rq dengan table critical the Q-Q plot (table 4.2 hal 181:
http://bit.ly/tabel42). Data berdistribusi normal jika rq > rtabel
Fajari Ramadhan 17
Contoh:
sampel A sebanyak 10
observasi.
Misal P Z โ‰ค 0.385 = โˆ’โˆž
0.385 1
2โซช
๐‘’โˆ’ ๐‘ง2 2dz
= 0.65
๏ƒ˜ plot(q(j),x(j))โ†’ linear(Normal)
๏ƒ˜ rq = 0.994369 , rq table = 0.9198
rq>rq table (gagal tolak H0, normal)
Ordered
obsevatio
n
Probability
levels
Standart
normal
quantiles
x(j) ( j -
1
2
)/n q(j)
-1.00 0.05 -1.645
-0.10 0.15 -1.036
0.16 0.25 -0.674
0.41 0.35 -0.385
0.62 0.45 -0.125
0.80 0.55 0.125
1.26 0.65 0.385
1.54 0.75 0.674
1.71 0.85 1.036
2.30 0.95 1.645
-1.5
-1
-0.5
0
0.5
1
1.5
2
2.5
-2 -1 0 1 2
x(j)
q(j)
Fajari Ramadhan
18
Normalitas Bivariate
Jika pengamatan dihasilkan dari distribusi normal,maka setiap distribusi
bivariat akan normal, dan konturnya adalah elips.
๐‘‘2
= ๐‘ฅ โˆ’ ยต
โ€ฒ
โˆ’1
๐‘ฅ โˆ’ ยต โ‰ค ๐Ÿ€ ๐ŸŽ,๐Ÿ“
๐Ÿ
Dengan demikian, kita harus mengharapkan kira-kira persentase yang
sama, 50% dari pengamatan sampel terletak pada elips.
{untuk semua x, (x- ๐‘ฅ)โ€™๐‘†โˆ’1(x- ๐‘ฅ) โ‰ค ๐Ÿ€2(0,5)
2
}
(example 4.12 hal 183: http://bit.ly/mvnexample412)
Fajari Ramadhan 19
Perusahaan
X1=sales
(million$)
X2=profit
(million$)
General motor 126,974 4224
Ford 96,933 3835
Exxon 86,656 3510
IBM 63,438 3758
General electric 55,264 3939
Mobil 50,976 1809
Philip morris 39,069 2946
Chrysler 36,156 359
Du pont 35,209 2480
Texaco 32,416 2413
๐‘ฅ =
62,309
2927
๐‘† =
10005,2 255,76
255,76 14,3
๐‘†โˆ’1
=
0,000184 โˆ’0,003293
โˆ’0,003293 0,128831
๐‘‹ 10โˆ’5
Lakukan langkah berikut untuk setiap observasi:
obs pertama: ๐‘‘2
=(xโˆ’ ๐‘ฅ)โ€™๐‘†โˆ’1
(xโˆ’ ๐‘ฅ) = 4,34 > ๐Ÿ€2(0,5)
2
= 1,39 (dstโ€ฆobs n)
Hasilnya 7 dari 10 observasi memiliki ๐‘‘2
< 1.39 (lebih dari 50%)
maka data tidak normal multivariate.
Fajari Ramadhan 20
Chi Square Plot (multivariate)
Urutkan kuadrat jarak dari yang terkecil-terbesar(๐‘‘1
2
, ๐‘‘2
2
dst)
qc,p
๐‘—โˆ’
1
2
๐‘›
:
100(๐‘—โˆ’
1
2
)
๐‘›
merupakan nilai kuantil untuk chi square distribusi dengan df = p.
kemudian gambarkan {qc,p (
๐‘—โˆ’
1
2
๐‘›
), ๐‘‘๐‘—
2
}
(example 4.13 hal 184 : http://bit.ly/example413)
j d2 qc,p
1 0,59 0,10
2 0,81 0,33
3 0,83 0,58
4 0,97 0,86
5 1,01 1,20
6 1,02 1,60
7 1,20 2,10
8 1,88 2,77
9 4,34 3,79
10 5,33 5,99
0
1
2
3
4
5
6
0 2 4 6 8
d2
qc,p
Fajari Ramadhan
21
Mendeteksi Outlier dan Membersihkan Data
Membuat dot plot untuk setiap variabel.
Membuat scatter plot untuk setiap variabel.
Menghitung nilai standar (z) dan memeriksanya untuk nilai
yang kecil dan besar.
Menghitung jarak (๐‘ฅ ๐‘—โˆ’ ๐‘ฅ)โ€ฒ
๐‘†โˆ’1
(๐‘ฅ ๐‘—โˆ’ ๐‘ฅ). Periksa apakah jaraknya
wajar atau tidak. Pada plot chi-square, outliernya akan berada
pada titik terjauh dari origin.
A
B
C
D
Kebanyakan data mengandung observasi yang tidak berada pada polanya (pencilan). Pencilan pada data dapat bernilai jauh lebih tinggi
atau lebih rendah daripada yang lain.
Ketika outlier teridentifikasi, maka harus diperiksa
terlebhi dahulu seperti yang terdapa pada contoh
sebelumnya. Outlier dapat dihapus atau dikira-kira
dengan penimbang pada analisis selanjutnya,
tergantung pada sifat outlier dan tujuan penelitian.
Mendeteksi outlier
Akfarianti Nawangsih
22
Contoh
Soal
Tabel 4.4 mengandung datayang
berada di tabel 4.3 termasuk nilai
terstandardnya. Data ini terdiri dari
empat ukuran stiffness (kekakuan)
yang berbeda x1, x2, x3,dan x4 pada
masing-masing 30 papan (n=30).
table 4.4 Four measurements of stiffness with standardized values
x1 x2 x3 x4 observation no. z1 z2 z3 z4 d2
1889 1651 1651 1778 1 -0,1 -0,3 0,2 0,2 0,6
2403 2048 2078 2197 2 1,5 0,9 1,9 1,5 5,48
2119 1700 1815 2222 3 0,7 -0,2 1 1,5 7,62
1645 1627 1110 1533 4 -0,8 -0,4 -1,3 -0,6 5,21
1976 1916 1614 1883 5 0,2 0,5 0,3 0,5 1,4
1712 1712 1439 1546 6 -0,6 -0,1 -0,2 -0,6 2,22
1943 1685 1271 1671 7 0,1 -0,2 -0,8 -0,2 4,99
2104 1820 1717 1874 8 0,6 0,2 0,7 0,5 1,49
2983 2794 2412 2581 9 3,3 3,3 3 2,7 12,26
1745 1600 1384 1508 10 -0,5 -0,5 -0,4 -0,7 0,77
1710 1591 1518 1667 11 -0,6 -0,5 0 -0,2 1,93
2046 1907 1627 1898 12 0,4 0,5 0,4 0,5 0,46
1840 1841 1595 1741 13 -0,2 0,3 0,3 0 2,7
1867 1685 1493 1678 14 -0,1 -0,2 -0,1 -0,1 0,13
1859 1649 1389 1714 15 -0,1 -0,3 -0,4 0 1,08
1954 2149 1180 1281 16 0,1 1,3 -1,1 -1,4 16,75
1325 1170 1002 1176 17 -1,8 -1,8 -1,7 -1,7 3,5
1419 1371 1252 1308 18 -1,5 -1,2 -0,8 -1,3 3,99
1828 1634 1602 1755 19 -0,2 -0,4 0,3 0,1 1,36
1725 1594 1313 1646 20 -0,6 -0,5 -0,6 -0,2 1,46
2276 2189 1547 2111 21 1,1 1,4 0,1 1,2 9,9
1899 1614 1422 1477 22 0 -0,4 -0,3 -0,8 5,06
1633 1513 1290 1516 23 -0,8 -0,7 -0,7 -0,6 0,8
2061 1867 1646 2037 24 0,5 0,4 0,5 1 2,54
1856 1493 1356 1533 25 -0,2 -0,8 -0,5 -0,6 4,58
1727 1412 1238 1469 26 -0,6 -1,1 -0,9 -0,8 3,4
2168 1896 1701 1834 27 0,8 0,5 0,6 0,3 2,38
1655 1675 1414 1597 28 -0,8 -0,2 -0,3 -0,4 3
2326 2301 2065 2234 29 1,3 1,7 1,8 1,6 6,28
1490 1382 1214 1284 30 -1,3 -1,2 -1 -1,4 2,58
Akfarianti Nawangsih
23
Kuadrat jarak ๐‘‘๐‘—
2
= (๐‘ฅ๐‘— โˆ’ ๐‘ฅ)๐‘†โˆ’1
(๐‘ฅ๐‘— โˆ’ ๐‘ฅ).
Kolom terakhir pada tabel 4.4 menunjukkan bahwa sampel ke-16
adalah pencilan karena ๊ญ“4;0,05
2
= 14,86, tetapi semua pengukuran
individu berada dalam jangkauan univariat masing-masng. Sampel
ke-9 juga memiliki nilai ๐‘‘2yang tinggi.
Kedua sampel (9 dan 16) dengan kuadrat jarak yang menonjol dari
pola lain pada scatter plot. Begitu dua titik dihilangkan, pola yang
ada akan sesuai dengan yang diharapkan (garis lurus).
Akfarianti Nawangsih 24
Transformasi Mendekati Kenormalan
Data
Dengan
Asumsi
kenormalan
tidak
terpenuhi
Transformasi
Mendekati
Kenormalan
HELPFUL TRANSFORMATION TO NEAR
NORMALITY
Skala asli Skala hasil transformasi
Perhitungan, y ๐‘ฆ
Proporsi, ๐‘ ๐ฟ๐‘œ๐‘”๐‘–๐‘ก ๐‘ =
1
2
log
๐‘
1 โˆ’ ๐‘
Korelasi, r Fisherโ€™s ๐‘ง ๐‘Ÿ =
1
2
๐‘™๐‘œ๐‘”
1+๐‘Ÿ
1โˆ’๐‘Ÿ
M.Abd.Aziz A.
25
Teknik
Menentukan
Pemilihan
Transformasi
yang Tepat
A. Penentuan transformasi hanya berdasarkan bentuk data
Menggunakan power transformation
Misal x adalah observasi acak, power transformation ฮป
Contoh: perhatikan ๐‘‹ฮป dengan ฮป= -1. karena ๐‘‹โˆ’1
= 1/x , pemilihan ฮป
berkorespondensi secara timbal balik dengan transformasi.. Kita dapat
mencari himpunan transformasi dengan menerapkan rentang ฮป dari yang
negatif sampai yang positif
Contoh: โ€ฆ., ๐‘ฅโˆ’1 , ๐‘ฅ0 =lnx, ๐‘ฅ1/4 , ๐‘ฅ1/2 , ๐‘ฅ2 , ๐‘ฅ3 ,โ€ฆ.
Ketika histogramnya terlalu lebar, maka perlu disusutkan dan begitu juga
sebaliknya
Hasil transformasi diuji lagi kenormalannya dengan membuat Q-Q plot
M.Abd.Aziz A.
26
B. Penentuan transformasi berdasarkan informasi dari data dan faktor-faktor di luar
Box and Coxโ€™s univariate transformation
๐‘ฅ ๐œ†
=
๐‘ฅ ๐œ†โˆ’1
๐œ†
, ๐œ† โ‰  0
ln ๐‘ฅ , ๐œ† = 0
Cari ฮป yang memaksimumkan fungsi dengan
๐‘™ ๐œ† = โˆ’
๐‘›
2
๐‘™๐‘›
1
๐‘›
๐‘—=1
๐‘›
๐‘ฅ๐‘—
๐œ†
โˆ’ ๐‘ฅ ๐œ†
2
+ (๐œ† โˆ’ 1)
๐‘—=1
๐‘›
๐‘™๐‘›๐‘ฅ๐‘—
dengan ๐‘ฅ ๐œ† =
1
๐‘› ๐‘—=1
๐‘›
๐‘ฅ๐‘—
(๐œ†)
M.Abd.Aziz A.
27
ฮป l(ฮป) ฮป l(ฮป) ฮป l(ฮป)
-1 70.52 -0.1 103.35 0.8 101.33
-0.9 75.65 0 104.83 0.9 99.34
-0.8 80.46 0.1 105.84 1 97.10
-0.7 84.94 0.2 106.39 1.1 94.64
-0.6 89.06 0.3 106.51 1.2 91.96
-0.5 92.79 0.4 106.20 1.3 89.10
-0.4 96.10 0.5 105.50 1.4 85.07
-0.3 98.97 0.6 104.43 1.5 82.88
-0.2 101.3
9
0.7 103.03
Untuk lamda = -1
๐‘—=1
42
๐‘ฅ๐‘—
โˆ’1
โˆ’ ๐‘ฅ โˆ’1
2
= 20249,30 ;
๐‘—=1
42
๐‘™๐‘›๐‘ฅ๐‘— = โˆ’100,13
Contoh
Misalkan kita tentukan power transformation (ฮป) dari -1,0 sampai 1,5
no.
oven
Radiasi (xj)
no.
oven
Radiasi
(xj)
no.
oven
Radiasi
(xj)
no.
oven
Radiasi
(xj)
no.
oven
Radiasi
(xj)
no.
oven
Radiasi
(xj)
1 0.15 8 0.05 15 0.1 22 0.05 29 0.08 36 0.2
2 0.09 9 0.08 16 0.1 23 0.03 30 0.18 37 0.2
3 0.18 10 0.1 17 0.02 24 0.05 31 0.1 38 0.3
4 0.1 11 0.07 18 0.1 25 0.15 32 0.2 39 0.3
5 0.05 12 0.02 19 0.01 26 0.1 33 0.11 40 0.4
6 0.12 13 0.01 20 0.4 27 0.15 34 0.3 41 0.3
7 0.08 14 0.1 21 0.1 28 0.09 35 0.02 42 0.05
Data radiasi (pintu tertutup)
Nilai l(ฮป)
maksimum
Sehingga
๐‘™ โˆ’1 = โˆ’
42
2
๐‘™๐‘›
1
42
๐‘—=1
42
๐‘ฅ๐‘—
โˆ’1
โˆ’ ๐‘ฅ โˆ’1
2
+ (โˆ’1 โˆ’ 1)
๐‘—=1
42
๐‘™๐‘›๐‘ฅ๐‘—
= โˆ’21 ln[1
42 20249,30 + โˆ’2 (โˆ’100,13)]
= 70,52
Dst terdapat pada tabel berikut
M.Abd.Aziz A. 28
28
Berikut disajikan xj dan ๐’™๐’‹
(๐€)
; j= 1,2,โ€ฆ,42
No.
Oven
Radiasi
(xj)
๐’™๐’‹
(๐€)
=
๐’™ ๐’‹
๐ŸŽ.๐Ÿ๐Ÿ“
โˆ’๐Ÿ
๐ŸŽ.๐Ÿ๐Ÿ“
No.
Oven
Radiasi
(xj) ๐‘ฅ๐‘—
(๐œ†)
=
๐‘ฅ ๐‘—
0.25
โˆ’1
0.25
1 0.15 -1.51 22 0.05 -2.11
2 0.09 -1.81 23 0.03 -2.34
3 0.18 -1.39 24 0.05 -2.11
4 0.1 -1.75 25 0.15 -1.51
5 0.05 -2.11 26 0.1 -1.75
6 0.12 -1.65 27 0.15 -1.51
7 0.08 -1.87 28 0.09 -1.81
8 0.05 -2.11 29 0.08 -1.87
9 0.08 -1.87 30 0.18 -1.39
10 0.1 -1.75 31 0.1 -1.75
11 0.07 -1.94 32 0.2 -1.33
12 0.02 -2.50 33 0.11 -1.70
13 0.01 -2.74 34 0.3 -1.04
14 0.1 -1.75 35 0.02 -2.50
15 0.1 -1.75 36 0.2 -1.33
16 0.1 -1.75 37 0.2 -1.33
17 0.02 -2.50 38 0.3 -1.04
18 0.1 -1.75 39 0.3 -1.04
19 0.01 -2.74 40 0.4 -0.82
20 0.4 -0.82 41 0.3 -1.04
21 0.1 -1.75 42 0.05 -2.11
Q-Q Plot
0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
0.45
0 10 20 30 40 50
sebelum transformasi
-3
-2.5
-2
-1.5
-1
-0.5
0
0 10 20 30 40 50
sesudah transformasi
M.Abd.Aziz A. 29
Transformasi Multivariate
ฮป1, ฮป2,โ€ฆ ฮป ๐‘: power transformations untuk p karakteristik
Pilih ฮป ๐‘˜ untuk memaksimalkan
๐‘™ ๐‘˜ ๐œ† = โˆ’
๐‘›
2
๐‘™๐‘›
1
๐‘›
๐‘—=1
๐‘›
๐‘ฅ๐‘—๐‘˜
(๐œ† ๐‘˜)
โˆ’ ๐‘ฅ ๐‘˜
(๐œ† ๐‘˜)
2
+ (๐œ† ๐‘˜ โˆ’ 1)
๐‘—=1
๐‘›
๐‘™๐‘›๐‘ฅ๐‘—๐‘˜
Dengan ๐‘ฅ ๐‘˜
(๐œ† ๐‘˜)
=
1
๐‘› ๐‘—=1
๐‘›
๐‘ฅ๐‘—๐‘˜
(๐œ† ๐‘˜)
๐‘‹๐‘—
( ๐œ†)
=
๐‘ฅ๐‘—1
( ๐œ†1)
โˆ’ 1
๐œ†1
;
๐‘ฅ๐‘—2
( ๐œ†2)
โˆ’ 1
๐œ†2
; โ€ฆ ;
๐‘ฅ๐‘—๐‘
( ๐œ† ๐‘)
โˆ’ 1
๐œ† ๐‘
Lihat example 4.17 http://bit.ly/MultivarTransform
M.Abd.Aziz A.
30
Thank You
31

More Related Content

What's hot

Analisis Komponen Utama (1)
Analisis Komponen Utama (1)Analisis Komponen Utama (1)
Analisis Komponen Utama (1)Rani Nooraeni
ย 
Analisis Diskriminan (1)
Analisis Diskriminan (1)Analisis Diskriminan (1)
Analisis Diskriminan (1)Rani Nooraeni
ย 
APG Pertemuan 7 : Manova
APG Pertemuan 7 : ManovaAPG Pertemuan 7 : Manova
APG Pertemuan 7 : ManovaRani Nooraeni
ย 
Uji Run ( Keacakan )
Uji Run ( Keacakan )Uji Run ( Keacakan )
Uji Run ( Keacakan )Nur Sandy
ย 
APG Pertemuan 6 : Inferensia Dua Vektor Rata-rata
APG Pertemuan 6 : Inferensia Dua Vektor Rata-rataAPG Pertemuan 6 : Inferensia Dua Vektor Rata-rata
APG Pertemuan 6 : Inferensia Dua Vektor Rata-rataRani Nooraeni
ย 
Statistika non-parametrik dengan metode Uji Tanda
Statistika non-parametrik dengan metode Uji Tanda Statistika non-parametrik dengan metode Uji Tanda
Statistika non-parametrik dengan metode Uji Tanda RindyArini
ย 
APG Pertemuan 5 : Inferences about a Mean Vector and Comparison of Several Mu...
APG Pertemuan 5 : Inferences about a Mean Vector and Comparison of Several Mu...APG Pertemuan 5 : Inferences about a Mean Vector and Comparison of Several Mu...
APG Pertemuan 5 : Inferences about a Mean Vector and Comparison of Several Mu...Rani Nooraeni
ย 
Distribusi multinomial
Distribusi multinomialDistribusi multinomial
Distribusi multinomialMarwaElshi
ย 
Distribusi hipergeometrik
Distribusi hipergeometrikDistribusi hipergeometrik
Distribusi hipergeometrikEman Mendrofa
ย 
Statistika - Distribusi peluang
Statistika - Distribusi peluangStatistika - Distribusi peluang
Statistika - Distribusi peluangYusuf Ahmad
ย 
APG Pertemuan 1-2 (1)
APG Pertemuan 1-2 (1)APG Pertemuan 1-2 (1)
APG Pertemuan 1-2 (1)Rani Nooraeni
ย 
Stat matematika II (7)
Stat matematika II (7)Stat matematika II (7)
Stat matematika II (7)jayamartha
ย 
Uji untuk 2 sampel dependen
Uji untuk 2 sampel dependenUji untuk 2 sampel dependen
Uji untuk 2 sampel dependenAngga Mahendra
ย 
Distribusi peluang diskrit(8)
Distribusi peluang diskrit(8)Distribusi peluang diskrit(8)
Distribusi peluang diskrit(8)rizka_safa
ย 
Distribusi Peluang Diskrit dan Distribusi Peluang Kontinu
Distribusi Peluang Diskrit dan Distribusi Peluang KontinuDistribusi Peluang Diskrit dan Distribusi Peluang Kontinu
Distribusi Peluang Diskrit dan Distribusi Peluang KontinuArning Susilawati
ย 
Struktur aljabar-2
Struktur aljabar-2Struktur aljabar-2
Struktur aljabar-2Safran Nasoha
ย 
Tabel kontingensi 2x2 dan uji independensi
Tabel kontingensi 2x2 dan uji independensiTabel kontingensi 2x2 dan uji independensi
Tabel kontingensi 2x2 dan uji independensiDarnah Andi Nohe
ย 
Anava 2 arah
Anava 2 arahAnava 2 arah
Anava 2 arahyositria
ย 

What's hot (20)

Analisis Komponen Utama (1)
Analisis Komponen Utama (1)Analisis Komponen Utama (1)
Analisis Komponen Utama (1)
ย 
Analisis Diskriminan (1)
Analisis Diskriminan (1)Analisis Diskriminan (1)
Analisis Diskriminan (1)
ย 
APG Pertemuan 7 : Manova
APG Pertemuan 7 : ManovaAPG Pertemuan 7 : Manova
APG Pertemuan 7 : Manova
ย 
Uji Run ( Keacakan )
Uji Run ( Keacakan )Uji Run ( Keacakan )
Uji Run ( Keacakan )
ย 
APG Pertemuan 6 : Inferensia Dua Vektor Rata-rata
APG Pertemuan 6 : Inferensia Dua Vektor Rata-rataAPG Pertemuan 6 : Inferensia Dua Vektor Rata-rata
APG Pertemuan 6 : Inferensia Dua Vektor Rata-rata
ย 
Statistika non-parametrik dengan metode Uji Tanda
Statistika non-parametrik dengan metode Uji Tanda Statistika non-parametrik dengan metode Uji Tanda
Statistika non-parametrik dengan metode Uji Tanda
ย 
APG Pertemuan 5 : Inferences about a Mean Vector and Comparison of Several Mu...
APG Pertemuan 5 : Inferences about a Mean Vector and Comparison of Several Mu...APG Pertemuan 5 : Inferences about a Mean Vector and Comparison of Several Mu...
APG Pertemuan 5 : Inferences about a Mean Vector and Comparison of Several Mu...
ย 
Distribusi multinomial
Distribusi multinomialDistribusi multinomial
Distribusi multinomial
ย 
ANALISIS REAL
ANALISIS REALANALISIS REAL
ANALISIS REAL
ย 
Distribusi hipergeometrik
Distribusi hipergeometrikDistribusi hipergeometrik
Distribusi hipergeometrik
ย 
Statistika - Distribusi peluang
Statistika - Distribusi peluangStatistika - Distribusi peluang
Statistika - Distribusi peluang
ย 
APG Pertemuan 1-2 (1)
APG Pertemuan 1-2 (1)APG Pertemuan 1-2 (1)
APG Pertemuan 1-2 (1)
ย 
Stat matematika II (7)
Stat matematika II (7)Stat matematika II (7)
Stat matematika II (7)
ย 
Uji untuk 2 sampel dependen
Uji untuk 2 sampel dependenUji untuk 2 sampel dependen
Uji untuk 2 sampel dependen
ย 
Distribusi peluang diskrit(8)
Distribusi peluang diskrit(8)Distribusi peluang diskrit(8)
Distribusi peluang diskrit(8)
ย 
VARIABEL RANDOM & DISTRIBUSI PELUANG
VARIABEL RANDOM & DISTRIBUSI PELUANGVARIABEL RANDOM & DISTRIBUSI PELUANG
VARIABEL RANDOM & DISTRIBUSI PELUANG
ย 
Distribusi Peluang Diskrit dan Distribusi Peluang Kontinu
Distribusi Peluang Diskrit dan Distribusi Peluang KontinuDistribusi Peluang Diskrit dan Distribusi Peluang Kontinu
Distribusi Peluang Diskrit dan Distribusi Peluang Kontinu
ย 
Struktur aljabar-2
Struktur aljabar-2Struktur aljabar-2
Struktur aljabar-2
ย 
Tabel kontingensi 2x2 dan uji independensi
Tabel kontingensi 2x2 dan uji independensiTabel kontingensi 2x2 dan uji independensi
Tabel kontingensi 2x2 dan uji independensi
ย 
Anava 2 arah
Anava 2 arahAnava 2 arah
Anava 2 arah
ย 

Similar to MULTIVARIATE NORMAL DISTRIBUTION

Distribusi Normal Matematika Peminatan Kelas XII Program MIPA
Distribusi Normal Matematika Peminatan Kelas XII Program MIPADistribusi Normal Matematika Peminatan Kelas XII Program MIPA
Distribusi Normal Matematika Peminatan Kelas XII Program MIPAMuhammad Arif
ย 
Distribusi binomial, distribusi poisson, dan distribusi
Distribusi binomial, distribusi poisson, dan distribusiDistribusi binomial, distribusi poisson, dan distribusi
Distribusi binomial, distribusi poisson, dan distribusiprofkhafifa
ย 
Konsep distribusi peluang_kontinu(9)
Konsep distribusi peluang_kontinu(9)Konsep distribusi peluang_kontinu(9)
Konsep distribusi peluang_kontinu(9)rizka_safa
ย 
Distribusi normal
Distribusi normalDistribusi normal
Distribusi normalAnton Fi
ย 
Stat prob10 distribution_normal
Stat prob10 distribution_normalStat prob10 distribution_normal
Stat prob10 distribution_normalArif Rahman
ย 
Teknik analisis dataa
Teknik analisis dataaTeknik analisis dataa
Teknik analisis dataaEkaPuspita26
ย 
Distribusi binomial, poisson dan normal
Distribusi binomial, poisson dan normalDistribusi binomial, poisson dan normal
Distribusi binomial, poisson dan normalAYU Hardiyanti
ย 
K6_INDRALAYA_DISTRIBUSI NORMAL_STATISTIKA PENDIDIKAN.pptx
K6_INDRALAYA_DISTRIBUSI NORMAL_STATISTIKA PENDIDIKAN.pptxK6_INDRALAYA_DISTRIBUSI NORMAL_STATISTIKA PENDIDIKAN.pptx
K6_INDRALAYA_DISTRIBUSI NORMAL_STATISTIKA PENDIDIKAN.pptxTriOktariana2
ย 
APG Pertemuan 7 : Manova (2)
APG Pertemuan 7 : Manova (2)APG Pertemuan 7 : Manova (2)
APG Pertemuan 7 : Manova (2)Rani Nooraeni
ย 
APG Pertemuan 3 : Sample Geometry and Random Sampling (1)
APG Pertemuan 3 : Sample Geometry and Random Sampling (1)APG Pertemuan 3 : Sample Geometry and Random Sampling (1)
APG Pertemuan 3 : Sample Geometry and Random Sampling (1)Rani Nooraeni
ย 
APG Pertemuan 6 : Mean Vectors From Two Populations
APG Pertemuan 6 : Mean Vectors From Two PopulationsAPG Pertemuan 6 : Mean Vectors From Two Populations
APG Pertemuan 6 : Mean Vectors From Two PopulationsRani Nooraeni
ย 
ukuran keruncingan
ukuran keruncinganukuran keruncingan
ukuran keruncinganRatih Ramadhani
ย 
Statistik 1 3 dispersi
Statistik 1 3 dispersiStatistik 1 3 dispersi
Statistik 1 3 dispersiSelvin Hadi
ย 
Distribusi normal
Distribusi normalDistribusi normal
Distribusi normalNuurwashilaah -
ย 
Sisi Lain Distribusi Binomial dan Normal
Sisi Lain Distribusi Binomial dan NormalSisi Lain Distribusi Binomial dan Normal
Sisi Lain Distribusi Binomial dan NormalAgung Anggoro
ย 
Ukuran kemiringan dan keruncingan data
Ukuran kemiringan dan keruncingan dataUkuran kemiringan dan keruncingan data
Ukuran kemiringan dan keruncingan dataSriwijaya University
ย 

Similar to MULTIVARIATE NORMAL DISTRIBUTION (20)

Distribusi Normal Matematika Peminatan Kelas XII Program MIPA
Distribusi Normal Matematika Peminatan Kelas XII Program MIPADistribusi Normal Matematika Peminatan Kelas XII Program MIPA
Distribusi Normal Matematika Peminatan Kelas XII Program MIPA
ย 
Catatan Regresi linier
Catatan Regresi linierCatatan Regresi linier
Catatan Regresi linier
ย 
Distribusi binomial, distribusi poisson, dan distribusi
Distribusi binomial, distribusi poisson, dan distribusiDistribusi binomial, distribusi poisson, dan distribusi
Distribusi binomial, distribusi poisson, dan distribusi
ย 
Konsep distribusi peluang_kontinu(9)
Konsep distribusi peluang_kontinu(9)Konsep distribusi peluang_kontinu(9)
Konsep distribusi peluang_kontinu(9)
ย 
Distribusi normal
Distribusi normalDistribusi normal
Distribusi normal
ย 
Stat prob10 distribution_normal
Stat prob10 distribution_normalStat prob10 distribution_normal
Stat prob10 distribution_normal
ย 
Statistika dasar Pertemuan 8
 Statistika dasar Pertemuan 8 Statistika dasar Pertemuan 8
Statistika dasar Pertemuan 8
ย 
Teknik analisis dataa
Teknik analisis dataaTeknik analisis dataa
Teknik analisis dataa
ย 
Distribusi binomial, poisson dan normal
Distribusi binomial, poisson dan normalDistribusi binomial, poisson dan normal
Distribusi binomial, poisson dan normal
ย 
K6_INDRALAYA_DISTRIBUSI NORMAL_STATISTIKA PENDIDIKAN.pptx
K6_INDRALAYA_DISTRIBUSI NORMAL_STATISTIKA PENDIDIKAN.pptxK6_INDRALAYA_DISTRIBUSI NORMAL_STATISTIKA PENDIDIKAN.pptx
K6_INDRALAYA_DISTRIBUSI NORMAL_STATISTIKA PENDIDIKAN.pptx
ย 
APG Pertemuan 7 : Manova (2)
APG Pertemuan 7 : Manova (2)APG Pertemuan 7 : Manova (2)
APG Pertemuan 7 : Manova (2)
ย 
mtk p.pptx
mtk p.pptxmtk p.pptx
mtk p.pptx
ย 
Statistika Dasar Pertemuan 9
Statistika Dasar Pertemuan 9Statistika Dasar Pertemuan 9
Statistika Dasar Pertemuan 9
ย 
APG Pertemuan 3 : Sample Geometry and Random Sampling (1)
APG Pertemuan 3 : Sample Geometry and Random Sampling (1)APG Pertemuan 3 : Sample Geometry and Random Sampling (1)
APG Pertemuan 3 : Sample Geometry and Random Sampling (1)
ย 
APG Pertemuan 6 : Mean Vectors From Two Populations
APG Pertemuan 6 : Mean Vectors From Two PopulationsAPG Pertemuan 6 : Mean Vectors From Two Populations
APG Pertemuan 6 : Mean Vectors From Two Populations
ย 
ukuran keruncingan
ukuran keruncinganukuran keruncingan
ukuran keruncingan
ย 
Statistik 1 3 dispersi
Statistik 1 3 dispersiStatistik 1 3 dispersi
Statistik 1 3 dispersi
ย 
Distribusi normal
Distribusi normalDistribusi normal
Distribusi normal
ย 
Sisi Lain Distribusi Binomial dan Normal
Sisi Lain Distribusi Binomial dan NormalSisi Lain Distribusi Binomial dan Normal
Sisi Lain Distribusi Binomial dan Normal
ย 
Ukuran kemiringan dan keruncingan data
Ukuran kemiringan dan keruncingan dataUkuran kemiringan dan keruncingan data
Ukuran kemiringan dan keruncingan data
ย 

More from Rani Nooraeni

Analisis Faktor (2.2)
Analisis Faktor (2.2)Analisis Faktor (2.2)
Analisis Faktor (2.2)Rani Nooraeni
ย 
Analisis Faktor (2.1)
Analisis Faktor (2.1)Analisis Faktor (2.1)
Analisis Faktor (2.1)Rani Nooraeni
ย 
Analisis Korelasi Kanonik (1)
Analisis Korelasi Kanonik (1)Analisis Korelasi Kanonik (1)
Analisis Korelasi Kanonik (1)Rani Nooraeni
ย 
Analisis Diskriminan (2)
Analisis Diskriminan (2)Analisis Diskriminan (2)
Analisis Diskriminan (2)Rani Nooraeni
ย 
Analisis Klaster (2)
Analisis Klaster (2)Analisis Klaster (2)
Analisis Klaster (2)Rani Nooraeni
ย 
Analisis Klaster (1)
Analisis Klaster (1)Analisis Klaster (1)
Analisis Klaster (1)Rani Nooraeni
ย 
Analisis Faktor (1)
Analisis Faktor (1)Analisis Faktor (1)
Analisis Faktor (1)Rani Nooraeni
ย 
Analisis Komponen Utama (2)
Analisis Komponen Utama (2)Analisis Komponen Utama (2)
Analisis Komponen Utama (2)Rani Nooraeni
ย 
APG Pertemuan 7 : Manova and Repeated Measures
APG Pertemuan 7 : Manova and Repeated MeasuresAPG Pertemuan 7 : Manova and Repeated Measures
APG Pertemuan 7 : Manova and Repeated MeasuresRani Nooraeni
ย 
APG Pertemuan 5 : Inferensia Satu Vektor Rata-rata
APG Pertemuan 5 : Inferensia Satu Vektor Rata-rataAPG Pertemuan 5 : Inferensia Satu Vektor Rata-rata
APG Pertemuan 5 : Inferensia Satu Vektor Rata-rataRani Nooraeni
ย 
APG Pertemuan 1 dan 2 (3)
APG Pertemuan 1 dan 2 (3)APG Pertemuan 1 dan 2 (3)
APG Pertemuan 1 dan 2 (3)Rani Nooraeni
ย 
APG Pertemuan 1 dan 2 (2)
APG Pertemuan 1 dan 2 (2)APG Pertemuan 1 dan 2 (2)
APG Pertemuan 1 dan 2 (2)Rani Nooraeni
ย 

More from Rani Nooraeni (12)

Analisis Faktor (2.2)
Analisis Faktor (2.2)Analisis Faktor (2.2)
Analisis Faktor (2.2)
ย 
Analisis Faktor (2.1)
Analisis Faktor (2.1)Analisis Faktor (2.1)
Analisis Faktor (2.1)
ย 
Analisis Korelasi Kanonik (1)
Analisis Korelasi Kanonik (1)Analisis Korelasi Kanonik (1)
Analisis Korelasi Kanonik (1)
ย 
Analisis Diskriminan (2)
Analisis Diskriminan (2)Analisis Diskriminan (2)
Analisis Diskriminan (2)
ย 
Analisis Klaster (2)
Analisis Klaster (2)Analisis Klaster (2)
Analisis Klaster (2)
ย 
Analisis Klaster (1)
Analisis Klaster (1)Analisis Klaster (1)
Analisis Klaster (1)
ย 
Analisis Faktor (1)
Analisis Faktor (1)Analisis Faktor (1)
Analisis Faktor (1)
ย 
Analisis Komponen Utama (2)
Analisis Komponen Utama (2)Analisis Komponen Utama (2)
Analisis Komponen Utama (2)
ย 
APG Pertemuan 7 : Manova and Repeated Measures
APG Pertemuan 7 : Manova and Repeated MeasuresAPG Pertemuan 7 : Manova and Repeated Measures
APG Pertemuan 7 : Manova and Repeated Measures
ย 
APG Pertemuan 5 : Inferensia Satu Vektor Rata-rata
APG Pertemuan 5 : Inferensia Satu Vektor Rata-rataAPG Pertemuan 5 : Inferensia Satu Vektor Rata-rata
APG Pertemuan 5 : Inferensia Satu Vektor Rata-rata
ย 
APG Pertemuan 1 dan 2 (3)
APG Pertemuan 1 dan 2 (3)APG Pertemuan 1 dan 2 (3)
APG Pertemuan 1 dan 2 (3)
ย 
APG Pertemuan 1 dan 2 (2)
APG Pertemuan 1 dan 2 (2)APG Pertemuan 1 dan 2 (2)
APG Pertemuan 1 dan 2 (2)
ย 

MULTIVARIATE NORMAL DISTRIBUTION

  • 1. Oleh : Kelompok III Multivariate Normal Distribution 1 Dosen Pengampu : Rani Nooraeni, S.ST., M.Stat..
  • 2. Fungsi Normal Distribusi dan Fungsinya Banyak variabel acak yang berdistribusi normal Keuntungan Menggunakan Distribusi Normal Semakin besar sampel akan semakin mendekati distribusi normal ( berdasarkan CLT) Menghasilkan perhitungan yang akurat/bagus Banyak distribusi seperti poisson dan binomial bisa diperkirakan dengan distribusi normal (CLT) Univariate distribution ๐‘“ ๐‘ฅ = 1 2๐œ‹๐œŽ2 ๐‘’ โˆ’ (๐‘ฅโˆ’๐œ‡ /๐œŽ)]2 2 ; โˆ’โˆž < ๐‘ฅ < โˆž Asumsi ๐‘‹~๐‘(๐œ‡, ๐œŽ2 ) Hanif Palupi 2
  • 3. Example : ๐‘Ž๐‘ ๐‘ข๐‘š๐‘ ๐‘– ๐‘ฅ1, ๐‘ฅ2~ ๐‘(๐œ‡, ฮฃ) dan ๐‘ฅ1, ๐‘ฅ2 iid Normal Bivariate Distribution s11 = s22, r12 = 0 | ฮฃ |lebih besar s11 = s22, r12 = 0.75 | ฮฃ |lebih kecil ๐’‡ ๐’™ ๐Ÿ, ๐’™ ๐Ÿ = ๐Ÿ |๐œฎโˆ’๐Ÿ|(๐Ÿ๐…) ๐’‘/๐Ÿ ๐ž๐ฑ๐ฉ[โˆ’ ๐Ÿ ๐Ÿ (๐’™ โˆ’ ๐)๐œฎโˆ’๐Ÿ (๐’™ โˆ’ ๐)] Hanif Palupi 3
  • 4. Normal Multivariate Distribution ๐‘Ž๐‘ ๐‘ข๐‘š๐‘ ๐‘– ๐‘ฅ1, โ€ฆ , ๐‘ฅ ๐‘~ ๐‘ ๐‘ƒ(๐œ‡, ฮฃ) dan ๐‘ฅ1, โ€ฆ , ๐‘ฅ ๐‘ ๐‘–๐‘–๐‘‘ Bentuk grafik : Volume Contour (๐‘2) adalah permukaan dimana kuadrat jarak (๐‘ฅ โˆ’ ๐œ‡ )ฮฃโˆ’1 (๐‘ฅ โˆ’ ๐œ‡ ) konstan atau seluruh nilai variabel yang peluangnya konstan dan berbentuk elips. ๐‘2 = (๐‘ฅ โˆ’ ๐œ‡ )ฮฃโˆ’1 (๐‘ฅ โˆ’ ๐œ‡ ) Ellips berpusat di ๐œ‡ dan memiliki sumbu ยฑ๐‘ ๐œ†๐‘– ๐‘’๐‘–dimana ฮฃ๐‘’๐‘– = ๐œ†๐‘– ๐‘’๐‘–dimana i : 1,2,...,p Selang kepercayaan distribusi normal multivariate CI: ๐‘‹ ยฑ ๐‘ ๐œ†๐‘’ ๐‘“ ๐‘ฅ1, โ€ฆ , ๐‘ฅ ๐‘ = 1 |ฮฃโˆ’1|(2๐œ‹) ๐‘/2 exp[โˆ’ 1 2 (๐‘ฅ โˆ’ ๐œ‡ )ฮฃโˆ’1 (๐‘ฅ โˆ’ ๐œ‡ )] Hanif Palupi 4
  • 5. Result 4.1 Jika ฮฃ definit positif maka ฮฃโˆ’1 ada, sehingga ฮฃ๐‘’ = ๐œ†๐‘’menjadikan ฮฃโˆ’1 ๐‘’ = 1 ๐œ† ๐‘’ Jadi ๐œ†, ๐‘’ adalah pasangan eigenvalue-eigenvector untuk ฮฃ yang bercoresponden dengan ( 1 ๐œ† , ๐‘’) untuk ฮฃโˆ’1 . Sehingga ฮฃโˆ’1 definit positif Jika Matriks A simetris, maka nilai eigen riil dan memiliki eigen vektor yang saling bebas (ortogonal) Hanif Palupi Pembuktian, buka link berikut ini ! http://bit.ly/PembuktianResult4 5
  • 6. Hubungan peluang dengan kuadrat P[(๐‘ฅ โˆ’ ๐œ‡)๐›ดโˆ’1(๐‘ฅ โˆ’ ๐œ‡) โ‰ค ๐œ’2 ๐‘(๐›ผ)] = 1 โˆ’ ๐›ผ Contour 50% dan 90% untuk distribusi normal bivariate Hanif Palupi 6
  • 7. Sifat-Sifat Distribusi Normal Kombinasi linear dari komponen X yang berdistribusi normal. Syarat : Distribusi dari komponen bersyarat berdistribusi normal Apabila kovarian sama dengan nol maka setiap komponen didistribusikan secara independen. Semua subset dari komponen X multivariat berdistribusi normal Mursalina Bia 7
  • 8. Distribusi Kombinasi Linear dari Komponen Normal Jika X berdistribusi ๐‘๐‘(๐œ‡, ), kemudian setiap variabel kombinasi linear ๐‘Žโ€ฒ ๐‘ฟ = ๐‘Ž1 ๐‘‹1 + ๐‘Ž2 ๐‘‹2 + โ‹ฏ + ๐‘Ž ๐‘ ๐‘‹ ๐‘ berdistribusi N(๐‘Žโ€ฒ๐œ‡, ๐‘Žโ€ฒ ๐‘Ž) dan ๐‘Žโ€ฒ ๐‘ฟ berdistribusi N(๐‘Žโ€ฒ๐œ‡, ๐‘Žโ€ฒ ๐‘Ž) untuk setiap ๐‘Ž, maka X berdistibusi ๐‘๐‘(๐œ‡, ) Jika ๐‘ฟ = [ ๐‘ฟ ๐Ÿ, ๐‘ฟ ๐Ÿ, โ€ฆ , ๐‘ฟ ๐‘ท]โ€ฒ berdistribusi ๐‘๐‘(๐œ‡, ) ๐‘Žโ€ฒ ๐‘ฟ = 1 0 โ‹ฏ 0 ๐‘ฟ ๐Ÿ ๐‘ฟ ๐Ÿ โ‹ฎ ๐‘ฟ ๐‘ท = ๐‘‹1 ๐‘Žโ€ฒ ๐œ‡ = 1 0 โ‹ฏ 0 ๐œ‡1 ๐œ‡2 โ‹ฎ ๐œ‡ ๐‘ƒ = ๐œ‡1 ๐‘Žโ€ฒ ๐‘Ž = 1 0 โ‹ฏ 0 ๐œŽ11 โ‹ฏ ๐œŽ1๐‘ƒ โ‹ฎ โ‹ฑ โ‹ฎ ๐œŽ ๐‘ƒ1 โ‹ฏ ๐œŽ ๐‘ƒ๐‘ƒ 1 0 โ‹ฎ 0 = ๐œŽ11 โ€ข Jika X berdistribusi ๐‘๐‘(๐œ‡, ), dengan q kombinasi linear ๐€๐— = ๐‘Ž11 ๐‘‹1 + โ‹ฏ + ๐‘Ž1๐‘ ๐‘‹ ๐‘ ๐‘Ž21 ๐‘‹1 + โ‹ฏ + ๐‘Ž2๐‘ ๐‘‹ ๐‘ โ‹ฎ ๐‘Ž ๐‘ž1 ๐‘‹1 + โ‹ฏ + ๐‘Ž ๐‘ž๐‘ ๐‘‹ ๐‘ : ๐‘๐‘ž(๐€๐œ‡, ๐€๐šบ๐€โ€ฒ) d = vektor konstan Pembuktian : http://bit.ly/KombinasiLinear Mursalina Bia 8
  • 9. Distribusi Chi-Square Distribusi chi square menentukkan keragaman dari sampel varians ๐‘ 2 = ๐‘ 11 untuk sampel univariate normal population. Jika X berdistribusi ๐‘ ๐‘ƒ(๐œ‡, ) dengan > 0 maka (๐‘‹ โˆ’ ๐œ‡)โ€ฒ๐›ดโˆ’1 (๐‘‹ โˆ’ ๐œ‡)~๐œ’ ๐‘ 2 dimana ๐œ’ ๐‘ 2 merupakan distribusi chi square dengan derajat bebas p ๐‘ ๐‘ƒ(๐œ‡, ) distribusi dengan peluang 1 โˆ’ ๐›ผ untuk setiap {๐‘ฅ ๐‘ฅ โˆ’ ๐œ‡ โ€ฒ ๐›ดโˆ’1 ๐‘ฅ โˆ’ ๐œ‡ โ‰ค ๐œ’ ๐‘ 2 ๐›ผ } merupakan nilai atas 100๐›ผ persentil dari distribusi ๐œ’ ๐‘ 2 Mursalina Bia 9
  • 10. Kombinasi Linear Vektor Random ๐‘‹1, ๐‘‹2, โ€ฆ , ๐‘‹ ๐‘› ๐‘š๐‘’๐‘Ÿ๐‘ข๐‘๐‘Ž๐‘˜๐‘Ž๐‘› ๐‘š๐‘ข๐‘ก๐‘ข๐‘Ž๐‘™๐‘™๐‘ฆ ๐‘–๐‘›๐‘‘๐‘’๐‘๐‘’๐‘›๐‘‘๐‘’๐‘›๐‘ก ๐‘ก ๐‘‹๐‘— : ๐‘ ๐‘(๐œ‡ ๐‘—, ) ๐‘‰1 = ๐‘1 ๐‘‹1 + ๐‘2 ๐‘‹2 + โ‹ฏ + ๐‘ ๐‘› ๐‘‹ ๐‘› ๐‘๐‘’๐‘Ÿ๐‘‘๐‘–๐‘ ๐‘ก๐‘Ÿ๐‘–๐‘๐‘ข๐‘ ๐‘– ๐‘ ๐‘( ๐‘—=1 ๐‘› ๐‘๐‘— ๐œ‡ ๐‘—, ( ๐‘—=1 ๐‘› ๐‘๐‘— 2 ) ) ๐‘‰2 = ๐‘1 ๐‘‹1 + ๐‘2 ๐‘‹2 + โ‹ฏ + ๐‘ ๐‘› ๐‘‹ ๐‘› dan ๐‘‰1 merupakan joint berdistrubusi normal dengan matrix kovariance ( ๐‘—=1 ๐‘› ๐‘๐‘— 2 ) (๐‘โ€ฒ ๐‘) (๐‘โ€ฒ ๐‘) ( ๐‘—=1 ๐‘› ๐‘๐‘— 2 ) Mursalina Bia 10
  • 11. SAMPLING DARI DISTRIBUSI NORMAL MULTIVARIATE Sufficient Statistics (STATISTIK CUKUP) Dari persamaan ๐‘ณ ๐, ๐œฎ = 1 (2ฯ€) ๐‘›๐‘/2 ๐šบ ๐‘›/2 ๐‘’ โˆ’๐‘ก๐‘Ÿ ๐œฎโˆ’๐Ÿ ๐‘—=1 ๐‘› ๐‘ฅ ๐‘—โˆ’ ๐‘ฅ ๐‘ฅ ๐‘—โˆ’ ๐‘ฅ โ€ฒ +๐‘› ๐‘ฅโˆ’๐œ‡ ๐‘ฅโˆ’๐œ‡ โ€ฒ /2 joint density dari sekumpulan observasi ๐’™ ๐Ÿ, ๐’™ ๐Ÿ, . . , ๐’™ ๐’ bergantung hanya melalui mean sampel ๐’™ dan matriks sum-of-squares-and-cross-product ๐’‹=๐Ÿ ๐’ ๐’™๐’‹ โˆ’ ๐’™ ๐’™๐’‹ โˆ’ ๐’™ โ€ฒ = ๐‘› โˆ’ 1 ๐‘บ Sehingga dapat dikatakan bahwa ๐’™ dan ๐‘› โˆ’ 1 ๐‘บ (atau ๐‘บ) adalah statistik yang sufficient (cukup) Untuk ๐‘ฟ ๐Ÿ, ๐‘ฟ ๐Ÿ, . . , ๐‘ฟ ๐’ yang merupakan peubah acak dari populasi normal multivariate dengan mean ๐ dan kovarians ๐šบ , maka ๐‘ฟ dan ๐‘บ adalah statistik yang sufficient (cukup) dari distribusi normal multivariate. Rizka Amalia Farentina 11
  • 12. Distribusi Sampling untuk ๐‘‹ dan S Kasus univariat : 1 ๐‘› โˆ’ 1 ๐‘ 2 = ๐‘—=1 ๐‘› (๐‘‹๐‘— โˆ’ ๐‘‹) โˆถ ๐œŽ2 ฯ‡(๐‘›โˆ’1) 2 ๐‘› โˆ’ 1 ๐‘ 2 = ๐œŽ2 ๐‘—=1 ๐‘› ๐‘๐‘— 2 , ๐œŽ๐‘๐‘—: ๐‘(0, ๐œŽ2 ) Kasus multivariat : ๐‘๐‘— = ๐‘‹๐‘— โˆ’ ๐‘‹ โˆถ ๐‘ 0, ฮฃ ๐‘› โˆ’ 1 ๐‘  = ๐‘—=1 ๐‘› ๐‘๐‘— ๐‘๐‘— โ€ฒ : ๐‘ค๐‘–๐‘ โ„Ž๐‘Ž๐‘Ÿ๐‘ก ๐‘‘๐‘–๐‘ ๐‘ก๐‘Ÿ๐‘–๐‘๐‘ข๐‘ก๐‘–๐‘œ๐‘› ๐‘ค ๐‘›โˆ’1( ๐‘› โˆ’ 1 ๐‘†|ฮฃ) ๐‘‹1, ๐‘‹2, โ€ฆ , ๐‘‹ ๐‘› adalah random sampel ๐‘๐‘(๐œ‡, ฮฃ) Distribusi Sampling untuk S Kasus univariat : p=1 ๐‘‹: ๐‘ ๐œ‡, ๐œŽ2 ๐‘› Kasus multivariat : ๐‘‹: ๐‘๐‘ ๐œ‡, ฮฃ ๐‘› ๐‘‹1, ๐‘‹2, โ€ฆ , ๐‘‹ ๐‘› adalah random sampel ๐‘๐‘(๐œ‡, ฮฃ) Distribusi sampling untuk ๐‘ฟ Akfarianti Nawangsih 12
  • 13. Karakteristik Distribusi Wishart Jika A berdistribusi W (A|โˆ‘), maka CACโ€™ berdistribusi Wm (CACโ€™|Cโˆ‘Cโ€™) Jika A1 berdistribusi Wm1 (A1|โˆ‘) independen dari A2 yang berdistribusi Wm2 (A2|โˆ‘), lalu A1 dan A2 berdistribusi Wm1+m2 (A1+ A2|โˆ‘) adalah derajat bebas yang ditambahkan. 1 2 A = Definit Positiif ๐‘ค ๐‘›โˆ’1 ๐ด ฮฃ = |๐ด|(๐‘›โˆ’๐‘โˆ’2) ๐‘’โˆ’๐‘ก๐‘Ÿ[๐ดฮฃโˆ’1]/2 2 ๐‘(๐‘›โˆ’1)/2 ๐œ‹ ๐‘(๐‘โˆ’1)/4|ฮฃ| ๐‘›โˆ’1/2 ๐‘–=1 ๐‘ ฮ“( 1 2 (๐‘› โˆ’ ๐‘–)) Akfarianti Nawangsih 13
  • 14. KARAKTERISTIK SAMPEL BESAR DARI ๐‘ฟ DAN ๐‘บ ๐‘ฟ : ditentukan oleh large number independen yang menyebabkan ๐‘ฝ ๐Ÿ, ๐‘ฝ ๐Ÿ, โ€ฆ , ๐‘ฝ ๐’ ๐‘ฝ๐’Š : variabel acak yang mempunyai variabilitas yang hampir sama ๐‘ฟ = ๐‘ฝ ๐Ÿ+๐‘ฝ ๐Ÿ+โ€ฆ+๐‘ฝ ๐’ ๐‘ฟ mempunyai distribusi mendekati normal ๐‘ฟ berdistribusi mendekati normal untuk sampel besar Law of Large Number ๐’€ ๐Ÿ, ๐’€ ๐Ÿ, โ€ฆ , ๐’€ ๐’ : observasi independen dari sebuah populasi (mungkin tidak normal) dengan ๐ธ ๐‘Œ๐‘– = ๐œ‡ Untuk semua ๐œ€ > 0, ๐‘ƒ โˆ’๐œ€ < ๐‘Œ โˆ’ ๐œ‡ < ๐œ€ ๏ƒ  1 ketika n๏ƒ โˆž ๐‘Œ = ๐‘Œ1+๐‘Œ2+..+๐‘Œ๐‘› ๐‘› berpeluang untuk konvergen menuju ๐œ‡ Rizka Amalia Farentina Pembuktian : http://bit.ly/LawLargeNumber 14
  • 15. Central Limit Theorem ( Ukuran Limit Pusat ) ๐‘ฟ ๐Ÿ, ๐‘ฟ ๐Ÿ, โ€ฆ , ๐‘ฟ ๐’ : observasi independen dari sebuah populasi dengan mean ๐ dan finite (nonsingular) kovarians ๐œฎ ๐‘› ๐‘ฟ โˆ’ ๐œ‡ mempunyai distribusi yang mendekati ๐‘ต ๐’‘ ๐ŸŽ, ๐œฎ untuk sampel besar ๐‘ฟ berdistribusi ๐‘ต ๐’‘ ๐, ๐Ÿ ๐’ ๐œฎ untuk n-p besar ๐‘› ๐‘ฟ โˆ’ ๐œ‡ โ€ฒ ๐œฎโˆ’๐Ÿ ๐‘ฟ โˆ’ ๐œ‡ mendekati distribusi ๐œ’ ๐‘ 2 untuk n-p besar ๐‘บ mendekati ๐œฎ dengan peluang yang besar saat n besar sehingga ๐‘› ๐‘ฟ โˆ’ ๐œ‡ โ€ฒ ๐‘บโˆ’๐Ÿ ๐‘ฟ โˆ’ ๐œ‡ mendekati distribusi ๐œ’ ๐‘ 2 untuk n-p besar Pembuktian : http://bit.ly/ProofCLT Rizka Amalia Farentina 15
  • 16. Asumsi Normalitas Kombinasi linear dari variabel normal adalah normal dan kontur dari normal multivariat adalah ellipsoid. Untuk melihat kenormalan data, salah satu cara yaitu Plot khusus yang disebut plot Q-Q. Ketika poin terletak hampir sepanjang garis lurus, asumsi normalitas tetap dapat dipertahankan. Q-Q Plot(untuk univariate) x1 โ‰ค x2 โ‰ค โ€ฆ โ‰ค xn : observasi Misalkan xj memiliki nilai yang berbeda-beda dan n cukup besar, maka: Proporsi nilai x โ‰ค xj โˆถ ๐‘— ๐‘› โ†’ ( j โˆ’ 1 2 )/n Fajari Ramadhan Normalitas univariate P Z โ‰ค q j = โˆ’โˆž ๐‘ž ๐‘— 1 2โซช ๐‘’โˆ’ ๐‘ง2 2 dz = p(j) = (๐‘—โˆ’1/2) ๐‘› Dimana, p(j) : probabilitas mendapatkan nilai kurang dari atau sama dengan qi dalam satu kurva normal standar. q(j) : standard normal quantil Plot (qj,xj) untuk meneliti kelinearnnya, dan jika xj โ‰ˆ ฮดqj + ยต maka data dapat diasumsikan normal. {example 4.9 hal 179}. 16
  • 17. Langkah-langkah Q-Q plot : First Second Third Urutkan data x(1), x(2), โ€ฆ, x(n) dan nilai probabilitas yang sesuai (1 - 1 2 )/n, (2 - 1 2 )/n, ..., (n - 1 2 )/n; Hitung standar kuantil normal q(1), q(2), โ€ฆ ,q(n); dan Plot pasangan pengamatan (q(1), x(1)),(q(2), x(2)) ..., (q(n, x(n) ) dan periksa Kelinearan dari hasilnya. Koefisien korelasi rq= ๐‘—=1 ๐‘› (๐‘ฅ ๐‘— โˆ’ ๐‘ฅ) (๐‘ž ๐‘— โˆ’ ๐‘ž) ๐‘—=1 ๐‘› (๐‘ฅ ๐‘—โˆ’ ๐‘ฅ)2 ๐‘—=1 ๐‘› (๐‘ž ๐‘—โˆ’ ๐‘ž)2 Bandingkan rq dengan table critical the Q-Q plot (table 4.2 hal 181: http://bit.ly/tabel42). Data berdistribusi normal jika rq > rtabel Fajari Ramadhan 17
  • 18. Contoh: sampel A sebanyak 10 observasi. Misal P Z โ‰ค 0.385 = โˆ’โˆž 0.385 1 2โซช ๐‘’โˆ’ ๐‘ง2 2dz = 0.65 ๏ƒ˜ plot(q(j),x(j))โ†’ linear(Normal) ๏ƒ˜ rq = 0.994369 , rq table = 0.9198 rq>rq table (gagal tolak H0, normal) Ordered obsevatio n Probability levels Standart normal quantiles x(j) ( j - 1 2 )/n q(j) -1.00 0.05 -1.645 -0.10 0.15 -1.036 0.16 0.25 -0.674 0.41 0.35 -0.385 0.62 0.45 -0.125 0.80 0.55 0.125 1.26 0.65 0.385 1.54 0.75 0.674 1.71 0.85 1.036 2.30 0.95 1.645 -1.5 -1 -0.5 0 0.5 1 1.5 2 2.5 -2 -1 0 1 2 x(j) q(j) Fajari Ramadhan 18
  • 19. Normalitas Bivariate Jika pengamatan dihasilkan dari distribusi normal,maka setiap distribusi bivariat akan normal, dan konturnya adalah elips. ๐‘‘2 = ๐‘ฅ โˆ’ ยต โ€ฒ โˆ’1 ๐‘ฅ โˆ’ ยต โ‰ค ๐Ÿ€ ๐ŸŽ,๐Ÿ“ ๐Ÿ Dengan demikian, kita harus mengharapkan kira-kira persentase yang sama, 50% dari pengamatan sampel terletak pada elips. {untuk semua x, (x- ๐‘ฅ)โ€™๐‘†โˆ’1(x- ๐‘ฅ) โ‰ค ๐Ÿ€2(0,5) 2 } (example 4.12 hal 183: http://bit.ly/mvnexample412) Fajari Ramadhan 19
  • 20. Perusahaan X1=sales (million$) X2=profit (million$) General motor 126,974 4224 Ford 96,933 3835 Exxon 86,656 3510 IBM 63,438 3758 General electric 55,264 3939 Mobil 50,976 1809 Philip morris 39,069 2946 Chrysler 36,156 359 Du pont 35,209 2480 Texaco 32,416 2413 ๐‘ฅ = 62,309 2927 ๐‘† = 10005,2 255,76 255,76 14,3 ๐‘†โˆ’1 = 0,000184 โˆ’0,003293 โˆ’0,003293 0,128831 ๐‘‹ 10โˆ’5 Lakukan langkah berikut untuk setiap observasi: obs pertama: ๐‘‘2 =(xโˆ’ ๐‘ฅ)โ€™๐‘†โˆ’1 (xโˆ’ ๐‘ฅ) = 4,34 > ๐Ÿ€2(0,5) 2 = 1,39 (dstโ€ฆobs n) Hasilnya 7 dari 10 observasi memiliki ๐‘‘2 < 1.39 (lebih dari 50%) maka data tidak normal multivariate. Fajari Ramadhan 20
  • 21. Chi Square Plot (multivariate) Urutkan kuadrat jarak dari yang terkecil-terbesar(๐‘‘1 2 , ๐‘‘2 2 dst) qc,p ๐‘—โˆ’ 1 2 ๐‘› : 100(๐‘—โˆ’ 1 2 ) ๐‘› merupakan nilai kuantil untuk chi square distribusi dengan df = p. kemudian gambarkan {qc,p ( ๐‘—โˆ’ 1 2 ๐‘› ), ๐‘‘๐‘— 2 } (example 4.13 hal 184 : http://bit.ly/example413) j d2 qc,p 1 0,59 0,10 2 0,81 0,33 3 0,83 0,58 4 0,97 0,86 5 1,01 1,20 6 1,02 1,60 7 1,20 2,10 8 1,88 2,77 9 4,34 3,79 10 5,33 5,99 0 1 2 3 4 5 6 0 2 4 6 8 d2 qc,p Fajari Ramadhan 21
  • 22. Mendeteksi Outlier dan Membersihkan Data Membuat dot plot untuk setiap variabel. Membuat scatter plot untuk setiap variabel. Menghitung nilai standar (z) dan memeriksanya untuk nilai yang kecil dan besar. Menghitung jarak (๐‘ฅ ๐‘—โˆ’ ๐‘ฅ)โ€ฒ ๐‘†โˆ’1 (๐‘ฅ ๐‘—โˆ’ ๐‘ฅ). Periksa apakah jaraknya wajar atau tidak. Pada plot chi-square, outliernya akan berada pada titik terjauh dari origin. A B C D Kebanyakan data mengandung observasi yang tidak berada pada polanya (pencilan). Pencilan pada data dapat bernilai jauh lebih tinggi atau lebih rendah daripada yang lain. Ketika outlier teridentifikasi, maka harus diperiksa terlebhi dahulu seperti yang terdapa pada contoh sebelumnya. Outlier dapat dihapus atau dikira-kira dengan penimbang pada analisis selanjutnya, tergantung pada sifat outlier dan tujuan penelitian. Mendeteksi outlier Akfarianti Nawangsih 22
  • 23. Contoh Soal Tabel 4.4 mengandung datayang berada di tabel 4.3 termasuk nilai terstandardnya. Data ini terdiri dari empat ukuran stiffness (kekakuan) yang berbeda x1, x2, x3,dan x4 pada masing-masing 30 papan (n=30). table 4.4 Four measurements of stiffness with standardized values x1 x2 x3 x4 observation no. z1 z2 z3 z4 d2 1889 1651 1651 1778 1 -0,1 -0,3 0,2 0,2 0,6 2403 2048 2078 2197 2 1,5 0,9 1,9 1,5 5,48 2119 1700 1815 2222 3 0,7 -0,2 1 1,5 7,62 1645 1627 1110 1533 4 -0,8 -0,4 -1,3 -0,6 5,21 1976 1916 1614 1883 5 0,2 0,5 0,3 0,5 1,4 1712 1712 1439 1546 6 -0,6 -0,1 -0,2 -0,6 2,22 1943 1685 1271 1671 7 0,1 -0,2 -0,8 -0,2 4,99 2104 1820 1717 1874 8 0,6 0,2 0,7 0,5 1,49 2983 2794 2412 2581 9 3,3 3,3 3 2,7 12,26 1745 1600 1384 1508 10 -0,5 -0,5 -0,4 -0,7 0,77 1710 1591 1518 1667 11 -0,6 -0,5 0 -0,2 1,93 2046 1907 1627 1898 12 0,4 0,5 0,4 0,5 0,46 1840 1841 1595 1741 13 -0,2 0,3 0,3 0 2,7 1867 1685 1493 1678 14 -0,1 -0,2 -0,1 -0,1 0,13 1859 1649 1389 1714 15 -0,1 -0,3 -0,4 0 1,08 1954 2149 1180 1281 16 0,1 1,3 -1,1 -1,4 16,75 1325 1170 1002 1176 17 -1,8 -1,8 -1,7 -1,7 3,5 1419 1371 1252 1308 18 -1,5 -1,2 -0,8 -1,3 3,99 1828 1634 1602 1755 19 -0,2 -0,4 0,3 0,1 1,36 1725 1594 1313 1646 20 -0,6 -0,5 -0,6 -0,2 1,46 2276 2189 1547 2111 21 1,1 1,4 0,1 1,2 9,9 1899 1614 1422 1477 22 0 -0,4 -0,3 -0,8 5,06 1633 1513 1290 1516 23 -0,8 -0,7 -0,7 -0,6 0,8 2061 1867 1646 2037 24 0,5 0,4 0,5 1 2,54 1856 1493 1356 1533 25 -0,2 -0,8 -0,5 -0,6 4,58 1727 1412 1238 1469 26 -0,6 -1,1 -0,9 -0,8 3,4 2168 1896 1701 1834 27 0,8 0,5 0,6 0,3 2,38 1655 1675 1414 1597 28 -0,8 -0,2 -0,3 -0,4 3 2326 2301 2065 2234 29 1,3 1,7 1,8 1,6 6,28 1490 1382 1214 1284 30 -1,3 -1,2 -1 -1,4 2,58 Akfarianti Nawangsih 23
  • 24. Kuadrat jarak ๐‘‘๐‘— 2 = (๐‘ฅ๐‘— โˆ’ ๐‘ฅ)๐‘†โˆ’1 (๐‘ฅ๐‘— โˆ’ ๐‘ฅ). Kolom terakhir pada tabel 4.4 menunjukkan bahwa sampel ke-16 adalah pencilan karena ๊ญ“4;0,05 2 = 14,86, tetapi semua pengukuran individu berada dalam jangkauan univariat masing-masng. Sampel ke-9 juga memiliki nilai ๐‘‘2yang tinggi. Kedua sampel (9 dan 16) dengan kuadrat jarak yang menonjol dari pola lain pada scatter plot. Begitu dua titik dihilangkan, pola yang ada akan sesuai dengan yang diharapkan (garis lurus). Akfarianti Nawangsih 24
  • 25. Transformasi Mendekati Kenormalan Data Dengan Asumsi kenormalan tidak terpenuhi Transformasi Mendekati Kenormalan HELPFUL TRANSFORMATION TO NEAR NORMALITY Skala asli Skala hasil transformasi Perhitungan, y ๐‘ฆ Proporsi, ๐‘ ๐ฟ๐‘œ๐‘”๐‘–๐‘ก ๐‘ = 1 2 log ๐‘ 1 โˆ’ ๐‘ Korelasi, r Fisherโ€™s ๐‘ง ๐‘Ÿ = 1 2 ๐‘™๐‘œ๐‘” 1+๐‘Ÿ 1โˆ’๐‘Ÿ M.Abd.Aziz A. 25
  • 26. Teknik Menentukan Pemilihan Transformasi yang Tepat A. Penentuan transformasi hanya berdasarkan bentuk data Menggunakan power transformation Misal x adalah observasi acak, power transformation ฮป Contoh: perhatikan ๐‘‹ฮป dengan ฮป= -1. karena ๐‘‹โˆ’1 = 1/x , pemilihan ฮป berkorespondensi secara timbal balik dengan transformasi.. Kita dapat mencari himpunan transformasi dengan menerapkan rentang ฮป dari yang negatif sampai yang positif Contoh: โ€ฆ., ๐‘ฅโˆ’1 , ๐‘ฅ0 =lnx, ๐‘ฅ1/4 , ๐‘ฅ1/2 , ๐‘ฅ2 , ๐‘ฅ3 ,โ€ฆ. Ketika histogramnya terlalu lebar, maka perlu disusutkan dan begitu juga sebaliknya Hasil transformasi diuji lagi kenormalannya dengan membuat Q-Q plot M.Abd.Aziz A. 26
  • 27. B. Penentuan transformasi berdasarkan informasi dari data dan faktor-faktor di luar Box and Coxโ€™s univariate transformation ๐‘ฅ ๐œ† = ๐‘ฅ ๐œ†โˆ’1 ๐œ† , ๐œ† โ‰  0 ln ๐‘ฅ , ๐œ† = 0 Cari ฮป yang memaksimumkan fungsi dengan ๐‘™ ๐œ† = โˆ’ ๐‘› 2 ๐‘™๐‘› 1 ๐‘› ๐‘—=1 ๐‘› ๐‘ฅ๐‘— ๐œ† โˆ’ ๐‘ฅ ๐œ† 2 + (๐œ† โˆ’ 1) ๐‘—=1 ๐‘› ๐‘™๐‘›๐‘ฅ๐‘— dengan ๐‘ฅ ๐œ† = 1 ๐‘› ๐‘—=1 ๐‘› ๐‘ฅ๐‘— (๐œ†) M.Abd.Aziz A. 27
  • 28. ฮป l(ฮป) ฮป l(ฮป) ฮป l(ฮป) -1 70.52 -0.1 103.35 0.8 101.33 -0.9 75.65 0 104.83 0.9 99.34 -0.8 80.46 0.1 105.84 1 97.10 -0.7 84.94 0.2 106.39 1.1 94.64 -0.6 89.06 0.3 106.51 1.2 91.96 -0.5 92.79 0.4 106.20 1.3 89.10 -0.4 96.10 0.5 105.50 1.4 85.07 -0.3 98.97 0.6 104.43 1.5 82.88 -0.2 101.3 9 0.7 103.03 Untuk lamda = -1 ๐‘—=1 42 ๐‘ฅ๐‘— โˆ’1 โˆ’ ๐‘ฅ โˆ’1 2 = 20249,30 ; ๐‘—=1 42 ๐‘™๐‘›๐‘ฅ๐‘— = โˆ’100,13 Contoh Misalkan kita tentukan power transformation (ฮป) dari -1,0 sampai 1,5 no. oven Radiasi (xj) no. oven Radiasi (xj) no. oven Radiasi (xj) no. oven Radiasi (xj) no. oven Radiasi (xj) no. oven Radiasi (xj) 1 0.15 8 0.05 15 0.1 22 0.05 29 0.08 36 0.2 2 0.09 9 0.08 16 0.1 23 0.03 30 0.18 37 0.2 3 0.18 10 0.1 17 0.02 24 0.05 31 0.1 38 0.3 4 0.1 11 0.07 18 0.1 25 0.15 32 0.2 39 0.3 5 0.05 12 0.02 19 0.01 26 0.1 33 0.11 40 0.4 6 0.12 13 0.01 20 0.4 27 0.15 34 0.3 41 0.3 7 0.08 14 0.1 21 0.1 28 0.09 35 0.02 42 0.05 Data radiasi (pintu tertutup) Nilai l(ฮป) maksimum Sehingga ๐‘™ โˆ’1 = โˆ’ 42 2 ๐‘™๐‘› 1 42 ๐‘—=1 42 ๐‘ฅ๐‘— โˆ’1 โˆ’ ๐‘ฅ โˆ’1 2 + (โˆ’1 โˆ’ 1) ๐‘—=1 42 ๐‘™๐‘›๐‘ฅ๐‘— = โˆ’21 ln[1 42 20249,30 + โˆ’2 (โˆ’100,13)] = 70,52 Dst terdapat pada tabel berikut M.Abd.Aziz A. 28 28
  • 29. Berikut disajikan xj dan ๐’™๐’‹ (๐€) ; j= 1,2,โ€ฆ,42 No. Oven Radiasi (xj) ๐’™๐’‹ (๐€) = ๐’™ ๐’‹ ๐ŸŽ.๐Ÿ๐Ÿ“ โˆ’๐Ÿ ๐ŸŽ.๐Ÿ๐Ÿ“ No. Oven Radiasi (xj) ๐‘ฅ๐‘— (๐œ†) = ๐‘ฅ ๐‘— 0.25 โˆ’1 0.25 1 0.15 -1.51 22 0.05 -2.11 2 0.09 -1.81 23 0.03 -2.34 3 0.18 -1.39 24 0.05 -2.11 4 0.1 -1.75 25 0.15 -1.51 5 0.05 -2.11 26 0.1 -1.75 6 0.12 -1.65 27 0.15 -1.51 7 0.08 -1.87 28 0.09 -1.81 8 0.05 -2.11 29 0.08 -1.87 9 0.08 -1.87 30 0.18 -1.39 10 0.1 -1.75 31 0.1 -1.75 11 0.07 -1.94 32 0.2 -1.33 12 0.02 -2.50 33 0.11 -1.70 13 0.01 -2.74 34 0.3 -1.04 14 0.1 -1.75 35 0.02 -2.50 15 0.1 -1.75 36 0.2 -1.33 16 0.1 -1.75 37 0.2 -1.33 17 0.02 -2.50 38 0.3 -1.04 18 0.1 -1.75 39 0.3 -1.04 19 0.01 -2.74 40 0.4 -0.82 20 0.4 -0.82 41 0.3 -1.04 21 0.1 -1.75 42 0.05 -2.11 Q-Q Plot 0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 0.45 0 10 20 30 40 50 sebelum transformasi -3 -2.5 -2 -1.5 -1 -0.5 0 0 10 20 30 40 50 sesudah transformasi M.Abd.Aziz A. 29
  • 30. Transformasi Multivariate ฮป1, ฮป2,โ€ฆ ฮป ๐‘: power transformations untuk p karakteristik Pilih ฮป ๐‘˜ untuk memaksimalkan ๐‘™ ๐‘˜ ๐œ† = โˆ’ ๐‘› 2 ๐‘™๐‘› 1 ๐‘› ๐‘—=1 ๐‘› ๐‘ฅ๐‘—๐‘˜ (๐œ† ๐‘˜) โˆ’ ๐‘ฅ ๐‘˜ (๐œ† ๐‘˜) 2 + (๐œ† ๐‘˜ โˆ’ 1) ๐‘—=1 ๐‘› ๐‘™๐‘›๐‘ฅ๐‘—๐‘˜ Dengan ๐‘ฅ ๐‘˜ (๐œ† ๐‘˜) = 1 ๐‘› ๐‘—=1 ๐‘› ๐‘ฅ๐‘—๐‘˜ (๐œ† ๐‘˜) ๐‘‹๐‘— ( ๐œ†) = ๐‘ฅ๐‘—1 ( ๐œ†1) โˆ’ 1 ๐œ†1 ; ๐‘ฅ๐‘—2 ( ๐œ†2) โˆ’ 1 ๐œ†2 ; โ€ฆ ; ๐‘ฅ๐‘—๐‘ ( ๐œ† ๐‘) โˆ’ 1 ๐œ† ๐‘ Lihat example 4.17 http://bit.ly/MultivarTransform M.Abd.Aziz A. 30