Dokumen tersebut membahas tentang sample geometry dan random sampling. Secara ringkas, dokumen menjelaskan tentang diagram p-dimensi dan n-dimensi untuk mewakili data sampel, serta menghitung nilai rata-rata vektor dan dekomposisi vektor menjadi komponen rata-rata dan deviasi. Dokumen juga membahas mengenai nilai ekspektasi dari sample mean dan covarians matriks, serta generalized variance untuk mewakili variasi data pada lebih d
2. Geometri Nilai-Nilai Sampel
• Setiap baris mewakili
observasi multivariat
• Setiap kolom mewakili
variabel multivariat
• Dari data tersebut
dapat dibuat 2 plot
yang berbeda, yaitu
diagram p-dimensi dan
diagram n-dimensi.
Johnson
pdf
3. Diagram p-dimensi
Vektor observasi
ke-1
Vektor observasi
ke-n
• Setiap baris mewakili koordinat titik pada diagram
pada diagram p-dimensi.
• Diagram tersebut memberikan informasi lokasi dan
variabilitas titik-titik.
M. Harry D - 16.9298
Johnson
pdf
4. Cara Menghitung Rata-Rata Vektor x
Pada Diagram p-dimensi.
𝐱 𝟏
′
= [ 4,
1 ]
𝐱 𝟐
′
= [ -1,
3 ]
𝐱 𝟑
′
= [ 3,
5 ]
1.Hitung rata-rata variabel
untuk setiap observasi
2.Plot n=3 vektor pada p=2
dimensi, dan masukkan
nilai x pada diagram
Gambar 1. Plot data
matriks X, n=3 vektor pada
p=2 dimensi.
Gambar 1 menunjukkan bahwa
x adalah balance point pada
diagram tersebut.
M. Harry D - 16.9298
5. Diagram n-dimensi
Contoh:
𝑦1 = Vektor variabel ke-1
𝑦𝑝 = vektor varaiabel ke-p
Setiap kolom mewakili
koordinat titik pada diagram
pada diagram n-dimensi.
𝒚 𝟏
′
= [ 4, -1, 3 ]
𝒚 𝟐
′
= [ 1, 3, 5 ]
Gambar 2. Diagram dengan
p = 2 vektor pada n = 3
dimensi M. Harry D - 16.9298
Johnson
pdf
7. Example 3.3 – Dekomposisi Vektor Menjadi
Komponen Rata-Rata dan Deviasi
Misal X =
4 1
−1 3
3 5
, maka 𝑥𝑖 =
𝑥1𝑖+𝑥2𝑖+⋯+𝑥 𝑛1
𝑛
.
𝑥1 =
4−1+3
3
= 2 dan 𝑥2 =
1+3+5
3
. Dari Example 3.2 diperoleh di = yi +
𝑥𝑖1,
d1 = y1 + 𝑥11 =
4
−1
3
−
2
2
2
=
2
−3
1
d2 = y2 + 𝑥21 =
1
3
5
−
3
3
3
=
−2
0
2
.
Ingat bahwa 𝑥11 dan d1= y1 + 𝑥11 adalah orthogonal, karena
( 𝑥11)’(d1) = 2 2 2
2
−3 = 4-6+2 = 0.
Afifatuz Zahra - 16.8970
8. Hal tersebut juga berlaku untuk 𝑥21 dan d2= y2 + 𝑥21. Hasil
dekomposisinya adalah
y1 =
4
−1
3
=
2
2
2
+
2
−3
1
y2 =
1
3
5
=
3
3
3
+
−2
0
2
Panjang vektor (𝐿 𝑑 𝑖
2
) = 𝒅𝒊
′
𝒅𝒊 = 𝑗=1
𝑛
𝑥𝑗𝑖 − 𝑥𝑖
2
Dan diketahui varians sampel adalah 𝑠𝑖
2
=
𝑗=1
𝑛
𝑥 𝑗𝑖− 𝑥 𝑖
2
𝑛
.
Sehingga dapat ditunjukkan bahwa kuadrat panjang vektor deviasi
proporsional terhadap nilai varians variabelnya (semakin panjang
vektor maka nilainya semakin bervariasi, begitu juga sebaliknya).
Misalkan 𝜃𝑖𝑘 adalah sudut antara vektor 𝑑𝑖 dan 𝑑 𝑘, maka
𝑟𝑖𝑘 =
𝑠 𝑖𝑘
𝑠 𝑖𝑖 𝑠 𝑘𝑘
= cos (𝜃𝑖𝑘).
Jadi, nilai cos sudut antara dua vektor adalah koefisien korelasi sampelnya.
yi di𝑥𝑖1
Afifatuz Zahra - 16.8970
9. Example 3.4 – Menghitung Sn dan R Dari Vektor Deviasi
Dari Example 3.3 diperoleh d1 =
2
−3
1
dan d2 =
−2
0
2
.
𝒅 𝟏
′
𝒅 𝟏 = 2 −3 1
2
−3
1
= 14 = 3𝑠11, sehingga 𝑠11 =
14
3
.
𝒅 𝟐
′
𝒅 𝟐 = −2 0 2
−2
0
2
= 8 = 3𝑠22, sehingga 𝑠22 =
8
3
.
𝒅 𝟏
′
𝒅 𝟐 = 2 −3 1
−2
0
2
= -2 = 3𝑠12, sehingga 𝑠12 = −
2
3
.
𝑟12 =
𝑠12
𝑠11 𝑠22
=
−
2
3
14
3
8
3
= -0.189
Diperoleh 𝑆 𝑛 =
14
3
−
2
3
−
2
3
3
3
dan R =
1 −0.189
−0.189 1
.
Afifatuz Zahra - 16.8970
Johnson
pdf
11. Random
Sample
Misal kita memiliki variabel random Xjk dalam satu set
matriks X (n x p), Tiap set pengukuran Xj dengan p
variabel adalah random vector. Sehingga seluruh (n)
observasi akan membentuk random Matriks X tersebut.
Jika Vektor baris X’1, X’2,...., X’n mewakili Observasi
independen dari common joint distribution dengan
density function f(x) =f(x1, x2, ..., xp), maka X1, X2,
..., Xn dapat dikatakan sampel random dari f(x).
Dalam mempelajari Variabilitas sampling statistika
seperti 𝑥 dan Sn dengan tujuan membuat analisis
inferensia, diperlukan asumsi pada variabel di tiap
observasi. Dimana :
1. Pengukuran sejumlah variabel dalam sekali percobaan
akan berkorelasi, dan pengukuran antar percobaan
harus independen
2. Independensi tiap percobaan seringkali terlanggar
bila data berupa series.
Ahmad Rizal- 16.8978
Johnson
pdf
12. N i l a i
E k s p e k t a
s i d a r i
S a m p l e
M e a n d a n
Covarians
M a t r i k s
Misal diketahui X1, X2, ..., Xn adalah sampel acak
dari joint distribusi yang memiliki mean vector 𝜇
dan covarians matriks 𝜮. Maka 𝑿 adalah unbiased
estimator dari 𝜇, dan covarians matriksnya adalah 𝜮/n.
Yang dituliskan dengan :
– E( 𝑿) = 𝜇 (Mean vektor populasi)
– Cov ( 𝑿) 𝜮/n (Varians-covarians matriks
populasi dibagi sample size).
Untuk covarians matriks Sn,
E(Sn) =
𝑛 −1
𝑛
Σ = Σ – Σ/n
Maka,
E(
𝑛
𝑛 −1
Sn) = Σ
Unbiased Estimator dari Varians-Covarians Matriks :
S = (
𝑛
𝑛 −1
)Sn =
1
𝑛 −1 𝑗=1
𝑛
𝑿𝑗 − 𝑿 𝑿𝑗 − 𝑿 ’
Ahmad Rizal- 16.8978
Johnson
pdf
13. G e n e l a r i z
e d
V a r i a n c e
Pengertian Generalized variance
• Untuk variabel tunggal, varians
sampel digunakan untuk menggambarkan
variasi data dalam pengukuran
variabel tersebut. Namun, ketika
terdapat p variabel untuk setiap
unit, maka variasinya digambarkan
dengan matriks varians-kovarians
sampel sebagai berikut.
𝑺 =
𝑠11 ⋯ 𝑠1𝑝
⋮ ⋱ ⋮
𝑠1𝑝 ⋯ 𝑠 𝑝𝑝
= 𝑠𝑖𝑘 =
1
𝑛 − 1
𝑗=1
𝑛
𝑥𝑗𝑖 − 𝑥𝑖 𝑥𝑗𝑘 − 𝑥 𝑘
Hanifah Afuwu- 16.9165
To
Johnson
pdf
14. G e n e l a r i z
e d
V a r i a n c e
( 2 )
Generalized sample variance
dihitung dengan |S| yaitu nilai
determinan dari matriks varians-
kovarians sampel.
Generalized sample variance =|S|
Generalized sample variance
memberikan informasi tentang semua
nilai varians dan kovarians data
dalam satu nilai. Ketika p > 1,
beberapa informasi tentang sampel
akan hilang dalam proses
perhitungannya. Namun, interpretasi
geometris |S| dapat mengatasi
kekurangan dan kelebihannya.
Hanifah Afuwu- 16.9165
Johnson
pdf
15. Ketika p=2 maka akan menghasilkan 2 vektor deviasi
yaitu 𝑑1 = 𝑦1 − 𝑥11 dan 𝑑2 = 𝑦2 − 𝑥21. Sehingga 𝐿 𝑑1 adalah
panjang dari 𝑑1 dan 𝐿 𝑑2 adalah panjang dari 𝑑2.
Luas trapesium :|𝐿 𝑑1 sin ⍬ | 𝐿 𝑑2
Karena 𝑐𝑜𝑠2
(⍬) + 𝑠𝑖𝑛2
(⍬) = 1 maka rumus diatas dapat
ditulis
𝐿 𝑑1
sin(𝜃) 𝐿 𝑑2
= 𝐿 𝑑1
𝐿 𝑑2
1 − 𝑐𝑜𝑠2(𝜃)
Hanifah Afuwu- 16.9165
Johnson
pdf
17. Generalized sample variance untuk p>2 atau p=p
• Ketika p=p maka akan menghasilkan p vektor deviasi
yaitu 𝒅 𝟏 = 𝒚 𝟏 − 𝑥1 𝟏, 𝒅 𝟐 = 𝒚 𝟐 − 𝑥2 𝟏, … , 𝒅 𝒑 = 𝒚 𝒑 − 𝑥 𝑝 𝟏.
Sehingga perhitungan generalized sample variance
menjadi :
𝑺 =
𝑣𝑜𝑙𝑢𝑚𝑒 𝑝
𝑛 − 1 𝑝
Hanifah Afuwu- 16.9165
Johnson
pdf
18. Contoh
Hanifah Afuwu- 16.9165
Catatan :
GV sampel membesar, jika ada
vektor deviasi yang memanjang,
yang menyatakan variasi di
dalam variabel juga membesar
(korelasinya mengecil)
GV sampel mengecil, jika arah
dari 2 vektor deviasi semakin
berimpitan , yang menyatakan
variasi di dalam variabel juga
mengecil (korelasinya membesar)
Johnson
pdf
19. Ketika
Generalis
asi
Varians
Sampel
bernilai
‘0’
|S| = 0 ketika salah satu kolom di dalam
matriks X – 1𝐱 ̅^′ merupakan kombinasi linier
dari kolom lainnya. Misalnya ketika ada
variabel nilai akhir, dan nilai UAS. Nilai
akhir = nilai UTS + nilai UAS, maka nilai
akhir merupakan kombinasi liner dari nilai UAS
Nabilla Fathasya-16.9317
To
Johnson
pdf
20. Indikasi
(Johnson, p. 131 – 134)
Sa = 0
a adalah vektor eigen dari S dengan
eigenvalue ‘0’
2. a’(𝐱_𝐣 - 𝐱 ̅) = 0 untuk semua j
kombinasi linear dari matriks X – 1
𝐱 ̅^′ bernilai ‘0’
3. a’𝐱_𝐣=c, untuk semua j (c="a’" 𝐱 ̅")"
kombinasi linear dari matriks X (data
asli) bernilai ‘c’Dampak
Didalam perhitungan statistik dan
analisisnya jika |S| = 0 terjadi maka ada
variabel yang harus direduksi.
Pertanyaannya variabel manakah yang harus
direduksi?
?
Nabilla Fathasya-16.9317
To
Johnson
pdf
21. Generalisasi Varians Sampel yang telah Distandardisasi
Observasi terstandar =
xjk − xk
skk
Kemudian matriks varians-kovarians nya disebut R.
Karena panjang vektor adalah n − 1
|R| akan besar ketika vektor-vektor ini saling
orthogonal dan akan bernilai kecil ketika vektor-
vektor memiliki arah yang sama. Dari persamaan rik =sik
sii skk
= cos(θ𝑖𝑘) maka|R| akan bernilai besar
ketika rik mendekati ‘0’ dan bernilai kecil ketika rik
mendekati ‘1’.
Sehingga |R|= (n − 1)−p
(volume)2
Nabilla Fathasya-16.9317
To
Johnson
pdf
22. Hubungan dengan S
Efek yang ditimbulkan oleh 𝐝 𝟐 varians besar di|S| lebih
besar dibanding |R|. Hubungan yang dapat ditarik antar
keduanya yaitu (n − 1)p
𝐒 = n − 1 p
(s11s22 … spp)|𝐑|
Nabilla Fathasya-16.9317
Johnson
pdf
23. Contoh soal Generalized variance
p.124 (johnson)
Example 3.7. Terdapat data mengenai karyawan (x1)
dan pendapatan per karyawan (x2) untuk 16 perusahan
penerbitan terbesar di Amerika Serikat. Berikut ini
matriks sampel varians-kovariansya.
𝑺 =
252,04 −68,43
−68,43 123,67
Hitunglah generalized variance!
Jawab :
𝐺𝑒𝑛𝑒𝑟𝑎𝑙𝑖𝑧𝑒𝑑 𝑣𝑎𝑟𝑖𝑎𝑛𝑐𝑒 = 𝑺 = 252,04 123,67 − −68,43 −68,43
= 26,487
Hanifah Afuwu- 16.9165
Johnson
pdf
24. M a t r i k s
R a t a -
R a t a ,
V a r i a n s -
c ov ar i an s
d a n
K o r e l a s i
S a m p e l
Misalkan diberikan sebuah matriks X :
X=
𝑥11 ⋯ 𝑥1𝑝
⋮ ⋱ ⋮
𝑥1𝑝 ⋯ 𝑥 𝑛𝑝
= 𝑦1 ⋯ 𝑦𝑝
Maka:
𝒙 =
𝑦1 1
𝑛
…
𝑦 𝑝 1
𝑛
=
1
𝑛
𝑥11 ⋯ 𝑥1𝑝
⋮ ⋱ ⋮
𝑥1𝑝 ⋯ 𝑥 𝑛𝑝
1
⋯
1
=
1
𝑛
X’1
Matriks var-cov sampel yang tidak bias
adalah
𝑺 =
1
𝑛 − 1
𝑿′
𝑰 −
𝟏
𝒏
𝟏′
𝟏 𝑿
Kartika Ningtyas-16.9216
Johnson
pdf
25. M a t r i k s
K o r e l a s i
𝑹 =
𝑠11
𝑠11 𝑠11
⋯
𝑠1𝑝
𝑠11 𝑠 𝑝𝑝
𝑠21
𝑠11 𝑠22
⋯
𝑠2𝑝
𝑠22 𝑠 𝑝𝑝
⋮ ⋱ ⋮
𝑠 𝑝1
𝑠11 𝑠 𝑝𝑝
⋯
𝑠 𝑝𝑝
𝑠 𝑝𝑝 𝑠 𝑝𝑝
=
𝟏 𝒓 𝟏𝟐 …
⋮ ⋮ ⋱
𝒓 𝟏𝒑 𝒓 𝟐𝒑 ⋯
𝒓 𝟏𝒑
⋮
𝟏
Kartika Ningtyas-16.9216
Johnson
pdf
26. Nilai Sampel yang Saling Berkombinasi
Linear
dalam Satu Variabel
Misalkan terdapat sebuah kombinasi linear dari p variabel
𝒃′
𝑿 = 𝑏1 𝑋1 + 𝑏2 𝑋2 + … + 𝑏 𝑝 𝑋 𝑝
Maka diperoleh:
Sample mean = 𝒃′ 𝒙
Sample variance = 𝒃′
𝑺𝒃
Sample covariance dari 𝒃′ 𝒙 dan 𝐜′ 𝒙 = 𝒃′ 𝑺𝒄
Atau jika dimisalkan sebuah matriks A berukuran q x p dengan
baris ke-k berisi kombinasi linear dari p variabel, maka
untuk q kombinasi linear akan memiliki:
Sample mean = 𝑨 𝒙
Sample variance = A 𝑺𝑨′
Kartika Ningtyas-16.9216
Johnson
pdf
28. Sample Geometry
dan
Random Sampling
Consider the data matrix
𝑿 =
−1 3 −2
2 4 2
5 2 3
a. Calculate the matrix of deviations
(residuals), 𝑿 − 𝟏 𝒙′. Is this matrix of
full rank? Explain.
b. Determine S and calculate the
generalized sample variance 𝑺 .
Interpret the latter geometrically.
c. Using the result in (b), calculate the
total sample variance.