3. Mind map
3
3.1
introduction
3.2
The
geometri of
the sample
3.3
Random
Samples and
The Expected
Values of The
Sample Mean
and Covariance
Matrix
3.4
Generalized
varians
3.5
SAMPLE
MEAN,
COVARIANCE,
AND
CORRELATION
AS MATRIX
OPERATIONS
3.6
Sample
Values of
Linear
Combinations
of Variables
LATIHAN
4. Introduction
โข โInterpretasi geometrik dari deskriptif statistik
๐, ๐บ ๐, and ๐ pada bagian 3.2
โข Pada bagian 3.3 akan membahas tentang asumsi observasi
sebuah sampel acak.
โข Bagian 3.4 membahas single number, yang disebut generalized
variance untuk menjelaskan variabilitas
Sampel geometri:
๐ฟ =
๐ฅ11 ๐ฅ12 โฏ ๐ฅ1๐
๐ฅ21 ๐ฅ22 โฏ ๐ฅ2๐
โฎ โฎ โฑ โฎ
๐ฅ ๐1 ๐ฅ ๐2 โฏ ๐ฅ ๐๐
=
๐ฅโฒ1
๐ฅโฒ2
โฎ
๐ฅโฒ ๐
Generalized variance:
๐บ =
๐ 11 ๐ 12 โฏ ๐ 1๐
๐ 21 ๐ 22 โฏ ๐ 2๐
โฎ โฎ โฑ โฎ
๐ 1๐ ๐ 2๐ โฏ ๐ ๐๐
= ๐ ๐๐ =
1
๐โ1 ๐=1
๐
๐ฅ๐๐ + ๐ฅ๐ ๐ฅ๐๐ + ๐ฅ ๐
4
By: Gunawan Zulfi
5. The geometri of the sample
X =
๐ฅ11 โฏ ๐ฅ1๐
โฎ โฑ โฎ
๐ฅ ๐1 โฏ ๐ฅ ๐๐
, Vektor X dalam
ordo n x p
=
๐ฅ1
โฒ
โฎ
๐ฅ ๐
โฒ
(3-1)
= ๐ฆ1 โฆ ๐ฆ๐ (3-2)
NB:
๏ง ๐ฅ๐
โฒ
adalah vektor observasi
(multivariat) ke-i untuk p
variabel (dalam vektor
baris).
๏ง ๐ฆ๐ adalah vektor variabel
ke-i yang mengandung
nilai-nilai observasi
(dalam vektor kolom).
๏ง Persamaan 3-1 berada
pada halaman 112 dan
persamaan 3-2 berada
pada halaman 113.
5
By: Luh Lisna R
6. The geometri of the sample
Contoh 3.1
๐ =
4 1
โ1 3
3 5
Vektor rata-rata
๐ฅ =
4โ1+3
3
1+3+5
3
=
2
3
Contoh 3.3
Dekomposisi sebuah vektor menjadi
komponen rata-rata dan deviasinya.
(๐๐๐๐๐๐๐ ๐ฃ๐๐๐ก๐๐ ๐๐๐ฃ๐๐๐ ๐) 2
=
๐๐ข๐๐๐โ ๐๐๐ฃ๐๐๐ ๐ ๐๐ข๐๐๐๐๐ก
๐ฟ ๐ ๐
2
= ๐๐
,
๐๐ = ๐=1
๐
(๐ฅ๐๐ โ ๐ฅ๐ )2
(3-5)
6
Terdapat pada halaman 115 dengan vektor rata-rata
pada contoh 3.1
Persamaan (3-5) untuk deviasi 1 vector, dapat disebut
varians dari variable ke-i. Panjang vector tersebut
adalah standar deviasi.
By: Luh Lisna R
7. The geometri of the sample
๐๐ ๐ ๐ = ๐=1
๐
(๐ฅ๐๐ โ ๐ฅ๐)(๐ฅ๐๐ โ ๐ฅ ๐) (3-6)
= ๐ฟ ๐ ๐
๐ฟ ๐ ๐
cos ๐ ๐๐
๐๐๐ =
๐ ๐๐
๐ ๐๐ ๐ ๐๐
= cos ๐ ๐๐ (3-7)
๏ง Pada persamaan (3-6) adalah deviasi untuk 2 vector.
Persamaan tersebut didapatkan dari persamaan (2-6)
di bab 2.
๏ง Sudut kosinus adalah koefisien korelasi sampel. Jika 2
variable memiliki korelasi yang kuat, maka hasil dari
๐๐๐ akan mendekati 1.
7
By: Luh Lisna R
8. LAtihan soal The geometri of the sample
Given the data matrix
๐ฟ =
3 4
6 โ2
3 1
Graph the scatter plot p=2
dimensions, and locate the sample
mean on your diagram.
Answer.
Known: ๐ฟ =
3 4
6 โ2
3 1
Ask : Graph the scatter plot p=2
dimensions, and locate the sample
mean on your diagram.
Answer:
๐โฒ1 = 3 4 = A
๐โฒ2 = 6 โ2 = B
๐โฒ3 = 3 1 = C
๐ =
3+6+3
3
1+3+5
3
=
2
3
= D
8
By: Luh Lisna R
9. Latihan soal The geometri of the sample
Known: ๐ฟ =
3 4
6 โ2
3 1
Ask:
Sketch the n=3
dimensions representation
of the data, and plot the
deviation vectors ๐1 โ ๐ฅ1 ๐
and ๐2 โ ๐ฅ2 ๐.
Answer:
๐1 =
3
6
3
, ๐2 =
4
โ2
1
The graph
๐ 1 = ๐1 โ ๐ฅ1 ๐ =
3 โ 4
6 โ 4
3 โ 4
=
โ1
2
โ1
๐ 2 = ๐2 โ ๐ฅ2 ๐ =
4 โ 1
โ2 โ 1
1 โ 1
=
3
โ3
0
9
By: Luh Lisna R
10. Random Samples and The Expected Values of The Sample Mean
and Covariance MatriX
Untuk mempelajari variabilitas
sampling seperti ๐ฅ dan ๐ ๐ dengan
tujuan akhir membuat kesimpulan,
kita perlu membuat asumsi tentang
variabel yang nilai pengamatannya
merupakan kumpulan data X.
Dimana,
๐ฟ(๐x๐)=
๐11 โฏ ๐1๐
โฎ โฑ โฎ
๐ ๐1 โฏ ๐ ๐๐
=
๐1โฒ
โฎ
๐ ๐โฒ
Dua poin yang terhubung dengan
definisi sampel acak patut mendapat
perhatian khusus:
1. Pengukuran variabel p dalam satu
percobaan, seperti
๐โฒ๐= ๐๐1, ๐๐2, โฆ , ๐๐๐ , biasanya akan
dikorelasikan. Pengukuran dari
percobaan yang berbeda harus
independen.
2. Independensi pengukuran dari
percobaan ke percobaan mungkin
tidak akan berlaku ketika variabel
akan berubah dari waktu ke
waktu. Pelanggaran terhadap
asumsi tentatif independensi
dapat berdampak serius pada
kualitas kesimpulan statistik.
10
By: Fatima Fajar Y
11. Random Samples and The Expected Values of The Sample Mean
and Covariance MatriX
Misalkan ๐1, ๐2, โฆ , ๐ ๐ random sampel dari joint distribution
yang memiliki vektor rata-rata ๐ dan matriks kovarians ฮฃ.
๐ adalah unbiased estimator dari ๐ dan covarian matriks nya
adalah
1
๐
ฮฃ
E( ๐) = ๐ (vektor populasi rata-rata)
Cov ( ๐) =
1
๐
ฮฃ (populasi varians-kovarians matriks dibagi
banyak sampel)
11
By: Fatima Fajar Y
12. Random Samples and The Expected Values of The Sample Mean
and Covariance MatriX
Untuk kovarians matriks ๐ ๐,
๐ธ ๐ ๐ =
๐ โ 1
๐
= โ
1
๐
Maka
E
๐
๐โ1
๐ ๐ = ฮฃ
๐
๐โ1
๐ ๐ merupakan unbiased estimator dari ฮฃ
๐ ๐ merupakan bias estimator dengan bias ๐ธ ๐ ๐ โ = โ
1
๐
UNBIASED SAMPLE MATRIKS VARIANS-KOVARIANS
S =
๐
๐โ1
๐ ๐ =
1
๐โ1 ๐=1
๐
๐๐ โ ๐ ๐๐ โ ๐ โฒ
12
By: Fatima Fajar Y
13. Generelized variance
Generalized population variance= ฮฃ
Generalized sample variance= ๐
๐บ =
๐ 11 โฏ ๐ ๐1
โฎ โฑ โฎ
๐ ๐1 โฏ ๐ ๐๐
{๐๐๐=
1
๐ โ 1
๐=1
๐
๐๐๐ โ ๐๐ (๐๐๐ โ ๐ ๐)}
๏ง Generalized sample variance = ๐บ
๏ง Ketika p>1 maka ada beberapa informsi dari sample
yang hilang dari proses sehingga ๐ dapat digunakan
sebagai solusi untuk menunjukan tentang kelemahan
dan kelebihan dari descriptive summary
13
By: Aditya Faizal
14. Generelized variance
๐1 = ๐ฆ1 โ ๐ฅ11
๐2 = ๐ฆ2 โ ๐ฅ21
๐ฟ ๐1
= ๐๐๐๐๐๐๐ ๐1
๐ฟ ๐2
= ๐๐๐๐๐๐๐ ๐2
Gambar disamping
merupakan area yang
dihasilkan dalam 2
deviation vector
Area = ๐ฟ ๐1
๐ฟ ๐2
1 โ ๐๐๐ 2(๐)
14
By: Aditya Faizal
16. Generelized variance
Dari persamaan diatas kita bisa
tuliskan
๐ =
๐๐๐๐ 2
๐ โ 1 2
Maka dari itu kita bisa menuliskan
untuk p deviation :
๐ = ๐ โ 1 โ๐
๐ฃ๐๐๐ข๐๐ 2
16
.
By: Aditya Faizal
21. Latihan soal SAMPLE MEAN, COVARIANCE, AND CORRELATION AS
MATRIX OPERATIONS
Contoh 3.12
Hitunglah total sample variance untuk matriks varians-kovarians S
pada contoh 3.7 dan 3.9
Dari contoh 3.7
๐ =
252.04 โ68.43
โ68.43 123.67
Total sample variance = s11 + s22 = 252.04 + 123.67 = 375.71
Dari contoh 3.9
๐ =
3 โ
3
2
0
โ
3
2
1
1
2
0
1
2
1
Total sample variance = s11 + s22 + s33 = 3 + 1 + 1 = 5
21
By: Sri Indriyani
22. Sample Values of Linear Combinations of
Variables
Seperti yang sudah di jelaskan dalam Section 2.6. Dalam prosedur
multivariate, kita harus mendapatkan kombinasi linier dari bentuk :
๐โฒ
๐ = ๐1 ๐1 + ๐2 ๐2+. . . + ๐ ๐ ๐ ๐
Atau dengan nilai pengamatan j menjadi:
๐โฒ
๐ฅ๐ = ๐1 ๐ฅ๐1 + ๐2 ๐ฅ๐2+. . . +๐ ๐ ๐ฅ๐๐ ๐ = 1, 2, . . . , ๐ (3 โ 31)
Dan diperoleh nilai observasi n:
Rata-rata sampel =
(๐โฒ ๐ฅ1+๐โฒ ๐ฅ2+ . . . +๐โฒ ๐ฅ ๐)
๐
= ๐โฒ
(๐ฅ1 + ๐ฅ1+ . . . +๐ฅ1)
1
๐
= ๐โฒ
๐ฅ 3 โ 32
Varians sampel dari ๐โฒ
๐= ๐โฒ
๐๐ 3 โ 33
Equations (3-32) dan (3-33) merupakan sampel dari (2-43). Sesuai
dengan substitusi dari sampel ๐ฅ dan S untuk populasi ๐ dan ๐ด.
22
By: Mulyana
23. Sample Values of Linear Combinations of
Variables
Diberikan kombinasi linier
๐โฒ
๐ = ๐1 ๐1 + ๐2 ๐2+ . . . +๐ ๐ ๐ ๐
๐โฒ
๐ = ๐1 ๐1 + ๐2 ๐2+ . . . +๐ ๐ ๐ ๐
Memiliki sampel rata-rata, varians, dan kovarian
yang ditunjukkan dengan ๐ฅ dan S
๏ง Rata-rata sampel dari ๐โฒ
๐ = ๐โฒ
๐ฅ
๏ง Rata-rata sampel dari ๐โฒ ๐ = ๐โฒ ๐ฅ
๏ง Varians sampel dari ๐โฒ ๐ = ๐โฒ ๐๐
๏ง Varians sampel dari ๐โฒ ๐ = ๐โฒ ๐๐
๏ง Kovarians sampel dari ๐โฒ ๐ dan ๐โฒ ๐ = ๐โฒ ๐๐
23
By: Mulyana
24. Latihan Sample Values of Linear
Combinations of Variables
Contoh 3.13 (Rata-rata dan kovarians untuk kombinasi linier)
๐ =
๐ฅ11 ๐ฅ12 ๐ฅ13
๐ฅ21 ๐ฅ22 ๐ฅ23
๐ฅ31 ๐ฅ32 ๐ฅ33
=
1 2 4
4 1 6
4 0 4
Diberikan dua kombinasi linier
๐โฒ ๐ = 2 2 โ1
๐1
๐2
๐3
= 2๐1+2 ๐2- ๐3dan ๐โฒ ๐ = 1 โ1 3
๐1
๐2
๐3
= 2๐1 โ
๐2 + 3๐3
Rata-rata sampel dari ๐โฒ
๐ = 3 Varians sampel dari ๐โฒ
๐ = 3
Rata-rata sampel dari ๐โฒ
๐ = 17 Varians sampel dari ๐โฒ
๐= 13
24
By: Mulyana
25. Latihan Sample Values of Linear
Combinations of Variables
Kovarians sampel dari ๐โฒ ๐ dan ๐โฒ ๐ =
9
2
Dari contoh 3.9 didapatkan ๐ฅ =
3
1
5
๐๐๐ ๐ =
3 โ
3
2
0
โ
3
2
1
1
2
0
1
2
1
Dengan menggunakan (3-36), kita dapat mencari
dua rata-rata sampel untuk observasi
Rata-rata sampel dari ๐โฒ
๐ = ๐โฒ
๐ฅ = 2 2 โ1
3
1
5
= 3
25
By: Mulyana
26. Latihan Sample Values of Linear
Combinations of Variables
Rata-rata sampel dari ๐โฒ
๐ = ๐โฒ
๐ฅ = 1 โ1 3
3
1
5
= 17
Varians sampel dari ๐โฒ
๐ = ๐โฒ
๐๐ = 2 2 โ1
3 โ
3
2
0
โ
3
2
1
1
2
0
1
2
1
2
2
โ1
= 3
Varians sampel dari ๐โฒ
๐ = ๐โฒ
๐๐ = 1 โ1 3
3 โ
3
2
0
โ
3
2
1
1
2
0
1
2
1
1
โ1
3
= 13
Kovarians sampel dari ๐โฒ
๐ dan ๐โฒ
๐ = ๐โฒ
๐๐ = 2 2 โ1
3 โ
3
2
0
โ
3
2
1
1
2
0
1
2
1
2
โ1
3
=
9
2
26
By: Mulyana
27. Latihan bab 3
1. Table 3.3 gives partial data from
Kramer and Jensen (1969a). Three
variables were measured (in
milliequivalents per 100 g) at 10
different locations in the South. The
variables are
y1 = available soil calcium,
y2 = exchangeable soil calcium
y3 = turnip green calcium.
Use the calcium data in Table
3.3:
a) Calculate S using the data
matrix Y
b) Find R
c) Find the generalized sample
variance |S|
27
28. Latihan bab 3
2. For the variables in Table 3.3, define
z = 3y1 โ y2 + 2y3 = (3,โ1, 2)y.
a)Find ๐ง and sz
2 in two ways:Evaluate z for each row of
Table 3.3 and find ๐ง and sz
2 directly from z1, z2, . . . , z10.
b)Use ๐ง = ๐โฒ ๐ and ๐ ๐ง
2
= ๐โฒ
๐บ๐
3. For the variables in Table 3.3, define w = โ2y1 + 3y2 + y3
and define z as in Problem 2. Find rzw !
28