1. Chng 4 LÝ THUY T M U 93
Ph n th hai
Th ng kê toán
XSTK
2008
2. Chng 4 LÝ THUY T M U 94
Th ng kê toán là m t ngành c a toán h c bao g m vi c thu th p, t ch c,
trình bày, phân tích và gi i thích các d li u, và c các phương pháp ñã ñư c dùng
trong ñó. Nh ng th t c ñư c dùng trong vi c thu th p, t ng k t và phân tích d
li u ñư c g i là các phương pháp th ng kê. Khoa h c th ng kê, trư c h t, liên
quan ñ n vi c hình thành và th c hi n các phương pháp th ng kê vào vi c phân
tích d li u, ñ t ñó, ngư i ta ñưa ra nh ng k t lu n có ý nghĩa cho m c tiêu c a
vi c thu th p d li u.
Th ng kê, v i nghĩa h p, cũng ñư c dùng ñ ch b n thân d li u hay các
ñ i lư ng nh n ñư c t d li u, ch ng h n như trung bình, phương sai. . .
Nh ng k t lu n, phán ñoán c a th ng kê ñ u mang tính xác su t, d a vào
nguyên lý bi n c hi m và lu t s l n. Lý thuy t xác su t làm cho th ng kê, tho t
ñ u ch có tính ch t mô t , tr nên có kh năng phân tích, d ñoán v i cơ s khoa
h c v ng ch c.
Th ng kê toán ñư c chia làm hai lĩnh v c chính:
Th ng kê mô t : Bao g m giai ño n quan sát ñ thu th p, trình bày và t ng
h p các thông tin thành m t t p các d li u, trên ñó vi c phân tích s ñư c ti n
hành.
Th ng kê suy ñoán ( còn g i là th ng kê qui n p): G m nh ng phương pháp
phân tích và gi i thích d li u, nó giúp các nhà th ng kê tri n khai các suy lu n có
ý nghĩa v d li u.
C hai lĩnh v c trên liên quan ch t ch v i nhau.
0.01
0
)
,
3. Chng 4 LÝ THUY T M U 95
Chương 4
Lý thuy t m u
1. KHÁI NI M
Trong các nghiên c u khoa h c thu c nhi u lĩnh v c (kinh t , y h c, xã h i
h c, v.v. . . ), ngư i ta thư ng ph i kh o sát m t ho c nhi u ñ c trưng nào ñó
(còn g i là d u hi u hay tiêu th c th ng kê) th hi n trên m t t p h p các ñ i
tư ng, g i là T ng th .
S ph n t c a t ng th thư ng r t l n, nên vi c kh o sát toàn b khó th
th c hi n vì nh ng lý do v th i gian và chi phí; ngoài ra, có trư ng h p vi c
kh o sát ph i phá hu ñ i tư ng ñư c kh o sát. Do ñó, ngư i ta nghĩ ñ n phương
pháp ñi u tra thăm dò, nghĩa là kh o sát trên m t t p con c a t ng th , g i M u.
S ph n t c a m u ñư c g i là kích thư c m u hay c m u.
Lý thuy t m u nghiên c u nh ng m i quan h gi a m t t ng th v i m u
ñư c ch n t t ng th ñó. Ch ng h n, ư c lư ng nh ng ñ i lư ng chưa bi t c a
t ng th (như trung bình, phương sai. v.v. . .), ñư c g i là Tham s t ng th hay
nói g n là Tham s , t nh ng ñ i lư ng tương ng c a m u, ñư c g i là các
Th ng kê. Lý thuy t m u cũng ñư c dùng trong vi c xác ñ nh xem s khác nhau
quan sát ñư c gi a hai m u th c s có ý nghĩa không. v.v. . .
Vi c ch n m u ñ di u tra, nghiên c u có nhi u ưu ñi m như: Vi c nghiên
c u ñư c ti n hành nhanh, ñáp ng k p th i yêu c u nghiên c u; ti t ki m th i
gian và chi phí; có ñi u ki n ñi sâu nghiên c u t ng ñơn v , t ñó ñ m b o tính
chính xác c a các s li u thu th p ñư c.
Tuy nhiên, trong vi c ch n m u, do nhi u nguyên nhân khác nhau, s không
tránh kh i các sai s .
Sai s là hi u gi a giá tr x c a tham s tính ñư c trên m u v i giá tr th c a
c a tham s tương ng trong t ng th .
Có lo i sai s do vi ph m các ñi u ki n cơ b n c a vi c ch n m u hay do
ño, ñ m thi u chính xác c a ngư i th c hi n ... g i là Sai s thô; có lo i sinh ra
do d ng c không ñư c ñi u ch nh chính xác ho c không th ng nh t v i nhau v
4. Chng 4 LÝ THUY T M U 96
cách xác ñ nh m t ñ i lư ng nào ñó ... g i là Sai s h th ng. Các lo i sai s này
c n ñư c phát hi n và lo i b ngay trong quá trình thu th p d li u m u. Sau khi
lo i b sai s thô và sai s h th ng, còn m t lo i sai s sinh ra do m t s l n các
nguyên nhân mà tác d ng c a t ng nguyên nhân bé ñ n m c không th tách ra ñ
tính riêng ñư c g i là Sai s ng u nhiên. Ngư i ta nh n th y r ng sai s ng u
nhiên Z = X − a có phân ph i chu n N(0, σ2), v i σ là ñ chính xác c a phép ño.
Ngoài ra, vì kích thư c m u thư ng r t nh so v i kích thư c c a t ng th
nên t k t qu c a m u suy ra cho t ng th không th tránh ñư c nh ng sai s g i
là Sai s ch n m u.
Sai s ch n m u không ph i do ño, ñ m hay ghi chép sai mà là lo i sai s
g n li n v i b n thân cu c nghiên c u ñi u tra m u. Sai s ch n m u ph thu c
vào hai y u t cơ b n là kích thư c m u và phương pháp ch n m u. Chúng ta
không th bi t chính xác sai s này, nhưng có th h n ch và ư c lư ng sai s
ch n m u.
Trong nh ng ñi u ki n không thay ñ i, kích thư c m u càng l n thì tính
ch t ñ i di n c a m u càng cao, do ñó sai s ch n m u càng nh . Nhưng n u kích
thư c m u l n thi các sai s do ño, ñ m, ghi chép . . . càng d x y ra. Do ñó,
kích thư c m u ph i ch n v a ñ cho yêu công vi c. V n ñ kích thư c m u s
ñư c xét k trong các chương sau. Tuy nhiên, nhìn chung, n u t ng th h u h n,
nhi u tác gi cho r ng ch n kích thư c m u b ng 10% kích thư c t ng th là ñ .
Đ h n ch sai s , m u ph i ph n ánh ñư c ñúng ñ n c u trúc c a t ng th ,
nghĩa là m u ph i mang tính ñ i di n cho t ng th . Mu n th , các ph n t c a
m u ph i ñư c ch n m t cách ng u nhiên, i.e. ch n th nào ñ m i ph n t c a
t ng th có cơ h i ñư c ch n như nhau. M t k thu t ñ ñ t ñư c m u ng u nhiên
là gán cho m i ph n t c a t ng th m t con s ; vi t các s này vào nh ng m nh
gi y nh r i ñ t chúng vào m t bình r i rút s t bình, v i lưu ý tr n ñ u các
m nh gi y trư c m i l n rút. Vi c rút s t bình có th ñư c thay b ng ch n s
trên b ng s ng u nhiên.
Sau khi rút m t s t bình, chúng ta có th hoàn tr l i hay không hoàn tr
l i s ñó vào bình trư c khi rút s ti p theo. Trong trư ng h p th nh t, m t s có
th ñư c rút nhi u hơn m t l n. M u, trong ñó, m i ph n t c a t ng th có th
ñư c ch n nhi u hơn m t l n ñư c g i là M u có hoàn l i; trư ng h p ngư c l i
là M u không hoàn l i.
Giáo trình này không ñi sâu vào nh ng k thu t ch n m u mà ch nêu lên
m t s nguyên t c chung khi ch n m u.
T ng th có khi h u h n, có khi vô h n. Thí d , t ng th g m t t c s n
ph m do m t nhà máy s n xu t ra trong m t ngày cho trư c là h u h n; trong khi
ñó, n u gieo m t ñ ng ti n 50 l n và ñ m s m t s p xu t hi n thì chúng ta có m t
m u t t ng th vô h n.
Chú ý. M t t ng th h u h n, t ñó thành l p m u không hoàn l i, ñư c xem
như t ng th vô h n. Trong th c hành, m t t ng th h u h n, nhưng có s ph n
t N r t l n so v i kích thư c m u n ñư c thành l p, (theo th c nghi m, n
0,05N), có th ñư c xem như vô h n.
5. Chng 4 LÝ THUY T M U 97
T ñây, tr khi nói rõ, m u ñư c xem như ñư c thành l p t m t t ng th
vô h n.
2. PHÂN PH I M U
M t m u kích thư c n là m t t p con g m n ph n t c a t ng th g m N
ph n t . Vi c có th l p ñư c nhi u m u có cùng kích thư c n khác nhau t m t
t ng th d n ñ n khái ni m phân ph i m u.
2.1. Đ nh nghĩa. Gi s ñ c trưng c a t ng th c n nghiên c u ñư c bi u
di n b i bi n ng u nhiên X, xác ñ nh trên m t không gian m u M. M t vectơ
ng u nhiên n thành ph n (X1, X2, ..., Xn) g m n bi n ng u nhiên ñ c l p, có cùng
lu t phân ph i xác su t v i X ñư c g i là m t M u lý thuy t kích thư c n, ñ c
trưng X ( hay ñư c thành l p t X ).
Phân ph i xác su t c a X ñư c g i là phân ph i c a t ng th ; µ = E(X) và
(X)Dσ = , l n lư t, là kỳ v ng (trung bình) và ñ l ch chu n c a t ng th .
V i m i m ∈ M, b giá tr ((X1(m), X2(m), ..., Xn(m)) ñư c g i là m t
M u c th , kích thư c n, ñ c trưng X . Th c ch t, m t m u c th là m t b n
s th c (x1, x2, ..., xn) th hi n giá tr c a m u lý thuy t (X1, X2, ..., Xn) sau khi
th c hi n m t phép th ñ i v i m u.
T nay, ñ ti n vi c trình bày, m u lý thuy t và m u c th ñ u ñư c g i là
M u (tr trư ng h p c n thi t); tuy nhiên, chúng ta v n phân bi t hai khái ni m
này thông qua n i dung và cách vi t.
2.2. Đ nh nghĩa. Gi s (X1, X2, ..., Xn) là m t m u ñ c trưng X và là
m t hàm th c n bi n. Bi n ng u nhiên T = To(X1, X2, ..., Xn), không ph thu c
vào b t kỳ m t tham s nào chưa bi t, ñư c g i là m t Th ng kê. Phân ph i xác
su t c a th ng kê T ñư c g i là Phân ph i m u c a T. Đ l ch chu n c a T, i.e.
σT, ñư c g i là Sai s chu n c a T.
Hai th ng kê thư ng ñư c dùng là Trung bình m u và Phương sai m u.
3. PHÂN PH I M U C A TRUNG BÌNH
3.1. Đ nh nghĩa. Cho m u ng u nhiên (X1, X2, ..., Xn) kích thư c n, ñ c
trưng X. Bi n ng u nhiên X ñư c xác ñ nh b i:
1 2 ... 1
1
n
nX X X
in n
i
X X
+ + +
=
= = ∑
ñư c g i là Trung bình m u.
6. Chng 4 LÝ THUY T M U 98
Giá tr c a X ng v i m u c th (x1, x2, ... , xn) là s
1
1 n
i
i
x x
n ====
==== ∑∑∑∑ ,
ñư c g i là Giá tr trung bình m u.
T tính ch t c a kỳ v ng và phương sai , chúng ta có
3.2. Đ nh lý. Gi s m u (X1, X2, ..., Xn) ñư c thành l p t bi n ng u nhiên
X có kỳ v ng µX và ñ l ch chu n σX . Khi ñó,
E( ) XX = µ và X
X n
σ
σ =
Ch ng minh.
1 1
1 2( ) [ ( ) ( ) ... ( )] .n X Xn n
E X E X E X E X n= + + + = µ =µ .
Vì các BNN X1, X2, ..., Xn ñ c l p, nên
2
2 2
1 12 2
1 2 n[D( ) D( ) ... D( )] = . XX nn n
X X X n σσ = + + + σ = ,
hay X
X n
σ
σ = . ■
Theo ñ nh lý trên, kỳ v ng c a trung bình m u b ng kỳ v ng c a t ng th
và phương sai c a trung bình m u n l n nh hơn phương sai c a t ng th . Nói
cách khác, phân ph i xác su t c a X có xu hư ng t p trung t i trung bình c a
t ng th . Ngoài ra, n u m u càng l n thì giá tr c a X càng t p trung g n µ.
Khi m u có kích thư c n không quá nh so v i s ph n t N c a t ng th
(n ≥≥≥≥ 0,05N) và là m u không hoàn l i thì ñ l ch chu n c a X ñư c ñi u ch nh
là:
1
.
N n
X Nn
−σ
−
σ =
Lư ng
1
N n
N
−
−
ñư c g i là Th a s ñi u ch nh h u h n.
3.3. H qu . N u X ~ N( µ, σ2) thì
2
~ N( , )
n
X σµ và do ñó, BNN
( )( )
X
X nX
U
− µ− µ
σ σ
= =
Như v y, BNN
( )X n
U
− µ
σ
= tuân theo lu t phân ph i N(0,1) v i gi
thi t t ng th X ~ N( µ, σ2). Tuy nhiên, v i m u có kích thư c lón, ngư i ta
ch ng minh ñư c:
7. Chng 4 LÝ THUY T M U 99
3.4. Đ nh lý gi i h n trung tâm
Gi s m u (X1, X2, ..., Xn) ñư c thành l p t bi n ng u nhiên X có kỳ v ng
µ và phương sai σ2 . Khi ñó, v i m i x ∈ ,
2
( ) 1
2
lim P exp( )
2
x
X n
n
t
x dt
− µ
σ π→∞ −∞
= −
∫ .
• Như v y, v i giá tr n l n (n 30), chúng ta v n có th xem BNN
( )
U
X n− µ
σ
= có phân ph i chu n N(0,1), dù X có b t kỳ phân ph i nào.
Thí d . M t m u ng u nhiên kích thư c n = 25 ñư c thành l p t t ng th
X có phân ph i chu n v i trung bình là 75 và ñ l ch chu n là 10. Tính xác su t
ñ trung bình m u n m trong kho ng t 71 ñ n 79.
Gi i.
Vì X ~ N(75; 100) nên ~ (75;4)X N .
nên
( ) ( )− −
≤ ≤ = Φ − Φ
= Φ − Φ − =
79 75 71 75
2 2
(71 79)
(2) ( 2) 0,9554
P X
3.5. Đ nh nghĩa. N u ñ c trưng X có phân ph i B(p) thì kỳ v ng µ = p
ñư c g i là T l c a t ng th . Trung bình m u X ñư c g i là T l m u và
ñư c ký hi u là P .Giá tr c a P trên m t m u c th (x1, x2, ..., xn), ñư c g i là
Giá tr t l m u, và ñư c ký hi u p .
1
1
n
in
i
p x x
=
= = ∑ .
Trong trư ng h p này,
E( )P p= và
(1 )p p
P n
−
σ = .
Dĩ nhiên, như ph n trên, khi m u ñư c ch n t m t t ng th h u h n,
chúng ta ph i nhân thêm th a s ñi u ch nh h u h n.
V i m u c l n, BNN
( )
P
P p
U
−
σ
= ñư c xem như có phân ph i N(0,1).
4. PHÂN PH I M U C A PHƯƠNG SAI
4.1. Đ nh nghĩa. Cho m u ng u nhiên (X1, X2, ..., Xn) kích thư c n, có
trung bình m u X . Bi n ng u nhiên:
8. Chng 4 LÝ THUY T M U 100
2 21
1
1
( )
n
in
i
S X X
−
=
= −∑
ñư c g i là Phương sai m u
Bi n ng u nhiên 2S S= ñư c g i là ñ l ch chu n m u.
V i m u c th (x1, x2, ..., xn), s th c
2 2 2 21 1
1 1
1 1
( ) ( )
n n
i in n
i i
s x x x n x
− −
= =
= − = −∑ ∑
ñư c g i là giá tr phương sai m u.
4.2. Đ nh lý. Cho m u ng u nhiên (X1, X2, . . ., Xn) ñư c thành l p t
bi n ng u nhiên X có kỳ v ng µX và phương sai 2
Xσ . Khi ñó:
(a) = σ2 2
E( ) XS ;
(b) n u X có phân ph i chu n thì:
(i)
422
1
D( ) X
n
S
σ
−
= ;
(ii) X ñ c l p v i S2 và bi n ng u nhiên
2( 1)
2
n S
X
−
σ
có phân ph i
χ2 v i n − 1 b c t
do.
( )
( ) ( )
2
2
2
0 1 1
i
i i
X ~ N ,
X X
~ N , ~
µ σ
µ µ
χ
σ σ
− − ⇒
Ch ng minh.
(a) 2 2
1
1
E( ) E( )
n
i
i
S X X
n =
= −∑
2
1
1
E[( ) ( )]
n
i
i
X X
n =
= −µ − −µ∑
2 2 2
1
1 1
E( ) E[ ( ) 2 ( ) ]
n
i
i
X n X n X
n n=
= −µ + −µ − − µ∑
9. Chng 4 LÝ THUY T M U 101
( )2 2
1
E( )n
n
X
−
= σ − − µ
2
2 2
1
.n
n n
σ
−
= σ − = σ
Ph n ch ng minh D(S2) dành cho b n ñ c. ■
Chú ý. N u ñ nh nghĩa phương sai m u b ng bi u th c:
2 2
1
1
( )
n
i
i
S X X
n =
= −∑
thì E( S2 ) = 21n
n
−
σ ≠ σ2.
Khi ñó, S2 không th là m t ư c lư ng t t cho σ2.
4.3. H qu . Gi s m u (X1, X2, ..., Xn ) ñư c thành l p t bi n ng u
nhiên X có phân ph i chu n N(µ, σ2). Khi ñó, bi n ng u nhiên
( )X n
T
S
− µ
=
có phân ph i Student v i (n − 1) b c t do.
Th t v y, vì
( )X n− µ
σ
~ N(0,1)
và
2( 1)
2
n S−
σ
~ χ2 (n − 1)
nên
( )X n
S
− µ
=
2
2
( )
( 1)
( 1)
X n
n S
n
− µ
σ
−
− σ
~ t (n − 1). ■
5. PHÂN PH I M U C A HI U HAI TH NG KÊ
Gi s cho trư c hai t ng th . T m u (X1, X2, ..., Xn) ñ c trưng X, kích
thư c n, ñư c thành l p t t ng th th nh t, chúng ta xây d ng th ng kê T1. Phân
ph i m u c a T1 có trung bình và ñ l ch chu n l n lư t ñư c ký hi u là 1Tµ và
1Tσ . T m u (Y1, Y2, ..., Ym) ñ c trưng Y, kích thư c m, ñư c thành l p t t ng
10. Chng 4 LÝ THUY T M U 102
th th hai, chúng ta xây d ng th ng kê T2. Phân ph i m u c a T2 có trung bình
và ñ l ch chu n l n lư t ñư c ký hi u là 2Tµ và 2Tσ . Xét bi n ng u nhiên
D = T1 − T2,
chúng ta có:
5.1. Đ nh lý. Phân ph i xác su t c a D = T1 − T2 có trung bình và ñ l ch
chu n l n lư t là:
1 2 1 2
2 2
D T T D T T
µ = µ − µ σ = σ + σvµ
Trư ng h p ñ c bi t, T1 = X và T2 = Y , chúng ta có:
5.2. H qu . Kỳ v ng và ñ l ch chu n c a bi n ng u nhiên X − Y , theo
theo th t , là:
X X YY−µ = µ − µ và
2 2
X
X Y
Y n m− = +
σ σ
σ .
5.3. Đ nh lý. Cho hai m u (X1, X2, ..., Xn ) ñ c trưng X, và (Y1, Y2, ..., Ym )
ñ c trưng Y, ñ c l p nhau. N u
2
X~ ( , )XX N µ σ và 2
Y~ ( , )YY N µ σ
thì bi n ng u nhiên
2 2
( ) ( )
X Y
X Y
n m
X Y
U
σ σ
− − µ − µ
=
+
tuân theo lu t phân ph i N(0,1).
5.4. Đ nh lý. Cho hai m u (X1, X2, ..., Xn ) ñ c trưng X, và (Y1, Y2, ..., Ym )
ñ c trưng Y, ñ c l p nhau. Gi s 2~ ( , )XX N µ σ và 2~ ( , )YY N µ σ (cùng
phương sai). Khi ñó:
(a) Bi n ng u nhiên
2 2
2 2
( 1) ( 1)X YS S
n m− + −
σ σ
tuân theo lu t phân ph i χ2(n + m − 2).
(b) Bi n ng u nhiên
( )2 1 1
( ) ( )X Y
n m
X Y
T
S
− − µ − µ
=
+
,
11. Chng 4 LÝ THUY T M U 103
trong ñó
2 2( 1) ( 1)2
2
X Yn S m S
n m
S
− + −
+ −
= ,
tuân theo lu t phân ph i Student v i (n + m − 2) b c t do.
Ch ng minh.
(a) Theo Đ nh lý 4.4.2, BNN
2( 1)
2
n SX−
σ
~ χ2(n − 1) và
2( 1)
2
m SY−
σ
~ χ2(m − 1).
Do ñó, BNN
2 2
2 2
( 1) ( 1)X YS S
n m− + −
σ σ
tuân theo lu t phân ph i χ2(n + m − 2).
(b) Vì BNN
2 1 1
( ) ( )
~ (0,1)
( )
X Y
n m
X Y
U N
− − µ − µ
=
σ +
và
2 22
2 2
( 1) ( 1)( 2) 2
~ ( 2)X Yn S m Sn m S
n m
− + −+ −
= + −
σ σ
χ
nên
2 2/
U
S
T
σ
= tuân theo lu t phân ph i Student v i (n + m − 2) b c t do.■
6. TRÌNH BÀY D LI U: B NG TH NG KÊ
D li u ban ñ u thu th p ñư c t m u là m t b sưu t p các d li u chưa
ñư c t ch c, thư ng nhi u và l n x n, ñư c g i là d li u thô. T d li u thô,
ngư i ta x p ñ t l i, trình bày có h th ng ñ d nh n xét và tính toán. Hình th c
thư ng ñư c dùng ñ trình bày d li u là các B ng th ng kê và các Bi u ñ .
Nguyên t c là x p ñ t d li u có h th ng, theo m t th t nào ñó (th i gian,
không gian, ñ l n . . . ). N i dung b ng g m các hàng ho c c t ghi các giá tr xi
c a m u và t n s ni (s l n l p l i giá tr xi ) tương ng. N u c n, ngư i ta ghi
thêm các hàng ho c c t t n s tương ñ i (t n su t)
n
i n
i
f = và t n su t tích lu .
Ngư i ta cũng g i m t b ng th ng kê như th là m t b ng phân ph i t n
s . Chúng ta có b ng phân ph i t n s m t bi n ho c hai bi n tuỳ theo ñ c trưng
kh o sát là m t ho c hai.
12. Chng 4 LÝ THUY T M U 104
6.1. Thí d . Đ kh o sát s ñơn ñ t hàng (SĐĐH) X mà xí nghi p cơ khí
ABC nh n ñư c trong m i ngày, ngư i ta theo dõi m t tháng làm vi c ( 25 ngày )
nào ñó. K t qu ñư c ghi trong b ng d li u thô sau ( i là s th t c a ngày ):
B ng 1: B ng d li u thô
i 1 2 3 4 5 6 7 8 9 10 11 12 13
xi 1 1 0 2 5 0 1 2 1 4 1 3 3
i 14 15 16 17 18 19 20 21 22 23 24 25
xi 2 0 1 0 3 1 2 2 1 4 2 0
D li u trên ñư c s p x p l i: Có 6 giá tr khác nhau c a xi trong 25 ngày
quan sát tương ng v i s ngày ni (t n s ) mà giá tr xi ñó ñã quan sát ñư c. Các
c p (xi, ni ) ñư c th hi n trong b ng th ng kê sau:
B ng 2: B ng phân ph i t n s (l y d li u t b ng 1)
SĐĐH (xi) 0 1 2 3 4 5 T ng
S ngày ( ni ) 5 8 6 3 2 1 n = 25
fi = ni /n 0,20 0,32 0,24 0,12 0,08 0,04 1
6.2. Chú ý. Trong trư ng h p b ng phân ph i t n s có k giá tr khác nhau
c a xi, công th c tính giá tr trung bình m u và giá tr phương sai m u, theo th
t , là:
1
1
k
i in
i
x n x
====
==== ∑∑∑∑
và 2 2 21
1
1
( )
k
i in
i
s n x n x−
=
= −∑ .
6.3. D li u ñư c phân l p. Trư ng h p d li u g m m t s l n các giá
tr khác nhau; ñ d có m t cái nhìn t ng quát v d li u, ngư i ta ghép các s li u
thành t ng l p. Ngoài ra, ñ ñơn gi n hoá vi c tính toán cũng là m t lý do ñ th c
hi n vi c ghép l p.
V n ñ ñây là n ñ nh s l p. S l p quá ít s d n ñ n s m t thông tin,
còn s l p quá nhi u l i ñưa v trư ng h p ban ñ u. M t kinh nghi m ñư c nhi u
nhà th c nghi m s d ng là gi m t s l p k b ng s nguyên nh nh t sao cho
2k n.
Hai ñi m ñ u trái và ph i c a m i l p l n lư t ñư c g i là các ñi m gi i
h n dư i và gi i h n trên c a l p.
13. Chng 4 LÝ THUY T M U 105
N u BNN X thu c lo i r i r c, ch ng h n s công nhân, s s n ph m,…thì
gi i h n dư i và gi i h n trên c a 2 l p k nhau không trùng nhau. N u BNN X
thu c lo i liên t c, ch ng h n kh i lư ng c a ngư i, năng su t lúa.…thì gi i h n
dư i và gi i h n trên c a m t l p trùng v i gi i h n dư i c a l p k ti p.
M i l p s ñư c gán cho m t giá tr ñ i di n cho các giá tr nh n ñư c b i
các ph n t c a l p. Có nhi u cách ch n khác nhau, tùy t ng trư ng h p. Trong
giáo trình này, ñ ñơn gi n vi c tính toán, chúng ta ch n giá tr gi a c a m i l p
ñ ñ i di n cho l p ñó. Trư ng h p l p ñ u tiên không có gi i h n dư i và l p
cu i cùng không có gi i h n trên, ngư i ta qui ñ nh b r ng c a chúng là b
r ng c a l p g n chúng nh t.
6.4. Thí d . Đ kh o sát kh i lư ng X (ñơn v là gam) c a m t lo i thu c
viên do xí nghi p Alpha s n xu t, ngư i ta cân ng u nhiên 50 viên thu c lo i ñó.
K t qu ñư c cho trong b ng sau (s li u ñư c ghép l p):
B ng 3:
Kh i lư ng xi (gam) S viên (ni) fi = ni / n fi tích lu
[325; 327) 326,0 6 0,12 0,12
[327; 328) 327,5 8 0,16 0,28
[328; 329) 328,5 14 0,28 0,56
[329; 330) 329,5 9 0,18 0,74
[330; 331) 330,5 7 0,14 0,88
≥ 331 331,5 6 0,12 1,00
6.5. B ng phân ph i t n s hai chi u.
Gi s công ty Alpha có 453 nhân viên. Khi ñi u tra, ngư i ta quan tâm
ñ ng th i ñ n hai bi n: Lương tháng X (105 VNĐ) và thâm niên Y (năm) c a
nh ng ngư i hư ng lương. K t qu ñư c trình bày trong b ng phân ph i t n s
hai chi u. Phân ph i th ng kê ñư c xác ñ nh b i các b ba (xj, yk, njk )
X
Y
5 7 9 12 T ng
1 năm 87 57 11 3 158
3 năm 39 45 14 19 117
5 năm 15 36 47 25 123
8 năm 8 14 24 9 55
T ng 149 152 96 56 453
7. TRÌNH BÀY D LI U: BI U Đ
14. Chng 4 LÝ THUY T M U 106
Có nhi u hình th c ñ bi u di n các thông tin dư i d ng hình nh, g i là
Bi u ñ . Bi u ñ d gây n tư ng hơn b ng phân ph i t n s . Có nhi u d ng
bi u ñ : Bi u ñ d ng c t, d ng qu t tròn, d ng ñư ng g p khúc. . .
Dùng m t h tr c to ñ vuông góc; tr c hoành bi u di n các giá tr xi c a
bi n X và tr c tung bi u di n các t n s ni ho c t n su t fi ho c t n su t tích lu .
Chú ý r ng khi v bi u ñ t n s (t n su t), ñi m 0 c a tr c tung ph i t i giao
ñi m c a hai tr c to ñ ; ñ i v i tr c hoành, v trí ñi m 0 không c n xác ñ nh mà
tuỳ thu c vào giá tr c a xi.
Thí d . L y d li u t B ng phân ph i s ñơn ñ t hàng trong 25 ngày c a
công ty ABC (B ng 2), chúng ta có các bi u ñ :
Bi u ñ phân ph i t n s
ni
0
1
2
3
4
5
6
7
8
0 1 2 3 4 5 xi
Bi u ñ phân ph i t n su t
fi
20%
32%
24%
12%
8%
4%
0%
10%
20%
30%
40%
0 1 2 3 4 5 xi
Bi u ñ hình ch nh t (Nh t ñ ) là bi u ñ d ng c t, ñư c dùng cho
trư ng h p bi n liên t c, g m m t t p h p các hình ch nh t k nhau. M i hình
ch nh t có:
(a) Chi u r ng αi, bi u th b r ng c a m i l p, ñư c ñ t trên tr c hoành;
15. Chng 4 LÝ THUY T M U 107
(b) chi u cao t l v i t n s (hay t n su t) c a l p. Ngư i ta thư ng ch n
chi u cao b ng ni/αi (hay fi/ni). Như v y, n u là nh t ñ t n su t thì t ng di n
tích các hình ch nh t b ng 1.
V i t p d li u cho trong b ng 3, chúng ta có nh t ñ sau:
Nh t ñ t n su t kh i lư ng 50 s n ph m
(α1 = 2; α2 = α3 = α4 = α5 = 1; α6 = 3 )
fi
6%
16%
26%
18%
14%
4%
0%
10%
20%
30%
325 327 328 329 330 331 334 xi(g)
Bi u ñ phân ph i t n su t tích lu
fi tích lu
20%
52%
76%
88%
92%
100%
0%
20%
40%
60%
80%
100%
0 1 2 3 4 5 xi
8. TÍNH CÁC GIÁ TR TRUNG BÌNH VÀ PHƯƠNG SAI M U
Đ tìm hi u v các tham s c a m t t ng th X như kỳ v ng, phương sai…,
ngư i ta tính các giá tr tương ng, như các giá tr trung bình và phương sai m u,
trên m t m u c th (x1, x2, ..., xn).
16. Chng 4 LÝ THUY T M U 108
Đ ti n vi c tính toán, ngư i ta l p các b ng tính.
Thí d . Tính giá tr trung bình m u và giá tr phương sai m u c a m u có
giá tr cho trong b ng 2:
SĐĐH (xi) 0 1 2 3 4 5 T ng
S ngày ( ni ) 5 8 6 3 2 1 n = 25
L p b ng tính:
xi ni nixi 2
i in x
0
1
2
3
4
5
5
8
6
3
2
1
0
8
12
9
8
5
0
8
24
27
32
25
( Σ ) n = 25 42 116
Giá tr trung bình m u:
6
1
25
1
1,68i i
i
x n x
=
= =∑
Giá tr phương sai m u:
6
2 2 2 21
24
1
25 (1,3760)i i
i
s n x x
=
= − =
∑
Chú ý: Hi n nay, m t s máy tính b túi khá hi n ñ i như: Casio fx 500
MS, fx 500 ES, fx 570 MS, fx570 ES, …có ch c năng th ng kê. Ch c năng này
cho phép tính các giá tr trung bình và ñ l ch chu n m u r t ti n l i, không c n
ph i l p b ng như trên. B n ñ c có th tham kh o hư ng d n s d ng c a các máy
trên tài li u kèm theo máy.
17. Chng 4 LÝ THUY T M U 109
BÀI T P
4.1. M t t ng th g m 5 s 2, 3, 6, 8, 11. Xem t t c các m u có hoàn l i
kích thư c 2 ñư c thành l p t t ng th trên. Tìm
(a) kỳ v ng và ñ l ch chu n t ng th ;
(b) kỳ v ng và sai s chu n c a phân ph i m u c a trung bình (tính tr c
ti p t m u, không dùng Đ nh lý 3.3.2 )
4.2. Gi i bài t p 4.1. trong trư ng h p m u không hoàn lơ i.
4.3. Đ nghiên c u v s con trong m t gia ñình (SCTMGĐ) ñ a phương
A, ngư i ta ñi u tra s con c a m i gia ñình trong 30 gia ñình ñư c ch n ng u
nhiên ñ a phương A. K t qu ñư c ghi l i như sau:
0 2 5 3 7 4 3 3 1 4
2 4 3 1 6 1 0 2 4 1
1 2 3 2 0 5 5 1 3 2
(a) Hãy l p b ng phân ph i t n s và t n su t tích lu cho d li u trên m u.
(b) Trên m u v a nêu, tính SCTMGĐ trung bình ñ l ch chu n c a
SCTMGĐ.
4.4. Đ nghiên c u v thâm niên công tác (tính tròn năm) c a nhân viên
m t công ty l n, ngư i ta kh o sát thâm niên c a 100 nhân viên ñư c ch n ng u
nhiên trong công ty. K t qu như sau:
Thâm niên 5 - 7 8 - 10 11 - 13 14 - 16 17 -19
S nhân viên 8 21 36 25 10
Hãy tính giá tr trung bình m u và giá tr ñ l ch chu n m u.
4.5. Đ nghiên c u chi u cao c a thanh niên l a tu i t 18 ñ n 22 tu i
thành ph LX, ngư i ta ño trên m t m u g m m t s thanh niên ñư c ch n ng u
nhiên thành ph LX. K t qu như sau (ñơn v cm):
Chi u cao (cm) S thanh niên Chi u cao (cm) S thanh niên
[154, 158)
[158, 162)
[162, 166)
[166, 170)
10
16
29
37
[170, 174)
[174, 178)
[178, 182)
15
10
4
18. Chng 4 LÝ THUY T M U 110
Tính giá tr trung bình m u và giá tr ñ l ch chu n m u.
4.6. Gi s ñ tăng theo ph n trăm lương hàng năm c a m i công nhân viên
ch c trong công ty Alpha tuân theo lu t phân ph i chu n v i trung bình 12,2% và
ñ l ch chu n 3,6%. M t m u ng u nhiên g m 9 ph n t ñư c ch n t t ng th
y. Tìm xác su t ñ trung bình m u nh hơn 10%.
4.7. Đ nghiên c u tu i th c a m t lo i bóng ñèn, ngư i ta th p th 100
bóng ñèn lo i ñó và có s li u sau:
Tu i th (gi ) S bóng ñèn Tu i th S bóng ñèn
1030
[1030, 1050)
[1050, 1070)
[1070, 1090)
[1090, 1110)
2
3
8
13
25
[1110, 1130)
[1130, 1150)
[1150, 1170)
[1170, 1200]
1200
20
12
10
5
2
Sau khi c i ti n k thu t, ngư i ta th p l i 100 bóng và có k t qu sau:
Tu i th (gi ) 1150 1160 1170 1180 1190 1200
S bóng ñèn 10 15 20 30 15 10
Hãy so sánh giá tr trung bình và giá tr ñ l ch chu n c a hai m u trên.
4.8. Theo H i sinh viên thành ph LX thì có 60% sinh viên hi n ñang
theo h c ñ i h c mu n tìm vi c làm ngoài gi h c. M t m u g m 205 sinh viên
ñư c ch n ng u nhiên. Tìm xác su t ñ trong s ñó có hơn 135 sinh viên mu n
tìm vi c làm ngoài gi h c.
4.9. M t m u kích thư c n ñư c thành l p t t ng th tuân theo phân ph i
chu n v i kỳ v ng µ và ñ l ch chu n là 8. Hãy xác ñ nh n sao cho, v i xác su t
b ng 0,9524, trung bình m u n m trong kho ng t µ - 4 ñ n µ + 4 .
4.10. S li u th ng kê cho bi t có 40% các h gia ñình thành ph A có
thu nh p hàng năm n m trong kh ng t 1200 USD ñ n 2000 USD. V y, ph i ñi u
tra m t m u g m bao nhiêu h gia ñình ñ , v i xác su t 0,95, t l các gia ñình có
thu nh p trong kho ng nói trên, sai l ch so v i t l chung c a thành ph không
quá 4%?
4.11. M t lô hàng ñ t tiêu chu n xu t kh u n u t l ph ph m không quá
5%. N u ki m tra ng u nhiên 100 s n ph m thì v i t l ph ph m th c t t i ña là
bao nhiêu, chúng ta có th cho phép lô hàng ñư c xu t kh u mà kh năng không
m c sai l m là 95%?
4.12. Chi u cao (ñơn v cm) c a m t thanh niên thành ph l n A là BNN
tuân theo lu t phân ph i N(165; 100). Ngư i ta ño ng u nhiên chi u cao c a 100
thanh niên thành ph A (TP.A).
19. Chng 4 LÝ THUY T M U 111
(a) Xác su t ñ chi u cao trung bình c a 100 thanh niên ñó l ch so v i
chi u cao trung bình c a thanh niên TP.A không vư t quá 2cm là bao
nhiêu?
(b) N u mu n ch u cao trung bình ño ñư c sai l ch so v i chi u cao trung
bình c a t ng th không vư t quá 1cm v i xác su t không dư i 99% thì
chúng ta ph i ti n hành ño chi u cao c a bao nhiêu thanh niên?