CÁC MOMENT VÀ PHÂN PHỐI CHUẨN

BỘ Y TẾ
ĐẠI HỌC Y DƯỢC TP. HỒ CHÍ MINH
BÁO CÁO TỔNG KẾT
ĐỀ TÀI KHOA HỌC VÀ CÔNG NGHỆ
Thành Phố Hồ Chí Minh 3/2017
Chủ nhiệm đề tài: Ths. BÙI ANH TÚ
CÁC MOMENT VÀ PHÂN PHỐI CHUẨN

Abstract
This subject represents definitions and analysis of
Moments. In addition, we discuss about Bessel’s
correction and applications of kurtosis and skewness in
Normality test.
Tóm Tắt
Đề tài này trình bày khái niệm và làm rõ ý nghĩa
của các moment, bàn về phương pháp hiệu chỉnh
phương sai Bessel và ứng dụng của độ nhọn và độ đối
xứng trong kiểm định phân phối chuẩn.

BOÁ CUÏC TRÌNH BAØY
Phần 1.1: Giới thiệu các khái niệm về moment thống kê.
Phần 1.2: Moment trung tâm bậc 2 - Phương sai và phép hiệu chỉnh
phương sai Bessel.
Phần 1.3: Moment trung tâm bậc 3 - Hệ số bất đối xứng Skewness.
Phần 1.4: Moment trung tâm bậc 4 - Hệ số nhọn Kurtosis.
Phần 1.5: Kiểm định phân phối chuẩn, phép kiểm kết hợp
D’Agostino-Pearson.
Phần 1.6: Ví dụ thực hành.

1.1. Moment thống kê
Định nghĩa 1.1.1. Cho X là một biến ngẫu nhiên, k là một số tự
nhiên, thì đại lượng được gọi là moment bậc
k của X, và đại lượng được gọi là các
moment trung tâm bậc k của X.
 , 1,2,3,4k
E X k 
   , 1,2,3,4
k
E X E X k 
Thông thường các moment trung tâm của X thường được
ký hiệu là    , k 1,2,3,4.
k
k E X E X   
Theo định nghĩa, moment bậc 1 của X chính là giá trị kỳ
vọng của nó, moment trung tâm bậc 1 của X thì luôn bằng 0,
moment trung tâm bậc 2 của X chính là phương sai của nó, và
có thể được biểu diễn qua các moment của X theo công thức:
        
2 22
.E X E X E X E X  
Tương tự, các moment trung tâm bậc cao hơn của X cũng
có thể khai triển dưới dạng đa thức của các moment của X.

1.2. Moment trung tâm bậc 2 – Phương sai
Giả sử số số liệu trong toàn bộ dân số là Np, khi đó phương
sai của dân số là
 22
1
1
,
pN
i
ip
x
N
 

  với
1
1
.
pN
i
ip
x
N


 
Trung bình mẫu và phương sai mẫu (cỡ mẫu n):
1
1
,
n
i
i
x x
n 
    
2 2
1
1
.
n
i
i
S x x
n 
 
Phương sai hiệu chỉnh :  
22
1
1
.
1
n
i
i
S x x
n 
 


Sự điều chỉnh từ thành được gọi là phép hiệu
chỉnh Bessel. Lý do ở đây là vì
1
n
1
1n 

 2
2
E S  và  2 2
.E S 

1.3. Moment trung tâm bậc 3 - Hệ số bất đối xứng skewness
Định nghĩa 1.3.1. Cho X là một biến ngẫu nhiên. Khi đó,
hệ số skewness của X là 3
1 3
2
2
.




Hệ số skewness đo lường mức độ đối xứng của một
phân bố xác suất. Hệ số skewness có thể âm (negative skew)
hoặc dương (positive skew) hoặc bằng 0. Tuy nhiên tất cả
các phân phối đối xứng đều có .1 0 

Tính Toán
Để ước tính hệ số skewness của toàn bộ dân số, ta dùng hệ
số skewness của mẫu.
Cho là một mẫu ngẫu nhiên từ dân số. Khi đó
được dùng để ước tính các
moment Hệ số skewness mẫu là
1 2, ,..., nx x x
 
1
1
, 2,3,4
n
k
k i
i
m x x k
n 
  
, 2,3,4.k k  3
1 3
2
2
.
m
g
m

Tuy nhiên, nếu dùng g1 để ước tính cho hệ số skewness
của toàn bộ dân số thì đây là một ước lượng lệch. Cramer
(1957) sử dụng hệ số skewness mẫu như sau và nó là một ước
lượng không lệch dưới điều kiện chuẩn
 
1 1
1
.
2
n n
G g
n



(1)

Chiều cao ( inches) X n
59,5 – 62,5 61 5
62,5 – 65,5 64 18
65,5 – 68,5 67 42
68,5 – 71,5 70 27
71,5 – 74,5 73 8
Ví dụ: Chiều cao của nam sinh

Ta có: 3
1 3
2
2
1,0815.
m
g
m
  
Suy ra, hệ số skewness mẫu là
 
1 1
1
0,1098.
2
n n
G g
n

  

Hệ số skewness âm và gần 0 điều này chứng tỏ dữ liệu về
chiều cao của sinh viên nam hơi lệch xiên về bên trái.
Để biết khi nào hệ số skewness của mẫu là quá lớn, chúng ta
cần sai số chuẩn (SES) của nó để tiến hành kiểm định thống kê
Công thức trên được Joanes và Gill (1998) đưa ra dưới điều
kiện phân phối chuẩn.
 
   
6 1
SES .
2 1 3
n n
n n n


  
(2)

1.4. Moment trung tâm bậc 4 – Hệ số nhọn Kurtosis
4
2 2
2
3.



 
Định nghĩa 1.4.1. Cho X là một biến ngẫu nhiên. Khi đó, hệ
số Kurtosis của X là
Kurtosis của một phân bố chuẩn bằng 0. Khi một phân bố
xác suất có kurtosis dương (phân bố như vậy gọi là phân bố
leptokurtic hay nhọn vượt chuẩn) thì có nghĩa là nó “nhọn”
hơn phân bố chuẩn có cùng độ lệch chuẩn, còn khi kurtosis âm
(phân bố như vậy gọi là phân bố platykurtic) thì có nghĩa là nó
“bẹt” hơn phân bố chuẩn có cùng độ lệch chuẩn. Nếu kurtosis
bằng 0 thì phân bố được gọi là mesokurtic.

Cramer (1957) sử dụng hệ số kurtosis mẫu như sau và nó
là một ước lượng không lệch dưới điều kiện chuẩn.
Cho là một mẫu ngẫu nhiên từ dân số. Hệ số
kurtosis của mẫu là
1 2, ,..., nx x x
4
2 2
2
3.
m
g
m
 
Tính toán
  
  2 2
1
1 6
2 3
n
G n g
n n

  
  (3)

4
2 2
2
3 0,25824.
m
g
m
   
  
  2 2
1
1 6 0,20915.
2 3
n
G n g
n n

    
 
Ví dụ: Với dữ liệu về chiều cao của nam sinh viên ở trên, ta có
Do đó, hệ số kurtosis mẫu là
Suy ra mẫu có độ nhọn dưới chuẩn một ít, nghĩa là đỉnh của
nó thấp hơn một ít so với đỉnh của phân bố chuẩn có cùng độ
lệch chuẩn.
Dưới điều kiện chuẩn, Joanes và Gill (1998) đưa ra công
thức cho sai số chuẩn (SEK) của G2 như sau:
  
2
1
SEK 2.SES. .
3 5
n
n n


 
(4)

1.5. Kiểm định phân phối chuẩn
Phép kiểm được D’Agostino và Stephens (1986) đưa ra, có
tên là phép kiểm kết hợp D’Agostino-Pearson. Phép kiểm
định này kết hợp cả hai hệ số skewness và kurtosis để tìm ra
giá trị p. Với giả thiết là dữ liệu phù hợp với phân phối chuẩn,
khi đó:
,
 2 2 2
~ 2 ,s kDP Z Z   (5)
trong đó: và1
SES
s
G
Z  2
.
SEK
k
G
Z 
Phép kiểm được khuyến cáo không dùng với cỡ mẫu dưới 20.

Ví dụ: Với mẫu chiều cao 100 nam sinh viên ở trên. Ta có
0,455
0,437
s
k
Z
Z
 

 
Do đó: 2 2
0,398.s kDP Z Z  
Suy ra 0,81955 0,05.p  
Vì không đủ cơ sở bác bỏ giả thiết không, nên ta chấp nhận
rằng mẫu chiều cao nam sinh viên ở trên phù hợp với phân
phối chuẩn.

1.6. Ví dụ thực hành
Kết quả đường huyết (mg%) của 100 người lớn khỏe mạnh
97 100 94 106 103 108 97 92 113 112
88 108 95 101 124 95 119 99 84 93
82 114 88 85 79 90 104 104 109 98
94 89 102 98 93 102 102 102 110 109
94 114 106 109 103 90 93 83 104 106
100 111 101 88 80 91 103 91 91 119
97 116 118 117 95 92 123 81 102 95
106 106 95 103 96 89 94 122 110 104
84 108 104 98 98 97 105 109 98 86
105 97 87 111 107 115 96 94 79 107
Mẫu xét nghiệm đường huyết 100 người lớn khỏe mạnh có
kết quả như sau:

Biểu đồ
Nhìn vào biểu đồ trên, ta thấy mẫu đường huyết của 100
người lớn khỏe mạnh có vẻ như tuân theo quy luật của phân
phối chuẩn. Tiếp theo, ta sẽ sử dụng phép kiểm D’Agostino-
Pearson để kiểm định nhận định trên.

Với SPSS, ta được n Valid 100
Missing 0
Skewness .103
Std. Error of Skewness .241
Kurtosis -.412
Std. Error of Kurtosis .478
Sử dụng phép kiểm D’Agostino-Pearson, ta có
2 2
0,427
0,925.
0,862
s
s k
k
Z
DP Z Z
Z

   
 
Suy ra 0,63 0,05.p  
.
Vì không đủ cơ sở bác bỏ giả thiết không, nên ta chấp nhận
rằng mẫu đường huyết máu ở trên phù hợp với phân phối chuẩn.

TÀI LIỆU THAM KHẢO
[1] Cramer, H. 1957. Mathematical methods of statistic. Princeton
University Press, Seventh Printing.
[2] Cramer, Duncan. 1997. Basic Statistics for Social Research.
Routledge.
[3] D’Agostino, Ralph B., and Michael A. Stephens. 1986. Goodness-of-
Fit Techniques. Dekker.
[4] Bulmer, M. G. 1979. Principles of Statistics. Dover.
[5] Stan Brown. 2016. Measures of Shape: Skewness and Kurtosis.
BrownMath.com.
[6] D. N. Joanes and C. A. Gill. 1998. Comparing Measures of Sample
Skewness and Kurtosis. The Statistician, Vol. 47, No. 1.
[7] Spiegel, Murray R., and Larry J. Stephens. 1999. Theory and
Problems of Statistics. 3d ed. McGraw-Hill.
[8] Stephen So, PhD, MIEEE. 2008. Why is the sample variance a
biased estimator. Griffith University, Brisbane, QLD, Australia, 4111.
[9] Karl G. Jöreskog. 1999. Formulas for Skewness and Kurtosis.
Papers published on internet.

XIN CHAÂN THAØNH CAÛM ÔN
QUYÙ THAØY COÂ LAÉNG NGHE
BUOÅI TRÌNH BAØY CUÛA TOÂI

CÁC MOMENT VÀ PHÂN PHỐI CHUẨN

Recommended

Recommended

More Related Content

What's hot

What's hot (20)

Similar to CÁC MOMENT VÀ PHÂN PHỐI CHUẨN

Similar to CÁC MOMENT VÀ PHÂN PHỐI CHUẨN (20)

More from SoM

More from SoM (20)

Recently uploaded

Recently uploaded (20)

CÁC MOMENT VÀ PHÂN PHỐI CHUẨN