SlideShare a Scribd company logo
1 of 48
Download to read offline
5
Chương I
XỬ LÝ DỮ LIỆU TRONG CHĂN NUÔI THÚ Y
1. ỨNG DỤNG MINITAB TRONG XỬ LÝ SỐ LIỆU
Minitab 14 for Windows XP ñược sử dụng ñể minh hoạ cho các bài tập trong phần
giáo trình này. Nếu bạn ñọc sử dụng các phiên bản khác của Minitab có thể sẽ không ñược
hỗ trợ một số các công cụ và giao diện sẽ khác so với giáo trình này.
1.1. Khởi ñộng Minitab
Nếu cài ñặt Minitab 14 for Windows XP theo mặc ñịnh ta có thể khởi ñộng phần mềm
bằng cách
1) Chọn biểu tượng Minitab trên Desktop của màn hình hoặc
2) Theo ñường dẫn Stat > Progam > MINITAB 14 > MINITAB 14
3) C:Progam FilesMINITAB 14Mtb14.exe
Giao diện phần mềm Minitab 14 for Windows XP gồm một số thành phần chính: 1)
Menu Bar, 2) Standard toolbar, 3) Project Manager Toolbar, 4) Worksheet Toolbar, 5)
Title, 6) Session Window, 7) Data Window 8) Project Manager Window và 8) Status bar.
Menu Bar Standard Toolbar Project Manager Toolbar
Title
Session
Window
Data
Window
(Worksheet
Windows)
Status Bar
Worksheet Toolbar
Project Manager Windows
6
1.2. Nhật ñồ và thống kê
a. Tóm tắt dữ liệu ñối với biến ñịnh lượng
Ví dụ 1.1: Khối lượng (gam) của 16 chuột cái tại thời ñiểm cai sữa như sau:
54,1 49,8 24,0 46,0 44,1 34,0 52,6 54,4
56,1 52,0 51,9 54,0 58,0 39,0 32,7 58,5
ðể tính các tham số thống kê mô tả
Số liệu ñược nhập vào vào cột trong Windows Worksheet
Thay thế dấu phẩy (,) bằng dấu chấm
(.) trong phần thập phân. Ô số liệu
khuyết ñược thay thế bằng dấu sao
(*), không ñược ñể trống.
Cột số liệu phải ở dưới dạng số.
ðối với một chỉ tiêu nghiên cứu, số
liệu ñược nhập dưới dạng cột.
Tên cột số liệu luôn nằm ở trên hàng
thứ 1. ðặt tên cột ngắn gọn, không
nên dùng các ký tự ñặc biệt (:, /…)
hoặc các ký tự tiếng Việt (ô, ă…).
Trong cùng một worksheet không ñặt
tên cột trùng nhau. Phần mềm Minitab
không phân biệt ñược các ký tự viết
hoa và viết thường (ví dụ: MINITAB
= Minitab = minitab).
Chọn Stat 


 Basic Statistics 


 Display Descriptive Statistics
Phần ô bên trái hộp thoại hiển thị cột
(C1) và tên của cột số liệu (P)
Chọn P và nhấn Select ñể hiển thị cột
cần tính các tham số thống kê mô tả
vào ô Variables.
Chọn OK ñể hiển thị kết quả.
Kết quả thu ñược từ Minitab như sau
Descriptive Statistics: P
Variable N N* Mean SE Mean StDev Minimum Q1 Median Q3 Maximum
P 16 0 47.58 2.54 10.16 24.00 40.28 51.95 54.33 58.50
7
Minitab cho kết quả theo mặc ñịnh. Có thể sử dụng một trong các tùy chọn (option)
sau ñây ñể cho ra kết quả phù hợp
 Chọn Statistics…có thể lựa chọn các tham số sau ñây
Một số thuật ngữ trong options Minitab của thống kê mô tả
Minitab Tiếng Việt Minitab Tiếng Việt
Mean Trung bình Trimmed mean Trung bình hiệu chỉnh
SE of mean Sai số tiêu chuẩn Sum Tổng số
Standard deviation ðộ lệch chuẩn Minimum Giá trị bé nhất
Variance Phương sai Maximum Giá trị lớn nhất
Coefficient of variation Hệ số biến ñộng Range Khoảng biến ñộng
First quartile Tứ vị thứ nhất Sum of squares Tổng bình phương
Median Trung vị Skewness ðộ lệch
Third quartile Tứ vị thứ 3 Kurtosis ðộ nhọn
Interquartile Tứ vị thứ 2 MSSD
N nonmissing N không khuyết Cumulative N N cộng gộp
N missing N khuyết Percent Phần trăm
N total N tổng số Cumulative percent Phần trăm cộng gộp
Chọn Graphs…ñể hiển các loại thị ñồ thị sau ñây:
Histogam of data tổ chức ñồ
Histogam of data, with normal curve tổ chức ñồ với ñường cong chuẩn
Individual value plot vẽ từng giá trị
Boxplot of data ñồ thị hộp
Chọn OK ñể có ñược ñồ thị
Ví dụ chọn Boxplot of data ñể có ñược ñồ thị hộp dưới ñây
8
 Khai báo vào By variables (Optional) ñể tính các tham số thống kê theo phân loại nhóm.
Xét Ví dụ 1.1, giả sử rằng 8 chuột cái ñầu
tiên sinh ra ở lứa thứ nhất và 8 chuột tiếp
theo sinh ra ở lứa thứ 2. Ta có thể bố trí cấu
trúc số liệu thành 2 cột, cột C1 (P) và cột C2
(LUA)
Kết quả từ Minitab
Descriptive Statistics: P
Variable LUA N N* Mean SE Mean StDev Minimum Q1 Median Q3
P 1 8 0 44.88 3.82 10.79 24.00 36.53 47.90 53.73
2 8 0 50.28 3.32 9.39 32.70 42.23 53.00 57.53
b. Tóm tắt dữ liệu ñối với biến ñịnh tính
ðối với biến ñịnh tính số liệu thô thu thập ñược từ thí nghiệm có thể ñược trình bày
theo một trong 2 cách sau ñây:
9
Ví dụ 1.2: Số bò sữa ở ba trại A, B, C lần lượt là 106, 132 và 122 con. Chọn ngẫu
nhiên và kiểm tra bệnh viêm nội mạc tử cung ở 3 trại, kết quả như sau:
Cách 1:
Trại A A A A A A A A A A A A A A A A A
Bò
số
1 2 3 4 5 6 7 8 9 10 1 12 13 14 15 16 17
Kết
quả
+ - - - + + + - - - + - - - - - +
Trại B B B B B B B B B B B B B B B B B B B B B B
Bò
số
1 2 3 4 5 6 7 8 9 10 1 12 13 14 15 16 17 18 19 20 21 22
Kết
quả
- - + - - - - - + + - - - - - + - + - + - -
Trại C C C C C C C C C C C C C C C C C C C C
Bò
số
1 2 3 4 5 6 7 8 9 10 1 12 13 14 15 16 17 18 19 20
Kết
quả
+ + - - - - + - - - + - + - - - - + + +
Cách 2:
Trại Viêm nội mạc tử cung Tổng số
Có Không
A 6 11 17
B 6 16 22
C 8 12 20
Số liệu ñược nhập vào cột trong Windows Worksheet (với cách 1)
Nhập dữ liệu vào 2 cột, Trại vào cột C1
(TRAI) và cột Kết quả xét nghiệm vào
cột C2 (KETQUA).
Lưu ý: Sau khi nhập thông tin vào cột
C1 và C2 ký hiệu ở thay ñổi tương ứng
C1-T và C2-T. Minitab thông báo các
thông tin trong cột không phải dưới
dạng số mà dưới dạng ký tự (Text)
Với số liệu ở dạng thô (cách 1) có thể
tạo thành bảng tóm tắt như ở cách 2
bằng các lệnh sau
Stat 


 Tables 


 Cross Tabulation
and Chi-Square...
Khai báo vào ô For rows và For
columns
10
Options Display hiển thị:
Count
tần số ñối với từng trường hợp
Row percents
tỷ lệ (phần trăm) theo hàng
Column percents
tỷ lệ (phần trăm) theo cột
Total percents
tỷ lệ (phần trăm) theo hàng/cột tổng số
Chọn OK ñể có kết quả
Tabulated statistics: TRAI; KETQUA
Rows: TRAI Columns: KETQUA
- + All
A 11 6 17
B 16 6 22
C 12 8 20
All 39 20 59
Cell Contents: Count
ðối với biến ñịnh tính có thể mô tả bằng biểu ñồ thanh (Bar Chart), biểu ñồ bánh (Pie Chart).
Graph 


 Bar Chart…Counts of unique values
Chọn OK Chọn Multiple Graphs…
Chọn OK ñể có biểu ñồ thanh Thực hiện tương tự ñể có biểu ñồ bánh
11
Số liệu ñược nhập vào cột trong Windows Worksheet (với cách 2)
Nhập dữ liệu vào 3 cột, Trại vào cột
C1 (TRAI), cột Kết quả xét nghiệm
vào cột C2 (KETQUA) và Tần suất
vào cột C3 (TANSUAT).
dạng ký tự (Text)
Với số liệu ở dạng thô (cách 1) có thể
tạo thành bảng tóm tắt như ở cách 2
bằng các lệnh sau
Stat 


 Tables 


 Cross Tabulation
and Chi-Square...
Khai báo vào ô For rows, For
columns và Frequencies are in.
Chọn Counts và Row percents trong
Display ñể có kết quả
Tabulated statistics: TRAI; KETQUA
Using frequencies in TANSUAT
Rows: TRAI Columns: KETQUA
- + All
A 11 6 17
64.71 35.29 100.00
B 16 6 22
72.73 27.27 100.00
C 12 8 20
60.00 40.00 100.00
All 39 20 59
66.10 33.90 100.00
Cell Contents: Count
% of Row
Biểu ñồ trong cách nhập số liệu thứ 2
hoàn toàn giống như ở cách nhập số
liệu, tuy nhiên cách khai báo trong hộp
thoại có một số ñiểm khác
Graph 


 Bar Chart…Values from
table
Khai báo vào ô Graph variables và
Categorical variables
12
1.3. Ước lượng và kiểm ñịnh giá trị trung bình
a. Kiểm ñịnh phân phối chuẩn
ðối với tất cả các phép thử dưới ñây biến ñịnh lượng ñều ñược giả thiết là số liệu thu
thập ñược (số liệu thô) tuân theo phân phối chuẩn. Nếu số liệu không tuân theo phân phối
chuẩn thì các phép thử sẽ không có hiệu lực. Trong trường hợp này cần biến ñổi số liệu về
phân phối chuẩn hoặc sử dụng kiểm ñịnh phi tham số.
Giả thiết của phép thử: H0: Số liệu có phân bố chuẩn và H1: Số liệu không có phân bố
chuẩn
Ví dụ 1.3: Tăng trọng trung bình (gam/ngày) của 36 lợn nuôi vỗ béo giống Landrace
ñược rút ngẫu nhiên từ một trại chăn nuôi. Số liệu thu ñược như sau:
577 596 594 612 600 584 618 627 588 601 606 559 615 607 608 591 565 586
621 623 598 602 581 631 570 595 603 605 616 574 578 600 596 619 636 589
Cán bộ kỹ thuật trại cho rằng tăng trọng trung bình của toàn ñàn lợn trong trại là
607gam/ngày. Theo anh chị kết luận ñó ñúng hay sai, vì sao? Biết rằng ñộ lệch chuẩn của
tính trạng này là 21,75 gam.
Nhập số liệu vào Worksheet Stat 


 Basic Statistics 


 Normality Test...
Chọn OK ñể có kết quả
13
Giá trị P-Value = 0,997 trong ñồ thị trên lớn hơn 0,05 (α), như vậy H0 ñược chấp nhận.
Kết luận số liệu tuân theo phân phối chuẩn.
b. Phép thử Z
Sử dụng phép thử Z ñể kiểm ñịnh một giá trị trung bình khi biết ñộ lệch chuẩn của
quần thể (σ
σ
σ
σ). Minitab sẽ tính khoảng tin cậy (CI 95%) và thực hiện phép kiểm ñịnh. ðối
với kiểm ñịnh 2 phía ta có giả thiết: H0: µ = µ0 với ñối thiết µ ≠ µ0; trong ñó µ là giá trị
trung bình của quần thể và µ0 là giá trị kiểm ñịnh.
Stat 


 Basic Statistics 


 1-sample Z...
Trong Samples in columns khai báo
cột số liệu (P).
Trong Standard deviation ñiền giá trị
21,75 (ñộ lệch chuẩn của quần thể σ
σ
σ
σ).
Trong Test mean ñiền giá trị 607 (giá
trị quần thể kiểm ñịnh µ0).
Chọn OK ñể có kết quả
One-Sample Z: P
Test of mu = 607 vs not = 607
The assumed standard deviation = 21.75
Variable N Mean StDev SE Mean 95% CI Z P
P 36 599.194 18.656 3.625 (592.090; 606.299) -2.15 0.031
Với xác suất của phép thử P = 0,031  0,05 (α), bác bỏ H0 và chấp nhận ñối thiết H1.
Kết luận: Tăng trọng của lợn Landrace ở trại nêu trên không bằng 607 gam/ ngày (P 
0,05). Khoảng tin cậy 95% là 592,090 – 606,299 gam/ ngày.
Lưu ý: Trong một số trường hợp, số
liệu ñã ñược tóm tắt (số liệu tinh) dưới
dạng các tham số thống kê mô tả. Như
ở ví dụ 1.3 ta có n = 36;
_
x = 599,194
gam. Vì vậy các giá trị này có thể sử
dụng ñể khai báo vào lựa chọn
Summarized data, các giá trị khác (σ
và µ) ñược khai báo tương tự ñể có kết
quả sau
One-Sample Z
Test of mu = 607 vs not = 607
The assumed standard deviation = 21.75
N Mean SE Mean 95% CI Z P
36 599.194 3.625 (592.089; 606.299) -2.15 0.031
14
c. Phép thử T
Trong trường hợp không biết ñộ lệch chuẩn của quần thể (σ), phép thử T ñược sử dụng
ñể kiểm ñịnh giá trị trung bình và ñộ lệch chuẩn của mẫu (s) ñược sử dụng thay ñộ lệch
chuẩn quần thể. Giả thiết của phép thử, cấu trúc số liệu tương tự như ở phép thử Z.
Stat 


 Basic Statistics 


 1-sample T...
Khai báo ñối với số liệu thô .. và ñối với số liệu tinh
Chọn OK ñể có kết quả
One-Sample T: P
Test of mu = 607 vs not = 607
Variable N Mean StDev SE Mean 95% CI T P
P 36 599.194 18.656 3.109 (592.882; 605.507) -2.51 0.017
Với P = 0,017 ta cũng có kết luận tương tự như ñối với khi sử phép thử Z.
1.4. Kiểm ñịnh 2 giá trị trung bình
Khi tiến hành thí nghiệm ñể so sánh sự khác nhau giữa 2 công thức thí nghiệm, có 2
trường hợp chọn mẫu có thể xảy ra: 1) Chọn mẫu ñộc lập và 2) chọn mẫu theo cặp (xem
2.4, tr.23, Giáo trình Thiết kế thí nghiệm 2007). Tuỳ thuộc vào cách chọn mẫu bố trí thí
nghiệm mà ta có thể sử dụng phép thử T hay T cặp cho phù hợp.
a. Kiểm ñịnh sự ñồng nhất của phương sai khi lấy mẫu ñộc lập
ðối với kiểm ñịnh 2 giá trị trung bình, ngoài giả thiết là số liệu tuân theo phân phối
chuẩn, còn vấn ñề thứ 2 là Hai phương sai có ñồng nhất hay không?
ðối với kiểm ñịnh hai phía ta có giả thiết H0: Hai phương sai ñồng nhất (σ²1 = σ²2) và
H1: Hai phương sai không ñồng nhất (σ²1 ≠ σ²2) . Khi chấp nhận giả thiết H0, phương sai
chung (σ2
)sẽ ñược sử dụng ñể tiến hành kiểm ñịnh trong phép thử T; ngược lại (bác bỏ H0)
thì phép thử T gần ñúng sẽ ñược thực hiện.
Ví dụ 1.4: ðể so sánh khối lượng của 2 giống bò, tiến hành chọn ngẫu nhiên và cân 12
con ñối với giống thứ nhất và 15 con ñối với giống thứ 2. Khối lượng (kg) thu ñược như sau:
Giống bò thứ nhất 187,6 180,3 198,6 190,7 196,3 203,8 190,2 201,0
194,7 221,1 186,7 203,1
Giống bò thứ hai 148,1 146,2 152,8 135,3 151,2 146,3 163,5 146,6
162,4 140,2 159,4 181,8 165,1 165,0 141,6
15
Theo anh (chị), khối lượng của 2 giống bò có sự sai khác không?
Cấu trúc số liệu của bài toán kiểm ñịnh 2 giá trị trung bình có thể ñược trình bày bằng
một trong 2 cách sau ñây:
Cách 1: Số liệu của 2 công thức thí
nghiệm ñược nhập vào một cột và cột thứ
2 ñể xác ñịnh giá trị của từng công thức
....
Cách 2: Số liệu ñược nhập vào 2 cột
riêng biệt theo từng công thức thí
nghiệm. Tên cột thể hiện giá trị trong
mỗi công thức
Lưu ý: Cấu trúc số liệu có thể nhập trong cùng một Worksheet hoặc 2 Worksheet riêng biệt.
Stat 


 Basic Statistics 


 2 Variances...
Cấu trúc số liệu cách 1 ... cách 2
Có thể sử dụng Summarized data khi số liệu ñã ñược tinh hoá. ðối với trường hợp
này cần khai báo dung lượng mẫu (Sample size) và phương sai (Variance) ñối với từng
công thức thí nghiệm tương ứng (First hoặc Second).
Chọn OK ñể có kết quả
16
Test for Equal Variances: KL versus GIONG
95% Bonferroni confidence intervals for standard deviations
GIONG N Lower StDev Upper
1 12 7.17875 10.6160 19.6238
2 15 8.63359 12.3014 20.8502
F-Test (normal distribution)
Test statistic = 0.74; p-value = 0.631
Levene's Test (any continuous distribution)
Test statistic = 0.46; p-value = 0.503
Xác suất p-value = 0,631  0,05 (α) vì vậy H0 ñược chấp nhận. Kết luận hai phương
sai ñồng nhất (P  0,05).
b. Phép thử T
Sử dụng phép thử T ñể kiểm ñịnh 2 giá trị trung bình khi không biết ñộ lệch chuẩn của
quần thể (σ
σ
σ
σ). Minitab sẽ tính khoảng tin cậy (CI 95%) sự chênh lệch giữa 2 giá trị trung
bình quần thể và thực hiện phép kiểm ñịnh. ðối với kiểm ñịnh 2 phía ta có giả thiết: H0: µ1
= µ2 với ñối thiết H1: µ1 ≠ µ2; trong ñó µ1 và µ2 là giá trị trung bình của quần thể thứ nhất
và thứ 2.
Stat 


 Basic Statistics 


 2-Sample T...
Có thể sử dụng Summarized data khi số liệu ñã ñược tinh hoá. ðối với trường hợp
này cần khai báo dung lượng mẫu (Sample size), giá trị trung bình (Mean) và ñộ lệch
chuẩn (Standard deviation) ñối với từng công thức thí nghiệm tương ứng (First hoặc
Second).
Chọn Assume equal variances nếu 2 phương sai ñồng nhất và ngược lại nếu 2 phương
sai không ñồng nhất (xem 4.1).
Chọn hiển thị ñồ thị trong Graphs... và mức tin cậy trong Options..., theo mặc ñịnh
Minitab tính khoảng tin cậy 95%.
Với cấu trúc số liệu cách 1 ... cách 2
Chọn OK ñể có kết quả
17
Two-Sample T-Test and CI: KL; GIONG
Two-sample T for KL
GIONG N Mean StDev SE Mean
1 12 196.2 10.6 3.1
2 15 153.7 12.3 3.2
Difference = mu (1) - mu (2)
Estimate for difference: 42.4750
95% CI for difference: (33.2301; 51.7199)
T-Test of difference = 0 (vs not =): T-Value = 9.46 P-Value = 0.000 DF = 25
Both use Pooled StDev = 11.5901
Xác suất p-value = 0,000  0,05 (α) vì vậy H0 bị bác bỏ và H1 ñược chấp nhận. Kết
luận rằng Khối lượng của hai giống bò có sự sai khác (P-value  0,05).
c. Phép thử T cặp ñôi
ðối với các thí nghiệm chọn mẫu theo cặp, ñiều kiện duy nhất của bài toán là kiểm tra
phân bố chuẩn của phần chênh lệch (d) số liệu giữa 2 công thức thí nghiệm.
Với kiểm ñịnh 2 phía ta có giả thiết H0: µd = 0 ñối thiết H1: µd ≠ 0 (µd là trung bình của
sự chênh lệch giữa 2 trung bình µ1 và µ2).
Ví dụ 1.5: Tăng trọng (pound) của 10 cặp bê sinh ñôi giống hệt nhau với hai chế ñộ
chăm sóc khác nhau (A và B). Bê trong từng cặp ñược bắt thăm ngẫu nhiên về một trong
hai cách chăm sóc.
Hãy kiểm ñịnh giả thiết H0: Tăng trọng trung bình ở hai cách chăm sóc như nhau, ñối
thiết H1: Tăng trọng trung bình ở hai cách chăm sóc khác nhau với mức ý nghĩa α = 0,05.
Số liệu thu ñược như sau:
Cặp sinh ñôi 1 2 3 4 5 6 7 8 9 10
Tăng trọng ở cách A 43 39 39 42 46 43 38 44 51 43
Tăng trọng ở cách B 37 35 34 41 39 37 35 40 48 36
Chênh lệch (d) 6 4 5 1 7 6 3 4 3 7
Nhập số liệu vào Worksheet
Lưu ý:
Số liệu ñược nhập vào Worksheet theo
một cách duy nhất vào 2 cột theo từng
cặp số liệu tương ứng.
Thứ tự các cặp số liệu không ñóng vai
trò quan trọng.
Sự thay ñổi vị trí trong 1 cặp có thể ñưa
ta ñến các kết luận thiếu chính xác.
18
Calc


Calculator... …chọn OK ñể có ñược phần chênh lệch
Tiến hành kiểm ñịnh phân bố chuẩn của phần chênh lệch D (xem 4.1)
Stat 


 Basic Statistics 


 Paired T..
Có thể sử dụng Summarized data
(differences) khi sử dụng các thông tin
của cột chênh lệch D ñể kiểm ñịnh.
ðối với trường hợp này cần khai báo
dung lượng mẫu (Sample size), giá trị
trung bình (Mean) và ñộ lệch chuẩn
(Standard deviation) của cột D.
Chọn hiển thị ñồ thị trong Graphs... và
mức tin cậy trong Options..., theo mạc
ñịnh Minitab tính khoảng tin cậy 95%.
Chọn OK ñể có kết quả
Paired T-Test and CI: A; B
Paired T for A - B
N Mean StDev SE Mean
A 10 42.8000 3.8239 1.2092
B 10 38.2000 4.1312 1.3064
Difference 10 4.60000 1.95505 0.61824
95% CI for mean difference: (3.20144; 5.99856)
T-Test of mean difference = 0 (vs not = 0): T-Value = 7.44 P-Value = 0.000
Xác suất p-value = 0,000  0,05 (α) vì vậy H0 bị bác bỏ và H1 ñược chấp nhận. Kết
luận rằng Tăng trọng trung bình ở hai cách chăm sóc có sự sai khác (P-value  0,05).
1.5. Phân tích phương sai
Phân tích phương sai (Analysis of Variance - ANOVA) là công cụ hữu ích ñể so sánh
nhiều giá trị trung bình. ðiều kiện của bài toán phân tích phương sai là 1) số liệu tuân theo
phân bố chuẩn và 2) phương sai ñồng nhất. Trong khuôn khổ giáo trình này chúng tôi chỉ
ñề cập ñến việc kiểm tra ñiều kiện của bài toán ñối với các mô hình thiết kế thí nghiệm ñơn
giản (Thí nghiệm một yếu tố hoàn toàn ngẫu nhiên).
ðể kiểm ñịnh 2 phía ta có giả thiết H0: µ1 = µ2 = ... = µa ñối thiết H1: µ1 ≠ µ2 ≠ ...≠ µa
(µ là trung bình của quần thể ở công thức thí nghiệm thứ 1, 2, ...a).
19
a. Thí nghiệm một yếu tố hoàn toàn ngẫu nhiên
Xét trường hợp ñơn giản nhất ñối với bài toán phân tích phương sai. Chỉ có một yếu tố
duy nhất trong thí nghiệm, các yếu tố phi thí nghiệm còn lại ñược coi là có tác ñộng như
nhau ñến ñối tượng thí nghiệm.
Ví dụ 1.6: Theo dõi tăng trọng của cá (kg)
trong thí nghiệm với 5 công thức nuôi (A,
B, C, D và E). Hãy cho biết tăng trọng của
cá ở các công thức nuôi. Nếu có sự khác
nhau thì tiến hành so sánh sự sai khác của
từng cặp giá trị trung bình.
A B C D E
0,95 0,43 0,70 1,00 0,90
0,85 0,45 0,90 0,95 1,00
0,85 0,40 0,75 0,90 0,95
0,90 0,42 0,70 0,90 0,95
Cấu trúc số liệu của bài toán kiểm ñịnh nhiều giá trị trung bình có thể ñược trình bày
bằng một trong 2 cách sau:
Cách 1: Số liệu của các công thức thí
nghiệm ñược nhập vào một cột và cột thứ
2 ñể xác ñịnh giá trị của từng công thức
Cách 2: Số liệu ñược nhập vào các cột
riêng biệt theo công thức thí nghiệm. Tên
cột thể hiện giá trị trong mỗi công thức
Kiểm tra ñiều kiện của bài toán (sự ñồng nhất của phương sai và phân phối chuẩn của
số liệu) sẽ ñược trình bày sau. Tiến hành so sánh các giá trị trung bình bằng phép phân tích
phương sai (ANOVA) ñối với cấu trúc số liệu cách 1 và cách 2.
Với các bài toán sử dụng phép phân tích phương sai ñể so sánh, cấu trúc số liệu cách 1
sẽ phù hợp và thuận lợi hơn trong quá trình xử lý số liệu. Trong các ví dụ tiếp theo chúng
tôi chỉ ñề cập ñến việc xử lý số liệu có cấu trúc cách 1.
Stat 


 ANOVA 


 One-Way... Stat 


 ANOVA 


 One-Way (Unstacked)...
20
Chọn OK ñể có kết quả
One-way ANOVA: KL versus TA
Source DF SS MS F P
TA 4 0.76325 0.19081 60.99 0.000
Error 15 0.04693 0.00313
Total 19 0.81018
S = 0.05593 R-Sq = 94.21% R-Sq(adj) = 92.66%
Individual 95% CIs For Mean Based on
Pooled StDev
Level N Mean StDev --+---------+---------+---------+-------
A 4 0.8875 0.0479 (--*--)
B 4 0.4250 0.0208 (--*--)
C 4 0.7625 0.0946 (--*--)
D 4 0.9375 0.0479 (--*--)
E 4 0.9500 0.0408 (-*--)
--+---------+---------+---------+-------
0.40 0.60 0.80 1.00
Pooled StDev = 0.0559
Xác suất p-value = 0,000  0,05 (α) vì vậy H0 bị bác bỏ và H1 ñược chấp nhận. Kết luận
rằng Tăng trọng trung bình của cá ở các công thức thức ăn có sự sai khác (P-value  0,05).
So sánh cặp khi bác bỏ giả thiết H0 chấp nhận giả thiết H1
Chọn Comparisons... trong hộp thoại One-Way Analysis of Variances
Các lựa chọn:
Tukey’s, family error rate: với sai số
của toàn bộ các cặp so sánh là 5%
Fisher’s, individual error rate: với sai
số của từng cặp so sánh là 5%
Dunnett’s, family error rate: so sánh
với nhóm ñối chứng, sai số của toàn bộ
các cặp so sánh là 5%
Hsu’s MCB, family error rate: với sai
số của toàn bộ các cặp so sánh là 5%
Chọn OK ñể có kết quả
Tukey 95% Simultaneous Confidence Intervals
All Pairwise Comparisons among Levels of TA
Individual confidence level = 99.25%
TA = A subtracted from:
TA Lower Center Upper --------+---------+---------+---------+-
B -0.58471 -0.46250 -0.34029 (---*--)
C -0.24721 -0.12500 -0.00279 (--*---)
D -0.07221 0.05000 0.17221 (--*---)
E -0.05971 0.06250 0.18471 (---*--)
--------+---------+---------+---------+-
-0.35 0.00 0.35 0.70
21
TA = B subtracted from:
TA Lower Center Upper --------+---------+---------+---------+-
C 0.21529 0.33750 0.45971 (---*--)
D 0.39029 0.51250 0.63471 (---*--)
E 0.40279 0.52500 0.64721 (--*--)
--------+---------+---------+---------+-
-0.35 0.00 0.35 0.70
TA = C subtracted from:
TA Lower Center Upper --------+---------+---------+---------+-
D 0.05279 0.17500 0.29721 (--*--)
E 0.06529 0.18750 0.30971 (--*---)
--------+---------+---------+---------+-
-0.35 0.00 0.35 0.70
TA = D subtracted from:
TA Lower Center Upper --------+---------+---------+---------+-
E -0.10971 0.01250 0.13471 (--*---)
--------+---------+---------+---------+-
-0.35 0.00 0.35 0.70
Ngoài kết quả phân tích phương sai như phần trên, Minitab ñã cung cấp kết quả so
sánh từng cặp. Sự sai khác có ý nghĩa (P-value  0,05) giữa các nghiệm thức dựa trên
khoảng tin cậy của từng cặp. Không có sự sai khác giữa các nghiệm thức nếu khoảng tin
cậy có chứa số 0 và ngược lại có sự sai khác nếu không chứa số 0. Ví dụ trong kết quả nêu
trên nếu so sánh giữa A-B ta có khoảng tin cậy (-0,58471; -0,34029) không chứa số không
nên kết luận có sự sai khác giữa A và B (P-value  0,05). Nếu so sánh A và D ta có khoảng
tin cậy (-0,07221; +17221) có chứa số 0 nên kết luận không có sự sai khác giữa A và D (P-
value  0,05). ðể có thể trình bày kết quả so sánh cặp ñôi bạn ñọc có thể tham khảo trang
57 chương 4 Giáo trình Thiết kế thí nghiêm (2007).
Kiểm tra sự ñồng nhất của phương sai với cấu trúc số liệu cách 1
Stat 


 ANOVA 


 Test for Equal Variances... Chọn OK ñể hiển thị ñồ thị và
..kết quả
Test for Equal Variances: KL versus TA
95% Bonferroni confidence intervals for standard deviations
TA N Lower StDev Upper
A 4 0.0231412 0.0478714 0.309607
B 4 0.0100628 0.0208167 0.134631
C 4 0.0457534 0.0946485 0.612137
22
D 4 0.0231412 0.0478714 0.309607
E 4 0.0197348 0.0408248 0.264034
Bartlett's Test (normal distribution)
Test statistic = 5.76; p-value = 0.218
Levene's Test (any continuous distribution)
Test statistic = 0.81; p-value = 0.539
Xác suất p-value = 0,218  0,05 (α) vì vậy H0 ñược chấp nhận. Kết luận rằng Các
Phương sai ñồng nhất (P-value  0,05).
Kiểm tra phân bố chuẩn với cấu trúc số liệu cách 1
Không tiến hành kiểm tra phân bố chuẩn của cột số thô (KL) mà tiến hành kiểm tra
phần sai số ngẫu nhiên ε
ε
ε
εij theo mô hình:
yi j = µ + ai + εi j (i = 1, a; j = 1, ri)
trong ñó yij = quan sát thứ j ở công thức i, µ= trung bình chung, ai = chênh lệch do ảnh
hưởng của công thức i và εij = sai số ngẫu nhiên; các εij ñộc lập, phân phối chuẩn N∼(0,σ2
).
Nếu phần sai số ngẫu nhiên tuân theo phân phối chuẩn thì số liệu bài toán cũng có phân
phối chuẩn.
Stat 


 ANOVA 


 One-Way... Chọn Store residuals và OK ñể có RESI1 (εij)
Tiến hành kiểm tra phân bố chuẩn của cột số liệu RESI1 (xem 3.1 Kiểm ñịnh phân
phối chuẩn). Phép kiểm ñịnh sẽ cho ta P-Value = 0,159  0,05 (α) nên có thể kết luận Số
liệu tuân theo phân phối chuẩn (P  0,05).
Lưu ý: Với cấu trúc số liệu cách 2, có thể kiểm ñịnh phân phối chuẩn của số liệu với
từng nghiệm thức riêng biệt. Kết quả kiểm ñịnh, xác suất ñể số liệu ở các nghiệm thức A,
B, C, D và E có phân phối chuẩn lần lượt là 0,255; 0,845; 0,092; 0,255 và 0,410. Ta cũng
có kết luận tương tự.
b. Thí nghiệm một yếu tố khối ngẫu nhiên ñầy ñủ
Xem xét một thí nghiệm mà ñối tượng thí nghiệm chịu tác ñộng ñồng thời của một yếu
tố chính (yếu tố thí nghịêm) và yếu tố phụ (khối).
Ví dụ 1.7: Nghiên cứu số lượng tế bào lymphô ở chuột (×1000 tế bào mm-3 máu)
ñược sử dụng 4 loại thuốc khác nhau (A, B, C và D; thuốc D là placebo) qua 5 lứa; số liệu
thu ñược trình bày ở bảng dưới. Cho biết ảnh hưởng của thuốc ñến tế bào lymphô?
23
Lứa 1 Lứa 2 Lứa 3 Lứa 4 Lứa 5
Thuốc A 7,1 6,1 6,9 5,6 6,4
Thuốc B 6,7 5,1 5,9 5,1 5,8
Thuốc C 7,1 5,8 6,2 5,0 6,2
Thuốc D 6,7 5,4 5,7 5,2 5,3
Cấu trúc số liệu
Số liệu của bài toàn này chỉ có một cấu
trúc duy nhất trong Minitab; bao gồm 3
cột:
1) cột Số lượng tế bào C1 (TEBAO),
2) cột Thuốc C2 (THUOC) và
3) cột Lứa C3 (LUA)
Trong thí nghiệm này ñối tượng thí
nghiệm bị tác ñộng bởi yếu tố chính
(yếu tố thí nghiệm) và yếu tố phụ (khối)
So sánh sự sai khác giữa các nghiệm thức bằng Phân tích phương sai (ANOVA)
Stat 


 ANOVA 


 Two-Way... Chọn Store residuals ñể có RESI1
Chọn OK ñể có kết quả
Two-way ANOVA: TEBAO versus THUOC; LUA
Source DF SS MS F P
THUOC 3 1.8455 0.61517 11.59 0.001
LUA 4 6.4030 1.60075 30.16 0.000
Error 12 0.6370 0.05308
Total 19 8.8855
S = 0.2304 R-Sq = 92.83% R-Sq(adj) = 88.65%
Xác suất của phép thử ñối với yếu tố Thuốc P = 0,001  0,05 (α), bác bỏ giả thiết H0
và chấp nhận ñối thiết H1. Kết luận thuốc có ảnh khác nhau lên tế bào lymphô của chuột (P
 0,05).
24
Ví dụ 1.8: Một thí nghiệm ñược tiến hành ñể
xác ñịnh ảnh hưởng của 3 công thức thức ăn
(A1, A2 và A3) ñến tăng trọng trung bình trên
ngày (gam / ngày) của bê ñực. Bê ñực ñược
cân và chia thành 4 khối dựa theo khối lượng
bắt ñầu thí nghiệm. Trong mỗi khối có 6 ñộng
vật thí nghiệm ñược chọn ra và ñược phân
ngẫu nhiên về với các nghiệm thức. Số liệu
thu thập sau khi kết thúc thí nghiệm như sau:
Khối
I II III IV
A1
826
806
864
834
795
810
850
845
A2
827
800
871
881
729
709
860
840
A3
753
773
801
821
736
740
820
835
Cấu trúc số liệu mô hình thí nghiệm trong
ví dụ 1.8 tương tự như ở ví dụ 1.7.
Trong ví dụ 1.8 có 2 ñơn vị thí nghiệm ở một
nghiệm thức và khối vì vậy ngoài tác ñộng
của khối và công thức thí nghiệm còn tồn tại
sự tương tác giữa khối và công thức thí
nghiệm.
Stat 


 ANOVA 


 General Linear Model... Chọn Comparisons ñể so sánh cặp ñôi
Chọn OK ñể có kết quả
General Linear Model: KL versus CT, KHOI
Factor Type Levels Values
CT fixed 3 A1, A2, A3
KHOI fixed 4 I, II, III, IV
Analysis of Variance for KL, using Adjusted SS for Tests
Source DF Seq SS Adj SS Adj MS F P
CT 2 8025.6 8025.6 4012.8 7.08 0.005
KHOI 3 33816.8 33816.8 11272.3 19.90 0.000
Error 18 10197.4 10197.4 566.5
Total 23 52039.8
S = 23.8017 R-Sq = 80.40% R-Sq(adj) = 74.96%
Xác suất của phép thử ñối với yếu tố Thức ăn P = 0,005 nên bác bỏ giả thiết H0 và
chấp nhận ñối thiết H1. Kết luận công thức ăn có ảnh ñến tăng trọng của bê. Xác suất của
phép thử ñối với yếu tố KHOI P = 0,000 nên bác bỏ giả thiết H0 và chấp nhận ñối thiết H1.
Kết luận KHOI có ảnh ñến tăng trọng của bê.
25
1.6. Tương quan và hồi quy
ðể tính hệ số tương quan và xây dựng phương trình hồi quy, số liệu luôn phải tạo
thành từng bộ và ñược nhập vào từng cột ñối từng chỉ tiêu.
Ví dụ 1.9: Tiến hành cân khối lượng (P), ño ñường kính lớn (D) và ñường kính bé (d)
của 22 quả trứng gà. Số liệu thu ñược trình bày ở bảng dưới ñây.
P (gam) 66,80 60,10 71,20 61,60 61,20 59,00 67,90 59,00 51,50 62,60 64,20
D (mm) 58,37 54,95 60,58 56,73 57,36 53,26 57,07 58,17 52,28 55,62 56,82
d (mm) 45,12 44,35 45,56 44,34 43,57 44,86 46,27 42,82 41,91 44,95 44,79
P (gam) 71,20 54,20 54,50 69,10 55,90 66,00 68,00 62,00 56,70 67,00 53,80
D (mm) 61,15 54,24 54,99 60,99 54,41 58,19 59,93 56,80 55,66 58,49 52,44
d (mm) 46,00 42,58 42,32 44,85 42,62 45,69 45,50 44,20 42,41 45,56 43,38
Cấu trúc số liệu trong Worksheet Lưu ý:
ðể tính hệ số tương quan và xây dựng
phương trình hồi quy, số liệu luôn phải
tạo thành từng cặp và ñược nhập vào
từng cột ñối từng chỉ tiêu.
1) Cột Khối lượng C1 (KL)
2) Cột ðường kính lớn C2 (DL)
3) Cột ðường kính bé C3 (DB)
a. Hệ số tương quan
Giả thiết ñối với kiểm ñịnh hai phía H0: ρ = 0 và ñối thiết H1: ρ ≠ 0, trong ñó ρ là
tương quan giữa 2 biến nghiên cứu.
Stat 


 Basic Statistics 


 Correlation... Chọn OK ñể có kết quả
Correlations: KL; DL; DN
KL DL
DL 0.897
0.000
DN 0.905 0.648
0.000 0.001
Cell Contents: Pearson correlation
P-Value
Chọn Display p-values ñể hiển thị xác
suất ñối với từng hệ số tương quan.
Chọn Store matrix (display nothing) ñể
nhớ ma trận hệ số tương quan vào bộ nhớ
ñệm và không hiển thị kết quả ra màn hình.
Hệ số tương quan giữa khối lượng và ñường kính lớn là 0,897; khối lượng và ñường
kính bé là 0,905; ñường kính lớn và ñường kính bé là 0,648. Xác suất ñối với từng hệ số
26
tương quan (p-values) ñều bé hơn 0,05 (α) vì vậy kết luận mối quan hệ giữa các chỉ tiêu
này khác 0.
b. Phương trình hồi quy tuyến tính
Có thể xây dựng hồi quy ñơn biến y = a + bx hoặc ña biến y = a + b1x1 + b2x2
+...+bnxn. Có thể xây dựng phương trình hồi tuyến tính ñơn biến quy ước tính khối lượng
trứng thông qua ñường kính lớn/ñường kính bé hoặc ña biến thông qua ñường kính lớn và
ñường kính bé.
Stat 


 Regression 


 Regression...
Response: Khai báo cột C1 (KL) biến
phụ thuộc.
Predictors: Khai báo cột C2 (DL) biến
ñộc lập.
Chọn OK ñể có kết quả
Regression Analysis: KL versus DL
The regression equation is
KL = - 53.7 + 2.04 DL
Predictor Coef SE Coef T P
Constant -53.67 12.78 -4.20 0.000
DL 2.0379 0.2250 9.06 0.000
S = 2.69651 R-Sq = 80.4% R-Sq(adj) = 79.4%
Analysis of Variance
Source DF SS MS F P
Regression 1 596.60 596.60 82.05 0.000
Residual Error 20 145.42 7.27
Total 21 742.02
Unusual Observations
Obs DL KL Fit SE Fit Residual St Resid
7 57.1 67.900 62.629 0.579 5.271 2.00R
8 58.2 59.000 64.871 0.658 -5.871 -2.25R
R denotes an observation with a large standardized residual.
Phương trình hồi quy ước tính khối lượng (y) thông qua ñường kính lớn (x) y = -53,7 + 2,04x.
Bảng thứ nhất trong phần kết quả kiểm ñịnh các hệ số của phương trình hồi quy. Với xác
suất P = 0,000 ta có thể kết luận các hệ số trong phương trình hồi quy khác 0 (P  0,05).
Hệ số xác ñịnh của phương trình R² = 80,4%, hiệu chỉnh R² = 79,4%.
Các quan sát ngoại lai (Unusual Observations) trong mô hình và ví dụ nêu trên. Các
giá trị ở hàng thứ 7 và 8 trong ví dụ trên ñược coi là ngoại lai.
Stat 


 Regression 


 Regression...
27
Predictors: Khai báo cột C2 (DL) và
C3 (DN) biến ñộc lập.
ðể xây dựng phương trình hồi quy ña
biến, biến ñộc lập bao gồm từ 2 biến trở
lên.
Chọn OK ñể có kết quả.
Regression Analysis: KL versus DL; DN
The regression equation is
KL = - 117 + 1.21 DL + 2.48 DN
Predictor Coef SE Coef T P
Constant -116.555 5.472 -21.30 0.000
DL 1.21473 0.08323 14.60 0.000
DN 2.4764 0.1623 15.26 0.000
S = 0.759757 R-Sq = 98.5% R-Sq(adj) = 98.4%
Analysis of Variance
Source DF SS MS F P
Regression 2 731.05 365.53 633.24 0.000
Residual Error 19 10.97 0.58
Total 21 742.02
Source DF Seq SS
DL 1 596.60
Ta có kết quả hoàn toàn tương tự như việc xây dựng phương trình hồi quy ñơn giản.
2. ỨNG DỤNG EXCEL TRONG XỬ LÝ SỐ LIỆU
Phần mềm Excel cho phép phân tích dữ liệu nói chung, dữ liệu dữ liệu trong chăn
nuôi, thú y nói riêng, một cách khá hiệu quả thông qua việc sử dụng menu Tools Data
Analysis (nếu không có mục này thì chọn Tools Add-in  Analysis ToolPak ñể cài ñặt
thêm). Sau ñây là một số công cụ xử lý số liệu thống kê mà Excel cung cấp.
2.1. Thống kê mô tả và tổ chức ñồ
2.1.1. Thống kê mô tả
Thống kê mô tả cho phép tính các số ñặc trưng mẫu/ các giá trị thống kê mẫu như
trung bình, ñộ lệch chuẩn, sai số chuẩn, trung vị, mode... Số liệu tính toán ñược bố trí theo
cột hoặc theo dòng.
a. Các bước thực hiện trong Excel
Chọn ToolsData AnalysisDescriptive Statistics, khai báo các mục sau trong hộp thoại:
- Input range: miền dữ liệu kể cả nhãn.
- Grouped by: Column (số liệu theo cột, Row số liệu theo hàng).
- Labels in first row: ðánh dấu √ vào ô này nếu có nhãn ở dòng ñầu.
28
- Confidence level for mean: 95% (ñộ tin cậy 95%).
- K-th largest: 1 (1 Số lớn nhất, 2 số lớn nhì ).
- K-th smallest: 1 (1 Số nhỏ nhất, 2 số nhỏ nhì ).
- Output range: miền ra.
- Summary Statistics: ðánh dấu √ nếu muốn hiện các thống kê cơ bản.
- OK.
Ví dụ 1.1: Khối lượng (gam) của 16 chuột cái tại thời ñiểm cai sữa:
54.1 49.8 24 46 44.1 34 52.6 54.4 56.1 52 51.9 54 58 39 32.7 58.5
Chọn ToolsData AnalysisDescriptive Statistics, sau ñó khai báo hộp thoại (xem
hình sau)
Kết quả thu ñược cho trong hình sau:
b. Phân tích các kết quả thu ñược
Một số nhận xét trên các thống kê thu ñược như sau:
- Mean cho ta giá trị trung bình của dãy số.
- Median cho trung vị (giá trị ñiểm giữa của dãy số).
Nếu 2 giá trị Mean và Median xấp xỉ nhau ta thì số liệu là cân ñối.
- Phương sai mẫu hay ñộ lệch chuẩn mẫu cho ta biết ñộ phân tán của số liệu quanh giá
trị trung bình, nếu các giá trị này càng nhỏ chứng tỏ số liệu càng tập trung.
29
- Kurtosis ñánh giá ñường mật ñộ phân phối của dãy số liệu có nhọn hơn hay tù hơn
ñường mật ñộ chuẩn tắc. Nếu trong khoảng từ -2 ñến 2 thì có thể coi ñộ nhọn xấp xỉ ñộ
nhọn chuẩn.
- Skewness ñánh giá ñường phân phối nghiêng trái hay nghiêng phải. Nếu trong
khoảng từ -2 ñến 2 thì có thể coi số liệu cân ñối xấp xỉ phân phối chuẩn .
- Confidence Level ñược hiểu là nửa ñộ dài khoảng tin cậy. Giả sử Confidence Level là m
thì khoảng tin cậy của trung bình tổng thể là: (Mean- m , Mean+m). Trong ví dụ 1.1 ta có khoảng
tin cậy 95% của “dài bông” là:(47.575 - 5.415 , 47.575 - 5.415), tức là (42.160, 52.990).
2.1.2. Tổ chức ñồ
Tần số xuất hiện của số liệu trong các khoảng cách ñều nhau cho phép phác hoạ biểu
ñồ tần số, còn gọi là tổ chức ñồ. ðể vẽ tổ chức ñồ cần phải tiến hành phân tổ số liệu.
a. Tạo miền phân tổ
ðể tiến hành phân tổ số liệu (tạo Bin), cần thực hiện các bước sau:
- Dùng các hàm Min, Max ñể xác ñịnh giá trị nhỏ nhất và giá trị lớn nhất.Tính biên ñộ
= Max - Min. Dựa vào ñó ta có thể ñịnh số tổ cần chia. Số tổ có thể theo công thức
k=6*log(n), n là số số liệu. Từ ñó ta ñịnh ra khoảng cách tổ là h = biên ñộ/k.
ðịnh ra giá trị cận dưới và giá trị cận trên của miền phân tổ, thường thì lấy giá trị cận
dưới nhỏ hơn Min, giá trị cận trên lớn hơn Max.
- Ghi giá trị cận dưới vào ô ñầu của miền phân tổ. Con trỏ tại ô này.
- Chọn Edit  Fill  Series ñể khai báo các mục:
+ Trong mục Series in chọn Columns (dữ liệu theo cột).
+ Trong mục Type chọn Linear (dữ liệu tăng theo cấp số cộng).
+ Trong Step value: nhập giá trị bước tăng (h).
+ Trong Stop value: nhập giá trị cuối (giá trị cận trên).
+ OK.
Ví dụ 1.2: Dựa trên 30 số liệu về chiều dài cá ta tạo miền phân tổ (Bin) như trên hình
sau, với miền phân tổ từ ô D2 tới ô D12 (kể cả nhãn), giá trị cận dưới là 10, cận trên là 55,
giá trị bước tăng 5.
Hình 1.1. Tạo miền Bin cho các số liệu về chiều dài cá
30
b. Vẽ tổ chức ñồ
Chọn Tools Data Analysis Histogam ñể khai báo các mục:
- Input range: miền dữ liệu.
- Input Bin: miền phân tổ.
- Labels: nhãn ở dòng ñầu nếu có.
- Output range: Miền kết quả.
- Pareto: tần số sắp xếp giảm dần.
- Cumulative Percentage: Tần suất cộng dồn %.
- Chart output: Biểu ñồ.
- OK.
Trong ví dụ 1.2 chọn Tools Data Analysis Histogam và khai báo như trong hình sau:
Hình 1.2. Các khai báo ñể vẽ tổ chức ñồ
c. Kết quả vẽ tổ chức ñồ
Hình 1.3. Tổ chức ñồ
31
d. Phân tích kết quả
- Tần số số liệu rơi vào từng khoảng ñược ghi ở cận trên của khoảng (Chẳng hạn, có 2
số liệu thuộc vào khoảng (10,15], vì vậy số 2 ñược ghi tương ứng với số 15 là cận trên).
- Nhìn vào tần số ta có thể thấy trong khoảng nào số liệu xuất hiện nhiều nhất.
- Nhìn vào hình dạng của tổ chức ñồ còn cho biết: dãy số liệu khảo sát ñược về chiều
dài của cá có thể coi là tuân theo luật chuẩn.
2.2. So sánh và kiểm ñịnh
Bài toán ñặt ra là cấn so sánh phương sai của 2 biến hoặc so sánh trung bình của 2
biến với nhau. ðể giải quyết vấn ñề này người ta ñưa về bài toán kiểm ñịnh giả thiết hai
phương sai bằng nhau hoặc bài toán kiểm ñịnh giả thiết hai trung bình bằng nhau.
2.2.1. Kiểm ñịnh sự bằng nhau của 2 phương sai
Bài toán ở ñây là thông qua hai mẫu ñể kiểm ñịnh giả thuyết H0: σ1
2
=σ2
2
(phương sai
của biến 1 bằng phương sai của biến 2) với ñối thuyết H1: σ1
2
≠σ2
2
ở mức ý nghĩa α .
a. Các bước thực hiện
Chọn Tools Data Analysis  F-Test Two Sample for Variance, sau ñó lần lượt trả lời:
- Variable 1 Range: miền dữ liệu của biến 1, kể cả dòng ñầu chứa nhãn.
- Variable 2 Range: Miền dữ liệu của biến thứ hai, kể cả dòng ñầu chứa nhãn.
- Labels: Chọn mục này nếu miền dữ liệu chọn cả dòng nhãn.
- Alpha: Mức ý nghĩa (thường là 0.05 hoặc 0.01).
- Output Range: Chọn miền trống ñể ñưa ra kết quả.
- OK: Kết thúc.
Ví dụ 1.3: Có 2 giống bò, tiến hành chọn ngẫu nhiên và cân 12 con ñối với giống thứ
nhất và 15 con ñối với giống thứ 2. Khối lượng (kg) thu ñược như sau:
Hãy kiểm ñịnh giả thiết: phương sai của 2 dãy số trên là như nhau.
Chọn Tools Data Analysis  F-Test Two Sample for Variance và khai báo như sau:
So sánh khối lượng của 2 giống bò
Giống 1 188 180 199 191 196 204 190 201 195 221 187 203
Giống 2 148 146 153 135 151 146 164 147 162 140 159 182 165 165 142
32
Kết quả thu ñược như sau:
F-Test Two-Sample for Variances
Giống 1 Giống 2
Mean 196.1750 153.7000
Variance 112.7002 151.3243
Observations 12 15
df 11 14
F 0.7448
P(F=f) one-tail 0.3156
F Critical one-tail 0.3651
b. Phân tích kết quả
Bảng kết quả này gồm có:
- Mean: Trung bình của 2 mẫu là 196.1750 và 153.7000
- Variance: Phương sai của 2 mẫu là 112.7002 và 151.3243
- Observations: Số quan sát n1và n2 là 12 và 15
- df: Bậc tự do là 11 và 14
- F: Giá trị F thực nghiệm là 0.7448
- P(F=f) one-tail: Giá trị P một phía 0.3156
- F Critical one-tail: Giá trị lý thuyết một phía là 0.03651
* Kết luận: P(F=f) one-tail  0.05 nên chấp nhận H0: σ1
2
=σ2
2
2.2.2. So sánh trung bình trường hợp hai mẫu ñộc lập khi biết phương sai σ
σ
σ
σ 2
1 và σ
σ
σ
σ 2
2
Bài toán ở ñây là cần thông qua hai mẫu ñể kiểm ñịnh giả thuyết H0: m1 = m2 (kỳ vọng
của biến X bằng kỳ vọng của biến Y) với ñối thuyết H1: m1 ≠ m2 ở mức ý nghĩa α .
Rút mẫu ñộc lập từ hai tổng thể phân phối chuẩn, trong một số tình huống nào ñó
chúng ta có thể ước lượng ñược phương sai (thường xảy ra khi ñiều tra lại một tổng thể sau
một thời gian chưa lâu, nên phương sai chưa thay ñổi, do ñó lấy phương sai của lần ñiều tra
trước làm σ2
1 và σ2
2, chẳng hạn khi xem xét các kết quả phân tích của hai phòng thí
nghiệm mà ñộ chính xác ñã ổn ñịnh, từ ñó có các ước lượng về phương sai).
Trường hợp mẫu lớn: Khi việc rút hai mẫu quan sát từ hai tổng thể ñược tiến hành một
cách ñộc lập thì chúng ta có hai mẫu ñộc lập. Nếu dung lượng của cả hai mẫu ñều lớn
(thường quy ước là n1 ≥ 30, n2 ≥ 30) ta có thể tiến hành z-test nhưng thay hai phương sai
của tổng thể σ2
1 và σ2
2 bằng phương sai mẫu s1
2
và s2
2
a. Các bước thực hiện
Chọn Tools Data Analysis  z-Test: Two Sample for Means, sau ñó lần lượt trả lời:
- Variable 1 Range: miền dữ liệu của biến 1, kể cả dòng ñầu chứa nhãn.
- Variable 2 Range: Miền dữ liệu của biến thứ hai, kể cả dòng ñầu chứa nhãn.
- Labels: Chọn mục này nếu miền dữ liệu chọn cả dòng nhãn.
33
- Hypothesized means difference: Giả thuyết về hiệu hai trung bình của hai tổng thể. Nếu
lấy giả thuyết H0: m1=m2 thì ghi 0. Nếu lấy giả thuyết H1: m1=m2+d thì ghi d (d là 1 số) .
- Variable 1 variance: Phương sai của biến 1 (nhập σ2
1).
- Variable 2 variance: Phương sai của biến 2 (nhập σ2
2).
- Output Range: Chọn miền trống ñể ñưa ra kết quả.
- Chọn OK.
Ví dụ 1.4: Thực hiện thí nghiệm ño chiều dài của 2 giống cá x và y. Với giống cá x lấy
mẫu ño 10 con cá, Với giống cá y lấy mẫu ño 12 con cá, ta có bảng số liệu sau, biết
phương sai của giống cá x là 11.6, của giống cá y là 10.9.
Hãy so sánh chiều dài của 2 giống cá x và y.
Chọn Tools Data Analysis  z-Test: Two Sample for Means, sau ñó khai báo theo
hộp thoại sau:
Kết quả so sánh hai mẫu cho ở bảng sau:
z-Test: Two Sample for Means
x y
Mean 20.300 20.833
Known Variance 11.6 10.9
Observations 10 12
Hypothesized Mean Difference 0
z -0.37084
P(Z=z) one-tail 0.35538
z Critical one-tail 1.64485
P(Z=z) two-tail 0.71076
z Critical two-tail 1.95996
b. Phân tích kết quả
- Mean:Trung bình của 2 mẫu.
- Known Variance: Phương sai ñã cho (σ2
1 và σ2
2 ).
34
- Observations: Số quan sát n1 và n2.
- Hypothesized means difference: Giả thuyết về hiệu hai trung bình của hai tổng thể. Nếu
lấy giả thuyết H0: m1=m2 thì ghi 0. Nếu lấy giả thuyết H1: m1=m2+d thì ghi d (d là 1 số) .
- z: Giá trị z thực nghiệm tính theo công thức sau:
z=(a1-a2)/Sqrt(σ2
1/n1 + σ2
2/n2 )
- P(Z=z) one-tail: Giá trị P một phía
- z Critical one-tail: Giá trị z lý thuyết (tới hạn) một phía.
- P(Z=z) two-tail: Giá trị P hai phía.
- z Critical two-tail: Giá trị z lý thuyết (tới hạn) hai phía
Chú ý: Ta có thể dùng một số hàm trong Excel ñể tính một số kết quả:
+ Giá trị P một phía tính bằng hàm 1-Normsdist(z).
+ Giá trị P hai phía tính bằng hàm (1-Normsdist(z))*2.
+ Giá trị tới hạn của hàm phân phối chuẩn tắc z một phía tính bằng hàm
Normsinv(0.95).
+ Giá trị z tới hạn hai phía tính bằng hàm Normsinv(0.975).
Kết luận: Nếu P two-tail  mức ý nghĩa α = 0.05 thì chập nhận H0 ngược lại bác bỏ H
0 chấp nhận H1.
Trong ví dụ giá trị P hai phía lớn hơn mức ý nghĩa α = 0.05 nên kết luận: chiều dài của
hai giống cá không khác nhau.
2.2.3. So sánh hai mẫu kiểu cặp ñôi
Ta xét thí dụ: lấy một tổ chim và cân trọng lượng chim cái, trọng lượng chim ñực ta
ñược các cặp số liệu, lấy mẫu với dung lượng là n thì ta có n cặp số liệu, trường hợp này là
lấy mẫu cặp ñôi. Nếu lấy một số chim ñực ngẫu nhiên trong nhiều chim ñực và lấy một số
chim cái ngẫu nhiên trong nhiều chim cái thì có hai mẫu quan sát ñộc lập.
Trường hợp khác, nếu ta ñem 10 mẫu ñất, mỗi mẫu chia ñôi, một nửa giao cho phòng
phân tích A thực hiện, nửa kia giao cho phòng phân tích B thì thu ñược số liệu cặp ñể so
sánh kết quả của hai phòng phân tích, hoặc nếu ta ñem hai giống lúa cấy trên một số ruộng,
mỗi ruộng chia ñôi, một nửa cấy giống A, một nửa cấy giống B thì có hai mẫu cặp ñể so
sánh, hay nếu ño một chỉ số sinh lý hoặc sinh hoá của một bệnh nhân khi mới nhập viện và
ño lại chỉ số ñó sau một thời gian ñiều trị thì có hai mẫu quan sát cặp ñể ñánh giá hiệu quả
ñiều trị.
Chú ý rằng, khi rút hai mẫu cặp ta có hai mẫu cùng số quan sát n, các số liệu sắp xếp
thành cặp ñứng ở hai cột cạnh nhau.
a. Các bước thực hiện
Chọn Tools Data Analysis  t-Test: Paired Two Sample for Means, sau ñó lần lượt
trả lời:
- Variable 1 Range: miền dữ liệu của biến 1, kể cả dòng ñầu chứa nhãn.
- Variable 2 Range: Miền dữ liệu của biến thứ hai, kể cả dòng ñầu chứa nhãn.
- Labels: Chọn mục này nếu miền dữ liệu chọn cả dòng nhãn
35
- Hypothesized means difference: Giả thiết về hiệu hai trung bình của hai tổng thể.
Nếu lấy giả thuyết H0: m1=m2 thì ghi 0. Nếu lấy giả thuyết H0: m1=m2+d thì ghi d (d là một
số nào ñó)
- Output Range: Chọn miền trống ñể ñặt ra kết quả.
Ví dụ 1.5: Tăng trọng (pound) của 10 cặp bê sinh ñôi giống hệt nhau dưới hai chế ñộ
chăm sóc A và B khác nhau. Bê trong từng cặp ñược bắt thăm ngẫu nhiên về một trong hai
cách chăm sóc.
Hãy kiểm ñịnh giả thiết H0: Tăng trọng trung bình ở hai cách chăm sóc như nhau, ñối
thiết H1: Tăng trọng trung bình khác nhau ở hai cách chăm sóc với mức ý nghĩa α = 0,05.
Số liệu thu ñược như sau:
Tăng trọng ở cách A 43 39 39 42 46 43 38 44 51 43
Tăng trọng ở cách B 37 35 34 41 39 37 35 40 48 36
Chọn Tools Data Analysis  t-Test: Paired Two Sample for Means, khai báo hộp
thoại như sau:
Kết quả thu ñược như sau:
t-Test: Paired Two Sample for Means
Tăng trọng ở cách A Tăng trọng ở cách B
Mean 42.8 38.2
Variance 14.6222 17.0667
Observations 10 10
Pearson Correlation 0.8820
Hypothesized Mean Difference 0
df 9
t Stat 7.44046
P(T=t) one-tail 0.00002
t Critical one-tail 1.83311
P(T=t) two-tail 0.00004
t Critical two-tail 2.26216
36
b. Phân tích kết quả
Bảng kết quả có hai cột cho hai mẫu quan sát. Bảng này có các hàng:
- Mean: Trung bình mẫu a1, a2.
- Variance: Phương sai mẫu s1
2
, s2
2
.
- Observations: Số quan sát n1 và n2 (bằng nhau và bằng số cặp số liệu n).
- Pearson Correlation: Hệ số tương quan r của 2 mẫu.
- Hypothesized means difference: Giả thuyết về hiệu hai trung bình của hai tổng thể. Nếu
lấy giả thuyết H0: m1=m2 thì ghi 0. Nếu lấy giả thuyết H1: m1=m2+d thì ghi d (d là 1 số) .
- df: Bậc tự do bằng số cặp trừ 1 (n-1).
- t Stat: Giá trị t thực nghiệm
- P(T=t) one-tail: Giá trị P một phía.
- t Critical one-tail: Giá trị t một phía.
- P(T=t) two-tail: Giá trị P hai phía.
- t Critical two-tail: Giá trị t hai phía.
Kết luận: Do giá trị P hai phía nhỏ hơn mức ý nghĩa α = 0.05 nên trong ví dụ trên ta
bác bỏ H0, chấp nhận giả thuyết H1 (m1≠m2) và ñồng thời t thực nghiệm  t một phía nên
m1 m2, có nghĩa là tăng trọng cách A lớn hơn tăng trọng của cách B.
2.2.4. So sánh trung bình khi lấy mẫu ñộc lập với giả thuyết hai phương sai bằng nhau
Trường hợp mẫu lớn: Khi việc rút hai mẫu quan sát từ hai tổng thể ñược tiến hành một
cách ñộc lập thì chúng ta có hai mẫu ñộc lập. Nếu dung lượng của cả hai mẫu ñều lớn
(thường quy ước là n1 ≥ 30, n2 ≥ 30) ta có thể tiến hành z-test nhưng thay hai phương sai
của tổng thể σ 2
1và σ 2
2 bằng phương sai mẫu s1
2
và s2
2
.
Trường hợp mẫu bé (n1,n2 nhỏ hơn 30) thì ta gặp bài toán khó, gọi tên là bài toán
Berens – Fisher. Trong trường hợp này, nếu coi hai phương sai của hai tổng thể bằng nhau
(cần kiểm ñịnh giả thuyết phụ về sự bằng nhau của hai phương sai) thì có thể tiếp tục tính
toán như sau:
a. Các bước thực hiện:
Chọn Tools Data Analysis  t-Test: Two-Sample Assuming Equal Variances, sau ñó
lần lượt trả lời:
- Variable 1 Range: miền dữ liệu của biến 1, kể cả dòng ñầu chứa nhãn.
- Variable 2 Range: Miền dữ liệu của biến thứ hai, kể cả dòng ñầu chứa nhãn.
- Labels: Chọn mục này nếu miền dữ liệu chọn cả dòng nhãn
- Hypothesized means difference: Giả thiết về hiệu hai trung bình của hai tổng thể.
Nếu lấy giả thuyết H0: m1=m2 thì ghi 0. Nếu lấy giả thuyết H0: m1=m2+d thì ghi d (d là một
số nào ñó) .
- Output Range: Chọn miền trống ñể ñặt ra kết quả.
37
Ví dụ 1.6: Có 2 giống bò, tiến hành chọn ngẫu nhiên và cân 12 con ñối với giống thứ
nhất và 15 con ñối với giống thứ 2. Khối lượng (kg) thu ñược như sau:
So sánh khối lượng của 2 giống bò
Giống 1 188 180 199 191 196 204 190 201 195 221 187 203
Giống 2 148 146 153 135 151 146 164 147 162 140 159 182 165 165 142
Kiểm ñịnh giả thiết H0: khối lượng trung bình của 2 giống bò như nhau.
- Trước tiên ta phải kiểm ñịnh sự bằng nhau của hai phương sai, trong mục 1.2.1 và ở
ví dụ 1.3 ta ñã có kết luận hai phương sai bằng nhau.
- Bước tiếp theo ta ñi so sánh trung bình với giả thiết phương sai bằng nhau:
Chọn Tools Data Analysis  t-Test: Two-Sample Assuming Equal Variances, khai
báo hộp thoại như sau:
Kết quả như sau:
t-Test: Two-Sample Assuming Equal Variances
Giống 1 Giống 2
Mean 196.175 153.7
Variance 112.7002 151.3243
Observations 12 15
Pooled Variance 134.3297
Hypothesized Mean Difference 0
df 25
t Stat 9.46241
P(T=t) one-tail 0.00000
t Critical one-tail 1.70814
P(T=t) two-tail 0.00000
t Critical two-tail 2.05954
38
b. Phân tích kết quả
Bảng kết quả thu ñược có hai cột cho hai mẫu quan sát, và lần lựơt có các hàng sau:
- Mean: Trung bình mẫu a1, a2.
- Variance: Phương sai mẫu s1
2
, s2
2
.
- Observations: Số quan sát n1 và n2.
- Pooled Variance: Phương sai chung tính theo công thức
s2
=((n1-1)s1
2
+( n2-1)s2
2
)/(n1+n2-2)
- Hypothesized means difference: Giả thiết về hiệu hai trung bình của hai tổng thể.
Nếu lấy giả thuyết H0: m1=m2 thì ghi 0. Nếu lấy giả thuyết H0: m1=m2+d thì ghi d (d là một
số nào ñó) .
- df: Bậc tự do (n1+ n2-2)
- t Stat: Giá trị t thực nghiệm tính theo công thức:
t = (a1-a2)/Sqrt(s2
×(1/n1+1/n2))
- P(T=t) one-tail: Giá trị P một phía.
- t Critical one-tail: Giá trị t một phía.
- P(T=t) two-tail: Giá trị P hai phía.
- t Critical two-tail: Giá trị t hai phía.
Chú ý: có thể tìm ñược các giá trị theo các hàm của Excel
+ Giá trị P một phía và hai phía qua hàm Tdist(z,f,1) và Tdist(z,f,2).
+ Giá trị t lý thuyết một phía qua hàm TINV(0.10,f).
+ Giá trị t lý thuyết hai phía qua hàm TINV(0.05,f).
Kết luận: Do giá trị P hai phía nhỏ hơn mức ý nghĩa α = 0.05 nên trong ví dụ trên ta
bác bỏ H0, chấp nhận giả thuyết H1 (m1≠m2) và ñồng thời t thực nghiệm  t một phía nên
m1 m2, có nghĩa là khối lượng trung bình của giống bò 1 lớn hơn khối lượng trung bình
của giống bò 2.
2.2.5. So sánh trung bình khi lấy mẫu ñộc lập với giả thuyết hai phương sai khác nhau
Trong trường hợp mẫu bé và phương sai khác nhau thì có thể thực hiện theo các bước sau:
a. Các bước thực hiện
Chọn Tools Data Analysis  t-Test: Two-Sample Assuming Unequal Variances, sau
ñó lần lượt trả lời:
- Variable 1 Range: miền dữ liệu của biến 1, kể cả dòng ñầu chứa nhãn.
- Variable 2 Range: Miền dữ liệu của biến thứ hai, kể cả dòng ñầu chứa nhãn.
- Labels: Chọn mục này nếu miền dữ liệu chọn cả dòng nhãn
- Hypothesized means difference: Giả thiết về hiệu hai trung bình của hai tổng thể.
Nếu lấy giả thuyết H0: m1=m2 thì ghi 0. Nếu lấy giả thuyết H0: m1=m2+d thì ghi d (d là một
số nào ñó)
- Output Range: Chọn miền trống ñể ñặt ra kết quả.
Ví dụ 1.7: Thực hiện thí nghiệm ño chiều dài của 2 giống cá x và y. Với giống cá x lấy
mẫu ño 10 con cá, Với giống cá y lấy mẫu ño 12 con cá, ta có bảng số liệu sau.
Hãy so sánh chiều dài của 2 giống cá x và y.
39
x 15 17 20 23 25 17 18 22 24 22
y 14 12 13 28 12 17 25 24 30 21 23 30
* Bước 1: Kiểm ñịnh sự bằng nhau của hai phương sai, thực hiện theo mục 1.2.1, ta có
kết quả sau:
F-Test Two-Sample for Variances
x y
Mean 20.3 20.75
Variance 11.5667 48.2045
Observations 10 12
df 9 11
F 0.23995
P(F=f) one-tail 0.02047
F Critical one-tail 0.32232
Kết luận: P một phía  0.05 nên bác bỏ H0, chấp nhận H1 tức là hai phương sai khác nhau.
* Bước 2: Kiểm ñịnh sự bằng nhau của hai trung bình với giả thuyết hai phương sai
khác nhau:
Chọn Tools Data Analysis  t-Test: Two-Sample Assuming Unequal Variances, khai
báo hộp thoại như sau:
Kết quả thu ñược như sau:
t-Test: Two-Sample Assuming Unequal Variances
x y
Mean 20.3 20.75
Variance 11.5667 48.2045
Observations 10 12
Hypothesized Mean Difference 0
df 17
t Stat -0.19784
P(T=t) one-tail 0.42276
t Critical one-tail 1.73961
P(T=t) two-tail 0.84552
t Critical two-tail 2.10982
40
b. Phân tích kết quả
ðánh giá kết quả như trọng mục 1.2.4 ở trên.
Kết luận: Theo kết quả trên giả thuyết H0 vẫn ñược chấp nhận ở mức ý nghĩ 0.05 do P
hai phía lớn hơn mức ý nghĩa α = 0.05, tức là chiều dài của 2 giống cá không khác nhau.
2.3. Phân tích phương sai
Phân tích phương sai là công cụ chủ yếu ñể phân tích các số liệu khi theo dõi ảnh
hưởng của các nhân tố (factor) và ảnh hưởng tương tác của chúng. ðể thu thập số liệu, thí
nghiệm cần ñược thiết kế phù hợp với mục ñích nghiên cứu và ñiều kiện cụ thể nơi tiến
hành thí nghiệm. ðể phân tích một nhân tố, thí nghiệm thường ñược thiết kế theo kiểu
hoàn toàn ngẫu nhiên, kiểu khối hoàn toàn ngẫu nhiên, hay ô vuông La tinh. ðể phân tích
hai nhân tố, thí nghiệm ñược bố trí theo kiểu khối ngẫu nhiên, kiểu trực giao, kiểu chia ô
lớn, ô nhỏ. Từ ba nhân tố trở lên thì cần bố trí thí nghiệm sao cho mỗi nhân tố có hai mức
hay mỗi nhân tố có ba mức.
1.3.1. Phân tích phương sai một nhân tố
Phân tích phương sai một nhân tố ñược sử dụng ñể phân tích số liệu khi theo dõi ảnh
hưởng của các mức của nhân tố tới kết quả, như ảnh hưởng của các công thức cho ăn ñến
năng suất thịt lợn, ảnh hưởng của các công thức ñiều trị thuốc ñến tỷ lệ bệnh...
ðể phân tích phương sai một nhân tố cần thiết kế thí nghiệm kiểu hoàn toàn ngẫu
nhiên, mỗi mức lặp lại một số lần, số lần lặp của các mức của nhân tố không cần phải bằng
nhau. Số liệu ñược ñiền theo cột hoặc theo hàng (nếu vào theo hàng thì mỗi hàng ứng với
một mức của nhân tố), ô ñầu tiên ghi tên mức, các ô tiếp theo ghi số liệu.
Giả sử thí nghiệm ñược bố trí theo k mức tác ñộng khác nhau của nhân tố A, mỗi mức
ñược lặp lại ni lần, i= k
,
1 và n1 + n2+…+ nk là tổng số các thí nghiệm.
Gọi Xij là số liệu thu ñược của thí nghiệm ở mức i và lần lặp thứ j. Ta có bảng thực
nghiệm sau:
Mức của nhân tố A Số liệu thực nghiệm
1 X11 X12 … X1n1
2 X21 X22 … X2n2
… … … … …
k Xk1 Xk2 … Xknk
Nếu k ñám ñông có phân phối chuẩn N(mi,δ2
), i = k
,
1 thì ñại lượng
2
2
1
2
S
S
F =
Trong ñó S2
1 là phương sai gây ra do tác ñộng của các mức, S2
2 là phương sai do ngẫu
nhiên. F có phân phối Fisher với k-1; n-k bậc tự do.
Bài toán phân tích phương sai ñưa về việc kiểm ñịnh giả thiết:
H0: m1= m2=… = mk
ðối giả thiết H1: Có ít nhất hai trị trung bình khác nhau.
Giả thiết H0 bị bác bỏ ở mức α nếu: F  Fα(k-1,n-k) với Fα(k-1,n-k) là số tìm ñược ở
bảng F, mức α với k-1, n-k bậc tự do.
41
a. Các bước thực hiện trong Excel
Chọn Tools Data Analysis  Anova: Single Factor và khai báo:
- Input range: Khai báo miền dữ liệu vào (một chữ nhật bao trùm toàn bộ các ô chứa
tên mức và toàn bộ các số liệu).
- Grouped by: Column (số liệu theo cột) hoặc row (số liệu theo hàng)
- Label in First column: nhãn dòng ñầu.
- Alpha: 0.05 mức ý nghĩa α.
- Output range: miền ra.
- Chọn nút OK
b. Phân tích kết quả
- Kết quả in ra gồm các thống kê cơ bản cho từng mức (trung bình, ñộ lệch chuẩn...) và
bảng phân tích phương sai.
- Nếu giá trị xác suất P-value = alpha (hoặc F thực nghiệm = F lý thuyết) thì chấp
nhận H0 các công thức không có khác biệt ñáng kể.
- Nếu giá trị xác suất P-value  alpha (hoặc F thực nghiệm  F lý thuyết) thì bác bỏ Ho
chấp nhận H1 các công thức có tác ñộng khác nhau tới kết quả.
- Khi kết luận các công thức có tác ñộng khác nhau tới kết quả thì phải tiến hành bước
tiếp theo là so sánh các công thức ñể rút ra công thức nào tốt nhất.
1.3.2. So sánh các trung bình dùng ngưỡng so sánh LSD (Least sinificance diffrence)
Phần mềm Excel không cho phép so sánh các trung bình của các nhóm ứng với các
mức của nhân tố (các công thức). Tuy nhiên, nếu cần so sánh trung bình mi (với ri lần lặp)
với trung bình mj (rj lần lặp) người dùng có thể tự tính thêm LSD (Least Significance
Difference) theo công thức LSD = tα,f × SQRT(s2
(1/ri + 1/rj)), trong ñó s2
là phương sai
chung ñược ước lượng bởi trung bình của sai số bình phương trong nội bộ nhóm (MS
within groups), α = 1-p, và tα,f là giá trị t của bảng Student ứng với mức ý nghĩa α và f bậc
tự do. tα,f có thể tìm ñược bằng cách tra bảng số hay bằng hàm TINV trong Excel.
* Tính trị tuyệt ñối của hiệu các trung bình mi, mj: |mi- mj|
* So sánh nếu |mi- mj|  LSD thì hai trung bình là khác nhau, ngược lại 2 trung bình
ñược coi là không khác nhau. Thông thường người ta lập bảng hiệu các trung bình, sau ñó
lập bảng ghi kết quả so sánh.
Ví dụ 1.8: Theo dõi tăng trọng của cá (kg), thí nghiệm với 5 công thức nuôi (A, B, C,
D, E). . Số liệu thu ñược như bảng sau. Hãy cho biết công thức nào tốt nhất
* Các bước thực hiện trong Excel
42
Chọn Tools Data Analysis  Anova: Single Factor và khai báo theo hộp thoại sau:
* Kết quả thu ñược như sau:
Anova: Single Factor
SUMMARY
Groups Count Sum Average Variance
A 4 3.55 0.8875 0.002292
B 4 1.7 0.425 0.000433
C 4 3.05 0.7625 0.008958
D 4 3.75 0.9375 0.002292
E 4 3.8 0.95 0.001667
ANOVA
Source of Variation SS df MS F P-value F crit
Between Groups 0.76325 4 0.190813 60.99494 4.24E-09 3.055568
Within Groups 0.046925 15 0.003128
Total 0.810175 19
* Kết luận: P- value  0.05 (mức ý nghĩa của kiểm ñịnh) nên bác bỏ Ho chấp nhận H1
các công thức có tác ñộng khác nhau tới kết quả.
* So sánh các trung bình:
43
2.3.3. Phân tích phương sai hai nhân tố
Khi phân tích phương sai hai nhân tố A và B thì có thể xảy ra các hai trường hợp:
trường hợp A và B không tương tác (biến ñộng gây nên bởi tác ñộng ñồng thời của A và B
gần sát 0) và trường hợp A và B tương tác (nếu trái lại). Phân tích phương sai một nhân tố
bố trí kiểu khối hoàn toàn ngẫu nhiên ñược coi là trường hợp riêng của phân tích phương
sai hai nhân tố không tương tác (nhân tố khối là nhân tố thứ hai không tương tác với nhân
tố thứ nhất). Khi phân tích phương sai hai nhân tố không tương tác, số liệu cần ñược sắp
xếp theo cách sau: hàng là các mức của nhân tố thứ nhất, cột là các mức của nhân tố thứ
hai (trong trường hợp cần phân tích phương sai một nhân tố bố trí kiểu khối ngẫu nhiên thì
hàng là các mức của nhân tố, cột là các khối ngẫu nhiên).
a. Phân tích phương sai hai nhân tố không tương tác (không lặp)
Xét trường hợp thí nghiệm liên quan tới 2 nhân tố A và B, mỗi nhân tố có một số mẫu.
Xét trường hợp không có tương tác giữa Avà B.
Nhân tố A
Nhân tố B
1 2 … kA
1 X11 X12 … X1kA
2 X21 X22 … X2kA
… … … … …
kB XkB1 XkB2 … XkBkA
44
Ta ñi kiểm ñịnh giả thuyết H0A và H0B với các ñối thuyết H1A và H1B (Giả thiết H0A:
Các mức của nhân tố A có tác ñộng như nhau. Giả thiết H0B: Các mức của nhân tố B có tác
ñộng như nhau)
Các ñại lượng thống kê:
R
A
A
s
s
F 2
2
= và
R
B
B
s
s
F 2
2
=
Trong ñó S2
A là phương sai do nhân tố A, S2
B là phương sai do nhân tố B, S2
R là
phương sai do nhân tố ngẫu nhiên.
Nếu: FA  F 0.05A kết luận các mức của nhân tố theo cột (A) có ảnh hưởng khác nhau
ñến số liệu nghiên cứu.
FB  F 0.05B kết luận các mức của nhân tố theo dòng (B) có ảnh hưởng khác nhau ñến
số liệu nghiên cứu.
* Các bước thực hiện trong Excel
Chọn Tools Data Analysis Anova: Two Factor Without Replication sau ñó khai báo
tiếp các thông tin trong hình sau:
Hình 1.4. Hộp thoại khai báo ñể phân tích phương sai không tương tác
* Phân tích kết quả
- Nếu FA  F Crit A thì các mức của nhân tố A có ảnh hưởng khác nhau ñến kết quả.
- Nếu kết luận các mức của nhân tố A có ảnh hưởng khác nhau ñến kết quả thì ta tiến
hành so sánh trung bình của các mức trong nhân tố A theo chỉ số LSD (tương tự trong phần
phân tích phương sai một nhân tố).
- Nếu FB  F Crit B thì các mức của nhân tố B có ảnh hưởng khác nhau ñến kết quả.
- Nếu kết luận các mức của nhân tố B có ảnh hưởng khác nhau ñến kết quả thì ta tiến
hành so sánh trung bình của các công thức trong nhân tố B theo chỉ số LSD (tương tự trong
phần phân tích phương sai một nhân tố).
Chú ý: F là F thực nghiệm, F Crit là F lý thuyết có thể tìm bằng hàm FINV(...)
F Crit A = FINV(α, kA -1, (kA-1)(kB-1)) , F Crit B = FINV(α, kB -1, (kA-1)(kB-1))
Ví dụ 1.9: Mead và cộng sự nghiên cứu số lượng tế bào Lymphô ở chuột (×1000 tế
bào mm-3máu) , sử dụng 4 loại thuốc, qua 5 lứa. Số liệu ñược cho trên bảng sau. Thực
hiện trong Excel khai báo dữ liệu theo hộp thoại sau:
45
Kết quả xử lý cho trong bảng sau:
Anova: Two-Factor Without Replication
SUMMARY Count Sum Average Variance
Thuốc A 5 32.1 6.42 0.367
Thuốc B 5 28.6 5.72 0.442
Thuốc C 5 30.3 6.06 0.578
Thuốc D 5 28.3 5.66 0.373
Lứa 1 4 27.6 6.9 0.053333
Lứa 2 4 22.4 5.6 0.193333
Lứa 3 4 24.7 6.175 0.275833
Lứa 4 4 20.9 5.225 0.069167
Lứa 5 4 23.7 5.925 0.235833
ANOVA
Source of Variation SS df MS F P-value F crit
Rows 1.8455 3 0.615167 11.5887 0.0007392 3.490295
Columns 6.403 4 1.60075 30.15542 3.544E-06 3.259167
Error 0.637 12 0.053083
Total 8.8855 19
Kết luận:
+ Với nhân tố thuốc thì khi sử dụng các loại thuốc khác nhau có ảnh hưởng tới số
lượng tế bào lymphô trong máu (F  F crit).
+ Với nhân tố lứa thì các lứa khác nhau cũng ảnh hưởng tới số lượng tế bào lymphô
trong máu (F  F crit).
b. Phân tích phương sai hai nhân tố có tương tác (có lặp)
Trong trường hợp này khi phân tích phương sai ta phải tính ñến sự tác ñộng ñồng thời
của A và B. Số liệu sắp xếp như sau:
- Nhân tố 1 ñánh theo hàng với các mức khác nhau, nhân tố 2 ñánh theo cột với các
mức khác nhau.
46
- Mỗi mức của nhân tố 1 (thường gọi là nhân tố A) ñược dành m hàng (cho m lần lặp)
còn mỗi mức của nhân tố 2 (thường gọi là nhân tố B) là 1 cột.
- Tên mỗi mức của nhân tố A chỉ viết một lần trong ô ñầu tiên của mức ñó, các tên
mức của nhân tố B thì ghi ñầu ở mỗi cột. Các ô từ hàng 2 cột 2 trở ñi ghi số liệu.
Số liệu bố trí theo bảng sau:
B
A
1 2 ... kB
X111 X121 ... X1kB1
X112 X122 ... X1kB2
... ... ... ...
1
X11m X12m ... X1kBm
X211 X221 ... X2KB1
X212 X222 ... X2kB2
... ... ... ...
2
X21m X22m ... X2kBm
... ... ... ... ...
XkA11 XkA21 ... XkAkB1
XkA12 XkA22 ... XkAkB2
... ... ... ...
kA
XkA1m XkA2m ... XkAkBm
Tổng số lượng quan sát: n = m kA kB
Các ñại lượng thống kê:
R
AB
AB
R
B
B
R
A
A
S
S
F
S
S
F
S
S
F 2
2
2
2
2
2
,
, =
=
=
Trong ñó S2
A là phương sai do nhân tố A, S2
B là phương sai do nhân tố B, SAB là
phương sai do tương tác AB, S2
R là phương sai do nhân tố ngẫu nhiên.
* Các bước thực hiện trong Excel
Chọn Tools Data Analysis Anova: Two Factor With Replication, sau ñó khai báo
các thông tin như sau:
Trong ñó Rows per sample là số lần lặp.
47
* Phân tích kết quả
- Nếu FA  F Crit A thì các mức của nhân tố A có ảnh hưởng khác nhau ñến kết quả.
- Nếu FB  F Crit B thì các mức của nhân tố B có ảnh hưởng khác nhau ñến kết quả.
- Nếu FAB  F Crit AB thì tương tác A B có ảnh hưởng ñến kết quả.
Ví dụ 1.10: Một nghiên cứu tiến hành ñể xác ñịnh ảnh hưởng của việc bổ sung 2 loại
vitamin (A và B) vào thức ăn ñể tăng trọng (kg/ngày) của lợn. Hai mức ñối với vitamin A
(0 và 4 mg) và 2 mức ñối với vitamin B (0 và 5 mg). Số liệu thu ñược khi kết thúc thí
nghiệm ñược trình bày như sau:
Vitamin A 0 mg 4 mg
Vitamin B 0 mg 5 mg 0 mg 5 mg
0.585 0.567 0.473 0.684
0.536 0.545 0.450 0.702
0.458 0.589 0.869 0.900
0.486 0.536 0.473 0.698
0.536 0.549 0.464 0.693
Khi xử lý trong Excel số liệu ñược bố trí lại như sau:
Chọn Tools Data Analysis Anova: Two Factor With Replication, sau ñó khai báo
các thông tin như sau:
48
Chú ý: Miền dữ liệu vào (Input Range) A2: C12. Không chọn ô có nhãn Vitamin B,
mà ở ñây chỉ nhập ñể xem choão. Số lần lặp là 5.
Kết quả thu ñược như bảng sau:
Anova: Two-Factor With Replication
SUMMARY 0 mg 5 mg Total
0 mg
Count 5 5 10
Sum 2.601 2.786 5.387
Average 0.5202 0.5572 0.5387
Variance 0.0024342 0.0004432 0.00165912
4 mg
Count 5 5 10
Sum 2.729 3.677 6.406
Average 0.5458 0.7354 0.6406
Variance 0.0327317 0.0085118 0.02831604
Total
Count 10 10
Sum 5.33 6.463
Average 0.533 0.6463
Variance 0.015811333 0.0128009
ANOVA
Source of Variation SS df MS F P-value F crit
Sample 0.05191805 1 0.05191805 4.706889479 0.045448 4.493998
Columns 0.06418445 1 0.06418445 5.818961082 0.028222 4.493998
Interaction 0.02910845 1 0.02910845 2.638971553 0.123804 4.493998
Within 0.1764836 16 0.01103023
Total 0.32169455 19
Theo kết quả xử lý, ta rút ra kết luận:
- Vitamin A có ảnh hưởng ñến tăng trọng của lợn (F  F crit).
- Vitamin B có ảnh hưởng ñến tăng trọng của lợn (F  F crit).
- Tương tác của Vitamin A và Vitamin B không ảnh hưởng ñến tăng trọng của lợn (F  F crit).
2.4. Tương quan và Hồi quy
2.4.1. Hệ số tương quan
Hệ số tương quan dùng ñể ño mức ñộ quan hệ giữa 2 biến. Hệ số tương quan có thể
nhận giá trị từ -1 ñến +1. Nếu 1 biến theo chiều tăng còn biến kia thì giảm thì hệ số tương
quan là âm. Ngược lại nếu cả 2 biến ñều theo chiều tăng thì hệ số tương quan dương. Hệ số
tương quan |ρ| ≥ 0,7 tương quan tuyến tính. |ρ| = 1 thì quan hệ hoàn toàn tuyến tính.
Hệ số tương quan ñược kí hiệu là ρ ñối với tổng thể và kí hiệu là r ñối với mẫu.
* Tính hệ số tương quan mẫu r
49
ðối với 2 biến x và y, hệ số tương quan mẫu r ñược tính theo công thức sau:
r =
( )( )
y
x
i
i
s
s
)
1
n
(
n
1
i
Y
X y
x
−
∑
=
−
−
ở ñây x và sx là trung bình và ñộ lệch chuẩn mẫu ñối với mẫu thứ nhất, y và sy là
trung bình và ñộ lệch chuẩn của mẫu thứ 2.
* Tính hệ số tương quan trong Excel:
Excel cho phép tính hệ số tương quan ñơn giữa các biến sắp xếp thành một bảng gồm
n hàng, n cột (mỗi cột là 1 biến).
a. Các bước thực hiện
Chọn ToolsData AnalysisCorrelation và khai báo các mục:
- Input range: miền dữ liệu kể cả nhãn.
- Grouped by: Column (số liệu theo cột).
- Labels in first row: ðánh dấu √ vào ô này nếu có nhãn ở dòng ñầu.
- Output range: miền ra.
- OK.
b. Phân tích kết quả
- Hệ số tương quan của dòng và cột ghi ở ô giao giữa dòng và cột.
- Hệ số tương quan âm( 0) thể hiện mối tương quan nghịch biến.
- Các hệ số tương quan có giá trị tuyệt ñối xấp xỉ 0.7 trở lên thể hiện mối tương quan
tuyến tính (tương quan mạnh) giữa hai biến.
Ví dụ 1.11: Xác ñịnh mối tương quan giữa khối lượng của gà mái (kg) và thu nhận
thức ăn trong một năm (kg). Tiến hành quan sát 10 gà mái và thu ñược kết quả sau:
Khối lượng gà mái 2.3 2.6 2.4 2.2 2.8 2.3 2.6 2.6 2.4 2.5
Khối lượng thức ăn 43 46 45 46 50 46 48 49 46 47
- Chọn ToolsData analysisCorrelation.
- Khai báo các mục như hình sau:
50
- Kết quả thu ñược trên bảng sau:
Khối lượng gà mái Khối lượng thức ăn
Khối lượng gà mái 1
Khối lượng thức ăn 0.779445522 1
- Kết luận: Hệ số tương quan giữa khối lượng gà mái và khối lượng thức ăn là
0.779445522 , thể hiện mối tương quan tuyến tính.
2.4.2. Hồi quy tuyến tính trong excel
Excel cho phép tìm phương trình hồi quy tuyến tính ñơn y= a+ bx và hồi quy tuyến
tính bội y= a0 + a1x1 + a2x2 + . . . + anxn. Các biến ñộc lập chứa trong n cột, biến phụ thuộc
y ñể trong một cột, các giá trị tương ứng giữa biến ñộc lập và biến phụ thuộc ñược xếp trên
cùng một hàng.
a. Các bước thực hiện
Chọn ToolsData AnalysisRegression và khai báo các mục:
- Input y range: miền dữ liệu biến y.
- Input x range: miền dữ liệu các biến x.
- Label: ðánh dấu √ vào ô này nếu có nhãn ở dòng ñầu.
- Confidence level: 95% (ñộ tin cậy 95%).
- Constant in zero: ðánh dấu √ nếu hệ số tự do a0 = 0 .
- Output range: miền xuất kết quả.
- Residuals: ðánh dấu √ vào ô này ñể hiện phần dư hay sai lệch giữa y thực nghiệm và
y theo hồi quy.
- Standardized residuals: ðánh dấu √ ñể hiện phần dư ñã chuẩn hoá.
- Residuals plot: ðánh dấu √ ñể hiện ñồ thị phần dư.
- Line fit plots: ðánh dấu √ ñể hiện ñồ thị các ñường dự báo.
- Normal probability plot: ðánh dấu √ ñể hiện ñồ thị phần dư ñã chuẩn hoá.
- OK.
b. Phân tích kết quả
- Nếu hệ số tương quan bội xấp xỉ 0.7 hoặc lớn hơn thì mô hình hồi quy tuyến tính là
thích hợp (ngược lại nên tìm mô hình khác).
- Hệ số tương quan R square trong cho biết bao nhiên % sự biến ñộng của y là do các
yếu tố x gây nên.
- Hệ số Adjusted R square nếu không sát gần với R square chứng tỏ không phải tất cả
các biến ñưa vào là thực sự cần thiết.
- Trong bảng phân tich hồi quy nếu mức ý nghĩa kiểm ñịnh F (Significiance F) nhỏ
hơn mức ý nghĩa α thì phương trình hồi quy tuyến tính ñược chấp nhận.
- Nhìn vào các hệ số của các biến ta viết ñược ñường hồi quy dự báo
- Nếu suất cho ở cột P-value của hệ số của xi  α thì hệ số của biến ñó có thể coi là
bằng không. Trong trường hợp này, cần tiến hành lọc bớt biến xi ñể ñược ñường hồi quy
với các hệ số ñều có ý nghĩa.
51
Ví dụ 1.12: Xác ñịnh phương trình hồi quy giữa khối lượng của gà mái (kg) và thu
nhận thức ăn trong một năm (kg). Tiến hành quan sát 10 gà mái và thu ñược kết quả sau:
Khối lượng gà mái 2.3 2.6 2.4 2.2 2.8 2.3 2.6 2.6 2.4 2.5
Khối lượng thức ăn 43 46 45 46 50 46 48 49 46 47
Số liệu nhập vào trong Excel theo cột.
Chọn ToolsData AnalysisRegression và khai báo các mục như trên hình sau:
Kết quả thu ñược theo bảng sau:
SUMMARY OUTPUT
Regression Statistics
Multiple R 0.779445522
R Square 0.607535322
Adjusted R Square 0.558477237
Standard Error 0.121517421
Observations 10
ANOVA
df SS MS F Significance F
Regression 1 0.182868 0.1828681 12.384 0.007856347
Residual 8 0.118132 0.0147665
Total 9 0.301
Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Upper 95.0%
Intercept -0.832967033 0.939372 -0.886728 0.4010953 -2.999161935 1.333227869 1.333227869
Khối lượng thức ăn 0.070879121 0.020141 3.5190908 0.0078563 0.024433162 0.11732508 0.11732508
52
BÀI TẬP CHƯƠNG I
Bài 1: Một thí nghiệm ñược tiến hành nhằm so sánh nồng ñộ Epinephrine (PEP) trong
huyết tương chó ở các thuốc gây mê khác nhau. Trong nghiên cứu này 10 cho ñược chọn
tham gia thí nghiệm. Ba loại thuốc gây mê ñược lựa chọn ngẫu nhiên ñể lần lượt gây mê
cho mỗi chó. Kết quả thu ñược như sau:
Chó số 1 2 3 4 5 6 7 8 9 10
Thuốc A 1,07 1,35 0,69 0,28 1,24 1,53 0,49 0,56 1,02 0,30
Thuốc B 0,30 0,39 0,63 0,68 0,38 0,21 0,88 0,39 0,51 0,32
Thuốc C 0,28 0,51 1,00 0,39 0,29 0,36 0,32 0,69 0,17 0,33
So sánh hàm lượng Epinephrine ở 3 loại thuốc gây mê khác nhau?
Bài 2: Tiến hành một nghiên cứu về công thức thức ăn trên gia cầm. Có 2 công thức
thức ăn (Công thức 1 và Công thức 2) và tiến hành thí nghiệm trên cả con trống và mái.
Khối lượng thức ăn thu nhận (gam) ở thí nghiệm nêu trên ñược trình bày như sau:
Trống Mái
Công thức 1 Công thức 2 Công thức 1 Công thức 2
70,9 59,2 65,7 50,8
67,9 53,8 59,4 50,5
69,9 47,6 67,7 50,5
So sánh lượng thức ăn thu nhận qua thí nghiệm nêu trên?

More Related Content

What's hot

mạng truyền thông công nghiệp
mạng truyền thông công nghiệpmạng truyền thông công nghiệp
mạng truyền thông công nghiệphuong nguyen
 
ĐIỀU KHIỂN BỘ NGHỊCH LƯU NỐI LƯỚI TRONG MẠNG ĐIỆN PHÂN PHỐI.pdf
ĐIỀU KHIỂN BỘ NGHỊCH LƯU NỐI LƯỚI TRONG MẠNG ĐIỆN PHÂN PHỐI.pdfĐIỀU KHIỂN BỘ NGHỊCH LƯU NỐI LƯỚI TRONG MẠNG ĐIỆN PHÂN PHỐI.pdf
ĐIỀU KHIỂN BỘ NGHỊCH LƯU NỐI LƯỚI TRONG MẠNG ĐIỆN PHÂN PHỐI.pdfMan_Ebook
 
Bài tập và ứng dụng PLC
Bài tập và ứng dụng PLCBài tập và ứng dụng PLC
Bài tập và ứng dụng PLCquanglocbp
 
Nghiên cứu quy trình lên men chìm nấm Thượng Hoàng (Phellinus linteus).pdf
Nghiên cứu quy trình lên men chìm nấm Thượng Hoàng (Phellinus linteus).pdfNghiên cứu quy trình lên men chìm nấm Thượng Hoàng (Phellinus linteus).pdf
Nghiên cứu quy trình lên men chìm nấm Thượng Hoàng (Phellinus linteus).pdfTÀI LIỆU NGÀNH MAY
 
Chương 5 phân tích protei trong thực phẩm- pttp 1
Chương 5  phân tích protei trong thực phẩm- pttp 1Chương 5  phân tích protei trong thực phẩm- pttp 1
Chương 5 phân tích protei trong thực phẩm- pttp 1Nhat Tam Nhat Tam
 
Nghiên cứu chế tạo và sử dụng vật liệu nano bạc, đồng, sắt để xử lý vi khuẩn ...
Nghiên cứu chế tạo và sử dụng vật liệu nano bạc, đồng, sắt để xử lý vi khuẩn ...Nghiên cứu chế tạo và sử dụng vật liệu nano bạc, đồng, sắt để xử lý vi khuẩn ...
Nghiên cứu chế tạo và sử dụng vật liệu nano bạc, đồng, sắt để xử lý vi khuẩn ...jackjohn45
 
Bài Giảng Vi Xử Lý ICTU
Bài Giảng Vi Xử Lý ICTUBài Giảng Vi Xử Lý ICTU
Bài Giảng Vi Xử Lý ICTUNgô Doãn Tình
 
VI ĐIỀU KHIỂN 8051
VI ĐIỀU KHIỂN 8051VI ĐIỀU KHIỂN 8051
VI ĐIỀU KHIỂN 8051LE The Vinh
 
Dây chuyền sản xuất nước dứa cô đặc.
Dây chuyền sản xuất nước dứa cô đặc.Dây chuyền sản xuất nước dứa cô đặc.
Dây chuyền sản xuất nước dứa cô đặc.thietbivpm
 
he-thong-bai-tap-plc-co-ban
he-thong-bai-tap-plc-co-banhe-thong-bai-tap-plc-co-ban
he-thong-bai-tap-plc-co-banbtminh
 

What's hot (20)

Luận văn: Kỹ năng giao tiếp với người bệnh của nhân viên y tế, 9đ
Luận văn: Kỹ năng giao tiếp với người bệnh của nhân viên y tế, 9đLuận văn: Kỹ năng giao tiếp với người bệnh của nhân viên y tế, 9đ
Luận văn: Kỹ năng giao tiếp với người bệnh của nhân viên y tế, 9đ
 
mạng truyền thông công nghiệp
mạng truyền thông công nghiệpmạng truyền thông công nghiệp
mạng truyền thông công nghiệp
 
ĐIỀU KHIỂN BỘ NGHỊCH LƯU NỐI LƯỚI TRONG MẠNG ĐIỆN PHÂN PHỐI.pdf
ĐIỀU KHIỂN BỘ NGHỊCH LƯU NỐI LƯỚI TRONG MẠNG ĐIỆN PHÂN PHỐI.pdfĐIỀU KHIỂN BỘ NGHỊCH LƯU NỐI LƯỚI TRONG MẠNG ĐIỆN PHÂN PHỐI.pdf
ĐIỀU KHIỂN BỘ NGHỊCH LƯU NỐI LƯỚI TRONG MẠNG ĐIỆN PHÂN PHỐI.pdf
 
Luận án: Nghiên cứu đa dạng thực vật bậc cao và giải pháp bảo tồn
Luận án: Nghiên cứu đa dạng thực vật bậc cao và giải pháp bảo tồnLuận án: Nghiên cứu đa dạng thực vật bậc cao và giải pháp bảo tồn
Luận án: Nghiên cứu đa dạng thực vật bậc cao và giải pháp bảo tồn
 
Bài tập và ứng dụng PLC
Bài tập và ứng dụng PLCBài tập và ứng dụng PLC
Bài tập và ứng dụng PLC
 
Nghiên cứu quy trình lên men chìm nấm Thượng Hoàng (Phellinus linteus).pdf
Nghiên cứu quy trình lên men chìm nấm Thượng Hoàng (Phellinus linteus).pdfNghiên cứu quy trình lên men chìm nấm Thượng Hoàng (Phellinus linteus).pdf
Nghiên cứu quy trình lên men chìm nấm Thượng Hoàng (Phellinus linteus).pdf
 
Đề tài: Tiêu chuẩn kiểm nghiệm nguyên liệu cao chiết từ Dâu tằm
Đề tài: Tiêu chuẩn kiểm nghiệm nguyên liệu cao chiết từ Dâu tằmĐề tài: Tiêu chuẩn kiểm nghiệm nguyên liệu cao chiết từ Dâu tằm
Đề tài: Tiêu chuẩn kiểm nghiệm nguyên liệu cao chiết từ Dâu tằm
 
Đề tài: Giám sát và thu thập dữ liệu cho hệ thống băng tải, 9đ
Đề tài: Giám sát và thu thập dữ liệu cho hệ thống băng tải, 9đĐề tài: Giám sát và thu thập dữ liệu cho hệ thống băng tải, 9đ
Đề tài: Giám sát và thu thập dữ liệu cho hệ thống băng tải, 9đ
 
Chế phẩm bt
Chế phẩm btChế phẩm bt
Chế phẩm bt
 
Chương 5 phân tích protei trong thực phẩm- pttp 1
Chương 5  phân tích protei trong thực phẩm- pttp 1Chương 5  phân tích protei trong thực phẩm- pttp 1
Chương 5 phân tích protei trong thực phẩm- pttp 1
 
Nghiên cứu chế tạo và sử dụng vật liệu nano bạc, đồng, sắt để xử lý vi khuẩn ...
Nghiên cứu chế tạo và sử dụng vật liệu nano bạc, đồng, sắt để xử lý vi khuẩn ...Nghiên cứu chế tạo và sử dụng vật liệu nano bạc, đồng, sắt để xử lý vi khuẩn ...
Nghiên cứu chế tạo và sử dụng vật liệu nano bạc, đồng, sắt để xử lý vi khuẩn ...
 
Sản xuất phô mai
Sản xuất phô maiSản xuất phô mai
Sản xuất phô mai
 
Bài Giảng Vi Xử Lý ICTU
Bài Giảng Vi Xử Lý ICTUBài Giảng Vi Xử Lý ICTU
Bài Giảng Vi Xử Lý ICTU
 
Thông tư số 02/2018/TT-BYT Quy định thực hành tốt cơ sở bán lẻ thuốc
Thông tư số 02/2018/TT-BYT Quy định thực hành tốt cơ sở bán lẻ thuốcThông tư số 02/2018/TT-BYT Quy định thực hành tốt cơ sở bán lẻ thuốc
Thông tư số 02/2018/TT-BYT Quy định thực hành tốt cơ sở bán lẻ thuốc
 
VI ĐIỀU KHIỂN 8051
VI ĐIỀU KHIỂN 8051VI ĐIỀU KHIỂN 8051
VI ĐIỀU KHIỂN 8051
 
Baocao chocolate
Baocao chocolateBaocao chocolate
Baocao chocolate
 
Dây chuyền sản xuất nước dứa cô đặc.
Dây chuyền sản xuất nước dứa cô đặc.Dây chuyền sản xuất nước dứa cô đặc.
Dây chuyền sản xuất nước dứa cô đặc.
 
Luận văn: Sử dụng hệ thống câu hỏi trong dạy học Hóa lớp 10, 9đ
Luận văn: Sử dụng hệ thống câu hỏi trong dạy học Hóa lớp 10, 9đLuận văn: Sử dụng hệ thống câu hỏi trong dạy học Hóa lớp 10, 9đ
Luận văn: Sử dụng hệ thống câu hỏi trong dạy học Hóa lớp 10, 9đ
 
he-thong-bai-tap-plc-co-ban
he-thong-bai-tap-plc-co-banhe-thong-bai-tap-plc-co-ban
he-thong-bai-tap-plc-co-ban
 
Đề tài: Quá trình trích ly thu nhận Flavonoid từ củ cải trắng, 9đ
Đề tài: Quá trình trích ly thu nhận Flavonoid từ củ cải trắng, 9đĐề tài: Quá trình trích ly thu nhận Flavonoid từ củ cải trắng, 9đ
Đề tài: Quá trình trích ly thu nhận Flavonoid từ củ cải trắng, 9đ
 

Similar to Chuong 1 tin hoc cn minitab

Thống kê mô tả & Ước lượng thống kê
Thống kê mô tả & Ước lượng thống kêThống kê mô tả & Ước lượng thống kê
Thống kê mô tả & Ước lượng thống kêYen Luong-Thanh
 
07 acc201 bai 5_v1.0011103225
07 acc201 bai 5_v1.001110322507 acc201 bai 5_v1.0011103225
07 acc201 bai 5_v1.0011103225Yen Dang
 
Tạo form - Chuẩn bị dữ liệu
Tạo form - Chuẩn bị dữ liệu Tạo form - Chuẩn bị dữ liệu
Tạo form - Chuẩn bị dữ liệu Yen Luong-Thanh
 
SPC training.pptx
SPC training.pptxSPC training.pptx
SPC training.pptxTHihi5
 
Chương 5 & 6 Tương Quan Và Hồi Quy
Chương 5 & 6 Tương Quan Và Hồi QuyChương 5 & 6 Tương Quan Và Hồi Quy
Chương 5 & 6 Tương Quan Và Hồi QuyLe Nguyen Truong Giang
 
THCS_W11_BaiTap
THCS_W11_BaiTapTHCS_W11_BaiTap
THCS_W11_BaiTapCNTT-DHQG
 
Ktl bai tap 1-092 - dap an
Ktl bai tap 1-092 - dap anKtl bai tap 1-092 - dap an
Ktl bai tap 1-092 - dap anTuấn Nguyễn
 
PHƯƠNG PHÁP DỰ BÁO CHUỖI THỜI GIAN
PHƯƠNG PHÁP DỰ BÁO CHUỖI THỜI GIANPHƯƠNG PHÁP DỰ BÁO CHUỖI THỜI GIAN
PHƯƠNG PHÁP DỰ BÁO CHUỖI THỜI GIANCông Cẩn Chu
 
Bai tap quan tri chat luong
Bai tap quan tri chat luongBai tap quan tri chat luong
Bai tap quan tri chat luongxuanduong92
 
7 Công cụ quản lý chất lượng - Nâng cao kỹ năng phân tích - 7 QC tools
7 Công cụ quản lý chất lượng - Nâng cao kỹ năng phân tích - 7 QC tools7 Công cụ quản lý chất lượng - Nâng cao kỹ năng phân tích - 7 QC tools
7 Công cụ quản lý chất lượng - Nâng cao kỹ năng phân tích - 7 QC toolsThanh Nguyễn Văn
 
Huong dan su_dung_spss_ung_dung_trong_nghien_cuu_marketing
Huong dan su_dung_spss_ung_dung_trong_nghien_cuu_marketingHuong dan su_dung_spss_ung_dung_trong_nghien_cuu_marketing
Huong dan su_dung_spss_ung_dung_trong_nghien_cuu_marketingosevenphi
 
Huong danmatlab simulink
Huong danmatlab simulinkHuong danmatlab simulink
Huong danmatlab simulinkAnh Vu
 
De kiem tra hoc ki 1 tin hoc 7
De kiem tra hoc ki 1 tin hoc 7De kiem tra hoc ki 1 tin hoc 7
De kiem tra hoc ki 1 tin hoc 7Phụng Lâm Thanh
 
Phương pháp xử lý số liệu
Phương pháp xử lý số liệuPhương pháp xử lý số liệu
Phương pháp xử lý số liệunguoitinhmenyeu
 
DSKTD - C9 - Xu ly ket qua do.pptx
DSKTD - C9 - Xu ly ket qua do.pptxDSKTD - C9 - Xu ly ket qua do.pptx
DSKTD - C9 - Xu ly ket qua do.pptxssuserc841ef
 
Huong dan thuc_hanh_spss
Huong dan thuc_hanh_spssHuong dan thuc_hanh_spss
Huong dan thuc_hanh_spssTri Minh
 
Thực hành cơ sở lập trình C++ Fithou
Thực hành cơ sở lập trình C++ FithouThực hành cơ sở lập trình C++ Fithou
Thực hành cơ sở lập trình C++ FithouTTnguyen
 

Similar to Chuong 1 tin hoc cn minitab (20)

Thống kê mô tả & Ước lượng thống kê
Thống kê mô tả & Ước lượng thống kêThống kê mô tả & Ước lượng thống kê
Thống kê mô tả & Ước lượng thống kê
 
07 acc201 bai 5_v1.0011103225
07 acc201 bai 5_v1.001110322507 acc201 bai 5_v1.0011103225
07 acc201 bai 5_v1.0011103225
 
Tạo form - Chuẩn bị dữ liệu
Tạo form - Chuẩn bị dữ liệu Tạo form - Chuẩn bị dữ liệu
Tạo form - Chuẩn bị dữ liệu
 
SPC training.pptx
SPC training.pptxSPC training.pptx
SPC training.pptx
 
Chương 5 & 6 Tương Quan Và Hồi Quy
Chương 5 & 6 Tương Quan Và Hồi QuyChương 5 & 6 Tương Quan Và Hồi Quy
Chương 5 & 6 Tương Quan Và Hồi Quy
 
THCS_W11_BaiTap
THCS_W11_BaiTapTHCS_W11_BaiTap
THCS_W11_BaiTap
 
Ktl bai tap 1-092 - dap an
Ktl bai tap 1-092 - dap anKtl bai tap 1-092 - dap an
Ktl bai tap 1-092 - dap an
 
PHƯƠNG PHÁP DỰ BÁO CHUỖI THỜI GIAN
PHƯƠNG PHÁP DỰ BÁO CHUỖI THỜI GIANPHƯƠNG PHÁP DỰ BÁO CHUỖI THỜI GIAN
PHƯƠNG PHÁP DỰ BÁO CHUỖI THỜI GIAN
 
Bai tap quan tri chat luong
Bai tap quan tri chat luongBai tap quan tri chat luong
Bai tap quan tri chat luong
 
7 qc tools
7 qc tools7 qc tools
7 qc tools
 
7 Công cụ quản lý chất lượng - Nâng cao kỹ năng phân tích - 7 QC tools
7 Công cụ quản lý chất lượng - Nâng cao kỹ năng phân tích - 7 QC tools7 Công cụ quản lý chất lượng - Nâng cao kỹ năng phân tích - 7 QC tools
7 Công cụ quản lý chất lượng - Nâng cao kỹ năng phân tích - 7 QC tools
 
Huong dan su_dung_spss_ung_dung_trong_nghien_cuu_marketing
Huong dan su_dung_spss_ung_dung_trong_nghien_cuu_marketingHuong dan su_dung_spss_ung_dung_trong_nghien_cuu_marketing
Huong dan su_dung_spss_ung_dung_trong_nghien_cuu_marketing
 
Huong danmatlab simulink
Huong danmatlab simulinkHuong danmatlab simulink
Huong danmatlab simulink
 
Bài tập nhóm
Bài tập nhómBài tập nhóm
Bài tập nhóm
 
De kiem tra hoc ki 1 tin hoc 7
De kiem tra hoc ki 1 tin hoc 7De kiem tra hoc ki 1 tin hoc 7
De kiem tra hoc ki 1 tin hoc 7
 
Phương pháp xử lý số liệu
Phương pháp xử lý số liệuPhương pháp xử lý số liệu
Phương pháp xử lý số liệu
 
DSKTD - C9 - Xu ly ket qua do.pptx
DSKTD - C9 - Xu ly ket qua do.pptxDSKTD - C9 - Xu ly ket qua do.pptx
DSKTD - C9 - Xu ly ket qua do.pptx
 
test
testtest
test
 
Huong dan thuc_hanh_spss
Huong dan thuc_hanh_spssHuong dan thuc_hanh_spss
Huong dan thuc_hanh_spss
 
Thực hành cơ sở lập trình C++ Fithou
Thực hành cơ sở lập trình C++ FithouThực hành cơ sở lập trình C++ Fithou
Thực hành cơ sở lập trình C++ Fithou
 

Recently uploaded

QUẢN LÝ HOẠT ĐỘNG GIÁO DỤC KỸ NĂNG SỐNG CHO HỌC SINH CÁC TRƯỜNG TRUNG HỌC CƠ ...
QUẢN LÝ HOẠT ĐỘNG GIÁO DỤC KỸ NĂNG SỐNG CHO HỌC SINH CÁC TRƯỜNG TRUNG HỌC CƠ ...QUẢN LÝ HOẠT ĐỘNG GIÁO DỤC KỸ NĂNG SỐNG CHO HỌC SINH CÁC TRƯỜNG TRUNG HỌC CƠ ...
QUẢN LÝ HOẠT ĐỘNG GIÁO DỤC KỸ NĂNG SỐNG CHO HỌC SINH CÁC TRƯỜNG TRUNG HỌC CƠ ...ThunTrn734461
 
powerpoint lịch sử đảng cộng sản việt nam.pptx
powerpoint lịch sử đảng cộng sản việt nam.pptxpowerpoint lịch sử đảng cộng sản việt nam.pptx
powerpoint lịch sử đảng cộng sản việt nam.pptxAnAn97022
 
Đề cương môn giải phẫu......................
Đề cương môn giải phẫu......................Đề cương môn giải phẫu......................
Đề cương môn giải phẫu......................TrnHoa46
 
30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...
30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...
30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...Nguyen Thanh Tu Collection
 
SÁNG KIẾN ÁP DỤNG CLT (COMMUNICATIVE LANGUAGE TEACHING) VÀO QUÁ TRÌNH DẠY - H...
SÁNG KIẾN ÁP DỤNG CLT (COMMUNICATIVE LANGUAGE TEACHING) VÀO QUÁ TRÌNH DẠY - H...SÁNG KIẾN ÁP DỤNG CLT (COMMUNICATIVE LANGUAGE TEACHING) VÀO QUÁ TRÌNH DẠY - H...
SÁNG KIẾN ÁP DỤNG CLT (COMMUNICATIVE LANGUAGE TEACHING) VÀO QUÁ TRÌNH DẠY - H...Nguyen Thanh Tu Collection
 
GIÁO TRÌNH KHỐI NGUỒN CÁC LOẠI - ĐIỆN LẠNH BÁCH KHOA HÀ NỘI
GIÁO TRÌNH  KHỐI NGUỒN CÁC LOẠI - ĐIỆN LẠNH BÁCH KHOA HÀ NỘIGIÁO TRÌNH  KHỐI NGUỒN CÁC LOẠI - ĐIỆN LẠNH BÁCH KHOA HÀ NỘI
GIÁO TRÌNH KHỐI NGUỒN CÁC LOẠI - ĐIỆN LẠNH BÁCH KHOA HÀ NỘIĐiện Lạnh Bách Khoa Hà Nội
 
Chuong trinh dao tao Su pham Khoa hoc tu nhien, ma nganh - 7140247.pdf
Chuong trinh dao tao Su pham Khoa hoc tu nhien, ma nganh - 7140247.pdfChuong trinh dao tao Su pham Khoa hoc tu nhien, ma nganh - 7140247.pdf
Chuong trinh dao tao Su pham Khoa hoc tu nhien, ma nganh - 7140247.pdfhoangtuansinh1
 
Sáng kiến Dạy học theo định hướng STEM một số chủ đề phần “vật sống”, Khoa họ...
Sáng kiến Dạy học theo định hướng STEM một số chủ đề phần “vật sống”, Khoa họ...Sáng kiến Dạy học theo định hướng STEM một số chủ đề phần “vật sống”, Khoa họ...
Sáng kiến Dạy học theo định hướng STEM một số chủ đề phần “vật sống”, Khoa họ...Nguyen Thanh Tu Collection
 
30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...
30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...
30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...Nguyen Thanh Tu Collection
 
30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...
30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...
30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...Nguyen Thanh Tu Collection
 
30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...
30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...
30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...Nguyen Thanh Tu Collection
 
Campbell _2011_ - Sinh học - Tế bào - Ref.pdf
Campbell _2011_ - Sinh học - Tế bào - Ref.pdfCampbell _2011_ - Sinh học - Tế bào - Ref.pdf
Campbell _2011_ - Sinh học - Tế bào - Ref.pdfTrnHoa46
 
sách sinh học đại cương - Textbook.pdf
sách sinh học đại cương   -   Textbook.pdfsách sinh học đại cương   -   Textbook.pdf
sách sinh học đại cương - Textbook.pdfTrnHoa46
 
BỘ ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...
BỘ ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...BỘ ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...
BỘ ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...Nguyen Thanh Tu Collection
 
Sáng kiến “Sử dụng ứng dụng Quizizz nhằm nâng cao chất lượng ôn thi tốt nghiệ...
Sáng kiến “Sử dụng ứng dụng Quizizz nhằm nâng cao chất lượng ôn thi tốt nghiệ...Sáng kiến “Sử dụng ứng dụng Quizizz nhằm nâng cao chất lượng ôn thi tốt nghiệ...
Sáng kiến “Sử dụng ứng dụng Quizizz nhằm nâng cao chất lượng ôn thi tốt nghiệ...Nguyen Thanh Tu Collection
 
TỔNG HỢP ĐỀ THI CHÍNH THỨC KỲ THI TUYỂN SINH VÀO LỚP 10 THPT MÔN NGỮ VĂN NĂM ...
TỔNG HỢP ĐỀ THI CHÍNH THỨC KỲ THI TUYỂN SINH VÀO LỚP 10 THPT MÔN NGỮ VĂN NĂM ...TỔNG HỢP ĐỀ THI CHÍNH THỨC KỲ THI TUYỂN SINH VÀO LỚP 10 THPT MÔN NGỮ VĂN NĂM ...
TỔNG HỢP ĐỀ THI CHÍNH THỨC KỲ THI TUYỂN SINH VÀO LỚP 10 THPT MÔN NGỮ VĂN NĂM ...Nguyen Thanh Tu Collection
 
30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...
30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...
30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...Nguyen Thanh Tu Collection
 
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 7 GLOBAL SUCCESS (2 CỘ...
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 7 GLOBAL SUCCESS (2 CỘ...GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 7 GLOBAL SUCCESS (2 CỘ...
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 7 GLOBAL SUCCESS (2 CỘ...Nguyen Thanh Tu Collection
 
chuong-7-van-de-gia-dinh-trong-thoi-ky-qua-do-len-cnxh.pdf
chuong-7-van-de-gia-dinh-trong-thoi-ky-qua-do-len-cnxh.pdfchuong-7-van-de-gia-dinh-trong-thoi-ky-qua-do-len-cnxh.pdf
chuong-7-van-de-gia-dinh-trong-thoi-ky-qua-do-len-cnxh.pdfVyTng986513
 

Recently uploaded (20)

QUẢN LÝ HOẠT ĐỘNG GIÁO DỤC KỸ NĂNG SỐNG CHO HỌC SINH CÁC TRƯỜNG TRUNG HỌC CƠ ...
QUẢN LÝ HOẠT ĐỘNG GIÁO DỤC KỸ NĂNG SỐNG CHO HỌC SINH CÁC TRƯỜNG TRUNG HỌC CƠ ...QUẢN LÝ HOẠT ĐỘNG GIÁO DỤC KỸ NĂNG SỐNG CHO HỌC SINH CÁC TRƯỜNG TRUNG HỌC CƠ ...
QUẢN LÝ HOẠT ĐỘNG GIÁO DỤC KỸ NĂNG SỐNG CHO HỌC SINH CÁC TRƯỜNG TRUNG HỌC CƠ ...
 
powerpoint lịch sử đảng cộng sản việt nam.pptx
powerpoint lịch sử đảng cộng sản việt nam.pptxpowerpoint lịch sử đảng cộng sản việt nam.pptx
powerpoint lịch sử đảng cộng sản việt nam.pptx
 
Đề cương môn giải phẫu......................
Đề cương môn giải phẫu......................Đề cương môn giải phẫu......................
Đề cương môn giải phẫu......................
 
30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...
30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...
30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...
 
SÁNG KIẾN ÁP DỤNG CLT (COMMUNICATIVE LANGUAGE TEACHING) VÀO QUÁ TRÌNH DẠY - H...
SÁNG KIẾN ÁP DỤNG CLT (COMMUNICATIVE LANGUAGE TEACHING) VÀO QUÁ TRÌNH DẠY - H...SÁNG KIẾN ÁP DỤNG CLT (COMMUNICATIVE LANGUAGE TEACHING) VÀO QUÁ TRÌNH DẠY - H...
SÁNG KIẾN ÁP DỤNG CLT (COMMUNICATIVE LANGUAGE TEACHING) VÀO QUÁ TRÌNH DẠY - H...
 
GIÁO TRÌNH KHỐI NGUỒN CÁC LOẠI - ĐIỆN LẠNH BÁCH KHOA HÀ NỘI
GIÁO TRÌNH  KHỐI NGUỒN CÁC LOẠI - ĐIỆN LẠNH BÁCH KHOA HÀ NỘIGIÁO TRÌNH  KHỐI NGUỒN CÁC LOẠI - ĐIỆN LẠNH BÁCH KHOA HÀ NỘI
GIÁO TRÌNH KHỐI NGUỒN CÁC LOẠI - ĐIỆN LẠNH BÁCH KHOA HÀ NỘI
 
1 - MÃ LỖI SỬA CHỮA BOARD MẠCH BẾP TỪ.pdf
1 - MÃ LỖI SỬA CHỮA BOARD MẠCH BẾP TỪ.pdf1 - MÃ LỖI SỬA CHỮA BOARD MẠCH BẾP TỪ.pdf
1 - MÃ LỖI SỬA CHỮA BOARD MẠCH BẾP TỪ.pdf
 
Chuong trinh dao tao Su pham Khoa hoc tu nhien, ma nganh - 7140247.pdf
Chuong trinh dao tao Su pham Khoa hoc tu nhien, ma nganh - 7140247.pdfChuong trinh dao tao Su pham Khoa hoc tu nhien, ma nganh - 7140247.pdf
Chuong trinh dao tao Su pham Khoa hoc tu nhien, ma nganh - 7140247.pdf
 
Sáng kiến Dạy học theo định hướng STEM một số chủ đề phần “vật sống”, Khoa họ...
Sáng kiến Dạy học theo định hướng STEM một số chủ đề phần “vật sống”, Khoa họ...Sáng kiến Dạy học theo định hướng STEM một số chủ đề phần “vật sống”, Khoa họ...
Sáng kiến Dạy học theo định hướng STEM một số chủ đề phần “vật sống”, Khoa họ...
 
30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...
30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...
30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...
 
30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...
30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...
30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...
 
30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...
30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...
30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...
 
Campbell _2011_ - Sinh học - Tế bào - Ref.pdf
Campbell _2011_ - Sinh học - Tế bào - Ref.pdfCampbell _2011_ - Sinh học - Tế bào - Ref.pdf
Campbell _2011_ - Sinh học - Tế bào - Ref.pdf
 
sách sinh học đại cương - Textbook.pdf
sách sinh học đại cương   -   Textbook.pdfsách sinh học đại cương   -   Textbook.pdf
sách sinh học đại cương - Textbook.pdf
 
BỘ ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...
BỘ ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...BỘ ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...
BỘ ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...
 
Sáng kiến “Sử dụng ứng dụng Quizizz nhằm nâng cao chất lượng ôn thi tốt nghiệ...
Sáng kiến “Sử dụng ứng dụng Quizizz nhằm nâng cao chất lượng ôn thi tốt nghiệ...Sáng kiến “Sử dụng ứng dụng Quizizz nhằm nâng cao chất lượng ôn thi tốt nghiệ...
Sáng kiến “Sử dụng ứng dụng Quizizz nhằm nâng cao chất lượng ôn thi tốt nghiệ...
 
TỔNG HỢP ĐỀ THI CHÍNH THỨC KỲ THI TUYỂN SINH VÀO LỚP 10 THPT MÔN NGỮ VĂN NĂM ...
TỔNG HỢP ĐỀ THI CHÍNH THỨC KỲ THI TUYỂN SINH VÀO LỚP 10 THPT MÔN NGỮ VĂN NĂM ...TỔNG HỢP ĐỀ THI CHÍNH THỨC KỲ THI TUYỂN SINH VÀO LỚP 10 THPT MÔN NGỮ VĂN NĂM ...
TỔNG HỢP ĐỀ THI CHÍNH THỨC KỲ THI TUYỂN SINH VÀO LỚP 10 THPT MÔN NGỮ VĂN NĂM ...
 
30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...
30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...
30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...
 
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 7 GLOBAL SUCCESS (2 CỘ...
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 7 GLOBAL SUCCESS (2 CỘ...GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 7 GLOBAL SUCCESS (2 CỘ...
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 7 GLOBAL SUCCESS (2 CỘ...
 
chuong-7-van-de-gia-dinh-trong-thoi-ky-qua-do-len-cnxh.pdf
chuong-7-van-de-gia-dinh-trong-thoi-ky-qua-do-len-cnxh.pdfchuong-7-van-de-gia-dinh-trong-thoi-ky-qua-do-len-cnxh.pdf
chuong-7-van-de-gia-dinh-trong-thoi-ky-qua-do-len-cnxh.pdf
 

Chuong 1 tin hoc cn minitab

  • 1. 5 Chương I XỬ LÝ DỮ LIỆU TRONG CHĂN NUÔI THÚ Y 1. ỨNG DỤNG MINITAB TRONG XỬ LÝ SỐ LIỆU Minitab 14 for Windows XP ñược sử dụng ñể minh hoạ cho các bài tập trong phần giáo trình này. Nếu bạn ñọc sử dụng các phiên bản khác của Minitab có thể sẽ không ñược hỗ trợ một số các công cụ và giao diện sẽ khác so với giáo trình này. 1.1. Khởi ñộng Minitab Nếu cài ñặt Minitab 14 for Windows XP theo mặc ñịnh ta có thể khởi ñộng phần mềm bằng cách 1) Chọn biểu tượng Minitab trên Desktop của màn hình hoặc 2) Theo ñường dẫn Stat > Progam > MINITAB 14 > MINITAB 14 3) C:Progam FilesMINITAB 14Mtb14.exe Giao diện phần mềm Minitab 14 for Windows XP gồm một số thành phần chính: 1) Menu Bar, 2) Standard toolbar, 3) Project Manager Toolbar, 4) Worksheet Toolbar, 5) Title, 6) Session Window, 7) Data Window 8) Project Manager Window và 8) Status bar. Menu Bar Standard Toolbar Project Manager Toolbar Title Session Window Data Window (Worksheet Windows) Status Bar Worksheet Toolbar Project Manager Windows
  • 2. 6 1.2. Nhật ñồ và thống kê a. Tóm tắt dữ liệu ñối với biến ñịnh lượng Ví dụ 1.1: Khối lượng (gam) của 16 chuột cái tại thời ñiểm cai sữa như sau: 54,1 49,8 24,0 46,0 44,1 34,0 52,6 54,4 56,1 52,0 51,9 54,0 58,0 39,0 32,7 58,5 ðể tính các tham số thống kê mô tả Số liệu ñược nhập vào vào cột trong Windows Worksheet Thay thế dấu phẩy (,) bằng dấu chấm (.) trong phần thập phân. Ô số liệu khuyết ñược thay thế bằng dấu sao (*), không ñược ñể trống. Cột số liệu phải ở dưới dạng số. ðối với một chỉ tiêu nghiên cứu, số liệu ñược nhập dưới dạng cột. Tên cột số liệu luôn nằm ở trên hàng thứ 1. ðặt tên cột ngắn gọn, không nên dùng các ký tự ñặc biệt (:, /…) hoặc các ký tự tiếng Việt (ô, ă…). Trong cùng một worksheet không ñặt tên cột trùng nhau. Phần mềm Minitab không phân biệt ñược các ký tự viết hoa và viết thường (ví dụ: MINITAB = Minitab = minitab). Chọn Stat Basic Statistics Display Descriptive Statistics Phần ô bên trái hộp thoại hiển thị cột (C1) và tên của cột số liệu (P) Chọn P và nhấn Select ñể hiển thị cột cần tính các tham số thống kê mô tả vào ô Variables. Chọn OK ñể hiển thị kết quả. Kết quả thu ñược từ Minitab như sau Descriptive Statistics: P Variable N N* Mean SE Mean StDev Minimum Q1 Median Q3 Maximum P 16 0 47.58 2.54 10.16 24.00 40.28 51.95 54.33 58.50
  • 3. 7 Minitab cho kết quả theo mặc ñịnh. Có thể sử dụng một trong các tùy chọn (option) sau ñây ñể cho ra kết quả phù hợp Chọn Statistics…có thể lựa chọn các tham số sau ñây Một số thuật ngữ trong options Minitab của thống kê mô tả Minitab Tiếng Việt Minitab Tiếng Việt Mean Trung bình Trimmed mean Trung bình hiệu chỉnh SE of mean Sai số tiêu chuẩn Sum Tổng số Standard deviation ðộ lệch chuẩn Minimum Giá trị bé nhất Variance Phương sai Maximum Giá trị lớn nhất Coefficient of variation Hệ số biến ñộng Range Khoảng biến ñộng First quartile Tứ vị thứ nhất Sum of squares Tổng bình phương Median Trung vị Skewness ðộ lệch Third quartile Tứ vị thứ 3 Kurtosis ðộ nhọn Interquartile Tứ vị thứ 2 MSSD N nonmissing N không khuyết Cumulative N N cộng gộp N missing N khuyết Percent Phần trăm N total N tổng số Cumulative percent Phần trăm cộng gộp Chọn Graphs…ñể hiển các loại thị ñồ thị sau ñây: Histogam of data tổ chức ñồ Histogam of data, with normal curve tổ chức ñồ với ñường cong chuẩn Individual value plot vẽ từng giá trị Boxplot of data ñồ thị hộp Chọn OK ñể có ñược ñồ thị Ví dụ chọn Boxplot of data ñể có ñược ñồ thị hộp dưới ñây
  • 4. 8 Khai báo vào By variables (Optional) ñể tính các tham số thống kê theo phân loại nhóm. Xét Ví dụ 1.1, giả sử rằng 8 chuột cái ñầu tiên sinh ra ở lứa thứ nhất và 8 chuột tiếp theo sinh ra ở lứa thứ 2. Ta có thể bố trí cấu trúc số liệu thành 2 cột, cột C1 (P) và cột C2 (LUA) Kết quả từ Minitab Descriptive Statistics: P Variable LUA N N* Mean SE Mean StDev Minimum Q1 Median Q3 P 1 8 0 44.88 3.82 10.79 24.00 36.53 47.90 53.73 2 8 0 50.28 3.32 9.39 32.70 42.23 53.00 57.53 b. Tóm tắt dữ liệu ñối với biến ñịnh tính ðối với biến ñịnh tính số liệu thô thu thập ñược từ thí nghiệm có thể ñược trình bày theo một trong 2 cách sau ñây:
  • 5. 9 Ví dụ 1.2: Số bò sữa ở ba trại A, B, C lần lượt là 106, 132 và 122 con. Chọn ngẫu nhiên và kiểm tra bệnh viêm nội mạc tử cung ở 3 trại, kết quả như sau: Cách 1: Trại A A A A A A A A A A A A A A A A A Bò số 1 2 3 4 5 6 7 8 9 10 1 12 13 14 15 16 17 Kết quả + - - - + + + - - - + - - - - - + Trại B B B B B B B B B B B B B B B B B B B B B B Bò số 1 2 3 4 5 6 7 8 9 10 1 12 13 14 15 16 17 18 19 20 21 22 Kết quả - - + - - - - - + + - - - - - + - + - + - - Trại C C C C C C C C C C C C C C C C C C C C Bò số 1 2 3 4 5 6 7 8 9 10 1 12 13 14 15 16 17 18 19 20 Kết quả + + - - - - + - - - + - + - - - - + + + Cách 2: Trại Viêm nội mạc tử cung Tổng số Có Không A 6 11 17 B 6 16 22 C 8 12 20 Số liệu ñược nhập vào cột trong Windows Worksheet (với cách 1) Nhập dữ liệu vào 2 cột, Trại vào cột C1 (TRAI) và cột Kết quả xét nghiệm vào cột C2 (KETQUA). Lưu ý: Sau khi nhập thông tin vào cột C1 và C2 ký hiệu ở thay ñổi tương ứng C1-T và C2-T. Minitab thông báo các thông tin trong cột không phải dưới dạng số mà dưới dạng ký tự (Text) Với số liệu ở dạng thô (cách 1) có thể tạo thành bảng tóm tắt như ở cách 2 bằng các lệnh sau Stat Tables Cross Tabulation and Chi-Square... Khai báo vào ô For rows và For columns
  • 6. 10 Options Display hiển thị: Count tần số ñối với từng trường hợp Row percents tỷ lệ (phần trăm) theo hàng Column percents tỷ lệ (phần trăm) theo cột Total percents tỷ lệ (phần trăm) theo hàng/cột tổng số Chọn OK ñể có kết quả Tabulated statistics: TRAI; KETQUA Rows: TRAI Columns: KETQUA - + All A 11 6 17 B 16 6 22 C 12 8 20 All 39 20 59 Cell Contents: Count ðối với biến ñịnh tính có thể mô tả bằng biểu ñồ thanh (Bar Chart), biểu ñồ bánh (Pie Chart). Graph Bar Chart…Counts of unique values Chọn OK Chọn Multiple Graphs… Chọn OK ñể có biểu ñồ thanh Thực hiện tương tự ñể có biểu ñồ bánh
  • 7. 11 Số liệu ñược nhập vào cột trong Windows Worksheet (với cách 2) Nhập dữ liệu vào 3 cột, Trại vào cột C1 (TRAI), cột Kết quả xét nghiệm vào cột C2 (KETQUA) và Tần suất vào cột C3 (TANSUAT). dạng ký tự (Text) Với số liệu ở dạng thô (cách 1) có thể tạo thành bảng tóm tắt như ở cách 2 bằng các lệnh sau Stat Tables Cross Tabulation and Chi-Square... Khai báo vào ô For rows, For columns và Frequencies are in. Chọn Counts và Row percents trong Display ñể có kết quả Tabulated statistics: TRAI; KETQUA Using frequencies in TANSUAT Rows: TRAI Columns: KETQUA - + All A 11 6 17 64.71 35.29 100.00 B 16 6 22 72.73 27.27 100.00 C 12 8 20 60.00 40.00 100.00 All 39 20 59 66.10 33.90 100.00 Cell Contents: Count % of Row Biểu ñồ trong cách nhập số liệu thứ 2 hoàn toàn giống như ở cách nhập số liệu, tuy nhiên cách khai báo trong hộp thoại có một số ñiểm khác Graph Bar Chart…Values from table Khai báo vào ô Graph variables và Categorical variables
  • 8. 12 1.3. Ước lượng và kiểm ñịnh giá trị trung bình a. Kiểm ñịnh phân phối chuẩn ðối với tất cả các phép thử dưới ñây biến ñịnh lượng ñều ñược giả thiết là số liệu thu thập ñược (số liệu thô) tuân theo phân phối chuẩn. Nếu số liệu không tuân theo phân phối chuẩn thì các phép thử sẽ không có hiệu lực. Trong trường hợp này cần biến ñổi số liệu về phân phối chuẩn hoặc sử dụng kiểm ñịnh phi tham số. Giả thiết của phép thử: H0: Số liệu có phân bố chuẩn và H1: Số liệu không có phân bố chuẩn Ví dụ 1.3: Tăng trọng trung bình (gam/ngày) của 36 lợn nuôi vỗ béo giống Landrace ñược rút ngẫu nhiên từ một trại chăn nuôi. Số liệu thu ñược như sau: 577 596 594 612 600 584 618 627 588 601 606 559 615 607 608 591 565 586 621 623 598 602 581 631 570 595 603 605 616 574 578 600 596 619 636 589 Cán bộ kỹ thuật trại cho rằng tăng trọng trung bình của toàn ñàn lợn trong trại là 607gam/ngày. Theo anh chị kết luận ñó ñúng hay sai, vì sao? Biết rằng ñộ lệch chuẩn của tính trạng này là 21,75 gam. Nhập số liệu vào Worksheet Stat Basic Statistics Normality Test... Chọn OK ñể có kết quả
  • 9. 13 Giá trị P-Value = 0,997 trong ñồ thị trên lớn hơn 0,05 (α), như vậy H0 ñược chấp nhận. Kết luận số liệu tuân theo phân phối chuẩn. b. Phép thử Z Sử dụng phép thử Z ñể kiểm ñịnh một giá trị trung bình khi biết ñộ lệch chuẩn của quần thể (σ σ σ σ). Minitab sẽ tính khoảng tin cậy (CI 95%) và thực hiện phép kiểm ñịnh. ðối với kiểm ñịnh 2 phía ta có giả thiết: H0: µ = µ0 với ñối thiết µ ≠ µ0; trong ñó µ là giá trị trung bình của quần thể và µ0 là giá trị kiểm ñịnh. Stat Basic Statistics 1-sample Z... Trong Samples in columns khai báo cột số liệu (P). Trong Standard deviation ñiền giá trị 21,75 (ñộ lệch chuẩn của quần thể σ σ σ σ). Trong Test mean ñiền giá trị 607 (giá trị quần thể kiểm ñịnh µ0). Chọn OK ñể có kết quả One-Sample Z: P Test of mu = 607 vs not = 607 The assumed standard deviation = 21.75 Variable N Mean StDev SE Mean 95% CI Z P P 36 599.194 18.656 3.625 (592.090; 606.299) -2.15 0.031 Với xác suất của phép thử P = 0,031 0,05 (α), bác bỏ H0 và chấp nhận ñối thiết H1. Kết luận: Tăng trọng của lợn Landrace ở trại nêu trên không bằng 607 gam/ ngày (P 0,05). Khoảng tin cậy 95% là 592,090 – 606,299 gam/ ngày. Lưu ý: Trong một số trường hợp, số liệu ñã ñược tóm tắt (số liệu tinh) dưới dạng các tham số thống kê mô tả. Như ở ví dụ 1.3 ta có n = 36; _ x = 599,194 gam. Vì vậy các giá trị này có thể sử dụng ñể khai báo vào lựa chọn Summarized data, các giá trị khác (σ và µ) ñược khai báo tương tự ñể có kết quả sau One-Sample Z Test of mu = 607 vs not = 607 The assumed standard deviation = 21.75 N Mean SE Mean 95% CI Z P 36 599.194 3.625 (592.089; 606.299) -2.15 0.031
  • 10. 14 c. Phép thử T Trong trường hợp không biết ñộ lệch chuẩn của quần thể (σ), phép thử T ñược sử dụng ñể kiểm ñịnh giá trị trung bình và ñộ lệch chuẩn của mẫu (s) ñược sử dụng thay ñộ lệch chuẩn quần thể. Giả thiết của phép thử, cấu trúc số liệu tương tự như ở phép thử Z. Stat Basic Statistics 1-sample T... Khai báo ñối với số liệu thô .. và ñối với số liệu tinh Chọn OK ñể có kết quả One-Sample T: P Test of mu = 607 vs not = 607 Variable N Mean StDev SE Mean 95% CI T P P 36 599.194 18.656 3.109 (592.882; 605.507) -2.51 0.017 Với P = 0,017 ta cũng có kết luận tương tự như ñối với khi sử phép thử Z. 1.4. Kiểm ñịnh 2 giá trị trung bình Khi tiến hành thí nghiệm ñể so sánh sự khác nhau giữa 2 công thức thí nghiệm, có 2 trường hợp chọn mẫu có thể xảy ra: 1) Chọn mẫu ñộc lập và 2) chọn mẫu theo cặp (xem 2.4, tr.23, Giáo trình Thiết kế thí nghiệm 2007). Tuỳ thuộc vào cách chọn mẫu bố trí thí nghiệm mà ta có thể sử dụng phép thử T hay T cặp cho phù hợp. a. Kiểm ñịnh sự ñồng nhất của phương sai khi lấy mẫu ñộc lập ðối với kiểm ñịnh 2 giá trị trung bình, ngoài giả thiết là số liệu tuân theo phân phối chuẩn, còn vấn ñề thứ 2 là Hai phương sai có ñồng nhất hay không? ðối với kiểm ñịnh hai phía ta có giả thiết H0: Hai phương sai ñồng nhất (σ²1 = σ²2) và H1: Hai phương sai không ñồng nhất (σ²1 ≠ σ²2) . Khi chấp nhận giả thiết H0, phương sai chung (σ2 )sẽ ñược sử dụng ñể tiến hành kiểm ñịnh trong phép thử T; ngược lại (bác bỏ H0) thì phép thử T gần ñúng sẽ ñược thực hiện. Ví dụ 1.4: ðể so sánh khối lượng của 2 giống bò, tiến hành chọn ngẫu nhiên và cân 12 con ñối với giống thứ nhất và 15 con ñối với giống thứ 2. Khối lượng (kg) thu ñược như sau: Giống bò thứ nhất 187,6 180,3 198,6 190,7 196,3 203,8 190,2 201,0 194,7 221,1 186,7 203,1 Giống bò thứ hai 148,1 146,2 152,8 135,3 151,2 146,3 163,5 146,6 162,4 140,2 159,4 181,8 165,1 165,0 141,6
  • 11. 15 Theo anh (chị), khối lượng của 2 giống bò có sự sai khác không? Cấu trúc số liệu của bài toán kiểm ñịnh 2 giá trị trung bình có thể ñược trình bày bằng một trong 2 cách sau ñây: Cách 1: Số liệu của 2 công thức thí nghiệm ñược nhập vào một cột và cột thứ 2 ñể xác ñịnh giá trị của từng công thức .... Cách 2: Số liệu ñược nhập vào 2 cột riêng biệt theo từng công thức thí nghiệm. Tên cột thể hiện giá trị trong mỗi công thức Lưu ý: Cấu trúc số liệu có thể nhập trong cùng một Worksheet hoặc 2 Worksheet riêng biệt. Stat Basic Statistics 2 Variances... Cấu trúc số liệu cách 1 ... cách 2 Có thể sử dụng Summarized data khi số liệu ñã ñược tinh hoá. ðối với trường hợp này cần khai báo dung lượng mẫu (Sample size) và phương sai (Variance) ñối với từng công thức thí nghiệm tương ứng (First hoặc Second). Chọn OK ñể có kết quả
  • 12. 16 Test for Equal Variances: KL versus GIONG 95% Bonferroni confidence intervals for standard deviations GIONG N Lower StDev Upper 1 12 7.17875 10.6160 19.6238 2 15 8.63359 12.3014 20.8502 F-Test (normal distribution) Test statistic = 0.74; p-value = 0.631 Levene's Test (any continuous distribution) Test statistic = 0.46; p-value = 0.503 Xác suất p-value = 0,631 0,05 (α) vì vậy H0 ñược chấp nhận. Kết luận hai phương sai ñồng nhất (P 0,05). b. Phép thử T Sử dụng phép thử T ñể kiểm ñịnh 2 giá trị trung bình khi không biết ñộ lệch chuẩn của quần thể (σ σ σ σ). Minitab sẽ tính khoảng tin cậy (CI 95%) sự chênh lệch giữa 2 giá trị trung bình quần thể và thực hiện phép kiểm ñịnh. ðối với kiểm ñịnh 2 phía ta có giả thiết: H0: µ1 = µ2 với ñối thiết H1: µ1 ≠ µ2; trong ñó µ1 và µ2 là giá trị trung bình của quần thể thứ nhất và thứ 2. Stat Basic Statistics 2-Sample T... Có thể sử dụng Summarized data khi số liệu ñã ñược tinh hoá. ðối với trường hợp này cần khai báo dung lượng mẫu (Sample size), giá trị trung bình (Mean) và ñộ lệch chuẩn (Standard deviation) ñối với từng công thức thí nghiệm tương ứng (First hoặc Second). Chọn Assume equal variances nếu 2 phương sai ñồng nhất và ngược lại nếu 2 phương sai không ñồng nhất (xem 4.1). Chọn hiển thị ñồ thị trong Graphs... và mức tin cậy trong Options..., theo mặc ñịnh Minitab tính khoảng tin cậy 95%. Với cấu trúc số liệu cách 1 ... cách 2 Chọn OK ñể có kết quả
  • 13. 17 Two-Sample T-Test and CI: KL; GIONG Two-sample T for KL GIONG N Mean StDev SE Mean 1 12 196.2 10.6 3.1 2 15 153.7 12.3 3.2 Difference = mu (1) - mu (2) Estimate for difference: 42.4750 95% CI for difference: (33.2301; 51.7199) T-Test of difference = 0 (vs not =): T-Value = 9.46 P-Value = 0.000 DF = 25 Both use Pooled StDev = 11.5901 Xác suất p-value = 0,000 0,05 (α) vì vậy H0 bị bác bỏ và H1 ñược chấp nhận. Kết luận rằng Khối lượng của hai giống bò có sự sai khác (P-value 0,05). c. Phép thử T cặp ñôi ðối với các thí nghiệm chọn mẫu theo cặp, ñiều kiện duy nhất của bài toán là kiểm tra phân bố chuẩn của phần chênh lệch (d) số liệu giữa 2 công thức thí nghiệm. Với kiểm ñịnh 2 phía ta có giả thiết H0: µd = 0 ñối thiết H1: µd ≠ 0 (µd là trung bình của sự chênh lệch giữa 2 trung bình µ1 và µ2). Ví dụ 1.5: Tăng trọng (pound) của 10 cặp bê sinh ñôi giống hệt nhau với hai chế ñộ chăm sóc khác nhau (A và B). Bê trong từng cặp ñược bắt thăm ngẫu nhiên về một trong hai cách chăm sóc. Hãy kiểm ñịnh giả thiết H0: Tăng trọng trung bình ở hai cách chăm sóc như nhau, ñối thiết H1: Tăng trọng trung bình ở hai cách chăm sóc khác nhau với mức ý nghĩa α = 0,05. Số liệu thu ñược như sau: Cặp sinh ñôi 1 2 3 4 5 6 7 8 9 10 Tăng trọng ở cách A 43 39 39 42 46 43 38 44 51 43 Tăng trọng ở cách B 37 35 34 41 39 37 35 40 48 36 Chênh lệch (d) 6 4 5 1 7 6 3 4 3 7 Nhập số liệu vào Worksheet Lưu ý: Số liệu ñược nhập vào Worksheet theo một cách duy nhất vào 2 cột theo từng cặp số liệu tương ứng. Thứ tự các cặp số liệu không ñóng vai trò quan trọng. Sự thay ñổi vị trí trong 1 cặp có thể ñưa ta ñến các kết luận thiếu chính xác.
  • 14. 18 Calc Calculator... …chọn OK ñể có ñược phần chênh lệch Tiến hành kiểm ñịnh phân bố chuẩn của phần chênh lệch D (xem 4.1) Stat Basic Statistics Paired T.. Có thể sử dụng Summarized data (differences) khi sử dụng các thông tin của cột chênh lệch D ñể kiểm ñịnh. ðối với trường hợp này cần khai báo dung lượng mẫu (Sample size), giá trị trung bình (Mean) và ñộ lệch chuẩn (Standard deviation) của cột D. Chọn hiển thị ñồ thị trong Graphs... và mức tin cậy trong Options..., theo mạc ñịnh Minitab tính khoảng tin cậy 95%. Chọn OK ñể có kết quả Paired T-Test and CI: A; B Paired T for A - B N Mean StDev SE Mean A 10 42.8000 3.8239 1.2092 B 10 38.2000 4.1312 1.3064 Difference 10 4.60000 1.95505 0.61824 95% CI for mean difference: (3.20144; 5.99856) T-Test of mean difference = 0 (vs not = 0): T-Value = 7.44 P-Value = 0.000 Xác suất p-value = 0,000 0,05 (α) vì vậy H0 bị bác bỏ và H1 ñược chấp nhận. Kết luận rằng Tăng trọng trung bình ở hai cách chăm sóc có sự sai khác (P-value 0,05). 1.5. Phân tích phương sai Phân tích phương sai (Analysis of Variance - ANOVA) là công cụ hữu ích ñể so sánh nhiều giá trị trung bình. ðiều kiện của bài toán phân tích phương sai là 1) số liệu tuân theo phân bố chuẩn và 2) phương sai ñồng nhất. Trong khuôn khổ giáo trình này chúng tôi chỉ ñề cập ñến việc kiểm tra ñiều kiện của bài toán ñối với các mô hình thiết kế thí nghiệm ñơn giản (Thí nghiệm một yếu tố hoàn toàn ngẫu nhiên). ðể kiểm ñịnh 2 phía ta có giả thiết H0: µ1 = µ2 = ... = µa ñối thiết H1: µ1 ≠ µ2 ≠ ...≠ µa (µ là trung bình của quần thể ở công thức thí nghiệm thứ 1, 2, ...a).
  • 15. 19 a. Thí nghiệm một yếu tố hoàn toàn ngẫu nhiên Xét trường hợp ñơn giản nhất ñối với bài toán phân tích phương sai. Chỉ có một yếu tố duy nhất trong thí nghiệm, các yếu tố phi thí nghiệm còn lại ñược coi là có tác ñộng như nhau ñến ñối tượng thí nghiệm. Ví dụ 1.6: Theo dõi tăng trọng của cá (kg) trong thí nghiệm với 5 công thức nuôi (A, B, C, D và E). Hãy cho biết tăng trọng của cá ở các công thức nuôi. Nếu có sự khác nhau thì tiến hành so sánh sự sai khác của từng cặp giá trị trung bình. A B C D E 0,95 0,43 0,70 1,00 0,90 0,85 0,45 0,90 0,95 1,00 0,85 0,40 0,75 0,90 0,95 0,90 0,42 0,70 0,90 0,95 Cấu trúc số liệu của bài toán kiểm ñịnh nhiều giá trị trung bình có thể ñược trình bày bằng một trong 2 cách sau: Cách 1: Số liệu của các công thức thí nghiệm ñược nhập vào một cột và cột thứ 2 ñể xác ñịnh giá trị của từng công thức Cách 2: Số liệu ñược nhập vào các cột riêng biệt theo công thức thí nghiệm. Tên cột thể hiện giá trị trong mỗi công thức Kiểm tra ñiều kiện của bài toán (sự ñồng nhất của phương sai và phân phối chuẩn của số liệu) sẽ ñược trình bày sau. Tiến hành so sánh các giá trị trung bình bằng phép phân tích phương sai (ANOVA) ñối với cấu trúc số liệu cách 1 và cách 2. Với các bài toán sử dụng phép phân tích phương sai ñể so sánh, cấu trúc số liệu cách 1 sẽ phù hợp và thuận lợi hơn trong quá trình xử lý số liệu. Trong các ví dụ tiếp theo chúng tôi chỉ ñề cập ñến việc xử lý số liệu có cấu trúc cách 1. Stat ANOVA One-Way... Stat ANOVA One-Way (Unstacked)...
  • 16. 20 Chọn OK ñể có kết quả One-way ANOVA: KL versus TA Source DF SS MS F P TA 4 0.76325 0.19081 60.99 0.000 Error 15 0.04693 0.00313 Total 19 0.81018 S = 0.05593 R-Sq = 94.21% R-Sq(adj) = 92.66% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev --+---------+---------+---------+------- A 4 0.8875 0.0479 (--*--) B 4 0.4250 0.0208 (--*--) C 4 0.7625 0.0946 (--*--) D 4 0.9375 0.0479 (--*--) E 4 0.9500 0.0408 (-*--) --+---------+---------+---------+------- 0.40 0.60 0.80 1.00 Pooled StDev = 0.0559 Xác suất p-value = 0,000 0,05 (α) vì vậy H0 bị bác bỏ và H1 ñược chấp nhận. Kết luận rằng Tăng trọng trung bình của cá ở các công thức thức ăn có sự sai khác (P-value 0,05). So sánh cặp khi bác bỏ giả thiết H0 chấp nhận giả thiết H1 Chọn Comparisons... trong hộp thoại One-Way Analysis of Variances Các lựa chọn: Tukey’s, family error rate: với sai số của toàn bộ các cặp so sánh là 5% Fisher’s, individual error rate: với sai số của từng cặp so sánh là 5% Dunnett’s, family error rate: so sánh với nhóm ñối chứng, sai số của toàn bộ các cặp so sánh là 5% Hsu’s MCB, family error rate: với sai số của toàn bộ các cặp so sánh là 5% Chọn OK ñể có kết quả Tukey 95% Simultaneous Confidence Intervals All Pairwise Comparisons among Levels of TA Individual confidence level = 99.25% TA = A subtracted from: TA Lower Center Upper --------+---------+---------+---------+- B -0.58471 -0.46250 -0.34029 (---*--) C -0.24721 -0.12500 -0.00279 (--*---) D -0.07221 0.05000 0.17221 (--*---) E -0.05971 0.06250 0.18471 (---*--) --------+---------+---------+---------+- -0.35 0.00 0.35 0.70
  • 17. 21 TA = B subtracted from: TA Lower Center Upper --------+---------+---------+---------+- C 0.21529 0.33750 0.45971 (---*--) D 0.39029 0.51250 0.63471 (---*--) E 0.40279 0.52500 0.64721 (--*--) --------+---------+---------+---------+- -0.35 0.00 0.35 0.70 TA = C subtracted from: TA Lower Center Upper --------+---------+---------+---------+- D 0.05279 0.17500 0.29721 (--*--) E 0.06529 0.18750 0.30971 (--*---) --------+---------+---------+---------+- -0.35 0.00 0.35 0.70 TA = D subtracted from: TA Lower Center Upper --------+---------+---------+---------+- E -0.10971 0.01250 0.13471 (--*---) --------+---------+---------+---------+- -0.35 0.00 0.35 0.70 Ngoài kết quả phân tích phương sai như phần trên, Minitab ñã cung cấp kết quả so sánh từng cặp. Sự sai khác có ý nghĩa (P-value 0,05) giữa các nghiệm thức dựa trên khoảng tin cậy của từng cặp. Không có sự sai khác giữa các nghiệm thức nếu khoảng tin cậy có chứa số 0 và ngược lại có sự sai khác nếu không chứa số 0. Ví dụ trong kết quả nêu trên nếu so sánh giữa A-B ta có khoảng tin cậy (-0,58471; -0,34029) không chứa số không nên kết luận có sự sai khác giữa A và B (P-value 0,05). Nếu so sánh A và D ta có khoảng tin cậy (-0,07221; +17221) có chứa số 0 nên kết luận không có sự sai khác giữa A và D (P- value 0,05). ðể có thể trình bày kết quả so sánh cặp ñôi bạn ñọc có thể tham khảo trang 57 chương 4 Giáo trình Thiết kế thí nghiêm (2007). Kiểm tra sự ñồng nhất của phương sai với cấu trúc số liệu cách 1 Stat ANOVA Test for Equal Variances... Chọn OK ñể hiển thị ñồ thị và ..kết quả Test for Equal Variances: KL versus TA 95% Bonferroni confidence intervals for standard deviations TA N Lower StDev Upper A 4 0.0231412 0.0478714 0.309607 B 4 0.0100628 0.0208167 0.134631 C 4 0.0457534 0.0946485 0.612137
  • 18. 22 D 4 0.0231412 0.0478714 0.309607 E 4 0.0197348 0.0408248 0.264034 Bartlett's Test (normal distribution) Test statistic = 5.76; p-value = 0.218 Levene's Test (any continuous distribution) Test statistic = 0.81; p-value = 0.539 Xác suất p-value = 0,218 0,05 (α) vì vậy H0 ñược chấp nhận. Kết luận rằng Các Phương sai ñồng nhất (P-value 0,05). Kiểm tra phân bố chuẩn với cấu trúc số liệu cách 1 Không tiến hành kiểm tra phân bố chuẩn của cột số thô (KL) mà tiến hành kiểm tra phần sai số ngẫu nhiên ε ε ε εij theo mô hình: yi j = µ + ai + εi j (i = 1, a; j = 1, ri) trong ñó yij = quan sát thứ j ở công thức i, µ= trung bình chung, ai = chênh lệch do ảnh hưởng của công thức i và εij = sai số ngẫu nhiên; các εij ñộc lập, phân phối chuẩn N∼(0,σ2 ). Nếu phần sai số ngẫu nhiên tuân theo phân phối chuẩn thì số liệu bài toán cũng có phân phối chuẩn. Stat ANOVA One-Way... Chọn Store residuals và OK ñể có RESI1 (εij) Tiến hành kiểm tra phân bố chuẩn của cột số liệu RESI1 (xem 3.1 Kiểm ñịnh phân phối chuẩn). Phép kiểm ñịnh sẽ cho ta P-Value = 0,159 0,05 (α) nên có thể kết luận Số liệu tuân theo phân phối chuẩn (P 0,05). Lưu ý: Với cấu trúc số liệu cách 2, có thể kiểm ñịnh phân phối chuẩn của số liệu với từng nghiệm thức riêng biệt. Kết quả kiểm ñịnh, xác suất ñể số liệu ở các nghiệm thức A, B, C, D và E có phân phối chuẩn lần lượt là 0,255; 0,845; 0,092; 0,255 và 0,410. Ta cũng có kết luận tương tự. b. Thí nghiệm một yếu tố khối ngẫu nhiên ñầy ñủ Xem xét một thí nghiệm mà ñối tượng thí nghiệm chịu tác ñộng ñồng thời của một yếu tố chính (yếu tố thí nghịêm) và yếu tố phụ (khối). Ví dụ 1.7: Nghiên cứu số lượng tế bào lymphô ở chuột (×1000 tế bào mm-3 máu) ñược sử dụng 4 loại thuốc khác nhau (A, B, C và D; thuốc D là placebo) qua 5 lứa; số liệu thu ñược trình bày ở bảng dưới. Cho biết ảnh hưởng của thuốc ñến tế bào lymphô?
  • 19. 23 Lứa 1 Lứa 2 Lứa 3 Lứa 4 Lứa 5 Thuốc A 7,1 6,1 6,9 5,6 6,4 Thuốc B 6,7 5,1 5,9 5,1 5,8 Thuốc C 7,1 5,8 6,2 5,0 6,2 Thuốc D 6,7 5,4 5,7 5,2 5,3 Cấu trúc số liệu Số liệu của bài toàn này chỉ có một cấu trúc duy nhất trong Minitab; bao gồm 3 cột: 1) cột Số lượng tế bào C1 (TEBAO), 2) cột Thuốc C2 (THUOC) và 3) cột Lứa C3 (LUA) Trong thí nghiệm này ñối tượng thí nghiệm bị tác ñộng bởi yếu tố chính (yếu tố thí nghiệm) và yếu tố phụ (khối) So sánh sự sai khác giữa các nghiệm thức bằng Phân tích phương sai (ANOVA) Stat ANOVA Two-Way... Chọn Store residuals ñể có RESI1 Chọn OK ñể có kết quả Two-way ANOVA: TEBAO versus THUOC; LUA Source DF SS MS F P THUOC 3 1.8455 0.61517 11.59 0.001 LUA 4 6.4030 1.60075 30.16 0.000 Error 12 0.6370 0.05308 Total 19 8.8855 S = 0.2304 R-Sq = 92.83% R-Sq(adj) = 88.65% Xác suất của phép thử ñối với yếu tố Thuốc P = 0,001 0,05 (α), bác bỏ giả thiết H0 và chấp nhận ñối thiết H1. Kết luận thuốc có ảnh khác nhau lên tế bào lymphô của chuột (P 0,05).
  • 20. 24 Ví dụ 1.8: Một thí nghiệm ñược tiến hành ñể xác ñịnh ảnh hưởng của 3 công thức thức ăn (A1, A2 và A3) ñến tăng trọng trung bình trên ngày (gam / ngày) của bê ñực. Bê ñực ñược cân và chia thành 4 khối dựa theo khối lượng bắt ñầu thí nghiệm. Trong mỗi khối có 6 ñộng vật thí nghiệm ñược chọn ra và ñược phân ngẫu nhiên về với các nghiệm thức. Số liệu thu thập sau khi kết thúc thí nghiệm như sau: Khối I II III IV A1 826 806 864 834 795 810 850 845 A2 827 800 871 881 729 709 860 840 A3 753 773 801 821 736 740 820 835 Cấu trúc số liệu mô hình thí nghiệm trong ví dụ 1.8 tương tự như ở ví dụ 1.7. Trong ví dụ 1.8 có 2 ñơn vị thí nghiệm ở một nghiệm thức và khối vì vậy ngoài tác ñộng của khối và công thức thí nghiệm còn tồn tại sự tương tác giữa khối và công thức thí nghiệm. Stat ANOVA General Linear Model... Chọn Comparisons ñể so sánh cặp ñôi Chọn OK ñể có kết quả General Linear Model: KL versus CT, KHOI Factor Type Levels Values CT fixed 3 A1, A2, A3 KHOI fixed 4 I, II, III, IV Analysis of Variance for KL, using Adjusted SS for Tests Source DF Seq SS Adj SS Adj MS F P CT 2 8025.6 8025.6 4012.8 7.08 0.005 KHOI 3 33816.8 33816.8 11272.3 19.90 0.000 Error 18 10197.4 10197.4 566.5 Total 23 52039.8 S = 23.8017 R-Sq = 80.40% R-Sq(adj) = 74.96% Xác suất của phép thử ñối với yếu tố Thức ăn P = 0,005 nên bác bỏ giả thiết H0 và chấp nhận ñối thiết H1. Kết luận công thức ăn có ảnh ñến tăng trọng của bê. Xác suất của phép thử ñối với yếu tố KHOI P = 0,000 nên bác bỏ giả thiết H0 và chấp nhận ñối thiết H1. Kết luận KHOI có ảnh ñến tăng trọng của bê.
  • 21. 25 1.6. Tương quan và hồi quy ðể tính hệ số tương quan và xây dựng phương trình hồi quy, số liệu luôn phải tạo thành từng bộ và ñược nhập vào từng cột ñối từng chỉ tiêu. Ví dụ 1.9: Tiến hành cân khối lượng (P), ño ñường kính lớn (D) và ñường kính bé (d) của 22 quả trứng gà. Số liệu thu ñược trình bày ở bảng dưới ñây. P (gam) 66,80 60,10 71,20 61,60 61,20 59,00 67,90 59,00 51,50 62,60 64,20 D (mm) 58,37 54,95 60,58 56,73 57,36 53,26 57,07 58,17 52,28 55,62 56,82 d (mm) 45,12 44,35 45,56 44,34 43,57 44,86 46,27 42,82 41,91 44,95 44,79 P (gam) 71,20 54,20 54,50 69,10 55,90 66,00 68,00 62,00 56,70 67,00 53,80 D (mm) 61,15 54,24 54,99 60,99 54,41 58,19 59,93 56,80 55,66 58,49 52,44 d (mm) 46,00 42,58 42,32 44,85 42,62 45,69 45,50 44,20 42,41 45,56 43,38 Cấu trúc số liệu trong Worksheet Lưu ý: ðể tính hệ số tương quan và xây dựng phương trình hồi quy, số liệu luôn phải tạo thành từng cặp và ñược nhập vào từng cột ñối từng chỉ tiêu. 1) Cột Khối lượng C1 (KL) 2) Cột ðường kính lớn C2 (DL) 3) Cột ðường kính bé C3 (DB) a. Hệ số tương quan Giả thiết ñối với kiểm ñịnh hai phía H0: ρ = 0 và ñối thiết H1: ρ ≠ 0, trong ñó ρ là tương quan giữa 2 biến nghiên cứu. Stat Basic Statistics Correlation... Chọn OK ñể có kết quả Correlations: KL; DL; DN KL DL DL 0.897 0.000 DN 0.905 0.648 0.000 0.001 Cell Contents: Pearson correlation P-Value Chọn Display p-values ñể hiển thị xác suất ñối với từng hệ số tương quan. Chọn Store matrix (display nothing) ñể nhớ ma trận hệ số tương quan vào bộ nhớ ñệm và không hiển thị kết quả ra màn hình. Hệ số tương quan giữa khối lượng và ñường kính lớn là 0,897; khối lượng và ñường kính bé là 0,905; ñường kính lớn và ñường kính bé là 0,648. Xác suất ñối với từng hệ số
  • 22. 26 tương quan (p-values) ñều bé hơn 0,05 (α) vì vậy kết luận mối quan hệ giữa các chỉ tiêu này khác 0. b. Phương trình hồi quy tuyến tính Có thể xây dựng hồi quy ñơn biến y = a + bx hoặc ña biến y = a + b1x1 + b2x2 +...+bnxn. Có thể xây dựng phương trình hồi tuyến tính ñơn biến quy ước tính khối lượng trứng thông qua ñường kính lớn/ñường kính bé hoặc ña biến thông qua ñường kính lớn và ñường kính bé. Stat Regression Regression... Response: Khai báo cột C1 (KL) biến phụ thuộc. Predictors: Khai báo cột C2 (DL) biến ñộc lập. Chọn OK ñể có kết quả Regression Analysis: KL versus DL The regression equation is KL = - 53.7 + 2.04 DL Predictor Coef SE Coef T P Constant -53.67 12.78 -4.20 0.000 DL 2.0379 0.2250 9.06 0.000 S = 2.69651 R-Sq = 80.4% R-Sq(adj) = 79.4% Analysis of Variance Source DF SS MS F P Regression 1 596.60 596.60 82.05 0.000 Residual Error 20 145.42 7.27 Total 21 742.02 Unusual Observations Obs DL KL Fit SE Fit Residual St Resid 7 57.1 67.900 62.629 0.579 5.271 2.00R 8 58.2 59.000 64.871 0.658 -5.871 -2.25R R denotes an observation with a large standardized residual. Phương trình hồi quy ước tính khối lượng (y) thông qua ñường kính lớn (x) y = -53,7 + 2,04x. Bảng thứ nhất trong phần kết quả kiểm ñịnh các hệ số của phương trình hồi quy. Với xác suất P = 0,000 ta có thể kết luận các hệ số trong phương trình hồi quy khác 0 (P 0,05). Hệ số xác ñịnh của phương trình R² = 80,4%, hiệu chỉnh R² = 79,4%. Các quan sát ngoại lai (Unusual Observations) trong mô hình và ví dụ nêu trên. Các giá trị ở hàng thứ 7 và 8 trong ví dụ trên ñược coi là ngoại lai. Stat Regression Regression...
  • 23. 27 Predictors: Khai báo cột C2 (DL) và C3 (DN) biến ñộc lập. ðể xây dựng phương trình hồi quy ña biến, biến ñộc lập bao gồm từ 2 biến trở lên. Chọn OK ñể có kết quả. Regression Analysis: KL versus DL; DN The regression equation is KL = - 117 + 1.21 DL + 2.48 DN Predictor Coef SE Coef T P Constant -116.555 5.472 -21.30 0.000 DL 1.21473 0.08323 14.60 0.000 DN 2.4764 0.1623 15.26 0.000 S = 0.759757 R-Sq = 98.5% R-Sq(adj) = 98.4% Analysis of Variance Source DF SS MS F P Regression 2 731.05 365.53 633.24 0.000 Residual Error 19 10.97 0.58 Total 21 742.02 Source DF Seq SS DL 1 596.60 Ta có kết quả hoàn toàn tương tự như việc xây dựng phương trình hồi quy ñơn giản. 2. ỨNG DỤNG EXCEL TRONG XỬ LÝ SỐ LIỆU Phần mềm Excel cho phép phân tích dữ liệu nói chung, dữ liệu dữ liệu trong chăn nuôi, thú y nói riêng, một cách khá hiệu quả thông qua việc sử dụng menu Tools Data Analysis (nếu không có mục này thì chọn Tools Add-in Analysis ToolPak ñể cài ñặt thêm). Sau ñây là một số công cụ xử lý số liệu thống kê mà Excel cung cấp. 2.1. Thống kê mô tả và tổ chức ñồ 2.1.1. Thống kê mô tả Thống kê mô tả cho phép tính các số ñặc trưng mẫu/ các giá trị thống kê mẫu như trung bình, ñộ lệch chuẩn, sai số chuẩn, trung vị, mode... Số liệu tính toán ñược bố trí theo cột hoặc theo dòng. a. Các bước thực hiện trong Excel Chọn ToolsData AnalysisDescriptive Statistics, khai báo các mục sau trong hộp thoại: - Input range: miền dữ liệu kể cả nhãn. - Grouped by: Column (số liệu theo cột, Row số liệu theo hàng). - Labels in first row: ðánh dấu √ vào ô này nếu có nhãn ở dòng ñầu.
  • 24. 28 - Confidence level for mean: 95% (ñộ tin cậy 95%). - K-th largest: 1 (1 Số lớn nhất, 2 số lớn nhì ). - K-th smallest: 1 (1 Số nhỏ nhất, 2 số nhỏ nhì ). - Output range: miền ra. - Summary Statistics: ðánh dấu √ nếu muốn hiện các thống kê cơ bản. - OK. Ví dụ 1.1: Khối lượng (gam) của 16 chuột cái tại thời ñiểm cai sữa: 54.1 49.8 24 46 44.1 34 52.6 54.4 56.1 52 51.9 54 58 39 32.7 58.5 Chọn ToolsData AnalysisDescriptive Statistics, sau ñó khai báo hộp thoại (xem hình sau) Kết quả thu ñược cho trong hình sau: b. Phân tích các kết quả thu ñược Một số nhận xét trên các thống kê thu ñược như sau: - Mean cho ta giá trị trung bình của dãy số. - Median cho trung vị (giá trị ñiểm giữa của dãy số). Nếu 2 giá trị Mean và Median xấp xỉ nhau ta thì số liệu là cân ñối. - Phương sai mẫu hay ñộ lệch chuẩn mẫu cho ta biết ñộ phân tán của số liệu quanh giá trị trung bình, nếu các giá trị này càng nhỏ chứng tỏ số liệu càng tập trung.
  • 25. 29 - Kurtosis ñánh giá ñường mật ñộ phân phối của dãy số liệu có nhọn hơn hay tù hơn ñường mật ñộ chuẩn tắc. Nếu trong khoảng từ -2 ñến 2 thì có thể coi ñộ nhọn xấp xỉ ñộ nhọn chuẩn. - Skewness ñánh giá ñường phân phối nghiêng trái hay nghiêng phải. Nếu trong khoảng từ -2 ñến 2 thì có thể coi số liệu cân ñối xấp xỉ phân phối chuẩn . - Confidence Level ñược hiểu là nửa ñộ dài khoảng tin cậy. Giả sử Confidence Level là m thì khoảng tin cậy của trung bình tổng thể là: (Mean- m , Mean+m). Trong ví dụ 1.1 ta có khoảng tin cậy 95% của “dài bông” là:(47.575 - 5.415 , 47.575 - 5.415), tức là (42.160, 52.990). 2.1.2. Tổ chức ñồ Tần số xuất hiện của số liệu trong các khoảng cách ñều nhau cho phép phác hoạ biểu ñồ tần số, còn gọi là tổ chức ñồ. ðể vẽ tổ chức ñồ cần phải tiến hành phân tổ số liệu. a. Tạo miền phân tổ ðể tiến hành phân tổ số liệu (tạo Bin), cần thực hiện các bước sau: - Dùng các hàm Min, Max ñể xác ñịnh giá trị nhỏ nhất và giá trị lớn nhất.Tính biên ñộ = Max - Min. Dựa vào ñó ta có thể ñịnh số tổ cần chia. Số tổ có thể theo công thức k=6*log(n), n là số số liệu. Từ ñó ta ñịnh ra khoảng cách tổ là h = biên ñộ/k. ðịnh ra giá trị cận dưới và giá trị cận trên của miền phân tổ, thường thì lấy giá trị cận dưới nhỏ hơn Min, giá trị cận trên lớn hơn Max. - Ghi giá trị cận dưới vào ô ñầu của miền phân tổ. Con trỏ tại ô này. - Chọn Edit Fill Series ñể khai báo các mục: + Trong mục Series in chọn Columns (dữ liệu theo cột). + Trong mục Type chọn Linear (dữ liệu tăng theo cấp số cộng). + Trong Step value: nhập giá trị bước tăng (h). + Trong Stop value: nhập giá trị cuối (giá trị cận trên). + OK. Ví dụ 1.2: Dựa trên 30 số liệu về chiều dài cá ta tạo miền phân tổ (Bin) như trên hình sau, với miền phân tổ từ ô D2 tới ô D12 (kể cả nhãn), giá trị cận dưới là 10, cận trên là 55, giá trị bước tăng 5. Hình 1.1. Tạo miền Bin cho các số liệu về chiều dài cá
  • 26. 30 b. Vẽ tổ chức ñồ Chọn Tools Data Analysis Histogam ñể khai báo các mục: - Input range: miền dữ liệu. - Input Bin: miền phân tổ. - Labels: nhãn ở dòng ñầu nếu có. - Output range: Miền kết quả. - Pareto: tần số sắp xếp giảm dần. - Cumulative Percentage: Tần suất cộng dồn %. - Chart output: Biểu ñồ. - OK. Trong ví dụ 1.2 chọn Tools Data Analysis Histogam và khai báo như trong hình sau: Hình 1.2. Các khai báo ñể vẽ tổ chức ñồ c. Kết quả vẽ tổ chức ñồ Hình 1.3. Tổ chức ñồ
  • 27. 31 d. Phân tích kết quả - Tần số số liệu rơi vào từng khoảng ñược ghi ở cận trên của khoảng (Chẳng hạn, có 2 số liệu thuộc vào khoảng (10,15], vì vậy số 2 ñược ghi tương ứng với số 15 là cận trên). - Nhìn vào tần số ta có thể thấy trong khoảng nào số liệu xuất hiện nhiều nhất. - Nhìn vào hình dạng của tổ chức ñồ còn cho biết: dãy số liệu khảo sát ñược về chiều dài của cá có thể coi là tuân theo luật chuẩn. 2.2. So sánh và kiểm ñịnh Bài toán ñặt ra là cấn so sánh phương sai của 2 biến hoặc so sánh trung bình của 2 biến với nhau. ðể giải quyết vấn ñề này người ta ñưa về bài toán kiểm ñịnh giả thiết hai phương sai bằng nhau hoặc bài toán kiểm ñịnh giả thiết hai trung bình bằng nhau. 2.2.1. Kiểm ñịnh sự bằng nhau của 2 phương sai Bài toán ở ñây là thông qua hai mẫu ñể kiểm ñịnh giả thuyết H0: σ1 2 =σ2 2 (phương sai của biến 1 bằng phương sai của biến 2) với ñối thuyết H1: σ1 2 ≠σ2 2 ở mức ý nghĩa α . a. Các bước thực hiện Chọn Tools Data Analysis F-Test Two Sample for Variance, sau ñó lần lượt trả lời: - Variable 1 Range: miền dữ liệu của biến 1, kể cả dòng ñầu chứa nhãn. - Variable 2 Range: Miền dữ liệu của biến thứ hai, kể cả dòng ñầu chứa nhãn. - Labels: Chọn mục này nếu miền dữ liệu chọn cả dòng nhãn. - Alpha: Mức ý nghĩa (thường là 0.05 hoặc 0.01). - Output Range: Chọn miền trống ñể ñưa ra kết quả. - OK: Kết thúc. Ví dụ 1.3: Có 2 giống bò, tiến hành chọn ngẫu nhiên và cân 12 con ñối với giống thứ nhất và 15 con ñối với giống thứ 2. Khối lượng (kg) thu ñược như sau: Hãy kiểm ñịnh giả thiết: phương sai của 2 dãy số trên là như nhau. Chọn Tools Data Analysis F-Test Two Sample for Variance và khai báo như sau: So sánh khối lượng của 2 giống bò Giống 1 188 180 199 191 196 204 190 201 195 221 187 203 Giống 2 148 146 153 135 151 146 164 147 162 140 159 182 165 165 142
  • 28. 32 Kết quả thu ñược như sau: F-Test Two-Sample for Variances Giống 1 Giống 2 Mean 196.1750 153.7000 Variance 112.7002 151.3243 Observations 12 15 df 11 14 F 0.7448 P(F=f) one-tail 0.3156 F Critical one-tail 0.3651 b. Phân tích kết quả Bảng kết quả này gồm có: - Mean: Trung bình của 2 mẫu là 196.1750 và 153.7000 - Variance: Phương sai của 2 mẫu là 112.7002 và 151.3243 - Observations: Số quan sát n1và n2 là 12 và 15 - df: Bậc tự do là 11 và 14 - F: Giá trị F thực nghiệm là 0.7448 - P(F=f) one-tail: Giá trị P một phía 0.3156 - F Critical one-tail: Giá trị lý thuyết một phía là 0.03651 * Kết luận: P(F=f) one-tail 0.05 nên chấp nhận H0: σ1 2 =σ2 2 2.2.2. So sánh trung bình trường hợp hai mẫu ñộc lập khi biết phương sai σ σ σ σ 2 1 và σ σ σ σ 2 2 Bài toán ở ñây là cần thông qua hai mẫu ñể kiểm ñịnh giả thuyết H0: m1 = m2 (kỳ vọng của biến X bằng kỳ vọng của biến Y) với ñối thuyết H1: m1 ≠ m2 ở mức ý nghĩa α . Rút mẫu ñộc lập từ hai tổng thể phân phối chuẩn, trong một số tình huống nào ñó chúng ta có thể ước lượng ñược phương sai (thường xảy ra khi ñiều tra lại một tổng thể sau một thời gian chưa lâu, nên phương sai chưa thay ñổi, do ñó lấy phương sai của lần ñiều tra trước làm σ2 1 và σ2 2, chẳng hạn khi xem xét các kết quả phân tích của hai phòng thí nghiệm mà ñộ chính xác ñã ổn ñịnh, từ ñó có các ước lượng về phương sai). Trường hợp mẫu lớn: Khi việc rút hai mẫu quan sát từ hai tổng thể ñược tiến hành một cách ñộc lập thì chúng ta có hai mẫu ñộc lập. Nếu dung lượng của cả hai mẫu ñều lớn (thường quy ước là n1 ≥ 30, n2 ≥ 30) ta có thể tiến hành z-test nhưng thay hai phương sai của tổng thể σ2 1 và σ2 2 bằng phương sai mẫu s1 2 và s2 2 a. Các bước thực hiện Chọn Tools Data Analysis z-Test: Two Sample for Means, sau ñó lần lượt trả lời: - Variable 1 Range: miền dữ liệu của biến 1, kể cả dòng ñầu chứa nhãn. - Variable 2 Range: Miền dữ liệu của biến thứ hai, kể cả dòng ñầu chứa nhãn. - Labels: Chọn mục này nếu miền dữ liệu chọn cả dòng nhãn.
  • 29. 33 - Hypothesized means difference: Giả thuyết về hiệu hai trung bình của hai tổng thể. Nếu lấy giả thuyết H0: m1=m2 thì ghi 0. Nếu lấy giả thuyết H1: m1=m2+d thì ghi d (d là 1 số) . - Variable 1 variance: Phương sai của biến 1 (nhập σ2 1). - Variable 2 variance: Phương sai của biến 2 (nhập σ2 2). - Output Range: Chọn miền trống ñể ñưa ra kết quả. - Chọn OK. Ví dụ 1.4: Thực hiện thí nghiệm ño chiều dài của 2 giống cá x và y. Với giống cá x lấy mẫu ño 10 con cá, Với giống cá y lấy mẫu ño 12 con cá, ta có bảng số liệu sau, biết phương sai của giống cá x là 11.6, của giống cá y là 10.9. Hãy so sánh chiều dài của 2 giống cá x và y. Chọn Tools Data Analysis z-Test: Two Sample for Means, sau ñó khai báo theo hộp thoại sau: Kết quả so sánh hai mẫu cho ở bảng sau: z-Test: Two Sample for Means x y Mean 20.300 20.833 Known Variance 11.6 10.9 Observations 10 12 Hypothesized Mean Difference 0 z -0.37084 P(Z=z) one-tail 0.35538 z Critical one-tail 1.64485 P(Z=z) two-tail 0.71076 z Critical two-tail 1.95996 b. Phân tích kết quả - Mean:Trung bình của 2 mẫu. - Known Variance: Phương sai ñã cho (σ2 1 và σ2 2 ).
  • 30. 34 - Observations: Số quan sát n1 và n2. - Hypothesized means difference: Giả thuyết về hiệu hai trung bình của hai tổng thể. Nếu lấy giả thuyết H0: m1=m2 thì ghi 0. Nếu lấy giả thuyết H1: m1=m2+d thì ghi d (d là 1 số) . - z: Giá trị z thực nghiệm tính theo công thức sau: z=(a1-a2)/Sqrt(σ2 1/n1 + σ2 2/n2 ) - P(Z=z) one-tail: Giá trị P một phía - z Critical one-tail: Giá trị z lý thuyết (tới hạn) một phía. - P(Z=z) two-tail: Giá trị P hai phía. - z Critical two-tail: Giá trị z lý thuyết (tới hạn) hai phía Chú ý: Ta có thể dùng một số hàm trong Excel ñể tính một số kết quả: + Giá trị P một phía tính bằng hàm 1-Normsdist(z). + Giá trị P hai phía tính bằng hàm (1-Normsdist(z))*2. + Giá trị tới hạn của hàm phân phối chuẩn tắc z một phía tính bằng hàm Normsinv(0.95). + Giá trị z tới hạn hai phía tính bằng hàm Normsinv(0.975). Kết luận: Nếu P two-tail mức ý nghĩa α = 0.05 thì chập nhận H0 ngược lại bác bỏ H 0 chấp nhận H1. Trong ví dụ giá trị P hai phía lớn hơn mức ý nghĩa α = 0.05 nên kết luận: chiều dài của hai giống cá không khác nhau. 2.2.3. So sánh hai mẫu kiểu cặp ñôi Ta xét thí dụ: lấy một tổ chim và cân trọng lượng chim cái, trọng lượng chim ñực ta ñược các cặp số liệu, lấy mẫu với dung lượng là n thì ta có n cặp số liệu, trường hợp này là lấy mẫu cặp ñôi. Nếu lấy một số chim ñực ngẫu nhiên trong nhiều chim ñực và lấy một số chim cái ngẫu nhiên trong nhiều chim cái thì có hai mẫu quan sát ñộc lập. Trường hợp khác, nếu ta ñem 10 mẫu ñất, mỗi mẫu chia ñôi, một nửa giao cho phòng phân tích A thực hiện, nửa kia giao cho phòng phân tích B thì thu ñược số liệu cặp ñể so sánh kết quả của hai phòng phân tích, hoặc nếu ta ñem hai giống lúa cấy trên một số ruộng, mỗi ruộng chia ñôi, một nửa cấy giống A, một nửa cấy giống B thì có hai mẫu cặp ñể so sánh, hay nếu ño một chỉ số sinh lý hoặc sinh hoá của một bệnh nhân khi mới nhập viện và ño lại chỉ số ñó sau một thời gian ñiều trị thì có hai mẫu quan sát cặp ñể ñánh giá hiệu quả ñiều trị. Chú ý rằng, khi rút hai mẫu cặp ta có hai mẫu cùng số quan sát n, các số liệu sắp xếp thành cặp ñứng ở hai cột cạnh nhau. a. Các bước thực hiện Chọn Tools Data Analysis t-Test: Paired Two Sample for Means, sau ñó lần lượt trả lời: - Variable 1 Range: miền dữ liệu của biến 1, kể cả dòng ñầu chứa nhãn. - Variable 2 Range: Miền dữ liệu của biến thứ hai, kể cả dòng ñầu chứa nhãn. - Labels: Chọn mục này nếu miền dữ liệu chọn cả dòng nhãn
  • 31. 35 - Hypothesized means difference: Giả thiết về hiệu hai trung bình của hai tổng thể. Nếu lấy giả thuyết H0: m1=m2 thì ghi 0. Nếu lấy giả thuyết H0: m1=m2+d thì ghi d (d là một số nào ñó) - Output Range: Chọn miền trống ñể ñặt ra kết quả. Ví dụ 1.5: Tăng trọng (pound) của 10 cặp bê sinh ñôi giống hệt nhau dưới hai chế ñộ chăm sóc A và B khác nhau. Bê trong từng cặp ñược bắt thăm ngẫu nhiên về một trong hai cách chăm sóc. Hãy kiểm ñịnh giả thiết H0: Tăng trọng trung bình ở hai cách chăm sóc như nhau, ñối thiết H1: Tăng trọng trung bình khác nhau ở hai cách chăm sóc với mức ý nghĩa α = 0,05. Số liệu thu ñược như sau: Tăng trọng ở cách A 43 39 39 42 46 43 38 44 51 43 Tăng trọng ở cách B 37 35 34 41 39 37 35 40 48 36 Chọn Tools Data Analysis t-Test: Paired Two Sample for Means, khai báo hộp thoại như sau: Kết quả thu ñược như sau: t-Test: Paired Two Sample for Means Tăng trọng ở cách A Tăng trọng ở cách B Mean 42.8 38.2 Variance 14.6222 17.0667 Observations 10 10 Pearson Correlation 0.8820 Hypothesized Mean Difference 0 df 9 t Stat 7.44046 P(T=t) one-tail 0.00002 t Critical one-tail 1.83311 P(T=t) two-tail 0.00004 t Critical two-tail 2.26216
  • 32. 36 b. Phân tích kết quả Bảng kết quả có hai cột cho hai mẫu quan sát. Bảng này có các hàng: - Mean: Trung bình mẫu a1, a2. - Variance: Phương sai mẫu s1 2 , s2 2 . - Observations: Số quan sát n1 và n2 (bằng nhau và bằng số cặp số liệu n). - Pearson Correlation: Hệ số tương quan r của 2 mẫu. - Hypothesized means difference: Giả thuyết về hiệu hai trung bình của hai tổng thể. Nếu lấy giả thuyết H0: m1=m2 thì ghi 0. Nếu lấy giả thuyết H1: m1=m2+d thì ghi d (d là 1 số) . - df: Bậc tự do bằng số cặp trừ 1 (n-1). - t Stat: Giá trị t thực nghiệm - P(T=t) one-tail: Giá trị P một phía. - t Critical one-tail: Giá trị t một phía. - P(T=t) two-tail: Giá trị P hai phía. - t Critical two-tail: Giá trị t hai phía. Kết luận: Do giá trị P hai phía nhỏ hơn mức ý nghĩa α = 0.05 nên trong ví dụ trên ta bác bỏ H0, chấp nhận giả thuyết H1 (m1≠m2) và ñồng thời t thực nghiệm t một phía nên m1 m2, có nghĩa là tăng trọng cách A lớn hơn tăng trọng của cách B. 2.2.4. So sánh trung bình khi lấy mẫu ñộc lập với giả thuyết hai phương sai bằng nhau Trường hợp mẫu lớn: Khi việc rút hai mẫu quan sát từ hai tổng thể ñược tiến hành một cách ñộc lập thì chúng ta có hai mẫu ñộc lập. Nếu dung lượng của cả hai mẫu ñều lớn (thường quy ước là n1 ≥ 30, n2 ≥ 30) ta có thể tiến hành z-test nhưng thay hai phương sai của tổng thể σ 2 1và σ 2 2 bằng phương sai mẫu s1 2 và s2 2 . Trường hợp mẫu bé (n1,n2 nhỏ hơn 30) thì ta gặp bài toán khó, gọi tên là bài toán Berens – Fisher. Trong trường hợp này, nếu coi hai phương sai của hai tổng thể bằng nhau (cần kiểm ñịnh giả thuyết phụ về sự bằng nhau của hai phương sai) thì có thể tiếp tục tính toán như sau: a. Các bước thực hiện: Chọn Tools Data Analysis t-Test: Two-Sample Assuming Equal Variances, sau ñó lần lượt trả lời: - Variable 1 Range: miền dữ liệu của biến 1, kể cả dòng ñầu chứa nhãn. - Variable 2 Range: Miền dữ liệu của biến thứ hai, kể cả dòng ñầu chứa nhãn. - Labels: Chọn mục này nếu miền dữ liệu chọn cả dòng nhãn - Hypothesized means difference: Giả thiết về hiệu hai trung bình của hai tổng thể. Nếu lấy giả thuyết H0: m1=m2 thì ghi 0. Nếu lấy giả thuyết H0: m1=m2+d thì ghi d (d là một số nào ñó) . - Output Range: Chọn miền trống ñể ñặt ra kết quả.
  • 33. 37 Ví dụ 1.6: Có 2 giống bò, tiến hành chọn ngẫu nhiên và cân 12 con ñối với giống thứ nhất và 15 con ñối với giống thứ 2. Khối lượng (kg) thu ñược như sau: So sánh khối lượng của 2 giống bò Giống 1 188 180 199 191 196 204 190 201 195 221 187 203 Giống 2 148 146 153 135 151 146 164 147 162 140 159 182 165 165 142 Kiểm ñịnh giả thiết H0: khối lượng trung bình của 2 giống bò như nhau. - Trước tiên ta phải kiểm ñịnh sự bằng nhau của hai phương sai, trong mục 1.2.1 và ở ví dụ 1.3 ta ñã có kết luận hai phương sai bằng nhau. - Bước tiếp theo ta ñi so sánh trung bình với giả thiết phương sai bằng nhau: Chọn Tools Data Analysis t-Test: Two-Sample Assuming Equal Variances, khai báo hộp thoại như sau: Kết quả như sau: t-Test: Two-Sample Assuming Equal Variances Giống 1 Giống 2 Mean 196.175 153.7 Variance 112.7002 151.3243 Observations 12 15 Pooled Variance 134.3297 Hypothesized Mean Difference 0 df 25 t Stat 9.46241 P(T=t) one-tail 0.00000 t Critical one-tail 1.70814 P(T=t) two-tail 0.00000 t Critical two-tail 2.05954
  • 34. 38 b. Phân tích kết quả Bảng kết quả thu ñược có hai cột cho hai mẫu quan sát, và lần lựơt có các hàng sau: - Mean: Trung bình mẫu a1, a2. - Variance: Phương sai mẫu s1 2 , s2 2 . - Observations: Số quan sát n1 và n2. - Pooled Variance: Phương sai chung tính theo công thức s2 =((n1-1)s1 2 +( n2-1)s2 2 )/(n1+n2-2) - Hypothesized means difference: Giả thiết về hiệu hai trung bình của hai tổng thể. Nếu lấy giả thuyết H0: m1=m2 thì ghi 0. Nếu lấy giả thuyết H0: m1=m2+d thì ghi d (d là một số nào ñó) . - df: Bậc tự do (n1+ n2-2) - t Stat: Giá trị t thực nghiệm tính theo công thức: t = (a1-a2)/Sqrt(s2 ×(1/n1+1/n2)) - P(T=t) one-tail: Giá trị P một phía. - t Critical one-tail: Giá trị t một phía. - P(T=t) two-tail: Giá trị P hai phía. - t Critical two-tail: Giá trị t hai phía. Chú ý: có thể tìm ñược các giá trị theo các hàm của Excel + Giá trị P một phía và hai phía qua hàm Tdist(z,f,1) và Tdist(z,f,2). + Giá trị t lý thuyết một phía qua hàm TINV(0.10,f). + Giá trị t lý thuyết hai phía qua hàm TINV(0.05,f). Kết luận: Do giá trị P hai phía nhỏ hơn mức ý nghĩa α = 0.05 nên trong ví dụ trên ta bác bỏ H0, chấp nhận giả thuyết H1 (m1≠m2) và ñồng thời t thực nghiệm t một phía nên m1 m2, có nghĩa là khối lượng trung bình của giống bò 1 lớn hơn khối lượng trung bình của giống bò 2. 2.2.5. So sánh trung bình khi lấy mẫu ñộc lập với giả thuyết hai phương sai khác nhau Trong trường hợp mẫu bé và phương sai khác nhau thì có thể thực hiện theo các bước sau: a. Các bước thực hiện Chọn Tools Data Analysis t-Test: Two-Sample Assuming Unequal Variances, sau ñó lần lượt trả lời: - Variable 1 Range: miền dữ liệu của biến 1, kể cả dòng ñầu chứa nhãn. - Variable 2 Range: Miền dữ liệu của biến thứ hai, kể cả dòng ñầu chứa nhãn. - Labels: Chọn mục này nếu miền dữ liệu chọn cả dòng nhãn - Hypothesized means difference: Giả thiết về hiệu hai trung bình của hai tổng thể. Nếu lấy giả thuyết H0: m1=m2 thì ghi 0. Nếu lấy giả thuyết H0: m1=m2+d thì ghi d (d là một số nào ñó) - Output Range: Chọn miền trống ñể ñặt ra kết quả. Ví dụ 1.7: Thực hiện thí nghiệm ño chiều dài của 2 giống cá x và y. Với giống cá x lấy mẫu ño 10 con cá, Với giống cá y lấy mẫu ño 12 con cá, ta có bảng số liệu sau. Hãy so sánh chiều dài của 2 giống cá x và y.
  • 35. 39 x 15 17 20 23 25 17 18 22 24 22 y 14 12 13 28 12 17 25 24 30 21 23 30 * Bước 1: Kiểm ñịnh sự bằng nhau của hai phương sai, thực hiện theo mục 1.2.1, ta có kết quả sau: F-Test Two-Sample for Variances x y Mean 20.3 20.75 Variance 11.5667 48.2045 Observations 10 12 df 9 11 F 0.23995 P(F=f) one-tail 0.02047 F Critical one-tail 0.32232 Kết luận: P một phía 0.05 nên bác bỏ H0, chấp nhận H1 tức là hai phương sai khác nhau. * Bước 2: Kiểm ñịnh sự bằng nhau của hai trung bình với giả thuyết hai phương sai khác nhau: Chọn Tools Data Analysis t-Test: Two-Sample Assuming Unequal Variances, khai báo hộp thoại như sau: Kết quả thu ñược như sau: t-Test: Two-Sample Assuming Unequal Variances x y Mean 20.3 20.75 Variance 11.5667 48.2045 Observations 10 12 Hypothesized Mean Difference 0 df 17 t Stat -0.19784 P(T=t) one-tail 0.42276 t Critical one-tail 1.73961 P(T=t) two-tail 0.84552 t Critical two-tail 2.10982
  • 36. 40 b. Phân tích kết quả ðánh giá kết quả như trọng mục 1.2.4 ở trên. Kết luận: Theo kết quả trên giả thuyết H0 vẫn ñược chấp nhận ở mức ý nghĩ 0.05 do P hai phía lớn hơn mức ý nghĩa α = 0.05, tức là chiều dài của 2 giống cá không khác nhau. 2.3. Phân tích phương sai Phân tích phương sai là công cụ chủ yếu ñể phân tích các số liệu khi theo dõi ảnh hưởng của các nhân tố (factor) và ảnh hưởng tương tác của chúng. ðể thu thập số liệu, thí nghiệm cần ñược thiết kế phù hợp với mục ñích nghiên cứu và ñiều kiện cụ thể nơi tiến hành thí nghiệm. ðể phân tích một nhân tố, thí nghiệm thường ñược thiết kế theo kiểu hoàn toàn ngẫu nhiên, kiểu khối hoàn toàn ngẫu nhiên, hay ô vuông La tinh. ðể phân tích hai nhân tố, thí nghiệm ñược bố trí theo kiểu khối ngẫu nhiên, kiểu trực giao, kiểu chia ô lớn, ô nhỏ. Từ ba nhân tố trở lên thì cần bố trí thí nghiệm sao cho mỗi nhân tố có hai mức hay mỗi nhân tố có ba mức. 1.3.1. Phân tích phương sai một nhân tố Phân tích phương sai một nhân tố ñược sử dụng ñể phân tích số liệu khi theo dõi ảnh hưởng của các mức của nhân tố tới kết quả, như ảnh hưởng của các công thức cho ăn ñến năng suất thịt lợn, ảnh hưởng của các công thức ñiều trị thuốc ñến tỷ lệ bệnh... ðể phân tích phương sai một nhân tố cần thiết kế thí nghiệm kiểu hoàn toàn ngẫu nhiên, mỗi mức lặp lại một số lần, số lần lặp của các mức của nhân tố không cần phải bằng nhau. Số liệu ñược ñiền theo cột hoặc theo hàng (nếu vào theo hàng thì mỗi hàng ứng với một mức của nhân tố), ô ñầu tiên ghi tên mức, các ô tiếp theo ghi số liệu. Giả sử thí nghiệm ñược bố trí theo k mức tác ñộng khác nhau của nhân tố A, mỗi mức ñược lặp lại ni lần, i= k , 1 và n1 + n2+…+ nk là tổng số các thí nghiệm. Gọi Xij là số liệu thu ñược của thí nghiệm ở mức i và lần lặp thứ j. Ta có bảng thực nghiệm sau: Mức của nhân tố A Số liệu thực nghiệm 1 X11 X12 … X1n1 2 X21 X22 … X2n2 … … … … … k Xk1 Xk2 … Xknk Nếu k ñám ñông có phân phối chuẩn N(mi,δ2 ), i = k , 1 thì ñại lượng 2 2 1 2 S S F = Trong ñó S2 1 là phương sai gây ra do tác ñộng của các mức, S2 2 là phương sai do ngẫu nhiên. F có phân phối Fisher với k-1; n-k bậc tự do. Bài toán phân tích phương sai ñưa về việc kiểm ñịnh giả thiết: H0: m1= m2=… = mk ðối giả thiết H1: Có ít nhất hai trị trung bình khác nhau. Giả thiết H0 bị bác bỏ ở mức α nếu: F Fα(k-1,n-k) với Fα(k-1,n-k) là số tìm ñược ở bảng F, mức α với k-1, n-k bậc tự do.
  • 37. 41 a. Các bước thực hiện trong Excel Chọn Tools Data Analysis Anova: Single Factor và khai báo: - Input range: Khai báo miền dữ liệu vào (một chữ nhật bao trùm toàn bộ các ô chứa tên mức và toàn bộ các số liệu). - Grouped by: Column (số liệu theo cột) hoặc row (số liệu theo hàng) - Label in First column: nhãn dòng ñầu. - Alpha: 0.05 mức ý nghĩa α. - Output range: miền ra. - Chọn nút OK b. Phân tích kết quả - Kết quả in ra gồm các thống kê cơ bản cho từng mức (trung bình, ñộ lệch chuẩn...) và bảng phân tích phương sai. - Nếu giá trị xác suất P-value = alpha (hoặc F thực nghiệm = F lý thuyết) thì chấp nhận H0 các công thức không có khác biệt ñáng kể. - Nếu giá trị xác suất P-value alpha (hoặc F thực nghiệm F lý thuyết) thì bác bỏ Ho chấp nhận H1 các công thức có tác ñộng khác nhau tới kết quả. - Khi kết luận các công thức có tác ñộng khác nhau tới kết quả thì phải tiến hành bước tiếp theo là so sánh các công thức ñể rút ra công thức nào tốt nhất. 1.3.2. So sánh các trung bình dùng ngưỡng so sánh LSD (Least sinificance diffrence) Phần mềm Excel không cho phép so sánh các trung bình của các nhóm ứng với các mức của nhân tố (các công thức). Tuy nhiên, nếu cần so sánh trung bình mi (với ri lần lặp) với trung bình mj (rj lần lặp) người dùng có thể tự tính thêm LSD (Least Significance Difference) theo công thức LSD = tα,f × SQRT(s2 (1/ri + 1/rj)), trong ñó s2 là phương sai chung ñược ước lượng bởi trung bình của sai số bình phương trong nội bộ nhóm (MS within groups), α = 1-p, và tα,f là giá trị t của bảng Student ứng với mức ý nghĩa α và f bậc tự do. tα,f có thể tìm ñược bằng cách tra bảng số hay bằng hàm TINV trong Excel. * Tính trị tuyệt ñối của hiệu các trung bình mi, mj: |mi- mj| * So sánh nếu |mi- mj| LSD thì hai trung bình là khác nhau, ngược lại 2 trung bình ñược coi là không khác nhau. Thông thường người ta lập bảng hiệu các trung bình, sau ñó lập bảng ghi kết quả so sánh. Ví dụ 1.8: Theo dõi tăng trọng của cá (kg), thí nghiệm với 5 công thức nuôi (A, B, C, D, E). . Số liệu thu ñược như bảng sau. Hãy cho biết công thức nào tốt nhất * Các bước thực hiện trong Excel
  • 38. 42 Chọn Tools Data Analysis Anova: Single Factor và khai báo theo hộp thoại sau: * Kết quả thu ñược như sau: Anova: Single Factor SUMMARY Groups Count Sum Average Variance A 4 3.55 0.8875 0.002292 B 4 1.7 0.425 0.000433 C 4 3.05 0.7625 0.008958 D 4 3.75 0.9375 0.002292 E 4 3.8 0.95 0.001667 ANOVA Source of Variation SS df MS F P-value F crit Between Groups 0.76325 4 0.190813 60.99494 4.24E-09 3.055568 Within Groups 0.046925 15 0.003128 Total 0.810175 19 * Kết luận: P- value 0.05 (mức ý nghĩa của kiểm ñịnh) nên bác bỏ Ho chấp nhận H1 các công thức có tác ñộng khác nhau tới kết quả. * So sánh các trung bình:
  • 39. 43 2.3.3. Phân tích phương sai hai nhân tố Khi phân tích phương sai hai nhân tố A và B thì có thể xảy ra các hai trường hợp: trường hợp A và B không tương tác (biến ñộng gây nên bởi tác ñộng ñồng thời của A và B gần sát 0) và trường hợp A và B tương tác (nếu trái lại). Phân tích phương sai một nhân tố bố trí kiểu khối hoàn toàn ngẫu nhiên ñược coi là trường hợp riêng của phân tích phương sai hai nhân tố không tương tác (nhân tố khối là nhân tố thứ hai không tương tác với nhân tố thứ nhất). Khi phân tích phương sai hai nhân tố không tương tác, số liệu cần ñược sắp xếp theo cách sau: hàng là các mức của nhân tố thứ nhất, cột là các mức của nhân tố thứ hai (trong trường hợp cần phân tích phương sai một nhân tố bố trí kiểu khối ngẫu nhiên thì hàng là các mức của nhân tố, cột là các khối ngẫu nhiên). a. Phân tích phương sai hai nhân tố không tương tác (không lặp) Xét trường hợp thí nghiệm liên quan tới 2 nhân tố A và B, mỗi nhân tố có một số mẫu. Xét trường hợp không có tương tác giữa Avà B. Nhân tố A Nhân tố B 1 2 … kA 1 X11 X12 … X1kA 2 X21 X22 … X2kA … … … … … kB XkB1 XkB2 … XkBkA
  • 40. 44 Ta ñi kiểm ñịnh giả thuyết H0A và H0B với các ñối thuyết H1A và H1B (Giả thiết H0A: Các mức của nhân tố A có tác ñộng như nhau. Giả thiết H0B: Các mức của nhân tố B có tác ñộng như nhau) Các ñại lượng thống kê: R A A s s F 2 2 = và R B B s s F 2 2 = Trong ñó S2 A là phương sai do nhân tố A, S2 B là phương sai do nhân tố B, S2 R là phương sai do nhân tố ngẫu nhiên. Nếu: FA F 0.05A kết luận các mức của nhân tố theo cột (A) có ảnh hưởng khác nhau ñến số liệu nghiên cứu. FB F 0.05B kết luận các mức của nhân tố theo dòng (B) có ảnh hưởng khác nhau ñến số liệu nghiên cứu. * Các bước thực hiện trong Excel Chọn Tools Data Analysis Anova: Two Factor Without Replication sau ñó khai báo tiếp các thông tin trong hình sau: Hình 1.4. Hộp thoại khai báo ñể phân tích phương sai không tương tác * Phân tích kết quả - Nếu FA F Crit A thì các mức của nhân tố A có ảnh hưởng khác nhau ñến kết quả. - Nếu kết luận các mức của nhân tố A có ảnh hưởng khác nhau ñến kết quả thì ta tiến hành so sánh trung bình của các mức trong nhân tố A theo chỉ số LSD (tương tự trong phần phân tích phương sai một nhân tố). - Nếu FB F Crit B thì các mức của nhân tố B có ảnh hưởng khác nhau ñến kết quả. - Nếu kết luận các mức của nhân tố B có ảnh hưởng khác nhau ñến kết quả thì ta tiến hành so sánh trung bình của các công thức trong nhân tố B theo chỉ số LSD (tương tự trong phần phân tích phương sai một nhân tố). Chú ý: F là F thực nghiệm, F Crit là F lý thuyết có thể tìm bằng hàm FINV(...) F Crit A = FINV(α, kA -1, (kA-1)(kB-1)) , F Crit B = FINV(α, kB -1, (kA-1)(kB-1)) Ví dụ 1.9: Mead và cộng sự nghiên cứu số lượng tế bào Lymphô ở chuột (×1000 tế bào mm-3máu) , sử dụng 4 loại thuốc, qua 5 lứa. Số liệu ñược cho trên bảng sau. Thực hiện trong Excel khai báo dữ liệu theo hộp thoại sau:
  • 41. 45 Kết quả xử lý cho trong bảng sau: Anova: Two-Factor Without Replication SUMMARY Count Sum Average Variance Thuốc A 5 32.1 6.42 0.367 Thuốc B 5 28.6 5.72 0.442 Thuốc C 5 30.3 6.06 0.578 Thuốc D 5 28.3 5.66 0.373 Lứa 1 4 27.6 6.9 0.053333 Lứa 2 4 22.4 5.6 0.193333 Lứa 3 4 24.7 6.175 0.275833 Lứa 4 4 20.9 5.225 0.069167 Lứa 5 4 23.7 5.925 0.235833 ANOVA Source of Variation SS df MS F P-value F crit Rows 1.8455 3 0.615167 11.5887 0.0007392 3.490295 Columns 6.403 4 1.60075 30.15542 3.544E-06 3.259167 Error 0.637 12 0.053083 Total 8.8855 19 Kết luận: + Với nhân tố thuốc thì khi sử dụng các loại thuốc khác nhau có ảnh hưởng tới số lượng tế bào lymphô trong máu (F F crit). + Với nhân tố lứa thì các lứa khác nhau cũng ảnh hưởng tới số lượng tế bào lymphô trong máu (F F crit). b. Phân tích phương sai hai nhân tố có tương tác (có lặp) Trong trường hợp này khi phân tích phương sai ta phải tính ñến sự tác ñộng ñồng thời của A và B. Số liệu sắp xếp như sau: - Nhân tố 1 ñánh theo hàng với các mức khác nhau, nhân tố 2 ñánh theo cột với các mức khác nhau.
  • 42. 46 - Mỗi mức của nhân tố 1 (thường gọi là nhân tố A) ñược dành m hàng (cho m lần lặp) còn mỗi mức của nhân tố 2 (thường gọi là nhân tố B) là 1 cột. - Tên mỗi mức của nhân tố A chỉ viết một lần trong ô ñầu tiên của mức ñó, các tên mức của nhân tố B thì ghi ñầu ở mỗi cột. Các ô từ hàng 2 cột 2 trở ñi ghi số liệu. Số liệu bố trí theo bảng sau: B A 1 2 ... kB X111 X121 ... X1kB1 X112 X122 ... X1kB2 ... ... ... ... 1 X11m X12m ... X1kBm X211 X221 ... X2KB1 X212 X222 ... X2kB2 ... ... ... ... 2 X21m X22m ... X2kBm ... ... ... ... ... XkA11 XkA21 ... XkAkB1 XkA12 XkA22 ... XkAkB2 ... ... ... ... kA XkA1m XkA2m ... XkAkBm Tổng số lượng quan sát: n = m kA kB Các ñại lượng thống kê: R AB AB R B B R A A S S F S S F S S F 2 2 2 2 2 2 , , = = = Trong ñó S2 A là phương sai do nhân tố A, S2 B là phương sai do nhân tố B, SAB là phương sai do tương tác AB, S2 R là phương sai do nhân tố ngẫu nhiên. * Các bước thực hiện trong Excel Chọn Tools Data Analysis Anova: Two Factor With Replication, sau ñó khai báo các thông tin như sau: Trong ñó Rows per sample là số lần lặp.
  • 43. 47 * Phân tích kết quả - Nếu FA F Crit A thì các mức của nhân tố A có ảnh hưởng khác nhau ñến kết quả. - Nếu FB F Crit B thì các mức của nhân tố B có ảnh hưởng khác nhau ñến kết quả. - Nếu FAB F Crit AB thì tương tác A B có ảnh hưởng ñến kết quả. Ví dụ 1.10: Một nghiên cứu tiến hành ñể xác ñịnh ảnh hưởng của việc bổ sung 2 loại vitamin (A và B) vào thức ăn ñể tăng trọng (kg/ngày) của lợn. Hai mức ñối với vitamin A (0 và 4 mg) và 2 mức ñối với vitamin B (0 và 5 mg). Số liệu thu ñược khi kết thúc thí nghiệm ñược trình bày như sau: Vitamin A 0 mg 4 mg Vitamin B 0 mg 5 mg 0 mg 5 mg 0.585 0.567 0.473 0.684 0.536 0.545 0.450 0.702 0.458 0.589 0.869 0.900 0.486 0.536 0.473 0.698 0.536 0.549 0.464 0.693 Khi xử lý trong Excel số liệu ñược bố trí lại như sau: Chọn Tools Data Analysis Anova: Two Factor With Replication, sau ñó khai báo các thông tin như sau:
  • 44. 48 Chú ý: Miền dữ liệu vào (Input Range) A2: C12. Không chọn ô có nhãn Vitamin B, mà ở ñây chỉ nhập ñể xem choão. Số lần lặp là 5. Kết quả thu ñược như bảng sau: Anova: Two-Factor With Replication SUMMARY 0 mg 5 mg Total 0 mg Count 5 5 10 Sum 2.601 2.786 5.387 Average 0.5202 0.5572 0.5387 Variance 0.0024342 0.0004432 0.00165912 4 mg Count 5 5 10 Sum 2.729 3.677 6.406 Average 0.5458 0.7354 0.6406 Variance 0.0327317 0.0085118 0.02831604 Total Count 10 10 Sum 5.33 6.463 Average 0.533 0.6463 Variance 0.015811333 0.0128009 ANOVA Source of Variation SS df MS F P-value F crit Sample 0.05191805 1 0.05191805 4.706889479 0.045448 4.493998 Columns 0.06418445 1 0.06418445 5.818961082 0.028222 4.493998 Interaction 0.02910845 1 0.02910845 2.638971553 0.123804 4.493998 Within 0.1764836 16 0.01103023 Total 0.32169455 19 Theo kết quả xử lý, ta rút ra kết luận: - Vitamin A có ảnh hưởng ñến tăng trọng của lợn (F F crit). - Vitamin B có ảnh hưởng ñến tăng trọng của lợn (F F crit). - Tương tác của Vitamin A và Vitamin B không ảnh hưởng ñến tăng trọng của lợn (F F crit). 2.4. Tương quan và Hồi quy 2.4.1. Hệ số tương quan Hệ số tương quan dùng ñể ño mức ñộ quan hệ giữa 2 biến. Hệ số tương quan có thể nhận giá trị từ -1 ñến +1. Nếu 1 biến theo chiều tăng còn biến kia thì giảm thì hệ số tương quan là âm. Ngược lại nếu cả 2 biến ñều theo chiều tăng thì hệ số tương quan dương. Hệ số tương quan |ρ| ≥ 0,7 tương quan tuyến tính. |ρ| = 1 thì quan hệ hoàn toàn tuyến tính. Hệ số tương quan ñược kí hiệu là ρ ñối với tổng thể và kí hiệu là r ñối với mẫu. * Tính hệ số tương quan mẫu r
  • 45. 49 ðối với 2 biến x và y, hệ số tương quan mẫu r ñược tính theo công thức sau: r = ( )( ) y x i i s s ) 1 n ( n 1 i Y X y x − ∑ = − − ở ñây x và sx là trung bình và ñộ lệch chuẩn mẫu ñối với mẫu thứ nhất, y và sy là trung bình và ñộ lệch chuẩn của mẫu thứ 2. * Tính hệ số tương quan trong Excel: Excel cho phép tính hệ số tương quan ñơn giữa các biến sắp xếp thành một bảng gồm n hàng, n cột (mỗi cột là 1 biến). a. Các bước thực hiện Chọn ToolsData AnalysisCorrelation và khai báo các mục: - Input range: miền dữ liệu kể cả nhãn. - Grouped by: Column (số liệu theo cột). - Labels in first row: ðánh dấu √ vào ô này nếu có nhãn ở dòng ñầu. - Output range: miền ra. - OK. b. Phân tích kết quả - Hệ số tương quan của dòng và cột ghi ở ô giao giữa dòng và cột. - Hệ số tương quan âm( 0) thể hiện mối tương quan nghịch biến. - Các hệ số tương quan có giá trị tuyệt ñối xấp xỉ 0.7 trở lên thể hiện mối tương quan tuyến tính (tương quan mạnh) giữa hai biến. Ví dụ 1.11: Xác ñịnh mối tương quan giữa khối lượng của gà mái (kg) và thu nhận thức ăn trong một năm (kg). Tiến hành quan sát 10 gà mái và thu ñược kết quả sau: Khối lượng gà mái 2.3 2.6 2.4 2.2 2.8 2.3 2.6 2.6 2.4 2.5 Khối lượng thức ăn 43 46 45 46 50 46 48 49 46 47 - Chọn ToolsData analysisCorrelation. - Khai báo các mục như hình sau:
  • 46. 50 - Kết quả thu ñược trên bảng sau: Khối lượng gà mái Khối lượng thức ăn Khối lượng gà mái 1 Khối lượng thức ăn 0.779445522 1 - Kết luận: Hệ số tương quan giữa khối lượng gà mái và khối lượng thức ăn là 0.779445522 , thể hiện mối tương quan tuyến tính. 2.4.2. Hồi quy tuyến tính trong excel Excel cho phép tìm phương trình hồi quy tuyến tính ñơn y= a+ bx và hồi quy tuyến tính bội y= a0 + a1x1 + a2x2 + . . . + anxn. Các biến ñộc lập chứa trong n cột, biến phụ thuộc y ñể trong một cột, các giá trị tương ứng giữa biến ñộc lập và biến phụ thuộc ñược xếp trên cùng một hàng. a. Các bước thực hiện Chọn ToolsData AnalysisRegression và khai báo các mục: - Input y range: miền dữ liệu biến y. - Input x range: miền dữ liệu các biến x. - Label: ðánh dấu √ vào ô này nếu có nhãn ở dòng ñầu. - Confidence level: 95% (ñộ tin cậy 95%). - Constant in zero: ðánh dấu √ nếu hệ số tự do a0 = 0 . - Output range: miền xuất kết quả. - Residuals: ðánh dấu √ vào ô này ñể hiện phần dư hay sai lệch giữa y thực nghiệm và y theo hồi quy. - Standardized residuals: ðánh dấu √ ñể hiện phần dư ñã chuẩn hoá. - Residuals plot: ðánh dấu √ ñể hiện ñồ thị phần dư. - Line fit plots: ðánh dấu √ ñể hiện ñồ thị các ñường dự báo. - Normal probability plot: ðánh dấu √ ñể hiện ñồ thị phần dư ñã chuẩn hoá. - OK. b. Phân tích kết quả - Nếu hệ số tương quan bội xấp xỉ 0.7 hoặc lớn hơn thì mô hình hồi quy tuyến tính là thích hợp (ngược lại nên tìm mô hình khác). - Hệ số tương quan R square trong cho biết bao nhiên % sự biến ñộng của y là do các yếu tố x gây nên. - Hệ số Adjusted R square nếu không sát gần với R square chứng tỏ không phải tất cả các biến ñưa vào là thực sự cần thiết. - Trong bảng phân tich hồi quy nếu mức ý nghĩa kiểm ñịnh F (Significiance F) nhỏ hơn mức ý nghĩa α thì phương trình hồi quy tuyến tính ñược chấp nhận. - Nhìn vào các hệ số của các biến ta viết ñược ñường hồi quy dự báo - Nếu suất cho ở cột P-value của hệ số của xi α thì hệ số của biến ñó có thể coi là bằng không. Trong trường hợp này, cần tiến hành lọc bớt biến xi ñể ñược ñường hồi quy với các hệ số ñều có ý nghĩa.
  • 47. 51 Ví dụ 1.12: Xác ñịnh phương trình hồi quy giữa khối lượng của gà mái (kg) và thu nhận thức ăn trong một năm (kg). Tiến hành quan sát 10 gà mái và thu ñược kết quả sau: Khối lượng gà mái 2.3 2.6 2.4 2.2 2.8 2.3 2.6 2.6 2.4 2.5 Khối lượng thức ăn 43 46 45 46 50 46 48 49 46 47 Số liệu nhập vào trong Excel theo cột. Chọn ToolsData AnalysisRegression và khai báo các mục như trên hình sau: Kết quả thu ñược theo bảng sau: SUMMARY OUTPUT Regression Statistics Multiple R 0.779445522 R Square 0.607535322 Adjusted R Square 0.558477237 Standard Error 0.121517421 Observations 10 ANOVA df SS MS F Significance F Regression 1 0.182868 0.1828681 12.384 0.007856347 Residual 8 0.118132 0.0147665 Total 9 0.301 Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Upper 95.0% Intercept -0.832967033 0.939372 -0.886728 0.4010953 -2.999161935 1.333227869 1.333227869 Khối lượng thức ăn 0.070879121 0.020141 3.5190908 0.0078563 0.024433162 0.11732508 0.11732508
  • 48. 52 BÀI TẬP CHƯƠNG I Bài 1: Một thí nghiệm ñược tiến hành nhằm so sánh nồng ñộ Epinephrine (PEP) trong huyết tương chó ở các thuốc gây mê khác nhau. Trong nghiên cứu này 10 cho ñược chọn tham gia thí nghiệm. Ba loại thuốc gây mê ñược lựa chọn ngẫu nhiên ñể lần lượt gây mê cho mỗi chó. Kết quả thu ñược như sau: Chó số 1 2 3 4 5 6 7 8 9 10 Thuốc A 1,07 1,35 0,69 0,28 1,24 1,53 0,49 0,56 1,02 0,30 Thuốc B 0,30 0,39 0,63 0,68 0,38 0,21 0,88 0,39 0,51 0,32 Thuốc C 0,28 0,51 1,00 0,39 0,29 0,36 0,32 0,69 0,17 0,33 So sánh hàm lượng Epinephrine ở 3 loại thuốc gây mê khác nhau? Bài 2: Tiến hành một nghiên cứu về công thức thức ăn trên gia cầm. Có 2 công thức thức ăn (Công thức 1 và Công thức 2) và tiến hành thí nghiệm trên cả con trống và mái. Khối lượng thức ăn thu nhận (gam) ở thí nghiệm nêu trên ñược trình bày như sau: Trống Mái Công thức 1 Công thức 2 Công thức 1 Công thức 2 70,9 59,2 65,7 50,8 67,9 53,8 59,4 50,5 69,9 47,6 67,7 50,5 So sánh lượng thức ăn thu nhận qua thí nghiệm nêu trên?