1. SỬ DỤNG THỐNG KÊ TRONG
PHÂN TÍCH SỐ LIỆU
1
ĐHYDược TpHCM – Bộ môn HPT-KN
GV: TS.DS. Nguyễn Hữu Lạc Thủy
Năm học: 2015 - 2016
HÓA PHÂN TÍCH 1
2. NỘI DUNG
1. Sai số trong phân tích
2. Xử lý kết quả thực nghiệm
3. Chữ số có nghĩa
2
3. MỤC TIÊU BÀI HỌC
1. Trình bày được các khái niệm về sai số
2. Nêu các nguyên nhân gây sai số và cách khắc phục
3. Thực hiện được các bước xử lý số liệu trong HPT
4. Chữ số có nghĩa và cách làm tròn số
5. Trình bày kết quả thực nghiệm đúng yêu cầu
3
4. 4
Ví dụ 1: hàm lượng ddịch Kalipermanganat: 3,100 (g/l).
Sau 7 lần xác định kết quả (g/l):
3,102 3,080 3,089
3,123 3,094 3,090
3,103 3,107 3,092
3,111 3,056 3,088
3,115 3,112 3,089
3,131 3,154 3,095
3,140 3,168 3,092
KNV A KNV B KNV C
8. 9
Đo lường
Sai số trong phân tích – vấn đề cần quan tâm
Giá trị thật?
- ĐÚNG?
- CHÍNH XÁC?
SAI SỐ TRONG PHÂN TÍCH
9. 10
1. Sai số ngẫu nhiên
Nguyên nhân: không xác định, dao động quanh XTB.
không thể loại trừ, chỉ có thể hạn chế.
Xử lý: - tăng số lần phân tích (n ≥ 6)
- đánh giá các số liệu thực nghiệm bằng toán thống kê.
Sai số ngẫu nhiên ảnh hưởng đến độ chính xác.
CÁC LOẠI SAI SỐ TRONG PHÂN TÍCH
11. SAI SỐ NGẪU NHIÊN – ĐỘ CHÍNH XÁC
ĐỘ CHÍNH XÁC: độ lặp lại, độ chính xác trung gian, độ sao chép lại.
Ví dụ 1: hàm lượng Kalipermanganat:
3,080
3,094
3,107
3,056
3,112
3,174
3,198 (g/l)
12. ĐỘ CHÍNH XÁC – CÁCH ĐÁNH GIÁ
1
/
22
n
nXiXi
SD
13
ĐỘ CHÍNH XÁC: S S2 RSD %
Hàm lượng ddịch KMnO4: (g/l)
(1): 3,080
(2): 3,094
(3): 3,107
(4): 3,056
(5): 3,112
(6): 3,174
(7): 3,198
1
1
2
2
n
Xx
S
n
i
TBi
13. ĐỘ CHÍNH XÁC – CÁCH ĐÁNH GIÁ
%100x
X
SD
CVRSD
TB
14
ĐỘ LỆCH CHUẨN TƯƠNG ĐỐI RSD %
Hàm lượng của ddịch KMnO4
3,080; 3,094; 3,107; 3,056; 3,112; 3,174; 3,198 (g/l)
RSD %:
- đánh giá độ phân tán của dãy giá trị đo
so với giá trị trung bình
- hoặc để so sánh độ chính xác của các
dãy giá trị đo
ĐỘ CHÍNH XÁC: S S2 RSD %
14. 15
Ví duï 1: 3,080; 3,094; 3,107; 3,056; 3,112; 3,174; 3,198 (g/l)
117,3Xtb
00137,0)037,0()117,3080,3( 22
00656,0081,0117,3198,3
22
01556,000656,000325,000003,000372,000010,000053,000137,0
051,0
17
01556,0
SD
%6,1%100
117,3
051,0
% xCVRSD
…
1
)(
1
2
n
XtbXi
SD
n
i
%100x
X
SD
CVRSD
TB
n
x
Xtb
n
i
i
1
n
xxxx
Xtb n
...321
ĐỘ CHÍNH XÁC – CÁCH ĐÁNH GIÁ
15. XỬ LÝ SỐ LiỆU PHÂN TÍCH
n
x
Xtb
n
i
i
1
1
)(
1
2
n
XtbXi
SD
n
i
%100%
Xtb
SD
CVRSD
)1(
)(
1
2
2
n
xx
S
n
i
tbi
1/ SAI SỐ NGẪU NHIÊN
Hàm fx trong MS Excel:
- XTB: AVERAGE
- S2: VAR
- SD: STDEV
16.
17.
18.
19. SAI SỐ HỆ THỐNG - ĐỘ ĐÚNG
2. Sai số hệ thống
Nguyên nhân:
- mẫu,
- dụng cụ,
- phương pháp,
- kiểm nghiệm viên
độ đúng khắc phục và loại trừ.
20. 21
SAI SỐ HỆ THỐNG - ĐỘ ĐÚNG
Độ đúng: mức độ sát gần xi giá trị thật M
21. 22
SAI SỐ HỆ THỐNG - ĐỘ ĐÚNG
Độ đúng:
- mức độ sát gần xi giá trị thật M
- sai số không đổi: không phụ thuộc vào lượng mẫu
lượng mẫu càng lớn, càng ít sai số.
- hay sai số tỷ lệ: tỷ lệ với lượng mẫu
Đánh giá: - sai số tuyệt đối Et = Xi – M
- sai số tương đối E% = tỷ lệ phục hồi
- test T
25. 27
XÁC ĐỊNH SAI SỐ HỆ THỐNG
Đối với mẫu đã biết trước hàm lượng:
Căn cứ vào k = (n-1) và P (95%): xác định tlt
Nếu tlt > ttn không có sai số hệ thống
Hàm lượng thật M = 3,110 mg, xét xem phương pháp có sai số hệ thống?
ttn = 0,3786 < tlt = 2,45: không có sai số hệ thống
n
SD
MXtb
ttn
Dãy số liệu: 3,080; 3,094; 3,107; 3,056; 3,112; 3,174; 3,198 (g/l)
27. 29
PHÁT HIỆN VÀ LOẠI TRỪ SAI SỐ HỆ THỐNG
- Phân tích mẫu chuẩn
- Phân tích bằng các phương pháp độc lập
- Phân tích mẫu trắng
- Thay đổi lượng mẫu
28. 30
2. Sai soá
Sai soá ngaãu nhieân
(Sai soá khoâng xaùc ñònh)
Sai soá heä thoáng
(Sai soá xaùc ñònh)
Sai soá thoâ
Sai số khi kết quả đo
khác xa với giá trị
trung bình hay giá trị
thực của mẫu
29. 31
Sai số ngẫu nhiên: xử lí theo thống kê toán học.
Sai số hệ thống: khắc phục và loại trừ.
Sai số thô: loại bằng chuẩn Dixon hoặc test T.
30. 32
Kết quả định lượng B1/Trivibeta, kết quả của 6 lần đo như sau:
Số liệu nghi ngờ là: 126,7 mg
Xác định xem giá trị đo này có phải là sai số thô?
Lần đo Kết quả (mg)
1 124.7
2 124.8
3 125.6
4 125.0
5 125.3
6 125.6
126.7
Sai số thô – cách loại trừ
minmax
21
xx
xx
Qtn
Qtn = ( 126,7 - 125,6 ): (126,7 - 124,7) = 0,55
Tính Qlt tra bảng Dixon với n = 6
P = 0,95 cho Qlt = 0,56 .
Qlt > Qtn: có thể giữ số liệu 126,7.
31. n P = 0,9 P =0,95 P =0,99
3 0,89 0,94 0,99
4 0,68 0,77 0,89
5 0,56 0,64 0,76
6 0,48 0,56 0,70
7 0,43 0,51 0,64
8 0,40 0,48 0,58
33
32. 34
Ví dụ:
Với dãy số liệu: 17,61 16,86 16,93 16,84 16,95 16,91
Bước 1: 16,84 16,86 16,91 16,93 16,95 17,61
Bước 2: tính
Bước 3: n = 6; P = 0,95
Qlt = 0,56 < Qtn = 0,86 loại bỏ17,61
Qlt = 0,56 > Qtn = - 0,03 giữ lại 16,84
86,0
84,1661,17
95,1661,17
Qtn 03,0
84,1661,17
86,1684,16
Qtn
33. 35
Loại sai số thô bằng test T
Tlt : căn cứ vào n và vào P theo yêu cầu tra được Tlt
Ttn < Tlt: số liệu được giữ lại
Ttn > Tlt: số liệu bị loại trừ
SDXtbXTtn /)( max SDXXtbTtn /)( min
37. NỘI DUNG
1.Sai số trong phân tích
2. Các bước xử lý kết quả thực nghiệm
3. Chữ số có nghĩa - Cách làm tròn số
39
38. 40
Khi nào cần xử lí kết quả thực nghiệm?
- SSNN của 1 phép đo là sự kết hợp ngẫu nhiên các sai số cá thể xử lí
theo thống kê toán học.
- Xác định có hay không có sai số hệ thống của kết quả thực nghiệm
- Đánh giá độ chính xác, độ đúng của phương pháp hay dụng cụ
- So sánh 2 phương pháp, hai dụng cụ, hai KNV, hai mẫu thử…
39. 41
Tóm tắt các bước đánh giá kết quả phân tích
Ví dụ: 3,080; 3,094; 3,107; 3,056; 3,112; 3,174; 3,198 (g/l)
Các bứơc tiến hành như sau:
Bước 1: 3,056 3,080 3,094 3,107 3,112 3,174 3,198
Bước 2: theo chuẩn Q hoặc T: không loại bỏ giá trị nào
Bước 3: Xtb = 3,117; SD = 0,05; RSD = 1,63%
= 0,3786 < Tlt = 2,45: không có sai số hệ thống
Bước 4: ứng với P = 0,95; n =7 thì Tlt = 2,45 thì e = ± 0,047
Bước 5: hàm lượng kalipermanganat trong khoảng
M = 3,117 ± 0,047 (g/l)
n
SD
MXtb
ttn
40. 42
XỬ LÝ SỐ LiỆU PHÂN TÍCH
Ví dụ: 3,080; 3,094; 3,107; 3,056; 3,112; 3,174; 3,198 (g/l)
41. 43
SO SÁNH HAI PHƯƠNG SAI - TEST F
nA: số lần thực nghiệm của dãy số liệu A,
nB: số lần thực nghiệm của dãy số liệu B,
2
AS
2
BS
2
2
B
A
tn
S
S
F
2
AS 2
BS≥
Tính Ftn:
So sánh giá trị Ftn với Flt. Flt phụ thuộc vào bậc tự do của hai thí nghiệm A và B và
phụ thuộc vào mức xác xuất, thông thường là 95% (bảng 3.4).
Flt > Ftn: không có sự khác biệt về độ lặp lại của A và B
Flt < Ftn: độ lặp lại của hai thí nghiệm A và B khác nhau
42. 44
nA: 7
nB: 6
2
AS
2
BS
2
2
B
A
tn
S
S
F Tính Ftn:
Tra bảng 3.4, P = 0,95, KA = 6, KB = 5 thì Flt = 6,978
Flt = 6,987 > Ftn = 1,88: độ chính xác của hai PP như nhau
= 0,00259
= 0,00138
Ftn = 1,88
SO SÁNH HAI PHƯƠNG SAI - TEST F
Trong trường hợp so sánh kết quả từ nhiều (n) dãy thử nghiệm hoặc từ n PP:
- chuẩn Bartlett
- hay chuẩn Cochran
43. 45
SO SÁNH HAI HAY NHIỀU GIÁ TRỊ TRUNG BÌNH - TEST
T
tbAX ASD 2
ASAn
tbBX BSD
2
BSBn
2
AS 2
BS
Kết quả của pp A:
Bước 1: so sánh hai phương sai
Bước 2: có hai trương hợp
Kết quả của pp B:
44. 46
SO SAÙNH HAI SOÁ TRUNG BÌNH - TEST T
2
AS 2
BS
tnt
)/1()/1( BApool
tbBtbA
tn
nnS
XX
t
2
11 22
BA
BBAA
pool
nn
SnSn
S
ltt 2 BA nn
Tröôøng hôïp 1: phöông sai vaø khoâng khaùc nhau
ñöôïc tính:
ñöôïc tra töø baûng (3.1) vôùi ñoä töï do ( ), P = 95%.
45. 47
SO SAÙNH HAI SOÁ TRUNG BÌNH - TEST T
2
AS 2
BS
tnt
BBAA
tbBtbA
tn
nSnS
XX
t
// 22
ltt
2
1//1//
//
2222
222
BBBAAA
BBAA
nnSnnS
nSnS
Tröôøng hôïp 2: phöông sai vaø khaùc nhau
ñöôïc tính:
ñöôïc tra töø baûng (3.1) vôùi P = 95% vaø ñoä töï do
ñöôïc laøm troøn thaønh soá nguyeân coù giaù trò keá caän nhaát
= 5,4 thì ñoä töï do laø 5; = 5,9 thì ñoä töï do laø 6
46. 48
SO SAÙNH HAI SOÁ TRUNG BÌNH - TEST T
Böôùc 3: keát luaän
Cho duø Ttn ñöôïc tính theo caùch naøo:
Neáu Ttn < Tlt keát luaän hai phöông phaùp cho keát quaû khoâng khaùc nhau
Neáu Ttn > Tlt keát luaän hai phöông phaùp cho keát quaû khaùc nhau
A: 3,080; 3,094; 3,107; 3,056; 3,112; 3,174; 3,198 (g/l)
B: 3,052; 3,141; 3,083; 3,083; 3,048 (g/l)
So saùnh hai phöông sai khoâng khaùc nhau.
0459,0
)257(
)00138,0)(15()00259,0)(17(
poolS
34,1
)5/1()7/1(0459,0
081,3117,3
tnt
Tlt ñöôïc tra töø baûng (3.1), ñoä töï do n = (7 + 5 - 2) = 10; Ttn = 1,34 < Tlt = 2,23
neân keát luaän hai phöông phaùp A vaø B cho keát quaû khoâng khaùc nhau (P=95%)
69. Sai soá heä thoáng Sai soá ngaãu nhieân Sai soá thoâ
sai số xác định sai soá khoâng xaùc ñònh
keát quaû ño khaùc raát xa giaù
trò trung bình, giaù trò thöïc
coù theå bieát nguyeân nhaân
do maãu ño, duïng cuï,
pheùp ño vaø do kieåm
nghieäm vieân
khoâng theå bieát nguyeân
nhaân
do giôùi haïn töï nhieân veà
khaû naêng cuûa chuùng ta
chuû quan cuûa ngöôøi laøm
maãu hoaëc khaùch quan
cuûa ñieàu kieän thí nghieäm
Thöôøng coù qui luaät khoâng tuaân theo qui luaät
coù theå hieäu chính
khoâng theå hieäu chính
ñöôïc
khoâng theå hieäu chính
ñöôïc
loaïi tröø ñöôïc
taêng soá thí nghieäm vaø xöû
lyù thoáng keâ
phaân tích nhieàu laàn vaø
loaïi tröø baèng thoáng keâ
phaûn aùnh
ñoä ñuùng cuûa pheùp ño
phaûn aùnh
ñoä chính xaùc cuûa pheùp ño
71
70. Sai soá heä thoáng Sai soá ngaãu nhieân Sai soá thoâ
72
71. 73
GIÁ TRỊ TRUNG BÌNH ĐỘ LỆCH CHUẨN
SD: ñoä leäch chuaån
RSD: ñoä leäch chuaån töông ñoái
CV%: heä soá bieán thieân
KHOẢNG TIN CẬY
e: Giôùi haïn tin caäy, sai soá ngaãu
nhieân.
: khoaûng tin caäy
CAÙC ÑAÏI LÖÔÏNG THOÁNG KEÂ
1 2 ... n
TB
x x x
X
n
100%
TBX
SD
CVRSD
n
SDt
e
n
SDt
XTB
TB TBX e M X e
1
)(
1
2
n
XtbXi
SD
n
i
72. 74
Ví duï 1: 3,080; 3,094; 3,107; 3,056; 3,112; 3,174; 3,198
117,3Xtb
00137,0)037,0()117,3080,3( 22
00656,0081,0117,3198,3
22
01556,000656,000325,000003,000372,000010,000053,000137,0
051,0
17
01556,0
SD
%6,1%100
117,3
051,0
% xCVRSD
…
1
)(
1
2
n
XtbXi
SD
n
i %100x
X
SD
CVRSD
TB
CAÙC ÑAÏI LÖÔÏNG THOÁNG KEÂ
1 2 ... n
TB
x x x
X
n
Vôùi P = 95%, giaù trò t ñöôïc tra töø baûng Student (vôùi n = 6, baäc töï do (n-1) = 5 thì t = 2,57).
0,051
2,57. 0,0586
6 1
e
n
SDt
e