19.2 19.4 19.619.8 20.0 20.2 20.4
Trochę słownictwa
Podstawy statystyki Jakub M. Milczarek Uniwersytet Jagielloński
Błąd – różnica pomiędzy wartością zmierzoną a wartością prawdziwą
Powtórzenia – zbiór wyników stanowiących próbkę (statystyczną)
o określonym rozmiarze, złożony z wyników analiz prowadzony w taki
sam sposób
Rozrzut – różnica pomiędzy największym i najmniejszym wynikiem
3.
Średnia & mediana
Podstawystatystyki Jakub M. Milczarek Uniwersytet Jagielloński
Średnia – suma wszystkich
pomiarów podzielona przez ich
liczbę
Mediana – wartość środkowa uporządkowanej numerycznie serii danych
4.
Średnia & mediana
Podstawystatystyki Jakub M. Milczarek Uniwersytet Jagielloński
Oblicz średnią oraz medianę dla danych:
19.2 19.4 19.6 19.8 20.0 20.2 20.4
5.
Precyzja
Podstawy statystyki JakubM. Milczarek Uniwersytet Jagielloński
Precyzja - rozrzut wyników uzyskanych w dokładnie taki sam
sposób
Precyzję opisują:
• Odchylenie standardowe
• Wariancja
• Współczynnik zmienności
6.
Dokładność
Podstawy statystyki JakubM. Milczarek Uniwersytet Jagielloński
Dokładność – zgodność wartości zmierzone i wartości
prawdziwej (lub przyjętej za prawdziwą)
brak precyzji i dokładności precyzyjny i niedokładny precyzyjny i dokładny
7.
Dokładność
Podstawy statystyki JakubM. Milczarek Uniwersytet Jagielloński
Błąd bezwzględny – różnica między wartością zmierzoną
a wartością prawdziwą
Błąd względny – błąd bezwzględny podzielony przez wartość
prawdziwą
8.
Rodzaje błędów
Podstawy statystykiJakub M. Milczarek Uniwersytet Jagielloński
Błąd przypadkowy (nieokreślony) - ma jednakowe
prawdopodobieństwo bycia dużym lub małym
w serii pomiarowej
(determinuje precyzję pomiaru)
Błąd systematyczny (określony) – występuje
w każdym pomiarze w serii powtarzanych pomiarów
za każdym razem w tym samym kierunku
(determinuje dokładność pomiaru)
9.
Rodzaje błędów
Podstawy statystykiJakub M. Milczarek Uniwersytet Jagielloński
Błąd gruby – wynik pojawiający się sporadycznie
w serii i różnicy się znacząco do pozostałych
wyników w serii pomiarowej
10.
Test Q
Podstawy statystykiJakub M. Milczarek Uniwersytet Jagielloński
Otrzymujemy następujące wyniki pomiarów:
12,53 12,56 12,47 12,67 12,48
Czy wartość 12,67 powinniśmy odrzucić?
1.Układam wartości od najmniejszej do największej
2.Obliczamy zakres (range) – odległość od największej do najmniejszej
3.Obliczamy przerwę (gap) – odległość od podejrzanej wartości i
ostatniej wiarygodnej
4.Obliczamy wartość Q według wzoru
5.Porównujemy z wartościami tabelarycznymi
11.
Test Q
Podstawy statystykiJakub M. Milczarek Uniwersytet Jagielloński
Otrzymujemy następujące wyniki pomiarów:
12,53 12,56 12,47 12,67 12,48
Czy wartość 12,67 powinniśmy odrzucić?
Liczba
elementów 3 4 5 6 7 8 9 10
Q90%: 0,941 0,765 0,642 0,560 0,507 0,468 0,437 0,412
Q95%: 0,970 0,829 0,710 0,625 0,568 0,526 0,493 0,466
Q99%: 0,994 0,926 0,821 0,740 0,680 0,634 0,598 0,568
Źródła błędów systematycznych
Podstawystatystyki Jakub M. Milczarek Uniwersytet Jagielloński
Błędy instrumentalne
Odkształcenie ścianek
naczynia pomiarowego
Błędy kalibrowania
Zanieczyszczenia powierzchni naczyń
Obniżenie zasilania
urządzenia zasilanego
akumulatorem
Zastosowania przyrządu w
niesprzyjającym środowisku (np.
pHmetr w silnie kwaśnym)
Zmiany temperatury
Zakłócenia z sieci
elektrycznej
14.
Źródła błędów systematycznych
Podstawystatystyki Jakub M. Milczarek Uniwersytet Jagielloński
Błędy metody
Odstępstwa od
teoretycznego modelu
Nietrwałość substancji
Niespecyficzność większości
odczynników
Wolny przebieg reakcji
Reakcje uboczne
Jedne z najtrudniejszych do wykrycia!
15.
Źródła błędów systematycznych
Podstawystatystyki Jakub M. Milczarek Uniwersytet Jagielloński
Błędy osobowe
Określenie pozycji
wskaźnika na podziałce -
błąd paralaksy
Daltonizm
Określenie koloru w trakcie
obserwacji reakcji barwnej
Wolne reakcje (np. przy
włączaniu stopera)
Wrodzona wybiórczość!
Poprawianie precyzji przy odczycie
Percepcja pewnych cyfr (np. 0 i 5)
Percepcja pewnych cyfr (np. parzyste)
Faworyzowanie mniejszej cyfry niż
większej
16.
Wpływ błędów systematycznychna wyniki
Podstawy statystyki Jakub M. Milczarek Uniwersytet Jagielloński
Błędy stałe (addytywne) – wielkość błędu nie zależy od
wielkości próbki (i wartości mierzonej)
Błędy proporcjonalne (multiplikatywne) – rosną lub
maleją wraz z wielkością analizowanej próbki
Przykład:
Ubytek masy osadu wskutek przemywania cieczą o objętości wynosi 0,50 mg.
Jeśli masa osadu wynosi 500 mg to ile wyniesie błąd względy?
Jaki będzie błąd względny przy przemywaniu 50 mg osadu?
Źródło błędów proporcjonalnych – obecność w próbce składników
przeszkadzających, wprowadzających interferencje
17.
Wykrywanie błędów metody
Podstawystatystyki Jakub M. Milczarek Uniwersytet Jagielloński
Analiza materiałów odniesienia
Analizy kontrolne
• Porównania z innymi metodami
• Porównania między laboratoryjne
Analiza ślepej próby
Wpływ wielkości próbki
Matryca próbki!
18.
Rzut monetą
Podstawy statystykiJakub M. Milczarek Uniwersytet Jagielloński
1. Każdy rzuca 10 x monetą
2. Zapisujemy liczbę wyrzuconych reszek
3. Powtarzamy taką serię 3 razy
4. Zbieramy wyniki
5. Patrzymy co z tego wyjdzie!
19.
Źródła błędów przypadkowych
Podstawystatystyki Jakub M. Milczarek Uniwersytet Jagielloński
Kombinacje błędów
Wielkość
niepewności
Liczba kombinacji Względna częstość występowania
+U+U+U+U +4U 1 1/16 0,0625
-U+U+U+U
+2U 4 4/16 0,250
+U-U+U+U
+U+U-U+U
+U+U+U-U
-U-U+U+U
0 6 6/16 0,375
+U+U-U-U
+U-U+U-U
-U+U-U+U
-U+U+U-U
+U-U-U+U
+U-U-U-U
-2U 4 4/16 0,250
-U+U-U-U
-U-U+U-U
-U-U-U+U
-U-U-U-U -4U 1 1/16 0,0625
20.
Krzywa normalnego rozkładu(krzywa Gaussa)
Podstawy statystyki Jakub M. Milczarek Uniwersytet Jagielloński
wynik pomiaru
liczbarealizacji
funkcja rozkładu
Histogram – wykres słupkowy
Carl Friedrich Gauss
21.
Populacja i próbka
Podstawystatystyki Jakub M. Milczarek Uniwersytet Jagielloński
Populacja – zbiór wszystkich
pomiarów danego typu.
Próbka statystyczna – niewielki
podzbiór pomiarów wyodrębnionych
z populacji.
Pole powierzchni podwykresem
Podstawy statystyki Jakub M. Milczarek Uniwersytet Jagielloński
2
2
2
)(
2
1
)(
x
exf
68,2%
95,4%
99,7%
25.
Odchylenie standardowe próbki
Podstawystatystyki Jakub M. Milczarek Uniwersytet Jagielloński
Odchylenie standardowe próbki – miara precyzji wyników próbki
N – 1 – liczba stopni swobody
26.
Odchylenie standardowe próbki(alternatywna postać)
Podstawy statystyki Jakub M. Milczarek Uniwersytet Jagielloński
Odchylenie standardowe próbki – miara precyzji wyników próbki
N – 1 – liczba stopni swobody
27.
Obliczanie błędów
Podstawy statystykiJakub M. Milczarek Uniwersytet Jagielloński
Przykład:
Uzyskano następujące rezultaty oznaczenia ołowiu
Nr pomiaru μg/ml
1 0,752
2 0,756
3 0,752
4 0,751
5 0,760
Proszę obliczyć średnią oraz odchylenie standardowe
dla tej serii wyników
xśr = 0,7542 μg/ml, s = 0,004 μg/ml
Zbiorcze odchylenie standardowe
Podstawystatystyki Jakub M. Milczarek Uniwersytet Jagielloński
Przykład
Poziom glukozy sprawdzany jest rutynowo u pacjentów cierpiących na cukrzycę. Metodą
spektrofotometryczną oznaczano glukozę u pacjenta z lekko podniesionym poziomem glukozy w okresie
kilku miesięcy. W celu obniżenia poziomu glukozy zastosowano u pacjenta dietę ubogą w cukier.
Rezultatem badań efektywności diety są następujące wyniki. Obliczyć zbiorczy estymator odchylenia
standardowego zastosowanej metody.
Okres Stężenie glukozy [mg/l]
Średnie stężenie
glukozy [mg/l]
Suma kwadratów
odchyleń od średniej
Odchylenie
standardowe
Miesiąc 1
1108, 1122, 1075, 1099,
1115, 1083, 1100
1100,3 1687,43 16,8
Miesiąc 2
992, 975, 1022, 1001,
991
996,2 1182,80 17,2
Miesiąc 3 788, 805, 779, 822, 800 798,8 1086,80 16,5
Miesiąc 4
799, 745, 750, 774, 777,
800, 758
771,9 2950,86 22,2
Całkowita liczba pomiarów = 24 Całkowita suma kwadratów odchyleń = 6907,89
31.
Wariancja i innemiary precyzji
Podstawy statystyki Jakub M. Milczarek Uniwersytet Jagielloński
Wariancja
Względne
odchylenie
standardowe
Współczynnik
zmienności
32.
Obliczanie błędów
Podstawy statystykiJakub M. Milczarek Uniwersytet Jagielloński
Przykład:
Uzyskano następujące rezultaty oznaczenia ołowiu
Nr pomiaru μg/ml
1 0,752
2 0,756
3 0,752
4 0,751
5 0,760
Proszę obliczyć wariancję, RSD w ppt, CV i rozrzut serii wyników
s2 = 1,4 ∙ 10-5, RSD = 5,0 ppt, CV = 0,50%, w = 0,009 μg/ml
33.
Propagacja błędów
Podstawy statystykiJakub M. Milczarek Uniwersytet Jagielloński
Dodawanie / odejmowanie
Mnożenie / dzielenie
Potęgowanie
Logarytmowanie
Antylogarytmowanie
Cyfry znaczące
Podstawy statystykiJakub M. Milczarek Uniwersytet Jagielloński
Liczba cyfr mnożonych przez potęgę 10 to liczba cyfr znaczących
3456 = 3,456 103 4 cyfry znaczące
0,0486 = 4,86 10-2 3 cyfry znaczące
16,07 = 1,607 101 4 cyfry znaczące
9,300 = 9,300 100 4 cyfry znaczące
36.
Cyfry znaczące woperacjach matematycznych
Podstawy statystyki Jakub M. Milczarek Uniwersytet Jagielloński
Mnożenie i dzielenie: liczba cyfr
znaczących wyniku jest określona przez
najmniejszą liczbę cyfr znaczących
wyników pomiaru poddanych operacji
6,38 x 2,0 = 12,76 13
(2 cyfry znaczące)
37.
Cyfry znaczące woperacjach matematycznych
Podstawy statystyki Jakub M. Milczarek Uniwersytet Jagielloński
Dodawanie i odejmowanie: liczba cyfr
znaczących wyniku jest równa liczbie miejsc
dziesiętnych w najmniej dokładnym pomiarze.
6,8 + 11,934 = 18,734 18,7
(3 cyfry znaczące)
38.
Cyfry znaczące wzapisie wyników i błędów
Podstawy statystyki Jakub M. Milczarek Uniwersytet Jagielloński
Dobre zasady:
• liczba cyfr znaczących w wyniku taka sama, jak w błędzie
• jeśli występuje notacja naukowa (potęga dziesiętna),
to wynik i błąd muszą być w tej samej notacji
• w błędzie wystarczy jedna cyfra znacząca, chyba że jest
to 1 lub 2 wtedy pozostawiamy kolejną cyfrę
39.
Cyfry znaczące wzapisie wyników i błędów
Podstawy statystyki Jakub M. Milczarek Uniwersytet Jagielloński
Otrzymujemy następujące wyniki obliczeń:
60,8 ± 11,934
Zamieniamy na:
61 ± 12
Przykład
40.
Cyfry znaczące wzapisie wyników i błędów
Podstawy statystyki Jakub M. Milczarek Uniwersytet Jagielloński
Otrzymujemy następujące wyniki obliczeń:
60,8 ± 0,201
Zamieniamy na:
60,8 ± 0,2
60,80 ± 0,20
Przykład
41.
Cyfry znaczące wzapisie wyników i błędów
Podstawy statystyki Jakub M. Milczarek Uniwersytet Jagielloński
Otrzymujemy następujące wyniki obliczeń:
65,0 ± 0,11
Zamieniamy na:
65,00 ± 0,11
Przykład
42.
Cyfry znaczące wzapisie wyników i błędów
Podstawy statystyki Jakub M. Milczarek Uniwersytet Jagielloński
Otrzymujemy następujące wyniki obliczeń:
wynik: 6,43432, błąd: 6 x 10-2
6,43432 ± 6 x 10-2
Przykład
Prawidłowo:
6,43 ± 0,06
43.
Cyfry znaczące wzapisie wyników i błędów
Podstawy statystyki Jakub M. Milczarek Uniwersytet Jagielloński
Otrzymujemy następujące wyniki obliczeń:
wynik: 6,4 x 10-2, błąd: 6 x 10-4
6,4 x 10-2 ± 6 x 10-4
Przykład
Prawidłowo:
(64,0 ± 0,6) x 10-3
(6,40 ± 0,06) x 10-2
44.
Cyfry znaczące wzapisie wyników i błędów
Podstawy statystyki Jakub M. Milczarek Uniwersytet Jagielloński
Otrzymujemy następujące wyniki obliczeń:
wynik: 0,234234, błąd: 0,2
0,234234 ± 0,2
Przykład kuriozalny
Prawidłowo:
0,2 ± 0,2
(czyli i tak pomiar bez sensu)
45.
Zapis wyników ibłędów
Podstawy statystyki Jakub M. Milczarek Uniwersytet Jagielloński
Stała próbka o masie 3,4824 g, zawierająca kwas
benzoesowy C6H5COOH, została rozpuszczona
i zmiareczkowana zasadą wobec fenoloftaleiny.
Zużyto 41,36 ml roztworu NaOH o stężeniu 0,2328 mol/l.
Obliczyć zawartość procentową kwasu w próbce.
Przykład
Niepewność odczytu poziomu cieczy: ± 0,02 ml
Niepewność wagi analitycznej ± 0,0001 g
Niepewność stężenia ±0,0001 mol/l
46.
Analiza statystyczna wynikówpomiaru
Podstawy statystyki Jakub M. Milczarek Uniwersytet Jagielloński
Im węższy przedział (różnica między górną i dolną granicą przedziału),
tym bardziej precyzyjna jest estymacja przedziałowa
Im wyższa jest wartość współczynnika ufności, tym szerszy przedział
Przedział ufności dla średniej
1}{ n
s
n
s
tXmtXP
- odchylenie standardowe z próby
- wartość odczytana z tablic rozkładu t-Studenta
- współczynnik ufności, 0-1
- wartość zmierzona
s
1,n
t
m
x
47.
Rozkład normalny
Podstawy statystykiJakub M. Milczarek Uniwersytet Jagielloński
pH = 5,50 ± 0,22
Przykład: pomiar pH
przyjmijmy poziom ufności P = 95 %
05,005,0195,0P
wartość średnia i odchylenie std. średniej
Współczynnik ufności:
x
Analiza skupień (CA)& Analiza głównych składowych (PCA)
Analiza skupień
(ang. Cluster Analysis, CA)
(miara podobieństwa: kwadratowa odległość
euklidesowa i metoda tworzenia skupień: metoda
pełnego wiązania – najdalszego sąsiedztwa)
Podstawy statystyki Jakub M. Milczarek Uniwersytet Jagielloński
Analiza głównych składowych
(ang. Principal Component Analysis, PCA)
52.
Błędy I iII typu
Fałszywie pozytywny
(typ I)
Fałszywie negatywny
(typ II)
Wykrywamy:
KREW
W rzeczywistości był:
KETCHUP
Wykrywamy:
KETCHUP
W rzeczywistości była:
KREW
Źródło: http://editinternational.com
Źródło: Science Photo LibraryŹródło: drmikewellness.org
Podstawy statystyki Jakub M. Milczarek Uniwersytet Jagielloński