Próba statystyczna i dobór próby

PRÓBA STATYSTYCZNA
DOBÓR PRÓBY
● POPULACJA DOCELOWA I BADANA Slide 3
● OPERAT LOSOWANIA Slide 5
● MIT PRÓBY REPREZENTATYWNEJ Slide 6
● BŁĄD I TENDENCYJNOŚĆ PRÓBKOWANIA Slide 9
● DOBÓR PROBABILISTYCZNY Slide 11
● SKUTKI WYBORU TECHNIKI DOBORU PRÓBY Slide 16
● DOBÓR NIEPROBABILISTYCZNY Slide 17
● ANALIZA MOCY - WSTĘP Slide 20
● ANALIZA MOCY - PODSTAWOWE POJĘCIA Slide 29
● ANALIZA MOCY - ETAPY Slide 39
Artur Sołtysiak, styczeń 2015

SPOSÓB CYTOWANIA:
Artur Sołtysiak “Próba statystyczna. Dobór próby”. v1, prezentacja, styczeń 2015
Treść licencji: http://creativecommons.org/licenses/by-nc-nd/3.0/pl/legalcode

POPULACJA DOCELOWA (TARGET POPULATION)
➢ całkowita populacja na której skupia się badanie
POPULACJA BADANA (STUDY POPULATION)
➢ część populacji docelowej z której pobrana jest próba reprezentatywna
➢ badacz dobiera uczestników badania, którzy odpowiadają kryteriom włączenia

JAK PRZEJŚĆ OD WIELKIEJ POPULACJI
DOCELOWEJ POPRZEZ DUŻĄ POPULACJĘ
BADANĄ DO MOJEJ PRÓBY
REPREZENTATYWNEJ?

OPERAT LOSOWANIA* lub: PRZESTRZEŃ PRÓBKOWANIA
(SAMPLING FRAME)
➢ materiał źródłowy (list frames) lub urządzenie (non-list frames)
z którego pobiera się próbę
➢ wyczerpująca lista wszystkich tych elementów populacji które mogą podlegać
próbkowaniu (osoby, elementy, szpitale, instytucje, oddziały szpitalne)
➢ zawiera jednostki będące przedmiotem zainteresowania badacza
➢ dostarcza przejrzystą strukturę z której można pobrać próbę
(numeryczny identyfikator + cechę charakterystyczna każdej jednostki)
➢ obmyślając ramę próbkowania należy rozróżniać populację docelową od
populacji badanej
➢ nie ma idealnej, ale musi być jak najbardziej reprezentatywna
(lustrzane odbicie populacji docelowej za wyjątkim liczebności)
* definicja Głównego Urzędu Statystycznego TUTAJ

MIT PRÓBY REPREZENTATYWNEJ
● STATYSTYKA MATEMATYCZNA NIE ZNA POJĘCIA
“PRÓBY REPREZENTATYWNEJ”
● PR MOŻE JEDYNIE OZNACZAĆ TAKI SPOSÓB DOBORU, KTÓRY
NIE PROWADZI DO POWSTANIA BŁĘDU SYSTEMATYCZNEGO
(KIERUNKOWE WYPACZENIE WYNIKÓW)
● SPOSÓB NA IDEALNY DOBÓR PRÓBY NIE ISTNIEJE
● ZAWSZE NALEŻY LICZYĆ SIĘ Z MOŻLIWOŚCIĄ BŁĘDU
STATYSTYCZNEGO

MIT PRÓBY REPREZENTATYWNEJ
JAK DUŻA PRÓBA JEST REPREZENTATYWNA?
● NIE MA SENSOWNEJ ODPOWIEDZI NA TO PYTANIE
- ZALEŻY OD MOŻLIWOŚCI FINANSOWYCH PYTAJĄCEGO
● BŁĄD STATYSTYCZNY NAJPROŚCIEJ MINIMALIZUJE SIĘ PRZEZ
ZWIĘKSZENIE LICZEBNOŚCI PRÓBY
PROBLEM: BŁĄD NIE MALEJE PROPORCJONALNIE DO WZROSTU
LICZEBNOŚCI PRÓBY A JEDYNIE DO PIERWIASTKA Z LICZEBNOŚCI
PRÓBY (2X MNIEJSZY BŁĄD WYMAGA 4X WIĘKSZEJ PRÓBY!)
PROPORCJONALNIE DO LICZEBNOŚCI PRÓBY ROŚNIE TYLKO KOSZT!

DLA KOGO CHCESZ UOGÓLNIĆ BADANIE?
DO JAKIEJ POPULACJI MOŻESZ
MIEĆ DOSTĘP?
JAK ZDOBĘDZIESZ DO NICH DOSTĘP?
KTO JEST W TWOIM BADANIU?
POPULACJA DOCELOWA
POPULACJA BADANA
OPERAT LOSOWANIA
PRÓBA

BŁĄD PRÓBKOWANIA (SAMPLING ERROR):
➢ taki sposób doboru próby który prowadzi do tendencyjności próbkowania
➢ próba staje się niereprezentatywna, badanie jest nie trafne (invalid),
wyników badania nie można wykorzystać w praktyce
TENDENCYJNOŚĆ PRÓBKOWANIA
(SAMPLING BIAS, ASCERTAINMENT BIAS):
➢ “próba różni się od populacji, z której została wybrana pod względem
częstości występowania jakiejś istotnej cechy sprawiającej, że charakterystyka
próby ze względu na tę cechę różni się od charakterystyki populacji”
(Andrzej Zieliński “Dobór próby w badaniach epidemiologicznych”)
➢ próbę pobrano w taki sposób, że część członków danej populacji jest słabiej
reprezentowana niż inni

ŹLE OPRACOWANY LUB NIEDOKŁADNY
(INACCURATE) OPERAT LOSOWANIA TO
BŁĄD KTÓREGO NIE DA SIĘ SKORYGOWAĆ!

TECHNIKI DOBORU PRÓBY
czyli losować czy nie losować
DOBÓR PROBABILISTYCZNY (PROBABILITY SAMPLES):
❖ każda jednostka operata losowania ma znaną, większą niż zero szansę bycia
wylosowanym
❖ badacz nie ma wpływu na mechanizmy rządzące doborem konkretnych
jednostek do badania
❖ o “wyborze” elementu decyduje przypadek
❖ oparte na rachunku prawdopodobieństwa i statystyce matematycznej
❖ zaleta: przy uogólnianiu wyników badania z próby na całą populację można
oszacować błąd doboru

dobór probabilistyczny
DOBÓR LOSOWY PROSTY (SIMPLE RANDOM SAMPLE):
➢ każdy element operatu losowania ma znaną i równą szansę selekcji
➢ próba brana jest w jednym ciągnieniu losowym
➢ najlepszy w tworzeniu szacunkowej dla całej populacji
➢ słaby gdy chcemy dowiedzieć się czegoś o podgrupach populacji
➢ może okazać się kosztowny lub w niektórych przypadkach niemożliwy
DOBÓR SYSTEMATYCZNY (SYSTEMATIC SAMPLE):
➢ tak samo jak w DLP, różnica polega na tym że do pobrania próby
wykorzystuje się metodę selekcji systematycznej;
np pierwszy element z nr 4 a potem co 5-ty
➢ tańszy niż DLP ale wymaga ostrożności i przemyślenia

DOBÓR WARSTWOWY (STRATIFIED SAMPLE):
➢ operat losowania jest podzielony na nie nakładające się grupy
zainteresowania (strata)
➢ próby niekoniecznie jednakowo liczebne pobrane są z każdej takiej grupy
➢ badacz kontroluje dobór próby z każdej grupy (stratum)
➢ najlepsze do ustalenia szacunkowej dla całej populacji oraz dla każdej grupy
➢ wymaga: ↑kosztów, ↑próby,
➢ wysoka złożoność i trudność badania

DOBÓR KLASTROWY (CLUSTER SAMPLE):
➢ operat losowania jest podzielony na nie nakładające się grupy (clusters)
➢ pobiera się próbkę klastrów (random sample) a następnie próbki z każdego
wybranego klastra
➢ klaster służy jako wygodny dostęp do elementów próby na których skupia się
badanie, sam klaster to narzędzie, nie obiekt zainteresowania
➢ pozwala zaoszczędzić pieniądze
➢ daje mniej dokładne szacunkowe (estimates)
➢ najwyższy stopień trudności analitycznej

ODCHYLENIE STANDARDOWE (STANDARD DEVIATION)
BŁĄD STANDARDOWY (STANDARD ERROR)
SD:
● MIARA ZMIENNOŚCI (BEZ WZGLĘDU NA ROZKŁAD)
● GDY OBLICZAMY ODCHYLENIE STANDARDOWE PRÓBY, WYKORZYSTUJEMY JE JAKO
SZACUNKOWĄ ZMIENOŚCI POPULACJI Z KTÓREJ PRÓBA ZOSTAŁA POBRANA
● NIE ZMIENIA SIĘ ZE WZROSTEM LICZEBNOŚCI PRÓBY
SE:
● MIARA DOKŁADNOŚCI SZACUNKOWEJ PRÓBY
● SŁUŻY DO OBLICZANIA PRZEDZIAŁÓW UFNOŚCI
● IM MNIEJSZY TYM BARDZIEJ DOKŁADNA SZACUNKOWA
● MIARA PRECYZJI DLA ŚREDNIEJ PRÓBY (sample mean)
SE = SD/√(wielkość próby)
● MALEJE GDY ROŚNIE WIELKOŚĆ PRÓBY

EFEKT WYBORU DANEJ TECHNIKI DOBORU PRÓBY
DOBÓR PRÓBY
DESIGN
EFFECT
(Deff) lub
DEFT
LICZBA
OBSERWACJI
“n”
PROPORCJA
(p)
SE (p) 95%CI
PROSTY 1.0 500 0.50 0.022 +/- 0.044
WARSTWOWY 1.1 500 0.50 0.024 +/- 0.047
KLASTROWY 1.5 500 0.50 0.033 +/- 0.065
● IM BARDZIEJ SKOMPLIKOWANE PRÓBKOWANIE TYM WIĘKSZE ODCHYLENIA
(↑Deff, ↑SE i ↑CI) PRZY TEJ SAMEJ WIELKOŚCI PRÓBY
● W TAKIM PRZYPADKU ABY UTRZYMAĆ ISTOTNOŚĆ NA TYM SAMYM POZIOMIE, NALEŻY
ZWIĘKSZYĆ LICZEBNOŚĆ PRÓBY
Na podstawie: Anthony M. Roman “Introduction to sampling and weighting issues”, UMASS Boston

czyli losować czy nie losować
DOBÓR NIEPROBABILISTYCZNY (NON-PROBABILITY SAMPLES):
❖ dobór nielosowy, subiektywny - uzależniony od wiedzy i poglądów badacza
❖ najczęściej w oparciu o pewne wyznaczone kryteria
(np wybór przypadków ekstremalnych, ukazanie że dana cecha występuje w
populacji)
❖ wada: nie można zastosować metod wnioskowania statystycznego
→ nie można ocenić błędu doboru
❖ wykorzystywany gdy badana grupa osób jest trudno dostępna lub dobór
losowy zbyt kosztowny, jako badanie pilotażowe, bad. eksploracyjne
❖ daje pogłębioną wiedzę w obszarach mało znanych, ale nie można wyników
odnieść do całej populacji

dobór nieprobabilistyczny
DOBÓR WYGODNY (CONVENIENCE SAMPLING):
wybór jednostek do których ma się łatwy, natychmiastowy dostęp
DOBÓR SERYJNY (CONSECUTIVE SAMPLING):
➢ podobny do doboru wygodnego + wybór wszystkich dostępnych jednostek
➢ najlepsza technika doboru nieprobabilistycznego: większa próba, lepsza
reprezentacja w stosunku do całej populacji
DOBÓR KWOTOWY (QUOTA SAMPLING):
➢ równa lub proporcjonalna reprezentacja jednostek w zależności od tego jaka
cecha jest podstawą kwotowania

dobór nieprobabilistyczny
DOBÓR CELOWY (PURPOSIVE SAMPLING):
➢ badacz mając konkretny cel na uwadze, uznaje że dane jednostki są bardziej
przydatne dla celu badania niż inne
DOBÓR “KULA ŚNIEŻNA” (SNOWBALL SAMPLING):
➢ wykorzystywany przy niewielkich populacjach
➢ badacz prosi pierwszego zrekrutowanego aby ten wyznaczył drugiego
podobnego do siebie a ten kolejnego
➢ najmniej reprezentatywna próba

POZIOM
ISTOTNOŚCI
(significance
level)
WIELKOŚĆ
PRÓBY
(sample size)
WIELKOŚĆ
EFEKTU
(effect size)
MOC STATYSTYCZNA
BADANIA
(statistical power)

WARIANCJA (VARIANCE)
● WYLICZENIE ŚREDNIEJ → WYLICZENIE WARIANCJI
● DAJE OBRAZ JAK DUŻE JEST ZRÓŻNICOWANIE WYNIKÓW W DANYM
ZBIORZE WYNIKÓW
(CZY SĄ SKONCENTROWANE WOKÓŁ ŚREDNIEJ,
JEŚLI NIE - JAK BARDZO OD NIEJ ODBIEGAJĄ)
● PRZYJMUJE WARTOŚCI OD 0 DO NIESKOŃCZONOŚCI
● MAŁA WARIANCJA = PUNKTY BLISKO OCZEKIWANEJ ŚREDNIEJ
(np: diament OR na linii CI względem linii braku efektu)
● PIERWIASTEK KWADRATOWY Z WARIANCJI TO ODCHYLENIE
STANDARDOWE (standard deviation, SD)

ZMIENNE (variables):
MIERZALNE JAKOŚCI LUB CECHY CHARAKTERYSTYCZNE OSÓB,
RZECZY LUB SYTUACJI KTÓRE MOGĄ PODLEGAĆ ZMIANIE,
ZRÓŻNICOWANIU LUB PRZYPADKOWYM ODCHYLENIOM
Przykład w kontekście analizy mocy:
sygnał, szum, moc, poziom istotności, hipoteza alternatywna, wielkość próby
TO PODSTAWA BADAŃ ILOŚCIOWYCH:
STANOWIĄ PRZEDMIOT BADAŃ W DANEJ POPULACJI

ZMIENNA NIEZALEŻNA (independent variable):
➢ jest w badaniu od samego początku
➢ badacz nią manipuluje
➢ ma wpływ na inną zmienną (zależną)
PRZYKŁADY:
➢ LEK I JEGO POSZCZEGÓLNE DAWKI
➢ DANY SPOSÓB PIELĘGNACJI
(np: zmiana ułożenia pacjenta nieprzytomnego w łóżku)
➢ CZĘSTOTLIWOŚĆ, CZAS TRWANIA EKSPOZYCJI LUB INTERWENCJI
➢ OBECNOŚĆ LUB NIEOBECNOŚĆ CZYNNIKA, OSÓB
(np: obecność rodziców przy dzieciach w trakcie bolesnych zabiegów)

ZMIENNA ZALEŻNA (dependent variable):
➢ pojawia się w przebiegu badania jako skutek
➢ nie podlega manipulacji lecz obserwacji i pomiarom
➢ jej wartość/wielkość zależy od wartości/wielkości zmiennej
niezależnej
PRZYKŁADY:
➢ ODPOWIEDŻ NA LEK I JEGO POSZCZEGÓLNE DAWKI
➢ EFEKT DANEGO SPOSOBU PIELĘGNACJI
(np: pobudzenie procesów naprawczych skóry, zachowanie integracji tkanki skórnej)
➢ POJAWIENIE SIĘ FENOMENU (np: zmniejszony lęk, zwiększone zaufanie, sprawniejsza
komunikacja, lepsza współpraca z pacjentem, zwiększenie liczby osób biorących udział w
badaniach przesiewowych dla danej populacji)

ZMIENNA ZEWNĘTRZNA (extraneous variable):
➢ niechciana “zmienna niezależna”
➢ ma wpływ na efekt badania choć nie jest zmienną niezależną
wprowadzoną przez badacza
➢ zagraża trafności wyników badania
(validity of study results)
PRZYKŁADY:
➢ ALERGIA / UZALEŻNIENIE / INNE LEKI WCHODZĄCE W INTERAKCJE
A ODPOWIEDŹ NA DANY LEK I JEGO POSZCZEGÓLNE DAWKI
➢ CHOROBY WSPÓŁISTNIEJĄCE U PACJENTA A EFEKT DANEGO SPOSOBU
PIELĘGNACJI (np: niski poziom białka a pobudzenie procesów naprawczych skóry)
➢ WIEK I ZDOLNOŚCI POZNAWCZE A POJAWIENIE SIĘ FENOMENU
(np: lęk, zwiększone zaufanie, sprawniejsza komunikacja, lepsza współpraca z pacjentem,
zwiększenie liczby osób biorących udział w badaniach przesiewowych dla danej populacji)

ZMIENNE ZEWNĘTRZNE:
➢ należy je rozpoznać i jeśli to możliwe wyeliminować we stępnej fazie projektu
badania
➢ jeśli nie można ich wyeliminować - należy zastosować środki by je
maksymalnie zmniejszyć lub wprowadzić kontrolę zmiennych zewnętrznych w
badaniu
JEŚLI NIE MAMY KONTROLI NAD ZNANĄ ZMIENNĄ ZEWNĘTRZNĄ STAJE SIĘ
ONA ZMIENNĄ UWIKŁANĄ (confounding variable)
WYNIKI BADANIA SĄ NIETRAFNE (invalid):
wyjaśnienie nie odzwierciedla zjawiska do którego się odwołuje.

BADACZ MOŻE KONTROLOWAĆ / ANALIZOWAĆ
ZMIENNE ZEWNĘTRZNE JEŚLI SĄ ZNANE I MIERZALNE.
STRATEGIE REDUKCJI UWIKŁAŃ (confounding):
➢ randomizacja (randomization) cel: losowa dystrybucja zmiennych uwikłanych
(confounding variables) w grupach
➢ restrykcja (restriction): ograniczenie “wejścia” do badań osobom z czynnikami
uwikłanymi (confounding factors) - samo w sobie wiąże się z ryzykim
tendencyjności
➢ dopasowanie (matching) osób lub grup by zapewnić równomierną dystrybucję
uwikłań
➢ stratyfikacja (stratification): uwikłania są równo rozdzielone wewnątrz każdej
warstwy (subpopulacji badania)
➢ dostosowanie (adjustment) - zazwyczaj zniekształcone przez wybór standardu
➢ analiza wieloczynnikowa (multivariate analysis) ma sens tylko wtedy gdy
można rozpoznać i zmierzyć uwikłania

PODSTAWOWE POJĘCIA
SYGNAŁ (signal): wielkość różnicy pomiędzy średnimi dwu grup (M1-M2),
która ma szansę byś statystycznie/klinicznie istotna. Ustala ją badacz. Im
większa tym lepiej. Dla badań stosowanych należy także określić wielkość
efektu. Dla badań podstawowych (fundamental research) wystarczy że jest
jakakolwiek różnica pomiędzy grupami.
SZUM (noise): zróżnicowanie wśród przedmiotów badania wyrażone jako
odchylenie standardowe (SD). Bierze się je z dotychczasowych badań lub
badania pilotażowego. Jeśli brak estymacji, warto wykonać analizę mocy z
niską i wysoką szacunkową by zobaczyć jak wpływa ona na szacunkową
wielkość próby (“guesstimate”).
Można pominąć jeśli porównywane są 2 proporcje

PODSTAWOWE POJĘCIA
STOSUNEK SYGNAŁU DO SZUMU (signal/noise ratio) lub
ZNORMALIZOWANA WIELKOŚĆ EFEKTU (standardised effect size) lub
d COHENA (Cohen’s d):
...czyli różnica pomiędzy średnimi podzielona przez
odchylenie standardowe w próbie
lub

PODSTAWOWE POJĘCIA
MOC (power): prawdopodobieństwo że badacz będzie mógł wykryć
określony przez siebie efekt (sygnał)
Pożądany jest duży efekt (często określony jako 0.8 lub 0.9 (odpowiednio
80% lub 90%). Większa moc wymaga większej próby (sample size).
WIELKOŚĆ PRÓBY (sample size): jest liczbą (n, N) w każdej grupie.
Zazwyczaj chcemy ją oszacować czy jest “wystarczająca”.
Bywa jednak że mamy dostęp tylko do określonej próby (np 22) - wtedy
analiza mocy służy dla oszacowania mocy lub wielkości efektu (effect size)

HIPOTEZA ZEROWA (H0
) zwana hipotezą statystyczną:
BADACZ JEST PRZEKONANY ŻE ZWIĄZEK POMIĘDZY ZMIENNYMI LUB
WŚRÓD ZMIENNYCH W BADANIU NIE ISTNIEJE LUB WIEDZA
EMPIRYCZNA LUB TEORETYCZNA
JEST NIEWYSTARCZAJĄCA BY POSTAWIĆ PYTANIE BADAWCZE.
● ŚREDNIE 2 GRUP NIE RÓŻNIĄ SIĘ OD SIEBIE
PRZYKŁAD:
Obecność rodziców w gabinecie zabiegowym w trakcie zakładania
obwodowego kontaktu żylnego nie ma wpływu na poziom lęku u dzieci
w wieku przedszkolnym.

HIPOTEZA KIERUNKOWA (przyczynowa):
PROGNOZUJE ŚCIEŻKĘ I KIERUNEK RELACJI POMIĘDZY MINIMUM
DWIEMA ZMIENNYMI. ZMIENNA NIEZALEŻNA JEST PRZYCZYNĄ INNEJ
ZMIENNEJ - ZALEŻNEJ
● ŚREDNIE 2 GRUP RÓŻNIĄ SIĘ OD SIEBIE
PRZYKŁAD:
A: Obecność rodziców w gabinecie zabiegowym w trakcie zakładania
obwodowego kontaktu żylnego zmniejsza poziom lęku u dzieci w wieku
przedszkolnym.
B: Obecność rodziców w gabinecie zabiegowym w trakcie zakładania
obwodowego kontaktu żylnego zwiększa poziom lęku u dzieci w wieku
przedszkolnym.

HIPOTEZA BEZKIERUNKOWA:
PROGNOZUJE RELACJĘ POMIĘDZY MINIMUM DWIEMA ZMIENNYMI
BEZ WSKAZYWANIA NA NATURĘ LUB KIERUNEK TEJ RELACJI
Zazwyczaj gdy niewiele wiemy o przedmiocie badania lub gdy poprzednie
prace badawcze są sprzeczne.
● ŚREDNIE 2 GRUP RÓŻNIĄ SIĘ OD SIEBIE
PRZYKŁAD:
Obecność rodziców w gabinecie zabiegowym w trakcie zakładania
obwodowego kontaktu żylnego wpływa na poziom lęku u dzieci w wieku
przedszkolnym.

HIPOTEZA ASOCJACYJNA:
ZMIANIE JEDNEJ ZMIENNEJ TOWARZYSZY ZMIANA
INNEJ ZMIENNEJ. BEZ SUGESTII ŻE ZMIANA W
JEDNEJ ZMIENNEJ SPOWODOWAŁA ZMIANĘ W
INNEJ ZMIENNEJ.

Są tylko dwa wyjścia:
1) nie odrzucamy H0
(nie ma wystarczającego dowodu przeciw H0
na korzyść H1
)
2) odrzucamy H0
na korzyść H1
HIPOTEZA ZEROWA (H0
)
H0
to twierdzenie które testujemy
H1
to hipoteza alternatywna. Twierdzenie hipotezy alternatywnej
zostanie przyjęte jeśli H0
zostanie odrzucona.
Wynik testu statystycznego prezentujemy w świetle H0
.

Wniosek "nie odrzucam H0
"
nie oznacza to automatycznie że H0
jest prawdziwa.
Oznacza to, że nie ma wystarczającego dowodu by odrzucić H0
na korzyść H1
.
Wniosek "odrzucam H0
" na korzyść H1
,
czyli sugeruję że H1
MOŻE być prawdziwa
(a nie że z pewnością H1
jest prawdziwa).

MOŻLIWE SĄ DWA BŁĘDY
Type I error (α-error)
H0
jest odrzucona chociaż jest prawdziwa
obrona: wybór poziomu istotności, np 5% czyli średnio 1/20 porównań będzie
“istotnych”.
Type II error (β-error)
H0
zostaje zaakceptowana chociaż na prawdę jest fałszywa.
(Nie znaleziono różnicy pomiędzy próbami chociaż ona naprawdę istnieje = słaba
moc badania)
obrona: BARDZO TRUDNA ponieważ w grę wchodzi wiele zmiennych
(“sygnał”: różnica między średnimi grup, “szum”: zmienność osobnicza,
wielkość próby...)

Analiza Mocy (power analysis)
★ ZAZWYCZAJ WYKORZYSTYWANA DO OKREŚLENIA WIELKOŚCI PRÓBY.
★ DLA 2 GRUP (BADAWCZA I KONTROLNA) PRZY POSTAWIENIU HIPOTEZY
ZEROWEJ I ALTERNATYWNEJ NALEŻY:
- wybrać odpowiedni poziom istotności, np 5%
- zdecydować jaką wybrać moc (szansa na wykrycie prawdziwego efektu jeśli
jest obecny i uniknięcie błędu typu II); zazwyczaj pomiędzy 80% a 95%;
większa moc wymaga większej próby
- uzyskać szacunkową “szumu” (np odchylenie standardowe cechy badanej) z
poprzednich badań, opracowań lub badania pilotażowego
- oszacować “sygnał” (wielkość efektu), który nas interesuje (jak wielka różnica
pomiędzy dwoma średnimi byłaby warta zachodu (statystycznie i/lub klinicznie)
- obliczyć znormalizowaną wielkość efektu:
stosunek sygnał/szum = (średnia1 - średnia2)/SD

Analiza Mocy (power analysis)
★ ISTNIEJE MOŻLIWOŚĆ PRZEPROWADZENIA ANALIZY MOCY DLA
BADANIA Z 3 LUB WIĘCEJ GRUPAMI
(problem z określeniem istotnego statystycznie/klinicznie wielkości efektu)
★ JEŚLI WIELKOŚĆ PRÓBY JEST Z GÓRY USTALONA, WYKORZYSTUJE
SIĘ JĄ DO OSZACOWANIA “SYGNAŁU” LUB MOCY PLANOWANEGO
EKSPERYMENTU

SYGNAŁ
wielkość efektu
który nas interesuje
(wybiera badacz)
SZUM
zmienność
przedmiotu
eksperymentu
(poprzednie badania)
MOC
80%-90% ?
WIELKOŚĆ
PRÓBY
ZNORMALIZOWANA
WIELKOŚĆ EFEKTU
(d Cohena)
HIPOTEZA
ALTERNATYWN
A
POZIOM
ISTOTNOŚCI
(0.5)
WYBIERA BADACZ
Na podstawie: Ralph B. Dell et al “Sample size determination” 2002, tłumaczenie Artur Sołtysiak

ZADANIE
Na podstawie tekstu pracy badawczej http://goo.gl/ndxiDY:
a) opisz technikę doboru próby
b) określ populację docelową, populację badaną, określ
operat losowania
c) oceń dobór próby
(kryteria doboru i reprezentatywność próby)

LITERATURA ŹRÓDŁOWA WYKORZYSTANA W PREZENTACJI
1. Wikiversity “Cohen's d”, http://en.wikiversity.org/wiki/Cohen's_d
This page was last modified on 20 August 2014, at 23:36; accessed: February 2, 2015 at 22:20 CET
2. Aviva Petrie, Caroline Sabin “Medical Statistics at a Glance. Workbook” January 2013, Wiley-Blackwell
3. Kate Gerrish, Anne Lacey “The Research Process in Nursing”, 6th Edition, April 2010, Wiley-Blackwell
4. Douglas G Altman, J Martin Bland “Standard deviations and standard errors. Statistics Notes”
BMJ Vol 331, page 903, 15 Oct 2005
5. Alan M Betterham, Greg Atkinson “How big does my sample need to be?A primer on the murky world of
sample size estimation”, Physical Therapy in Sport 6, Elsevier (2005) 153-163
6. Ralph B Dell, Steve Holleran, Rajasekhar Ramakrishnan “Sample size determination”,
ILAR Journal, Vol 43, Number 4, 2002

Próba statystyczna i dobór próby

Recommended

Recommended

More Related Content

What's hot

What's hot (20)

Viewers also liked

Viewers also liked (7)

Similar to Próba statystyczna i dobór próby

Similar to Próba statystyczna i dobór próby (6)

Próba statystyczna i dobór próby