SlideShare a Scribd company logo
1 of 43
Download to read offline
PRÓBA STATYSTYCZNA
DOBÓR PRÓBY
● POPULACJA DOCELOWA I BADANA Slide 3
● OPERAT LOSOWANIA Slide 5
● MIT PRÓBY REPREZENTATYWNEJ Slide 6
● BŁĄD I TENDENCYJNOŚĆ PRÓBKOWANIA Slide 9
● DOBÓR PROBABILISTYCZNY Slide 11
● SKUTKI WYBORU TECHNIKI DOBORU PRÓBY Slide 16
● DOBÓR NIEPROBABILISTYCZNY Slide 17
● ANALIZA MOCY - WSTĘP Slide 20
● ANALIZA MOCY - PODSTAWOWE POJĘCIA Slide 29
● ANALIZA MOCY - ETAPY Slide 39
Artur Sołtysiak, styczeń 2015
SPOSÓB CYTOWANIA:
Artur Sołtysiak “Próba statystyczna. Dobór próby”. v1, prezentacja, styczeń 2015
Treść licencji: http://creativecommons.org/licenses/by-nc-nd/3.0/pl/legalcode
POPULACJA DOCELOWA (TARGET POPULATION)
➢ całkowita populacja na której skupia się badanie
POPULACJA BADANA (STUDY POPULATION)
➢ część populacji docelowej z której pobrana jest próba reprezentatywna
➢ badacz dobiera uczestników badania, którzy odpowiadają kryteriom włączenia
JAK PRZEJŚĆ OD WIELKIEJ POPULACJI
DOCELOWEJ POPRZEZ DUŻĄ POPULACJĘ
BADANĄ DO MOJEJ PRÓBY
REPREZENTATYWNEJ?
OPERAT LOSOWANIA* lub: PRZESTRZEŃ PRÓBKOWANIA
(SAMPLING FRAME)
➢ materiał źródłowy (list frames) lub urządzenie (non-list frames)
z którego pobiera się próbę
➢ wyczerpująca lista wszystkich tych elementów populacji które mogą podlegać
próbkowaniu (osoby, elementy, szpitale, instytucje, oddziały szpitalne)
➢ zawiera jednostki będące przedmiotem zainteresowania badacza
➢ dostarcza przejrzystą strukturę z której można pobrać próbę
(numeryczny identyfikator + cechę charakterystyczna każdej jednostki)
➢ obmyślając ramę próbkowania należy rozróżniać populację docelową od
populacji badanej
➢ nie ma idealnej, ale musi być jak najbardziej reprezentatywna
(lustrzane odbicie populacji docelowej za wyjątkim liczebności)
* definicja Głównego Urzędu Statystycznego TUTAJ
MIT PRÓBY REPREZENTATYWNEJ
● STATYSTYKA MATEMATYCZNA NIE ZNA POJĘCIA
“PRÓBY REPREZENTATYWNEJ”
● PR MOŻE JEDYNIE OZNACZAĆ TAKI SPOSÓB DOBORU, KTÓRY
NIE PROWADZI DO POWSTANIA BŁĘDU SYSTEMATYCZNEGO
(KIERUNKOWE WYPACZENIE WYNIKÓW)
● SPOSÓB NA IDEALNY DOBÓR PRÓBY NIE ISTNIEJE
● ZAWSZE NALEŻY LICZYĆ SIĘ Z MOŻLIWOŚCIĄ BŁĘDU
STATYSTYCZNEGO
MIT PRÓBY REPREZENTATYWNEJ
JAK DUŻA PRÓBA JEST REPREZENTATYWNA?
● NIE MA SENSOWNEJ ODPOWIEDZI NA TO PYTANIE
- ZALEŻY OD MOŻLIWOŚCI FINANSOWYCH PYTAJĄCEGO
● BŁĄD STATYSTYCZNY NAJPROŚCIEJ MINIMALIZUJE SIĘ PRZEZ
ZWIĘKSZENIE LICZEBNOŚCI PRÓBY
PROBLEM: BŁĄD NIE MALEJE PROPORCJONALNIE DO WZROSTU
LICZEBNOŚCI PRÓBY A JEDYNIE DO PIERWIASTKA Z LICZEBNOŚCI
PRÓBY (2X MNIEJSZY BŁĄD WYMAGA 4X WIĘKSZEJ PRÓBY!)
PROPORCJONALNIE DO LICZEBNOŚCI PRÓBY ROŚNIE TYLKO KOSZT!
DLA KOGO CHCESZ UOGÓLNIĆ BADANIE?
DO JAKIEJ POPULACJI MOŻESZ
MIEĆ DOSTĘP?
JAK ZDOBĘDZIESZ DO NICH DOSTĘP?
KTO JEST W TWOIM BADANIU?
POPULACJA DOCELOWA
POPULACJA BADANA
OPERAT LOSOWANIA
PRÓBA
BŁĄD PRÓBKOWANIA (SAMPLING ERROR):
➢ taki sposób doboru próby który prowadzi do tendencyjności próbkowania
➢ próba staje się niereprezentatywna, badanie jest nie trafne (invalid),
wyników badania nie można wykorzystać w praktyce
TENDENCYJNOŚĆ PRÓBKOWANIA
(SAMPLING BIAS, ASCERTAINMENT BIAS):
➢ “próba różni się od populacji, z której została wybrana pod względem
częstości występowania jakiejś istotnej cechy sprawiającej, że charakterystyka
próby ze względu na tę cechę różni się od charakterystyki populacji”
(Andrzej Zieliński “Dobór próby w badaniach epidemiologicznych”)
➢ próbę pobrano w taki sposób, że część członków danej populacji jest słabiej
reprezentowana niż inni
ŹLE OPRACOWANY LUB NIEDOKŁADNY
(INACCURATE) OPERAT LOSOWANIA TO
BŁĄD KTÓREGO NIE DA SIĘ SKORYGOWAĆ!
TECHNIKI DOBORU PRÓBY
czyli losować czy nie losować
DOBÓR PROBABILISTYCZNY (PROBABILITY SAMPLES):
❖ każda jednostka operata losowania ma znaną, większą niż zero szansę bycia
wylosowanym
❖ badacz nie ma wpływu na mechanizmy rządzące doborem konkretnych
jednostek do badania
❖ o “wyborze” elementu decyduje przypadek
❖ oparte na rachunku prawdopodobieństwa i statystyce matematycznej
❖ zaleta: przy uogólnianiu wyników badania z próby na całą populację można
oszacować błąd doboru
TECHNIKI DOBORU PRÓBY
dobór probabilistyczny
DOBÓR LOSOWY PROSTY (SIMPLE RANDOM SAMPLE):
➢ każdy element operatu losowania ma znaną i równą szansę selekcji
➢ próba brana jest w jednym ciągnieniu losowym
➢ najlepszy w tworzeniu szacunkowej dla całej populacji
➢ słaby gdy chcemy dowiedzieć się czegoś o podgrupach populacji
➢ może okazać się kosztowny lub w niektórych przypadkach niemożliwy
DOBÓR SYSTEMATYCZNY (SYSTEMATIC SAMPLE):
➢ tak samo jak w DLP, różnica polega na tym że do pobrania próby
wykorzystuje się metodę selekcji systematycznej;
np pierwszy element z nr 4 a potem co 5-ty
➢ tańszy niż DLP ale wymaga ostrożności i przemyślenia
TECHNIKI DOBORU PRÓBY
dobór probabilistyczny
DOBÓR WARSTWOWY (STRATIFIED SAMPLE):
➢ operat losowania jest podzielony na nie nakładające się grupy
zainteresowania (strata)
➢ próby niekoniecznie jednakowo liczebne pobrane są z każdej takiej grupy
➢ badacz kontroluje dobór próby z każdej grupy (stratum)
➢ najlepsze do ustalenia szacunkowej dla całej populacji oraz dla każdej grupy
➢ wymaga: ↑kosztów, ↑próby,
➢ wysoka złożoność i trudność badania
TECHNIKI DOBORU PRÓBY
dobór probabilistyczny
DOBÓR KLASTROWY (CLUSTER SAMPLE):
➢ operat losowania jest podzielony na nie nakładające się grupy (clusters)
➢ pobiera się próbkę klastrów (random sample) a następnie próbki z każdego
wybranego klastra
➢ klaster służy jako wygodny dostęp do elementów próby na których skupia się
badanie, sam klaster to narzędzie, nie obiekt zainteresowania
➢ pozwala zaoszczędzić pieniądze
➢ daje mniej dokładne szacunkowe (estimates)
➢ najwyższy stopień trudności analitycznej
ODCHYLENIE STANDARDOWE (STANDARD DEVIATION)
BŁĄD STANDARDOWY (STANDARD ERROR)
SD:
● MIARA ZMIENNOŚCI (BEZ WZGLĘDU NA ROZKŁAD)
● GDY OBLICZAMY ODCHYLENIE STANDARDOWE PRÓBY, WYKORZYSTUJEMY JE JAKO
SZACUNKOWĄ ZMIENOŚCI POPULACJI Z KTÓREJ PRÓBA ZOSTAŁA POBRANA
● NIE ZMIENIA SIĘ ZE WZROSTEM LICZEBNOŚCI PRÓBY
SE:
● MIARA DOKŁADNOŚCI SZACUNKOWEJ PRÓBY
● SŁUŻY DO OBLICZANIA PRZEDZIAŁÓW UFNOŚCI
● IM MNIEJSZY TYM BARDZIEJ DOKŁADNA SZACUNKOWA
● MIARA PRECYZJI DLA ŚREDNIEJ PRÓBY (sample mean)
SE = SD/√(wielkość próby)
● MALEJE GDY ROŚNIE WIELKOŚĆ PRÓBY
EFEKT WYBORU DANEJ TECHNIKI DOBORU PRÓBY
DOBÓR PRÓBY
DESIGN
EFFECT
(Deff) lub
DEFT
LICZBA
OBSERWACJI
“n”
PROPORCJA
(p)
SE (p) 95%CI
PROSTY 1.0 500 0.50 0.022 +/- 0.044
WARSTWOWY 1.1 500 0.50 0.024 +/- 0.047
KLASTROWY 1.5 500 0.50 0.033 +/- 0.065
● IM BARDZIEJ SKOMPLIKOWANE PRÓBKOWANIE TYM WIĘKSZE ODCHYLENIA
(↑Deff, ↑SE i ↑CI) PRZY TEJ SAMEJ WIELKOŚCI PRÓBY
● W TAKIM PRZYPADKU ABY UTRZYMAĆ ISTOTNOŚĆ NA TYM SAMYM POZIOMIE, NALEŻY
ZWIĘKSZYĆ LICZEBNOŚĆ PRÓBY
Na podstawie: Anthony M. Roman “Introduction to sampling and weighting issues”, UMASS Boston
TECHNIKI DOBORU PRÓBY
czyli losować czy nie losować
DOBÓR NIEPROBABILISTYCZNY (NON-PROBABILITY SAMPLES):
❖ dobór nielosowy, subiektywny - uzależniony od wiedzy i poglądów badacza
❖ najczęściej w oparciu o pewne wyznaczone kryteria
(np wybór przypadków ekstremalnych, ukazanie że dana cecha występuje w
populacji)
❖ wada: nie można zastosować metod wnioskowania statystycznego
→ nie można ocenić błędu doboru
❖ wykorzystywany gdy badana grupa osób jest trudno dostępna lub dobór
losowy zbyt kosztowny, jako badanie pilotażowe, bad. eksploracyjne
❖ daje pogłębioną wiedzę w obszarach mało znanych, ale nie można wyników
odnieść do całej populacji
TECHNIKI DOBORU PRÓBY
dobór nieprobabilistyczny
DOBÓR WYGODNY (CONVENIENCE SAMPLING):
wybór jednostek do których ma się łatwy, natychmiastowy dostęp
DOBÓR SERYJNY (CONSECUTIVE SAMPLING):
➢ podobny do doboru wygodnego + wybór wszystkich dostępnych jednostek
➢ najlepsza technika doboru nieprobabilistycznego: większa próba, lepsza
reprezentacja w stosunku do całej populacji
DOBÓR KWOTOWY (QUOTA SAMPLING):
➢ równa lub proporcjonalna reprezentacja jednostek w zależności od tego jaka
cecha jest podstawą kwotowania
TECHNIKI DOBORU PRÓBY
dobór nieprobabilistyczny
DOBÓR CELOWY (PURPOSIVE SAMPLING):
➢ badacz mając konkretny cel na uwadze, uznaje że dane jednostki są bardziej
przydatne dla celu badania niż inne
DOBÓR “KULA ŚNIEŻNA” (SNOWBALL SAMPLING):
➢ wykorzystywany przy niewielkich populacjach
➢ badacz prosi pierwszego zrekrutowanego aby ten wyznaczył drugiego
podobnego do siebie a ten kolejnego
➢ najmniej reprezentatywna próba
Analiza Mocy
(power analysis)
POZIOM
ISTOTNOŚCI
(significance
level)
WIELKOŚĆ
PRÓBY
(sample size)
WIELKOŚĆ
EFEKTU
(effect size)
MOC STATYSTYCZNA
BADANIA
(statistical power)
WARIANCJA (VARIANCE)
● WYLICZENIE ŚREDNIEJ → WYLICZENIE WARIANCJI
● DAJE OBRAZ JAK DUŻE JEST ZRÓŻNICOWANIE WYNIKÓW W DANYM
ZBIORZE WYNIKÓW
(CZY SĄ SKONCENTROWANE WOKÓŁ ŚREDNIEJ,
JEŚLI NIE - JAK BARDZO OD NIEJ ODBIEGAJĄ)
● PRZYJMUJE WARTOŚCI OD 0 DO NIESKOŃCZONOŚCI
● MAŁA WARIANCJA = PUNKTY BLISKO OCZEKIWANEJ ŚREDNIEJ
(np: diament OR na linii CI względem linii braku efektu)
● PIERWIASTEK KWADRATOWY Z WARIANCJI TO ODCHYLENIE
STANDARDOWE (standard deviation, SD)
ZMIENNE (variables):
MIERZALNE JAKOŚCI LUB CECHY CHARAKTERYSTYCZNE OSÓB,
RZECZY LUB SYTUACJI KTÓRE MOGĄ PODLEGAĆ ZMIANIE,
ZRÓŻNICOWANIU LUB PRZYPADKOWYM ODCHYLENIOM
Przykład w kontekście analizy mocy:
sygnał, szum, moc, poziom istotności, hipoteza alternatywna, wielkość próby
TO PODSTAWA BADAŃ ILOŚCIOWYCH:
STANOWIĄ PRZEDMIOT BADAŃ W DANEJ POPULACJI
ZMIENNA NIEZALEŻNA (independent variable):
➢ jest w badaniu od samego początku
➢ badacz nią manipuluje
➢ ma wpływ na inną zmienną (zależną)
PRZYKŁADY:
➢ LEK I JEGO POSZCZEGÓLNE DAWKI
➢ DANY SPOSÓB PIELĘGNACJI
(np: zmiana ułożenia pacjenta nieprzytomnego w łóżku)
➢ CZĘSTOTLIWOŚĆ, CZAS TRWANIA EKSPOZYCJI LUB INTERWENCJI
➢ OBECNOŚĆ LUB NIEOBECNOŚĆ CZYNNIKA, OSÓB
(np: obecność rodziców przy dzieciach w trakcie bolesnych zabiegów)
ZMIENNA ZALEŻNA (dependent variable):
➢ pojawia się w przebiegu badania jako skutek
➢ nie podlega manipulacji lecz obserwacji i pomiarom
➢ jej wartość/wielkość zależy od wartości/wielkości zmiennej
niezależnej
PRZYKŁADY:
➢ ODPOWIEDŻ NA LEK I JEGO POSZCZEGÓLNE DAWKI
➢ EFEKT DANEGO SPOSOBU PIELĘGNACJI
(np: pobudzenie procesów naprawczych skóry, zachowanie integracji tkanki skórnej)
➢ POJAWIENIE SIĘ FENOMENU (np: zmniejszony lęk, zwiększone zaufanie, sprawniejsza
komunikacja, lepsza współpraca z pacjentem, zwiększenie liczby osób biorących udział w
badaniach przesiewowych dla danej populacji)
ZMIENNA ZEWNĘTRZNA (extraneous variable):
➢ niechciana “zmienna niezależna”
➢ ma wpływ na efekt badania choć nie jest zmienną niezależną
wprowadzoną przez badacza
➢ zagraża trafności wyników badania
(validity of study results)
PRZYKŁADY:
➢ ALERGIA / UZALEŻNIENIE / INNE LEKI WCHODZĄCE W INTERAKCJE
A ODPOWIEDŹ NA DANY LEK I JEGO POSZCZEGÓLNE DAWKI
➢ CHOROBY WSPÓŁISTNIEJĄCE U PACJENTA A EFEKT DANEGO SPOSOBU
PIELĘGNACJI (np: niski poziom białka a pobudzenie procesów naprawczych skóry)
➢ WIEK I ZDOLNOŚCI POZNAWCZE A POJAWIENIE SIĘ FENOMENU
(np: lęk, zwiększone zaufanie, sprawniejsza komunikacja, lepsza współpraca z pacjentem,
zwiększenie liczby osób biorących udział w badaniach przesiewowych dla danej populacji)
ZMIENNE ZEWNĘTRZNE:
➢ należy je rozpoznać i jeśli to możliwe wyeliminować we stępnej fazie projektu
badania
➢ jeśli nie można ich wyeliminować - należy zastosować środki by je
maksymalnie zmniejszyć lub wprowadzić kontrolę zmiennych zewnętrznych w
badaniu
JEŚLI NIE MAMY KONTROLI NAD ZNANĄ ZMIENNĄ ZEWNĘTRZNĄ STAJE SIĘ
ONA ZMIENNĄ UWIKŁANĄ (confounding variable)
WYNIKI BADANIA SĄ NIETRAFNE (invalid):
wyjaśnienie nie odzwierciedla zjawiska do którego się odwołuje.
BADACZ MOŻE KONTROLOWAĆ / ANALIZOWAĆ
ZMIENNE ZEWNĘTRZNE JEŚLI SĄ ZNANE I MIERZALNE.
STRATEGIE REDUKCJI UWIKŁAŃ (confounding):
➢ randomizacja (randomization) cel: losowa dystrybucja zmiennych uwikłanych
(confounding variables) w grupach
➢ restrykcja (restriction): ograniczenie “wejścia” do badań osobom z czynnikami
uwikłanymi (confounding factors) - samo w sobie wiąże się z ryzykim
tendencyjności
➢ dopasowanie (matching) osób lub grup by zapewnić równomierną dystrybucję
uwikłań
➢ stratyfikacja (stratification): uwikłania są równo rozdzielone wewnątrz każdej
warstwy (subpopulacji badania)
➢ dostosowanie (adjustment) - zazwyczaj zniekształcone przez wybór standardu
➢ analiza wieloczynnikowa (multivariate analysis) ma sens tylko wtedy gdy
można rozpoznać i zmierzyć uwikłania
PODSTAWOWE POJĘCIA
SYGNAŁ (signal): wielkość różnicy pomiędzy średnimi dwu grup (M1-M2),
która ma szansę byś statystycznie/klinicznie istotna. Ustala ją badacz. Im
większa tym lepiej. Dla badań stosowanych należy także określić wielkość
efektu. Dla badań podstawowych (fundamental research) wystarczy że jest
jakakolwiek różnica pomiędzy grupami.
SZUM (noise): zróżnicowanie wśród przedmiotów badania wyrażone jako
odchylenie standardowe (SD). Bierze się je z dotychczasowych badań lub
badania pilotażowego. Jeśli brak estymacji, warto wykonać analizę mocy z
niską i wysoką szacunkową by zobaczyć jak wpływa ona na szacunkową
wielkość próby (“guesstimate”).
Można pominąć jeśli porównywane są 2 proporcje
PODSTAWOWE POJĘCIA
STOSUNEK SYGNAŁU DO SZUMU (signal/noise ratio) lub
ZNORMALIZOWANA WIELKOŚĆ EFEKTU (standardised effect size) lub
d COHENA (Cohen’s d):
...czyli różnica pomiędzy średnimi podzielona przez
odchylenie standardowe w próbie
lub
PODSTAWOWE POJĘCIA
MOC (power): prawdopodobieństwo że badacz będzie mógł wykryć
określony przez siebie efekt (sygnał)
Pożądany jest duży efekt (często określony jako 0.8 lub 0.9 (odpowiednio
80% lub 90%). Większa moc wymaga większej próby (sample size).
WIELKOŚĆ PRÓBY (sample size): jest liczbą (n, N) w każdej grupie.
Zazwyczaj chcemy ją oszacować czy jest “wystarczająca”.
Bywa jednak że mamy dostęp tylko do określonej próby (np 22) - wtedy
analiza mocy służy dla oszacowania mocy lub wielkości efektu (effect size)
HIPOTEZA ZEROWA (H0
) zwana hipotezą statystyczną:
BADACZ JEST PRZEKONANY ŻE ZWIĄZEK POMIĘDZY ZMIENNYMI LUB
WŚRÓD ZMIENNYCH W BADANIU NIE ISTNIEJE LUB WIEDZA
EMPIRYCZNA LUB TEORETYCZNA
JEST NIEWYSTARCZAJĄCA BY POSTAWIĆ PYTANIE BADAWCZE.
● ŚREDNIE 2 GRUP NIE RÓŻNIĄ SIĘ OD SIEBIE
PRZYKŁAD:
Obecność rodziców w gabinecie zabiegowym w trakcie zakładania
obwodowego kontaktu żylnego nie ma wpływu na poziom lęku u dzieci
w wieku przedszkolnym.
HIPOTEZA KIERUNKOWA (przyczynowa):
PROGNOZUJE ŚCIEŻKĘ I KIERUNEK RELACJI POMIĘDZY MINIMUM
DWIEMA ZMIENNYMI. ZMIENNA NIEZALEŻNA JEST PRZYCZYNĄ INNEJ
ZMIENNEJ - ZALEŻNEJ
● ŚREDNIE 2 GRUP RÓŻNIĄ SIĘ OD SIEBIE
PRZYKŁAD:
A: Obecność rodziców w gabinecie zabiegowym w trakcie zakładania
obwodowego kontaktu żylnego zmniejsza poziom lęku u dzieci w wieku
przedszkolnym.
B: Obecność rodziców w gabinecie zabiegowym w trakcie zakładania
obwodowego kontaktu żylnego zwiększa poziom lęku u dzieci w wieku
przedszkolnym.
HIPOTEZA BEZKIERUNKOWA:
PROGNOZUJE RELACJĘ POMIĘDZY MINIMUM DWIEMA ZMIENNYMI
BEZ WSKAZYWANIA NA NATURĘ LUB KIERUNEK TEJ RELACJI
Zazwyczaj gdy niewiele wiemy o przedmiocie badania lub gdy poprzednie
prace badawcze są sprzeczne.
● ŚREDNIE 2 GRUP RÓŻNIĄ SIĘ OD SIEBIE
PRZYKŁAD:
Obecność rodziców w gabinecie zabiegowym w trakcie zakładania
obwodowego kontaktu żylnego wpływa na poziom lęku u dzieci w wieku
przedszkolnym.
HIPOTEZA ASOCJACYJNA:
ZMIANIE JEDNEJ ZMIENNEJ TOWARZYSZY ZMIANA
INNEJ ZMIENNEJ. BEZ SUGESTII ŻE ZMIANA W
JEDNEJ ZMIENNEJ SPOWODOWAŁA ZMIANĘ W
INNEJ ZMIENNEJ.
Są tylko dwa wyjścia:
1) nie odrzucamy H0
(nie ma wystarczającego dowodu przeciw H0
na korzyść H1
)
2) odrzucamy H0
na korzyść H1
HIPOTEZA ZEROWA (H0
)
H0
to twierdzenie które testujemy
H1
to hipoteza alternatywna. Twierdzenie hipotezy alternatywnej
zostanie przyjęte jeśli H0
zostanie odrzucona.
Wynik testu statystycznego prezentujemy w świetle H0
.
Wniosek "nie odrzucam H0
"
nie oznacza to automatycznie że H0
jest prawdziwa.
Oznacza to, że nie ma wystarczającego dowodu by odrzucić H0
na korzyść H1
.
Wniosek "odrzucam H0
" na korzyść H1
,
czyli sugeruję że H1
MOŻE być prawdziwa
(a nie że z pewnością H1
jest prawdziwa).
MOŻLIWE SĄ DWA BŁĘDY
Type I error (α-error)
H0
jest odrzucona chociaż jest prawdziwa
obrona: wybór poziomu istotności, np 5% czyli średnio 1/20 porównań będzie
“istotnych”.
Type II error (β-error)
H0
zostaje zaakceptowana chociaż na prawdę jest fałszywa.
(Nie znaleziono różnicy pomiędzy próbami chociaż ona naprawdę istnieje = słaba
moc badania)
obrona: BARDZO TRUDNA ponieważ w grę wchodzi wiele zmiennych
(“sygnał”: różnica między średnimi grup, “szum”: zmienność osobnicza,
wielkość próby...)
Analiza Mocy (power analysis)
★ ZAZWYCZAJ WYKORZYSTYWANA DO OKREŚLENIA WIELKOŚCI PRÓBY.
★ DLA 2 GRUP (BADAWCZA I KONTROLNA) PRZY POSTAWIENIU HIPOTEZY
ZEROWEJ I ALTERNATYWNEJ NALEŻY:
- wybrać odpowiedni poziom istotności, np 5%
- zdecydować jaką wybrać moc (szansa na wykrycie prawdziwego efektu jeśli
jest obecny i uniknięcie błędu typu II); zazwyczaj pomiędzy 80% a 95%;
większa moc wymaga większej próby
- uzyskać szacunkową “szumu” (np odchylenie standardowe cechy badanej) z
poprzednich badań, opracowań lub badania pilotażowego
- oszacować “sygnał” (wielkość efektu), który nas interesuje (jak wielka różnica
pomiędzy dwoma średnimi byłaby warta zachodu (statystycznie i/lub klinicznie)
- obliczyć znormalizowaną wielkość efektu:
stosunek sygnał/szum = (średnia1 - średnia2)/SD
Analiza Mocy (power analysis)
★ ISTNIEJE MOŻLIWOŚĆ PRZEPROWADZENIA ANALIZY MOCY DLA
BADANIA Z 3 LUB WIĘCEJ GRUPAMI
(problem z określeniem istotnego statystycznie/klinicznie wielkości efektu)
★ JEŚLI WIELKOŚĆ PRÓBY JEST Z GÓRY USTALONA, WYKORZYSTUJE
SIĘ JĄ DO OSZACOWANIA “SYGNAŁU” LUB MOCY PLANOWANEGO
EKSPERYMENTU
SYGNAŁ
wielkość efektu
który nas interesuje
(wybiera badacz)
SZUM
zmienność
przedmiotu
eksperymentu
(poprzednie badania)
MOC
80%-90% ?
WIELKOŚĆ
PRÓBY
ZNORMALIZOWANA
WIELKOŚĆ EFEKTU
(d Cohena)
HIPOTEZA
ALTERNATYWN
A
POZIOM
ISTOTNOŚCI
(0.5)
WYBIERA BADACZ
Na podstawie: Ralph B. Dell et al “Sample size determination” 2002, tłumaczenie Artur Sołtysiak
ZADANIE
Na podstawie tekstu pracy badawczej http://goo.gl/ndxiDY:
a) opisz technikę doboru próby
b) określ populację docelową, populację badaną, określ
operat losowania
c) oceń dobór próby
(kryteria doboru i reprezentatywność próby)
LITERATURA ŹRÓDŁOWA WYKORZYSTANA W PREZENTACJI
1. Wikiversity “Cohen's d”, http://en.wikiversity.org/wiki/Cohen's_d
This page was last modified on 20 August 2014, at 23:36; accessed: February 2, 2015 at 22:20 CET
2. Aviva Petrie, Caroline Sabin “Medical Statistics at a Glance. Workbook” January 2013, Wiley-Blackwell
3. Kate Gerrish, Anne Lacey “The Research Process in Nursing”, 6th Edition, April 2010, Wiley-Blackwell
4. Douglas G Altman, J Martin Bland “Standard deviations and standard errors. Statistics Notes”
BMJ Vol 331, page 903, 15 Oct 2005
5. Alan M Betterham, Greg Atkinson “How big does my sample need to be?A primer on the murky world of
sample size estimation”, Physical Therapy in Sport 6, Elsevier (2005) 153-163
6. Ralph B Dell, Steve Holleran, Rajasekhar Ramakrishnan “Sample size determination”,
ILAR Journal, Vol 43, Number 4, 2002

More Related Content

What's hot

Podstawy statystyki dla psychologów - zajęcia 9 - prawdopodobieństwo
Podstawy statystyki dla psychologów - zajęcia 9 - prawdopodobieństwoPodstawy statystyki dla psychologów - zajęcia 9 - prawdopodobieństwo
Podstawy statystyki dla psychologów - zajęcia 9 - prawdopodobieństwoKarol Wolski
 
Jak najlepiej wykorzystać† Cochrane Library, Pubmed i Medline
Jak najlepiej wykorzystać† Cochrane Library, Pubmed i MedlineJak najlepiej wykorzystać† Cochrane Library, Pubmed i Medline
Jak najlepiej wykorzystać† Cochrane Library, Pubmed i MedlineEBNP POLAND
 
Podstastawy statystyki dla psychologów - Zajęcia 2 - Rozkład liczebności wyni...
Podstastawy statystyki dla psychologów - Zajęcia 2 - Rozkład liczebności wyni...Podstastawy statystyki dla psychologów - Zajęcia 2 - Rozkład liczebności wyni...
Podstastawy statystyki dla psychologów - Zajęcia 2 - Rozkład liczebności wyni...Karol Wolski
 
Podstawy statystyki dla psychologów - zajęcia 4 - wyniki standaryzowane, skala z
Podstawy statystyki dla psychologów - zajęcia 4 - wyniki standaryzowane, skala zPodstawy statystyki dla psychologów - zajęcia 4 - wyniki standaryzowane, skala z
Podstawy statystyki dla psychologów - zajęcia 4 - wyniki standaryzowane, skala zKarol Wolski
 
Podstawy statystyki dla psychologów - zajęcia 6 - predykcja
Podstawy statystyki dla psychologów - zajęcia 6 - predykcjaPodstawy statystyki dla psychologów - zajęcia 6 - predykcja
Podstawy statystyki dla psychologów - zajęcia 6 - predykcjaKarol Wolski
 
Podstawy statystyki dla psychologów - zajęcia 10 - wprowadzenie do wnioskowan...
Podstawy statystyki dla psychologów - zajęcia 10 - wprowadzenie do wnioskowan...Podstawy statystyki dla psychologów - zajęcia 10 - wprowadzenie do wnioskowan...
Podstawy statystyki dla psychologów - zajęcia 10 - wprowadzenie do wnioskowan...Karol Wolski
 
Psychometria rzetelność testów psychologicznych
Psychometria   rzetelność testów psychologicznychPsychometria   rzetelność testów psychologicznych
Psychometria rzetelność testów psychologicznychKarol Wolski
 
Eksperyment w naukach społecznych
Eksperyment w naukach społecznychEksperyment w naukach społecznych
Eksperyment w naukach społecznychRadek Oryszczyszyn
 
Metoda Ruchu Rozwijajcego Weroniki Sherborne
Metoda Ruchu Rozwijajcego Weroniki SherborneMetoda Ruchu Rozwijajcego Weroniki Sherborne
Metoda Ruchu Rozwijajcego Weroniki SherborneKatarzyna Borys
 
Scenariusz zajęć logopedycznych dla osoby jąkającej się
Scenariusz zajęć logopedycznych dla osoby jąkającej sięScenariusz zajęć logopedycznych dla osoby jąkającej się
Scenariusz zajęć logopedycznych dla osoby jąkającej sięagusia0120
 
Metody badań społecznych. Badania ilościowe i jakościowe
Metody badań społecznych. Badania ilościowe i jakościoweMetody badań społecznych. Badania ilościowe i jakościowe
Metody badań społecznych. Badania ilościowe i jakościoweDominika Winogrodzka
 
Podstawy statystyki dla psychologów - zajęcia 5 - korelacja
Podstawy statystyki dla psychologów - zajęcia 5 - korelacja Podstawy statystyki dla psychologów - zajęcia 5 - korelacja
Podstawy statystyki dla psychologów - zajęcia 5 - korelacja Karol Wolski
 
Scenariusz zajęć zintegrowanych dla klasy
Scenariusz zajęć zintegrowanych dla klasyScenariusz zajęć zintegrowanych dla klasy
Scenariusz zajęć zintegrowanych dla klasyMałgorzata Kocknecht
 
Podstawy statystyki dla psychologów - zajęcia 11 - test t dla dwóch średnich
Podstawy statystyki dla psychologów - zajęcia 11 - test t dla dwóch średnichPodstawy statystyki dla psychologów - zajęcia 11 - test t dla dwóch średnich
Podstawy statystyki dla psychologów - zajęcia 11 - test t dla dwóch średnichKarol Wolski
 
Psychometria trafność
Psychometria   trafnośćPsychometria   trafność
Psychometria trafnośćKarol Wolski
 

What's hot (20)

Podstawy statystyki dla psychologów - zajęcia 9 - prawdopodobieństwo
Podstawy statystyki dla psychologów - zajęcia 9 - prawdopodobieństwoPodstawy statystyki dla psychologów - zajęcia 9 - prawdopodobieństwo
Podstawy statystyki dla psychologów - zajęcia 9 - prawdopodobieństwo
 
Jak najlepiej wykorzystać† Cochrane Library, Pubmed i Medline
Jak najlepiej wykorzystać† Cochrane Library, Pubmed i MedlineJak najlepiej wykorzystać† Cochrane Library, Pubmed i Medline
Jak najlepiej wykorzystać† Cochrane Library, Pubmed i Medline
 
Podstastawy statystyki dla psychologów - Zajęcia 2 - Rozkład liczebności wyni...
Podstastawy statystyki dla psychologów - Zajęcia 2 - Rozkład liczebności wyni...Podstastawy statystyki dla psychologów - Zajęcia 2 - Rozkład liczebności wyni...
Podstastawy statystyki dla psychologów - Zajęcia 2 - Rozkład liczebności wyni...
 
Podstawy statystyki dla psychologów - zajęcia 4 - wyniki standaryzowane, skala z
Podstawy statystyki dla psychologów - zajęcia 4 - wyniki standaryzowane, skala zPodstawy statystyki dla psychologów - zajęcia 4 - wyniki standaryzowane, skala z
Podstawy statystyki dla psychologów - zajęcia 4 - wyniki standaryzowane, skala z
 
Podstawy statystyki dla psychologów - zajęcia 6 - predykcja
Podstawy statystyki dla psychologów - zajęcia 6 - predykcjaPodstawy statystyki dla psychologów - zajęcia 6 - predykcja
Podstawy statystyki dla psychologów - zajęcia 6 - predykcja
 
Podstawy statystyki dla psychologów - zajęcia 10 - wprowadzenie do wnioskowan...
Podstawy statystyki dla psychologów - zajęcia 10 - wprowadzenie do wnioskowan...Podstawy statystyki dla psychologów - zajęcia 10 - wprowadzenie do wnioskowan...
Podstawy statystyki dla psychologów - zajęcia 10 - wprowadzenie do wnioskowan...
 
Psychometria rzetelność testów psychologicznych
Psychometria   rzetelność testów psychologicznychPsychometria   rzetelność testów psychologicznych
Psychometria rzetelność testów psychologicznych
 
Eksperyment w naukach społecznych
Eksperyment w naukach społecznychEksperyment w naukach społecznych
Eksperyment w naukach społecznych
 
Metody badań społecznych. Badania ilościowe i jakościowe
Metody badań społecznych. Badania ilościowe i jakościoweMetody badań społecznych. Badania ilościowe i jakościowe
Metody badań społecznych. Badania ilościowe i jakościowe
 
Metoda Ruchu Rozwijajcego Weroniki Sherborne
Metoda Ruchu Rozwijajcego Weroniki SherborneMetoda Ruchu Rozwijajcego Weroniki Sherborne
Metoda Ruchu Rozwijajcego Weroniki Sherborne
 
Scenariusz zajęć logopedycznych dla osoby jąkającej się
Scenariusz zajęć logopedycznych dla osoby jąkającej sięScenariusz zajęć logopedycznych dla osoby jąkającej się
Scenariusz zajęć logopedycznych dla osoby jąkającej się
 
Prezentacja
Prezentacja  Prezentacja
Prezentacja
 
Metody badań społecznych. Badania ilościowe i jakościowe
Metody badań społecznych. Badania ilościowe i jakościoweMetody badań społecznych. Badania ilościowe i jakościowe
Metody badań społecznych. Badania ilościowe i jakościowe
 
Alkoholizm
AlkoholizmAlkoholizm
Alkoholizm
 
Podstawy statystyki dla psychologów - zajęcia 5 - korelacja
Podstawy statystyki dla psychologów - zajęcia 5 - korelacja Podstawy statystyki dla psychologów - zajęcia 5 - korelacja
Podstawy statystyki dla psychologów - zajęcia 5 - korelacja
 
Princípios de Estatística Inferencial - II
Princípios de Estatística Inferencial - IIPrincípios de Estatística Inferencial - II
Princípios de Estatística Inferencial - II
 
Scenariusz zajęć zintegrowanych dla klasy
Scenariusz zajęć zintegrowanych dla klasyScenariusz zajęć zintegrowanych dla klasy
Scenariusz zajęć zintegrowanych dla klasy
 
Ekspresje Mimiczne Twarzy
Ekspresje Mimiczne TwarzyEkspresje Mimiczne Twarzy
Ekspresje Mimiczne Twarzy
 
Podstawy statystyki dla psychologów - zajęcia 11 - test t dla dwóch średnich
Podstawy statystyki dla psychologów - zajęcia 11 - test t dla dwóch średnichPodstawy statystyki dla psychologów - zajęcia 11 - test t dla dwóch średnich
Podstawy statystyki dla psychologów - zajęcia 11 - test t dla dwóch średnich
 
Psychometria trafność
Psychometria   trafnośćPsychometria   trafność
Psychometria trafność
 

Viewers also liked

Wszystko, co trzeba wiedzieć o badaniach panelowych, Marcin Piwowarczyk, IMAS...
Wszystko, co trzeba wiedzieć o badaniach panelowych, Marcin Piwowarczyk, IMAS...Wszystko, co trzeba wiedzieć o badaniach panelowych, Marcin Piwowarczyk, IMAS...
Wszystko, co trzeba wiedzieć o badaniach panelowych, Marcin Piwowarczyk, IMAS...Biznes 2.0
 
Trafność‡, rzetelność‡, dokładność, precyzja
Trafność‡, rzetelność‡, dokładność, precyzjaTrafność‡, rzetelność‡, dokładność, precyzja
Trafność‡, rzetelność‡, dokładność, precyzjaEBNP POLAND
 
Wyszukiwarki medycyna
Wyszukiwarki medycynaWyszukiwarki medycyna
Wyszukiwarki medycynaEBNP POLAND
 
Analiza Tresci
Analiza TresciAnaliza Tresci
Analiza Trescikiwinska
 
Usted puede ayudar a su hijo a estudiar
Usted puede ayudar a su hijo a estudiarUsted puede ayudar a su hijo a estudiar
Usted puede ayudar a su hijo a estudiarazoguitos
 
Lectura cooperativa. Fitxes de rols. Per imprimir.
Lectura cooperativa. Fitxes de rols. Per imprimir. Lectura cooperativa. Fitxes de rols. Per imprimir.
Lectura cooperativa. Fitxes de rols. Per imprimir. Guida Allès Pons
 

Viewers also liked (7)

Wszystko, co trzeba wiedzieć o badaniach panelowych, Marcin Piwowarczyk, IMAS...
Wszystko, co trzeba wiedzieć o badaniach panelowych, Marcin Piwowarczyk, IMAS...Wszystko, co trzeba wiedzieć o badaniach panelowych, Marcin Piwowarczyk, IMAS...
Wszystko, co trzeba wiedzieć o badaniach panelowych, Marcin Piwowarczyk, IMAS...
 
Trafność‡, rzetelność‡, dokładność, precyzja
Trafność‡, rzetelność‡, dokładność, precyzjaTrafność‡, rzetelność‡, dokładność, precyzja
Trafność‡, rzetelność‡, dokładność, precyzja
 
Wyszukiwarki medycyna
Wyszukiwarki medycynaWyszukiwarki medycyna
Wyszukiwarki medycyna
 
Analiza Tresci
Analiza TresciAnaliza Tresci
Analiza Tresci
 
Usted puede ayudar a su hijo a estudiar
Usted puede ayudar a su hijo a estudiarUsted puede ayudar a su hijo a estudiar
Usted puede ayudar a su hijo a estudiar
 
Metodologia badań
Metodologia badańMetodologia badań
Metodologia badań
 
Lectura cooperativa. Fitxes de rols. Per imprimir.
Lectura cooperativa. Fitxes de rols. Per imprimir. Lectura cooperativa. Fitxes de rols. Per imprimir.
Lectura cooperativa. Fitxes de rols. Per imprimir.
 

Similar to Próba statystyczna i dobór próby

Meta analiza- łą„czenie ilorazó“w zdarzeń
Meta analiza- łą„czenie ilorazó“w zdarzeńMeta analiza- łą„czenie ilorazó“w zdarzeń
Meta analiza- łą„czenie ilorazó“w zdarzeńEBNP POLAND
 
Meetup 1 eksperymentujemy_na_duza_skale_rkita
Meetup 1 eksperymentujemy_na_duza_skale_rkitaMeetup 1 eksperymentujemy_na_duza_skale_rkita
Meetup 1 eksperymentujemy_na_duza_skale_rkitaRadoslaw Kita
 
Przedział‚ ufności i wartość‡ p
Przedział‚ ufności i wartość‡ pPrzedział‚ ufności i wartość‡ p
Przedział‚ ufności i wartość‡ pEBNP POLAND
 
Skalowanie Agile dla ALE Krakow
Skalowanie Agile dla ALE KrakowSkalowanie Agile dla ALE Krakow
Skalowanie Agile dla ALE KrakowAndy Brandt
 
Heterogeniczność
HeterogenicznośćHeterogeniczność
HeterogenicznośćEBNP POLAND
 
(Nie)wiarygodne obserwacje praktyków UX – o głupich błędach w interpretacji w...
(Nie)wiarygodne obserwacje praktyków UX – o głupich błędach w interpretacji w...(Nie)wiarygodne obserwacje praktyków UX – o głupich błędach w interpretacji w...
(Nie)wiarygodne obserwacje praktyków UX – o głupich błędach w interpretacji w...Krzysztof Piwowar
 

Similar to Próba statystyczna i dobór próby (6)

Meta analiza- łą„czenie ilorazó“w zdarzeń
Meta analiza- łą„czenie ilorazó“w zdarzeńMeta analiza- łą„czenie ilorazó“w zdarzeń
Meta analiza- łą„czenie ilorazó“w zdarzeń
 
Meetup 1 eksperymentujemy_na_duza_skale_rkita
Meetup 1 eksperymentujemy_na_duza_skale_rkitaMeetup 1 eksperymentujemy_na_duza_skale_rkita
Meetup 1 eksperymentujemy_na_duza_skale_rkita
 
Przedział‚ ufności i wartość‡ p
Przedział‚ ufności i wartość‡ pPrzedział‚ ufności i wartość‡ p
Przedział‚ ufności i wartość‡ p
 
Skalowanie Agile dla ALE Krakow
Skalowanie Agile dla ALE KrakowSkalowanie Agile dla ALE Krakow
Skalowanie Agile dla ALE Krakow
 
Heterogeniczność
HeterogenicznośćHeterogeniczność
Heterogeniczność
 
(Nie)wiarygodne obserwacje praktyków UX – o głupich błędach w interpretacji w...
(Nie)wiarygodne obserwacje praktyków UX – o głupich błędach w interpretacji w...(Nie)wiarygodne obserwacje praktyków UX – o głupich błędach w interpretacji w...
(Nie)wiarygodne obserwacje praktyków UX – o głupich błędach w interpretacji w...
 

Próba statystyczna i dobór próby

  • 1. PRÓBA STATYSTYCZNA DOBÓR PRÓBY ● POPULACJA DOCELOWA I BADANA Slide 3 ● OPERAT LOSOWANIA Slide 5 ● MIT PRÓBY REPREZENTATYWNEJ Slide 6 ● BŁĄD I TENDENCYJNOŚĆ PRÓBKOWANIA Slide 9 ● DOBÓR PROBABILISTYCZNY Slide 11 ● SKUTKI WYBORU TECHNIKI DOBORU PRÓBY Slide 16 ● DOBÓR NIEPROBABILISTYCZNY Slide 17 ● ANALIZA MOCY - WSTĘP Slide 20 ● ANALIZA MOCY - PODSTAWOWE POJĘCIA Slide 29 ● ANALIZA MOCY - ETAPY Slide 39 Artur Sołtysiak, styczeń 2015
  • 2. SPOSÓB CYTOWANIA: Artur Sołtysiak “Próba statystyczna. Dobór próby”. v1, prezentacja, styczeń 2015 Treść licencji: http://creativecommons.org/licenses/by-nc-nd/3.0/pl/legalcode
  • 3. POPULACJA DOCELOWA (TARGET POPULATION) ➢ całkowita populacja na której skupia się badanie POPULACJA BADANA (STUDY POPULATION) ➢ część populacji docelowej z której pobrana jest próba reprezentatywna ➢ badacz dobiera uczestników badania, którzy odpowiadają kryteriom włączenia
  • 4. JAK PRZEJŚĆ OD WIELKIEJ POPULACJI DOCELOWEJ POPRZEZ DUŻĄ POPULACJĘ BADANĄ DO MOJEJ PRÓBY REPREZENTATYWNEJ?
  • 5. OPERAT LOSOWANIA* lub: PRZESTRZEŃ PRÓBKOWANIA (SAMPLING FRAME) ➢ materiał źródłowy (list frames) lub urządzenie (non-list frames) z którego pobiera się próbę ➢ wyczerpująca lista wszystkich tych elementów populacji które mogą podlegać próbkowaniu (osoby, elementy, szpitale, instytucje, oddziały szpitalne) ➢ zawiera jednostki będące przedmiotem zainteresowania badacza ➢ dostarcza przejrzystą strukturę z której można pobrać próbę (numeryczny identyfikator + cechę charakterystyczna każdej jednostki) ➢ obmyślając ramę próbkowania należy rozróżniać populację docelową od populacji badanej ➢ nie ma idealnej, ale musi być jak najbardziej reprezentatywna (lustrzane odbicie populacji docelowej za wyjątkim liczebności) * definicja Głównego Urzędu Statystycznego TUTAJ
  • 6. MIT PRÓBY REPREZENTATYWNEJ ● STATYSTYKA MATEMATYCZNA NIE ZNA POJĘCIA “PRÓBY REPREZENTATYWNEJ” ● PR MOŻE JEDYNIE OZNACZAĆ TAKI SPOSÓB DOBORU, KTÓRY NIE PROWADZI DO POWSTANIA BŁĘDU SYSTEMATYCZNEGO (KIERUNKOWE WYPACZENIE WYNIKÓW) ● SPOSÓB NA IDEALNY DOBÓR PRÓBY NIE ISTNIEJE ● ZAWSZE NALEŻY LICZYĆ SIĘ Z MOŻLIWOŚCIĄ BŁĘDU STATYSTYCZNEGO
  • 7. MIT PRÓBY REPREZENTATYWNEJ JAK DUŻA PRÓBA JEST REPREZENTATYWNA? ● NIE MA SENSOWNEJ ODPOWIEDZI NA TO PYTANIE - ZALEŻY OD MOŻLIWOŚCI FINANSOWYCH PYTAJĄCEGO ● BŁĄD STATYSTYCZNY NAJPROŚCIEJ MINIMALIZUJE SIĘ PRZEZ ZWIĘKSZENIE LICZEBNOŚCI PRÓBY PROBLEM: BŁĄD NIE MALEJE PROPORCJONALNIE DO WZROSTU LICZEBNOŚCI PRÓBY A JEDYNIE DO PIERWIASTKA Z LICZEBNOŚCI PRÓBY (2X MNIEJSZY BŁĄD WYMAGA 4X WIĘKSZEJ PRÓBY!) PROPORCJONALNIE DO LICZEBNOŚCI PRÓBY ROŚNIE TYLKO KOSZT!
  • 8. DLA KOGO CHCESZ UOGÓLNIĆ BADANIE? DO JAKIEJ POPULACJI MOŻESZ MIEĆ DOSTĘP? JAK ZDOBĘDZIESZ DO NICH DOSTĘP? KTO JEST W TWOIM BADANIU? POPULACJA DOCELOWA POPULACJA BADANA OPERAT LOSOWANIA PRÓBA
  • 9. BŁĄD PRÓBKOWANIA (SAMPLING ERROR): ➢ taki sposób doboru próby który prowadzi do tendencyjności próbkowania ➢ próba staje się niereprezentatywna, badanie jest nie trafne (invalid), wyników badania nie można wykorzystać w praktyce TENDENCYJNOŚĆ PRÓBKOWANIA (SAMPLING BIAS, ASCERTAINMENT BIAS): ➢ “próba różni się od populacji, z której została wybrana pod względem częstości występowania jakiejś istotnej cechy sprawiającej, że charakterystyka próby ze względu na tę cechę różni się od charakterystyki populacji” (Andrzej Zieliński “Dobór próby w badaniach epidemiologicznych”) ➢ próbę pobrano w taki sposób, że część członków danej populacji jest słabiej reprezentowana niż inni
  • 10. ŹLE OPRACOWANY LUB NIEDOKŁADNY (INACCURATE) OPERAT LOSOWANIA TO BŁĄD KTÓREGO NIE DA SIĘ SKORYGOWAĆ!
  • 11. TECHNIKI DOBORU PRÓBY czyli losować czy nie losować DOBÓR PROBABILISTYCZNY (PROBABILITY SAMPLES): ❖ każda jednostka operata losowania ma znaną, większą niż zero szansę bycia wylosowanym ❖ badacz nie ma wpływu na mechanizmy rządzące doborem konkretnych jednostek do badania ❖ o “wyborze” elementu decyduje przypadek ❖ oparte na rachunku prawdopodobieństwa i statystyce matematycznej ❖ zaleta: przy uogólnianiu wyników badania z próby na całą populację można oszacować błąd doboru
  • 12. TECHNIKI DOBORU PRÓBY dobór probabilistyczny DOBÓR LOSOWY PROSTY (SIMPLE RANDOM SAMPLE): ➢ każdy element operatu losowania ma znaną i równą szansę selekcji ➢ próba brana jest w jednym ciągnieniu losowym ➢ najlepszy w tworzeniu szacunkowej dla całej populacji ➢ słaby gdy chcemy dowiedzieć się czegoś o podgrupach populacji ➢ może okazać się kosztowny lub w niektórych przypadkach niemożliwy DOBÓR SYSTEMATYCZNY (SYSTEMATIC SAMPLE): ➢ tak samo jak w DLP, różnica polega na tym że do pobrania próby wykorzystuje się metodę selekcji systematycznej; np pierwszy element z nr 4 a potem co 5-ty ➢ tańszy niż DLP ale wymaga ostrożności i przemyślenia
  • 13. TECHNIKI DOBORU PRÓBY dobór probabilistyczny DOBÓR WARSTWOWY (STRATIFIED SAMPLE): ➢ operat losowania jest podzielony na nie nakładające się grupy zainteresowania (strata) ➢ próby niekoniecznie jednakowo liczebne pobrane są z każdej takiej grupy ➢ badacz kontroluje dobór próby z każdej grupy (stratum) ➢ najlepsze do ustalenia szacunkowej dla całej populacji oraz dla każdej grupy ➢ wymaga: ↑kosztów, ↑próby, ➢ wysoka złożoność i trudność badania
  • 14. TECHNIKI DOBORU PRÓBY dobór probabilistyczny DOBÓR KLASTROWY (CLUSTER SAMPLE): ➢ operat losowania jest podzielony na nie nakładające się grupy (clusters) ➢ pobiera się próbkę klastrów (random sample) a następnie próbki z każdego wybranego klastra ➢ klaster służy jako wygodny dostęp do elementów próby na których skupia się badanie, sam klaster to narzędzie, nie obiekt zainteresowania ➢ pozwala zaoszczędzić pieniądze ➢ daje mniej dokładne szacunkowe (estimates) ➢ najwyższy stopień trudności analitycznej
  • 15. ODCHYLENIE STANDARDOWE (STANDARD DEVIATION) BŁĄD STANDARDOWY (STANDARD ERROR) SD: ● MIARA ZMIENNOŚCI (BEZ WZGLĘDU NA ROZKŁAD) ● GDY OBLICZAMY ODCHYLENIE STANDARDOWE PRÓBY, WYKORZYSTUJEMY JE JAKO SZACUNKOWĄ ZMIENOŚCI POPULACJI Z KTÓREJ PRÓBA ZOSTAŁA POBRANA ● NIE ZMIENIA SIĘ ZE WZROSTEM LICZEBNOŚCI PRÓBY SE: ● MIARA DOKŁADNOŚCI SZACUNKOWEJ PRÓBY ● SŁUŻY DO OBLICZANIA PRZEDZIAŁÓW UFNOŚCI ● IM MNIEJSZY TYM BARDZIEJ DOKŁADNA SZACUNKOWA ● MIARA PRECYZJI DLA ŚREDNIEJ PRÓBY (sample mean) SE = SD/√(wielkość próby) ● MALEJE GDY ROŚNIE WIELKOŚĆ PRÓBY
  • 16. EFEKT WYBORU DANEJ TECHNIKI DOBORU PRÓBY DOBÓR PRÓBY DESIGN EFFECT (Deff) lub DEFT LICZBA OBSERWACJI “n” PROPORCJA (p) SE (p) 95%CI PROSTY 1.0 500 0.50 0.022 +/- 0.044 WARSTWOWY 1.1 500 0.50 0.024 +/- 0.047 KLASTROWY 1.5 500 0.50 0.033 +/- 0.065 ● IM BARDZIEJ SKOMPLIKOWANE PRÓBKOWANIE TYM WIĘKSZE ODCHYLENIA (↑Deff, ↑SE i ↑CI) PRZY TEJ SAMEJ WIELKOŚCI PRÓBY ● W TAKIM PRZYPADKU ABY UTRZYMAĆ ISTOTNOŚĆ NA TYM SAMYM POZIOMIE, NALEŻY ZWIĘKSZYĆ LICZEBNOŚĆ PRÓBY Na podstawie: Anthony M. Roman “Introduction to sampling and weighting issues”, UMASS Boston
  • 17. TECHNIKI DOBORU PRÓBY czyli losować czy nie losować DOBÓR NIEPROBABILISTYCZNY (NON-PROBABILITY SAMPLES): ❖ dobór nielosowy, subiektywny - uzależniony od wiedzy i poglądów badacza ❖ najczęściej w oparciu o pewne wyznaczone kryteria (np wybór przypadków ekstremalnych, ukazanie że dana cecha występuje w populacji) ❖ wada: nie można zastosować metod wnioskowania statystycznego → nie można ocenić błędu doboru ❖ wykorzystywany gdy badana grupa osób jest trudno dostępna lub dobór losowy zbyt kosztowny, jako badanie pilotażowe, bad. eksploracyjne ❖ daje pogłębioną wiedzę w obszarach mało znanych, ale nie można wyników odnieść do całej populacji
  • 18. TECHNIKI DOBORU PRÓBY dobór nieprobabilistyczny DOBÓR WYGODNY (CONVENIENCE SAMPLING): wybór jednostek do których ma się łatwy, natychmiastowy dostęp DOBÓR SERYJNY (CONSECUTIVE SAMPLING): ➢ podobny do doboru wygodnego + wybór wszystkich dostępnych jednostek ➢ najlepsza technika doboru nieprobabilistycznego: większa próba, lepsza reprezentacja w stosunku do całej populacji DOBÓR KWOTOWY (QUOTA SAMPLING): ➢ równa lub proporcjonalna reprezentacja jednostek w zależności od tego jaka cecha jest podstawą kwotowania
  • 19. TECHNIKI DOBORU PRÓBY dobór nieprobabilistyczny DOBÓR CELOWY (PURPOSIVE SAMPLING): ➢ badacz mając konkretny cel na uwadze, uznaje że dane jednostki są bardziej przydatne dla celu badania niż inne DOBÓR “KULA ŚNIEŻNA” (SNOWBALL SAMPLING): ➢ wykorzystywany przy niewielkich populacjach ➢ badacz prosi pierwszego zrekrutowanego aby ten wyznaczył drugiego podobnego do siebie a ten kolejnego ➢ najmniej reprezentatywna próba
  • 22. WARIANCJA (VARIANCE) ● WYLICZENIE ŚREDNIEJ → WYLICZENIE WARIANCJI ● DAJE OBRAZ JAK DUŻE JEST ZRÓŻNICOWANIE WYNIKÓW W DANYM ZBIORZE WYNIKÓW (CZY SĄ SKONCENTROWANE WOKÓŁ ŚREDNIEJ, JEŚLI NIE - JAK BARDZO OD NIEJ ODBIEGAJĄ) ● PRZYJMUJE WARTOŚCI OD 0 DO NIESKOŃCZONOŚCI ● MAŁA WARIANCJA = PUNKTY BLISKO OCZEKIWANEJ ŚREDNIEJ (np: diament OR na linii CI względem linii braku efektu) ● PIERWIASTEK KWADRATOWY Z WARIANCJI TO ODCHYLENIE STANDARDOWE (standard deviation, SD)
  • 23. ZMIENNE (variables): MIERZALNE JAKOŚCI LUB CECHY CHARAKTERYSTYCZNE OSÓB, RZECZY LUB SYTUACJI KTÓRE MOGĄ PODLEGAĆ ZMIANIE, ZRÓŻNICOWANIU LUB PRZYPADKOWYM ODCHYLENIOM Przykład w kontekście analizy mocy: sygnał, szum, moc, poziom istotności, hipoteza alternatywna, wielkość próby TO PODSTAWA BADAŃ ILOŚCIOWYCH: STANOWIĄ PRZEDMIOT BADAŃ W DANEJ POPULACJI
  • 24. ZMIENNA NIEZALEŻNA (independent variable): ➢ jest w badaniu od samego początku ➢ badacz nią manipuluje ➢ ma wpływ na inną zmienną (zależną) PRZYKŁADY: ➢ LEK I JEGO POSZCZEGÓLNE DAWKI ➢ DANY SPOSÓB PIELĘGNACJI (np: zmiana ułożenia pacjenta nieprzytomnego w łóżku) ➢ CZĘSTOTLIWOŚĆ, CZAS TRWANIA EKSPOZYCJI LUB INTERWENCJI ➢ OBECNOŚĆ LUB NIEOBECNOŚĆ CZYNNIKA, OSÓB (np: obecność rodziców przy dzieciach w trakcie bolesnych zabiegów)
  • 25. ZMIENNA ZALEŻNA (dependent variable): ➢ pojawia się w przebiegu badania jako skutek ➢ nie podlega manipulacji lecz obserwacji i pomiarom ➢ jej wartość/wielkość zależy od wartości/wielkości zmiennej niezależnej PRZYKŁADY: ➢ ODPOWIEDŻ NA LEK I JEGO POSZCZEGÓLNE DAWKI ➢ EFEKT DANEGO SPOSOBU PIELĘGNACJI (np: pobudzenie procesów naprawczych skóry, zachowanie integracji tkanki skórnej) ➢ POJAWIENIE SIĘ FENOMENU (np: zmniejszony lęk, zwiększone zaufanie, sprawniejsza komunikacja, lepsza współpraca z pacjentem, zwiększenie liczby osób biorących udział w badaniach przesiewowych dla danej populacji)
  • 26. ZMIENNA ZEWNĘTRZNA (extraneous variable): ➢ niechciana “zmienna niezależna” ➢ ma wpływ na efekt badania choć nie jest zmienną niezależną wprowadzoną przez badacza ➢ zagraża trafności wyników badania (validity of study results) PRZYKŁADY: ➢ ALERGIA / UZALEŻNIENIE / INNE LEKI WCHODZĄCE W INTERAKCJE A ODPOWIEDŹ NA DANY LEK I JEGO POSZCZEGÓLNE DAWKI ➢ CHOROBY WSPÓŁISTNIEJĄCE U PACJENTA A EFEKT DANEGO SPOSOBU PIELĘGNACJI (np: niski poziom białka a pobudzenie procesów naprawczych skóry) ➢ WIEK I ZDOLNOŚCI POZNAWCZE A POJAWIENIE SIĘ FENOMENU (np: lęk, zwiększone zaufanie, sprawniejsza komunikacja, lepsza współpraca z pacjentem, zwiększenie liczby osób biorących udział w badaniach przesiewowych dla danej populacji)
  • 27. ZMIENNE ZEWNĘTRZNE: ➢ należy je rozpoznać i jeśli to możliwe wyeliminować we stępnej fazie projektu badania ➢ jeśli nie można ich wyeliminować - należy zastosować środki by je maksymalnie zmniejszyć lub wprowadzić kontrolę zmiennych zewnętrznych w badaniu JEŚLI NIE MAMY KONTROLI NAD ZNANĄ ZMIENNĄ ZEWNĘTRZNĄ STAJE SIĘ ONA ZMIENNĄ UWIKŁANĄ (confounding variable) WYNIKI BADANIA SĄ NIETRAFNE (invalid): wyjaśnienie nie odzwierciedla zjawiska do którego się odwołuje.
  • 28. BADACZ MOŻE KONTROLOWAĆ / ANALIZOWAĆ ZMIENNE ZEWNĘTRZNE JEŚLI SĄ ZNANE I MIERZALNE. STRATEGIE REDUKCJI UWIKŁAŃ (confounding): ➢ randomizacja (randomization) cel: losowa dystrybucja zmiennych uwikłanych (confounding variables) w grupach ➢ restrykcja (restriction): ograniczenie “wejścia” do badań osobom z czynnikami uwikłanymi (confounding factors) - samo w sobie wiąże się z ryzykim tendencyjności ➢ dopasowanie (matching) osób lub grup by zapewnić równomierną dystrybucję uwikłań ➢ stratyfikacja (stratification): uwikłania są równo rozdzielone wewnątrz każdej warstwy (subpopulacji badania) ➢ dostosowanie (adjustment) - zazwyczaj zniekształcone przez wybór standardu ➢ analiza wieloczynnikowa (multivariate analysis) ma sens tylko wtedy gdy można rozpoznać i zmierzyć uwikłania
  • 29. PODSTAWOWE POJĘCIA SYGNAŁ (signal): wielkość różnicy pomiędzy średnimi dwu grup (M1-M2), która ma szansę byś statystycznie/klinicznie istotna. Ustala ją badacz. Im większa tym lepiej. Dla badań stosowanych należy także określić wielkość efektu. Dla badań podstawowych (fundamental research) wystarczy że jest jakakolwiek różnica pomiędzy grupami. SZUM (noise): zróżnicowanie wśród przedmiotów badania wyrażone jako odchylenie standardowe (SD). Bierze się je z dotychczasowych badań lub badania pilotażowego. Jeśli brak estymacji, warto wykonać analizę mocy z niską i wysoką szacunkową by zobaczyć jak wpływa ona na szacunkową wielkość próby (“guesstimate”). Można pominąć jeśli porównywane są 2 proporcje
  • 30. PODSTAWOWE POJĘCIA STOSUNEK SYGNAŁU DO SZUMU (signal/noise ratio) lub ZNORMALIZOWANA WIELKOŚĆ EFEKTU (standardised effect size) lub d COHENA (Cohen’s d): ...czyli różnica pomiędzy średnimi podzielona przez odchylenie standardowe w próbie lub
  • 31. PODSTAWOWE POJĘCIA MOC (power): prawdopodobieństwo że badacz będzie mógł wykryć określony przez siebie efekt (sygnał) Pożądany jest duży efekt (często określony jako 0.8 lub 0.9 (odpowiednio 80% lub 90%). Większa moc wymaga większej próby (sample size). WIELKOŚĆ PRÓBY (sample size): jest liczbą (n, N) w każdej grupie. Zazwyczaj chcemy ją oszacować czy jest “wystarczająca”. Bywa jednak że mamy dostęp tylko do określonej próby (np 22) - wtedy analiza mocy służy dla oszacowania mocy lub wielkości efektu (effect size)
  • 32. HIPOTEZA ZEROWA (H0 ) zwana hipotezą statystyczną: BADACZ JEST PRZEKONANY ŻE ZWIĄZEK POMIĘDZY ZMIENNYMI LUB WŚRÓD ZMIENNYCH W BADANIU NIE ISTNIEJE LUB WIEDZA EMPIRYCZNA LUB TEORETYCZNA JEST NIEWYSTARCZAJĄCA BY POSTAWIĆ PYTANIE BADAWCZE. ● ŚREDNIE 2 GRUP NIE RÓŻNIĄ SIĘ OD SIEBIE PRZYKŁAD: Obecność rodziców w gabinecie zabiegowym w trakcie zakładania obwodowego kontaktu żylnego nie ma wpływu na poziom lęku u dzieci w wieku przedszkolnym.
  • 33. HIPOTEZA KIERUNKOWA (przyczynowa): PROGNOZUJE ŚCIEŻKĘ I KIERUNEK RELACJI POMIĘDZY MINIMUM DWIEMA ZMIENNYMI. ZMIENNA NIEZALEŻNA JEST PRZYCZYNĄ INNEJ ZMIENNEJ - ZALEŻNEJ ● ŚREDNIE 2 GRUP RÓŻNIĄ SIĘ OD SIEBIE PRZYKŁAD: A: Obecność rodziców w gabinecie zabiegowym w trakcie zakładania obwodowego kontaktu żylnego zmniejsza poziom lęku u dzieci w wieku przedszkolnym. B: Obecność rodziców w gabinecie zabiegowym w trakcie zakładania obwodowego kontaktu żylnego zwiększa poziom lęku u dzieci w wieku przedszkolnym.
  • 34. HIPOTEZA BEZKIERUNKOWA: PROGNOZUJE RELACJĘ POMIĘDZY MINIMUM DWIEMA ZMIENNYMI BEZ WSKAZYWANIA NA NATURĘ LUB KIERUNEK TEJ RELACJI Zazwyczaj gdy niewiele wiemy o przedmiocie badania lub gdy poprzednie prace badawcze są sprzeczne. ● ŚREDNIE 2 GRUP RÓŻNIĄ SIĘ OD SIEBIE PRZYKŁAD: Obecność rodziców w gabinecie zabiegowym w trakcie zakładania obwodowego kontaktu żylnego wpływa na poziom lęku u dzieci w wieku przedszkolnym.
  • 35. HIPOTEZA ASOCJACYJNA: ZMIANIE JEDNEJ ZMIENNEJ TOWARZYSZY ZMIANA INNEJ ZMIENNEJ. BEZ SUGESTII ŻE ZMIANA W JEDNEJ ZMIENNEJ SPOWODOWAŁA ZMIANĘ W INNEJ ZMIENNEJ.
  • 36. Są tylko dwa wyjścia: 1) nie odrzucamy H0 (nie ma wystarczającego dowodu przeciw H0 na korzyść H1 ) 2) odrzucamy H0 na korzyść H1 HIPOTEZA ZEROWA (H0 ) H0 to twierdzenie które testujemy H1 to hipoteza alternatywna. Twierdzenie hipotezy alternatywnej zostanie przyjęte jeśli H0 zostanie odrzucona. Wynik testu statystycznego prezentujemy w świetle H0 .
  • 37. Wniosek "nie odrzucam H0 " nie oznacza to automatycznie że H0 jest prawdziwa. Oznacza to, że nie ma wystarczającego dowodu by odrzucić H0 na korzyść H1 . Wniosek "odrzucam H0 " na korzyść H1 , czyli sugeruję że H1 MOŻE być prawdziwa (a nie że z pewnością H1 jest prawdziwa).
  • 38. MOŻLIWE SĄ DWA BŁĘDY Type I error (α-error) H0 jest odrzucona chociaż jest prawdziwa obrona: wybór poziomu istotności, np 5% czyli średnio 1/20 porównań będzie “istotnych”. Type II error (β-error) H0 zostaje zaakceptowana chociaż na prawdę jest fałszywa. (Nie znaleziono różnicy pomiędzy próbami chociaż ona naprawdę istnieje = słaba moc badania) obrona: BARDZO TRUDNA ponieważ w grę wchodzi wiele zmiennych (“sygnał”: różnica między średnimi grup, “szum”: zmienność osobnicza, wielkość próby...)
  • 39. Analiza Mocy (power analysis) ★ ZAZWYCZAJ WYKORZYSTYWANA DO OKREŚLENIA WIELKOŚCI PRÓBY. ★ DLA 2 GRUP (BADAWCZA I KONTROLNA) PRZY POSTAWIENIU HIPOTEZY ZEROWEJ I ALTERNATYWNEJ NALEŻY: - wybrać odpowiedni poziom istotności, np 5% - zdecydować jaką wybrać moc (szansa na wykrycie prawdziwego efektu jeśli jest obecny i uniknięcie błędu typu II); zazwyczaj pomiędzy 80% a 95%; większa moc wymaga większej próby - uzyskać szacunkową “szumu” (np odchylenie standardowe cechy badanej) z poprzednich badań, opracowań lub badania pilotażowego - oszacować “sygnał” (wielkość efektu), który nas interesuje (jak wielka różnica pomiędzy dwoma średnimi byłaby warta zachodu (statystycznie i/lub klinicznie) - obliczyć znormalizowaną wielkość efektu: stosunek sygnał/szum = (średnia1 - średnia2)/SD
  • 40. Analiza Mocy (power analysis) ★ ISTNIEJE MOŻLIWOŚĆ PRZEPROWADZENIA ANALIZY MOCY DLA BADANIA Z 3 LUB WIĘCEJ GRUPAMI (problem z określeniem istotnego statystycznie/klinicznie wielkości efektu) ★ JEŚLI WIELKOŚĆ PRÓBY JEST Z GÓRY USTALONA, WYKORZYSTUJE SIĘ JĄ DO OSZACOWANIA “SYGNAŁU” LUB MOCY PLANOWANEGO EKSPERYMENTU
  • 41. SYGNAŁ wielkość efektu który nas interesuje (wybiera badacz) SZUM zmienność przedmiotu eksperymentu (poprzednie badania) MOC 80%-90% ? WIELKOŚĆ PRÓBY ZNORMALIZOWANA WIELKOŚĆ EFEKTU (d Cohena) HIPOTEZA ALTERNATYWN A POZIOM ISTOTNOŚCI (0.5) WYBIERA BADACZ Na podstawie: Ralph B. Dell et al “Sample size determination” 2002, tłumaczenie Artur Sołtysiak
  • 42. ZADANIE Na podstawie tekstu pracy badawczej http://goo.gl/ndxiDY: a) opisz technikę doboru próby b) określ populację docelową, populację badaną, określ operat losowania c) oceń dobór próby (kryteria doboru i reprezentatywność próby)
  • 43. LITERATURA ŹRÓDŁOWA WYKORZYSTANA W PREZENTACJI 1. Wikiversity “Cohen's d”, http://en.wikiversity.org/wiki/Cohen's_d This page was last modified on 20 August 2014, at 23:36; accessed: February 2, 2015 at 22:20 CET 2. Aviva Petrie, Caroline Sabin “Medical Statistics at a Glance. Workbook” January 2013, Wiley-Blackwell 3. Kate Gerrish, Anne Lacey “The Research Process in Nursing”, 6th Edition, April 2010, Wiley-Blackwell 4. Douglas G Altman, J Martin Bland “Standard deviations and standard errors. Statistics Notes” BMJ Vol 331, page 903, 15 Oct 2005 5. Alan M Betterham, Greg Atkinson “How big does my sample need to be?A primer on the murky world of sample size estimation”, Physical Therapy in Sport 6, Elsevier (2005) 153-163 6. Ralph B Dell, Steve Holleran, Rajasekhar Ramakrishnan “Sample size determination”, ILAR Journal, Vol 43, Number 4, 2002