Podstawy statystyki dla
    psychologów
         Zajęcia 10.
Wprowadzenie do wnioskowania
       statystycznego
        Karol Wolski
Wnioskowanie statystyczne
• Wnioskowanie statystyczne to wyprowadzanie
  wniosku o parametrze populacyjnym na
  podstawie statystyki z próby
• Jego istotą jest odkrycie, jakie wartości z próby
  są możliwe i z jakim prawdopodobieństwem
  mogą się one pojawić.
Hipoteza zerowa i alternatywna
• Hipoteza zerowa (H0) - Jest to hipoteza poddana
  procedurze weryfikacyjnej, w której zakładamy, że
  różnica między analizowanymi parametrami lub
  rozkładami wynosi zero.
  – H0 :  = 100
• Hipoteza alternatywna (H1)/ (HA)- hipoteza
  przeciwstawna do weryfikowanej.
  – H1 :  ≠ 100
  – H2 :  > 100
  – H3 :  < 100
Kiedy odrzucamy H0
• Uzyskana przez nas średnia w próbie prawie
  nigdy nie będzie taka sama jak średnia w
  populacji
• Dlatego aby odrzucić H0 musi posłużyć się
  jakimś kryterium wskazującym nam jakie
  wartości  będą pojawiały się bardzo często a
  jakie bardzo rzadko, kiedy H0 jest prawdziwa.
Kiedy odrzucamy H0
• Tym kryterium jest Poziom istotności ( – alfa)
   – jest to wartość prawdopodobieństwa, którą
     wykorzystujemy jako kryterium w decyzjach, czy
     prawdopodobieństwo pojawienia się przez przypadek
     statystyki otrzymanej w próbie jest niskie, wtedy gdy
     hipoteza zerowa jest prawdziwa (w rezultacie hipoteza
     zerowa zostaje odrzucona)
   – Określa maksymalne ryzyko błędu, jakie badacz jest
     skłonny zaakceptować. Wybór wartości α zależy od
     badacza, natury problemu i od tego, jak dokładnie
     chce on weryfikować swoje hipotezy, najczęściej
     przyjmuje się α = 0,05; rzadziej 0,1, 0,03, 0,01 lub
     0,001
Kiedy odrzucamy H0
• Rozpatrzmy następujący przykład
  – H0 :  = 85
  – H1 :  ≠ 85
  – Alfa=0,05
  –  = 90
  – n=100
  –  = 20
Kiedy odrzucamy H0
• Aby przetestować naszą hipotezę musimy
  przekształcić naszą średnią  = 90 na wynik z oraz
  odnieść ją do rozkładu
Kiedy odrzucamy H0
• Zatem
         −       −        90−85     5
•  =             =         =             = = +2,5
                                 20/ 100    2
Kiedy odrzucamy H0
• Uzyskana wartość z jest wyższa niż wartość
  krytyczna
• Można więc odrzucić hipotezę zerową i przyjąć
  hipotezę alternatywną
• Nie ma podstaw aby uważać, że średnia w
  populacji, z której pochodzi próba jest równa 85.
  Średnia ta jest najprawdopodobniej wyższa.
• Wniosek dotyczy populacji, z której została
  pobrana próba (reprezentatywna), nie zaś samej
  próby
Kiedy odrzucamy H0
• Problemy, wybór poziomu Alfa jest arbitralny,
  kiedy wybierzemy inny niż 0,05 nasza hipoteza
  zerowe może nie zostać odrzucona
• To, że H0 nie zostanie odrzucona, NIE oznacza, że
  najprawdopodobniej jest ona prawdziwa.
  Oznacza to jedynie, że nie mamy wystarczających
  podstaw aby ją odrzucić
• Odrzucenie H0 oznacza, że nie wydaje się
  uzasadniona wiara w to, że hipoteza ta jest
  prawdziwa.
Test jednostronny i dwustronny
• Dwustronny (niekierunkowy) – hipoteza
  alternatywna stwierdza, że parametr populacyjny
  może być albo mniejszy albo większy od wartości
  określonej przez hipotezę zerową (obszar
  odrzucenia podzielony i rozmieszczony
  symetrycznie po obu krańcach rozkładu)
• Kierunkowy (jednostronny) - hipoteza
  alternatywna stwierdza, że parametr populacyjny
  różni się od wartości określonej przez hipotezę
  zerową w jednym konkretnym kierunku (cały
  obszar odrzucenia po jednej stronie rozkładu)
Test jednostronny i dwustronny
Założenia testowania hipotez o
          średniej pojedynczej
• Próba wybrana z populacji jest próbą losową
• Losowanie zgodne ze schematem losowania
  zwrotnego
• Rozkład wartości  z próby jest zgodny z krzywą
  normalną
• Znane jest odchylenie standardowe wyników w
  populacji (niezbędne do policzenia  )
                  − 2
  – wzór  =
                    
  – Problem w tym, że rzadko znamy tę wartość…. A jak ją
    znamy, to znamy i średnią w populacji
Szacowanie błędu standardowego
               średniej
         −         −       −
•  =              =          =    ????
          
                                        
• Skąd zatem wziąć odchylenie st. Populacji?
• Z pomocą przychodzi nam nasza ukochana
  wariancja (estymator nieobciążony):
   2      − 2        
•  =              =
           −1          −1
          − 2
• s=
           −1
Szacowanie błędu standardowego
               średniej
• Wartość  zastępujemy zatem s i dzięki temu
  otrzymujemy oszacowanie błędu
  standardowego średniej
           
•  =
             
• A teraz niespodzianka… jeśli we wzorze na
         −
   =             wartość  zastąpimy  to
           
  otrzymamy nową statystykę - t
Rozkład t
       −
• t=
         
       ś   ó −ℎ.ś..
• t=
                 łę .ś
         ł .−ł
• t=
                        
• Rozkład t NIE jest rozkładem normalnym,
  nazywamy go rozkładem t Studenta
Rozkład t - cechy
• Im większa próba tym rozkład t będzie bliższy
  rozkładowi z
• Przy nieskończenie dużej próbie t=z
• Kształt rozkładu t zależy od wielkości próby a
  dokładnie od liczby stopni swobody (df)
• W przypadku testowania hipotez o
  pojedynczej średniej df=n-1
Rozkład t - cechy
Rozkład z a rozkład t
• Podobieństwa
  – Oba mają średnią równą zero
  – Są symetryczne
  – Są jednomodalne
• Różnice, rozkład t w porównaniu z z jest:
  – Platykurtyczny – ma smuklejszy wierzchołek i ma
    większą koncentrację obserwacji na krańcach rozkładu
  – Ma większe odchylenie standardowe
  – Zależy od liczby stopni swobody
Rozkład t - cechy
• Dla nieskończonej liczby stopni swobody
  krytyczna wartość t=z=+- 1,96 (Dla alfa=0,05)
• Im mniejsza liczba df tym większa wartość
  krytyczna t
Rozkład t
• Rozkład t wykorzystujemy tak samo jak rozkład z,
  pozwala on nam umiejscowić daną średnią w
  rozkładzie, a przez to wnioskować o populacji
• Jego zaletą jest to, że nie jest wymagana
  znajomość 
• Do oceny położenia danego wyniku t w rozkładzie
  używamy tablic statystycznych
  – http://pl.wikisource.org/wiki/Tablica_rozk%C5%82adu
    _t-Studenta

Podstawy statystyki dla psychologów - zajęcia 10 - wprowadzenie do wnioskowania statystycznego

  • 1.
    Podstawy statystyki dla psychologów Zajęcia 10. Wprowadzenie do wnioskowania statystycznego Karol Wolski
  • 2.
    Wnioskowanie statystyczne • Wnioskowaniestatystyczne to wyprowadzanie wniosku o parametrze populacyjnym na podstawie statystyki z próby • Jego istotą jest odkrycie, jakie wartości z próby są możliwe i z jakim prawdopodobieństwem mogą się one pojawić.
  • 3.
    Hipoteza zerowa ialternatywna • Hipoteza zerowa (H0) - Jest to hipoteza poddana procedurze weryfikacyjnej, w której zakładamy, że różnica między analizowanymi parametrami lub rozkładami wynosi zero. – H0 : = 100 • Hipoteza alternatywna (H1)/ (HA)- hipoteza przeciwstawna do weryfikowanej. – H1 : ≠ 100 – H2 : > 100 – H3 : < 100
  • 4.
    Kiedy odrzucamy H0 •Uzyskana przez nas średnia w próbie prawie nigdy nie będzie taka sama jak średnia w populacji • Dlatego aby odrzucić H0 musi posłużyć się jakimś kryterium wskazującym nam jakie wartości będą pojawiały się bardzo często a jakie bardzo rzadko, kiedy H0 jest prawdziwa.
  • 5.
    Kiedy odrzucamy H0 •Tym kryterium jest Poziom istotności ( – alfa) – jest to wartość prawdopodobieństwa, którą wykorzystujemy jako kryterium w decyzjach, czy prawdopodobieństwo pojawienia się przez przypadek statystyki otrzymanej w próbie jest niskie, wtedy gdy hipoteza zerowa jest prawdziwa (w rezultacie hipoteza zerowa zostaje odrzucona) – Określa maksymalne ryzyko błędu, jakie badacz jest skłonny zaakceptować. Wybór wartości α zależy od badacza, natury problemu i od tego, jak dokładnie chce on weryfikować swoje hipotezy, najczęściej przyjmuje się α = 0,05; rzadziej 0,1, 0,03, 0,01 lub 0,001
  • 6.
    Kiedy odrzucamy H0 •Rozpatrzmy następujący przykład – H0 : = 85 – H1 : ≠ 85 – Alfa=0,05 – = 90 – n=100 – = 20
  • 8.
    Kiedy odrzucamy H0 •Aby przetestować naszą hipotezę musimy przekształcić naszą średnią = 90 na wynik z oraz odnieść ją do rozkładu
  • 9.
    Kiedy odrzucamy H0 •Zatem − − 90−85 5 • = = = = = +2,5 20/ 100 2
  • 10.
    Kiedy odrzucamy H0 •Uzyskana wartość z jest wyższa niż wartość krytyczna • Można więc odrzucić hipotezę zerową i przyjąć hipotezę alternatywną • Nie ma podstaw aby uważać, że średnia w populacji, z której pochodzi próba jest równa 85. Średnia ta jest najprawdopodobniej wyższa. • Wniosek dotyczy populacji, z której została pobrana próba (reprezentatywna), nie zaś samej próby
  • 11.
    Kiedy odrzucamy H0 •Problemy, wybór poziomu Alfa jest arbitralny, kiedy wybierzemy inny niż 0,05 nasza hipoteza zerowe może nie zostać odrzucona • To, że H0 nie zostanie odrzucona, NIE oznacza, że najprawdopodobniej jest ona prawdziwa. Oznacza to jedynie, że nie mamy wystarczających podstaw aby ją odrzucić • Odrzucenie H0 oznacza, że nie wydaje się uzasadniona wiara w to, że hipoteza ta jest prawdziwa.
  • 12.
    Test jednostronny idwustronny • Dwustronny (niekierunkowy) – hipoteza alternatywna stwierdza, że parametr populacyjny może być albo mniejszy albo większy od wartości określonej przez hipotezę zerową (obszar odrzucenia podzielony i rozmieszczony symetrycznie po obu krańcach rozkładu) • Kierunkowy (jednostronny) - hipoteza alternatywna stwierdza, że parametr populacyjny różni się od wartości określonej przez hipotezę zerową w jednym konkretnym kierunku (cały obszar odrzucenia po jednej stronie rozkładu)
  • 13.
  • 14.
    Założenia testowania hipotezo średniej pojedynczej • Próba wybrana z populacji jest próbą losową • Losowanie zgodne ze schematem losowania zwrotnego • Rozkład wartości z próby jest zgodny z krzywą normalną • Znane jest odchylenie standardowe wyników w populacji (niezbędne do policzenia ) − 2 – wzór = – Problem w tym, że rzadko znamy tę wartość…. A jak ją znamy, to znamy i średnią w populacji
  • 15.
    Szacowanie błędu standardowego średniej − − − • = = = ???? • Skąd zatem wziąć odchylenie st. Populacji? • Z pomocą przychodzi nam nasza ukochana wariancja (estymator nieobciążony): 2 − 2 • = = −1 −1 − 2 • s= −1
  • 16.
    Szacowanie błędu standardowego średniej • Wartość zastępujemy zatem s i dzięki temu otrzymujemy oszacowanie błędu standardowego średniej • = • A teraz niespodzianka… jeśli we wzorze na − = wartość zastąpimy to otrzymamy nową statystykę - t
  • 17.
    Rozkład t − • t= ś ó −ℎ.ś.. • t= łę .ś ł .−ł • t= • Rozkład t NIE jest rozkładem normalnym, nazywamy go rozkładem t Studenta
  • 18.
    Rozkład t -cechy • Im większa próba tym rozkład t będzie bliższy rozkładowi z • Przy nieskończenie dużej próbie t=z • Kształt rozkładu t zależy od wielkości próby a dokładnie od liczby stopni swobody (df) • W przypadku testowania hipotez o pojedynczej średniej df=n-1
  • 19.
  • 20.
    Rozkład z arozkład t • Podobieństwa – Oba mają średnią równą zero – Są symetryczne – Są jednomodalne • Różnice, rozkład t w porównaniu z z jest: – Platykurtyczny – ma smuklejszy wierzchołek i ma większą koncentrację obserwacji na krańcach rozkładu – Ma większe odchylenie standardowe – Zależy od liczby stopni swobody
  • 21.
    Rozkład t -cechy • Dla nieskończonej liczby stopni swobody krytyczna wartość t=z=+- 1,96 (Dla alfa=0,05) • Im mniejsza liczba df tym większa wartość krytyczna t
  • 22.
    Rozkład t • Rozkładt wykorzystujemy tak samo jak rozkład z, pozwala on nam umiejscowić daną średnią w rozkładzie, a przez to wnioskować o populacji • Jego zaletą jest to, że nie jest wymagana znajomość • Do oceny położenia danego wyniku t w rozkładzie używamy tablic statystycznych – http://pl.wikisource.org/wiki/Tablica_rozk%C5%82adu _t-Studenta