Korelacje

552 views
481 views

Published on

0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
552
On SlideShare
0
From Embeds
0
Number of Embeds
3
Actions
Shares
0
Downloads
9
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Korelacje

  1. 1. WSPÓŁZMIENNOŚĆ MIARY KORELACJI
  2. 2. INTERPRETACJA - ĆWICZENIE
  3. 3. PRZYJMUJEMY CZY ODRZUCAMY? 1. Porównujemy skuteczność nauczania przez mówców rodzimych i nauczycieli z wykształceniem filologicznym. Badamy średnią liczbę błędów popełnioną na teście przez ich uczniów. Zbadano 32 nauczycieli z każdej grupy, których dobrano tak, by byli w parach podobni ze względu na cechy istotne w badaniu. 1. t=-1.83 2. df=31 2. Badano średnią długość zdań ze względu na rejestr w czterech podkorpusach (mowa, artykuły naukowe, artykuły prasowe, literatura). W każdy podkorpusie zbadano 100 zdań: 1. F=5,21 2. dflicz=3 dfmian=396 3. Badano skuteczność nauczania języka obcego dwoma metodami. Z korpusu wypracowań pozyskano informację o liczbie błędów popełnionych. 1. t=2,584 2. df=13 4. Analizowano długość samogłosek w mowie 10 mówców. Wzięto pod uwagę dwa różne otoczenia tych samogłosek. 1. t=-2,95 2. df=9
  4. 4. PROBLEM ZDOLNI NIEZOLNI METODA 1 METODA 2 poziom ZDOLNOŚCI mierzony przy pomocy testu IQ znacznie dokładniej oddaje zróżnicowania niż prosty podział na kilka kategorii DWIE ZMIENNE CIĄGŁE (interwałowe lub ilorazowe) możemy sprawdzać, jak zmienność jednej wiąże się ze zmiennością drugiej => współczynniki KORELACJI
  5. 5. WSPÓŁCZYNNIK KORELACJI PEARSONA
  6. 6. LOGIKA  Badamy zależność między wzrostem w calach a wzrostem w centymetrach;  jak wiadomo – wartości te będą ze sobą ściśle związane;  Mamy grupę 7 osób;  Obliczamy średnią dla wzrostu grupy w calach i średnią dla wzrostu grupy w centymetrach;  Dla każdego wyniku liczymy „odległość od średniej” (np. w jednostkach odchylenia standardowego); Osob a WZROST CALE (zrelatywizowany) WZROST CENTYMETRY (zrelatywizowany) O1 0,3 O2 0,2 O3 0,2 O4 0,5 O5 0,2 O6 0,2 O7 0,5
  7. 7. LOGIKA A B C D ZMIENNA 1 ZMIENNA 2 A B C D
  8. 8. LOGIKA Wniosek:  Jeżeli istnieje zależność – jesteśmy w stanie przewidzieć „odległości” od średniej dla poszczególnych osób; I odwrotnie:  Na podstawie różnicy „odległościami” możemy określać siłę związku między zmiennymi.
  9. 9. MATEMATYKA 
  10. 10. INTERPRETACJA WSPÓŁCZYNNIK r POPULACJA testowanie H0: r=0 PRÓBA siła kierunek KORELACJA TO NIE KAUZACJA
  11. 11. INTERPRETACJA - PRÓBA  progi: •| r| < 0,3 – zależność słaba, brak zależności •| r| < 0,5 – zależność średnia •| r| > 0,5 – zależność silna  kierunek: • r>0 – wraz ze wzrostem wartości zmiennej niezależnej, rośnie wartość zmiennej zależnej; • r,0 – wraz ze wzrostem wartości zmiennej niezależnej, spada wartość zmiennej zależnej;  znaczenie (po drobnym przeliczeniu): • jaki procent wartości zmiennej zależnej będzie się znajdował powyżej mediany dla wartości zmiennej niezależnej powyżej mediany
  12. 12. INTERPRETACJA - PRÓBA ZMIENNA 1 ZMIENNA 2 wartość r procent oczekiwanych obserwacji poniżej mediany 0,00 50,0 0,10 46,9 0,20 43,8 0,30 40,5 0,40 37,0 0,50 33,5 0,60 29,7 0,70 25,5 0,80 20,7 0,90 14,7 1,00 0,00 1 2 3 4 5 6 4 3 6 2 1 5
  13. 13. INTERPRETACJA - POPULACJA  obliczamy t:  porównujemy do rozkładu t-Studenta dla n-2 stopni swobody (n – liczba osób badanych)
  14. 14. ZASTOSOWANIA  obie zmienne min. interwałowe;  związek zbliżony do prostolinowego: • podstawy, by przypuszczać, że taki związek zachodzi; • wykres punktowy potwierdza prostoliniowość związku;  przykłady zależności nie prostolinowych: • wiek i wyniki testu fluencji słownej
  15. 15. ĆWICZENIE  badamy zależność wyników testu fluecji słownej od różnych czynników: oZMIENNE ZALEŻNE: wynik zwierzęta (FS1), wynik przedmioty ostre (FS2); ogólny wynik – zmienna porządkowa (FS_całość); oZMIENNE NIEZALEŻNE: IQ, wykształcenie, płeć.  zbadaliśmy 30 osób;  zmienne dla których mogę obliczyć współczynnik korelacji Pearsona: o wynik zwierzęta (FS1), o wynik przedmioty ostre (FS2); o IQ =WSP.KORELACJI(zmienna 1; zmienna 2)
  16. 16. WSPÓŁCZYNNIK KORELACJI RANG SPEARMANA
  17. 17. PROBLEM  jedna zmienna interwałowa, a druga porządkowa; o np. wykształcenie i wynik testu fluencji słownej  co się zmienia: o nie mam średniej; o nie mogę stosować sumy kwadratów;
  18. 18. LOGIKA Osoba badana Kolejne miejsce na liście wg wykształcenia tzw. ranga Kolejne miejsce na liście wg zasobu słownictwa tzw. ranga O1 6,5 O2 6,5 O3 5 O4 3,5 O5 2 O6 3,5 O7 1
  19. 19. LOGIKA ZMIENNA 1 ZMIENNA 2 1 2 3 4 5
  20. 20. LOGIKA Wniosek:  Jeżeli istnieje zależność – jesteśmy w stanie przewidzieć kolejność osób w przypadku obu zmiennych; I odwrotnie:  Na podstawie różnicy między tym kolejnością dla jednej i dla drugiej zmiennej możemy określić siłę zależności
  21. 21. WWW.LOGIC.AMU.EDU.PL MATEMATYKA  Obliczenia: rS = d – różnica pomiędzy rangą dla zmiennej pierwszej a drugiej N – liczba obserwacji
  22. 22. RANGOWANIE  Dla każdej z analizowanych zmiennych osobno: 1. Porządkujemy obserwacje wg wartości zmiennej – od najmniejszej do największej 2. Przypisujemy im numer miejsca, na którym się znajdują  Jeżeli kilka obserwacji ma tę samą wartość – przypisujemy im średnią z numerów wszystkich miejsc, które zajmują EXCEL 2013: =POZYCJA.ŚR(komórka;zakres;1) starszy: POZYCJA (liczba;zakres;1)+((ILE.LICZB(zakres)+1-POZYCJA(liczba;zakres;0)- POZYCJA(liczba;zakres;1))/2)
  23. 23. WSPÓŁCZYNNIK Ρ - SPEARMANA Osoby badane: 1. Wykształcenie zawodowe 2. Wykształcenie wyższe 3. Wykształcenie średnie 4. Wykształcenie gimnazjalne 5. Wykształcenie podstawowe 6. Wykształcenie wyższe 7. Wykształcenie zawodowe Kolejność: 1. Wykształcenie podstawowe 2. Wykształcenie gimnazjalne 3. Wykształcenie zawodowe 4. Wykształcenie zawodowe 5. Wykształcenie średnie 6. Wykształcenie wyższe 7. Wykształcenie wyższe Rangi: 1 2 3,5 3,5 5 6,5 6,5
  24. 24. INTERPRETACJA - PRÓBA Kierunek : oWartość dodatnia – zależność wprost proporcjonalna oWartość ujemna – zależność odwrotnie proporcjonalna Siła: o| rS | < 0,3 – zależność słaba, brak zależności o| rS | < 0,5 – zależność średnia o| rS | > 0,5 – zależność silna
  25. 25. INTERPRETACJA - POPULACJA  obliczamy t:  porównujemy do rozkładu t-Studenta dla n-2 stopni swobody (n – liczba osób badanych)
  26. 26. ĆWICZENIE  badamy zależność wyników testu fluecji słownej od różnych czynników: oZMIENNE ZALEŻNE: wynik zwierzęta (FS1), wynik przedmioty ostre (FS2); ogólny wynik – zmienna porządkowa (FS_całość); oZMIENNE NIEZALEŻNE: IQ, wykształcenie, płeć.  zbadaliśmy 30 osób;  zmienne dla których mogę obliczyć współczynnik korelacji Spearmana: o wynik zwierzęta (FS1), o wynik przedmioty ostre (FS2); o IQ o wykształcenie
  27. 27. NIEZALEŻNOŚĆ ZMIENNYCH χ2 (chi kwadrat) współczynnik Fi-Cramera
  28. 28. LOGIKA 29 WYSOKA BARWA GŁOSU NISKA BARWA GŁOSU SUMA KOBIETY ? ? 50 MĘŻCZYŹN I ? ? 50 SUMA 50 50 100
  29. 29. MATEMATYKA 
  30. 30. χ2 ISTOTNOŚĆ  Dla H0 o niezależności zmiennych: o H0 : w populacji nie zachodzi zależność miedzy dwoma obserwowanymi zmiennymi;  Odczytujemy z rozkładu chi: o df=(W-1)(K-1) (W – liczba kolumn; K-liczba wierszy) EXCEL: =CHI.TEST(tabela 1;tabela 2) => zwraca prawdopodobieństwo dla H0 aby uzyskać χ2: =ROZKŁAD.CHI.ODW(p;df)
  31. 31. χ2 MATEMATYKA  O – ang. observed (liczebność faktyczna)  E – ang. expected (liczebność oczekiwana)
  32. 32. LICZEBNOŚĆ OCZEKIWANA - MATEMATYKA w1 w2 w3 suma Z1 21*15/70 24*15/70 25*15/70 15 Z2 21*30/70 24*30/70 25*30/70 30 Z3 21*25/70 24*25/70 25*25/70 25 suma 21 24 25 70 EXCEL (z surowych danych): => tabela przestawna
  33. 33. INTERPRETACJA - PRÓBA  Siła związku: o V< 0,3 – słaby związek, brak związku; o V< 0,5 – umiarkowany związek o V> 0,5 – silny związek
  34. 34. ĆWICZENIE  badamy zależność wyników testu fluecji słownej od różnych czynników: oZMIENNE ZALEŻNE: wynik zwierzęta (FS1), wynik przedmioty ostre (FS2); ogólny wynik – zmienna porządkowa (FS_całość); oZMIENNE NIEZALEŻNE: IQ, wykształcenie, płeć.  zbadaliśmy 30 osób;  zmienne dla których mogę obliczyć współczynnik korelacji Pearsona: o wynik ogólny o płeć

×