Statistika II
Parametrinių hipotezių testai
• Studento testas dviejų populiacijų vidurkių
lyginimui:
    21
2121
2
22
2
11
)2(
11 nn
nnnn
snsn
yx
t






Treniruotė
• Leaves were collected from wax-leaf
ligustrum grown in shade and in full sun. The
thickness in micrometers of the palisade layer
was recorded for each type of leaf.
Thicknesses of 7 sun leaves were reported as:
150, 100, 210, 300, 200, 210, and 300,
respectively. Thicknesses of 7 shade leaves
were reported as 120, 125, 160, 130, 200, 170,
and 200, respectively.
Treniruotė
• The mean ± standard deviation for sun leaves
was 210 ± 73 micrometers and for shade
leaves it was158 ± 34 micrometers
Treniruotė
• the difference between means is 52
• t = 1.71
• 12 degrees of freedom
• critical value for p = 0.05 is 2.18
• 1.71 is less than 2.18, so we cannot reject the
null hypothesis that the two populations have
the same palisade layer thickness
Parametrinių hipotezių testai
• Kada nulinė hipotezė atmetama?
• t kritinė vienpusėms hipotezėms - tP
• t kritinė dvipusėms hipotezėms - t(1+P)/2
– kodėl?
p (pasikliovimo lygmens) prasmė
• Tai tikimybė, kad toks arba didesnis t atsirado
vien dėl atsitiktinumo, kai H0 galioja
• Iš kitos pusės: jei H0 galioja, tai p - tikimybė,
kad stebimas nuokrypis yra atsitiktinis, o ne
papildomų faktorių padarinys
p (pasikliovimo lygmens) prasmė
• Pateikiant duomenis galima:
– Pateikti testo įvertį (t), patikrinti jį norimame
lygmenyje p ir pranešti, ar išvada reikšminga,
ARBA
– Pateikti testo įvertį (t), suskaičiuoti, kokiame p
lygmenyje išvada būtų reikšminga
Priklausomybės testai
Įvykis A1,
tikimybė P1
P2 … Pi
Įvykis B1,
tikimybėQ1
Įvykis A1 ir B1,
tikimybė P1Q1
P2Q1 …PiQ1
Q2 P1Q2 P2Q2 …PiQ2
…Qi …P1Qi …P2Qi …PiQi
Esant nepriklausomam pasiskirstymui,
P(A∩B) = P(A) * P(B)
Priklausomybės testai (tęs.)
Įvykis A1,
P1=0,3
P2=0,3 … Pi
Įvykis B1,
tikimybė
Q1=0,3
Įvykis A1 ir B1,
tikimybė
P1Q1=0,25
P2Q1=0,01 …PiQ1
Q2=0,3 P1Q2=0,01 P2Q2=0,09 …PiQ2
…Qi …P1Qi …P2Qi …PiQi
Priklausomybės pavyzdys:
Kokios sąveikos čia
ir kitur?
Kai P(A∩B) < P(A) * P(B), galime įtarti antagonizmą (pvz., konkurencija), ir atvirkščiai
Chi2 priklausomybei patikrinti
• Iškeliame H0 – kintamieji pasiskirstę
nepriklausomai
• Skaičiuojame. Galioja bendroji chi2 formulė:
• Observed – stebimi dažniai. O iš kur gauti E?
Chi2 priklausomybei patikrinti
• H0 – kintamieji pasiskirstę nepriklausomai
• Tokiu atveju, E=P(Ai∩Bi)=?..
Chi2 priklausomybei patikrinti
• Pavyzdys:
Ligoniai,
gydyti nauju
vaistu
Ligoniai,
gydyti senu
vaistu
Sumos
Mirė 35 120 155
Pasveiko 25 50 75
Sumos
60 170 230
Chi2 priklausomybei patikrinti
• Užpildykite E:
(O)
Sumos
35 120 155
25 50 75
Sumos
60 170 230
Ligoniai,
gydyti
nauju
vaistu
Ligoniai,
gydyti senu
vaistu
Sumos
Mirė ? ? ?
Pasveiko ? ? ?
Sumos
? ? 1
Chi2 priklausomybei patikrinti
• Suskaičiuokite Chi2
Ligoniai,
gydyti
nauju
vaistu
Ligoniai,
gydyti senu
vaistu
Sumos
Mirė 40 115 0,674
Pasveiko 20 55,4 0,326
Sumos
0,261 0,739 1
Chi2 priklausomybei patikrinti
• Chi2 = 3,031
• Toliau reikia kritinės chi2 reikšmės, o tam – df
• df = (eilutės-1)*(stulpeliai-1)
Chi2 priklausomybei patikrinti
• Dėmesio: net ir šio testo negalima naudoti, jei
matuojami pokyčiai vienoje objektų aibėje!
– Pvz., tų pačių ligonių sveikata prieš ir po gydymo
• Tada naudojamas McNemar kriterijus
 
cb
1cb
2
2



Po
Prieš
+ -
+ a b
- c d
Chi2 priklausomybei patikrinti
• Kokie testai naudojami:
– Transmission disequilibrium populiacijoje?
– Transmission disequilibrium šeimoje?
r (koreliacijos koeficientas)
r2 (coefficient of determination)
• r2 parodo, kokia dalis skirstinio X variacijos
paaiškinama skirstinio Y variacija
Mažiausių kvadratų metodas
• Parodo, ar modelis gerai tinka aprašyti duomenims
• Dažniausiai naudojamas patikrinti, ar per taškus
nubrėžta tinkama tiesė
Mažiausių kvadratų metodas
• Įvertinkite savo (arba kolegų) vakarykščio
darbo kalibracinę tiesę mažiausių kvadratų
metodu

Statistika 2

  • 1.
  • 2.
    Parametrinių hipotezių testai •Studento testas dviejų populiacijų vidurkių lyginimui:     21 2121 2 22 2 11 )2( 11 nn nnnn snsn yx t      
  • 3.
    Treniruotė • Leaves werecollected from wax-leaf ligustrum grown in shade and in full sun. The thickness in micrometers of the palisade layer was recorded for each type of leaf. Thicknesses of 7 sun leaves were reported as: 150, 100, 210, 300, 200, 210, and 300, respectively. Thicknesses of 7 shade leaves were reported as 120, 125, 160, 130, 200, 170, and 200, respectively.
  • 4.
    Treniruotė • The mean± standard deviation for sun leaves was 210 ± 73 micrometers and for shade leaves it was158 ± 34 micrometers
  • 6.
    Treniruotė • the differencebetween means is 52 • t = 1.71 • 12 degrees of freedom • critical value for p = 0.05 is 2.18 • 1.71 is less than 2.18, so we cannot reject the null hypothesis that the two populations have the same palisade layer thickness
  • 7.
    Parametrinių hipotezių testai •Kada nulinė hipotezė atmetama? • t kritinė vienpusėms hipotezėms - tP • t kritinė dvipusėms hipotezėms - t(1+P)/2 – kodėl?
  • 8.
    p (pasikliovimo lygmens)prasmė • Tai tikimybė, kad toks arba didesnis t atsirado vien dėl atsitiktinumo, kai H0 galioja • Iš kitos pusės: jei H0 galioja, tai p - tikimybė, kad stebimas nuokrypis yra atsitiktinis, o ne papildomų faktorių padarinys
  • 9.
    p (pasikliovimo lygmens)prasmė • Pateikiant duomenis galima: – Pateikti testo įvertį (t), patikrinti jį norimame lygmenyje p ir pranešti, ar išvada reikšminga, ARBA – Pateikti testo įvertį (t), suskaičiuoti, kokiame p lygmenyje išvada būtų reikšminga
  • 10.
    Priklausomybės testai Įvykis A1, tikimybėP1 P2 … Pi Įvykis B1, tikimybėQ1 Įvykis A1 ir B1, tikimybė P1Q1 P2Q1 …PiQ1 Q2 P1Q2 P2Q2 …PiQ2 …Qi …P1Qi …P2Qi …PiQi Esant nepriklausomam pasiskirstymui, P(A∩B) = P(A) * P(B)
  • 11.
    Priklausomybės testai (tęs.) ĮvykisA1, P1=0,3 P2=0,3 … Pi Įvykis B1, tikimybė Q1=0,3 Įvykis A1 ir B1, tikimybė P1Q1=0,25 P2Q1=0,01 …PiQ1 Q2=0,3 P1Q2=0,01 P2Q2=0,09 …PiQ2 …Qi …P1Qi …P2Qi …PiQi Priklausomybės pavyzdys: Kokios sąveikos čia ir kitur? Kai P(A∩B) < P(A) * P(B), galime įtarti antagonizmą (pvz., konkurencija), ir atvirkščiai
  • 12.
    Chi2 priklausomybei patikrinti •Iškeliame H0 – kintamieji pasiskirstę nepriklausomai • Skaičiuojame. Galioja bendroji chi2 formulė: • Observed – stebimi dažniai. O iš kur gauti E?
  • 13.
    Chi2 priklausomybei patikrinti •H0 – kintamieji pasiskirstę nepriklausomai • Tokiu atveju, E=P(Ai∩Bi)=?..
  • 14.
    Chi2 priklausomybei patikrinti •Pavyzdys: Ligoniai, gydyti nauju vaistu Ligoniai, gydyti senu vaistu Sumos Mirė 35 120 155 Pasveiko 25 50 75 Sumos 60 170 230
  • 15.
    Chi2 priklausomybei patikrinti •Užpildykite E: (O) Sumos 35 120 155 25 50 75 Sumos 60 170 230 Ligoniai, gydyti nauju vaistu Ligoniai, gydyti senu vaistu Sumos Mirė ? ? ? Pasveiko ? ? ? Sumos ? ? 1
  • 16.
    Chi2 priklausomybei patikrinti •Suskaičiuokite Chi2 Ligoniai, gydyti nauju vaistu Ligoniai, gydyti senu vaistu Sumos Mirė 40 115 0,674 Pasveiko 20 55,4 0,326 Sumos 0,261 0,739 1
  • 17.
    Chi2 priklausomybei patikrinti •Chi2 = 3,031 • Toliau reikia kritinės chi2 reikšmės, o tam – df • df = (eilutės-1)*(stulpeliai-1)
  • 18.
    Chi2 priklausomybei patikrinti •Dėmesio: net ir šio testo negalima naudoti, jei matuojami pokyčiai vienoje objektų aibėje! – Pvz., tų pačių ligonių sveikata prieš ir po gydymo • Tada naudojamas McNemar kriterijus   cb 1cb 2 2    Po Prieš + - + a b - c d
  • 19.
    Chi2 priklausomybei patikrinti •Kokie testai naudojami: – Transmission disequilibrium populiacijoje? – Transmission disequilibrium šeimoje?
  • 21.
  • 22.
    r2 (coefficient ofdetermination) • r2 parodo, kokia dalis skirstinio X variacijos paaiškinama skirstinio Y variacija
  • 23.
    Mažiausių kvadratų metodas •Parodo, ar modelis gerai tinka aprašyti duomenims • Dažniausiai naudojamas patikrinti, ar per taškus nubrėžta tinkama tiesė
  • 24.
    Mažiausių kvadratų metodas •Įvertinkite savo (arba kolegų) vakarykščio darbo kalibracinę tiesę mažiausių kvadratų metodu