Ch01 032. 2
Эдийн засагчид юу судалдаг вэ?
• Ангийн хэмжээг багасгах нь сурагчдын сурлагын
амжилтад ямар тоон н л з лэх вэө өө ү үү ?
• Боловсролд зарцуулсан хугацаа нь орлогод н л лд гө өө ө
үү?
• Тамхины нийн мэдрэмж ямар байх вэү ?
• Холбооны Н цийн Системөө х ний т вшинг 1 хувиарүү ү
сг в л эдийн засгийн с лт д ямар н л з лэхө ө ө ө ө ө ө өө ү үү
вэ?
• Орчныг сайжруулах нь байшингийн нэд ямар н лү ө өө
з лэх вэү үү ?
3. 3
Бид эдгээр асуултад хэрхэн
хариулах вэ?
• Бид ихэвчлэн туршилт хийхийг х сдэгү
• Ангийн хэмжээ шалгалтын оноонд н л л х нө өө ө өл гөө
тооцохын тулд ямар туршилт хийх вэ?
• Гэвч бид бараг ихэвчлэн ажиглалтын (туршилтын бус)
г гд л ашигладагө ө ө .
• Боловсролын г жө өө
• Тамхины нэү
• М нг нийө ө бодлого
• Ихэнх судалгаанд шалтгаант н л г нэлэхэд ажиглалтынө өө ү
г гд л ашиглах нь х ндрэлө ө ө ү д х ргэдэгү :
• Орхигдсон хувьсагчид
• Нэгэн зэрэг шалтгаантай байх
• “хамаарал нь учир шалтгааныг илэрхийлдэгг йү ”
4. 4
Магадлал статистикийн тойм
Эмпирик асуудал: Ангийн хэмжээ ба боловсролын рү
д нү
• Бодлогын асуулт: Нэг ангид сурагчийн тоог багасгах
замаар ангийн хэмжээг бууруулах нь шалгалтын
оноонд ямар н л з лэх вэө өө ү үү (эсвэл зарим бусад рү
д нгийн хэмжигдэх ндү үү )?
• нд хариулахын тулд г гд л ашиглах хэрэгтэйҮү ө ө ө
( г гд лг йгээр хариулах боломж байгаа юуө ө ө ү ?)
5. 5
Калифорни мужийн шалгалтын
онооны г гд лө ө ө
Калифорни мужийн б хү K-6, K-8 сургуулийн д рэгүү
(n = 420)
Хувьсагчид:
• 5-р ангийн шалгалтын оноо (Станфорд-9 тест,
математик унших хосолсон), д ргийн дунджаарүү
• Сурагч-багшийн харьцаа (СБХ) = д ргийнүү
сурагчдын тоог б тэн цагийн ижил багш нарынү
тоонд хуваана
6. 6
г гдлийг анх харахадӨ ө :
(Та энэ х снэгтийг хэрхэн тайлбарлахыг мэдэж байх ёстойү )
• Энэ х снэгт бидэнд шалгалтын оноо болонү
сурагч багшийн харьцаа хоорондын
хамаарлын талаар юу ч хэлэхг й.ү
7. 7
Жижиг ангиудтай д рг д шалгалтын нд рүү үү ө ө
оноотой байдаг уу?
Шалгалтын оноо ба сурагч багшийн харьцааны
Scatterplot
Энэ зураг юуг харуулж байна вэ?
8. 8
Бид энэ асуултанд г гд лтэй болө ө ө
хэрхэн хариулах вэ?
1. Сурагч багшийн харьцаа багатай д рг дийнүү үү
шалгалтын дундаж оноог уг харьцаа нд рө ө
д рг дтэй харьцуулахүү үү (“ нэлэхү ”)
2. Хоёр т рлийн д рг дийн шалгалтын дундаж оноо ньө үү үү
ижил гэсэн “тэг” таамаглал, ялгаатай гэсэн
“альтернатив” таамаглалын эсрэг шалгая
(“таамаглал шалгах”)
3. Сурагч багшийн харьцаа өнд р ба багаө тай д рг дийнүү үү
шалгалтын дундаж оноог интервалаар нэлэхү (“итгэх
завсар”)
9. 9
Compare districts with “small” (STR < 20)
and “large” (STR ≥ 20) class sizes
1. Estimation of ∆ = difference between group
means
2. Test the hypothesis that ∆ = 0
3. Construct a confidence interval for ∆
Y
Class Size Average score
( )
Standard
deviation (sY
)
n
Small 657.4 19.4 238
Large 650.0 17.9 182
10. 10
1. нэлгээҮ
= –
= 657.4 – 650.0
= 7.4
Бодит ерт нцийн утга нь их ялгаатай юуө ? Энэ ялгаа нь
эцэг эхч д болон сургуулийн хорооны хувьдүү
сургуулийн шинэчлэлийн хэлэлц лэгт чухал ууүү ?
12. 12
Дунджийн ялгааг тооцох t-статистик:
Size sY n
small 657.4 19.4 238
large 650.0 17.9 182
= 4.05
|t| > 1.96 бол дунджууд ижил гэсэн тэг таамаглал 5% ач
холбогдлын т вшинд няцаагданаү .
13. 13
3. Итгэх завсар
Дунджийн ялгааны 95%-итгэх завсар нь
( – ) ± Критик утга*SE( – )
= 7.4 ± 1.96*1.83 = (3.8, 11.0)
Хоёр ижил ойлголт:
1. Ялгааны 95%-ийн итгэх завсарт 0 орохг йү ;
2. Ялгаа ∆ = 0 гэсэн тэг таамаглал 5%-ийн т вшиндү
няцаагдана.
14. 14
Статистикийн онолын тойм
1. Статистик д гнэлт хийх магадлалын ндэсү ү
2. нэлгээҮ
3. Таамаглал шалгах
4. Итгэх завсар
Статистик д гнэлт хийх магадлалын ндэсү ү
(a) Эх олонлог, санамсарг й хувьсагчү , ба тархалт
(b) Тархалтын шинж чанар (дундаж, дисперс, стандарт
хазайлт, ковариац, корреляци)
(c) Н хц лө ө т тархалт ба н хц л дундажө ө
(d) Эх олонлогоос санамсарг йгээр авсан т врийнү үү
тархалт: Y1,…, Yn
15. 15
(a) Эх олонлог, санамсарг йү
хувьсагч, ба тархалт
Эх олонлог
• Сонирхсон б х боломжит нэгж дийн б лэгү үү ү
(сургуулийн д рг дүү үү )
• Бид эх олонлогийг хязгаарг й их гэж знэү ү (∞ нь
ойролцоогоор “маш их”)
Санамсарг й хувьсагчү Y
• Санамсарг й хувьсагчийн тоон р д нү ү ү (д ргийнүү
шалгалтын дундаж оноо, д ргийн СБХүү )
16. 16
Y –ийн эх олонлогийн тархалт
• Y –ийн янз б рийн утгуудын эх олонлогоос олдохү
магадлал, жишээ нь Pr[Y = 650] (Y дискрет бол)
• Эсвэл: Эдгээр утгуудын олонлогийн магадлал, жишээ
нь.
Pr[640 ≤ Y ≤ 660] (Y тасралтг йү бол).
17. (b) Эх олонлогийн тархалтын шинж чанар
17
дундаж = Y-ийн х лээгдэж бү уй утга
= E(Y)
= µY
дисперс = E(Y – µY)2
=
= тархалтын квадрат хазайлт
Стандарт хазайлт = = σY
18. Зоосыг хоёр удаа хаяхад с лдү
буух зэгдэлү
• E(Y) = 0*(0.25) + 1*(0.50) + 2*(0.25)
= 0 + 0.50 + 0.50 = 1
• var(Y) = (0.25)*(0 - 1)² + (0.50)*(1 – 1)² +
(0.25)*(2 – 1)²
= 0.25 + 0 + 0.25 = .50
• stdev(Y) = √.50 = 0.7071
18
19. 19
skewness =
= тархалтын ассиметрийн хэмжигдэх нүү
• skewness = 0: тархалт тэгш хэмтэй
• skewness > (<) 0: тархалт урт баруун (з нүү ) с лтэйүү
kurtosis =
= с лний массын хэмжигдэх нүү үү
• kurtosis = 3: нормал тархалттай
• kurtosis > 3: х нү д с лтэйүү (“leptokurtic”)
21. 21
2 санамсарг й хувьсагчү : хамтын
тархалт ба ковариац
• Санамсарг й хувьсагчү X ба Y хамтын тархалттай
• X ба Y хоорондын ковариац
cov(X,Y) = E[(X – µX)(Y – µY)] = σXY
• Ковариац нь X ба Y хоорондын шугаман хамаарлын
хэмжигдэх нүү
• cov(X,Y) > 0 нь X ба Y эерэг хамааралтайг илэрхийлнэ
• cov(X,Y) < 0 нь X ба Y с р г хамааралтайг илэрхийлнэө ө
• Хэрэв X ба Y нь хамааралг й тархсанү бол cov(X,Y) = 0
• Санамсарг й хувьсагчийн ртэйгээ сгэсэн ковариацү өө үү
нь түүний дисперс байна:
cov(X,X) = E[(X – µX)(X – µX)] = E[(X – µX)2] =
22. Хамтын магадлал
• Жишээ: Бороо орох болон зорчих цаг
хоорондын хамаарал
Pr(X=x, Y=y) нь хамтын магадлал ба энд
X = 0 хэрэв бороо орвол
= 1 бусад едү
Y = 1 зорчих цаг богино бол (<20 минут)
= 0 зорчих цаг урт бол (>= 20 минут)
Эерэг эсвэл с р г хамааралө ө ?
22
23. Н хц лт магадлалө ө
•Н хц лт магадлалө ө нь хамааралтай р нэгөө
зэгдэл явагдахад тухайн зэгдэл явагдахү ү
магадлалыг тодорхойлоход ашиглагддаг.
•Н хц лт магадлал ньө ө P(X | Y) гэж бичигддэг.
Y явагдахад Х явагдах магадлал гэж унших ба
дараах байдлаар тооцно:
23
Pr( , )
Pr( | )
Pr( )
X x Y y
X x Y y
Y y
= =
= = =
=
24. Хамтын л хамаарах чанарү
• X ба Y санамсарг й хэмжигдэх н д б х Х баү үү үү ү Y-ийн
хувьд хамааралг й тархсан болү
Pr(X = x,Y = y) = Pr(X = x)*Pr(Y = y)
эсвэл
Pr(Y = y | X = x) = Pr(Y = y)
1. Бороо орох болон
зорчих цагийн жишээн
дээр авч звэлү ?
2. Pr (X = 1, Y=1) = ?
3. E (X | Y=1) = ?
4. Pr (X=0 | Y=0) = ?
24
25. 25
Корреляцийн коэффициент нь
ковариацаар тодорхойлогдоно:
corr(X,Y) = = rXY
• –1 ≤ corr(X,Y) ≤ 1
• corr(X,Y) = 1 →т гс эерэг шугаман хамааралө
• corr(X,Y) = –1 →т гс с р г шугаман хамааралө ө ө
• corr(X,Y) = 0 →шугаман хамаарал байхг йү
27. 27
(c) Н хц лт тархалт ба н хц лтө ө ө ө
дундаж
Н хц лт тархалтө ө
• Х санамсарг й хэмжигдэх н г гдс н едү үү ө ө ө ү Y-ийн
тархалт
• Жишээ: СБХ< 20 г гдс н ед шалгалтын онооныө ө ө ү
тархалт
Н хц лт дундаж ба н хц лт моментө ө ө ө
• Н хц лтө ө дундаж = н хц лт тархалтын дундажө ө
= E(Y|X = x)
• Н хц лтө ө дисперс = н хц лт тархалтын дисперсө ө
• Жишээ: E(Шалгалтын оноо|СБХ < 20) = жижиг
ангиудтай д рг дийн шалгалтын онооны дундажүү үү
28. 28
Н хц лт дундажө ө , ргэлжлэлү
Дунджийн ялгаа нь хоёр н хц лт тархалтынө ө
дунджийн ялгаа:
∆ = E(Test scores|STR < 20) – E(Test scores|STR ≥ 20)
Н хц лт дунджийн бусад жишээө ө :
• Б х эмэгтэй ажилчдын цалинү (Y = цалин, X = х йсү )
• Туршилтын эмчилгээний г гдс н утганд насө ө ө
баралтын т вшинү (Y = амьдрах/ хэхү ; X =
эмчлэгдсэн/эмчлэгдээг йү )
• Хэрэв E(X|Z) = тогтмол бол corr(X,Z) = 0 (яагаад?)
Н хц лт дундаж нь ерд л б лгийн дундаж юмө ө өө ү .
29. 29
(d) Эх олонлогоос санамсарг й авсанү
т врийн тархалтүү : Y1,…, Yn
Бид энгийн санамсарг й т вэрлэлт хийнэү үү
• Эх олонлогоос санамсарг йгээр нэгжийг сонгоноү
Тэмдэглэгээ
• г гдлийн олонлогӨ ө (Y1, Y2,…, Yn), ба Yi = Y-ийн i-р бие
даасан т вэрлэсэнүү утга
30. 30
Энгийн санамсарг й т врийнү үү
дагуу Y1,…, Yn –ийн тархалт
• #1 ба #2 бие даасан утга санамсарг й сонгогдсон тулү
Y1 –ийн утга Y2-ийн талаар юу ч хэлэхг й.ү Иймд:
• Y1 ба Y2 нь хамааралг й тархсанү
• Y1 ба Y2 ижил тархалттай байвал Y1, Y2 нь адил
тархалттай гэнэ
→ Энгийн санамсарг й т врийн дагууү үү , {Yi}, i = 1,…, n,
нь хамааралг й, адил тархалттай байнаү (i.i.d.).
Бид эх олонлогоос авсан т вэр г гдлийг ашигланүү ө ө эх
олонлогийн шинж дийн тухай статистик д гнэлтүү ү
хийхийг х сдэг.ү
31. 31
1. Магадлалын ндэсү
2. нэлгээҮ
3. Таамаглал шалгах
4. Итгэх завсар
нэлгээҮ
, т врийн дундаж нь эх олонлогийн дунджийнүү
нэлэлтү .
(a) ямар шинж чанартай вэ?
(b)Яагаад бид бусад нэлэлтээс илү үү -ийг ашигладаг
вэ?
• Y1 (эхний ажиглалтын нэгж)
• Тэгш бус жинтэй – энгийн дундаж биш
• Медиан (Y1,…, Yn)
-ийн т врийн тархүү алтад хариу нь оршино.
32. 32
(a) -ийн т врийн тархалтүүY
санамсарг й хувьсагч ба т ний шинж чанаруудү үү -ийн
т врийн тархалтаар тодорхойлогдоноүү
• Т врийн нэгж д санамсарг й сонгогдоно.үү үү ү
• (Y1,…, Yn)-ийн утгууд санамсарг йү .
• зэрэг (Y1,…, Yn)-ийн функц нь санамсарг йү : р рөө өө
тү вр д нь р р утга авнаү үү өө өө .
• р р т врээс олсонӨө өө үү -ийн тархалтыг -ийн
т врийн тархалт гэдэгүү .
• Т вэрүү тархалтын дундаж болон дисперс нь E( )
болон var( ).
33. 33
-ийн т врийн тархалтүүY
Жишээ: Магадлалын тархалт б хий Yү нь 0 эсвэл 1
(Бернулийн санамсарг й хувьсагчү ) утга авдаг гэж
таамаглая,
Pr(Y = 0) = .22, Pr(Y =1) = .78
ба
µY = E(Y) = p×1 + (1 – p)×0 = p = .78
= E[Y – E(Y)]2
= p(1 – p)
= .78×(1–.78) = 0.1716
-ийн т врийн тархалтүү n-ээс хамаарна.
n = 2 гэе. -ийн т врийн тархалтүү ,
Pr( = 0) = .222 = .0484
Pr( = ½) = 2×.22×.78 = .3432
Pr( = 1) = .782 = .6084
35. 35
Т врийн тархалтын талаарүү
бидний мэдэхийг х сч байгааү
з йлсү :
• -ийн дундаж ямар байх вэ?
• Хэрэв E( ) = µ = .78, ба нь µ-ийн хазайлтг йү
нэлэлт болү
• -ийн дисперс ямар байх вэ?
• var( ) нь n-ээс хэрхэн хамаарах вэ?
• нь n их едү µ-д ил д хнүү ө ө?
• Их тооны хууль: нь µ-ийн тогтмол нэлэлтү
• – µ нь n их ед хонх хэлбэртэй харагддагү …энэ нь
нэндээ нэнү ү үү?
• нэндээҮ – µ нь n их ед бараг нормальү
тархалттай болдог (Т вийн хязгаарын теоремө )
36. 36
-ийн т врийн тархалтынүү
дундаж ба дисперс
Y
Ер нхий тохиолдолдө – з вх н Бернул ч биш ямар нэгө ө
тархалтын Yi нь л хамаарах, ижил тархалттай байнаү :
Дундаж: E( ) = E( ) = = = µY
Дисперс: var( ) = E[ – E( )]2
= E[ – µY]2
= E
= E
38. 38
-ийн т врийн тархалтынүү
дундаж ба дисперс, ргэлжлэл.ү
E( ) = µY
var( ) =
р дагаварҮ :
1. нь µY (E( ) = µY)-ийн хазайлтг й нэлэлтү ү
2. var( ) нь n-тэй с р г хамааралтайө ө
• Т вэр ньүү -тай тодорхойг й хамааралтай баү
1/ -тэй пропорциональ
• Лейманы ухагдахуунаар: Их т вэр ньүү
тодорхойг й байдлыг бууруулдагү
Y
39. 39
n их ед -ийн т врийн тархалтү үүY
Т врийн хэмжээтэй холбоотой хоёр чухал д рэмүү ү :
1. n с х дө ө ө -ийн тархалт µY-ийн эргэн тойронд илүү
нягт т вл рд гө ө ө
Их тооны хууль
2. n с х дө ө ө – µ-ийн тархалт нормал тархалтай болдог
Т вийн хязгаарын теоремө
40. 40
Их тооны хууль:
Хэрэв т врийн хэмжээ с х д эх олонлогийн бодитүү ө ө ө
утгын интервал дотор байх магадлал нэг рүү
тэм лдэг бол нэлэлт ньүү ү нийцтэй байна.
Хэрэв (Y1,…,Yn) нь л хамааран ижил тархалттай болү
нь µY –ийн тогтмол нэлэлт болноү ,
n → ∞ едү Pr[| – µY| < ε] → 1
µY гэж бичнэ
(“ µY” нь “ нь µY –ийн магадлал руу нийлнэ”
гэсэн гү ).
(математикт: n → ∞ едү , var( ) = → 0.)
41. 41
Т вийн хязгаарын теоремө (CLT):
Хэрэв (Y1,…,Yn) нь л хамаарах, ижил тархалттай болү n
их едү -ийн тархалт бараг нормаль тархалттай
болно.
• нь N(µY, ) тархалттай байна (“µY дундажтай /n
дисперстэй нормаль тархалттай байна”)
• “стандартчилагдсан” = = нь
N(0,1) (стандарт нормаль) тархалттай байна.
• n их байх тусам ил ойролцоо болдогүү .
44. 44
р д нҮ ү : -ийн т вэр тархалтүүY
Үл хамаарах, ижил тархалттай Y1,…,Yn –ийн хувьд.,
• -ийн т вүү эр тархалт нь µY дундажтай (“ нь µY-ийн
хазайлтг й нэлэлтү ү ”) /n дисперстэй байна
• n их ед т врийн тархалтыг хялбарчилбалү үү :
• µY (Их тооны хууль)
• нь ойролцоогоор N(0,1) (CLT)
45. 45
(b) Яагаад µY –ийг нэлэхэдү
-ийг ашигладаг вэ?
Y
• нь хазайлтг йү : E( ) = µY
• нь нийцтэй: µY
• нь Best Linear Unbiased Estimator (BLUE)
o нэлэлт д дундаас хамгийн сайн нэлэлт ньҮ үү ү
Y1, …, Yn-ийн хазайлтг йү , шугаман функц байна
o нь хамгийн бага квадрат нэлэлт юмү
46. 46
1. Магадлалын ндэсү
2. нэлгээҮ
3. Таамаглал шалгах
4. Итгэх интервал
Таамаглал шалгах
Жишээ нь, ангийн хэмжээний жишээний хувьд: “жижиг”
ба “том” СБХ-ны хоорондын рчл лт нь шалгалтадөө ө
н л л хг й гэсэн таамаглалө өө ө ү (тэг таамаглал)
Таамаглал шалгах хэлбэр дүү
H0: E(Y) = µY,0 ба H1: E(Y) > µY,0 (1-талт, >)
H0: E(Y) = µY,0 ба H1: E(Y) < µY,0 (1-талт, <)
H0: E(Y) = µY,0 ба H1: E(Y) ≠µY,0 (2-талт)
47. • Test statistic = t-statistic:
• Ач холбогдлын т вшинү : I т рлийн алдаа гарахө
магадлал
• Ач холбогдлын т вшинү = α
• Критик утга: г гдс н ач холбогдлын т вшиндӨ ө ө ү
тэг таамаглалыг няцаах t статистикийн утга
Таамаглал шалгах хэл
47
48. Таамаглал шалгах хэл,
ргэлжлэлү .
• p-утга
• Тэг таамаглал нэн гэж звэл г гдл с тооцожү ү ө ө өө
олсон утга итгэх завсрын гадна утгаа авах
магадлал
• Тэг таамаглалыг няцааж чадах хамгийн бага ач
холбогдлын т вшинү
|Ажиглалтын утга| > |критик утга| → тэг таамаглал
няцаагдана
|Ажиглалтын утга| < |критик утга| → тэг
таамаглалыг няцааж чадахг йү
48
49. 49
σY мэдэгдэж байхад p-утгыг тооцох:
•n их едү p-утга = the probability that a N(0,1)
санамсарг й хэмжигдэх нү үү |( – µY,0)/ | завсараас
гадна утгаа авах магадлал
• мэдэгдэж байвал z статистик ашиглана:
z = .
• ихэнхдээ мэдэгддэгг й тулү – энэ нь t-статистик
ашиглан тооцогдоно.
50. 50
Y-ийн дисперсийн нэлэлтү :
= = “Y-ийн т врийн дисперсүү ”
р д нҮ ү :
Хэрэв (Y1,…,Yn) нь л хамаарах, жигд тархалттай болү
Тооцогдсон ашиглан p-утгыг тооцох нь:
t =
51. 51
p-утга ба ач холбогдлын т вшинийү
хооронд ямар холбоо бий вэ?
Ач холбогдлын т вшин эхлээд тодорхойлогддогү . Жишээ
нь, хэрэв ач холбогдлын т вшинү 5% бол,
• |t| ≥ 1.96 ед тэг таамаглал няцаагданаү .
• М н адилө p ≤ 0.05 бол тэг таамаглал няцаагдана.
• Энэ нь тест няцаагдсан эсэхээс илүү мэдээллийг p-
утга агуулдаг
52. Нийтлэг критик утгууд
Нэг талт тест Хоёр талт тест
1-α α Критик
утга
1-α α/2 Критик
утга
0.90 0.10 1.282 0.90 0.05 1.645
0.95 0.05 1.645 0.95 0.025 1.960
0.99 0.01 2.326 0.99 0.005 2.576
52
53. 53
1. Магадлалын ндэсү
2. нэлгээҮ
3. Таамаглал шалгах
4. Итгэх завсар
Итгэх завсар
µY –ийн 95% итгэх завсар гэдэг нь µY –ийн бодит утгын
95%-ийг агуулах интервал.
Итгэх завсрын тухай чухал з йл гэвэлү : Энд юу
санамсарг й вэү ? Y1,…,Yn утгууд ба итгэх завсрыг оруулаад
тэдгээрийн ямар ч цункц. Итгэх завсар р р т вэртөө өө үү
ялгаатай байдаг. Эх олонлогийн µY санамсарг й бишү ; бид
з гээр л нийг мэдэхг й байгааү үү ү .