Files2. 2
ёндсэн агуулга
Хамаарлыг судлах
Корреляцийн коэффициент буюу хамаарлын хђчийг
хэмжих тухай
Энгийн шугаман регрессийн загвар
Энгийн шугаман регрессийн загварийг тооцох
Регрессийн шинжилгээний ђлдэгдэлийн шинжилгээ,
тђђний ђндсэн хэлбэрђђд
Регрессийн шинжилгээ хийхээс өмнө тавигддаг
урьдач нөхцөлийн талаарх ойлголт
Детерминацийн коэффициент болон ђл хамааралт
хувьсагчийн хамааралт байх нөхцөл
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
3. 3
ёндсэн агуулга
Регрессийн коэффициентын итгэх интервал тооцох ба
тайлбарлах
Дурбин-Ватсоны статистик ашиглан автокорреляци
шалгах
Корреляцийн коэффициентийг ђнэлэх
Регрессийн итгэх интервал
Дундажийн интгэх интерал
Бодит (хувийн) таамгаласан итгэх интервал
(continued)
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
4. Статистик хамаарал
Хамаарлыг судлах
Хамаарлын хђч, нягтралыг судлах
(Корреляцийн шинжилгээ)
Хамаарлын хэлбэр чиглэлийг тодорхойлох
(Регрессийн шинжилгээ)
Судлагдаж буй ђзђђлэлтђђдийн хооронд хамаарал
буй эсхийг илрђђлэх
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС 4
6. 6
Корреляцийн Коэффициент
(Coefficient of Correlation)
Хоѐр тоон ђзђђлэлтийн шугаман хамааралын
зэргийг тодорхойлдог.
Корреляцийн коэффициент:
YX
n
1i
2
i
n
1i
2
i
n
1i
ii
SS
)Y,X(cov
)YY()XX(
)YY)(XX(
r
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
7. 7
Корреляцийн Коэффициент, r
Корреляцийн коэффициент –1 : 1 хооронд утга авна
Корреляцийн коэффициентийн утга –1 рђђ ойртох
тусам хђчтэй урвуу шугаман хамааралтай
Корреляцийн коэффициентийн утга 1 рђђ ойртох
тусам хђчтэй шууд шугаман хамааралтай
Корреляцийн коэффициентийн утга 0 рђђ ойртох
тусам сул шугаман хамааралтай
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
8. 8
Цэгэн дђрслэл (Scatter Plots)
Y
X
Y
X
Y
X
Y
X
Y
X
r = -1 r = -.6 r = 0
r = +.3r = +1
Y
X
r = 0
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
9. 9
Регрессийн Шинжилгээ
(Regression Analysis)
Регрессийн шинжилгээ нь:
õî¸ð ¿ç¿¿ëýëòèéí õîîðîíäûí ñòàòèñòèê õàìààðëûí
õýëáýðèéã òîãòîîх
ñîíãîæ àâñàí íýã ¿ç¿¿ëýëòèéí óòãààñ íºãºº
¿ç¿¿ëýëòèéí íºõöºëò äóíäàæ óòãà õýðõýí õàìààð÷
áàéãààã èëýðõèéëýх
Хамааран хувьсагч (Dependent variable): гол
тайлбарлуулагч ђзђђлэлт
ёл хамааран хувьсагч (Independent variable): хамааран
хувьсагчийг тайлбарлагч ђзђђлэлт
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
11. 11
Энгийн шугаман регрессийн
загвар (Simple Linear Regression Model)
Нэг эх олонлогоос сонгогдсон хоѐр ђзђђлэлтийн
хоорондын шугаман хамааралыг тодорхойлж,
прогноз, төлөвлөлт, бодлого боловсруулахад
хэрхэн ашиглах
Энгийн Шугам Регрессийн загвар:
Зөвхөн нэг ђл хамааран хувьсагч , X
X ба Y -ийн хоорондын шугаман функцийг
тодорхойлох
X –ийн өөрчлөлтөөр Y-ийн өөрчлөлтийг
тайлбарлах
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
12. 12
Хамааралын Төрөл (Types of
Relationships)
Y
X
Y
X
Y
Y
X
X
Шугаман хамаарал Муруй шугаман хамаарал
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
13. 13
Хамаарлыг хђчээр нь ангилах
Y
X
Y
X
Y
Y
X
X
Хђчтэй хамаарал Сул хамаарал
(continued)
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
14. 14
Хамаарлыг хђчээр нь ангилах
(continued)
Y
X
Y
X
Хамааралгђй
Статистик хамаарал: Сонгож
авсан нэг ђзђђлэлтийн утгаас
нөгөө ђзђђлэлтийн нөхцөлт
дундаж утга хэрхэн хамаарч
байгааг илэрхийлнэ
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
15. 15
ii10i εXββY
Шугаман
Энгийн Шугаман Регрессийн
загвар (Simple Linear Regression Model)
Эх олонлогийн регрессийн загвар:
Эх олонлогын
Y тогтмол утга
Эх
олонлогын
мэдрэмж
Санамсаргђй
алдаа
Хамааран
хувьсагч
ёл хамааран
хувьсагч
Санамсаргђй алдаа
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
Бђрэлдэхђђн:
16. 16
(continued)
ёлдэгдэл буюу
алдаа
Y
X
Y ба Xi
харгалзах бодит
утга
Y ба Xi –ийн
шугаман дээрх
утга (Predicted
Value)
ii10i εXββY
Xi
Slope = β1
Тогтмол
(Intercept) = β0
εi
Энгийн Шугаман Регрессийн
загвар (Simple Linear Regression Model)
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
17. 17
i10i XbbYˆ
Эх олонлогын шугаман регрессийн ђнэлсэн
энгийн шугаман регрессийн тэгшитгэл
Энгийн Шугаман Регрессийн
Тэгшитгэл (Simple Linear Regression Equation)
Регрессийн
ђнэлэгдсэн
тогтмол утга
Регрессийн
ђнэлэгдсэн мэдрэмж
i ажиглалтын
ђнэлэгдсэн Y
утга
i ажиглалтын
X утга
ёлдэгдэл буюу алдааны ei дундаж утга нь “тэг”-тэй
тэнцђђ
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
18. 18
Хамгийн Бага Квадратын
арга (Least Squares Method)
ёлдэгдэл буюу алдааны квадратыг хамгийн
бага байлгах:
Параметрђђдийн хувьд минимизацийн
бодлого бодож, тэдгээрийг олох системийг
тодорхойлбол:
2
i10i
2
ii ))Xb(b(Ymin)Yˆ(Ymin
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
19. Хамгийн Бага Квадратын
арга (Least Squares Method)
Параметрђђдийн хувьд минимизацийн
бодлого бодож, тэдгээрийг олох системийг
тодорхойлбол:
Системээс параметрђђдийн ђнэлнэ.
19
0
0
1
10
1
10
n
i
iii
n
i
ii
XbbYX
XbbY
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
20. 20
Энгийн Шугаман Регрессийн
Жишээ
Байрны ђнэд талбайн хэмжээнээс хэрхэн
хамаардаг байдлыг судлах зорилгоор судалгаа
хийв
Санамсаргђй тђђвэрлэлтээр 10 байр сонгосон
Хамааран хувьсагч (Y) = байрны ђнэ $1000
ёл хамааран хувьсагч (X) = талбайн хэмжээ
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
21. 21
Байрны ђнэ талбайн хэмжээ
Байрны үнэ $1000
(Y)
Талбайн хэмжээ
(X)
245 1400
312 1600
279 1700
308 1875
199 1100
219 1550
405 2350
324 2450
319 1425
255 1700
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
23. Excel программ ашиглан Регрессийн
шинжилгээ хийх (Regression Using Excel)
Data / Data Analysis / Regression
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
24. 24
ёр дђн (Excel Output)
Regression Statistics
Multiple R 0.76211
R Square 0.58082
Adjusted R Square 0.52842
Standard Error 41.33032
Observations 10
ANOVA
df SS MS F Significance F
Regression 1 18934.9348 18934.9348 11.0848 0.01039
Residual 8 13665.5652 1708.1957
Total 9 32600.5000
Coefficients Standard Error t Stat P-value Lower 95% Upper 95%
Intercept 98.24833 58.03348 1.69296 0.12892 -35.57720 232.07386
Square Feet 0.10977 0.03297 3.32938 0.01039 0.03374 0.18580
Регрессийн тэгшитгэл:
feet)(square0.1097798.24833pricehouse
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
25. 25
0
50
100
150
200
250
300
350
400
450
0 500 1000 1500 2000 2500 3000
Square Feet
HousePrice($1000s)
График дђрслэл (Graphical Presentation)
Байрны ђнэ, талбайн хэмжээнээс хамаарсан
загвар: цэгэн дђрслэл ба регрессийн шугам
feet)(square0.1097798.24833pricehouse
Slope
= 0.10977
Intercept
= 98.248
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
26. 26
b0 буюу тогтмол коэффициентийг
тайлбарлах (Interpretation of the Intercept)
b0 нь X буюу ђл хамааран хувьсагчаас бусад
хђчин зђйлийн нөлөөг харуулна.
feet)(square0.1097798.24833pricehouse
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
27. 27
b1 коэффициентийг тайлбарлах
(Interpretation of the Slope Coefficient)
b1 нь Х буюу ђл хамааран хувьсагч нэг
нэгжээр өөрчлөгдөхөд Y буюу хамааран
хувьсагч хэрхэн өөрчлөгдөхийг харуулна.
Жишээ: b1 = .10977 ба талбайн хэмжээ нэг
квадрат метрээр нэмэгдэхэд байрны ђнэ дундажаар
0.10977($1000) = $109.77 нэмэгдэнэ.
feet)(square0.1097798.24833pricehouse
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
29. 29
ёзђђлэлтийн Вариаци
(Measures of Variation)
Дисперсийг нэмэх дђрэм:
SSESSRSST
Total Sum of
Squares
Regression Sum
of Squares
Error Sum of
Squares
2
i )YY(SST 2
ii )YˆY(SSE 2
i )YYˆ(SSR
ђђнд:
= хамааран хувьсагчийн дундаж утга
Yi = хамааран хувьсагчийн бодит утга
i = регрессийн шугаман дээрх утгаYˆ
Y
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
30. 30
(continued)
Xi
Y
X
Yi
SST = (Yi - Y)2
SSE = (Yi - Yi )2
SSR = (Yi - Y)2
_
_
_
Y
Y
Y
_
Y
ёзђђлэлтийн Вариаци
(Measures of Variation)
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
31. 31
Детерминацийн коэффициент нь рергессийн
тегшитгэлийг тайлбалагч гол ђзђђлэлт
Тайлбарлагч хувьсагчийн хэдэн хувийг
тайлбарлаж буйг илэрхийлнэ
Кореляцийн коэффициентийг квадрат зэрэгт
дэвшђђлсэнтэй тэнцђђ
Детерминацийн Коэффициент
(Coefficient of Determination), r2
1r0 2
squaresofsumtotal
squaresofsumregression
SST
SSR
r2
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
32. 32
r2 = 1
Детерминацийн коэффициентийн
ерөнхий хэлбэрђђд
Y
X
Y
X
r2 = 1
r2 = 1
X ба Y хооронд төгс буюу
функцинал хамааралтай:
X хђчин зђйлийн өөрчлөлт нь
Y-ийн өөрчлөлтийг 100%
тайлбарлана
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
35. 35
ёр дђн (Excel Output)
Regression Statistics
Multiple R 0.76211
R Square 0.58082
Adjusted R Square 0.52842
Standard Error 41.33032
Observations 10
ANOVA
df SS MS F Significance F
Regression 1 18934.9348 18934.9348 11.0848 0.01039
Residual 8 13665.5652 1708.1957
Total 9 32600.5000
Coefficients Standard Error t Stat P-value Lower 95% Upper 95%
Intercept 98.24833 58.03348 1.69296 0.12892 -35.57720 232.07386
Square Feet 0.10977 0.03297 3.32938 0.01039 0.03374 0.18580
Байрны ђнийг тодорхойлсон
загвар 58.08% -ийг
тайлбарлах боломжтой
0.58082
32600.5000
18934.9348
SST
SSR
r2
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
36. 36
Регрессийн шинжилгээний урьдач
нөхцөл (Assumptions of Regression)
Алдааны нормал байх шинж (Normality of Error)
ёлдэгдэл буюу алдаа (ε)-ны тархалт нь нормал
тархалттай байх
Хомоскедастик байх шинж (Homoscedasticity)
Алдааны магадлалт тархалт нь тогтмол вариацтай
байх
Алдааны ђл хамааралт байх шинж (Independence of
Errors)
Алдаа буюу ђлдэгдэл хувьсагчид нь бие биеэсээ ђл
хамаарах байх
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
37. 37
ёлдэгдэлийн Шинжилгээ
(Residual Analysis)
Бодит ажиглалтын утга, регрессийн шугаман дээрх
утгуудын зөрђђг ђлдэгдэл буюу алдаа
Шугаман регрессийн ђлдэгдэлийн шинжилгээнд
тавигдах урьдач нөхцөлийг шалгах
Шугаман нөхцөлийн шалгах
Тогтмол вариацтай байх буюу гомоскедастик
нөхцөл(homoscedasticity)
Нормал тархалтай байх нөцөлийг ђнэлэх
ёл хамааралт байх нөхцөлийг ђнэлэх
ёлдэгдэлийн График шинжилгээ
ёлдэгдэлийн график дђрслэл
iii YˆYe
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
38. 38
ёлдэгдэлийн шугаман байх
нөхцөл (Residual Analysis for Linearity)
Шугаман биш Шугаман
x
residuals
x
Y
x
Y
x
residuals
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
40. 40
ёлдэгдэлийн Шинжилгээний ђл
хамааралт байх нөхцөл
( Residual Analysis for Independence)
Хамааралт
ёл хамааралт
X
X
residuals
residuals
X
residuals
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
41. 41
House Price Model Residual Plot
-60
-40
-20
0
20
40
60
80
0 1000 2000 3000
Square Feet
Residuals
ёлдэгдэлийн ђр дђн
RESIDUAL OUTPUT
Predicted
House Price Residuals
1 251.92316 -6.923162
2 273.87671 38.12329
3 284.85348 -5.853484
4 304.06284 3.937162
5 218.99284 -19.99284
6 268.38832 -49.38832
7 356.20251 48.79749
8 367.17929 -43.17929
9 254.6674 64.33264
10 284.85348 -29.85348
Регрессийн урьдач нөхцөл хангагдаж байна
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
42. 42
Цаг хугацааны мэдээлэлд өмнөх цаг
хугацааны тђвшингђђдннс хђчтэй
хамаарч байвал автокорреляци байна гэж
ђздэг
ёлдэгдэл хувьсагчид өмнөх цаг
хугацааны тђвшингөөс хамаарах байдлыг
автокорреляци
Автокорреляци: Дурбин-Ватсоны
статистик(Autocorrelation: The Durbin-Watson Statistic)
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
43. 43
Автокорреляци (Autocorrelation)
Автокорреляци гэдэг нь ђлдэгдэл (алдаа)-ийн
хоорондоо хамааралтай бадал
Регрессийн урьдач нөхцөлийн нэг нь ђлдэгдэлђђд
нь санамсаргђй ба ђл хамааралт байх
Time (t) Residual Plot
-15
-10
-5
0
5
10
15
0 2 4 6 8
Time (t)
Residuals ёђнд, ђлдэгдэлђђд нь
санамсаргђй биш,
тодорхой мөчлөгт
өөрчлөгдөж байна.
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
44. 44
Дурбин-Ватсоны шинжђђр
(The Durbin-Watson Statistic)
n
1i
2
i
n
2i
2
1ii
e
)ee(
D
0 ≤ D ≤ 4 хооронд утга авна
D нь 2 орчимд байвал H0 ђнэн
D нь 2-оос бага бол эерэг
автокореляци байж болох дохио, D
нь 2-оос их бол сөрөг автокореляци
байж болох дохио
Дурбин-Ватсоны шинжђђрийг ашиглан
автокорреляци байгаа эсхийг шалгаж болно
H0: ђлдэгдэлђђд хамааралгђй
H1: автокореляци
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
45. 45
Эерэг Автокорреляцийг
шалгах (Testing for Positive Autocorrelation)
Дурбин- Ватсоны тестийг тооцох = D
Шийдвэр гаргах: хэрэв D < dL бол H0 няцаагдана
H0: эерэг автокорреляци байгаа
H1: эерэг автокорреляци байхгђй
0 dU 2dL
Няцаана H0 Зөвшөөрнө H0
Дурбин-Ватсоны хђснэтгээс dL ба dU утгыг олох
(тђђврийн хэмжээ n ба ђл хамааран хувьсагчийн тоо k)
Inconclusive
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
46. 46
Тђђврийн хэмжээ n = 25
Durbin-Watson Calculations
Sum of Squared
Difference of Residuals 3296.18
Sum of Squared
Residuals 3279.98
Durbin-Watson
Statistic 1.00494
y = 30.65 + 4.7038x
R
2
= 0.8976
0
20
40
60
80
100
120
140
160
0 5 10 15 20 25 30
Time
Sales
Эерэг Автокорреляцийг
шалгах (Testing for Positive Autocorrelation)
(continued)
1.00494
3279.98
3296.18
e
)e(e
D n
1i
2
i
n
2i
2
1ii
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
47. 47
n = 25 ба k = 1 буюу нэг ђл хамааран хувьсагч
Дурбин-Ватсоны хђснэгт, dL = 1.29 ба dU = 1.45
D = 1.00494 < dL = 1.29, учир эерэг автокореляцтай
гэсэн таамаглалыг статистик ач холбогдолын тђвшинд
H0 –ийг няцаана
Эерэг Автокорреляцийг
шалгах (Testing for Positive Autocorrelation)
(continued)
Шийдвэр: няцаана H0
D = 1.00494 < dL
0 dU=1.45 2dL=1.29
Reject H0 Do not reject H0Inconclusive
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
48. 48
Мэдрэмж буюу Slope
Регрессийн коэффициент (b1)-ийн стандарт
алдааг дараах байдлаар ђнэлдэг
2
i
YXYX
b
)X(X
S
SSX
S
S 1
ђђнд:
= Мэдрэмжийн ђнэлэгдсэн стандарт алдаа
= ёнэлгээний стандарт алдаа
1bS
2n
SSE
SYX
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
49. 49
ёр дђн
Regression Statistics
Multiple R 0.76211
R Square 0.58082
Adjusted R Square 0.52842
Standard Error 41.33032
Observations 10
ANOVA
df SS MS F Significance F
Regression 1 18934.9348 18934.9348 11.0848 0.01039
Residual 8 13665.5652 1708.1957
Total 9 32600.5000
Coefficients Standard Error t Stat P-value Lower 95% Upper 95%
Intercept 98.24833 58.03348 1.69296 0.12892 -35.57720 232.07386
Square Feet 0.10977 0.03297 3.32938 0.01039 0.03374 0.18580
0.03297S 1b
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
50. 50
Мэдрэмжийн Стандарт алдаа
(Standard Errors of the Slope)
Y
X
Y
X
1bSsmall 1bSlarge
нь мэдрэмжийн хазайлт ба регрессийн шугамыг
өөрчлөх боломжтой байдаг
1bS
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
51. Мэдрэмжийн тухай тайлбар: t
тест (Inference about the Slope: t Test)
Эх олонлогын мэдрэмж (slope) ђнэлэх t тест
X ба Y хооронд шугаман хамаарал байдаг уу?
Тэг ба альтарнатив таамаглал
H0: β1 = 0 (шугаман хамааралгђй)
H1: β1 ≠ 0 (шугаман хамааралтай)
Тестийн статистик
1b
11
S
βb
t
2nd.f.
ёђнд:
b1 = регрессийн тэгшитгэлийн
коэффициент
β1 = таамаглалын мэдрэмж
Sb1 = мэдрэмж (slope)-ийн
стандарт алдаа
51Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
52. House Price
in $1000s
(y)
Square Feet
(x)
245 1400
312 1600
279 1700
308 1875
199 1100
219 1550
405 2350
324 2450
319 1425
255 1700
(sq.ft.)0.109898.25pricehouse
ёнэлэгдсэн регрессийн тэгшитгэл:
Загварт ђнэлэгдсэн утга 0.1098
Талбайн хэмжээ нь байрны ђнэд
нөлөөлөх хђчин зђйл мөн ђђ?
Мэдрэмжийн тухай тайлбар: t
тест (Inference about the Slope: t Test)
(continued)
52Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
53. Мэдрэмжийн тухай тайлбар: t
тестийн жишээ (Inference about the Slope: t Test
Example)
H0: β1 = 0
H1: β1 ≠ 0
ёр дђн:
Coefficients Standard Error t Stat P-value
Intercept 98.24833 58.03348 1.69296 0.12892
Square Feet 0.10977 0.03297 3.32938 0.01039
1bS
t
b1
32938.3
03297.0
010977.0
S
βb
t
1b
11
53Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
54. H0: β1 = 0
H1: β1 ≠ 0
Тестийн статистик: t = 3.329
Талбай хэмжээ нь байрны
ђнэд нөлөөлөх хђчин зђйл
мөн
ёр дђн:
Няцаана H0
Coefficients Standard Error t Stat P-value
Intercept 98.24833 58.03348 1.69296 0.12892
Square Feet 0.10977 0.03297 3.32938 0.01039
1bS tb1
Шийдвэр:
Дђгнэлт:
Няцаана H0Няцаана H0
a/2=.025
-tα/2
Зөвшөөрнө H0
0
tα/2
a/2=.025
-2.3060 2.3060 3.329
d.f. = 10-2 = 8
(continued)
54Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
Мэдрэмжийн тухай тайлбар: t
тестийн жишээ (Inference about the Slope: t Test
Example)
55. H0: β1 = 0
H1: β1 ≠ 0
P-утга = 0.01039
Талбай хэмжээ нь байрны ђнэд
нөлөөлөх хђчин зђйл мөн
ёр дђн:
Coefficients Standard Error t Stat P-value
Intercept 98.24833 58.03348 1.69296 0.12892
Square Feet 0.10977 0.03297 3.32938 0.01039
P-value
Шийдвэр: P-value < α учир
Дђгнэлт:
(continued)
Хоѐр-талт тестийн ђед p-
утга тооцох
P(t > 3.329)+P(t < -3.329)
= 0.01039
( 8 d.f.)
55Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
Няцаана H0
Мэдрэмжийн тухай тайлбар: t
тестийн жишээ (Inference about the Slope: t Test
Example)
56. Регрессийн шинжилгээн дэхь
F-тест
F тест:
ђђнд
MSE
MSR
F
1kn
SSE
MSE
k
SSR
MSR
k ба (n – k - 1) чөлөөний зэргийн тоотой F тархалт ын утга,
тооцооны F утгатай харьцуулж тооцно
(k = регрессийн загвар дахь ђл хамааран хувьсагчийн тоо)
56Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
57. ёр дђн
Regression Statistics
Multiple R 0.76211
R Square 0.58082
Adjusted R Square 0.52842
Standard Error 41.33032
Observations 10
ANOVA
df SS MS F Significance F
Regression 1 18934.9348 18934.9348 11.0848 0.01039
Residual 8 13665.5652 1708.1957
Total 9 32600.5000
Coefficients Standard Error t Stat P-value Lower 95% Upper 95%
Intercept 98.24833 58.03348 1.69296 0.12892 -35.57720 232.07386
Square Feet 0.10977 0.03297 3.32938 0.01039 0.03374 0.18580
11.0848
1708.1957
18934.9348
MSE
MSR
F
1 ба 8 чөлөөний
зэрэгийн тоо
F-тестийн
P-утга
57Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
58. H0: β0 = β1 = 0
H1: β0 ≠ β1 ≠ 0
a = 0.05
df1= 1 df2 = 8
Тестийн статистик:
Шийдвэр:
Дђгнэлт:
α = 0.05 тђвшинд H0
няцаана
Регрессийн коэффициентууд
нэгэн зэрэг тэгтэй тэнцђђ биш0
a = .05
F.05 = 5.32
Няцаана H0Зөвшөрнө
H0
11.08
MSE
MSR
F
Критик
утга:
Fa = 5.32
F-Тест
(continued)
F
58Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
59. Мэдрэмжийн Итгэх Интервал
(Confidence Interval for the Slope)
Мэдрэмжийн интервал ђнэлгээ:
ёр дђн:
95% итгэх тђвшинд мэдрэмжийн итгэх интервал нь
(0.0337, 0.1858)
1b2n1 Stb
Coefficients Standard Error t Stat P-value Lower 95% Upper 95%
Intercept 98.24833 58.03348 1.69296 0.12892 -35.57720 232.07386
Square Feet 0.10977 0.03297 3.32938 0.01039 0.03374 0.18580
d.f. = n - 2
59Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
60. Талбайн хэмжээг нэг нэгжээр нэмэгдэхэд
байрны ђнэ дундажаар 95% итгэх тђвшинд
$33.70 -оос $185.80 нэмэгдэнэ
Coefficients Standard Error t Stat P-value Lower 95% Upper 95%
Intercept 98.24833 58.03348 1.69296 0.12892 -35.57720 232.07386
Square Feet 0.10977 0.03297 3.32938 0.01039 0.03374 0.18580
Мэдрэмжийн Итгэх Интервал
(Confidence Interval for the Slope)
(continued)
60Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
61. Корреляцийн Коэффициентийг
ђнэлэх t тест
Таамаглал
H0: ρ = 0 ( X ба Y хооронд хамааралгђй)
HA: ρ ≠ 0 (хамааралтай)
Статистик тест
( n – 2 чөлөөний зэргийн тоо)
2n
r1
ρ-r
t
2
0bifrr
0bifrr
where
1
2
1
2
61Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
62. Жишээ:
Байрны талбай хэмжээ ба байрны ђнэ
хооронд шугаман хамааралтай эсэхийг
ђнэлэх
H0: ρ = 0 (хамааралгђй)
H1: ρ ≠ 0 (хамааралтай)
a =.05 , df = 10 - 2 = 8
3.33
210
.7621
0.762
2n
r1
ρr
t
22
62Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
63. Жишээ: Тестийн ђр дђн
Дђгнэлт:
5% ач
холбогдолын
тђвшинд
шугаман
хамааралтай
Шийдвэр гаргах:
H0 Няцаана
Няцаана H0Няцаана H0
a/2=.025
-tα/2
Зөвшөөрнө H0
0
tα/2
a/2=.025
-2.3060 2.3060
3.33
d.f. = 10-2 = 8
3.33
210
.7621
0.762
2n
r1
ρr
t
22
63Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
64. Дундаж ба Таамагласан
бодит утгын ђнэлгээ
Y
XXi
Y = b0+b1Xi
Дундажийн
итгэх
интервал
Бодит (хувийн)
таамагласан итгэх
интервал
Y
64Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
65. Y-ийн дундаж утгын итгэх
интервал
Xi тухайлсан утгаар өгөгдсөн Y-ийн дундаж
утгын ђнэлэгдсэн итгэх интервал
Дундажаас хазайх хазайлтын
квадрат утга, X
ihtY YX2n
XX|Y
Sˆ
:μ i
2
i
2
i
2
i
i
)X(X
)X(X
n
1
SSX
)X(X
n
1
h
65Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
Итгэх интервал
66. Бодит Y-ийн таамагласан итгэх
интервал
Xi тухайлсан утгаар өгөгдсөн Y-ийн хувийн
утгын ђнэлэгдсэн итгэх интервал
iYX2n
XX
h1StYˆ
:YforintervalConfidence i
66Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
67. Дундаж утгын ђнэлгээ: Жишээ
2,000 квадрат метр байрны дундаж ђнийн 95%
интгэх интервал
ёнэлэгдсэн утга Yi = 317.85 ($1,000)
μY|X=X ђнэлгээний итгэх интервал
37.12317.85
)X(X
)X(X
n
1
StYˆ
2
i
2
i
YX2-n
Итгэх интервал нь $280,660 аас $354,900
67Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
68. Бодит утгын ђнэлгээ: Жишээ
2,000 квадрат метр байрны бодит (хувийн) 95%
таамагласан интервал
ёнэлэгдсэн утга Yi = 317.85 ($1,000s)
YX=X Таамагласан интервалын ђнэлгээ
102.28317.85
)X(X
)X(X
n
1
1StYˆ
2
i
2
i
YX1-n
Таамагласан интервал $215,500 аас $420,070
68Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС