Excel программ ашигланРегрессийн
шинжилгээ хийх (Regression Using Excel)
Data / Data Analysis / Regression
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
24.
24
ёр дђн (ExcelOutput)
Regression Statistics
Multiple R 0.76211
R Square 0.58082
Adjusted R Square 0.52842
Standard Error 41.33032
Observations 10
ANOVA
df SS MS F Significance F
Regression 1 18934.9348 18934.9348 11.0848 0.01039
Residual 8 13665.5652 1708.1957
Total 9 32600.5000
Coefficients Standard Error t Stat P-value Lower 95% Upper 95%
Intercept 98.24833 58.03348 1.69296 0.12892 -35.57720 232.07386
Square Feet 0.10977 0.03297 3.32938 0.01039 0.03374 0.18580
Регрессийн тэгшитгэл:
feet)(square0.1097798.24833pricehouse
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
29
ёзђђлэлтийн Вариаци
(Measures ofVariation)
Дисперсийг нэмэх дђрэм:
SSESSRSST
Total Sum of
Squares
Regression Sum
of Squares
Error Sum of
Squares
2
i )YY(SST 2
ii )YˆY(SSE 2
i )YYˆ(SSR
ђђнд:
= хамааран хувьсагчийн дундаж утга
Yi = хамааран хувьсагчийн бодит утга
i = регрессийн шугаман дээрх утгаYˆ
Y
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
30.
30
(continued)
Xi
Y
X
Yi
SST = (Yi- Y)2
SSE = (Yi - Yi )2
SSR = (Yi - Y)2
_
_
_
Y
Y
Y
_
Y
ёзђђлэлтийн Вариаци
(Measures of Variation)
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
38
ёлдэгдэлийн шугаман байх
нөхцөл(Residual Analysis for Linearity)
Шугаман биш Шугаман
x
residuals
x
Y
x
Y
x
residuals
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
44
Дурбин-Ватсоны шинжђђр
(The Durbin-WatsonStatistic)
n
1i
2
i
n
2i
2
1ii
e
)ee(
D
0 ≤ D ≤ 4 хооронд утга авна
D нь 2 орчимд байвал H0 ђнэн
D нь 2-оос бага бол эерэг
автокореляци байж болох дохио, D
нь 2-оос их бол сөрөг автокореляци
байж болох дохио
Дурбин-Ватсоны шинжђђрийг ашиглан
автокорреляци байгаа эсхийг шалгаж болно
H0: ђлдэгдэлђђд хамааралгђй
H1: автокореляци
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
45.
45
Эерэг Автокорреляцийг
шалгах (Testingfor Positive Autocorrelation)
Дурбин- Ватсоны тестийг тооцох = D
Шийдвэр гаргах: хэрэв D < dL бол H0 няцаагдана
H0: эерэг автокорреляци байгаа
H1: эерэг автокорреляци байхгђй
0 dU 2dL
Няцаана H0 Зөвшөөрнө H0
Дурбин-Ватсоны хђснэтгээс dL ба dU утгыг олох
(тђђврийн хэмжээ n ба ђл хамааран хувьсагчийн тоо k)
Inconclusive
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
46.
46
Тђђврийн хэмжээn = 25
Durbin-Watson Calculations
Sum of Squared
Difference of Residuals 3296.18
Sum of Squared
Residuals 3279.98
Durbin-Watson
Statistic 1.00494
y = 30.65 + 4.7038x
R
2
= 0.8976
0
20
40
60
80
100
120
140
160
0 5 10 15 20 25 30
Time
Sales
Эерэг Автокорреляцийг
шалгах (Testing for Positive Autocorrelation)
(continued)
1.00494
3279.98
3296.18
e
)e(e
D n
1i
2
i
n
2i
2
1ii
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
47.
47
n =25 ба k = 1 буюу нэг ђл хамааран хувьсагч
Дурбин-Ватсоны хђснэгт, dL = 1.29 ба dU = 1.45
D = 1.00494 < dL = 1.29, учир эерэг автокореляцтай
гэсэн таамаглалыг статистик ач холбогдолын тђвшинд
H0 –ийг няцаана
Эерэг Автокорреляцийг
шалгах (Testing for Positive Autocorrelation)
(continued)
Шийдвэр: няцаана H0
D = 1.00494 < dL
0 dU=1.45 2dL=1.29
Reject H0 Do not reject H0Inconclusive
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
48.
48
Мэдрэмж буюу Slope
Регрессийн коэффициент (b1)-ийн стандарт
алдааг дараах байдлаар ђнэлдэг
2
i
YXYX
b
)X(X
S
SSX
S
S 1
ђђнд:
= Мэдрэмжийн ђнэлэгдсэн стандарт алдаа
= ёнэлгээний стандарт алдаа
1bS
2n
SSE
SYX
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
49.
49
ёр дђн
Regression Statistics
MultipleR 0.76211
R Square 0.58082
Adjusted R Square 0.52842
Standard Error 41.33032
Observations 10
ANOVA
df SS MS F Significance F
Regression 1 18934.9348 18934.9348 11.0848 0.01039
Residual 8 13665.5652 1708.1957
Total 9 32600.5000
Coefficients Standard Error t Stat P-value Lower 95% Upper 95%
Intercept 98.24833 58.03348 1.69296 0.12892 -35.57720 232.07386
Square Feet 0.10977 0.03297 3.32938 0.01039 0.03374 0.18580
0.03297S 1b
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
50.
50
Мэдрэмжийн Стандарт алдаа
(StandardErrors of the Slope)
Y
X
Y
X
1bSsmall 1bSlarge
нь мэдрэмжийн хазайлт ба регрессийн шугамыг
өөрчлөх боломжтой байдаг
1bS
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
51.
Мэдрэмжийн тухай тайлбар:t
тест (Inference about the Slope: t Test)
Эх олонлогын мэдрэмж (slope) ђнэлэх t тест
X ба Y хооронд шугаман хамаарал байдаг уу?
Тэг ба альтарнатив таамаглал
H0: β1 = 0 (шугаман хамааралгђй)
H1: β1 ≠ 0 (шугаман хамааралтай)
Тестийн статистик
1b
11
S
βb
t
2nd.f.
ёђнд:
b1 = регрессийн тэгшитгэлийн
коэффициент
β1 = таамаглалын мэдрэмж
Sb1 = мэдрэмж (slope)-ийн
стандарт алдаа
51Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
52.
House Price
in $1000s
(y)
SquareFeet
(x)
245 1400
312 1600
279 1700
308 1875
199 1100
219 1550
405 2350
324 2450
319 1425
255 1700
(sq.ft.)0.109898.25pricehouse
ёнэлэгдсэн регрессийн тэгшитгэл:
Загварт ђнэлэгдсэн утга 0.1098
Талбайн хэмжээ нь байрны ђнэд
нөлөөлөх хђчин зђйл мөн ђђ?
Мэдрэмжийн тухай тайлбар: t
тест (Inference about the Slope: t Test)
(continued)
52Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
53.
Мэдрэмжийн тухай тайлбар:t
тестийн жишээ (Inference about the Slope: t Test
Example)
H0: β1 = 0
H1: β1 ≠ 0
ёр дђн:
Coefficients Standard Error t Stat P-value
Intercept 98.24833 58.03348 1.69296 0.12892
Square Feet 0.10977 0.03297 3.32938 0.01039
1bS
t
b1
32938.3
03297.0
010977.0
S
βb
t
1b
11
53Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
54.
H0: β1 =0
H1: β1 ≠ 0
Тестийн статистик: t = 3.329
Талбай хэмжээ нь байрны
ђнэд нөлөөлөх хђчин зђйл
мөн
ёр дђн:
Няцаана H0
Coefficients Standard Error t Stat P-value
Intercept 98.24833 58.03348 1.69296 0.12892
Square Feet 0.10977 0.03297 3.32938 0.01039
1bS tb1
Шийдвэр:
Дђгнэлт:
Няцаана H0Няцаана H0
a/2=.025
-tα/2
Зөвшөөрнө H0
0
tα/2
a/2=.025
-2.3060 2.3060 3.329
d.f. = 10-2 = 8
(continued)
54Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
Мэдрэмжийн тухай тайлбар: t
тестийн жишээ (Inference about the Slope: t Test
Example)