SlideShare a Scribd company logo
Бүлэг # 10: МУЛЬТИКОЛЛИНЕАР:
РЕГРЕССОРУУД КОРРЕЛЯЦИ ХАМААРАЛТАЙ
ҮЕД ЮУ БОЛОХ ВЭ?
• Энэ бүлэгт бид дараах асуултуудад хариулт хайж энэ урьдчилсан
нөхцлийг чухалд авч үзэх болно:
• 1. Мультиколлинеарын мөн чанар юу вэ?
• 2. Мультиколлинеар нь үнэхээр асуудал мөн үү?
• 3. Практик үр дагавар нь юу вэ?
• 4. Үүнийг хэрхэн мэдэх вэ?
• 5. Мультиколлинеарын асуудлыг бууруулахын тулд ямар арга хэмжээ
авч болох вэ?
Мультиколлинеарын мөн чанар
• Мультиколлинеар нь анхандаа регрессийн загварын зарим эсвэл бүх
тайлбарлагч хувьсагчдын хооронд “төгс” шугаман хамаарал оршин
байгааг илэрхийлдэг байсан. k-хувьсагчийн регресс нь X1, X2, . . . , Xk
(энд бүх ажиглалтын нэгжийн хувьд X1 = 1 нь тогтмол параметрийг
илэрхийлнэ) зэрэг тайлбарлагч хувьсагчдыг хамардаг ба дараах
нөхцөл хангагдах үед яг шугаман хамааралтай гэж үзнэ:
• λ1X1 + λ2X2 +· · ·+λkXk = 0 (10.1.1)
• энд λ1, λ2, . . . , λk нь бүгд нэгэн зэрэг тэг биш байх тогтмолууд.
• Өнөөдөр хэдийгээр мультиколлинеарын ухагдахуун нь Х хувьсагчид
хоорондоо хамааралтай боловч төгс биш хамааралтай тохиолдлыг авч
үзэхэд ашигладаг ба дараах хэлбэртэй байна:
• λ1X1 + λ2X2 +· · ·+λ2Xk + vi = 0 (10.1.2)
• энд vi нь стохастик алдааны утга.
• төгс ба бараг төгс мультиколлинеарын хоорондох ялгааг харъя.
Жишээ нь λ2 ≠ 0 гэвэл (10.1.1) нь дараах хэлбэрээр бичиж болно:
• X2 нь хэрхэн бусад хувьсагчидтай төгс шугаман хамааралтай байгааг
харуулна. Энэ нөхцөлд хувьсагч X2 болон (10.1.3)-ийн баруун гар талын
шугаман хослолын хоорондох корреляцийн коэффициент нь бараг нэг
болно.
• Энгийнээр, хэрэв λ2 ≠ 0 бол тэгшитгэл (10.1.2) нь:
• X2 нь бусад Х-ийн хослолын хувьд яг шугаман хамааралтай биш
гэдгийг харуулна. Учир нь энэ нь стохастик алдааны утга vi-аар
тодорхойлогдож байна.
• Тоон жишээ, дараах таамаглалт өгөгдлийг авч үзье:
• X2 X3 X*3
• 10 50 52
• 15 75 75
• 18 90 97
• 24 120 129
• 30 150 152
• Энд X3i = 5X2i нь тодорхой байна. Мөн түүнчлэн, r23 корреляцийн
коэффициент нь нэг учраас X2 ба X3 –ийн хооронд төгс коллинеар
оршин байна. X*3 хувьсагч нь X3 дээр санамсаргүй тооны хүснэгтээс
олдсон дараах тоонуудыг нэмэх замаар хялбар олдоно: 2, 0, 7, 9, 2. Одоо
X2 ба X*3 хоорондоо төгс коллинеар байхаа больсон байдаг. (X3i = 5X2i + vi
) Хэдий тийм боловч хоёр хувьсагчийн хооронд маш өндөр
корреляцитай байгааг тэдгээрийн хоорондын корреляцийн
коэффициент 0.9959 байгаагаас харж болно.
• Мультиколлинеарын өмнөх алгебр аргыг зураг 10.1-т дүрсэлсэн болно.
Энэ зурагт Y, X2, ба X3 дугуйнууд харгалзан Y-ийн хэлбэлзэл (хамааран
хувьсагч) ба X2 ба X3 (тайлбарлагч хувьсагчид)-ыг илэрхийлнэ.
Коллинеарын зэрэг нь X2 ба X3 дугуйнуудын давхардсан хэсгээр
хэмжигдэнэ (будсан муж). Туйлын тохиолдолд, хэрэв X2 ба X3 нь бүрэн
давхацвал (хэрэв X2 нь X3-ийн дотор бүрэн орсон, эсвэл эсрэгээрээ), төгс
коллинеар болно.
• Дашрамд, бидний тодорхойлсон мультиколлинеар нь Х хувьсагчдын
хоорондох зөвхөн шугаман хамаарлаас хамаарна. Энэ нь тэдгээрийн
хоорондын шугаман бус хамаарлын нөхцөлд ажиллахгүй. Жишээ нь,
дараах регрессийн загварыг авч үзье:
• Yi = β0 + β1Xi + β2X2
i + β3X3
i + ui (10.1.5)
• энд, Y = үйлдвэрлэлийн нийт зардал ба X = гарц. X2
i (гарцын квадрат
зэрэг) ба X3
i (гарцын куб зэрэг) хувьсагчид нь Xi-тэй функциональ
хамааралтай нь ойлгомжтой байгаа ч уг хамаарал нь шугаман бус
байна.
• Сонгодог шугаман регрессийн загвар яагаад Х-үүдийн хооронд
мультиколлинеар байхгүй гэж үздэг вэ? Шалтгаан нь:
• Хэрэв мультиколлинеар нь төгс бол, Х хувьсагчдын регрессийн
коэффициентүүд нь тодорхой бус, стандарт алдаа нь хязгааргүй.
• Хэрэв мультиколлинеар нь бараг төгс бол регрессийн коэффициентүүд
хэдий тодорхой байх хэдий ч стандарт алдаа ихтэй байх тул энэ нь
коэффициентүүд нарийн, үнэн зөв тооцогдохгүй гэсэн үг.
• Мультиколлинеарын хэд хэдэн эх үүсвэр байдаг.
• 1. Мэдээлэл цуглуулах аргыг хэрэглэн тайлбарлагч хувьсагчдын эх
олонлогоос авах түүврийн тоо хязгаарлагдмал байх.
• 2. Загвар эсвэл түүвэр хийж буй эх олонлогт тавьсан хязгаарлалт.
Жишээ нь, цахилгаан хэрэгслийн хэрэглээний орлого (X2) ба
байшингийн хэмжээ (X3)-с хамаарах регресс (Өндөр X2 үргэлж өндөр X3-
г илэрхийлнэ).
• 3. Загварын тодорхойлолт, жишээ нь, ялангуяа Х хувьсагчийн хэмжээ
бага үед регрессийн загварт олон гишүүнтийг нэмвэл.
• 4. Илүү тодорхойлогдсон загвар. Энэ нь загвар ажиглалтын нэгжээс
илүү олон тайлбарлагч хувьсагчидтай үед тохиолддог.
• Мультиколлинеар үүсэх нэмэлт шалтгаанд, ялангуяа хугацааны
цуваан өгөгдөлд, загварт орсон тайлбарлагч хувьсагчид нийтлэг
трендтэй буюу хугацааны туршид бүгд өсдөг эсвэл буурдаг үед
тохиолдоно.
ТӨГС МУЛЬТИКОЛЛИНЕАР БАЙХ ҮЕ ДЭХ ҮНЭЛЭЛТ
• Төгс мультиколлинеар тохиолдолд регрессийн коэффициентүүд
тодорхойгүй, тэдгээрийн стандарт алдаа хязгааргүй байна. Энэ
баримтыг гурван хувьсагчийн регрессийн загварын нөхцөлд харуулж
болно. Хазайлтаар илэрхийлвэл гурван хувьсагчийн регрессийн
загварыг дараах байдлаар бичиж болно:
• yi= βˆ2x2i + βˆ3x3i +uˆi (10.2.1)
• Now from Chapter 7 we obtain
• X3i = λX2i гэвэл энд λ нь тэг биш тогтмол (жишээ нь, 2, 4, 1.8, г.м).
Үүнийг (7.4.7)-д орлуулвал
• тодорхой бус илэрхийлэл болно. Бид βˆ3 тодорхойгүй болохыг бас
баталж болно.
• Яагаад бид (10.2.2)-ийн үр дүнг олж авдаг вэ? βˆ2-ийн утга нь:
• Энэ нь X3 тогтмол үед X2 нэгжээр өөрчлөгдөхөд Ү-ийн дундаж утгын
өөрчлөлтийн хувийг илэрхийлдэг. Харин хэрэв X3 ба X2 нь төгс
коллинеар бол X3 тогтмол байх боломжгүй юм: X2 өөрчлөгөдхөд, X3 мөн
λ хүчин зүйлээр өөрчлөгдөнө. Энэ нь өгөгдсөн түүврээс X2 ба X3-ийн тус
тусын нөлөөг салгах боломжгүй гэсэн үг юм.
• Үүнийг өөрөөр харахын тулд X3i = λX2i -г (10.2.1)-т орлуулж дараах
тэгшитгэлийг олно [(7.1.9)-г хар]:
• yi = βˆ2x2i + βˆ3(λx2i)+uˆi
• = (βˆ2 + λβˆ3)x2i +uˆi (10.2.3)
• = αˆx2i + uˆi
• энд
• αˆ = (βˆ2 + λβˆ3) (10.2.4)
• Ердийн OLS томъёог (10.2.3)-т хэрэглэвэл
• αˆ = (βˆ2 + λβˆ3) = Σx2i yi/Σx2
2i (10.2.5)
• Иймээс хэдий бид α-г үнэлж чадах ч β2 болон β3-г үнэлэх боломжгүй юм;
математикийн хувьд
• αˆ = βˆ2 + λβˆ3 (10.2.6)
• хоёр үл мэдэгдэх бүхий (λ өгөгдсөн) ганц тэгшитгэл байгаа ба αˆ ба λ
утгууд өгөгдсөн үед (10.2.6)-ийн шийд хязгааргүй байна.
• Бодит нөхцөлд энэ санааг авч үзвэл αˆ = 0.8 ба λ = 2 гэе. Тэгвэл бидэнд
• 0.8 = βˆ2 + 2βˆ3 (10.2.7)
• эсвэл
• βˆ2 = 0.8 − 2βˆ3 (10.2.8)
• Одоо βˆ3 –ийн дурын утгыг сонгон βˆ2-ийн шийдийг олж болно. βˆ3-ийн
өөр нэг утгыг сонгон βˆ2-ийн өөр нэг шийдийг олъё. Бид хэчнээн
хичээсэн ч βˆ2-ийн ганц утга олдохгүй. Энэ бол төгс мультиколлинеар
тохиолдолд регрессийн тухайн коэффициентийн хувьд ганц шийд олж
чадахгүй гэсэн үг.
• Гэвч эдгээр коэффициентүүдийн шугаман хослолын хувьд ганц шийд
олж чадна. Шугаман хослол (β2 + λβ3) нь λ-ийн утга өгөгдсөн үед α-аар
тооцогдоно. Дашрамд төгс мультиколлинеар тохиолдолд βˆ2 ба βˆ3-ийн
дисперс болон стандарт алдаа нь хязгааргүй байна.
“ӨНДӨР” БОЛОВЧ “ТӨГС БУС” МУЛЬТИКОЛЛИНЕАР
ОРШИН БАЙХ НӨХЦӨЛ ДЭХ ҮНЭЛЭЛТ
• Ерөнхийдөө Х хувьсагчдын дунд төгс шугаман хамаарал байхгүй.
Иймээс (10.2.1)-т өгөгдсөн хазайлтаар илэрхийлсэн гурван
хувьсагчийн загварыг дахин авч үзвэл төгс мультиколлинеарын оронд
дараах тэгшитгэл бидэнд байна
• x3i = λx2i + vi (10.3.1)
• энд λ ≠ 0 ба энд vi нь x2ivi = 0 бүхий стохастик алдааны утга.
• Энэ тохиолдолд β2 ба β3 регрессийн коэффициентүүдийн үнэлэлт
боломжтой болно. Жишээ нь, (10.3.1)-г (7.4.7)-д орлуулвал
• энд Σx2ivi = 0 болохыг ашигласан. βˆ3-г ижил илэрхийлж болно.
• Одоо (10.2.2)-с ялгаатай нь (10.3.2) тооцогдохгүй гэдэгт итгэх ямар ч
шалтгаан байхгүй. Мэдээж хэрэв vi нь хангалттай бага, тэг утганд
маш ойр бол (10.3.1) бараг төгс коллинеар болох ба бид (10.2.2)-ийн
тодорхой бус тохиолдол руу буцах болно.
МУЛЬТИКОЛЛИНЕАРЫН ПРАКТИК ҮР ДАГАВАР
• Бараг мультиколлинеар тохиолдолд дараах үр дагаваруудтай учрах
магадлалтай юм:
• 1. Хэдий BLUE байсан ч OLS үнэлэлтүүдийн дисперс болон ковариац
их бол нарийн үнэлэлт хийхэд хэцүү болно.
• 2. 1-р үр дагавараас шалтгаалан итгэх завсар их өргөн байх
хандлагатай байдаг ба “тэг таамаглал” (жишээ нь, жинхэнэ эх
олонлогийн коэффициент тэг байна)-ыг хүлээн зөвшөөрөхөд хялбар
болно.
• 3. Мөн 1-р үр дагавараас шалтгаалан нэг ба түүнээс олон
коэффициентийн t харьцаа статистик ач холбогдолгүй болох
хандлагатай.
• 4. Хэдий нэг ба түүнээс олон коэффициентийн t харьцаа статистик ач
холбогдолгүй байсан ч R2
их байж болно.
• 5. OLS үнэлэлтүүд болон тэдгээрийн стандарт алдаа нь өгөгдлийн бага
зэргийн өөрчлөлтөд мэдрэмжтэй байж болно. Өмнөх үр дагаваруудыг
дараах байдлаар харуулж болно.
• OLS үнэлэлтүүдийн дисперс, ковариаци их байх
• Дисперс болон ковариаци их байгааг харахын тулд (10.2.1) загварын
хувьд βˆ2 ба βˆ3-ийн дисперс ба ковариаци нь:
• Энэ нь (7.4.12) ба (7.4.15)-аас r23 1-рүү тэмүүлж коллинеар байдал өсөх
үед хоёр үнэлэлтийн дисперс өсөх ба r23 = 1 үед хязгааргүй болно. Энэ нь
мөн адил (7.4.17)-оос r23 1-рүү тэмүүлэхэд хоёр үнэлэлтийн ковариаци
абсолют утгаараа өсөх нь тодорхой байна.
• Өргөн итгэх завсар
• Стандарт алдаа их учир холбогдох эх олонлогийн параметрийн итгэх
завсар их болох хандлагатай болохыг хүснэгт 10.2-оос харж болно.
Жишээ нь, r23 = 0.95 үед β2 –ийн итгэх завсар нь r23 = 0 байх үеийнхээс их
байна ( )
• Мөн түүнчлэн өндөр мультиколлинеартай тохиолдолд түүвэр өгөгдөл
таамаглалын янз бүрийн олонлогт нийцтэй байж болно. Иймээс буруу
таамаглалыг зөвшөөрөх магадлал (жишээ нь, II төрлийн алдаа) өснө.
• “Ач холбогдолгүй” t харьцаа
• Бид өндөр коллинеарын нөхцөлд үнэлэгдсэн стандарт алдаанууд эрс
өсч улмаар t утгууд бага болдогийг харсан. Иймээс энэ тохиолдолд
холбогдох жинхэнэ эх олонлогийн утга тэг гэсэн тэг таамаглалыг улам
их хүлээн зөвшөөрөх болно.
• R2
өндөр боловч ач холбогдолтой t харьцаа цөөн байх
• k-хувьсагчтай шугаман регрессийн загварыг авч үзье:
• Yi = β1 + β2X2i + β3X3i +· · ·+βkXki + ui
• Өндөр коллинеар тохиолдолд нэг ба түүнээс олон тухайн өнцгийн
коэффициентүүд t тестэд үндэслэн статистик ач холбогдолгүй байж
болох юм. Гэсэн хэдий ч ийм нөхцөлд R2
маш өндөр буюу 0.9-с их бол F
тестэд суурилан β2 = β3 = · · · = βk = 0 таамаглалыг итгэл
үнэмшилтэйгээр няцааж болно. Үнэхээр энэ бол мультиколлинеарын нэг
дохио юм—t утга ач холбогдолгүй боловч R2
өндөр байх (мөн F утга ач
холбогдолтой байх)!
• OLS үнэлэлтүүд болон тэдгээрийн стандарт алдаанууд өгөгдлийн бага
хэмжээний өөрчлөлтөд мэдрэмжтэй байх
• Төгс бус мультиколлинеарын нөхцөлд регрессийн коэффициентүүдийн
үнэлэлт боломжтой боловч үнэлэлт болон стандарт алдаа нь өгөгдлийн
өчүүхэн өөрчлөлтөд ихээхэн мэдрэмжтэй байдаг.
• Үүнийг харахын тулд хүснэгт 10.3-г авч үзье. Эдгээр өгөгдөлд үндэслэн
бид дараах олон хэмжээст регрессийг байгуулъя:
Yˆi = 1.1939 + 0.4463X2i + 0.0030X3i
(0.7737) (0.1848) (0.0851)
t = (1.5431) (2.4151) (0.0358) (10.5.6)
R2
= 0.8101 r23 = 0.5523
• cov (βˆ2, βˆ3) = −0.00868 df = 2
• (10.5.6) регресс нь хэдий βˆ2 нь нэг талт t тестэд үндэслэн 10 хувийн
түвшинд ач холбогдолтой байгаа боловч регрессийн
коэффициентүүдийн нэг нь ч 1 ба 5 хувийн итгэх түвшинд ач
холбогдолгүй байгааг харуулж байна. Хүснэгт 10.4-г ашиглан:
Yˆi = 1.2108 + 0.4014X2i + 0.0270X3i
(0.7480) (0.2721) (0.1252)
t = (1.6187) (1.4752) (0.2158) (10.5.7)
R2
= 0.8143 r23 = 0.8285
cov (βˆ2, βˆ3) = −0.0282 df = 2
• Өгөгдөл өчүүхэн өөрчлөгдсөний үр дүнд өмнө 10 хувийн итгэх түвшинд
статистик ач холбогдолтой байсан βˆ2 ач холбогдолгүй болсон байна.
Мөн (10.5.6)-д cov (βˆ2, βˆ3) = −0.00868 байсан бол (10.5.7)-д энэ нь
−0.0282 буюу гурав дахин өссөн байна. Эдгээр бүх өөрчлөлтүүд
мультиколлинеар өссөнтэй холбоотой байж болох юм: (10.5.6)-д r23 =
0.5523 байсан бол (10.5.7)-д энэ нь 0.8285 байна. Мөн адил βˆ2 ба βˆ3-ийн
стандарт алдаанууд хоёр регрессийн хооронд өсч байгаа нь
коллинеарын ердийн шинж тэмдэг юм.
ТАЙЛБАР БҮХИЙ ЖИШЭЭ: ОРЛОГО БА БАЯЛАГТАЙ ХАМААРАЛ
БҮХИЙ ХЭРЭГЛЭЭНИЙ ЗАРДАЛ
• Хүснэгт 10.5 дахь хэрэглээ-орлогын жишээг дахин авч үзье. Бид дараах
регрессийг олж авна:
Yˆi = 24.7747 + 0.9415X2i − 0.0424X3i
(6.7525) (0.8229) (0.0807)
t = (3.6690) (1.1442) (−0.5261) (10.6.1)
R2
= 0.9635 R¯2
= 0.9531 df = 7
• (10.6.1) регресс нь орлого болон баялаг хамтдаа хэрэглээний зардлын
хэлбэлзлийн 96 хувийг тайлбарлаж байгаа ба өнцгийн
коэффициентүүд статистик ач холбогдолгүй байгааг харуулж байна.
Баялаг хувьсагч буруу тэмдэгтэй байна. Хэдий βˆ2 ба βˆ3 нь статистик
ач холбогдолгүй байгаа ч хэрэв бид β2 = β3 = 0 гэсэн таамаглал
шалгавал энэ таамаглал хүснэгт 10.6-д харуулсан шиг няцаагдана.
Source of variation SS df MSS
Due to regression 8,565.5541 2 4,282.7770
Due to residual 324.4459 7 46.3494
• Ердийн таамаглалын дагуу:
• F =4282.7770 / 46.3494 = 92.4019 (10.6.2)
• F утга нь өндөр ач холбогдолтой нь тодорхой байна. Бидний жишээ
мультиколлинеар гэж юу болохыг тодорхой харуулж байна.
• F тест ач холбогдолтой боловч X2 ба X3 –ийн t утгууд ач холбогдолгүй
байгаа нь хоёр хувьсагч өндөр корреляцитай бөгөөд орлого болон
баялгийн хэрэглээнд үзүүлэх тус бүрийн нөлөөг тусгаарлах боломжгүй
болохыг илэрхийлнэ.
• Хэрэв бид X3-г X2-с хамааруулан регресс байгуулвал
Xˆ3i = 7.5454 + 10.1909X2i
(29.4758) (0.1643) (10.6.3)
t = (0.2560) (62.0405) R2
= 0.9979
• X3 ба X2 хоорондоо бараг төгс коллинеар байна
• Одоо хэрэв Y-г X2-с хамааруулан регресс байгуулвал юу тохиолдохыг
харъя:
Yˆi = 24.4545 + 0.5091X2i
(6.4138) (0.0357) (10.6.4)
t = (3.8128) (14.2432) R2
= 0.9621
• (10.6.1)-д орлого хувьсагч статистик ач холбогдолгүй байсан бол одоо
харин ач холбогдолтой байна.
• Y –г X2 –с хамааруулан регресс байгуулахын оронд X3-с хамааруулан
байгуулвал
Yˆi = 24.411 + 0.0498X3i
(6.874) (0.0037) (10.6.5)
t = (3.551) (13.29) R2 = 0.9567
• (10.6.1)-д баялаг хэрэглээний зардалд нөлөөгүй байсан бол одоо харин
чухал нөлөөтэй болохыг харж байна.
• (10.6.4) ба (10.6.5) регрессүүд их хэмжээний мультиколлинеарын
нөхцөлд өндөр коллинеар хувьсагчийг нь хасахад нөгөө Х хувьсагч нь
статистик ач холбогдолтой болж байгааг тодорхой харуулж байна.
Энэ үр дүн нь туйлын коллинеараас зугтах арга зам нь коллинеар
хувьсагчийг хасах явдал болохыг харуулж байна.
МУЛЬТИКОЛЛИНЕАРЫГ ИЛРҮҮЛЭХ
• Өгөгдсөн нөхцөлд, ялангуяа загварт хоёроос олон тайлбарлагч
хувьсагч орсон үед коллинеар оршин байгааг хэрхэн мэдэх вэ?
Kmenta-ийн анхааруулгыг энд саная:
• 1. Мультиколлинеар нь хэмжээний асуудал юм. Гол онцлог нь
мультиколлинеар байгаа, байхгүй нь биш харин түүний янз бүрийн
түвшингээс хамаарна.
• 2. Мультиколлинеар нь эх олонлогийн бус түүврийн онцлог юм. Мөн
түүнчлэн бид “мультиколлинеарыг шалгахгүй” харин ямар нэг
тодорхой түүврийн хувьд түүний түвшинг хэмжинэ.
• Бидэнд түүнийг илрүүлэх, түүний хүчийг хэмжих ганц арга байхгүй.
Бидэнд байгаа зүйл нь зарим албан ба албан бус эрхий хурууны дүрэм
юм.
• 1. R2
их боловч цөөн ач холбогдол бүхий t харьцаа. Хэрэв R2
их бол (0.8-с
их) ихэнх тохиолдолд F тестээр тухайн өнцгийн коэффициентүүд
нэгэн зэрэг тэгтэй тэнцүү гэсэн таамаглал няцаагддаг боловч t тест нь
нэг ч биш эсвэл маш цөөн тухайн өнцгийн коэффициент статистикийн
хувьд тэгээс ялгаатай болохыг харуулах үед.
• 2. Тайлбарлагч хувьсагчид хос хосоороо өндөр корреляцитай үед. Эрхий
хурууны өөр нэг санал болгох дүрэм нь хэрэв хоёр тайлбарлагч
хувьсагчийн хоорондох тэг эрэмбийн корреляцийн коэффициент өндөр
бол (0.8-с их) мультиколлинеар нь ноцтой асуудал юм. Энэ
шалгуурын асуудал нь гэвэл хэдий өндөр тэг эрэмбийн корреляци
коллинеар болохыг илэрхийлэх ч, ямар ч тохиолдолд коллинеар
байхын тулд тэд заавал өндөр байх шаардлагүй, тэг эрэмбийн буюу
энгийн корреляци нь харьцангуй бага байсан ч оршин байж болно (0.50-с
бага).
• 3. Тухайн корреляцийг авч үзэх. Тэг эрэмбийн корреляцид тулгуурлах
нь ердөө л нэг асуудал ба Farrar болон Glauber нар тухайн
корреляцийн коэффициентийг харахыг санал болгосон. Иймээс Y-ийн
X2, X3, ба X4-ээс хамааруулан байгуулсан регрессийн хувьд R2
1.234 нь маш
их боловч r2
12.34, r2
13.24, болон r2
14.23 нь харьцангуй бага бол X2, X3, болон X4
хувьсагчид хоорондоо эсвэл наанадаж нэг хувьсагч хэт их
корреляцитай байна.
• Хэдий тухайн корреляцийг судлах нь ашигтай байж болох ч
мультиколлинеарыг илрүүлэх төгс хөтөч гэх баталгаа байхгүй ба R2
болон бүх тухайн корреляциуд хангалттай их байж болно. Гэвч илүү
чухал нь C. Robert Wichers өгөгдсөн тухайн корреляци нь өөр өөр
мультиколлинеар хэв шинжид нийцтэй байж болох тул Farrar-
Glauber-ийн тухайн корреляцийн тест үр ашиггүй болохыг харуулсан.
Farrar–Glauber тест маш их шүүмжлэгдэж байгаа.
• 4. Туслах регресс. Аль Х хувьсагч нь бусад Х хувьсагчидтай холбоотойг
олох нэг арга нь Xi бүрийг үлдсэн Х хувьсагчидтай халз регресс
байгуулах ба харгалзах R2
болох R2
i –г тооцох явдал юм. Эдгээр регресс
бүрийг Х-с хамаарах Ү-ийн гол регрессийн туслах регресс гэдэг. (8.5.11)-д
илэрхийлсэн F ба R2
хоорондын хамаарлын дагуу хувьсагч (10.7.3) k−2
ба n−k+1 чөлөөний зэрэг бүхий F тархалттай байна.
• Тэгшитгэл (10.7.3)-д n нь түүврийн хэмжээ, k нь параметрийн тоо,
болон R2
өгөгдсөн
• xi ·x2x3···xk нь Xi хувьсагчийн үлдсэн Х хувьсагчдаас хамаарах регресс
дэх детерминацийн коэффициент.
• Хэрэв сонгосон ач холбогдлын түвшинд F тооцсон утга Fi критик
утгаас их бол Xi нь бусад Х-тэй коллинеар гэдгийг илэрхийлнэ; хэрэв Fi
критик утгаас их биш бол бусад Х-тэй коллинеар биш гэж үзэж болох
ба энэ тохиолдолд бид энэ хувьсагчийг загварт үлдээж болно.
• Klien-ий эрхий хурууны дүрэм
• Бүх туслах R2
утгуудын албан ёсны тестийн оронд хэрэв туслах
регрессээс олдсон R2
нь гол R2
-с (бүх тайлбарлагч хувьсагчдаас
хамааруулан үнэлсэн Ү-ийн регресс) их үед л төвөгтэй асуудал үүсгэдэг
гэж үздэг Klien-ий эрхий хурууны дүрмийг дэмжиж болно. Мэдээж
бусад бүх эрхий хурууны дүрмийн адил энэ ч бас ухаалаг шийдэл юм.
ЗАЛРУУЛАХ АРГА ХЭМЖЭЭ
• Хэрэв мультиколлинеар ноцтой бол юу хийж болох вэ? Бидэнд хоёр
сонголт бий:
• (1) юу ч хийхгүй байх эсвэл
• (2) зарим эрхий хурууны дүрмийг дагах.
• Юу ч хийхгүй байх.
• Яагаад?
• Мультиколлинеар нь үндсэндээ мэдээлэл дутагдах асуудал
(micronumerosity) ба заримдаа бидэнд мэдээлэл дээр ямар ч сонголт
байдаггүй.
• Хэрэв бид нэг ба түүнээс олон регрессийн коэффициентийг илүү
нарийн үнэлж чадаагүй үед тэдгээрийн шугаман хослол (жишээ нь,
үнэлж болох функц) харьцангуй үр ашигтай үнэлэгдэж болно.
• yi = αˆx2i + uˆi (10.2.3)
• хэрэв бид хоёр параметрийг тусад нь үнэлж чадахгүй бол ганц α-г
үнэлж болно. Зарим үед өгөгдсөн өгөгдөл олонлогийн хувьд энэ нь
бидний хийж чадах хамгийн сайн зүйл байдаг.
• Эрхий хурууны дүрмийн процедур
• 1. Априори мэдээлэл. Дараах загварыг авч үзье
• Yi = β1 + β2X2i + β3X3i + ui
• энд Y = хэрэглээ, X2 = орлого, ба X3 = баялаг. Бид β3 = 0.10β2 гэж итгэж
байгаа ба баялагтай холбоотой хэрэглээний өөрчлөлтийн түвшин нь
орлоготой холбоотой харгалзах түвшиний аравны нэгтэй тэнцүү.
Дараах регрессийг байгуулъя:
• Yi = β1 + β2X2i + 0.10β2X3i + ui = β1 + β2Xi + ui
• энд Xi = X2i + 0.1X3i .
• Бид βˆ2-г олсноор β2 ба β3 –ийн хоорондох дурьдсан хамаарлаас βˆ3 –г
үнэлж болно. Априори мэдээллийг хэрхэн олох вэ? Энэ нь өмнөх
эмпирик ажлаас гарч ирнэ.
• Жишээ нь, Кобб-Дуглас хэлбэрийн үйлдвэрлэлийн функц
• Yi= β1X2i
β2
X3i
β3
eui
(7.9.1)
• хэрэв өргөжилтийн тогтмол үр өгөөжтэй гэж таамаглавал (β2 + β3) = 1,
энэ тохиолдолд регресс нь:
• ln (GDP/Labor)t= β1+ α ln (Capital/Labor)t (8.7.14)
• Гарц хөдөлмөрийн харьцааны эсрэг капитал хөдөлмөрийн
харьцаагаар халз регресс байгуулна. Хэрэв хөдөлмөр капитал
хоорондоо коллинеар бол ерөнхийдөө ихэнх түүвэр өгөгдлийн
тохиолдолд хувиргалт хийх замаар коллинеарын асуудлыг бууруулж
эсвэл арилгаж болно. Гэвч ийм априори хязгаарлалт тавих тухайд
анхаарах зүйл нь, “. . . Ер нь бид үнэн биш байж болох мэдээлэлд
асуудлыг орхих бус харин эдийн засгийн онолын априори таамаглалыг
шалгахыг хүсч байгаа.”
• 2. Орон зайн болон хугацааны цуваан өгөгдлийг нэгтгэх.
• Априори мэдээллийн техникийн хувилбар нь орон зайн болон
хугацааны цуваан өгөгдлийн хослол юм. Бид АНУ дахь автомашины
эрэлтийг судлахыг хүссэн ба бидэнд борлуулсан машины тоо, машины
дундаж үнэ, хэрэглэгийн орлогын хугацааны цуваан өгөгдөл байгаа гэе.
• ln Yt = β1 + β2 ln Pt + β3 ln It + ut
• энд Y = борлуулсан машины тоо, P = дундаж үнэ, I = орлого, ба t =
хугацаа. Зорилго нь үнийн мэдрэмж β2 болон орлогын мэдрэмж β3-г
үнэлэх
• Хугацааны цуваан өгөгдөлд үнэ болон орлого хувьсагчид ерөнхийдөө
өндөр коллинеар байх хандлагатай. Tobin нэг арга санал болгосон нь
хэрэв бидэнд орон зайн өгөгдөл байгаа бол энэ нь нэг цаг хугацаан
дахь өгөгдөл тул үнэ нэг их өөрчлөгдөхгүй тул бид орлогын мэдрэмж β3
–ийн нэлээн үнэн зөв үнэлэлтийг олж авах боломжтой. Орон зайн
өгөгдлөөр үнэлэгдсэн орлогын мэдрэмж βˆ3 гэе. Энэ үнэлэлтийг ашиглан
бид өмнөх хугацааны цуваан регрессийг бичиж болно:
• Y*t = β1 + β2 ln Pt + ut
• энд Y* = ln Y − βˆ3 ln I, Y* нь орлогын нөлөөг арилгасны дараах Ү-ийн
утгыг илэрхийлнэ. Бид одоо өмнөх регрессээс үнийн мэдрэмж β2 –г
үнэлж чадна.
• Хэдий энэ нь сонирхолтой арга боловч хугацааны цуваан болон орон
зайн өгөгдлийг нэгтгэх арга нь тайлбарлахад асуудал үүсгэж болох юм.
Учир нь бид орон зайн өгөгдлөөр үнэлсэн орлогын мэдрэмж нь цэвэр
хугацааны цуваан шинжилгээнээс олдох утгатай адил гэж үзсэн.
• 3. Хувьсагч орхих буюу тодорхойлолтын хазайлт.
• Бидний хэрэглээ-орлого-баялгийн жишээнд бид баялаг хувьсагчийг
орхивол (10.6.4)-р регрессийг байгуулах ба анхны загварт орлого
хувьсагч статистик ач холбогдолгүй байсан бол энд одоо өндөр ач
холбогдолтой байна. Гэхдээ загварт хувьсагч орхисноор бид
тодорхойлолтын алдаа гаргаж болох юм.
• Мультиколлинеарын асуудлыг арилгахын тулд загвараас хувьсагчийг
хасах нь тодорхойлолтын хазайлтад хүргэж болно. Иймээс зарим
нөхцөлд эм нь өвчнөөс илүү муу байж болно. Бараг коллинеарыг үл
харгалзан OLS үнэлэлтүүд нь BLUE байдгийг сана.
• 4. Хувьсагчдыг хувиргах. Бидэнд хэрэглээний зардал, орлого, болон
баялгийн хугацааны цуваан өгөгдөл байгаа гэе. Орлого ба баялгийн
ийм өгөгдлийн хооронд өндөр мультиколлинеар байх нэг шалтгаан нь
хугацааны туршид эдгээр хоёр хувьсагч нэг чиглэлтэй хөдөлж байж
болно. Энэ хамаарлыг минимумчилах нэг арга нь дараах байдлаар
үргэлжлэх явдал юм. Хэрэв хамаарал нь
• Yt = β1 + β2X2t + β3X3t + ut (10.8.3)
• t хугацаанд уявал хугацааны эхлэл нь дурын байх тул t − 1 хугацааг мөн
уяж болно. Иймээс
• Yt−1 = β1 + β2X2,t−1 + β3X3,t−1 + ut−1 (10.8.4)
• Хэрэв бид (10.8.4)-г (10.8.3)-с хасвал
• Yt − Yt−1 = β2(X2t − X2,t−1) + β3(X3t − X3,t−1) + vt (10.8.5)
• энд vt = ut − ut−1. Тэгшитгэл (10.8.5)-г нэгдүгээр эрэмбийн ялгаврын хэлбэр
гэнэ.
• 1. Нэгдүгээр эрэмбийн ялгаврын регрессийн загвар үргэлж
мультиколлинеарын ноцтой байдлыг бууруулдаг. Учир нь хэдий X2 ба X3
өндөр корреляци хамааралтай боловч тэдгээрийн ялгавар нь мөн адил
өндөр корреляцитай гэж итгэх шалтгаан байхгүй. Нэгдүгээр эрэмбийн
хувиргалтын нэмэлт давуу тал нь стационарь бус хугацааны цувааг
стационарь болгодог байж болох юм. Хугацааны цуваа Yt –ийн дундаж
болон дисперс нь хугацааны туршид системтэй өөрчлөгддөггүй бол
стационарь байна.
• 2. Өөр нэг практикт нийтлэг ашигладаг хувиргалт нь харьцангуй
хувиргалт юм. Дараах загварыг авч үзье:
• Yt = β1 + β2X2t + β3X3t + ut (10.8.6)
• энд Y нь бодит хэрэглээний зардал, X2 нь ДНБ, ба X3 нь нийт хүн ам. ДНБ
ба хүн ам хугацааны туршид өсөхөд корреляци хамааралтай болно. Энэ
асуудлын нэг “шийдэл” нь энэ загварыг нэг хүнд ногдох утгад суурилан
илэрхийлэх явдал бөгөөд (10.8.4)-г X3-т хуваавал:
• Yt/X3t = β1(1/X3t) + β2 (X2t X3t) + β3 + (ut/X3t) (10.8.7)
• Ийм хувиргалт нь анхны хувьсагчид дахь коллинеарыг бууруулж болох
юм. Гэхдээ нэгдүгээр эрэмбийн ялгавар ба харьцангуй хэмжигдэхүүний
хувиргалт нь асуудалгүй байдаггүй. Жишээ нь, (10.8.5) дахь алдааны утга
vt нь сонгодог шугаман регрессийн загварын зөрүү нь сериал
корреляцигүй байна гэсэн урьдчилсан нөхцлийг хангахгүй байж болох
юм. Бүлэг 12-т хэрэв анхны зөрүүгийн утга ut нь сериал корреляцигүй бол
алдааны утга vt нь ихэнх тохиолдолд сериал корреляцитай байдаг.
Иймээс эм нь өвчнөөс илүү муу байж болох юм.
• Үүнээс гадна ялгаврын процедураар нэг ажиглалтын нэгж алдагддаг.
Бага түүвэрт энэ нь анхааралдаа авах гол хүчин зүйл байж болох юм.
• Цаашилбал, нэгдүгээр эрэмбийн ялгаврын процедур нь ажиглалтад
логик эрэмбэ байхгүй тул орон зайн өгөгдөлд тохирохгүй байж болох юм.
Үүнтэй нэгэн адил харьцангуй хэмжигдэхүүний загвар (10.8.7)-д анхны
алдааны утга ut нь гомскедастик бол алдааны утга (ut/X3t) гетероскедастик
байхыг бүлэг 11-т харах болно. Мөн дахин эм нь коллинеарын өвчнөөс
илүү муу байж болно.
• Товчхондоо, мультиколлинеарын асуудлыг шийдэхийн тулд өгөгдлийг
нэгдүгээр эрэмбийн ялгаврын эсвэл харьцангуй хэмжигдэхүүний аргыг
ашиглан хувиргахдаа болгоомжтой байх хэрэгтэй.
• 5. Нэмэлт буюу шинэ өгөгдөл. Мультиколлинеар нь түүврийн онцлог юм
бол ижил хувьсагчид оролцсон өөр түүврийн коллинеар нь эхний
түүврийнх шиг ноцтой биш байж болох юм. Заримдаа түүврийн хэмжээг
өсгөх нь (хэрэв боломжтой бол) коллинеарын асуудлыг сулруулж болох
юм. Жишээ нь, 3 хувьсагчийн загварт
• var (βˆ2) = σ2
/ x2
2i(1 − r2
23)
• Одоо түүврийн хэмжээ өсөхөд, Σx2
2i ерөнхийдөө өснө. Мөн түүнчлэн
аливаа өгөгдсөн r23-ийн хувьд βˆ2-ийн дисперс буурна, иймээс стандарт
алдаа буурч β2-ийг илүү нарийн үнэлэх боломжтой болно.
• Жишээ болгож хэрэглээний зардал Y-ийн орлого X2 ба баялаг X3-с
хамаарах дараах регрессийг 10 ажиглалтад суурилан авч үзье:
• Yˆi = 24.377 + 0.8716X2i − 0.0349X3i
• t = (3.875) (2.7726) (−1.1595) R2
= 0.9682 (10.8.8)
• Энэ регрессийн баялгийн коэффициент нь зөвхөн буруу тэмдэгтэй бус
мөн 5 хувийн түвшинд статистик ач холбогдолгүй байна. Гэхдээ
түүврийн хэмжээ 40 ажиглалт болж өсөхөд дараах үр дүн олдсон:
• Yˆi = 2.0907 + 0.7299X2i + 0.0605X3i
• t = (0.8713) (6.0014) (2.0014) R2
= 0.9672 (10.8.9)
• Одоо баялгийн коэффициент зөвхөн зөв тэмдэгтэй байгаад зогсохгүй 5
хувийн түвшинд статистик ач холбогдолтой байна. Нэмэлт, илүү сайн
өгөгдөл олох нь үргэлж хялбар байдаггүй
• 6. Мультиколлинеарыг засварлах бусад арга.
• Хүчин зүйлийн шинжилгээ, үндсэн бүрэлдэхүүн зэрэг олон хүчин
зүйлстэй статистик арга техникүүд болон голч регрессийн техникүүд
мультиколлинеарын асуудлыг шийдвэрлэхэд байнга ашиглагддаг.
Эдгээрийг матриц алгебргүйгээр шийдэх боломжгүй юм.
МУЛЬТИКОЛЛИНЕАР НЬ ЗААВАЛ МУУ БАЙХ УУ?
ЗӨВХӨН ПРОГНОЗ ХИЙХ ЗОРИЛГОТОЙ БОЛ ҮГҮЙ БАЙЖ БОЛОХ
ЮМ
• Хэрэв регрессийн шинжилгээний ганц зорилго нь прогноз хийх бол R2
их үед
прогноз сайн байх тул мультиколлинеар нь ноцтой асуудал биш байж болно.
Гэхдээ энэ нь “. . . Прогнозын хувьд тайлбарлагч хувьсагчдын утгууд нь анхны
өгөгдөл матриц Х шиг бараг шугаман хамааралтай байж болно”. Иймээс хэрэв
үнэлсэн регрессийн загварын хувьд ойролцоогоор X2 = 2X3 байвал Ү-ийн
прогноз хийхэд ашиглагдах ирээдүйн түүвэр X2 нь ойролцоогоор 2X3-тай тэнцүү
байх хүнд нөхцөл практикт тулгарвал прогнозын тодорхойгүй байдал өснө.
Үүнээс гадна, хэрэв шинжилгээний зорилго зөвхөн прогноз хийх биш харин
параметрийн найдвартай үнэлэлт хийх явдал бол мультиколлинеар нь
үнэлэлтийн их хэмжээний стандарт алдаанд хүргэдэг учраас ноцтой асуудал
болно. Нэг нөхцөлд л мультиколлинеар нь ноцтой асуудал биш болно. Энэ нь R2
утга их, регрессийн коэффициентүүд өндөр t утгын хувьд ач холбогдолтой байх
тохиолдол юм. Мультиколлинеарын оношлогоо болох нөхцөл байдлын индекс
нь өгөгдөлд ноцтой коллинеар байгааг илэрхийлнэ. Ийм нөхцөл байдал хэзээ
үүсч болох вэ? Johnston-ий тэмдэглэснээр: Энэ нь хэрэв параметрүүд тоон
чанарын хувьд жинхэнэ утгаасаа илүү сайн байх, хөөрөгдсөн стандарт алдааг
үл харгалзан нөлөөтэй байх ба үнэлэлтийн сул тал байгаа ч түүний жинхэнэ
утга нь ач холбогдолтой байсаар байх.

More Related Content

What's hot

урт хугацаат өр төлбөрийн бүртгэл
урт хугацаат өр төлбөрийн  бүртгэл урт хугацаат өр төлбөрийн  бүртгэл
урт хугацаат өр төлбөрийн бүртгэл Bachkana Enhbat
 
бараа материалын бүртгэл
бараа материалын бүртгэлбараа материалын бүртгэл
бараа материалын бүртгэл
Enebish Vandandulam
 
зээлийн хүүгийн түвшин
зээлийн хүүгийн түвшин зээлийн хүүгийн түвшин
зээлийн хүүгийн түвшин
Mr Nyak
 
Lekts 9
Lekts 9Lekts 9
Lekts 9Pmunkh
 
Онцгой албан татвар
Онцгой албан татварОнцгой албан татвар
Онцгой албан татварDelgermaa Battulga
 
Санхүүгийн тайланг зөв цэгцтэй ойлгох нь
Санхүүгийн тайланг зөв цэгцтэй ойлгох нь Санхүүгийн тайланг зөв цэгцтэй ойлгох нь
Санхүүгийн тайланг зөв цэгцтэй ойлгох нь
Azzaya L
 
Санхүү, НББ-ийн мэдээллийн систем
Санхүү, НББ-ийн мэдээллийн системСанхүү, НББ-ийн мэдээллийн систем
Санхүү, НББ-ийн мэдээллийн систем
E-Gazarchin Online University
 
Sbeul3.2019 2020on
Sbeul3.2019  2020onSbeul3.2019  2020on
Sbeul3.2019 2020on
hicheel2020
 
Арилжааны банк гэж юу вэ?
Арилжааны банк гэж юу вэ?Арилжааны банк гэж юу вэ?
Арилжааны банк гэж юу вэ?2011_2013
 
микро эдийн засаг : судлах зүйл, судалгааны арга
микро эдийн засаг : судлах зүйл, судалгааны аргамикро эдийн засаг : судлах зүйл, судалгааны арга
микро эдийн засаг : судлах зүйл, судалгааны аргаГончигжавын Болдбаатар
 
Sanhuugiin tailangiin butets zohion baiguulalt
Sanhuugiin tailangiin butets zohion baiguulaltSanhuugiin tailangiin butets zohion baiguulalt
Sanhuugiin tailangiin butets zohion baiguulalt
E-Gazarchin Online University
 
Нягтлан бодох бүртгэлийн үндэс хичээл 11 ШИДС
Нягтлан бодох бүртгэлийн үндэс  хичээл 11 ШИДС Нягтлан бодох бүртгэлийн үндэс  хичээл 11 ШИДС
Нягтлан бодох бүртгэлийн үндэс хичээл 11 ШИДС Chuluun Zulaa
 
Lecture 5,6
Lecture 5,6Lecture 5,6
Lecture 5,6Bbujee
 
эдийн засаг дахь төрийн оролцоо
эдийн засаг дахь төрийн оролцооэдийн засаг дахь төрийн оролцоо
эдийн засаг дахь төрийн оролцооSilkroad10
 
үйлдвэрийн нэмэгдэл зардлын бүртгэл
үйлдвэрийн нэмэгдэл зардлын бүртгэлүйлдвэрийн нэмэгдэл зардлын бүртгэл
үйлдвэрийн нэмэгдэл зардлын бүртгэл
Enebish Vandandulam
 
Санхүүгийн эрсдэл ба өгөөж
Санхүүгийн эрсдэл ба өгөөжСанхүүгийн эрсдэл ба өгөөж
Санхүүгийн эрсдэл ба өгөөжAdilbishiin Gelegjamts
 
арилжааны банкууд
арилжааны банкуударилжааны банкууд
арилжааны банкууд
Nomin-Erdene Gantur
 
Sanhuugiin tailangiin shinjilgee 2
Sanhuugiin tailangiin shinjilgee 2Sanhuugiin tailangiin shinjilgee 2
Sanhuugiin tailangiin shinjilgee 2
E-Gazarchin Online University
 
Санхүү үндэс Лекц 1
Санхүү үндэс Лекц 1Санхүү үндэс Лекц 1
Санхүү үндэс Лекц 1
Gunjargal
 

What's hot (20)

урт хугацаат өр төлбөрийн бүртгэл
урт хугацаат өр төлбөрийн  бүртгэл урт хугацаат өр төлбөрийн  бүртгэл
урт хугацаат өр төлбөрийн бүртгэл
 
лекц №7
лекц №7лекц №7
лекц №7
 
бараа материалын бүртгэл
бараа материалын бүртгэлбараа материалын бүртгэл
бараа материалын бүртгэл
 
зээлийн хүүгийн түвшин
зээлийн хүүгийн түвшин зээлийн хүүгийн түвшин
зээлийн хүүгийн түвшин
 
Lekts 9
Lekts 9Lekts 9
Lekts 9
 
Онцгой албан татвар
Онцгой албан татварОнцгой албан татвар
Онцгой албан татвар
 
Санхүүгийн тайланг зөв цэгцтэй ойлгох нь
Санхүүгийн тайланг зөв цэгцтэй ойлгох нь Санхүүгийн тайланг зөв цэгцтэй ойлгох нь
Санхүүгийн тайланг зөв цэгцтэй ойлгох нь
 
Санхүү, НББ-ийн мэдээллийн систем
Санхүү, НББ-ийн мэдээллийн системСанхүү, НББ-ийн мэдээллийн систем
Санхүү, НББ-ийн мэдээллийн систем
 
Sbeul3.2019 2020on
Sbeul3.2019  2020onSbeul3.2019  2020on
Sbeul3.2019 2020on
 
Арилжааны банк гэж юу вэ?
Арилжааны банк гэж юу вэ?Арилжааны банк гэж юу вэ?
Арилжааны банк гэж юу вэ?
 
микро эдийн засаг : судлах зүйл, судалгааны арга
микро эдийн засаг : судлах зүйл, судалгааны аргамикро эдийн засаг : судлах зүйл, судалгааны арга
микро эдийн засаг : судлах зүйл, судалгааны арга
 
Sanhuugiin tailangiin butets zohion baiguulalt
Sanhuugiin tailangiin butets zohion baiguulaltSanhuugiin tailangiin butets zohion baiguulalt
Sanhuugiin tailangiin butets zohion baiguulalt
 
Нягтлан бодох бүртгэлийн үндэс хичээл 11 ШИДС
Нягтлан бодох бүртгэлийн үндэс  хичээл 11 ШИДС Нягтлан бодох бүртгэлийн үндэс  хичээл 11 ШИДС
Нягтлан бодох бүртгэлийн үндэс хичээл 11 ШИДС
 
Lecture 5,6
Lecture 5,6Lecture 5,6
Lecture 5,6
 
эдийн засаг дахь төрийн оролцоо
эдийн засаг дахь төрийн оролцооэдийн засаг дахь төрийн оролцоо
эдийн засаг дахь төрийн оролцоо
 
үйлдвэрийн нэмэгдэл зардлын бүртгэл
үйлдвэрийн нэмэгдэл зардлын бүртгэлүйлдвэрийн нэмэгдэл зардлын бүртгэл
үйлдвэрийн нэмэгдэл зардлын бүртгэл
 
Санхүүгийн эрсдэл ба өгөөж
Санхүүгийн эрсдэл ба өгөөжСанхүүгийн эрсдэл ба өгөөж
Санхүүгийн эрсдэл ба өгөөж
 
арилжааны банкууд
арилжааны банкуударилжааны банкууд
арилжааны банкууд
 
Sanhuugiin tailangiin shinjilgee 2
Sanhuugiin tailangiin shinjilgee 2Sanhuugiin tailangiin shinjilgee 2
Sanhuugiin tailangiin shinjilgee 2
 
Санхүү үндэс Лекц 1
Санхүү үндэс Лекц 1Санхүү үндэс Лекц 1
Санхүү үндэс Лекц 1
 

Viewers also liked

Econ ch 11
Econ ch 11Econ ch 11
Econ ch 9
Econ ch 9Econ ch 9
Econ ch 7
Econ ch 7Econ ch 7
Econ ch 6
Econ ch 6Econ ch 6
Shadow economy
Shadow economyShadow economy
Shadow economy
Baterdene Batchuluun
 
Econ ch 8
Econ ch 8Econ ch 8

Viewers also liked (6)

Econ ch 11
Econ ch 11Econ ch 11
Econ ch 11
 
Econ ch 9
Econ ch 9Econ ch 9
Econ ch 9
 
Econ ch 7
Econ ch 7Econ ch 7
Econ ch 7
 
Econ ch 6
Econ ch 6Econ ch 6
Econ ch 6
 
Shadow economy
Shadow economyShadow economy
Shadow economy
 
Econ ch 8
Econ ch 8Econ ch 8
Econ ch 8
 

Econ ch 10

  • 1. Бүлэг # 10: МУЛЬТИКОЛЛИНЕАР: РЕГРЕССОРУУД КОРРЕЛЯЦИ ХАМААРАЛТАЙ ҮЕД ЮУ БОЛОХ ВЭ?
  • 2. • Энэ бүлэгт бид дараах асуултуудад хариулт хайж энэ урьдчилсан нөхцлийг чухалд авч үзэх болно: • 1. Мультиколлинеарын мөн чанар юу вэ? • 2. Мультиколлинеар нь үнэхээр асуудал мөн үү? • 3. Практик үр дагавар нь юу вэ? • 4. Үүнийг хэрхэн мэдэх вэ? • 5. Мультиколлинеарын асуудлыг бууруулахын тулд ямар арга хэмжээ авч болох вэ?
  • 3. Мультиколлинеарын мөн чанар • Мультиколлинеар нь анхандаа регрессийн загварын зарим эсвэл бүх тайлбарлагч хувьсагчдын хооронд “төгс” шугаман хамаарал оршин байгааг илэрхийлдэг байсан. k-хувьсагчийн регресс нь X1, X2, . . . , Xk (энд бүх ажиглалтын нэгжийн хувьд X1 = 1 нь тогтмол параметрийг илэрхийлнэ) зэрэг тайлбарлагч хувьсагчдыг хамардаг ба дараах нөхцөл хангагдах үед яг шугаман хамааралтай гэж үзнэ: • λ1X1 + λ2X2 +· · ·+λkXk = 0 (10.1.1) • энд λ1, λ2, . . . , λk нь бүгд нэгэн зэрэг тэг биш байх тогтмолууд. • Өнөөдөр хэдийгээр мультиколлинеарын ухагдахуун нь Х хувьсагчид хоорондоо хамааралтай боловч төгс биш хамааралтай тохиолдлыг авч үзэхэд ашигладаг ба дараах хэлбэртэй байна: • λ1X1 + λ2X2 +· · ·+λ2Xk + vi = 0 (10.1.2) • энд vi нь стохастик алдааны утга.
  • 4. • төгс ба бараг төгс мультиколлинеарын хоорондох ялгааг харъя. Жишээ нь λ2 ≠ 0 гэвэл (10.1.1) нь дараах хэлбэрээр бичиж болно: • X2 нь хэрхэн бусад хувьсагчидтай төгс шугаман хамааралтай байгааг харуулна. Энэ нөхцөлд хувьсагч X2 болон (10.1.3)-ийн баруун гар талын шугаман хослолын хоорондох корреляцийн коэффициент нь бараг нэг болно. • Энгийнээр, хэрэв λ2 ≠ 0 бол тэгшитгэл (10.1.2) нь: • X2 нь бусад Х-ийн хослолын хувьд яг шугаман хамааралтай биш гэдгийг харуулна. Учир нь энэ нь стохастик алдааны утга vi-аар тодорхойлогдож байна.
  • 5. • Тоон жишээ, дараах таамаглалт өгөгдлийг авч үзье: • X2 X3 X*3 • 10 50 52 • 15 75 75 • 18 90 97 • 24 120 129 • 30 150 152 • Энд X3i = 5X2i нь тодорхой байна. Мөн түүнчлэн, r23 корреляцийн коэффициент нь нэг учраас X2 ба X3 –ийн хооронд төгс коллинеар оршин байна. X*3 хувьсагч нь X3 дээр санамсаргүй тооны хүснэгтээс олдсон дараах тоонуудыг нэмэх замаар хялбар олдоно: 2, 0, 7, 9, 2. Одоо X2 ба X*3 хоорондоо төгс коллинеар байхаа больсон байдаг. (X3i = 5X2i + vi ) Хэдий тийм боловч хоёр хувьсагчийн хооронд маш өндөр корреляцитай байгааг тэдгээрийн хоорондын корреляцийн коэффициент 0.9959 байгаагаас харж болно.
  • 6. • Мультиколлинеарын өмнөх алгебр аргыг зураг 10.1-т дүрсэлсэн болно. Энэ зурагт Y, X2, ба X3 дугуйнууд харгалзан Y-ийн хэлбэлзэл (хамааран хувьсагч) ба X2 ба X3 (тайлбарлагч хувьсагчид)-ыг илэрхийлнэ. Коллинеарын зэрэг нь X2 ба X3 дугуйнуудын давхардсан хэсгээр хэмжигдэнэ (будсан муж). Туйлын тохиолдолд, хэрэв X2 ба X3 нь бүрэн давхацвал (хэрэв X2 нь X3-ийн дотор бүрэн орсон, эсвэл эсрэгээрээ), төгс коллинеар болно.
  • 7.
  • 8. • Дашрамд, бидний тодорхойлсон мультиколлинеар нь Х хувьсагчдын хоорондох зөвхөн шугаман хамаарлаас хамаарна. Энэ нь тэдгээрийн хоорондын шугаман бус хамаарлын нөхцөлд ажиллахгүй. Жишээ нь, дараах регрессийн загварыг авч үзье: • Yi = β0 + β1Xi + β2X2 i + β3X3 i + ui (10.1.5) • энд, Y = үйлдвэрлэлийн нийт зардал ба X = гарц. X2 i (гарцын квадрат зэрэг) ба X3 i (гарцын куб зэрэг) хувьсагчид нь Xi-тэй функциональ хамааралтай нь ойлгомжтой байгаа ч уг хамаарал нь шугаман бус байна. • Сонгодог шугаман регрессийн загвар яагаад Х-үүдийн хооронд мультиколлинеар байхгүй гэж үздэг вэ? Шалтгаан нь: • Хэрэв мультиколлинеар нь төгс бол, Х хувьсагчдын регрессийн коэффициентүүд нь тодорхой бус, стандарт алдаа нь хязгааргүй. • Хэрэв мультиколлинеар нь бараг төгс бол регрессийн коэффициентүүд хэдий тодорхой байх хэдий ч стандарт алдаа ихтэй байх тул энэ нь коэффициентүүд нарийн, үнэн зөв тооцогдохгүй гэсэн үг.
  • 9. • Мультиколлинеарын хэд хэдэн эх үүсвэр байдаг. • 1. Мэдээлэл цуглуулах аргыг хэрэглэн тайлбарлагч хувьсагчдын эх олонлогоос авах түүврийн тоо хязгаарлагдмал байх. • 2. Загвар эсвэл түүвэр хийж буй эх олонлогт тавьсан хязгаарлалт. Жишээ нь, цахилгаан хэрэгслийн хэрэглээний орлого (X2) ба байшингийн хэмжээ (X3)-с хамаарах регресс (Өндөр X2 үргэлж өндөр X3- г илэрхийлнэ). • 3. Загварын тодорхойлолт, жишээ нь, ялангуяа Х хувьсагчийн хэмжээ бага үед регрессийн загварт олон гишүүнтийг нэмвэл. • 4. Илүү тодорхойлогдсон загвар. Энэ нь загвар ажиглалтын нэгжээс илүү олон тайлбарлагч хувьсагчидтай үед тохиолддог. • Мультиколлинеар үүсэх нэмэлт шалтгаанд, ялангуяа хугацааны цуваан өгөгдөлд, загварт орсон тайлбарлагч хувьсагчид нийтлэг трендтэй буюу хугацааны туршид бүгд өсдөг эсвэл буурдаг үед тохиолдоно.
  • 10. ТӨГС МУЛЬТИКОЛЛИНЕАР БАЙХ ҮЕ ДЭХ ҮНЭЛЭЛТ • Төгс мультиколлинеар тохиолдолд регрессийн коэффициентүүд тодорхойгүй, тэдгээрийн стандарт алдаа хязгааргүй байна. Энэ баримтыг гурван хувьсагчийн регрессийн загварын нөхцөлд харуулж болно. Хазайлтаар илэрхийлвэл гурван хувьсагчийн регрессийн загварыг дараах байдлаар бичиж болно: • yi= βˆ2x2i + βˆ3x3i +uˆi (10.2.1) • Now from Chapter 7 we obtain • X3i = λX2i гэвэл энд λ нь тэг биш тогтмол (жишээ нь, 2, 4, 1.8, г.м). Үүнийг (7.4.7)-д орлуулвал
  • 11. • тодорхой бус илэрхийлэл болно. Бид βˆ3 тодорхойгүй болохыг бас баталж болно. • Яагаад бид (10.2.2)-ийн үр дүнг олж авдаг вэ? βˆ2-ийн утга нь: • Энэ нь X3 тогтмол үед X2 нэгжээр өөрчлөгдөхөд Ү-ийн дундаж утгын өөрчлөлтийн хувийг илэрхийлдэг. Харин хэрэв X3 ба X2 нь төгс коллинеар бол X3 тогтмол байх боломжгүй юм: X2 өөрчлөгөдхөд, X3 мөн λ хүчин зүйлээр өөрчлөгдөнө. Энэ нь өгөгдсөн түүврээс X2 ба X3-ийн тус тусын нөлөөг салгах боломжгүй гэсэн үг юм.
  • 12. • Үүнийг өөрөөр харахын тулд X3i = λX2i -г (10.2.1)-т орлуулж дараах тэгшитгэлийг олно [(7.1.9)-г хар]: • yi = βˆ2x2i + βˆ3(λx2i)+uˆi • = (βˆ2 + λβˆ3)x2i +uˆi (10.2.3) • = αˆx2i + uˆi • энд • αˆ = (βˆ2 + λβˆ3) (10.2.4) • Ердийн OLS томъёог (10.2.3)-т хэрэглэвэл • αˆ = (βˆ2 + λβˆ3) = Σx2i yi/Σx2 2i (10.2.5) • Иймээс хэдий бид α-г үнэлж чадах ч β2 болон β3-г үнэлэх боломжгүй юм; математикийн хувьд • αˆ = βˆ2 + λβˆ3 (10.2.6) • хоёр үл мэдэгдэх бүхий (λ өгөгдсөн) ганц тэгшитгэл байгаа ба αˆ ба λ утгууд өгөгдсөн үед (10.2.6)-ийн шийд хязгааргүй байна.
  • 13. • Бодит нөхцөлд энэ санааг авч үзвэл αˆ = 0.8 ба λ = 2 гэе. Тэгвэл бидэнд • 0.8 = βˆ2 + 2βˆ3 (10.2.7) • эсвэл • βˆ2 = 0.8 − 2βˆ3 (10.2.8) • Одоо βˆ3 –ийн дурын утгыг сонгон βˆ2-ийн шийдийг олж болно. βˆ3-ийн өөр нэг утгыг сонгон βˆ2-ийн өөр нэг шийдийг олъё. Бид хэчнээн хичээсэн ч βˆ2-ийн ганц утга олдохгүй. Энэ бол төгс мультиколлинеар тохиолдолд регрессийн тухайн коэффициентийн хувьд ганц шийд олж чадахгүй гэсэн үг. • Гэвч эдгээр коэффициентүүдийн шугаман хослолын хувьд ганц шийд олж чадна. Шугаман хослол (β2 + λβ3) нь λ-ийн утга өгөгдсөн үед α-аар тооцогдоно. Дашрамд төгс мультиколлинеар тохиолдолд βˆ2 ба βˆ3-ийн дисперс болон стандарт алдаа нь хязгааргүй байна.
  • 14. “ӨНДӨР” БОЛОВЧ “ТӨГС БУС” МУЛЬТИКОЛЛИНЕАР ОРШИН БАЙХ НӨХЦӨЛ ДЭХ ҮНЭЛЭЛТ • Ерөнхийдөө Х хувьсагчдын дунд төгс шугаман хамаарал байхгүй. Иймээс (10.2.1)-т өгөгдсөн хазайлтаар илэрхийлсэн гурван хувьсагчийн загварыг дахин авч үзвэл төгс мультиколлинеарын оронд дараах тэгшитгэл бидэнд байна • x3i = λx2i + vi (10.3.1) • энд λ ≠ 0 ба энд vi нь x2ivi = 0 бүхий стохастик алдааны утга. • Энэ тохиолдолд β2 ба β3 регрессийн коэффициентүүдийн үнэлэлт боломжтой болно. Жишээ нь, (10.3.1)-г (7.4.7)-д орлуулвал • энд Σx2ivi = 0 болохыг ашигласан. βˆ3-г ижил илэрхийлж болно. • Одоо (10.2.2)-с ялгаатай нь (10.3.2) тооцогдохгүй гэдэгт итгэх ямар ч шалтгаан байхгүй. Мэдээж хэрэв vi нь хангалттай бага, тэг утганд маш ойр бол (10.3.1) бараг төгс коллинеар болох ба бид (10.2.2)-ийн тодорхой бус тохиолдол руу буцах болно.
  • 15. МУЛЬТИКОЛЛИНЕАРЫН ПРАКТИК ҮР ДАГАВАР • Бараг мультиколлинеар тохиолдолд дараах үр дагаваруудтай учрах магадлалтай юм: • 1. Хэдий BLUE байсан ч OLS үнэлэлтүүдийн дисперс болон ковариац их бол нарийн үнэлэлт хийхэд хэцүү болно. • 2. 1-р үр дагавараас шалтгаалан итгэх завсар их өргөн байх хандлагатай байдаг ба “тэг таамаглал” (жишээ нь, жинхэнэ эх олонлогийн коэффициент тэг байна)-ыг хүлээн зөвшөөрөхөд хялбар болно. • 3. Мөн 1-р үр дагавараас шалтгаалан нэг ба түүнээс олон коэффициентийн t харьцаа статистик ач холбогдолгүй болох хандлагатай. • 4. Хэдий нэг ба түүнээс олон коэффициентийн t харьцаа статистик ач холбогдолгүй байсан ч R2 их байж болно. • 5. OLS үнэлэлтүүд болон тэдгээрийн стандарт алдаа нь өгөгдлийн бага зэргийн өөрчлөлтөд мэдрэмжтэй байж болно. Өмнөх үр дагаваруудыг дараах байдлаар харуулж болно.
  • 16. • OLS үнэлэлтүүдийн дисперс, ковариаци их байх • Дисперс болон ковариаци их байгааг харахын тулд (10.2.1) загварын хувьд βˆ2 ба βˆ3-ийн дисперс ба ковариаци нь: • Энэ нь (7.4.12) ба (7.4.15)-аас r23 1-рүү тэмүүлж коллинеар байдал өсөх үед хоёр үнэлэлтийн дисперс өсөх ба r23 = 1 үед хязгааргүй болно. Энэ нь мөн адил (7.4.17)-оос r23 1-рүү тэмүүлэхэд хоёр үнэлэлтийн ковариаци абсолют утгаараа өсөх нь тодорхой байна.
  • 17. • Өргөн итгэх завсар • Стандарт алдаа их учир холбогдох эх олонлогийн параметрийн итгэх завсар их болох хандлагатай болохыг хүснэгт 10.2-оос харж болно. Жишээ нь, r23 = 0.95 үед β2 –ийн итгэх завсар нь r23 = 0 байх үеийнхээс их байна ( ) • Мөн түүнчлэн өндөр мультиколлинеартай тохиолдолд түүвэр өгөгдөл таамаглалын янз бүрийн олонлогт нийцтэй байж болно. Иймээс буруу таамаглалыг зөвшөөрөх магадлал (жишээ нь, II төрлийн алдаа) өснө.
  • 18.
  • 19. • “Ач холбогдолгүй” t харьцаа • Бид өндөр коллинеарын нөхцөлд үнэлэгдсэн стандарт алдаанууд эрс өсч улмаар t утгууд бага болдогийг харсан. Иймээс энэ тохиолдолд холбогдох жинхэнэ эх олонлогийн утга тэг гэсэн тэг таамаглалыг улам их хүлээн зөвшөөрөх болно. • R2 өндөр боловч ач холбогдолтой t харьцаа цөөн байх • k-хувьсагчтай шугаман регрессийн загварыг авч үзье: • Yi = β1 + β2X2i + β3X3i +· · ·+βkXki + ui • Өндөр коллинеар тохиолдолд нэг ба түүнээс олон тухайн өнцгийн коэффициентүүд t тестэд үндэслэн статистик ач холбогдолгүй байж болох юм. Гэсэн хэдий ч ийм нөхцөлд R2 маш өндөр буюу 0.9-с их бол F тестэд суурилан β2 = β3 = · · · = βk = 0 таамаглалыг итгэл үнэмшилтэйгээр няцааж болно. Үнэхээр энэ бол мультиколлинеарын нэг дохио юм—t утга ач холбогдолгүй боловч R2 өндөр байх (мөн F утга ач холбогдолтой байх)!
  • 20. • OLS үнэлэлтүүд болон тэдгээрийн стандарт алдаанууд өгөгдлийн бага хэмжээний өөрчлөлтөд мэдрэмжтэй байх • Төгс бус мультиколлинеарын нөхцөлд регрессийн коэффициентүүдийн үнэлэлт боломжтой боловч үнэлэлт болон стандарт алдаа нь өгөгдлийн өчүүхэн өөрчлөлтөд ихээхэн мэдрэмжтэй байдаг. • Үүнийг харахын тулд хүснэгт 10.3-г авч үзье. Эдгээр өгөгдөлд үндэслэн бид дараах олон хэмжээст регрессийг байгуулъя: Yˆi = 1.1939 + 0.4463X2i + 0.0030X3i (0.7737) (0.1848) (0.0851) t = (1.5431) (2.4151) (0.0358) (10.5.6) R2 = 0.8101 r23 = 0.5523 • cov (βˆ2, βˆ3) = −0.00868 df = 2
  • 21.
  • 22. • (10.5.6) регресс нь хэдий βˆ2 нь нэг талт t тестэд үндэслэн 10 хувийн түвшинд ач холбогдолтой байгаа боловч регрессийн коэффициентүүдийн нэг нь ч 1 ба 5 хувийн итгэх түвшинд ач холбогдолгүй байгааг харуулж байна. Хүснэгт 10.4-г ашиглан: Yˆi = 1.2108 + 0.4014X2i + 0.0270X3i (0.7480) (0.2721) (0.1252) t = (1.6187) (1.4752) (0.2158) (10.5.7) R2 = 0.8143 r23 = 0.8285 cov (βˆ2, βˆ3) = −0.0282 df = 2 • Өгөгдөл өчүүхэн өөрчлөгдсөний үр дүнд өмнө 10 хувийн итгэх түвшинд статистик ач холбогдолтой байсан βˆ2 ач холбогдолгүй болсон байна. Мөн (10.5.6)-д cov (βˆ2, βˆ3) = −0.00868 байсан бол (10.5.7)-д энэ нь −0.0282 буюу гурав дахин өссөн байна. Эдгээр бүх өөрчлөлтүүд мультиколлинеар өссөнтэй холбоотой байж болох юм: (10.5.6)-д r23 = 0.5523 байсан бол (10.5.7)-д энэ нь 0.8285 байна. Мөн адил βˆ2 ба βˆ3-ийн стандарт алдаанууд хоёр регрессийн хооронд өсч байгаа нь коллинеарын ердийн шинж тэмдэг юм.
  • 23.
  • 24. ТАЙЛБАР БҮХИЙ ЖИШЭЭ: ОРЛОГО БА БАЯЛАГТАЙ ХАМААРАЛ БҮХИЙ ХЭРЭГЛЭЭНИЙ ЗАРДАЛ • Хүснэгт 10.5 дахь хэрэглээ-орлогын жишээг дахин авч үзье. Бид дараах регрессийг олж авна: Yˆi = 24.7747 + 0.9415X2i − 0.0424X3i (6.7525) (0.8229) (0.0807) t = (3.6690) (1.1442) (−0.5261) (10.6.1) R2 = 0.9635 R¯2 = 0.9531 df = 7 • (10.6.1) регресс нь орлого болон баялаг хамтдаа хэрэглээний зардлын хэлбэлзлийн 96 хувийг тайлбарлаж байгаа ба өнцгийн коэффициентүүд статистик ач холбогдолгүй байгааг харуулж байна. Баялаг хувьсагч буруу тэмдэгтэй байна. Хэдий βˆ2 ба βˆ3 нь статистик ач холбогдолгүй байгаа ч хэрэв бид β2 = β3 = 0 гэсэн таамаглал шалгавал энэ таамаглал хүснэгт 10.6-д харуулсан шиг няцаагдана.
  • 25. Source of variation SS df MSS Due to regression 8,565.5541 2 4,282.7770 Due to residual 324.4459 7 46.3494 • Ердийн таамаглалын дагуу: • F =4282.7770 / 46.3494 = 92.4019 (10.6.2) • F утга нь өндөр ач холбогдолтой нь тодорхой байна. Бидний жишээ мультиколлинеар гэж юу болохыг тодорхой харуулж байна. • F тест ач холбогдолтой боловч X2 ба X3 –ийн t утгууд ач холбогдолгүй байгаа нь хоёр хувьсагч өндөр корреляцитай бөгөөд орлого болон баялгийн хэрэглээнд үзүүлэх тус бүрийн нөлөөг тусгаарлах боломжгүй болохыг илэрхийлнэ.
  • 26. • Хэрэв бид X3-г X2-с хамааруулан регресс байгуулвал Xˆ3i = 7.5454 + 10.1909X2i (29.4758) (0.1643) (10.6.3) t = (0.2560) (62.0405) R2 = 0.9979 • X3 ба X2 хоорондоо бараг төгс коллинеар байна • Одоо хэрэв Y-г X2-с хамааруулан регресс байгуулвал юу тохиолдохыг харъя: Yˆi = 24.4545 + 0.5091X2i (6.4138) (0.0357) (10.6.4) t = (3.8128) (14.2432) R2 = 0.9621 • (10.6.1)-д орлого хувьсагч статистик ач холбогдолгүй байсан бол одоо харин ач холбогдолтой байна.
  • 27. • Y –г X2 –с хамааруулан регресс байгуулахын оронд X3-с хамааруулан байгуулвал Yˆi = 24.411 + 0.0498X3i (6.874) (0.0037) (10.6.5) t = (3.551) (13.29) R2 = 0.9567 • (10.6.1)-д баялаг хэрэглээний зардалд нөлөөгүй байсан бол одоо харин чухал нөлөөтэй болохыг харж байна. • (10.6.4) ба (10.6.5) регрессүүд их хэмжээний мультиколлинеарын нөхцөлд өндөр коллинеар хувьсагчийг нь хасахад нөгөө Х хувьсагч нь статистик ач холбогдолтой болж байгааг тодорхой харуулж байна. Энэ үр дүн нь туйлын коллинеараас зугтах арга зам нь коллинеар хувьсагчийг хасах явдал болохыг харуулж байна.
  • 28. МУЛЬТИКОЛЛИНЕАРЫГ ИЛРҮҮЛЭХ • Өгөгдсөн нөхцөлд, ялангуяа загварт хоёроос олон тайлбарлагч хувьсагч орсон үед коллинеар оршин байгааг хэрхэн мэдэх вэ? Kmenta-ийн анхааруулгыг энд саная: • 1. Мультиколлинеар нь хэмжээний асуудал юм. Гол онцлог нь мультиколлинеар байгаа, байхгүй нь биш харин түүний янз бүрийн түвшингээс хамаарна. • 2. Мультиколлинеар нь эх олонлогийн бус түүврийн онцлог юм. Мөн түүнчлэн бид “мультиколлинеарыг шалгахгүй” харин ямар нэг тодорхой түүврийн хувьд түүний түвшинг хэмжинэ. • Бидэнд түүнийг илрүүлэх, түүний хүчийг хэмжих ганц арга байхгүй. Бидэнд байгаа зүйл нь зарим албан ба албан бус эрхий хурууны дүрэм юм.
  • 29. • 1. R2 их боловч цөөн ач холбогдол бүхий t харьцаа. Хэрэв R2 их бол (0.8-с их) ихэнх тохиолдолд F тестээр тухайн өнцгийн коэффициентүүд нэгэн зэрэг тэгтэй тэнцүү гэсэн таамаглал няцаагддаг боловч t тест нь нэг ч биш эсвэл маш цөөн тухайн өнцгийн коэффициент статистикийн хувьд тэгээс ялгаатай болохыг харуулах үед. • 2. Тайлбарлагч хувьсагчид хос хосоороо өндөр корреляцитай үед. Эрхий хурууны өөр нэг санал болгох дүрэм нь хэрэв хоёр тайлбарлагч хувьсагчийн хоорондох тэг эрэмбийн корреляцийн коэффициент өндөр бол (0.8-с их) мультиколлинеар нь ноцтой асуудал юм. Энэ шалгуурын асуудал нь гэвэл хэдий өндөр тэг эрэмбийн корреляци коллинеар болохыг илэрхийлэх ч, ямар ч тохиолдолд коллинеар байхын тулд тэд заавал өндөр байх шаардлагүй, тэг эрэмбийн буюу энгийн корреляци нь харьцангуй бага байсан ч оршин байж болно (0.50-с бага).
  • 30. • 3. Тухайн корреляцийг авч үзэх. Тэг эрэмбийн корреляцид тулгуурлах нь ердөө л нэг асуудал ба Farrar болон Glauber нар тухайн корреляцийн коэффициентийг харахыг санал болгосон. Иймээс Y-ийн X2, X3, ба X4-ээс хамааруулан байгуулсан регрессийн хувьд R2 1.234 нь маш их боловч r2 12.34, r2 13.24, болон r2 14.23 нь харьцангуй бага бол X2, X3, болон X4 хувьсагчид хоорондоо эсвэл наанадаж нэг хувьсагч хэт их корреляцитай байна. • Хэдий тухайн корреляцийг судлах нь ашигтай байж болох ч мультиколлинеарыг илрүүлэх төгс хөтөч гэх баталгаа байхгүй ба R2 болон бүх тухайн корреляциуд хангалттай их байж болно. Гэвч илүү чухал нь C. Robert Wichers өгөгдсөн тухайн корреляци нь өөр өөр мультиколлинеар хэв шинжид нийцтэй байж болох тул Farrar- Glauber-ийн тухайн корреляцийн тест үр ашиггүй болохыг харуулсан. Farrar–Glauber тест маш их шүүмжлэгдэж байгаа.
  • 31. • 4. Туслах регресс. Аль Х хувьсагч нь бусад Х хувьсагчидтай холбоотойг олох нэг арга нь Xi бүрийг үлдсэн Х хувьсагчидтай халз регресс байгуулах ба харгалзах R2 болох R2 i –г тооцох явдал юм. Эдгээр регресс бүрийг Х-с хамаарах Ү-ийн гол регрессийн туслах регресс гэдэг. (8.5.11)-д илэрхийлсэн F ба R2 хоорондын хамаарлын дагуу хувьсагч (10.7.3) k−2 ба n−k+1 чөлөөний зэрэг бүхий F тархалттай байна. • Тэгшитгэл (10.7.3)-д n нь түүврийн хэмжээ, k нь параметрийн тоо, болон R2 өгөгдсөн • xi ·x2x3···xk нь Xi хувьсагчийн үлдсэн Х хувьсагчдаас хамаарах регресс дэх детерминацийн коэффициент.
  • 32. • Хэрэв сонгосон ач холбогдлын түвшинд F тооцсон утга Fi критик утгаас их бол Xi нь бусад Х-тэй коллинеар гэдгийг илэрхийлнэ; хэрэв Fi критик утгаас их биш бол бусад Х-тэй коллинеар биш гэж үзэж болох ба энэ тохиолдолд бид энэ хувьсагчийг загварт үлдээж болно. • Klien-ий эрхий хурууны дүрэм • Бүх туслах R2 утгуудын албан ёсны тестийн оронд хэрэв туслах регрессээс олдсон R2 нь гол R2 -с (бүх тайлбарлагч хувьсагчдаас хамааруулан үнэлсэн Ү-ийн регресс) их үед л төвөгтэй асуудал үүсгэдэг гэж үздэг Klien-ий эрхий хурууны дүрмийг дэмжиж болно. Мэдээж бусад бүх эрхий хурууны дүрмийн адил энэ ч бас ухаалаг шийдэл юм.
  • 33. ЗАЛРУУЛАХ АРГА ХЭМЖЭЭ • Хэрэв мультиколлинеар ноцтой бол юу хийж болох вэ? Бидэнд хоёр сонголт бий: • (1) юу ч хийхгүй байх эсвэл • (2) зарим эрхий хурууны дүрмийг дагах. • Юу ч хийхгүй байх. • Яагаад? • Мультиколлинеар нь үндсэндээ мэдээлэл дутагдах асуудал (micronumerosity) ба заримдаа бидэнд мэдээлэл дээр ямар ч сонголт байдаггүй. • Хэрэв бид нэг ба түүнээс олон регрессийн коэффициентийг илүү нарийн үнэлж чадаагүй үед тэдгээрийн шугаман хослол (жишээ нь, үнэлж болох функц) харьцангуй үр ашигтай үнэлэгдэж болно. • yi = αˆx2i + uˆi (10.2.3) • хэрэв бид хоёр параметрийг тусад нь үнэлж чадахгүй бол ганц α-г үнэлж болно. Зарим үед өгөгдсөн өгөгдөл олонлогийн хувьд энэ нь бидний хийж чадах хамгийн сайн зүйл байдаг.
  • 34. • Эрхий хурууны дүрмийн процедур • 1. Априори мэдээлэл. Дараах загварыг авч үзье • Yi = β1 + β2X2i + β3X3i + ui • энд Y = хэрэглээ, X2 = орлого, ба X3 = баялаг. Бид β3 = 0.10β2 гэж итгэж байгаа ба баялагтай холбоотой хэрэглээний өөрчлөлтийн түвшин нь орлоготой холбоотой харгалзах түвшиний аравны нэгтэй тэнцүү. Дараах регрессийг байгуулъя: • Yi = β1 + β2X2i + 0.10β2X3i + ui = β1 + β2Xi + ui • энд Xi = X2i + 0.1X3i . • Бид βˆ2-г олсноор β2 ба β3 –ийн хоорондох дурьдсан хамаарлаас βˆ3 –г үнэлж болно. Априори мэдээллийг хэрхэн олох вэ? Энэ нь өмнөх эмпирик ажлаас гарч ирнэ. • Жишээ нь, Кобб-Дуглас хэлбэрийн үйлдвэрлэлийн функц • Yi= β1X2i β2 X3i β3 eui (7.9.1) • хэрэв өргөжилтийн тогтмол үр өгөөжтэй гэж таамаглавал (β2 + β3) = 1, энэ тохиолдолд регресс нь:
  • 35. • ln (GDP/Labor)t= β1+ α ln (Capital/Labor)t (8.7.14) • Гарц хөдөлмөрийн харьцааны эсрэг капитал хөдөлмөрийн харьцаагаар халз регресс байгуулна. Хэрэв хөдөлмөр капитал хоорондоо коллинеар бол ерөнхийдөө ихэнх түүвэр өгөгдлийн тохиолдолд хувиргалт хийх замаар коллинеарын асуудлыг бууруулж эсвэл арилгаж болно. Гэвч ийм априори хязгаарлалт тавих тухайд анхаарах зүйл нь, “. . . Ер нь бид үнэн биш байж болох мэдээлэлд асуудлыг орхих бус харин эдийн засгийн онолын априори таамаглалыг шалгахыг хүсч байгаа.” • 2. Орон зайн болон хугацааны цуваан өгөгдлийг нэгтгэх. • Априори мэдээллийн техникийн хувилбар нь орон зайн болон хугацааны цуваан өгөгдлийн хослол юм. Бид АНУ дахь автомашины эрэлтийг судлахыг хүссэн ба бидэнд борлуулсан машины тоо, машины дундаж үнэ, хэрэглэгийн орлогын хугацааны цуваан өгөгдөл байгаа гэе. • ln Yt = β1 + β2 ln Pt + β3 ln It + ut
  • 36. • энд Y = борлуулсан машины тоо, P = дундаж үнэ, I = орлого, ба t = хугацаа. Зорилго нь үнийн мэдрэмж β2 болон орлогын мэдрэмж β3-г үнэлэх • Хугацааны цуваан өгөгдөлд үнэ болон орлого хувьсагчид ерөнхийдөө өндөр коллинеар байх хандлагатай. Tobin нэг арга санал болгосон нь хэрэв бидэнд орон зайн өгөгдөл байгаа бол энэ нь нэг цаг хугацаан дахь өгөгдөл тул үнэ нэг их өөрчлөгдөхгүй тул бид орлогын мэдрэмж β3 –ийн нэлээн үнэн зөв үнэлэлтийг олж авах боломжтой. Орон зайн өгөгдлөөр үнэлэгдсэн орлогын мэдрэмж βˆ3 гэе. Энэ үнэлэлтийг ашиглан бид өмнөх хугацааны цуваан регрессийг бичиж болно: • Y*t = β1 + β2 ln Pt + ut • энд Y* = ln Y − βˆ3 ln I, Y* нь орлогын нөлөөг арилгасны дараах Ү-ийн утгыг илэрхийлнэ. Бид одоо өмнөх регрессээс үнийн мэдрэмж β2 –г үнэлж чадна.
  • 37. • Хэдий энэ нь сонирхолтой арга боловч хугацааны цуваан болон орон зайн өгөгдлийг нэгтгэх арга нь тайлбарлахад асуудал үүсгэж болох юм. Учир нь бид орон зайн өгөгдлөөр үнэлсэн орлогын мэдрэмж нь цэвэр хугацааны цуваан шинжилгээнээс олдох утгатай адил гэж үзсэн. • 3. Хувьсагч орхих буюу тодорхойлолтын хазайлт. • Бидний хэрэглээ-орлого-баялгийн жишээнд бид баялаг хувьсагчийг орхивол (10.6.4)-р регрессийг байгуулах ба анхны загварт орлого хувьсагч статистик ач холбогдолгүй байсан бол энд одоо өндөр ач холбогдолтой байна. Гэхдээ загварт хувьсагч орхисноор бид тодорхойлолтын алдаа гаргаж болох юм. • Мультиколлинеарын асуудлыг арилгахын тулд загвараас хувьсагчийг хасах нь тодорхойлолтын хазайлтад хүргэж болно. Иймээс зарим нөхцөлд эм нь өвчнөөс илүү муу байж болно. Бараг коллинеарыг үл харгалзан OLS үнэлэлтүүд нь BLUE байдгийг сана.
  • 38. • 4. Хувьсагчдыг хувиргах. Бидэнд хэрэглээний зардал, орлого, болон баялгийн хугацааны цуваан өгөгдөл байгаа гэе. Орлого ба баялгийн ийм өгөгдлийн хооронд өндөр мультиколлинеар байх нэг шалтгаан нь хугацааны туршид эдгээр хоёр хувьсагч нэг чиглэлтэй хөдөлж байж болно. Энэ хамаарлыг минимумчилах нэг арга нь дараах байдлаар үргэлжлэх явдал юм. Хэрэв хамаарал нь • Yt = β1 + β2X2t + β3X3t + ut (10.8.3) • t хугацаанд уявал хугацааны эхлэл нь дурын байх тул t − 1 хугацааг мөн уяж болно. Иймээс • Yt−1 = β1 + β2X2,t−1 + β3X3,t−1 + ut−1 (10.8.4) • Хэрэв бид (10.8.4)-г (10.8.3)-с хасвал • Yt − Yt−1 = β2(X2t − X2,t−1) + β3(X3t − X3,t−1) + vt (10.8.5) • энд vt = ut − ut−1. Тэгшитгэл (10.8.5)-г нэгдүгээр эрэмбийн ялгаврын хэлбэр гэнэ.
  • 39. • 1. Нэгдүгээр эрэмбийн ялгаврын регрессийн загвар үргэлж мультиколлинеарын ноцтой байдлыг бууруулдаг. Учир нь хэдий X2 ба X3 өндөр корреляци хамааралтай боловч тэдгээрийн ялгавар нь мөн адил өндөр корреляцитай гэж итгэх шалтгаан байхгүй. Нэгдүгээр эрэмбийн хувиргалтын нэмэлт давуу тал нь стационарь бус хугацааны цувааг стационарь болгодог байж болох юм. Хугацааны цуваа Yt –ийн дундаж болон дисперс нь хугацааны туршид системтэй өөрчлөгддөггүй бол стационарь байна. • 2. Өөр нэг практикт нийтлэг ашигладаг хувиргалт нь харьцангуй хувиргалт юм. Дараах загварыг авч үзье: • Yt = β1 + β2X2t + β3X3t + ut (10.8.6) • энд Y нь бодит хэрэглээний зардал, X2 нь ДНБ, ба X3 нь нийт хүн ам. ДНБ ба хүн ам хугацааны туршид өсөхөд корреляци хамааралтай болно. Энэ асуудлын нэг “шийдэл” нь энэ загварыг нэг хүнд ногдох утгад суурилан илэрхийлэх явдал бөгөөд (10.8.4)-г X3-т хуваавал: • Yt/X3t = β1(1/X3t) + β2 (X2t X3t) + β3 + (ut/X3t) (10.8.7)
  • 40. • Ийм хувиргалт нь анхны хувьсагчид дахь коллинеарыг бууруулж болох юм. Гэхдээ нэгдүгээр эрэмбийн ялгавар ба харьцангуй хэмжигдэхүүний хувиргалт нь асуудалгүй байдаггүй. Жишээ нь, (10.8.5) дахь алдааны утга vt нь сонгодог шугаман регрессийн загварын зөрүү нь сериал корреляцигүй байна гэсэн урьдчилсан нөхцлийг хангахгүй байж болох юм. Бүлэг 12-т хэрэв анхны зөрүүгийн утга ut нь сериал корреляцигүй бол алдааны утга vt нь ихэнх тохиолдолд сериал корреляцитай байдаг. Иймээс эм нь өвчнөөс илүү муу байж болох юм. • Үүнээс гадна ялгаврын процедураар нэг ажиглалтын нэгж алдагддаг. Бага түүвэрт энэ нь анхааралдаа авах гол хүчин зүйл байж болох юм. • Цаашилбал, нэгдүгээр эрэмбийн ялгаврын процедур нь ажиглалтад логик эрэмбэ байхгүй тул орон зайн өгөгдөлд тохирохгүй байж болох юм. Үүнтэй нэгэн адил харьцангуй хэмжигдэхүүний загвар (10.8.7)-д анхны алдааны утга ut нь гомскедастик бол алдааны утга (ut/X3t) гетероскедастик байхыг бүлэг 11-т харах болно. Мөн дахин эм нь коллинеарын өвчнөөс илүү муу байж болно.
  • 41. • Товчхондоо, мультиколлинеарын асуудлыг шийдэхийн тулд өгөгдлийг нэгдүгээр эрэмбийн ялгаврын эсвэл харьцангуй хэмжигдэхүүний аргыг ашиглан хувиргахдаа болгоомжтой байх хэрэгтэй. • 5. Нэмэлт буюу шинэ өгөгдөл. Мультиколлинеар нь түүврийн онцлог юм бол ижил хувьсагчид оролцсон өөр түүврийн коллинеар нь эхний түүврийнх шиг ноцтой биш байж болох юм. Заримдаа түүврийн хэмжээг өсгөх нь (хэрэв боломжтой бол) коллинеарын асуудлыг сулруулж болох юм. Жишээ нь, 3 хувьсагчийн загварт • var (βˆ2) = σ2 / x2 2i(1 − r2 23) • Одоо түүврийн хэмжээ өсөхөд, Σx2 2i ерөнхийдөө өснө. Мөн түүнчлэн аливаа өгөгдсөн r23-ийн хувьд βˆ2-ийн дисперс буурна, иймээс стандарт алдаа буурч β2-ийг илүү нарийн үнэлэх боломжтой болно. • Жишээ болгож хэрэглээний зардал Y-ийн орлого X2 ба баялаг X3-с хамаарах дараах регрессийг 10 ажиглалтад суурилан авч үзье: • Yˆi = 24.377 + 0.8716X2i − 0.0349X3i • t = (3.875) (2.7726) (−1.1595) R2 = 0.9682 (10.8.8)
  • 42. • Энэ регрессийн баялгийн коэффициент нь зөвхөн буруу тэмдэгтэй бус мөн 5 хувийн түвшинд статистик ач холбогдолгүй байна. Гэхдээ түүврийн хэмжээ 40 ажиглалт болж өсөхөд дараах үр дүн олдсон: • Yˆi = 2.0907 + 0.7299X2i + 0.0605X3i • t = (0.8713) (6.0014) (2.0014) R2 = 0.9672 (10.8.9) • Одоо баялгийн коэффициент зөвхөн зөв тэмдэгтэй байгаад зогсохгүй 5 хувийн түвшинд статистик ач холбогдолтой байна. Нэмэлт, илүү сайн өгөгдөл олох нь үргэлж хялбар байдаггүй • 6. Мультиколлинеарыг засварлах бусад арга. • Хүчин зүйлийн шинжилгээ, үндсэн бүрэлдэхүүн зэрэг олон хүчин зүйлстэй статистик арга техникүүд болон голч регрессийн техникүүд мультиколлинеарын асуудлыг шийдвэрлэхэд байнга ашиглагддаг. Эдгээрийг матриц алгебргүйгээр шийдэх боломжгүй юм.
  • 43. МУЛЬТИКОЛЛИНЕАР НЬ ЗААВАЛ МУУ БАЙХ УУ? ЗӨВХӨН ПРОГНОЗ ХИЙХ ЗОРИЛГОТОЙ БОЛ ҮГҮЙ БАЙЖ БОЛОХ ЮМ • Хэрэв регрессийн шинжилгээний ганц зорилго нь прогноз хийх бол R2 их үед прогноз сайн байх тул мультиколлинеар нь ноцтой асуудал биш байж болно. Гэхдээ энэ нь “. . . Прогнозын хувьд тайлбарлагч хувьсагчдын утгууд нь анхны өгөгдөл матриц Х шиг бараг шугаман хамааралтай байж болно”. Иймээс хэрэв үнэлсэн регрессийн загварын хувьд ойролцоогоор X2 = 2X3 байвал Ү-ийн прогноз хийхэд ашиглагдах ирээдүйн түүвэр X2 нь ойролцоогоор 2X3-тай тэнцүү байх хүнд нөхцөл практикт тулгарвал прогнозын тодорхойгүй байдал өснө. Үүнээс гадна, хэрэв шинжилгээний зорилго зөвхөн прогноз хийх биш харин параметрийн найдвартай үнэлэлт хийх явдал бол мультиколлинеар нь үнэлэлтийн их хэмжээний стандарт алдаанд хүргэдэг учраас ноцтой асуудал болно. Нэг нөхцөлд л мультиколлинеар нь ноцтой асуудал биш болно. Энэ нь R2 утга их, регрессийн коэффициентүүд өндөр t утгын хувьд ач холбогдолтой байх тохиолдол юм. Мультиколлинеарын оношлогоо болох нөхцөл байдлын индекс нь өгөгдөлд ноцтой коллинеар байгааг илэрхийлнэ. Ийм нөхцөл байдал хэзээ үүсч болох вэ? Johnston-ий тэмдэглэснээр: Энэ нь хэрэв параметрүүд тоон чанарын хувьд жинхэнэ утгаасаа илүү сайн байх, хөөрөгдсөн стандарт алдааг үл харгалзан нөлөөтэй байх ба үнэлэлтийн сул тал байгаа ч түүний жинхэнэ утга нь ач холбогдолтой байсаар байх.