Multivariate statistics2. Агуулга
LOGO
Cluster-н шинжилгээ гэж юу вэ?
Хүчин зүйлийн шинжилгээ гэж юу вэ?
SPSS програм дээр шинжилгээг хийх нь
• Эргүүлэлт бүхий хүчин зүйлийн шинжилгээ
• Хүчин зүйлийн шинжилгээний утга
• Хүчин зүйлийн шинжилгээний тохиргоо
Орон зайн шижилгээнд SAS программыг
ашиглах нь
SAS, ESRI-ийн хоорондын гүүр
YOUR SITE HERE
3. Cluster гэж юу вэ?
LOGO
Тодорхойлолт: Кластерийн шинжилгээ нь нэгэн
төрлийн бүлэг юмсийн хувьсагчийн талаарх
мэдээллийг нэгтгэх, тэдгээрийг зохион байгуулах
олон хувьсагчийн шинжилгээний арга юм.
Кластерийн шинжилгээ хийхэд дараах алхамуудыг
баримталдаг:
1. Мэдээлэл цуглуулах, шинжилгээний
хувьсагчдыг сонгох
2. Ижил матриц үүсгэх
3. Бүлгийн тоо болон агуулгыг тодорхойлох
4. Үр дүнг шалгах
YOUR SITE HERE
4. Cluster гэж юу вэ?
LOGO
Кластерийн шинжилгээний гол үр дүн нь
Dendrogram буюу модны диаграмаар
илэрхийлэгддэг.
YOUR SITE HERE
5. ХҮЧИН ЗҮЙЛИЙН ШИНЖИЛГЭЭ ГЭЖ
ЮУ ВЭ?
LOGO
Factor Analysis – Олон шинж тэмдгийг
хүчин зүйл гэж нэрлэгдэх цөөн шинж
тэмдгээр солиход хүчин зүйлийн
шинжилгээг хэрэглэдэг
Хүчин зүйлийн шинжилгээ нь
хувьсагчдыг хүчин зүйлүүдийн шугаман
хослол хэлбэрээр илэрхийлдэг
Ингэхдээ хүчин зүйлүүд өөр хоорондоо
хамаарал багатай, харин нэг хүчин зүйлд
орсон шинж тэмдгүүд өөр хоорондоо илүү
холбоотой байна гэж үздэг
YOUR SITE HERE
7. SPSS ПРОГРАМ ДЭЭР ХҮЧИН
ЗҮЙЛИЙН ШИНЖИЛГЭЭ ХИЙХ НЬ
LOGO
SPSS программ нь хүчин зүйлийг
илрүүлэхдээ гол бүрдүүлэгч (principal
components), жинлэгдээгүй хамгийн бага
квадрат (unweighted least squares), хамгийн их
үнэний хувийн (maximum likelihood),
ерөнхийлсөн хамгийн бага квадрат
(generalized least squares) гэх зэрэг 6 аргаас
сонголт хийдэг. Ингэхдээ корреляцийн буюу
ковариацийн матрицыг хэрэглэдэг
YOUR SITE HERE
8. SPSS ПРОГРАМ ДЭЭР ХҮЧИН
ЗҮЙЛИЙН ШИНЖИЛГЭЭ ХИЙХ НЬ
LOGO
Хүчин зүйлийн шинжилгээг олон аргаар
хийдэг
Analyze-Data reduction-Factor-Extraction
YOUR SITE HERE
9. SPSS ПРОГРАМ ДЭЭР ХҮЧИН
ЗҮЙЛИЙН ШИНЖИЛГЭЭ ХИЙХ НЬ
LOGO
Жигнээгүй хамгийн бага квадратын арга:
Бодит болон үнэлэн гаргаж ирсэн корреляцийн
матрицийн хоорондох өөрчлөлтийн
квадратуудын нийлбэрийн хамгийн бага утгаар
хүчин зүйлийн утгыг үнэлж гаргадаг арга юм
Ерөнхийлсөн хамгийн бага квадратын арга:
ХБКА-тай ойролцоо тодорхойлогддог ба
ялгаатай зүйл нь хувьсаг тус бүрийн
кореляцийн матрицад харьцуулан жигнэсэн
байдаг
YOUR SITE HERE
10. SPSS ПРОГРАМ ДЭЭР ХҮЧИН
ЗҮЙЛИЙН ШИНЖИЛГЭЭ ХИЙХ НЬ
LOGO
Шинжилгээг хийхдээ Корреляцийн матриц
эсвэл Ковариацын мартицыг ашиглах
сонголттой байдаг
Хэрэв шинжилгээнд ашиглаж буй хувьсагч нь
өөр хэмжигдэхүүнийг илэрхийлдэг бол
Корреляцийн матрицыг ашиглана
Харин шинжилгээнд хэлбэлзэл ихтэй олон бүлэг
хүчин зүйлүүд ашиглагдаж байгаа үед
Ковариацын мартицыг ашиглана
YOUR SITE HERE
11. Хүчин зүйлийн шинжилгээний эрэмбэлэлт
LOGO
Varimax Method
Direct Oblimin Method
Quartimax Method
Equamax Method
Promax Rotation
Rotated Solution
Factor Loading Plot
YOUR SITE HERE
12. Эргүүлэлт бүхий хүчин зүйлийн
шинжилгээ
LOGO
Varimax Method: Хүчин зүйл тус бүрийнх нь
хувьд хувьсагчдын тоог хамгийн бага байлгадаг
арга юм. Энэ арга нь хүчин зүйлийн тайлбарлах
чадварыг оновчтой болгодог.
Direct Oblimin Method: Delta=0 үед хамгийн их
хазайлттай утгаа авдаг. Delta<0 үед хүчин
зүйлийн хазайлт нь багасна. Delta-г гаднаас
оруулж өгөхдөө хамгийн ихдээ 0.8 байлгана.
Quartimax Method: Хүчин зүйл тус бүрийг
тайлбарлаж буй хувьсагчийн тоог хамгийн бага
байлгах арга
YOUR SITE HERE
13. Эргүүлэлт бүхий хүчин зүйлийн
шинжилгээ
LOGO
Equamax Method: Varimax болон Quartimax
аргуудын нийлбэр/холимог/ юм. Хүчин зүйл
болон түүнийг тайлбарлаж байгаа
хувьсагчид нь аль аль нь хамгийн бага
байхаар сонгогддог
Promax Rotation: Хоорондоо хамааралтай
хүчин зүйлсийг авч үздэг. Энэ нь Direct
Oblimin аргаас илүү хурдан тооцох
боломжийг олгодог. Тиймээс түүврийн
хэмжээ нь их үед ашиглахад тохиромжтой.
YOUR SITE HERE
14. Хүчин зүйлийн утга
Хувьсагчдыг хадгалах: LOGO
Хамгийн сүүлд хүчин
зүйл тус бүрийнх нь
хувьд нэг шинэ
хувьсагчийг үүсгэнэ.
Хүчин зүйлийн үнэлгээг
хийхдээ өөрөөр хэлбэл
утгыг нь тооцохдоо
Регресс, Bartlett,
Anderson-Rubin гэх мэт
уламжлалт бус аргуудын
нэгийг сонгон хэрэглэнэ.
YOUR SITE HERE
15. Хүчин зүйлийн утга
LOGO
Regression method: Хүчин зүйлсийн
коеффициэнтуудын утгыг үнэлэхэд оршино.
Энэ утга нь 0 гэсэн дундажтай, бидний үнэлж
гаргасан хүчин зүйлийн утга болон яг бодит
хүчин зүйл зүйлийн утгуудын хоорондох
корреляцитай тэнцүү вариацтай байна. Хэдий
хүчин зүйлс нь хазаалтгүй байсан ч гэсэн
утгууд нь корреляцичлагдана
YOUR SITE HERE
16. Хүчин зүйлийн шинжилгээний утга
LOGO
Bartlett Scores : Хүчин зүйлсийн
коеффициэнтуудын утгыг үнэлэхэд оршино.0
гэсэн дундажтай байна. Хувьсагчдын хүрээнд
хүчин зүйлсийн квадратуудын нийлбэр нь
хамгийн бага байна
Anderson-Rubin: Хүчин зүйлсийн
коеффициэнтуудын утгыг үнэлдэг бөгөөд
үнэлсэн хүчин зүйлсийн хазайлтгүй байдлыг
нь шалгадаг Bartlett-н сайжруулсан загвар юм.
Утгууд нь хоорондоо корреляцичлагдахгүй
бөгөөд 1 гэсэн стандарт хазайлттай, 0 гэсэн
дундажтай байна
YOUR SITE HERE
17. Хүчин зүйлийн шинжилгээний тохиргоо
LOGO
Алдааны утга: Алдааны
утгыг хэрхэн
тодорхойлох боломжийг
олгодог. Энэхүү гурван
сонголтоос
идвэхжүүлнэ.
Коэффициентийн харагдах байдал:
- Коэффициентуудыг хэмжээгээр нь эрэмбэлэх
- Оруулж өгсөн тооноос бага абсолют утгыг хасах
YOUR SITE HERE
18. Орон зайн шинжилгээнд SAS-ийг
ашиглах нь
LOGO
Энэхүү судалгааны зорилго нь: Зүрх судасны
болон амьсгалын замын өвчний шалтгааныг
тодорхойлох мөн Jefferson улсын
өвчтөнүүдийн газарзүйн байрлал болон
орлого хоѐрын хоорондын хамаарлыг
судлахад оршино
Энэ судалгаанд газрын зургийг шинжлэх,
зохиох, цуглуулах, газарзүйн мэдээллийг
гаргахад гэх мэтээр SAS, ArcGis, ESRI-ийг
ашигласан.
5000-н өвчтөний мэдээллийг ашигласан
YOUR SITE HERE
19. Орон зайн шинжилгээнд SAS-ийг
ашиглах нь
LOGO
Data mining гол зорилго нь:
Зах зээл болон бизнестэй холбоотой тоон
мэдээнд шинжилгээ хийх
Хувьсагчдын харилцан хамаарлыг
загварчлах
Маш их хэмжээний тоон мэдээг олж
илрүүлэх
Цуглуулсан мэдээллээ загварчлах, түүнийг
баталгаажуулах
YOUR SITE HERE
20. Орон зайн шинжилгээнд SAS-ийг
ашиглах нь
LOGO
Text mining: гол зорилго нь:
Тодорхой бус текстэн мэдээллийг
боловсруулах
Текстэн мэдээллээс чухал, ач
холбогдолтой тоон индексийг гаргаж авах
Янз бүрийн мэдээллээс статистикийн
арга, математик загварчлалын аргаар
хэрэгтэй мэдээллээ олж авах
YOUR SITE HERE
25. Кластерийн хүснэгт
LOGO
Өвчтөнгүүд Эмнэлэг DRG
MDC MDC 4 (амьсгалын замын
өвчингүүд)
MDC 5 (зүрх, судасны
өвчингүүд болон
тэдгээрийн нөхцөл байдал)
YOUR SITE HERE
26. Кластерийн нягтын хувь
LOGO
Тооцоолол:
SAS программ
proc kde data = work. Cadg gridl=1 gridu = 20
method = srot out = outkde;
var packyears;
run;
YOUR SITE HERE