Thailand household's disparity of socioeconomic statust: A cluster analysis โดย ประภาศรี เลิศเลอเกียรติ อาจารย์ ดร. อานนท์ ศักดิ์วรวิชญ์
ในงาน THE FIRST NIDA BUSINESS ANALYTICS AND DATA SCIENCES CONTEST/CONFERENCE จัดโดย คณะสถิติประยุกต์และ DATA SCIENCES THAILAND
Similar to Thailand household's disparity of socioeconomic statust: A cluster analysis โดย ประภาศรี เลิศเลอเกียรติ อาจารย์ ดร. อานนท์ ศักดิ์วรวิชญ์ (10)
5. Two-step cluster analysis
• Capable of handling both categorical and continuous
clustering variables.
• Two-steps 1. Pre-clustering 2. Clustering
• Pre-clustering creates cluster feature tree and cluster
centers. It adds up leaves to node based on distance.
• Distance measure is log-likelihood distance. Continuous
variables are assumed normality while categorical
variables are assumed to have multinomial distribution.
• Clustering uses agglomerative hierarchical clustering
based on results step 1: Pre-clustering.
6.
7. Examples of cluster analysis
1. Disease clustering and classification
2. Hospital clustering
3. Claim control with cluster analysis
4. Market segmentation
5. Students clustering
6. Country clustering
16. Analytic Strategies for Clustering SES
and Exploring disparity
1. Exploring and interpreting cluster profile
1. Cluster profile plot
2. Comparing interval clustering variables’ means among
cluster membership
3. Associating categorical clustering variables with cluster
membership
17. Analytic Strategies for Clustering SES
and Exploring disparity
2. Validating cluster results with other variables
1. Associating other categorical variables with cluster
membership
3. Measuring disparity
1. Gini coefficient within and between cluster
2. Normalized entropy within and between cluster
36. โดยแบ่งกลุ่มเป็น n กลุ่ม เรียงตัวแปรจากน้อยไปหามาก
หรือจนสุดไปรวยสุด
โดยที่ คือ หรือเปอร์เซ็นต์สะสมของประชากร
(cumulative percentage of population)
คือ เปอร์เซ็นต์สะสมของรายได ้
(cumulative percentage of income)
สูตรคานวณ (Gini Coefficient)
1
n
iX
))((2 1
1
iii
n
i
i XXYXtcoefficienGini
iY