Phân biệt được Phân tích nhân tố và các kỹ thuật phân tích đa biến khác
Phân biệt giữa Phân tích nhân tố khám phá (EFA) và khẳng định (CFA)
Nắm các bước để áp dụng Phân tích nhân tố
Mô tả được các các nhân tố được trích xuất
Hiểu được ý tưởng của việc xoay nhân tố
Biết cách đặt tên nhân tố
Nắm các nhược điểm của phương pháp này
Bài giảng chương 8: Phương trình vi phân cấp một và cấp hai
Factor analysis (FA)
1. 1FACTOR ANALYSIS (FA) WITH IBM SPSS
FACTOR ANALYSIS (FA) WITH IBM SPSS
ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM
PHÂN TÍCH NHÂN TỐ
Factor analysis (FA)
ỨNG DỤNG TIN HỌC HỖ TRỢ NGHIÊN CỨU KHOA HỌC VÀ
HOẠT ĐỘNG XÂY DỰNG
Đỗ Tiến Sỹ, Trần Nguyễn Nhật Nam
TP. HCM. 09 - 2019
2. 2FACTOR ANALYSIS (FA) WITH IBM SPSS
FACTOR ANALYSIS (FA) WITH IBM SPSS
ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM
01 PHÂN TÍCH
NHÂN TỐ (FA)
02 PHÂN TÍCH NHÂN TỐ
KHÁM PHÁ (EFA)
03 HƯỚNG DẪN CHẠY
EFA BẰNG SPSS
04 XỬ LÝ CÁC LỖI
THƯỜNG GẶP
ĐỊNH NGHĨA, MỤC ĐÍCH
PHÂN LOẠI, MODELS
ĐỊNH NGHĨA, MỤC ĐÍCH
ỨNG DỤNG, ĐIỀU KIỆN ĐỂ THỰC HIỆN
CÁC BƯỚC THỰC HIỆN
TIÊU CHÍ ĐÁNH GIÁ MÔ HÌNH
ĐỌC HIỂU CÁC THUẬT NGỮ, KẾT QUẢ
CÁCH LOẠI BIẾN
MA TRẬN XOAY XÁO TRỘN
“ROTATION FAILED TO CONVERGE IN
25 ITERATIONS…”
05 Q&A, TRAO ĐỔI VỀ FA;
GIỚI THIỆU SEM
3. 3FACTOR ANALYSIS (FA) WITH IBM SPSS
FACTOR ANALYSIS (FA) WITH IBM SPSS
ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM
1. Phân biệt được Phân tích nhân tố và các kỹ thuật phân tích đa biến khác
2. Phân biệt giữa Phân tích nhân tố khám phá (EFA) và khẳng định (CFA)
3. Nắm các bước để áp dụng Phân tích nhân tố
4. Mô tả được các các nhân tố được trích xuất
5. Hiểu được ý tưởng của việc xoay nhân tố
6. Biết cách đặt tên nhân tố
7. Nắm các nhược điểm của phương pháp này
MỤC TIÊU KHÓA HỌC
4. 4FACTOR ANALYSIS (FA) WITH IBM SPSS
FACTOR ANALYSIS (FA) WITH IBM SPSS
ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM
VÌ SAO CÓ FACTORS ANALYSIS
− Gặp các “yếu tố ẩn” khó đo lường được (sự hài lòng, trung thành…) Thì
chúng ta phải tìm nhiều câu hỏi khác, phản ánh yếu tố đó và đo lường được.
Phát sinh VOs
Câu hỏi 1
Câu hỏi 2
Câu hỏi 3
Ảnh hưởng VOs
Câu hỏi 4
Câu hỏi 5
Câu hỏi 6
?
?
?
?
?
?
YẾU TỐ “ẨN BIẾN DỮ LIỆU
5. 5FACTOR ANALYSIS (FA) WITH IBM SPSS
FACTOR ANALYSIS (FA) WITH IBM SPSS
ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM
PHÂN TÍCH NHÂN TỐ (FA)
− Dùng để rút gọn một tập gồm nhiều biến quan sát phụ thuộc lẫn nhau
thành một tập biến (gọi là các nhân tố) ít hơn để chúng có ý nghĩa
hơn nhưng vẫn chứa đựng hầu hết nội dung thông tin của tập biến
ban đầu (Hair, 1998)
− Dựa trên cấu trúc liên hệ ngầm (underlying structure) giữa các biến
Keywords:
1. So sánh với hồi quy bội
2. Factor analysis = Interdependence Technique
3. Các biến không thể đo lường trực tiếp
4. Thu nhỏ và tóm tắt
6. 6FACTOR ANALYSIS (FA) WITH IBM SPSS
FACTOR ANALYSIS (FA) WITH IBM SPSS
ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM
PHÂN TÍCH NHÂN TỐ (FA)
− Các biến đóng vai trò quan trọng trong kỹ thuật phân tích đa biến
− Ví dụ: Chúng ta xây dựng một dự đoán doanh thu bằng hồi quy.
− Mục đích trả lời câu hỏi doanh nghiệp thành công hay thất bại
− Công cụ sử dụng hồi quy, hoặc các công cụ phân tích khác.
− Cần có các biến để thành lập mối quan hệ (sản lượng, giá cả,
nhu cầu, sức khỏe môi trường kinh doanh…)
− Các biến giúp xây dựng các mối quan hệ.
− Tùy bản chất của nghiên cứu, số lượng biến sẽ tăng.
− Phân tích đa biến cho phép phân tích hàng trăm, ngàn biến.
− Nhưng nếu quá nhiều biến sẽ có khả năng bị lặp, “giống” nhau → phải
quản lý, nhóm các biến tương quan mạnh, đặt tên, giảm số lượng.
7. 7FACTOR ANALYSIS (FA) WITH IBM SPSS
FACTOR ANALYSIS (FA) WITH IBM SPSS
ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM
PHÂN TÍCH NHÂN TỐ (FA)
Hai mục đích chính khi phân tích nhân tố:
1. Phát triển lý thuyết
Phát hiện và kiểm tra cấu trúc liên hệ giữa các biến, xác định, phân
loại nhân tố (Identify and classify variables)
2. Thu gọn dữ liệu
Đơn giản hóa một tập hợp các biến (Variables) phức tạp ban đầu
thành một tập các biến nhỏ hơn dưới dạng các nhân tố (Factors)
Phải lưu ý tới mức độ mất mát dữ liệu khi tiến hành FA
8. 8FACTOR ANALYSIS (FA) WITH IBM SPSS
FACTOR ANALYSIS (FA) WITH IBM SPSS
ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM
PHÂN TÍCH NHÂN TỐ (FA)
Có hai loại phân tích nhân tố
1. Phân tích nhân tố khẳng định (Confirmatory Analysis)
Kiểm tra cấu trúc quan hệ giả thuyết (Hypothesized structure) và
đánh giá mức độ phù hợp của mô hình (Goodness of fit).
2. Phân tích nhân tố khám phá (Exploratory Factor Analysis)
Khám phá và tổng hợp các mối quan hệ tiềm ẩn của bộ dữ liệu
* Buổi học hôm nay tập trung vào loại 2.
CFA và SEM (Structural equation modeling) được sử dụng khá nhiều,
nhưng phức tạp hơn, sẽ được giới thiệu vào buổi sau.
9. 9FACTOR ANALYSIS (FA) WITH IBM SPSS
FACTOR ANALYSIS (FA) WITH IBM SPSS
ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM
MÔ HÌNH FA ĐƠN GIẢN VÀ PHỨC TẠP
Hướng nội /
Hướng ngoại
Tâm lý bất ổn Tâm thần
Ví dụ: Một nghiên cứu về tính cách con người cho KQ như trên
− 12 biến được rút gọn thành 3 nhân tố cơ sở
− Các nhân tố gồm các biến tương đồng nhau
[Source: Eysenck’s 3 personality factors]
Nói
nhiều
Ngại
ngùng
Hòa
đồng
Vui vẻ
Lo
lắng
Ảm
đạm
Căng
thẳng
Mệt
mỏi
Lảng
tránh
Cục
cằn
Dị biệt
Bạo
lực
10. 10FACTOR ANALYSIS (FA) WITH IBM SPSS
FACTOR ANALYSIS (FA) WITH IBM SPSS
ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM
MÔ HÌNH FA ĐƠN GIẢN VÀ PHỨC TẠP
Factor 1
Factor 2
Factor 3
Item 1
Item 2
Item 3
Item 4
Item 5
Factor 1
Factor 2
Factor 3
Item 1
Item 2
Item 3
Item 4
Item 5
Mỗi biến đo lường chỉ đặt hệ số tải
(loading factor) lên 1 nhân tố
Mỗi biến đo lường có thể đặt hệ số tải
(loading factor) lên 1, 2, 3.. nhân tố
Mô hình FA đơn giản Mô hình FA phức tạp
11. 11FACTOR ANALYSIS (FA) WITH IBM SPSS
FACTOR ANALYSIS (FA) WITH IBM SPSS
ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM
PHÂN TÍCH NHÂN TỐ KHÁM PHÁ (EFA)
EFA sử dụng trong các trường hợp cơ bản sau đây:
1. Để giảm một số lượng lớn các biến thành các nhân tố nhỏ hơn
2. Để chọn một tập hợp nhỏ các biến từ một tập hợp lớn ban đầu
3. Để tạo ra một tập hợp các nhân tố, mà tập hợp các nhân tố này
được xem như là các biến không có tương quan với nhau. Đây chính
là một cách tiếp cận để xử lý vấn đề đa cộng tuyến (Multicollinearity)
trong mô hình hồi quy bội.
4. Để xác định tính hợp lệ của thang đo.
12. 12FACTOR ANALYSIS (FA) WITH IBM SPSS
FACTOR ANALYSIS (FA) WITH IBM SPSS
ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM
PHÂN TÍCH NHÂN TỐ KHÁM PHÁ (EFA)
- Nhân tố chung có thể được diễn tả như những tổ hợp tuyến tính của các
biến đo lường, điều này được thể hiện thông qua mô hình sau đây:
Fi = Wi1*X1 + Wi2*X2 + Wi3*X3 + . . . + Wik*Xk
- Trong đó:
+ Fi : ước lượng trị số của nhân tố i
+ Wi : quyền số hay trọng số nhân tố (Factor scores coefficient)
+ k : số biến
+ Xi : các biến quan sát
13. 13FACTOR ANALYSIS (FA) WITH IBM SPSS
FACTOR ANALYSIS (FA) WITH IBM SPSS
ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM
SỐ LƯỢNG MẪU CẦN THIẾT
Quy tắc Reference
Rule of 100 Gorsuch (1983), Kline (1979)
Rule of 200 Guilford (1954)
Rule of 500 Comrey và Lee (1992)
Subjects-to-variables (STV) ratio
20:1 Hair, Anderson, Tatham, và Black (1995)
10:1 David Garson (2008); Everitt (1975)
[4, 5]:1 Bryant và Yarnold (1995)
3:1 ( > 250) Cattell (1978)
- Ví dụ: có 20 biến, cần ít nhất 20 x 5 = 100 mẫu (theo Bryant)
- Không có con số giới hạn trên, số lượng biến càng nhiều,
coverage cao… sẽ cho kết quả càng tốt.
- GABAGE IN GABAGE OUT
14. 14FACTOR ANALYSIS (FA) WITH IBM SPSS
FACTOR ANALYSIS (FA) WITH IBM SPSS
ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM
TRÌNH TỰ THỰC HIỆN EFA
Thiết kế nghiên cứu
Phám phá? Khẳng định?
Bao gồm những biến nào? Cỡ mẫu?...
Principal Component Analysis Common factor Analysis
Nhân tố chính
Maximum Likelihood Factor
(Nhân tố hợp lý cực đại)
Số lượng nhân tố:
Quy luật của Kaiser-Guttman
Screen test / Plot
Chỉ tiêu tổng phương sai giải thích
Phương pháp trích xuất
Phương pháp xoay
Trực giao
Varimax
Equamax
Quartimax
Xiên
Promax
Direct Oblimin
Thu thập dữ liệu
1:5
GIGO
Xây ma trận
tương quan
15. 15FACTOR ANALYSIS (FA) WITH IBM SPSS
FACTOR ANALYSIS (FA) WITH IBM SPSS
ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM
TRÌNH TỰ THỰC HIỆN EFA
Xác định cỡ mẫu
Khảo sát, lọc kết quả thô
Phân tích độ tin cậy Cronback’s Alpha
Kiểm tra giả thuyết
Tính ma trận tương quan (Correlation matrix)
0
1
2
3
4
5
Extracting factors
Rotating factors
Loại biến và đặt tên Factors
16. 16FACTOR ANALYSIS (FA) WITH IBM SPSS
FACTOR ANALYSIS (FA) WITH IBM SPSS
ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM
KIỂM TRA GIẢ THIẾT
- Barlett test of sphericity
Xem xét giả thuyết H0: “Ma trận tương quan có phải là ma trận
đơn vị (identity matrix)”
Nếu phép kiểm định Bartlett có p < 5%, chúng ta có thể từ chối
giả thuyết H0 (ma trận tương quan là ma trận đơn vị), có nghĩa là
các biến có quan hệ với nhau.
- (*) Ma trận đơn vị là ma trận có đường chéo chính bằng 1 và tất cả
những phần tử khác đều bằng 0
17. 17FACTOR ANALYSIS (FA) WITH IBM SPSS
FACTOR ANALYSIS (FA) WITH IBM SPSS
ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM
KIỂM TRA GIẢ THIẾT
- K.M.O. Measure of Sampling Adequacy
Là một chỉ tiêu để xem xét sự thích hợp của FA
Nếu 0.5 ≤ KMO ≤1 thì phân tích nhân tố là thích hợp
Khoảng Đánh giá
>= 0.9 Rất tốt
[0.8, 0.9) Tốt
[0.7, 0.8) Được
[0.6, 0.7) Tạm được
[0.5, 0.6) Tệ
< 0.5 Không chấp nhận được
[Source: Kaiser, H. F. (1974). An index of factorial simplicity]
18. 18FACTOR ANALYSIS (FA) WITH IBM SPSS
FACTOR ANALYSIS (FA) WITH IBM SPSS
ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM
TRÍCH XUẤT NHÂN TỐ
- Mục tiêu ở bước này là xác định các nhân tố.
- Phương pháp thường hay sử dụng là Trích xuất thành phần chính
(Principal components analysis).
O
Var 1 (…,…,…)
Var 2 (…,…,…)
Var 3 (…,…,…)
Var 4
(…,…,…)
Var 5
(…,…,…)
Var 6
(…,…,…)
Var 7
(…,…,…)
Var p
(…,…,…)
D1=F1 (Var)
D2=F2 (Var)
D3=F3 (Var) Thuật toán: Trục
thành tố được xác định
theo phương pháp
phương sai của các
hình chiếu biến ban
đầu xuống trục thành
tố chính là cực đại
19. 19FACTOR ANALYSIS (FA) WITH IBM SPSS
FACTOR ANALYSIS (FA) WITH IBM SPSS
ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM
TRÍCH XUẤT NHÂN TỐ
- PCA - Principal Components Analysis
+ Giảm “biến” (data reduction) -> tạo ra biến “tổng hợp”
(composite variable) mà không mất thông tin.
+ The 1st principal component là phức hợp giải thích được nhiều
biến thiên nhất trong quần thể nhất
Cần ít nhất bao nhiêu phép
chiếu để mô tả con lạc đà?
Lưu ý: 1. PCA chỉ phù hợp với dữ liệu số
2. Rất nhạy cảm với dữ liệu bất thường Outlier
3. Không phù hợp với các mô hình phi tuyến.
20. 20FACTOR ANALYSIS (FA) WITH IBM SPSS
FACTOR ANALYSIS (FA) WITH IBM SPSS
ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM
- Ví dụ 1: Đánh giá các nhân tố gây ra phát sinh thay đổi (Variation
Order) (dựa trên thang đo Likert 7 điểm 1 = không ảnh hưởng tới
7 = cực kỳ ảnh hưởng)
TRÍCH XUẤT NHÂN TỐ
Nguyên nhân 1 2 3 4 5 6 7
AF1 Nhà thầu thay đổi biện pháp thi công
AF2 Thay đổi thiết kế, chỉ tiêu kỹ thuật
AF3 (SOW) không được xác định rõ ràng, đầy đủ
AF4 Thay đổi quy chuẩn, tiêu chuẩn
AF5 Fast track
AF6 Không có kế hoạch chiến lược
AF7 Tư vấn thiết kế bị lỗi và thiếu sót
AF8 Liên lạc, thông tin giữa các bên kém
AF9 Thay thể vật liệu, quy trình
AF10 Giám sát và quản lý công trường kém
AF11 Tư vấn thiếu hiểu biết về vật liệu, thiết bị sẵn có
21. 21FACTOR ANALYSIS (FA) WITH IBM SPSS
FACTOR ANALYSIS (FA) WITH IBM SPSS
ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM
TRÍCH XUẤT NHÂN TỐ
[0.8, 0.9): Tốt
Significant p < 0.05
22. 22FACTOR ANALYSIS (FA) WITH IBM SPSS
FACTOR ANALYSIS (FA) WITH IBM SPSS
ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM
- Căn cứ để xác định số factors được giữ lại:
- Eigenvalues > 1 (Latent root)
- Tổng phương sai trích Variance extracted >= 50% (Anderson &
Gerbing, 1988)
TRÍCH XUẤT NHÂN TỐ
- Nếu Eigenvalue giảm xuống dưới 1 có nghĩa là nhân tố đó giải thích
phương sai kém hơn so với 1 biến đơn lẻ
Trước trích xuất Sau trích xuất Sau khi xoay
% of Var
thay đổi?
Từ 11 biến ban đầu,
chỉ còn lại 3 nhân tố
có Eigenvalue > 1
còn giữ lại
23. 23FACTOR ANALYSIS (FA) WITH IBM SPSS
FACTOR ANALYSIS (FA) WITH IBM SPSS
ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM
- Căn cứ để xác định số factors được giữ lại:
- Scree Plot: chú ý khu vực có độ dốc lớn.
TRÍCH XUẤT NHÂN TỐ
Elbow: khuỷu tay
24. 24FACTOR ANALYSIS (FA) WITH IBM SPSS
FACTOR ANALYSIS (FA) WITH IBM SPSS
ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM
- Eigenvalues (trị riêng) và Eigenvector (vector riêng) là cơ sở cho
các phương pháp FA để giảm chiều dữ liệu (dimensionality
reduction) nhằm mô tả dữ liệu ngắn gọn.
TRÍCH XUẤT NHÂN TỐ
- Vector: hướng và độ lớn
- Line best fit chỉ hướng của đa số
phương sai dữ liệu. Eigenvector rút gọn
và chỉ phương của line đó. Còn
eigenvalues là một số cho biết data set
trải ra trên line đó như thế nào.
- Khi giảm chiều dữ liệu như vậy, chuyện gì xảy ra? Nhân tố mới đại
diện các biến ban đầu TỐT như thế nào?
25. 25FACTOR ANALYSIS (FA) WITH IBM SPSS
FACTOR ANALYSIS (FA) WITH IBM SPSS
ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM
XOAY NHÂN TỐ
- Sau khi trích nhân tố, giá trị Factor loading được tính ra.
- Khi tiến hành xoay, phương sai (Variance) được phân bố lại do đó hệ
số tải loading cũng như phần trăm phương sai trích (Percentage of
variance) cũng thay đổi theo.
- Mục đích của bước này: phân bố lại phương sai từ nhân tố ban
đầu thành các nhân tố đơn giản hơn nữa, có ý nghĩa và dễ giải
thích hơn.
Factor 1
Var 1
Var 2
Var 1
26. 26FACTOR ANALYSIS (FA) WITH IBM SPSS
FACTOR ANALYSIS (FA) WITH IBM SPSS
ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM
XOAY NHÂN TỐ
- Có 2 phương pháp xoay nhân tố
+ ∕Orthogonal
Trực giao
(SPSS Varimax)
Các nhân tố mới không
liên quan với nhau
Oblique
Xiên
(SPSS Oblimin)
Cho phép nhân tố liên quan
với nhau
27. 27FACTOR ANALYSIS (FA) WITH IBM SPSS
FACTOR ANALYSIS (FA) WITH IBM SPSS
ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM
XOAY NHÂN TỐ
- QUARTIMAX: Hàng được đơn giản hóa để biến được tải trên một
yếu tố duy nhất.
- VARIMAX (thường dùng): Được sử dụng để đơn giản hóa cột của
ma trận nhân tố sao cho các trích xuất nhân tố được liên kết rõ ràng
và cần có sự tách biệt giữa các biến.
- EQUIMAX: kết hợp 2 phương pháp trên.
Thường sử dụng Varimax. Equimax hoặc Promax: SEM
28. 28FACTOR ANALYSIS (FA) WITH IBM SPSS
FACTOR ANALYSIS (FA) WITH IBM SPSS
ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM
XOAY NHÂN TỐ
- Sau khi xoay nhân tố, phải kiểm tra mức độ ý nghĩa (significant) của
factor loading. Theo Hair et al (1998) con số đó phụ thuộc vào cỡ mẫu
của nghiên cứu. Cụ thể:
Giá trị đề nghị Cỡ mẫu Min
0.30 350
0.35 250
0.40 200
0.45 150
0.50 100
0.60 85
0.65 70
0.70 60
0.75 50
29. 29FACTOR ANALYSIS (FA) WITH IBM SPSS
FACTOR ANALYSIS (FA) WITH IBM SPSS
ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM
HIỆU CHỈNH VÀ ĐẶT TÊN NHÂN TỐ
- Hiệu chỉnh: dựa trên mức độ tin cậy thang đo (Cronback’s Alpha),
chuẩn xác nghiên cứu (Construct validity) cũng như các hệ số đo
lường hội tụ ở trên.
- Đặt tên nhân tố: cuối cùng các biến tương đồng với nhau sẽ được
nhóm cụm lại, sắp xếp theo mức độ tương quan. Do vậy biến với hệ
số loading cao nhất thường được dùng để đặt tên nhóm.
- Lưu ý khi đặt tên nhân tố:
+ Thể hiện được ý nghĩa của tất cả các biến
+ Các nhân tố không được tương đồng với nhau
+ Factor này có phù hợp không? So với các nghiên cứu trước đây?
30. 30FACTOR ANALYSIS (FA) WITH IBM SPSS
FACTOR ANALYSIS (FA) WITH IBM SPSS
ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM
HIỆU CHỈNH VÀ ĐẶT TÊN NHÂN TỐ
- Nhân tố “tốt, đẹp”:
+ Có ý nghĩa (make sense)
+ Dễ hiểu, giải thích
+ Cấu trúc đơn giản
+ Không có các factor loading phức tạp
31. 31FACTOR ANALYSIS (FA) WITH IBM SPSS
FACTOR ANALYSIS (FA) WITH IBM SPSS
ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM
THỰC HIỆN EFA TRONG SPSS
MÃ NGUYÊN NHÂN
MỨC ĐỘ ẢNH HƯỞNG
1 2 3 4 5
EF1 Giảm năng suất lao động
EF2 Trễ tiến độ hoàn thành
EF3 Tranh chấp giữa Chủ đầu tư và nhà thầu
EF4 Giảm chất lượng dự án
EF5 Vượt chi phí dự án
EF6 Tăng lợi nhuận của nhà thầu
EF7 Gây chậm trễ trong quy trình cung cấp vật liệu, thiết bị
EF8 Làm xuất hiện nhưng hoạt động không có giá trị cho dự án
EF9 Tăng chi phí của nhà thầu
EF10 Xuất hiện công tác phải làm lại
EF11 Gây chậm thanh toán cho nhà thầu
EF12 Làm xuất hiện các quy trình không cần thiết
EF13 Gây mất an toàn lao động
Ví dụ 2: Đánh giá các tác động gây ra phát sinh thay đổi (Variation order)
(dựa trên thang đo Likert 5 điểm)
32. 32FACTOR ANALYSIS (FA) WITH IBM SPSS
FACTOR ANALYSIS (FA) WITH IBM SPSS
ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM
THỰC HIỆN EFA TRONG SPSS
- Bảng khảo sát (Google Doc) với thang đo Linkert 5 điểm
- 152 bảng khảo sát hợp lệ được mã hóa và nhập vào SPSS
- Bảng hiển thị các biến dữ liệu
33. 33FACTOR ANALYSIS (FA) WITH IBM SPSS
FACTOR ANALYSIS (FA) WITH IBM SPSS
ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM
THỰC HIỆN EFA TRONG SPSS
- Lưu ý: trước giai đoạn này, dữ liệu đã phải được làm sạch và kiểm
tra độ tin cậy của thang đo, tránh biến rác (Artificial factors)
NHẮC LẠI VỀ CRONBACK’S ALPHA:
- Vào menu Analyze / Scale / Reliability Analysis
- Nằm trong khoảng [0.6, 0.9]
- Quy tắc loại biến:
+ Hệ số tương quan biến tổng bé hơn 0.3 (Nunnally, 1994)
+ Hệ số Cronbach's alpha if item deleted lớn hơn hệ số
Cronbach hiện tại
+ Biến nào trong file data bị loại do Cronback’s Alpha?
34. 34FACTOR ANALYSIS (FA) WITH IBM SPSS
FACTOR ANALYSIS (FA) WITH IBM SPSS
ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM
THỰC HIỆN EFA TRONG SPSS
- B1: Kiểm tra điều kiện để thực hiện EFA
- Analyze / Data Reduction / Factor.
35. 35FACTOR ANALYSIS (FA) WITH IBM SPSS
FACTOR ANALYSIS (FA) WITH IBM SPSS
ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM
- Đưa 12 biến vào “Variables”, sau đó chọn “Descriptives”
THỰC HIỆN EFA TRONG SPSS
Cho biết hệ số tương
quan của tất cả các biến
- Hộp thoại Descriptive giúp xác định các tham số thống kê mô tả cần
tính: thống kê mô tả từng biến, phương án nhân tố ban đầu, kiểm định
KMO Barllette và tính hệ số tương quan
36. 36FACTOR ANALYSIS (FA) WITH IBM SPSS
FACTOR ANALYSIS (FA) WITH IBM SPSS
ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM
- Continue, ta có kết quả sau:
THỰC HIỆN EFA TRONG SPSS
- Ta thấy KMO = 0.759 > 0.50, thõa mản yêu cầu để thực hiện EFA. Hơn
nữa, theo Kaiser (1974), nếu KMO > 0.70 : ĐƯỢC.
- Sig. = 0.000 < 0.05, ta có thể từ chối giả thuyết H0 (ma trận tương quan
là ma trận đơn vị), có nghĩa là các biến có quan hệ với nhau nên ta có
thể thực hiện EFA.
- Như vậy, với kết quả i), ii) thì dữ liệu này phù hợp để thực hiện EFA.
Có ĐỦ chỉ
tiêu cho mỗi factor
37. 37FACTOR ANALYSIS (FA) WITH IBM SPSS
FACTOR ANALYSIS (FA) WITH IBM SPSS
ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM
- B2: Rút trích nhân tố
- Analyze / Data Reduction / Factor.
THỰC HIỆN EFA TRONG SPSS
I
II
III
IV
38. 38FACTOR ANALYSIS (FA) WITH IBM SPSS
FACTOR ANALYSIS (FA) WITH IBM SPSS
ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM
- Chọn “Extraction…”, sau đó ta chọn các thông số như sau:
THỰC HIỆN EFA TRONG SPSS
- Hộp thoại Extraction cho phép:
+ Chọn phương pháp rút trích (default là rút các thành phần chính, PC)
+ Thể hiện ma trận chưa xoay, vẽ biểu đồ dốc.
+ Tiêu chuẩn rút trích.
I
B1
B2 B3
B4
B5
39. 39FACTOR ANALYSIS (FA) WITH IBM SPSS
FACTOR ANALYSIS (FA) WITH IBM SPSS
ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM
- Chọn “Rotation…”, sau đó ta chọn các thông số như sau:
THỰC HIỆN EFA TRONG SPSS
- Trong hộp Rotation, đánh dấu
Varimax nếu phương pháp là
Principle components
- Hộp thoại Rotation cho phép:
+ Chỉ định phương pháp xoay nhân tố.
+ Vẽ các nhân tố.
+ Số lần thực hiện tối đa để hội tụ phép xoay.
II
B56
B7
B8
40. 40FACTOR ANALYSIS (FA) WITH IBM SPSS
FACTOR ANALYSIS (FA) WITH IBM SPSS
ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM
- Chọn “Scores…”, sau đó ta chọn các thông số như sau:
THỰC HIỆN EFA TRONG SPSS
- Chọn Save as variables nếu
bạn muốn lưu lại nhân số (đã
chuẩn hóa) của từng nhân tố
- Hộp thoại Factor Scores cho phép:
+ Chọn phương pháp tính nhân tố (factor score)
+ Chọn thể hiện bảng trọng số nhân tố.
+ Sử dụng bảng dữ liệu này nếu có dùng ANOVA, tương quan, hồi quy
III
B10
B9
41. 41FACTOR ANALYSIS (FA) WITH IBM SPSS
FACTOR ANALYSIS (FA) WITH IBM SPSS
ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM
- Chọn “Options…”, sau đó ta chọn các thông số sau:
THỰC HIỆN EFA TRONG SPSS
- Chọn “Sorted by size” nếu
muốn sắp xếp các biến quan
sát trong cùng một nhân tố
đứng gần nhau.
- Chọn “Suppress absolute value
less than”, giá trị tuyệt đối nhỏ
hơn sẽ không hiển thị (ví dụ
0.47..). Trong trường hợp muốn
xuất nhiều factor loading, có
thê giảm giá trị đó xuống thấp
(0.2, 0.1…)
- Chênh lệch loading giữa 2
nhân tố phải lớn hơn 0.3
IV
B11
B12
42. 42FACTOR ANALYSIS (FA) WITH IBM SPSS
FACTOR ANALYSIS (FA) WITH IBM SPSS
ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM
THỰC HIỆN EFA TRONG SPSS
Hệ số đồng nhất
- Mỗi biến sẽ có một hệ số đồng
nhất (Communality), đó chính là
phần trăm phương sai biến được
giải thích bởi nhân tố trích xuất
mới.
- Chạy từ 0 (không có phương sai
nào được giả thích) tới 1 (tất cả
phương sai được giả thích)
- High communalities (> .5)Vì sao hệ số đồng
nhất khi chưa trích
xuất lại bằng 1?
43. 43FACTOR ANALYSIS (FA) WITH IBM SPSS
FACTOR ANALYSIS (FA) WITH IBM SPSS
ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM
XOAY NHÂN TỐ
Trường hợp này giải thích được bao nhiêu % và bị thất thoát bao nhiêu % ?
44. 44FACTOR ANALYSIS (FA) WITH IBM SPSS
FACTOR ANALYSIS (FA) WITH IBM SPSS
ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM
XỬ LÝ CÁC LỖI THƯỜNG GẶP
D= 0.303
D= 0.239
D= 0.142
D=0.237
- Ma trận xoay bị xáo trộn, không hội tụ
- Xem xét lại số liệu
- Lần lượt loại biến tải lên trên 2 nhân
tố và chênh lệch FL < 0.3. Lưu ý các
biến quan trọng của nghiên cứu.
(chọn Delta FL Min)
EF12, 10, 9 và 13
tải lên 2 nhân tố?
FL: hệ số tải nhân tố là hệ số tương
quan đơn giữa biến và nhân tố
45. 45FACTOR ANALYSIS (FA) WITH IBM SPSS
FACTOR ANALYSIS (FA) WITH IBM SPSS
ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM
XỬ LÝ CÁC LỖI THƯỜNG GẶP
3 nhân tố giải thích 70,4%
phương sai của 13 biến
ban đầu. Rất hiệu quả
Một căn cứ để đánh giá
nghiên cứu: nhân tố mới
giải thích phần lớn
phương sai, ít bị mất dữ
liệu (loss of data)
MAXIMUM VARIANCE USING
FEWEST FACTORS
Trị riêng
Tổng 100%
Số trục chính
Nhân tố “yếu”
Nhân tố “mạnh”
46. 46FACTOR ANALYSIS (FA) WITH IBM SPSS
FACTOR ANALYSIS (FA) WITH IBM SPSS
ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM
XỬ LÝ CÁC LỖI THƯỜNG GẶP
- CÁC PHÂN TÍCH SAU KHI THỰC HIỆN EFA:
+ Tiến hành các phân tích thông thường khác: ANOVA,
Regression. Nâng cao CFA, SEM.
+ Có thể dùng nhân số chuẩn hoặc tính nhân số
FL: hệ số tải nhân tố là hệ số tương
quan đơn giữa biến và nhân tố
Nhân tố
Biến
47. 47FACTOR ANALYSIS (FA) WITH IBM SPSS
FACTOR ANALYSIS (FA) WITH IBM SPSS
ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM
XỬ LÝ CÁC LỖI THƯỜNG GẶP
- Lỗi khi chạy EFA: "Rotation failed to converge in 25 iterations...".
- Nghĩa là dữ liệu chưa thể hội tụ được sau 25 bước lặp.
- Cách xử lý là khi chạy EFA, vào "Extraction" và chỉnh "Maximum
iteration for convergence" từ 25 lên 40, 50... rồi chạy lại EFA.
48. 48FACTOR ANALYSIS (FA) WITH IBM SPSS
FACTOR ANALYSIS (FA) WITH IBM SPSS
ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM
Q&A, DISCUSSION
- Cần tránh bị dẫn dắt bởi Loading factor. Phải suy nghĩ cẩn thận.
- So sánh với lý thuyết và thực tế để đưa ra cấu trúc nhân tố cuối
cùng.
- Phải hiểu và giải thích được nhân tố mình chọn.
- ‘Seeing what you want to see’
1. GIẢI THÍCH NHÂN TỐ:
49. 49FACTOR ANALYSIS (FA) WITH IBM SPSS
FACTOR ANALYSIS (FA) WITH IBM SPSS
ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM
- Bare Min. = 2
- Khuyết nghị Min.=3
- Max.= không giới hạn
- Càng nhiều biến:
→ ↑ mức độ tin tưởng (Reliability)
→ ↑ mức độ đầy đủ (Roundedness)
→ ↑ quy luật Hiệu suất giảm dần (Diminishing returns)
Điển hình, 4 -> 10 biến là hợp lý
2. BAO NHIÊU BIẾN 1 NHÂN TỐ THÌ ĐƯỢC?
Q&A, DISCUSSION
50. 50FACTOR ANALYSIS (FA) WITH IBM SPSS
FACTOR ANALYSIS (FA) WITH IBM SPSS
ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM
Là quy trình chủ quan, lưu ý:
- Giá trị factor loading (tùy cỡ mẫu, Min. = 0.4 200 samples)
(xem Hair et al, 1998)
- Chêch lệch Loading < 0.3
- Ý nghĩa và sự đóng góp của biến đó trong nhân tố
- Mỗi lần chỉ loại 1 biến và chạy lại EFA
- Số lượng biến đã có trong nhân tố
3. LÀM THẾ NÀO ĐỂ LOẠI BỚT BIẾN?
Q&A, DISCUSSION
51. 51FACTOR ANALYSIS (FA) WITH IBM SPSS
FACTOR ANALYSIS (FA) WITH IBM SPSS
ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM
1. Factor Loading > 0,5
2. 0,5 < KMO < 1
3. Kiểm định Bartlett có Sig < 0,05
4. Phương sai trích Total Varicance Explained > 50%
5. Eigenvalue > 1
6. Chênh lệch FL giữa các biến phải lớn hơn 0.3
Ý nghĩa của mỗi điều kiện? Vì sao vậy?
4. TRONG EFA CẦN PHẢI ĐÁP ỨNG CÁC ĐIỀU KIỆN:
Q&A, DISCUSSION
52. 52FACTOR ANALYSIS (FA) WITH IBM SPSS
FACTOR ANALYSIS (FA) WITH IBM SPSS
ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM
Áp dụng EFA cho các mô hình phức tạp?
Q&A, DISCUSSION
53. 53FACTOR ANALYSIS (FA) WITH IBM SPSS
FACTOR ANALYSIS (FA) WITH IBM SPSS
ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM
Áp dụng EFA cho các mô hình phức tạp?
Q&A, DISCUSSION
SIMPLE MODEL COMPLICATED MODEL
1. Frequency
2. Descriptive
3. Cronbach’s Alpha
4. Exploratory Factoring Analysis
(Principle Component – Varimax)
5. Correlation
6. Regression
1. Frequency
2. Descriptive
3. Cronbach’s Alpha
4. Exploratory Factoring Analysis
(Principle Axis Factoring – Promax)
5. Confirmatory Factoring Analysis
6. Structural Equation Modeling
SPSS AMOS, SmartPLS
A
B
C
D
A
B
DC
54. 54FACTOR ANALYSIS (FA) WITH IBM SPSS
FACTOR ANALYSIS (FA) WITH IBM SPSS
ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM
THỰC HÀNH
1. Truy cập: https://bit.ly/2JMNtyd
2. Tiến hành kiểm tra Cronbach’s Alpha và biện luận Kết quả.
3. Tiến hành phân tích nhân tố khám phá EFA:
+ 3.1 Kiểm tra điều kiện (Bartlett và KMO) và biện luận
+ 3.2 Rút trích nhân tố.
+ 3.3 Đặt tên và phân tích kết quả.
+ 3.4 Đề xuất kiến nghị
55. 55FACTOR ANALYSIS (FA) WITH IBM SPSS
FACTOR ANALYSIS (FA) WITH IBM SPSS
ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM
ĐÁNH GIÁ KHÓA HỌC
- Anh chị vui lòng truy cập https://bit.ly/2Zhgmrm
- Những đánh giá của anh chị sẽ được giữ bí mật, chỉ phục vụ mục
đích giảng dạy
56. 56FACTOR ANALYSIS (FA) WITH IBM SPSS
FACTOR ANALYSIS (FA) WITH IBM SPSS
ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM
TÀI LIỆU THAM KHẢO
1. Trong H. et al (2008). Data analysis with SPSS. Hong Duc Inc.
2. Hair Jr., J. F. et al. (1998). Multivariate data analysis with readings.
Englewood Cliffs, NJ Prentice-Hall.
3. Nunnally, J.C. (1978). Psychometric theory. McGraw-Hill.
4. Kaiser, H. F. (1974). An index of factorial simplicity. Psychometrika.
57. 57FACTOR ANALYSIS (FA) WITH IBM SPSS
FACTOR ANALYSIS (FA) WITH IBM SPSS
ĐỖ TIẾN SỸ, TRẦN NGUYỄN NHẬT NAM
APPENDIX
STT NHÂN TỐ ẢNH HƯỞNG MÃ HÓA
1 CĐT thay đổi kế hoạch, quy mô dự án AF1
2 Sai sót trong hồ sơ hợp đồng AF2
3 Trở ngại trong quá trình thúc đẩy ra quyết định AF3
4 Bản chất bảo thủ của chủ đầu tư AF4
5 Phạm vi công việc (SOW) không được xác định rõ ràng, đầy đủ AF5
6 Liên lạc, thông tin giữa các bên kém AF6
7 Thay thể vật liệu, quy trình AF7
8 Không có kế hoạch chiến lược AF8
9 Thay đổi thiết kế, chỉ tiêu kỹ thuật AF9
10 Tư vấn Thiếu hiểu biết về vật liệu, thiết bị sẵn có AF10
11 Nhà thầu thay đổi biện pháp thi công AF11
12 Tư vấn thiết kế bị lỗi và thiếu sót AF12
13 Xây dựng song song các công tác đường găng (Fast track) AF13
14 Nhà thầu không tham gia vào giai đoạn thiết kế AF14
15 Thay đổi thiết kế để tiết kiệm chi phí (Value engineering) AF15
16 Chậm gửi yêu cầu thông tin (RFI) AF16
17 Giám sát và quản lý công trường kém AF17
18 Yếu tố bất khả kháng AF18
19 Thay đổi quy chuẩn, tiêu chuẩn AF19
20 Cản trơ vì chính quyền AF20
Bảng A.1 Bảng mã hóa các các nhân tố ảnh hưởng đến thay đổi, phát sinh khối lượng
Editor's Notes
Maximum Likelihood là một phương pháp đánh giá tham số
Maximum Likelihood là một phương pháp đánh giá tham số
EF6 EF5.Tnglinhuncanhàthu va LF 0.45 (150 samples)
Lần 1: loại AF8 (EF9)
Lần 2: loai AF12 (EF13)
Lan 3: loai AF6 (EF7)
Lan 4: AF7 (EF8)