SEM與Amos進階-三星統計張偉豪

12,031 views

Published on

Published in: Technology, Business
0 Comments
2 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
12,031
On SlideShare
0
From Embeds
0
Number of Embeds
4,053
Actions
Shares
0
Downloads
421
Comments
0
Likes
2
Embeds 0
No embeds

No notes for slide

SEM與Amos進階-三星統計張偉豪

  1. 1. 1與SEM共舞- 威脅潛伏Amos advanced training張偉豪三星統計服務有限公司執行長Amos 亞洲一哥
  2. 2. 2Best readings for SEM
  3. 3. 3Best readings for SEM
  4. 4. 4Best readings for SEM
  5. 5. 5Outline (第一天)1. 遺漏值的處理與應用2. 資料的多元常態檢定及例外值檢核3. SEM模型P值顯著的因應 (Bollen andStine p correction)4. 模型配適度的修正5. Bootstrap的介紹與應用6. 結構模型的二階段準則 ( Andersonand Gerbing, 1988)7. SEM共線性的判斷及處理
  6. 6. 6Outline (第二天)8.SEM處理順序尺度及類別尺度的研究設計9.SEM小樣本的另一種解決方法10.結構方程模型的檢定力計算及樣本數決定11.最佳模型的搜索12.結構方程模型的報告準則
  7. 7. 7遺漏值與極端值• 遺漏值指的是某些變數缺乏測量值• 極端值指的是某些變數在數字上的距離遠離其他的變數• 這兩種情形在SEM分析中可能造成參數估計的偏誤或模形無法正定,不可以等閒視之。
  8. 8. 8遺漏值的偵測• 變數遺漏值– 分析敘述性統計次數分配表– 將變數選入右側視窗確定
  9. 9. 9遺漏值的偵測• 樣本遺漏值– 轉換計算變數函數選擇Nmiss– 將變數選入右側視窗確定– 資料後方會新增一變數“NMISS”
  10. 10. 10遺漏值的次數分配• 分析敘述性統計次數分配表選入NMISS確定
  11. 11. 11遺漏值的處理• 樣本數大的時候,可以直接移除具遺漏值的樣本。– 註:在Amos 分析中請以SPSS16.0以上的版本移除,否則Amos將無法讀取檔案。• 如果樣本數不大,可以資料插補的方式進行,如此可以維持一定的樣本,也可以保持足夠的統計檢定力。
  12. 12. 1212遺漏值插補• Amos進行分析不可以有遺漏值存在,因此資料若有遺漏值需進行插補。插補方法有4種• 最大概似插補法• 迴歸插補法• 隨機迴歸插補法• 貝氏估計插補法
  13. 13. 1313遺漏值插補-ML插補• View Interface PropertiesEstimate Mean and Intercept 打勾分析標準化輸出
  14. 14. 1414遺漏值插補- Regression imputation• Analyze Data ImputationRegression imputation
  15. 15. 1515遺漏值插補-Stochastic regression imputation• Analyze Data ImputationStochastic regression imputation
  16. 16. 1616遺漏值插補-Bayesian imputation• Analyze Data ImputationBayesian imputation
  17. 17. 1717遺漏值插補-不同方法的比較資料插補-ML插補法 資料插補-regression資料插補-stochastic 資料插補-bayesian
  18. 18. 18遺漏值的插補1. View Interface PropertiesEstimate Mean and Intercept打勾2. Analyze Data ImputationBayesian imputation3. 依右圖設定4. 貝氏估計由綠色臉變成黃色笑臉表收斂完成
  19. 19. 19遺漏值的插補5. 開啟data imputation_c6. 刪除「圖像」和「語文」等潛在構面的變數存檔7. Amos重新讀取data imputation_c8. 選擇Grouping Variable Imputation_Group Value 選擇任一組樣本分析9. 直到所有組別測試完畢,留下估計值及配適度較好的樣本進入分析。
  20. 20. 20資料的多元常態檢定及例外值檢核
  21. 21. 21多元常態及極端值檢核
  22. 22. 22View Analysis Properties Output
  23. 23. 23多元常態檢定顯示為非多元常態• 偏態及峰度是檢查是否單變量常態的重點• 多元常態則是看Multivariate 的c.r.≦5
  24. 24. 24資料常態及例外值檢定• Kline (2005, p49~52)– 理論上常態峰是偏態為0,峰態為3,由於統計軟體峰態會減3,因此峰態為0及偏態為0視為常態)。– 實務上偏態絕對值在2以內,峰態絕對值在7以內可視為常態,skew>3為極端偏態,kurtosis>20為極端峰態。
  25. 25. 25極端值檢定• 顯著代表該樣本距離樣本中心位置的存在很有信心,但是否為極端值,仍需考慮。p2小於.001仍採保守原則,表示該馬氏距離是存在的。
  26. 26. 26P-value顯著與模型配適度修正• 當模型P-value顯著時會被視為模型與樣本配適度不佳,但是P-value容易受到樣本數的影響而導致顯著拒絕H0。• H0的拒絕究竟是模型不好所造成或是樣本數太大所造成,可用Bollen-Stine p-valuecorrection (1993) 評估。
  27. 27. 27P-value顯著與模型配適度修正• Bollen-Stine p-value correction (1993) 應用於輸入資料呈現非常態、模型卡方值膨脹及p-value顯著時校正:1. 如果分析資料為非多元常態易造成卡方值膨脹,可以利用Bollen-Stine加以修正卡方值2. 利用Bollen-Stine p-value估計的卡方值重新修正模型整體配適度3. Bollen-Stine p-value估計評估p-value顯著是否為樣本數大所造成。
  28. 28. 28Bollen-Stine bootstrap• Bootstrap次數學者建議1000次~5000次。• Bollen-Stine建議採2000次,一般不得少於1000次。
  29. 29. 29Bollen-Stine 計算結果2000個模型收斂的迭代次數,次數愈少表模型愈好
  30. 30. 30Bollen-Stine p-value correction(Byrne 2001, 284~285)• H0:ML估計的配適度與Bollen-Stine估計的配適度一樣。• P<0.05表示ML與Bollen-Stine估計不同• Bollen-Stine bootstrap p的意義為:下一個出現較差模型的機率為(240+1)/2001= 0.1204
  31. 31. 31Bootstrap Distributions卡方平均值• 4.94為執行2000次的估計所得卡方值加總平均值
  32. 32. 32SEM模型Bollen-Stine配適度修正• Bollen-Stine bootstrap 2000次
  33. 33. 33
  34. 34. 34Bollen-Stine p procedure correction
  35. 35. 35Bollen-Stine bootstrap p的意義• 如果重複抽樣1000次,950次以上家戶所得均低於平均所得,當然有足夠的證據證明多數家戶所得是低於平均所得。家戶所得(萬)家戶數0 120 ∞家戶平均所得
  36. 36. 36Bootstrap 使用時機1. 樣本不夠大時,但仍不能小於100個樣本。2. 資料呈現非常態分佈,然而卻無法修正。3. 欲得到所有估計參數的信賴區間及標準誤。
  37. 37. 37Bootstrap method (自助法)– 利用抽出放回的方式重覆抽樣來增加樣本數– 主要目的為了得到穩定的平均數分布 (常態分配)、信賴區間及標準誤估計
  38. 38. 38原始資料莖葉圖
  39. 39. 39原始資料長條圖
  40. 40. 40重新估計路徑值 (bootstrap 1000)• 取消Bollen-Stinebootstrap,點選估計 95 %信賴區間,重新估計新的標準誤。
  41. 41. 41ML與Bootstrap估計值• Bootstrap的表要在點選estimate下的選項後,下面Bootstrap的結果才能點選
  42. 42. 42共變異數的信賴區間• Bias-corrected及Percentile是很重要的兩種bootstrap的信賴區間估計法
  43. 43. 43結構模式的二階段準則 (Bollen,1989)1. 重新界定 SR 模型成為 CFA 模型,並讓所有的因素有相關。2. View the structural portion of theSR as a path model.• 二階段模型估計準則是SEM分析的充份條件,假如在測量模型下可以正定,那麼整個模型就會正定。• 除此之外,尚可了解模型是否有共線性的問題。
  44. 44. 44Figure 1.SEM結構模型TPB結構模型
  45. 45. 45TPB的CFA ModelFigure 2.TPB的CFA Model第一步:將模型重新架構成一階CFA完全有相關
  46. 46. 46高度共線性造成的問題• 標準化迴歸係數– 標準化迴歸係數應介於-1~1之間,當變數之間相關接近1時,表示這些變數代表同一件事,當這些變數同時去影響其它變數時,SEM估計過程會無法分出兩個近似的迴歸係數來,結果可能導致一個係數很高而另一個卻為負值。• 非標準化迴歸係數的標準誤– SEM會估計會產生較大的標準誤,使得迴歸係數檢定不顯著。z value=estimate/s.e.
  47. 47. 47高度共線性造成的問題• 參數估計的共變異數– 共線的兩個變數的共變異數會出現遠大於其它變數間的估計值,造成模型卡方值上升。• 變異數估計– 變數上可能會得到一個負的變異數,不合理的估計值, 一般稱為Heywood Case。• R2 (SMC)不可相加性。
  48. 48. 48高度共線性造成的問題• 迴歸係數與相關係數符號不一致,甚至於標準化係數大於1。1 2 121 2 22 12(1 )(1 )b bbr r rbr r−=− −x1x2y1b1r12b2d1
  49. 49. 49TPB Model• SNBI出現不符合假設狀況的值
  50. 50. 50共線性的處理 (Hebert et al., 2004)• 將共線性構面的係數設等同重新估計,即可得到正確的估計值
  51. 51. 51係數設定等同前、後比較• 迴歸係數由不顯著變顯著,正負符號也符合實際狀況
  52. 52. 52另一個共線的解決之道• 實務上變數共線代表的另一個意義便是具有一個更高階的因素存在。認知態度情感態度行為意圖認知態度情感態度整體態度 行為意圖高度相關
  53. 53. 53如何解決模型中潛在變項單一指標測量?OBrien, Robert. 1994."Identification of SimpleMeasurement Models withMultiple Latent Variablesand Correlated Errors."pp. 137-170 in PeterMarsden (Ed.) SociologicalMethodology. Blackwell.
  54. 54. 54多指標迴歸結構模型滿意度 忠誠度滿意度 忠誠度 績效x1 x2 x3 y1 y2 y3y4 y5 y6x1 x2 x3 y1 y2 y3d1d1 d211 111
  55. 55. 55Two indicators rules
  56. 56. 56潛在變數單一指標測量• x=F+e  Var(x)=Var(F)+Var(e)• 信度= Var(F)/Var(x)= [Var(x)-Var(e)]/Var(x)=1- Var(e)/Var(x)• Var(e)=(1-信度) × Var(x)F x e11
  57. 57. 57變異數的計算• Loading設1,殘差設0,表信度為1Amos 結果 SPSS 結果
  58. 58. 58信度0.8的設定• e1=(1-0.8) ×Var=0.2×1.026=0.2050.895為標準化負荷量0.8為信度,為標準化負荷量的平方值變異數設1為標準化設定殘差設0.205,表信度為0.8
  59. 59. 59Item parceling
  60. 60. 60Advantage of Item Parceling1. 加總或平均後的分數會近似於常態分配2. 改善題目與樣本比(item:N)3. 增加構面的信度4. 估計參數較少5. 參數估計較為穩定6. 降低題目變異的不確定7. 簡化模型易於解釋
  61. 61. 61SEM TAMParceling TAM
  62. 62. 62因素負荷量與測量誤差Variable α 1-α Varianceλ=√Var(x)αError=Var(x)(1-α)ATT 0.75 0.25 1.004 0.868 0.251EOU 0.784 0.216 0.715 0.749 0.154UF 0.758 0.242 0.833 0.795 0.202BI 0.888 0.112 1.030 0.956 0.115
  63. 63. 63Parceling TAMSEM TAM
  64. 64. 64SEM如何處理順序尺度及類別尺度的研究設計?
  65. 65. 65三種處理類別或順序尺度的方法1. 將資料轉為 polychoric 或 polyserialmatrics2. Amos Bayesian 估計3. Items to parcel(將類別、順序尺度變數轉為連續尺度)
  66. 66. 66polychoric 或 polyserial matrics• 利用lisrel的prelis語法轉出適當的矩陣
  67. 67. 67SEM相關矩陣的應用1. Both vars interval: Pearson r2. Both vars dichotomous:Tetrachoric correlation3. Both vars ordinal:Polychoric correlation4. One var interval, the other a forcedichotomy:Biserial correlation
  68. 68. 68SEM相關矩陣的應用5. One var interval, the other ordinal:Polyserial correlation6. One var interval, the other a truedichotomy: point-biserial7. Both true ordinal: Spearman rankcorrelation or Kendall’s tau8. Both true nominal:phi or contingency coefficient9. One true ordinal, one true nominal:gamma
  69. 69. 69SEM相關矩陣interval ordinal nominalinterval Pearson rordinal polyserialPolychoricSpearmanor KendallnominalBiserialPoly-biserialgammaTetrachoricPhi orcontigency
  70. 70. 70Amos Bayesian估計• 在ML估計及假設檢定,模式中的真實值是假設固定但未知,但估計值是隨機但己知。• 貝氏估計假設任何一個參數均為隨機參數,因此貝氏是指定一個機率分配;對貝氏估計而言,模式中的真實值是假設隨機且未知。
  71. 71. 71
  72. 72. 72
  73. 73. 73Items to parcel的條件1. 變數本身至少5點尺度,峰度接近0,且偏態絕對值不大於1且同為正偏或負偏• 假如變數5點以上尺度,通常第一點不成問題。• 若變數為 yes or no尺度?p.83
  74. 74. 74Dealing with yes or no questions• 以內、外控量表為例,共15題,no編碼為0,yes編碼為1,答yes愈多表示愈傾向內控,反之則傾向外控。1. 隨機將題目分成三群,每群5題2. 每群做分數加總成三個新變數3. 變數此時尺度介於0~5之間,形成6點的連續尺度4. 帶入CFA驗證
  75. 75. 75內外控二點尺度量度的處理
  76. 76. 76結構方程模型的檢定力計算及樣本數決定檢定力 (power)的介紹及重要性Power & sample sizes decisionSatorra & Sarris (1985)MacCallum, Browne & Sugawara (1996)
  77. 77. 77假設統計考驗的四種可能結果真實狀況統計決策拒絕H0 不拒絕H0H0為真錯誤決定型一錯誤(α)正確決定接受H0(1- α)H0為假正確決定拒絕H0(power:1-β)錯誤決定型二錯誤(β)
  78. 78. 78型I與型II錯誤 (Type I and II error)Type II errorA missed detection失之交臂Type I errorA falsealarm無中生有
  79. 79. 79Effect size vs. power• Effect size愈大,power愈大
  80. 80. 80型I錯誤• 顯著水準5%是當母體並沒有關係存在,但研究卻宣稱有關係存在的機率不能超過5%。• 5%機率的產生只是因為抽樣誤差所造成的偶然而已。
  81. 81. 81型II錯誤• 事實上效果真的存在,但卻宣稱不存在。• 樣本愈少,愈容易犯型II錯誤。
  82. 82. 82模型檢定統計結果(Kline, 2011, p.193)• Reject-support context– 檢定結果是顯著的 (p<0.05) ,則支持研究者的理論,如相關分析、迴歸分析、ANOVA檢定及路徑分析等。• Accept-support context– 檢定結果是不顯著的 (p>=0.05) ,則支持研究者的理論,如SEM、同質性、適合度檢定。
  83. 83. 83檢定力 (power)的介紹及重要性• 統計推論的正確性與 “樣本數” , “抽樣誤差”及 “檢定力”有關。• 樣本數愈大,標準誤愈小,信賴區間愈小,統計推論較不會受到抽樣誤差的影響,所以「愈多愈好」通常是成立的。• 自由度愈大,統計檢定力愈大
  84. 84. 84檢定力 (power)• Power:正確的判定統計結果,有關群組之間有差異或變數之間有相關的機率• Power又隱含了檢定出正確結論的機率,所以檢定力低表示:如果研究者的模型是對的,那麼檢定出此一結果的機率很低。• Power=0.8表示5次的檢定中有4次真實的效果會被檢出。換言之,當結論有差異時,有80%的信心結果真的有差異。
  85. 85. 85結構方程模型的檢定力計算及樣本數決定• SEM模型整體的檢定力 (power)及樣本數採用MacCallum, R.C., Browne, M.W.& Sugawara, H.W. (1996)• SEM模型每一條路徑係數的檢定力採用Satorra & Saris (1985)Kline, 2011. p222
  86. 86. 86檢定力的假設• H0:ε≦0.05 (close fit)Ha:εa=0.08• H0:ε≧0.05 (not-close fit)Ha:εa=0.01
  87. 87. 87R語言執行SEM 檢定統計力#Power analysis for SEMalpha <- 0.05 #alpha leveld <- 200 #degrees offreedomn <- 250 #sample sizermsea0 <- 0.05 #nullhypothesized RMSEArmseaa <- 0.08 #alternativehypothesized RMSEA#Code below this point neednot be changed by userncp0 <- (n-1)*d*rmsea0^2ncpa <- (n-1)*d*rmseaa^2#Compute powerif(rmsea0<rmseaa) {cval <-qchisq(alpha,d,ncp=ncp0,lower.tail=F)pow <-pchisq(cval,d,ncp=ncpa,lower.tail=F)}if(rmsea0>rmseaa) {cval <- qchisq(1-alpha,d,ncp=ncp0,lower.tail=F)pow <- 1-pchisq(cval,d,ncp=ncpa,lower.tail=F)}print(pow)
  88. 88. 88R語言計算SEM 樣本數#Computation of minimumsample size for test of fitrmsea0 <- 0.05 #nullhypothesized RMSEArmseaa <- 0.01 #alternativehypothesized RMSEAd <- 200 #degrees of freedomalpha <- 0.05 #alpha leveldesired <- 0.8 #desired power#Code below need not bechanged by user#initialize valuespow <- 0.0n <- 0#begin loop for finding initiallevel of nwhile (pow<desired) {n <- n+100ncp0 <- (n-1)*d*rmsea0^2ncpa <- (n-1)*d*rmseaa^2#compute powerif(rmsea0<rmseaa) {cval <-qchisq(alpha,d,ncp=ncp0,lower.tail=F)pow <-pchisq(cval,d,ncp=ncpa,lower.tail=F)}else {cval <- qchisq(1-alpha,d,ncp=ncp0,lower.tail=F)pow <- 1-pchisq(cval,d,ncp=ncpa,lower.tail=F)}}
  89. 89. 89R語言計算SEM 樣本數}else {cval <- qchisq(1-alpha,d,ncp=ncp0,lower.tail=F)pow <- 1-pchisq(cval,d,ncp=ncpa,lower.tail=F)}powdiff <- abs(pow-desired)if (pow<desired) {foo <- 1}if (pow>desired) {foo <- -1}}minn <- newnprint(minn)#begin loop for interval halvingfoo <- -1newn <- ninterval <- 200powdiff <- pow - desiredwhile (powdiff>.001) {interval <- interval*.5newn <- newn + foo*interval*.5ncp0 <- (newn-1)*d*rmsea0^2ncpa <- (newn-1)*d*rmseaa^2#compute powerif(rmsea0<rmseaa) {cval <-qchisq(alpha,d,ncp=ncp0,lower.tail=F)pow <-pchisq(cval,d,ncp=ncpa,lower.tail=F)
  90. 90. 90模型設定探索(Model Specification Search)• 模型探索主要為了找出多個模型中最精簡的模型。• 研究者可以將迴歸路加以選擇,每條路徑均會產生顯著或不顯著的結果,因此如果選了4條迴歸線,就會產生24=16個模型,Amos會評估16個模型的優劣,進而挑選出與模型配適度最佳且較精簡的模型。
  91. 91. 91模型設定探索• Analyze Specification Search或– 按 選擇要評估的路徑,點選後會由黑色變成紫色線。若要恢復則點 即可變回黑色。– 按 ,Amos會立即進行分析
  92. 92. 92選擇路徑
  93. 93. 93多個模型分析結果
  94. 94. 94最終模型確認
  95. 95. 95SEM報告的準則 (ch.9)• 概念模型及統計模型的敘述• 樣本資料的細節– 資料分析矩陣– 資料的分佈• 結果說明– 估計方法– 配適指標– 參數的估計– 競爭模型– 等值模型
  96. 96. 96SEM報告的準則 (ch.9)• 事後修正– 測量誤差的相關– 非標準化或特定的效果• 模型配適的額外資訊– 統計檢定力– 交叉效度• 解釋與推論
  97. 97. 97概念及統計模型的敘述• 概念模型– 實務上操作的概念關係圖形,不含 “指標” 、“測量誤差” 、 “負荷量” 。– 概念圖應對假設的每一條路加以解釋及判斷
  98. 98. 98概念及統計模型的敘述• 統計模型– 為概念模型的展開– 包括觀察變數、潛在變數、負荷量、殘差、路徑、固定及自由參數
  99. 99. 99樣本資料的細節• 資料分析矩陣– 分析時以 “共變異數矩陣”取代 “相關矩陣”(Cudeck, 1989) ,若輸入為 “相關矩陣”一定要提供標準差。– 矩陣至少要到小數點後三位數。– 共變異數矩陣需提供於附錄中。• 資料的分佈– 變數常態及多元常態檢定,提供skew及kurtosis等參數
  100. 100. 100結果說明• 估計方法– MLE(實務上的最佳法)是SEM的標準內定估計法,即使在小様本、過高的峰態仍有不錯的表現。– ADF(理論上的最佳法) ,不論資料呈現何種分佈,樣本需2000個以上。• 配適指標1.絕對配適指標2.增值配適指標3.精簡配適指標4.競爭配適指標
  101. 101. 101結果說明• 參數的估計– 估計參數值要在可接受的範圍內• Heywood cases (負的變異數)• 超出範圍的共變異數(標準化估計值大於1)• 不要使用希臘字母及下標代表參數名字– 估計標準誤及臨界值(critical ratio, estimate/standard error)– 不要重新估計之前被固定非0的值• 如每個因素都有一個觀察變數loading設為1– 報告整體配適度的同時,也要在論文解釋每一個估計參數
  102. 102. 102結果說明• 競爭模型 (alternative models)– 研究者應假設一個競爭模型與自定的推論模型做比較 (alternative models) 。– 或在分析過程中發現假設模型設定錯誤時,事後修正後的模型 (Model Specification)。– 競爭模型分成巢形比較(Δχ2及ΔCFI檢定)及非巢形比較(ECVI及AIC)兩大類。
  103. 103. 103結果說明• 模型修正的兩個問題1.測量誤差設定相關2.測量誤差與其它測量變數設定相關• MacCullum et.al.(1992) ,如果沒有具體而充份的理由,所有的修正都是不建議的。
  104. 104. 104結果說明• 等值模型– 統計上的等值模型是常忽略的競爭模型– 等值模型與假設模型包含了相同的變數及精簡程度,應該要考慮進來。– MacCullum et.al.(1993)建議應該在文章中新增一節討論等值模型,以利了解為何模型要假設成這樣,而不是其它的關係。
  105. 105. 105模型配適的額外資訊• 統計檢定力– 在社會及行為科學研究中,有些研究人員會宣稱其分析樣本夠大足以達到研究目的代表性。– SEM的統計檢定力是模型樣本大小的函數– 低的POWER會導致顯著的卡方值及模型配適度不佳時,無法拒絕模型。• 交叉效度– 可檢定模型本身是否具模型穩定性。
  106. 106. 106解釋與推論• 解釋假設模型中每一個相關或因果關係,含標準化及非標準化係數。• 如果樣本不夠大,可信度會降低,其估計值及推論應小心探討。• 資料有非常態應該要報告並採取相對的分析策略。
  107. 107. 107Jackson and Gillaspy, 2009
  108. 108. 108
  109. 109. 109三星統計服務有限公司• SEM教育訓練– SPSS 統計訓練– SEM 基礎訓練– SEM 進階分析– SEM 實務應用– SEM 寫作不求人– SEM 縱斷面分析應用• 演講邀約• 論文分析統計諮詢• 資料分析• 統計小班教學• IBM SPSS暨Amos軟體報價、銷售E-mail: semsoeasy@gmail.comFax: 07-3909741
  110. 110. 110三星統計服務有限公司• 全國最專業的SEM統計服務團隊• 快速並正確解決您統計上的問題• 教育訓練沒有煩人的數學推導、只有實例的深入探討• 以生活上的例子解釋抽象的統計概念• 全亞洲唯一的白話文結構方程模型教學• 全台唯一充滿熱情、活力、幽默的統計學講師

×