Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

人口統計應用於選舉預測-蔡佳泓

3,490 views

Published on

人口統計應用於選舉預測-蔡佳泓

Published in: Data & Analytics

人口統計應用於選舉預測-蔡佳泓

  1. 1. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 人口統計運用在選舉預測 蔡佳泓 國立政治大學選舉研究中心暨東亞研究所 tsaich@nccu.edu.tw August 22, 2015 2015 台灣資料科學愛好者年會 蔡佳泓 (tsaich@nccu.edu.tw ) 國立政治大學選舉研究中心 1/378/22/2015 1 / 37
  2. 2. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 主要報告內容 1 台北市長選舉預測結果 2 選舉預測方法 何謂多層次分析 迴歸模型 3 為什麼要用多層次分析模型 4 選舉行為模型 多層次分析與貝氏統計 5 多層次分析以及事後加權 6 2004 年預測模型 7 結論 蔡佳泓 (tsaich@nccu.edu.tw ) 國立政治大學選舉研究中心 2/378/22/2015 2 / 37
  3. 3. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 台北市市長選舉柯文哲得票率中位數預測 蔡佳泓 (tsaich@nccu.edu.tw ) 國立政治大學選舉研究中心 3/378/22/2015 3 / 37
  4. 4. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 二十個縣市長選舉民進黨得票率之預測 蔡佳泓 (tsaich@nccu.edu.tw ) 國立政治大學選舉研究中心 4/378/22/2015 4 / 37
  5. 5. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 如何進行選舉預測 把各個縣市、選區視為一個「層次」,或者是次類別。 假設每個縣市有其共通性,但是也有特殊的地方。 從民調資料得到民眾對於候選人或政黨的支持,然後加上選區的人 口結構,或者加上上次的選舉結果,克服民意調查中民眾不表態的 問題。 利用貝氏統計克服各個層次樣本規模不一、點估計的不確定程度 (標準誤)過大的問題。 蔡佳泓 (tsaich@nccu.edu.tw ) 國立政治大學選舉研究中心 5/378/22/2015 5 / 37
  6. 6. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 多層次分析的意義 多層次分析指的是考慮依變數與自變數的關係之外,而且需要估計 不同群體的個體之間的差異。 如果我們把所有的樣本放在一起進行分析,可能忽略了個體所屬群 體之間的差異。如果我們區隔群體分別分析,又忽略了個體之間的 差異。 多層次分析可以用廣泛線性模型 (Generalized Linear Model) 進行, 但是貝氏統計可以更佳地估計樣本的不確定性。 多層次分析幫助研究者處理個體與總體資料。例如,每一個縣市有 多少人喜歡某項政策?有多少人會支持某位候選人等等。 蔡佳泓 (tsaich@nccu.edu.tw ) 國立政治大學選舉研究中心 6/378/22/2015 6 / 37
  7. 7. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 迴歸模型一 迴歸的目的是找到依變數或是反應變數 (outcome)Y 與一個或是一 個以上的預測變數 (predictor)X 的函數關係。 迴歸的基礎觀念是條件機率,也就是迴歸線逼近在 X 成立的條件 下,Y 的平均值。所以模型的對象是 E[Y|X],也就是 X 變化時,Y 的平均值變化大小。 母體迴歸函數 (Population regression function) 一般表示為 E(Y|X) = β0 + Xβ1 (1) 我們盡可能逼近 X 各個值的 Y 的平均數的函數。一旦找到這樣的迴 歸函數,可以用來預測其他的觀察值,或是進行因果推論。 E(Y|X) 表示固定 X 之後 Y 的平均值,等於 β0 + Xβ1。 隨機樣本的迴歸模型表示為 Yi = β0 + β1xi + ϵi。 迴歸對於 x 沒有任何假設,但是假設 ϵi 的平均值為 0,變異數不隨 著 x 變動而變動。 蔡佳泓 (tsaich@nccu.edu.tw ) 國立政治大學選舉研究中心 7/378/22/2015 7 / 37
  8. 8. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 迴歸模型二 隨機樣本的迴歸模型表示為 yi = β0 + β1xi + ϵi。 迴歸對於 x 沒有任何假設,但是假設 ϵi 的平均值為 0,這樣才能得 到 β1 的無偏估計,也就是等於母體的 β1。而且假設變異數不隨著 x 變動而變動,這樣的估計 β1 才有最小的不確定性。 y 可以是任意數,但是當 y 只有 0 與 1,雖然 β1 仍然是無偏估計, 但是並非最佳估計,進行假設檢定時會得到錯誤的結論。 因為 y 只有 0 與 1,所以平均值 E(Y) 介於 0 與 1,可詮釋成機率 Pr(yi = 1)。 當 y 只有 0 與 1,有可能出現 x 對於 y 的影響 β1 會隨著抽樣得到 x (例如家庭收入)的範圍改變而改變,而不是固定不變。 因此,當 y 只有 0 與 1,而我們又希望用線性模型逼近 x 與 y 之間的 關係時,把 y 轉換成 log Pi (1−Pi) ,變成沒有上下限的依變數。 蔡佳泓 (tsaich@nccu.edu.tw ) 國立政治大學選舉研究中心 8/378/22/2015 8 / 37
  9. 9. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 迴歸模型三 當 y 只有 0 與 1,而我們又希望用線性模型逼近 x 與 y 之間的關係 時,把 y 取對數轉換成 log Pi (1−Pi) ,變成沒有上下限的依變數,符合 線性模型的要求。 Pi 0 0.1 0.2 0.3 0.5 ... 1 log Pi (1−Pi) -Inf -2.19 -1.38 -0.84 0 ... Inf 上表顯示 Pi 在 0 與 1 會得到無限小與無限大,因此當 y 變異數太小 得到的結果需謹慎推論。 因為 logistic 分佈適合以上的非線性關係,所以用”logistic probability unit” 指機率模型,簡稱為 logit。 蔡佳泓 (tsaich@nccu.edu.tw ) 國立政治大學選舉研究中心 9/378/22/2015 9 / 37
  10. 10. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 分析步驟 1 從民意調查資料,找出依變數 Y,以及自變數 X,假設 E(Y|X) = β0 + β1X 2 如果 Y 是二元變數,例如投票給兩個政黨其中之一,或者是支持不 支持獨立,可以假定 Y 與 X 之間為非線性模型,也就是 Pr(Y = 1)=logit−1(β0 + β1X) 或者是 P(y = 1) 1 − P(y = 1) = exp(β0 + β1X) 3 把 β0 換成 α0,代表各個縣市的截距。 4 為了配合人口統計資料,β1 代表人口變項 X 的係數,X 可以是性 別、教育程度、年齡等類別變數或者是兩兩變數的交互作用。 5 估計得到的係數,代入模型之後得到 Y 的預測值:θ1, . . . , θn 6 計算人口資料每一細格的百分比,乘上 θj,得到每一細格 Pr(Y = 1),累加起來為特定特徵人口的 Pr(Y = 1)。 蔡佳泓 (tsaich@nccu.edu.tw ) 國立政治大學選舉研究中心 10/378/22/2015 10 / 37
  11. 11. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 多層次模型與一般模型比較 一般迴歸模型以個體資料為主,無法納入總體資料。而且個體之間 如果有地區的差異,無法處理不同地區有不同樣本數規模造成不同 標準誤。 多層次分析把所有的個體納入估計,所以得到的係數估計應該有較 小的標準誤。 多層次分析也可以納入總體資料來估計不同地區的差異. 相較於全部匯集 (complete pooling) 以及完全不匯集 (no pooling),多 層次分析的概念是部分匯集 (partial pooling)。所得到的係數估計介 於兩者之間。 蔡佳泓 (tsaich@nccu.edu.tw ) 國立政治大學選舉研究中心 11/378/22/2015 11 / 37
  12. 12. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 二元的投票模型 -1 假設我們隨機調查一千位二十歲以上成年人,其中投票選擇是二分 類,例如投給國民黨是 1,其它是 0。而且我們詢問受訪者的政黨認 同、經濟評估、教育程度、地區等等來解釋投票行為。模型可以寫 成: Pr(yi = 1)= logit−1 (β0 + βpartisanship partisanshipi + βeconomy economyi+ βeducation educationi + βage agei+ α city j[i] ) (2) 根據模型 (2) 估計得到的係數, 可以得到每一個人投票給國民黨的預 測機率 0∼1。但是縣市的差異例如「北藍南綠中??」並沒有出現在 這個模型。 蔡佳泓 (tsaich@nccu.edu.tw ) 國立政治大學選舉研究中心 12/378/22/2015 12 / 37
  13. 13. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 二元的投票模型 -2 多層次模型不僅解釋個體的差異,而且解釋群體(縣市)的差異。 例如,在模型 (3),我們用上一次縣市的總統選舉結果或者是經濟成 長的指標以及縣市所在的區域,解釋每一個縣市民眾投票的變異。 換句話說,我們假設民眾的投票行為決定於 1 個人的政治態度與社經背景 2 所在縣市的整體政治或經濟指標 α city j = β1 previous election + αregion regionm[j] for j= 1, · · · , 5 (3) 用韓國以及台灣的 2012 年總統選舉為例,其中用各省市的收入變 化解釋韓國選舉的選舉(收入變化越大越會投票給补槿惠)。 蔡佳泓 (tsaich@nccu.edu.tw ) 國立政治大學選舉研究中心 13/378/22/2015 13 / 37
  14. 14. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Figure 1: Map of GNP’s Vote Shares in the Korean Presidential Election, 2012 蔡佳泓 (tsaich@nccu.edu.tw ) 國立政治大學選舉研究中心 13/378/22/2015 13 / 37
  15. 15. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Figure 2: Map of KMT’s Vote Shares in Taiwan’s Presidential Election, 2012 蔡佳泓 (tsaich@nccu.edu.tw ) 國立政治大學選舉研究中心 13/378/22/2015 13 / 37
  16. 16. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Table 1: Linear Mixed Effect Models of Voting for Saenuri in South Korean Presidential Election, 2012 Intercept Individual-level Province-level Intercept 0.470∗∗∗ −0.081 −0.262∗ (0.057) (0.070) (0.108) Saenuri identification 0.696∗∗∗ 0.695∗∗∗ (0.023) (0.023) Conservative 0.020∗∗∗ 0.020∗∗∗ (0.005) (0.005) Retrospective Economic Evaluation 0.060∗∗∗ 0.060∗∗∗ (0.014) (0.014) Age 0.017∗ 0.017† (0.009) (0.009) Education −0.000 −0.002 (0.017) (0.017) Female 0.005 0.004 (0.018) (0.018) Change in Individual Income 2.311∗ (1.028) AIC 1447.765 470.773 466.248 BIC 1462.611 515.313 515.736 Log Likelihood -720.882 -226.386 -223.124 Num. obs. 1042 1042 1042 Num. groups: Province 15 15 15 Variance: Province.(Intercept) 0.044 0.005 0.003 Variance: Residual 0.225 0.085 0.085 Notes: ***p < 0.001, **p < 0.01, *p < 0.05. Standard errors are in parentheses. 蔡佳泓 (tsaich@nccu.edu.tw ) 國立政治大學選舉研究中心 14/378/22/2015 14 / 37
  17. 17. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 多層次模型與一般模型比較 根據前面的分析,多層次分析把所有的個體納入估計,所以得到的 係數估計應該有較小的標準誤。 相較於全部匯集 (complete pooling) 以及完全不匯集 (no pooling),多 層次分析的概念是部分匯集 (partial pooling)。所得到的係數估計介 於兩者之間。 例如我們用民眾對於五個縣市社會福利等政策的滿意程度,加上各 縣市的財政資料、預測民眾對於社會福利等政策預算是否應該增加 的態度,經過估計得到係數,跟分開縣市估計的結果加以比較。 蔡佳泓 (tsaich@nccu.edu.tw ) 國立政治大學選舉研究中心 14/378/22/2015 14 / 37
  18. 18. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 一般模型與多層次模型對照圖 蔡佳泓 (tsaich@nccu.edu.tw ) 國立政治大學選舉研究中心 15/378/22/2015 15 / 37
  19. 19. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 雖然多層次分析可以結合個體與總體資料,同時解釋個體與群體的 差異,但是每個群體的觀察值數目不同,如果我們要從模型估計結 果反推得到每個群體的投票機率,可能有問題。 我們希望能夠運用人口資料細格的資料進行資料加權,提高係數估 計的價值。 蔡佳泓 (tsaich@nccu.edu.tw ) 國立政治大學選舉研究中心 16/378/22/2015 16 / 37
  20. 20. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 多層次分析與貝氏統計 貝氏統計允許研究者用觀察到的資訊 (y) 更新對於母體參數 θ 的估 計。 根據貝氏定理,我們所感興趣的參數 θ 服從一機率分佈,先驗機率 p(θ) 與「概似函數」(likelihood function) p(y|θ) 的乘積,等於後驗分 佈 (posterior distribution),或者是 p(θ|y)。 Bayes Theorem p(θ|y) ∝ p(θ)p(y|θ) 統計推論來自於後驗分佈 p(y|θ) 抽樣得到的值。 多層次模型依據馬可夫鏈蒙地卡羅 (Markov Chain Monte Caro, MCMC) 拆解複雜的條件機率。透過 WinBugs 或是 JAGS 不斷地根 據觀察到的自變數、依變數等資料,所構成的條件機率抽樣。 蔡佳泓 (tsaich@nccu.edu.tw ) 國立政治大學選舉研究中心 17/378/22/2015 17 / 37
  21. 21. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 以韓國 2007 總統選舉為例 韓國政治有地區的分歧:保守黨多半來自東南部,反對黨來自西南 部,北部則是兩黨勢力平均。 因此,解釋投票行為時,除了政治態度之外,需要考慮選民所在地 區。 Pr(yi = GNP)= logit−1 (β0 + βpartisanship partisanshipi + βideology ideologyi+ βeconomy economyi + βpartisanship·ideology partisanshipi · ideologyi+ α province j[i] ) (4) α province j = β1 previous election + αregion regionm[j] for j= 1, · · · , 5 (5) 蔡佳泓 (tsaich@nccu.edu.tw ) 國立政治大學選舉研究中心 18/378/22/2015 18 / 37
  22. 22. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 蔡佳泓 (tsaich@nccu.edu.tw ) 國立政治大學選舉研究中心 18/378/22/2015 18 / 37
  23. 23. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 蔡佳泓 (tsaich@nccu.edu.tw ) 國立政治大學選舉研究中心 18/378/22/2015 18 / 37
  24. 24. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 多層次分析以及事後加權 以上的分析加上人口變項可以增加預測的準確性,被稱為多層次迴 歸以及事後加權(Multi-level Regression and Post-stratification, MRP) 為了利用人口統計,個體層次主要用人口變項預測行為,總體層次 可用過去的投票紀錄調整各縣市的預測結果。 模型可分成個體與總體兩層次: Pr(yi = 1)= logit−1 (β0 + βfemale × femalei + αeducation k[i] + α age l[i] + α education×age k[i],l[i] + α city j[i] ) (6) α city j = β1 × Previous Election + αarea × aream[j] for j= 1, · · · , 20 (7) 蔡佳泓 (tsaich@nccu.edu.tw ) 國立政治大學選舉研究中心 19/378/22/2015 19 / 37
  25. 25. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 先驗機率的設定 p(θ|y) 是我們要估計的參數,包括平均數以及變異數,而且我們要 用 p(θ) 輔助。 WinBUGS 等軟體可以從 p(θ|y) 進行抽樣,幫助我們估計 θ。但是樣 本與參數 θ 之間的差距,用一個準確性的指標 (precision parameter) 表示。 截距的先驗機率設定為常態分佈,變異數設定為 σ2,1/σ2 為準確 性,並且設定服從一致分佈 (uniform distribution)。 αage ∼ N(0, τ) τage = 1/σ2 αedu ∼ N(0, τedu ) τedu = 1/σ2 αage·edu ∼ N(0, τ) τage·edu = 1/σ2 σ2 ∼ unif(0.001, 10) (8)蔡佳泓 (tsaich@nccu.edu.tw ) 國立政治大學選舉研究中心 20/378/22/2015 20 / 37
  26. 26. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 事後加權 用 θj 代表多層次分析模型所得到的預測值,也就是: θj = logit−1 (Xjβ + ∑ S αS ) 其中 αS 代表每個縣市,而 X 代表各個自變項,在求出 β 之後,代 入人口統計的資料,得到預測值 θj。 θS = ∑ j∈JS Nj × θj ∑ j∈JS Nj (9) 而 Nj 代表某一個細分類的母體人口數,因此 θS 代表每一個都市的 事後加權所得到的平均值: 蔡佳泓 (tsaich@nccu.edu.tw ) 國立政治大學選舉研究中心 21/378/22/2015 21 / 37
  27. 27. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2010 年人口及住宅普查資料 依據統計法規定,政府於民國 45 年舉辦第 1 次臺閩地區戶口普查, 迄今已辦理 5 次普查。 採「公務登記輔以抽樣調查」方式辦理,共抽選 16% 樣本普查區進 行全面訪查(非普查)。 蔡佳泓 (tsaich@nccu.edu.tw ) 國立政治大學選舉研究中心 22/378/22/2015 22 / 37
  28. 28. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 行政院主計總處 蔡佳泓 (tsaich@nccu.edu.tw ) 國立政治大學選舉研究中心 23/378/22/2015 23 / 37
  29. 29. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 蔡佳泓 (tsaich@nccu.edu.tw ) 國立政治大學選舉研究中心 24/378/22/2015 24 / 37
  30. 30. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2010 年人口及住宅普查資料 l 01010000100007 2112271122141000221410000017 01010000300001 2132371415322200153222000018 01010000300009 2111223424242200242422000018 01010000800002 2112252226411000142323000017 · · · · · · 蔡佳泓 (tsaich@nccu.edu.tw ) 國立政治大學選舉研究中心 24/378/22/2015 24 / 37
  31. 31. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 用 Stata 轉換資料格式 R code infix sex 17 age 18-19 edu 27-27 language 31 town 1-4 using "P99C3.txt" 蔡佳泓 (tsaich@nccu.edu.tw ) 國立政治大學選舉研究中心 25/378/22/2015 25 / 37
  32. 32. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 資料描述 經過變數定義之後,資料總共有 20 個縣市 4 組教育程度:國小、國中、高中職、大學及以上 5 組年齡層:15-24 歲,25-34 歲,35-44 歲,45-54 歲,55 歲以上 性別 總共有 2,896,446 人分佈在 800 個細格中 例如,台北市有 272,401 人,宜蘭縣有 72,579 人 蔡佳泓 (tsaich@nccu.edu.tw ) 國立政治大學選舉研究中心 26/378/22/2015 26 / 37
  33. 33. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Stata 資料截圖 蔡佳泓 (tsaich@nccu.edu.tw ) 國立政治大學選舉研究中心 27/378/22/2015 27 / 37
  34. 34. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2014 縣市長選舉預測 利用 TEDS 於今年六月、九月所做的總統滿意度電話調查資料(約 2000 份樣本),估計多層次模型: Pr(yi = 1)= logit−1 (β0 + βfemale × femalei + αeducation k[i] + α age l[i] + α education×age k[i],l[i] + α city j[i] ) (10) 使用 2012 年總統選舉民進黨候選人在各縣市的得票率預測各縣市 的差距。 α city j = β1 · 2012 DPP’s Vote Share + αarea · aream[j] for j= 1, · · · , 20 (11) 使用 2010 年的人口普查資料,進行 MRP 估計各縣市得票率。 蔡佳泓 (tsaich@nccu.edu.tw ) 國立政治大學選舉研究中心 28/378/22/2015 28 / 37
  35. 35. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 柯文哲得票率預測 蔡佳泓 (tsaich@nccu.edu.tw ) 國立政治大學選舉研究中心 29/378/22/2015 29 / 37
  36. 36. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 比較各縣市 MRP 估計以及調查資料之民進黨得票率 蔡佳泓 (tsaich@nccu.edu.tw ) 國立政治大學選舉研究中心 30/378/22/2015 30 / 37
  37. 37. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 比較 MRP 估計以及最後民進黨得票率 蔡佳泓 (tsaich@nccu.edu.tw ) 國立政治大學選舉研究中心 31/378/22/2015 31 / 37
  38. 38. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2004 年的預測模型 俞振華、蔡佳泓,2006,〈如何利用全國性民調推估地方民意?多 層次貝式定理估計模型與分層加權的應用〉,《台灣政治學刊》,10 (1):5-38. 用 2000 年總統選舉中民進黨的得票率預測縣市在 2004 年總統選舉 的差異。 蔡佳泓 (tsaich@nccu.edu.tw ) 國立政治大學選舉研究中心 32/378/22/2015 32 / 37
  39. 39. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2004 總統選舉民進黨得票率之預測 蔡佳泓 (tsaich@nccu.edu.tw ) 國立政治大學選舉研究中心 33/378/22/2015 33 / 37
  40. 40. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 結論 1 多層次分析可幫助我們克服次層級 (sub-level) 樣本數不太一致時的 推論問題,得到信賴區間較小、不確定性較低的估計。 2 多層次分析可結合個體與總體資料。 3 如果加上人口資料,進行 MRP 分析,也就是事後加權,即使樣本數 少,仍然可以得到較準確的估計。 4 挑選預測次層級之間差異的總體變數是一大難題,必須配合人口統 計資料。 5 要預測比縣市更小的單位例如立委選舉結果需要長期、大量的訪問 資料。 蔡佳泓 (tsaich@nccu.edu.tw ) 國立政治大學選舉研究中心 34/378/22/2015 34 / 37
  41. 41. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 報告完畢、敬請指教 蔡佳泓 (tsaich@nccu.edu.tw ) 國立政治大學選舉研究中心 35/378/22/2015 35 / 37
  42. 42. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . One More Thing. . . 蔡佳泓 (tsaich@nccu.edu.tw ) 國立政治大學選舉研究中心 36/378/22/2015 36 / 37
  43. 43. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 政大選研中心的網路民調以及市長選舉結果 蔡佳泓 (tsaich@nccu.edu.tw ) 國立政治大學選舉研究中心 37/378/22/2015 37 / 37

×