More Related Content Similar to Ch9 sampling (10) More from Mingxuan Zhuo (18) Ch9 sampling2. 本章的學習主題
1. 抽樣的基本概念
2. 抽樣的程序
3. 機率抽樣
4. 非機率抽樣
5. 抽樣誤差與非抽樣誤差
6. 樣本大小的決定
3. 1 抽樣的基本概念
抽樣的基本意義是「選擇母體或群體 (population) 中
一部份的元素,針對抽出之樣本進行研究,並藉由研究
的結果推論整個母體」。
一、抽樣的專有名詞簡介
1. 元素 (element) :元素是指研究的基本單位,亦是蒐
集資料的根據。
2. 母體 (population) :母體是研究中所有元素的
集合,也是我們藉由樣本想要推論的標的。
4. 抽樣的基本概念
3. 抽樣單位 (sampling unit) :抽樣單位是指被抽取樣本
中的一個或是一組元素。
4. 樣本 (sample) :經過抽樣方法抽出的元素即為樣
本,樣本為母體的一部份,唯有其與母體具有共同的
特質,研究結果才有意義,故樣本必須具有代表性。
5. 抽樣架構 (sampling frame) :抽樣架構是元素
(element) 的集合名冊,描繪整個抽樣的情形。
6. 抽樣誤差 (sampling error) :所謂抽樣誤差即是所選
出的樣本並不能完全代表母體特質。
6. 2 抽樣的程序
圖 6—1 抽樣程序
資料來源:參考 William G. Zikmund (2003), “Business Research Methods”, seventh edition, p.372.
定義目標母體
選擇抽樣架構
選擇適當的抽樣方法
方法
決定樣本大小
選擇抽樣元素
實地進行資料蒐集
規劃選擇抽樣單位的流程
7. 2 抽樣的程序
一、定義目標母體 (Target Population)
目標母體必須非常明確,後續蒐集得來的資訊才有意義,才
能解決要研究的問題。
如何定義目標母體呢?學者 Davis (2005) 認為詳細的母體定
義應包含: 1. 元素 (elements) 、 2. 範圍、 3. 時間。
大學生網路沈迷問題調查
元素:大學生(個人)
範圍:台澎金馬地區,高教、技職、教育與軍事大專院校
時間: 99.1.1—99.3.5
12. 2 抽樣的程序
五、選擇抽樣單位 (Sampling units)
抽樣單位 (Sampling units) 有時和抽樣元素
(Sampling element) 是相同的
一般抽樣單位可能為群體或個人,且可以分成好幾階
段來進行。
Primary sampling units…
Secondary sampling units …
14. 3 機率抽樣
抽樣的目的在於用樣本來解釋母體的特質。
機率抽樣的基本要點是隨機選取 (random
selection) ,即每一個元素被抽出的機率是相同的,
且每次抽樣為獨立事件。
一、簡單隨機抽樣 (Simple Random Sampling)
二、系統抽樣 (Systematic Sampling)
三、分層抽樣 (Stratified Sampling)
四、群集抽樣 (Cluster Sampling)
15. 3 機率抽樣
一、簡單隨機抽樣 (Simple Random Sampling)
一般讀者最熟悉的可能是簡單隨機抽樣
在隨機抽樣中,母體中的每個元素被選出的機會是相
同的
一般實行的隨機抽樣被抽出的樣本是不放回重抽的
研究者可藉由以下的兩個方法來實行。
1. 號碼球取樣法
2. 亂數表法 (random number table)
16. 3 機率抽樣
程序:
1. 確定研究目的母體名單(抽樣框架) ,並予以
編號
2. 決定樣本數
3. 以籤桶(或號碼球)、電腦亂數抽出符合樣本
個數之號碼組
4. 被抽出的號碼即是樣本
特性:
母體不大時較為適用
各個研究標的被抽出的機率相等
17. 3 機率抽樣
二、系統抽樣 (Systematic Sampling)
所謂系統抽樣法,是把抽樣架構中各元素依次編號分
組,選取抽樣架構中第 K 個元素組成的樣本。
1 2 3 4 5 6 7 8 9
10 11 12 13 14 15 16 17 18 19 20
隨機開始
21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40
41 42 999 1000
………………………………………..
如研究者隨機選擇以 6 為第一個元素,每隔 10 個
抽取一個,故其選擇的樣本分別為第 6 、 16 、 26 、
36 、 46 、…… . ,共選取 100 個樣本
18. 系統抽樣
程序:
1. 確定研究目的母體名單(抽樣框架) ,並予以
編號
2. 決定樣本數 ( 根據抽樣比率 )
3. 決定抽樣區間 n 。 抽樣區間 n =母體大小 / 樣
本數
4. 從名單中前 n 筆,隨機選取一個樣本(假設此
樣本編號為 k )後,作為第一個樣本
5. 後續樣本分別為:編號 k+n, k+2n, k+3n…..
19. 系統抽樣
例:里民滿意度調查
1. 假設某里有 1000 里民,將此些里民予以編號
2. 欲抽出樣本數 100 ( 抽樣比率 10%)
3. 抽樣區間: 1000/100 = 10
4. 前 10 筆中,隨機選取一筆,假設為第 5 筆,此
為第一個樣本
5. 後續樣本:編號 15, 25, 35,….995
21. 分層抽樣
母 體 樣 本
一年級
二年級
三年級
四年級
一年級
二年級
三年級
四年級
2000 人
1500 人
1000 人
500 人
200 人
150 人
100 人
50 人
圖 6—3 分層抽樣圖例
22. 分層抽樣
程序:
1. 研究者將母體按某些特質區分成數類
2. 計算各類在母體之比率
3. 決定總樣本數,再根據上述比率,計算出各類應
需多少樣本
4. 針對各個分類,進行隨機抽樣取得樣本
• 例:某高中學生學習行為調查
– 1. 按年級分類,分成高一、高二、高三
– 2. 在母體之比率分別為: 35 %、 33 %、 32 %
– 3. 決定總樣本數為 200 時,根據上述比率,各年級相對應抽出
70 、 66 、 64 位學生
– 4. 針對各個年級學生,分別進行隨機抽樣
24. 3 機率抽樣
四、群集抽樣 (Cluster Sampling)
為了節省研究時間及財力,可實施群集抽樣。
所謂群集抽樣是「將母體依特質分成若干類,每一類
稱為一個團體 (group) ,再以隨機的方式抽取若干小
團體,然後對這些小團體中的元素全部訪問」。
25. 群集抽樣
特性:
母體很大時適用
抽樣架構不是很完整
程序:
1. 研究者將母體按某些特質區分成數群
2. 決定欲抽出之群數
3. 以隨機方式抽出數群
4. 各群內的所有研究標的即是樣本
30. 非機率抽樣
二、配額抽樣 (Quota Sampling)
類似分層隨機抽樣的非機率抽樣
此法可改善樣本的代表性。
方法:藉由選擇樣本,使樣本中具有某種特質的比率和母體具
有某種特質的比率大約是一致的。
程序:
1. 研究者將母體按某些特質區分成數類
2. 計算各類在母體之比率
3. 決定總樣本數,再根據上述比率,計算出各類應需多少樣本
4. 針對各個分類,以便利抽樣或判斷抽樣取得樣本
31. 配額抽樣
• 例:顧客滿意度調查
1000 位顧客。以性別、居住區域分類
1000 位顧客在各類之比率:(男生,住都市)為
12 %,(男生,住鄉下)為 18 %,(女生,住都
市)為 50 %,(女生,住鄉下)為 20 %
樣本數: 100 ,則分別針對此四類抽出
12 、 18 、 50 、 20 之樣本
以便利抽樣或判斷抽樣取得樣本
32. 非機率抽樣
三、判斷抽樣 (Judgment Sampling)
依研究者本身判斷選擇樣本,挑選最符合研究目的的樣本。
使用此法時,研究者必須對母體十分了解,才能做出最適合的抽樣。
容易因研究者之偏差,產生抽樣誤差
四、雪球抽樣 (Snowball Sampling)
在特定的母體成員難以找到時,是最適合採用的方式
此法對找出遊民、外勞等樣本頗為適用。
程序:
1. 先找到幾個研究標的
2. 針對此些研究標的進行資料收集
3. 再請此些研究標的,介紹其他研究標的…
33. 表 非機率抽樣的類型
類型 敘述 優點 缺點
便利抽樣
研究者使用最方便
或是最經濟的方法
來進行抽樣。
1. 不 需 要 母 體 的 名
冊。
2.快速、便利。
1.正確性和估計偏差不
能衡量或控制。
2.研究者的主觀意識可
能影響抽樣,選出的樣
本可能不是很適合代
表母體。
配額抽樣
研究者將母體依特
質區分為數類,而
抽樣時按比例從各
類中抽出;其樣本元
素具有某種特質的
比率和母體元素具
有某種特質的比率
大約是一致的。
1.較機率抽樣中的分
層抽樣成本低。
2.具有分層抽樣的效
果。
1.雖採用配額的方式抽
樣,但在抽樣時若不
是隨機選取,選出的
樣本也會有誤差,而
不能代表整個母體。
2.在研究者將母體分類
時可能會產生偏誤。
判斷抽樣
依研究者的判斷進
行抽樣,研究者對
母體必須有深入的
了解。
1.在某種類型如選舉
預 測 上 是 很 有 用
的。
2.在蒐集樣本時,較
節省成本及時間。
1.研究者在抽樣時可能
會因主觀因素而影響
了抽樣,造成偏差。
2.由抽樣資料來推估母
體時較不適合。
雪球抽樣
先蒐集目標母體的
少數成員,再由這些
成員引出其他的母
體成員。
1.在尋找少數難以尋
找的母體時,此法是
一個很好的方法。
1. 因 為 抽 樣 單 位 不 獨
立,會產生較高的偏
差。
2.由抽樣資料來推估母
體時較不適合。
資料來源:William G. Zikmund (1999), “Business Research Methods”, sixth edition, p.362.
35. 研究誤差
抽樣誤差
抽樣中所產生的誤差
造成原因:
樣本太小
抽樣方法
理想的抽樣設計可降低抽樣誤差
非抽樣誤差
非抽樣中所產生的誤差
訪員素質、訪員疏忽、登錄錯誤、回答者故意錯誤
回答
抽樣前完整準備、嚴格訓練訪員、事後嚴格審查等
可降低非抽樣誤差
統計分析時常假設此誤差不存在
38. 非抽樣誤差
2. 回覆性誤差 (nonresponse) :拒答、樣本代表性問題。
3. 資料蒐集誤差 (data-collection errors) :填答不實內
容、訪員解說錯誤
4. 研究室中處理過程誤差 (office processing
errors) :編碼錯誤
39. 6 樣本大小的決定
一、基本的統計概念簡介
1. 母體參數 (population parameter) : 是指母體中變項特質的總
括性敘述。
2. 統計值 (statistics) :統計值是由樣本計算出的數值,用來推
估母數之用。
3. 樣本誤差 (sample error) :樣本的估計值與母體參數兩者的
差。
4. 信賴水準與信賴區間 (confidence interval) :信賴水準是用來
表示樣本估計母體的正確性。
45. 6 樣本大小的決定
2. 最適分配法:在某些情況下,可能各層的抽樣 單
位成本均不同。故在總樣本數已知,各層抽樣成
本不同,各層變異數不同時,適合採用最適分
配。其公式如下:
n :為總樣本數 ni :為第 i 層之最適樣本數
Ni :為第 i 層所含母體數
σi :為第 i 層的標準差
∑
⋅⋅
=
ii
ii
N
Nn
n
σ
σ
1
46. 6 樣本大小的決定
以上例而言,設其總樣本數為 1000 。第一、二、
三層的數量分別為 1000 、 2000 、 3000 ,由先前
的調 知道各層的標準差分別為查 10 、 20 、 30 。
層數 各層母體數量 各層標準差
1 1000 10
2 2000 20
3 3000 30
則第三層的樣本數 =
則第一層的樣本數 =
則第二層的樣本數 =
)3000*302000*201000*10(
)1000*10(1000
++
∗
)3000*302000*201000*10(
)2000*20(1000
++
∗
)3000*302000*201000*10(
)3000*30(1000
++
∗
=
71
=2
86
=6
43