浅野 晃
関西大学総合情報学部
2022年度秋学期 統計学
分布の推測とは —
標本調査,度数分布と確率分布
第10回
2
「統計学」の後半は
統計的推測💡💡
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
「統計的推測」とは
3
ここまでは
データを度数分布で整理する
度数分布を要約する(平均・分散)
記述統計学
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
「統計的推測」とは
3
ここまでは
データを度数分布で整理する
度数分布を要約する(平均・分散)
記述統計学
調べたいデータ全体を調べられるか?
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
「統計的推測」とは
4
日本男性全員の身長を調べられるか?
調べたいデータ全体を調べられるか?
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
「統計的推測」とは
4
日本男性全員の身長を調べられるか?
調べたいデータ全体を調べられるか?
データ全体の数値をすべて調べるのは,
費用や時間がかかる
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
「統計的推測」とは
4
日本男性全員の身長を調べられるか?
調べたいデータ全体を調べられるか?
データ全体の数値をすべて調べるのは,
費用や時間がかかる
最近はそうでもないのでは…(ぼそ)
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
「統計的推測」とは
4
日本男性全員の身長を調べられるか?
調べたいデータ全体を調べられるか?
データ全体の数値をすべて調べるのは,
費用や時間がかかる
最近はそうでもないのでは…(ぼそ)
その通りで,「ビッグデータ」という言葉がよく聞かれたこともあり,さらに今は
「機械学習」もさかんになりました。
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
「統計的推測」とは
5
日本男性全員の身長を調べられるか?
調べたいデータ全体を調べられるか?
※なぜ例が「男性」なのかは,もう少し先で。
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
「統計的推測」とは
5
日本男性全員の身長を調べられるか?
調べたいデータ全体を調べられるか?
データを集める手間は劇的に減ったけれど
測定作業の手間や費用は変わらない
※なぜ例が「男性」なのかは,もう少し先で。
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
「統計的推測」とは
5
日本男性全員の身長を調べられるか?
調べたいデータ全体を調べられるか?
データを集める手間は劇的に減ったけれど
測定作業の手間や費用は変わらない
それに,調べると,壊れてしまうものもある
※なぜ例が「男性」なのかは,もう少し先で。
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
「統計的推測」とは
5
日本男性全員の身長を調べられるか?
調べたいデータ全体を調べられるか?
データを集める手間は劇的に減ったけれど
測定作業の手間や費用は変わらない
それに,調べると,壊れてしまうものもある
料理をすべて味見してしまったら,食べるものがなくなってしまう
※なぜ例が「男性」なのかは,もう少し先で。
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
「統計的推測」とは
6
日本男性全員の身長を調べられるか?
調べたいデータ全体を調べられるか?
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
「統計的推測」とは
6
日本男性全員の身長を調べられるか?
データの一部を調べて度数分布を推測する
調べたいデータ全体を調べられるか?
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
「統計的推測」とは
6
日本男性全員の身長を調べられるか?
データの一部を調べて度数分布を推測する
いや,せめて平均や分散を推測する
調べたいデータ全体を調べられるか?
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
「統計的推測」とは
6
日本男性全員の身長を調べられるか?
データの一部を調べて度数分布を推測する
いや,せめて平均や分散を推測する
調べたいデータ全体を調べられるか?
統計的推測
7
統計的推測の基本は
「くじびき」🎯🎯
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
無作為抽出
8
統計的推測は,
集団のデータ全体を調べていないのに,
集団全体のようすを調べようとする
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
無作為抽出
8
統計的推測は,
結果が間違っている可能性がある
集団のデータ全体を調べていないのに,
集団全体のようすを調べようとする
バレーボール🏐🏐やバスケットボール🏀🏀の選手ばかり選んでしまったら
「日本人はすごく背が高い?」
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
無作為抽出
9
わざわざ背の高い人ばかり選ぶことはない
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
無作為抽出
9
わざわざ背の高い人ばかり選ぶことはない
高低まんべんなく選べば,
その平均は集団の平均とだいたい同じ
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
無作為抽出
9
わざわざ背の高い人ばかり選ぶことはない
高低まんべんなく選べば,
その平均は集団の平均とだいたい同じ
それはそうだけど
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
無作為抽出
9
わざわざ背の高い人ばかり選ぶことはない
高低まんべんなく選べば,
その平均は集団の平均とだいたい同じ
それはそうだけど
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
無作為抽出
9
わざわざ背の高い人ばかり選ぶことはない
高低まんべんなく選べば,
その平均は集団の平均とだいたい同じ
それはそうだけど
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
無作為抽出
9
わざわざ背の高い人ばかり選ぶことはない
高低まんべんなく選べば,
その平均は集団の平均とだいたい同じ
それはそうだけど
集団にどんな人👽👽がいるか何も知らないのに
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
無作為抽出
9
わざわざ背の高い人ばかり選ぶことはない
高低まんべんなく選べば,
その平均は集団の平均とだいたい同じ
それはそうだけど
集団にどんな人👽👽がいるか何も知らないのに
選ばれた人が,集団のなかで背が高いか低いかなどわからない
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
無作為抽出
10
集団にどんな人がいるか何も知らないのに
選ばれた人が,集団のなかで背が高いか低いかなどわからない
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
無作為抽出
10
集団にどんな人がいるか何も知らないのに
選ばれた人が,集団のなかで背が高いか低いかなどわからない
「まんべんなく選ぶ」のは無理
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
無作為抽出
10
集団にどんな人がいるか何も知らないのに
選ばれた人が,集団のなかで背が高いか低いかなどわからない
「まんべんなく選ぶ」のは無理
なので
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
無作為抽出
10
集団にどんな人がいるか何も知らないのに
選ばれた人が,集団のなかで背が高いか低いかなどわからない
「まんべんなく選ぶ」のは無理
公平なくじ引きで選ぶ
なので
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
無作為抽出
11
集団からくじびきで選ぶと
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
無作為抽出
11
集団からくじびきで選ぶと
偶然,🏐🏐🏀🏀選手のような人ばかりを
選んでしまって,おかしな結果になる可能性が
ないわけではないけれど,
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
無作為抽出
11
集団からくじびきで選ぶと
そうなる確率は小さい
偶然,🏐🏐🏀🏀選手のような人ばかりを
選んでしまって,おかしな結果になる可能性が
ないわけではないけれど,
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
無作為抽出
11
集団からくじびきで選ぶと
そうなる確率は小さい
偶然,🏐🏐🏀🏀選手のような人ばかりを
選んでしまって,おかしな結果になる可能性が
ないわけではないけれど,
その確率も計算できる。
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
無作為抽出
12
集団からくじびきで選ぶと
母集団の度数分布
(実際には不明)
無作為抽出すると
こんなふうに偏る
可能性は少ない
大小さまざまな
データが選ばれる
可能性が高い
母集団の度数分布
(実際には不明)
★たくさんの人を抽出すると,偏らないか?
無作為抽出なら,そう期待できる。(今日の後半)
無作為抽出でなければ,必ずしもそうではない。
(ツイッターのTLは「鏡に映った自分の意見」)
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
無作為抽出
13
データ全体から,いくつかの数値を
公平なくじびきで選ぶ
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
無作為抽出
13
データ全体から,いくつかの数値を
公平なくじびきで選ぶ
[無作為標本抽出]という
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
無作為抽出
13
データ全体から,いくつかの数値を
公平なくじびきで選ぶ
[無作為標本抽出]という
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
無作為抽出
13
データ全体から,いくつかの数値を
公平なくじびきで選ぶ
[無作為標本抽出]という
調べたい(が全部を調べるのは無理な)集団[母集団]
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
無作為抽出
13
データ全体から,いくつかの数値を
公平なくじびきで選ぶ
[無作為標本抽出]という
調べたい(が全部を調べるのは無理な)集団[母集団]
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
無作為抽出
13
データ全体から,いくつかの数値を
公平なくじびきで選ぶ
[無作為標本抽出]という
調べたい(が全部を調べるのは無理な)集団[母集団]
調べられる程度のデータ[標本(サンプル)]
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
標本「サイズ」
14
「母集団」や「標本」という言葉は,
「データ」と同様,数値の集まりをさす
(1つ1つの数値ではない)
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
標本「サイズ」
14
「母集団」や「標本」という言葉は,
「データ」と同様,数値の集まりをさす
(1つ1つの数値ではない)
母集団も標本も,その中に含まれる
数値の個数を大きさ(サイズ)という
([標本サイズ]とはいうが,標本数とはいわない)
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
標本「サイズ」
14
「母集団」や「標本」という言葉は,
「データ」と同様,数値の集まりをさす
(1つ1つの数値ではない)
母集団も標本も,その中に含まれる
数値の個数を大きさ(サイズ)という
([標本サイズ]とはいうが,標本数とはいわない)
家族(family)という言葉に似ている
15
度数分布と確率分布🤔🤔
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
度数分布と確率分布
16
標本を無作為抽出するとき
ある数値が出てくる確率がどのくらいになるか
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
度数分布と確率分布
16
標本を無作為抽出するとき
ある数値が出てくる確率がどのくらいになるか
さっきの
「偏った数値ばかり選んでしまう」確率を求めるのにも必要
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
「公平なくじびき」と当たり確率
17
この中に入っている当たりくじの割合が
20%とする
https://illpop.com/png_season/dec01_a07.htm
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
「公平なくじびき」と当たり確率
17
くじを1回ひいて,当たる確率は?
この中に入っている当たりくじの割合が
20%とする
https://illpop.com/png_season/dec01_a07.htm
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
「公平なくじびき」と当たり確率
17
くじを1回ひいて,当たる確率は?
この中に入っている当たりくじの割合が
20%とする
20%
https://illpop.com/png_season/dec01_a07.htm
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
「公平なくじびき」と当たり確率
17
くじを1回ひいて,当たる確率は?
この中に入っている当たりくじの割合が
20%とする
20% 本当?
https://illpop.com/png_season/dec01_a07.htm
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
「公平なくじびき」と当たり確率
18
これが本当であるためには,
当たりくじの割合が20%なら,
当たる確率も20%
・どのくじも同じ確率で選ばれる
・ある回のくじびきの結果が,他の回に影響しない(独立)
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
「公平なくじびき」と当たり確率
19
どのくじも同じ確率で選ばれるのなら,
くじの総数のうち20%が当たり
→当たりが出る確率は20%
(ラプラスの確率の定義)
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
度数分布で考えると
20
階級値
.
..
162.5
167.5
172.5
相対度数
15%
20%
20%
10%
177.5
.
..
母集団の度数分布
無作為抽出 階級値172.5の人が
選ばれる確率は
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
度数分布で考えると
20
階級値
.
..
162.5
167.5
172.5
相対度数
15%
20%
20%
10%
177.5
.
..
母集団の度数分布
無作為抽出 階級値172.5の人が
選ばれる確率は
20%
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
度数分布で考えると
21
階級値
162.5
167.5
172.5
相対度数
15%
20%
20%
10%
177.5
母集団の度数分布
無作為抽出
どの階級についても同じだから
階級値
162.5
167.5
172.5
選ばれる確率
15%
20%
20%
10%
177.5
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
度数分布で考えると
21
階級値
162.5
167.5
172.5
相対度数
15%
20%
20%
10%
177.5
母集団の度数分布
無作為抽出
どの階級についても同じだから
階級値
162.5
167.5
172.5
選ばれる確率
15%
20%
20%
10%
177.5
標本の[確率分布]
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
確率分布と確率変数
22
母集団の度数分布
(母集団分布)
=
つまり
階級値
162.5
167.5
172.5
選ばれる確率
15%
20%
20%
10%
177.5
標本の確率分布
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
確率分布と確率変数
22
母集団の度数分布
(母集団分布)
=
つまり
階級値
162.5
167.5
172.5
選ばれる確率
15%
20%
20%
10%
177.5
標本の確率分布
標本は,
値がいくらになるかは決まっていない
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
確率分布と確率変数
22
母集団の度数分布
(母集団分布)
=
つまり
階級値
162.5
167.5
172.5
選ばれる確率
15%
20%
20%
10%
177.5
標本の確率分布
標本は,
値がいくらになるかは決まっていない
しかし確率分布が決まっている
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
確率分布と確率変数
22
母集団の度数分布
(母集団分布)
=
つまり
階級値
162.5
167.5
172.5
選ばれる確率
15%
20%
20%
10%
177.5
標本の確率分布
標本は,
値がいくらになるかは決まっていない
しかし確率分布が決まっている
こういう数を[確率変数]という
(中国語では随機変数)
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
確率分布と確率変数
22
母集団の度数分布
(母集団分布)
=
つまり
階級値
162.5
167.5
172.5
選ばれる確率
15%
20%
20%
10%
177.5
標本の確率分布
標本は,
値がいくらになるかは決まっていない
しかし確率分布が決まっている
こういう数を[確率変数]という
(中国語では随機変数)
「標本は,確率変数(の一種)である」
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
何が知りたいのか
23
母集団の度数分布が知りたい
標本の確率分布を推定すればよい
標本の確率分布,推定できる?
くじを1本だけひいても,当たり確率はわからない
どうする?
24
標本平均と母平均🤔🤔
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
母平均の推定
25
標本として数値をいくつか取り出して,
それらの平均
母平均が知りたい
母集団
(日本男性全体)
母平均μ
が,日本男性全員は調べられない
[標本平均]
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
母平均の推定
25
標本として数値をいくつか取り出して,
それらの平均
母平均が知りたい
母集団
(日本男性全体)
母平均μ
が,日本男性全員は調べられない
[標本平均]
標本平均は母平均に近い値になるか?
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
母平均の推定
26
母集団
(日本男性全体)
母平均μ
[標本平均]
標本平均は母平均に近い値になるか?
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
母平均の推定
26
母集団
(日本男性全体)
母平均μ
[標本平均]
標本平均は母平均に近い値になるか?
もし偏った標本が得られていたら,
標本平均は母平均と大きく食い違うことに
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
母平均の推定
27
母集団
母平均μ
母分散σ2
X1 X2 … Xn
サイズnの標本1セット 標本平均
X
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
母平均の推定
27
母集団
母平均μ
仮に,何度も標本を抽出したとしたら?
母分散σ2
X1 X2 … Xn
サイズnの標本1セット 標本平均
X
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
X1の期待値と分散は
28
母集団
母平均μ
母分散σ2
X1 X2 … Xn
サイズnの標本1セット 標本平均
X
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
X1の期待値と分散は
28
母集団
母平均μ
母分散σ2
X1 X2 … Xn
サイズnの標本1セット 標本平均
X1 X2 … Xn
X
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
X1の期待値と分散は
28
母集団
母平均μ
母分散σ2
X1 X2 … Xn
サイズnの標本1セット 標本平均
X1 X2 … Xn
X
X
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
X1の期待値と分散は
28
母集団
母平均μ
母分散σ2
X1 X2 … Xn
サイズnの標本1セット 標本平均
X1 X2 … Xn
X1 X2 … Xn
X
X
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
X1の期待値と分散は
28
母集団
母平均μ
母分散σ2
X1 X2 … Xn
サイズnの標本1セット 標本平均
X1 X2 … Xn
X1 X2 … Xn
X
X
X
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
X1の期待値と分散は
28
母集団
母平均μ
母分散σ2
X1 X2 … Xn
サイズnの標本1セット 標本平均
X1 X2 … Xn
X1 X2 … Xn
…
X
X
X
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
X1の期待値と分散は
28
母集団
母平均μ
母分散σ2
X1 X2 … Xn
サイズnの標本1セット 標本平均
X1 X2 … Xn
X1 X2 … Xn
…
…
X
X
X
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
X1の期待値と分散は
28
母集団
母平均μ
母分散σ2
X1 X2 … Xn
サイズnの標本1セット 標本平均
X1 X2 … Xn
X1 X2 … Xn
…
…
X
X
X
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
X1の期待値と分散は
28
母集団
母平均μ
母分散σ2
X1 X2 … Xn
サイズnの標本1セット 標本平均
X1 X2 … Xn
X1 X2 … Xn
…
X1のさまざまな可能性
その平均を,
…
X
X
X
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
X1の期待値と分散は
28
母集団
母平均μ
母分散σ2
X1 X2 … Xn
サイズnの標本1セット 標本平均
X1 X2 … Xn
X1 X2 … Xn
…
X1のさまざまな可能性
その平均を,
[期待値]μ
…
分散σ2
X
X
X
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
X1の期待値と分散は
28
母集団
母平均μ
母分散σ2
X1 X2 … Xn
サイズnの標本1セット 標本平均
X1 X2 … Xn
X1 X2 … Xn
…
X1のさまざまな可能性
その平均を,
[期待値]μ
…
分散σ2
期待値とは?
X
X
X
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
期待値とは?
29
母集団
母平均μ
母分散σ2
X1 X2 … Xn
サイズnの標本1セット 標本平均
X1
X1
…
期待値は平均の一種で「すべての可能性にわたっての平均」
X
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
期待値とは?
29
母集団
母平均μ
母分散σ2
X1 X2 … Xn
サイズnの標本1セット 標本平均
X1
X1
…
期待値は平均の一種で「すべての可能性にわたっての平均」
X1の期待値=
X1のすべての可能性にわたっての平均
X
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
期待値とは?
29
母集団
母平均μ
母分散σ2
X1 X2 … Xn
サイズnの標本1セット 標本平均
X1
X1
…
期待値は平均の一種で「すべての可能性にわたっての平均」
X1の期待値=
X1のすべての可能性にわたっての平均
母集団のすべての数値を取り出すのと同じだから,
母平均μと同じ
X
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
期待値とは?
29
母集団
母平均μ
母分散σ2
X1 X2 … Xn
サイズnの標本1セット 標本平均
X1
X1
…
期待値は平均の一種で「すべての可能性にわたっての平均」
X1の期待値=
X1のすべての可能性にわたっての平均
母集団のすべての数値を取り出すのと同じだから,
母平均μと同じ
X
X1の分散も
母分散σ2と同じ
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
標本平均の期待値と分散は
30
母集団
母平均μ
母分散σ2
X1 X2 … Xn
サイズnの標本1セット 標本平均
X1からXnのなかに極端な数値があっても,
172 195 153
X
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
標本平均の期待値と分散は
30
母集団
母平均μ
母分散σ2
X1 X2 … Xn
サイズnの標本1セット 標本平均
X1からXnのなかに極端な数値があっても,
172 195 153
n個の数値を平均すれば,
そんなに極端な数値にはまずならない
X
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
標本平均の期待値と分散は
31
母集団
母平均μ
母分散σ2
X1 X2 … Xn
サイズnの標本1セット 標本平均
X1 X2 … Xn
X1 X2 … Xn
母集団と同じ
期待値μ
…
分散σ2
…
X
X
X
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
標本平均の期待値と分散は
31
母集団
母平均μ
母分散σ2
X1 X2 … Xn
サイズnの標本1セット 標本平均
X1 X2 … Xn
X1 X2 … Xn
母集団と同じ
期待値μ
…
分散σ2
…
X
X
X
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
標本平均の期待値と分散は
31
母集団
母平均μ
母分散σ2
X1 X2 … Xn
サイズnの標本1セット 標本平均
X1 X2 … Xn
X1 X2 … Xn
母集団と同じ
期待値μ
…
分散σ2
…
極端な値はあまりないので
分散が小さくなる
X
X
X
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
標本平均の期待値と分散は
31
母集団
母平均μ
母分散σ2
X1 X2 … Xn
サイズnの標本1セット 標本平均
X1 X2 … Xn
X1 X2 … Xn
母集団と同じ
期待値μ
…
分散σ2
…
極端な値はあまりないので
分散が小さくなる
期待値μ
X
X
X
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
標本平均の期待値と分散は
31
母集団
母平均μ
母分散σ2
X1 X2 … Xn
サイズnの標本1セット 標本平均
X1 X2 … Xn
X1 X2 … Xn
母集団と同じ
期待値μ
…
分散σ2
…
極端な値はあまりないので
分散が小さくなる
期待値μ
分散 σ2/n
X
X
X
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
標本平均の期待値と分散は
31
母集団
母平均μ
母分散σ2
X1 X2 … Xn
サイズnの標本1セット 標本平均
X1 X2 … Xn
X1 X2 … Xn
母集団と同じ
期待値μ
…
分散σ2
…
極端な値はあまりないので
分散が小さくなる
期待値μ
分散 σ2/n
X
X
X
標本平均の分散は,母分散の「標本サイズ分の一」になる
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
母平均の推定
32
母平均がμ
母分散がσ2
のとき,
標本平均の期待値がμ
標本平均の分散がσ2 /n
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
母平均の推定
32
母平均がμ
母分散がσ2
のとき,
標本平均の期待値がμ
標本平均の分散がσ2 /n
仮に,何度も標本を抽出して,
何度も標本平均を計算したとすると
分散が小さくなっているので,
「たいてい,ほぼ」母平均に近い値になる
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
母平均の推定
32
母平均がμ
母分散がσ2
のとき,
標本平均の期待値がμ
標本平均の分散がσ2 /n
仮に,何度も標本を抽出して,
何度も標本平均を計算したとすると
分散が小さくなっているので,
「たいてい,ほぼ」母平均に近い値になる
標本平均を
何度も計算しても
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
母平均の推定
32
母平均がμ
母分散がσ2
のとき,
標本平均の期待値がμ
標本平均の分散がσ2 /n
仮に,何度も標本を抽出して,
何度も標本平均を計算したとすると
分散が小さくなっているので,
「たいてい,ほぼ」母平均に近い値になる
標本平均を
何度も計算しても
μ
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
母平均の推定
32
母平均がμ
母分散がσ2
のとき,
標本平均の期待値がμ
標本平均の分散がσ2 /n
仮に,何度も標本を抽出して,
何度も標本平均を計算したとすると
分散が小さくなっているので,
「たいてい,ほぼ」母平均に近い値になる
標本平均を
何度も計算しても
μ
X
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
母平均の推定
32
母平均がμ
母分散がσ2
のとき,
標本平均の期待値がμ
標本平均の分散がσ2 /n
仮に,何度も標本を抽出して,
何度も標本平均を計算したとすると
分散が小さくなっているので,
「たいてい,ほぼ」母平均に近い値になる
標本平均を
何度も計算しても
μ
X
X
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
母平均の推定
32
母平均がμ
母分散がσ2
のとき,
標本平均の期待値がμ
標本平均の分散がσ2 /n
仮に,何度も標本を抽出して,
何度も標本平均を計算したとすると
分散が小さくなっているので,
「たいてい,ほぼ」母平均に近い値になる
標本平均を
何度も計算しても
μ
X
X
X
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
母平均の推定
32
母平均がμ
母分散がσ2
のとき,
標本平均の期待値がμ
標本平均の分散がσ2 /n
仮に,何度も標本を抽出して,
何度も標本平均を計算したとすると
分散が小さくなっているので,
「たいてい,ほぼ」母平均に近い値になる
標本平均を
何度も計算しても
μ
X
X
X
X
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
母平均の推定
32
母平均がμ
母分散がσ2
のとき,
標本平均の期待値がμ
標本平均の分散がσ2 /n
仮に,何度も標本を抽出して,
何度も標本平均を計算したとすると
分散が小さくなっているので,
「たいてい,ほぼ」母平均に近い値になる
標本平均を
何度も計算しても
μ
いつ計算しても,たいていそれほどかわらない
X
X
X
X
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
母平均の推定
33
母平均がμ
母分散がσ2
のとき,
標本平均の期待値がμ
標本平均の分散がσ2 /n
仮に,何度も標本を抽出して,
何度も標本平均を計算したとすると
分散が小さくなっているので,
「たいてい,ほぼ」母平均に近い値になる
いま1回だけ計算した標本平均も,
たいてい,ほぼ母平均に近い値だろう
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
母平均の推定
34
いま1回だけ計算した標本平均も,
「たいてい,ほぼ」母平均に近い値だろう
何度も計算しても
μ
いつ計算しても,たいていそれほどかわらない
X
X
X
X
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
母平均の推定
34
いま1回だけ計算した標本平均も,
「たいてい,ほぼ」母平均に近い値だろう
いま1回だけ計算した標本平均は
上のどれにあたるかはわからないが,
何度も計算しても
μ
いつ計算しても,たいていそれほどかわらない
X
X
X
X
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
母平均の推定
34
いま1回だけ計算した標本平均も,
「たいてい,ほぼ」母平均に近い値だろう
いま1回だけ計算した標本平均は
上のどれにあたるかはわからないが,
何度も計算しても
μ
いつ計算しても,たいていそれほどかわらない
?
X
X
X
X
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
母平均の推定
34
いま1回だけ計算した標本平均も,
「たいてい,ほぼ」母平均に近い値だろう
いま1回だけ計算した標本平均は
上のどれにあたるかはわからないが,
何度も計算しても
μ
いつ計算しても,たいていそれほどかわらない
? ?
X
X
X
X
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
母平均の推定
34
いま1回だけ計算した標本平均も,
「たいてい,ほぼ」母平均に近い値だろう
いま1回だけ計算した標本平均は
上のどれにあたるかはわからないが,
何度も計算しても
μ
いつ計算しても,たいていそれほどかわらない
?
?
?
X
X
X
X
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
母平均の推定
34
いま1回だけ計算した標本平均も,
「たいてい,ほぼ」母平均に近い値だろう
いま1回だけ計算した標本平均は
上のどれにあたるかはわからないが,
何度も計算しても
μ
いつ計算しても,たいていそれほどかわらない
?
?
?
?
X
X
X
X
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
母平均の推定
34
いま1回だけ計算した標本平均も,
「たいてい,ほぼ」母平均に近い値だろう
いま1回だけ計算した標本平均は
上のどれにあたるかはわからないが,
何度も計算しても
μ
いつ計算しても,たいていそれほどかわらない
いずれにせよ,たいていはあまりかわらない
?
?
?
?
X
X
X
X
35
理想的な無作為抽出とは🎯🎯
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
ところで
36
母分散がσ2のとき,標本平均の分散がσ2 /n
標本平均の分散に関係しているのは
標本の大きさであって,母集団の大きさは関係ない
推測の確かさに影響するのは
標本の大きさであって,
標本の大きさの,母集団の大きさに対する割合 ではない
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
標本の大きさとは
37
「10人からなる標本」の意味は,
1,000人からなる母集団でも
100,000人からなる母集団でも同じ 🤔🤔…
理想的な無作為抽出では,復元抽出を行う
標本サイズは,
「取り出された数値の個数」というよりも
「同一の母集団から数値ひとつひとつを取り出す回数」
→ 母集団の大きさに対する割合は無関係
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
復元抽出と非復元抽出
38
出たくじをすぐに箱に戻す
[復元抽出]
・どのくじも同じ確率で選ばれる
・ある回のくじびきの結果が,他の回に影響しない(独立)
こうであるためには,
実際にはあまりやらない…
理想的な無作為抽出は,「公平なくじびき」
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
母平均の推定
39
いま1回だけ計算した標本平均も,
「たいてい,ほぼ」母平均に近い値だろう
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
母平均の推定
39
いま1回だけ計算した標本平均も,
「たいてい,ほぼ」母平均に近い値だろう
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
母平均の推定
39
いま1回だけ計算した標本平均も,
「たいてい,ほぼ」母平均に近い値だろう
どのくらい近い?
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
母平均の推定
39
いま1回だけ計算した標本平均も,
「たいてい,ほぼ」母平均に近い値だろう
どのくらい近い?
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
母平均の推定
39
いま1回だけ計算した標本平均も,
「たいてい,ほぼ」母平均に近い値だろう
どのくらい近い?
どのくらいの確率で?
はずれる確率は?
39
2022年度秋学期 統計学 / 関西大学総合情報学部 浅野 晃
母平均の推定
39
いま1回だけ計算した標本平均も,
「たいてい,ほぼ」母平均に近い値だろう
どのくらい近い?
どのくらいの確率で?
はずれる確率は?
このあたりは次回。

2022年度秋学期 統計学 第10回 分布の推測とはー標本調査,度数分布と確率分布 (2022. 11. 29)

  • 1.
  • 2.
  • 3.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 「統計的推測」とは 3 ここまでは データを度数分布で整理する 度数分布を要約する(平均・分散) 記述統計学
  • 4.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 「統計的推測」とは 3 ここまでは データを度数分布で整理する 度数分布を要約する(平均・分散) 記述統計学 調べたいデータ全体を調べられるか?
  • 5.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 「統計的推測」とは 4 日本男性全員の身長を調べられるか? 調べたいデータ全体を調べられるか?
  • 6.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 「統計的推測」とは 4 日本男性全員の身長を調べられるか? 調べたいデータ全体を調べられるか? データ全体の数値をすべて調べるのは, 費用や時間がかかる
  • 7.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 「統計的推測」とは 4 日本男性全員の身長を調べられるか? 調べたいデータ全体を調べられるか? データ全体の数値をすべて調べるのは, 費用や時間がかかる 最近はそうでもないのでは…(ぼそ)
  • 8.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 「統計的推測」とは 4 日本男性全員の身長を調べられるか? 調べたいデータ全体を調べられるか? データ全体の数値をすべて調べるのは, 費用や時間がかかる 最近はそうでもないのでは…(ぼそ) その通りで,「ビッグデータ」という言葉がよく聞かれたこともあり,さらに今は 「機械学習」もさかんになりました。
  • 9.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 「統計的推測」とは 5 日本男性全員の身長を調べられるか? 調べたいデータ全体を調べられるか? ※なぜ例が「男性」なのかは,もう少し先で。
  • 10.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 「統計的推測」とは 5 日本男性全員の身長を調べられるか? 調べたいデータ全体を調べられるか? データを集める手間は劇的に減ったけれど 測定作業の手間や費用は変わらない ※なぜ例が「男性」なのかは,もう少し先で。
  • 11.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 「統計的推測」とは 5 日本男性全員の身長を調べられるか? 調べたいデータ全体を調べられるか? データを集める手間は劇的に減ったけれど 測定作業の手間や費用は変わらない それに,調べると,壊れてしまうものもある ※なぜ例が「男性」なのかは,もう少し先で。
  • 12.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 「統計的推測」とは 5 日本男性全員の身長を調べられるか? 調べたいデータ全体を調べられるか? データを集める手間は劇的に減ったけれど 測定作業の手間や費用は変わらない それに,調べると,壊れてしまうものもある 料理をすべて味見してしまったら,食べるものがなくなってしまう ※なぜ例が「男性」なのかは,もう少し先で。
  • 13.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 「統計的推測」とは 6 日本男性全員の身長を調べられるか? 調べたいデータ全体を調べられるか?
  • 14.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 「統計的推測」とは 6 日本男性全員の身長を調べられるか? データの一部を調べて度数分布を推測する 調べたいデータ全体を調べられるか?
  • 15.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 「統計的推測」とは 6 日本男性全員の身長を調べられるか? データの一部を調べて度数分布を推測する いや,せめて平均や分散を推測する 調べたいデータ全体を調べられるか?
  • 16.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 「統計的推測」とは 6 日本男性全員の身長を調べられるか? データの一部を調べて度数分布を推測する いや,せめて平均や分散を推測する 調べたいデータ全体を調べられるか? 統計的推測
  • 17.
  • 18.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 無作為抽出 8 統計的推測は, 集団のデータ全体を調べていないのに, 集団全体のようすを調べようとする
  • 19.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 無作為抽出 8 統計的推測は, 結果が間違っている可能性がある 集団のデータ全体を調べていないのに, 集団全体のようすを調べようとする バレーボール🏐🏐やバスケットボール🏀🏀の選手ばかり選んでしまったら 「日本人はすごく背が高い?」
  • 20.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 無作為抽出 9 わざわざ背の高い人ばかり選ぶことはない
  • 21.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 無作為抽出 9 わざわざ背の高い人ばかり選ぶことはない 高低まんべんなく選べば, その平均は集団の平均とだいたい同じ
  • 22.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 無作為抽出 9 わざわざ背の高い人ばかり選ぶことはない 高低まんべんなく選べば, その平均は集団の平均とだいたい同じ それはそうだけど
  • 23.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 無作為抽出 9 わざわざ背の高い人ばかり選ぶことはない 高低まんべんなく選べば, その平均は集団の平均とだいたい同じ それはそうだけど
  • 24.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 無作為抽出 9 わざわざ背の高い人ばかり選ぶことはない 高低まんべんなく選べば, その平均は集団の平均とだいたい同じ それはそうだけど
  • 25.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 無作為抽出 9 わざわざ背の高い人ばかり選ぶことはない 高低まんべんなく選べば, その平均は集団の平均とだいたい同じ それはそうだけど 集団にどんな人👽👽がいるか何も知らないのに
  • 26.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 無作為抽出 9 わざわざ背の高い人ばかり選ぶことはない 高低まんべんなく選べば, その平均は集団の平均とだいたい同じ それはそうだけど 集団にどんな人👽👽がいるか何も知らないのに 選ばれた人が,集団のなかで背が高いか低いかなどわからない
  • 27.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 無作為抽出 10 集団にどんな人がいるか何も知らないのに 選ばれた人が,集団のなかで背が高いか低いかなどわからない
  • 28.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 無作為抽出 10 集団にどんな人がいるか何も知らないのに 選ばれた人が,集団のなかで背が高いか低いかなどわからない 「まんべんなく選ぶ」のは無理
  • 29.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 無作為抽出 10 集団にどんな人がいるか何も知らないのに 選ばれた人が,集団のなかで背が高いか低いかなどわからない 「まんべんなく選ぶ」のは無理 なので
  • 30.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 無作為抽出 10 集団にどんな人がいるか何も知らないのに 選ばれた人が,集団のなかで背が高いか低いかなどわからない 「まんべんなく選ぶ」のは無理 公平なくじ引きで選ぶ なので
  • 31.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 無作為抽出 11 集団からくじびきで選ぶと
  • 32.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 無作為抽出 11 集団からくじびきで選ぶと 偶然,🏐🏐🏀🏀選手のような人ばかりを 選んでしまって,おかしな結果になる可能性が ないわけではないけれど,
  • 33.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 無作為抽出 11 集団からくじびきで選ぶと そうなる確率は小さい 偶然,🏐🏐🏀🏀選手のような人ばかりを 選んでしまって,おかしな結果になる可能性が ないわけではないけれど,
  • 34.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 無作為抽出 11 集団からくじびきで選ぶと そうなる確率は小さい 偶然,🏐🏐🏀🏀選手のような人ばかりを 選んでしまって,おかしな結果になる可能性が ないわけではないけれど, その確率も計算できる。
  • 35.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 無作為抽出 12 集団からくじびきで選ぶと 母集団の度数分布 (実際には不明) 無作為抽出すると こんなふうに偏る 可能性は少ない 大小さまざまな データが選ばれる 可能性が高い 母集団の度数分布 (実際には不明) ★たくさんの人を抽出すると,偏らないか? 無作為抽出なら,そう期待できる。(今日の後半) 無作為抽出でなければ,必ずしもそうではない。 (ツイッターのTLは「鏡に映った自分の意見」)
  • 36.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 無作為抽出 13 データ全体から,いくつかの数値を 公平なくじびきで選ぶ
  • 37.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 無作為抽出 13 データ全体から,いくつかの数値を 公平なくじびきで選ぶ [無作為標本抽出]という
  • 38.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 無作為抽出 13 データ全体から,いくつかの数値を 公平なくじびきで選ぶ [無作為標本抽出]という
  • 39.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 無作為抽出 13 データ全体から,いくつかの数値を 公平なくじびきで選ぶ [無作為標本抽出]という 調べたい(が全部を調べるのは無理な)集団[母集団]
  • 40.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 無作為抽出 13 データ全体から,いくつかの数値を 公平なくじびきで選ぶ [無作為標本抽出]という 調べたい(が全部を調べるのは無理な)集団[母集団]
  • 41.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 無作為抽出 13 データ全体から,いくつかの数値を 公平なくじびきで選ぶ [無作為標本抽出]という 調べたい(が全部を調べるのは無理な)集団[母集団] 調べられる程度のデータ[標本(サンプル)]
  • 42.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 標本「サイズ」 14 「母集団」や「標本」という言葉は, 「データ」と同様,数値の集まりをさす (1つ1つの数値ではない)
  • 43.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 標本「サイズ」 14 「母集団」や「標本」という言葉は, 「データ」と同様,数値の集まりをさす (1つ1つの数値ではない) 母集団も標本も,その中に含まれる 数値の個数を大きさ(サイズ)という ([標本サイズ]とはいうが,標本数とはいわない)
  • 44.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 標本「サイズ」 14 「母集団」や「標本」という言葉は, 「データ」と同様,数値の集まりをさす (1つ1つの数値ではない) 母集団も標本も,その中に含まれる 数値の個数を大きさ(サイズ)という ([標本サイズ]とはいうが,標本数とはいわない) 家族(family)という言葉に似ている
  • 45.
  • 46.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 度数分布と確率分布 16 標本を無作為抽出するとき ある数値が出てくる確率がどのくらいになるか
  • 47.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 度数分布と確率分布 16 標本を無作為抽出するとき ある数値が出てくる確率がどのくらいになるか さっきの 「偏った数値ばかり選んでしまう」確率を求めるのにも必要
  • 48.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 「公平なくじびき」と当たり確率 17 この中に入っている当たりくじの割合が 20%とする https://illpop.com/png_season/dec01_a07.htm
  • 49.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 「公平なくじびき」と当たり確率 17 くじを1回ひいて,当たる確率は? この中に入っている当たりくじの割合が 20%とする https://illpop.com/png_season/dec01_a07.htm
  • 50.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 「公平なくじびき」と当たり確率 17 くじを1回ひいて,当たる確率は? この中に入っている当たりくじの割合が 20%とする 20% https://illpop.com/png_season/dec01_a07.htm
  • 51.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 「公平なくじびき」と当たり確率 17 くじを1回ひいて,当たる確率は? この中に入っている当たりくじの割合が 20%とする 20% 本当? https://illpop.com/png_season/dec01_a07.htm
  • 52.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 「公平なくじびき」と当たり確率 18 これが本当であるためには, 当たりくじの割合が20%なら, 当たる確率も20% ・どのくじも同じ確率で選ばれる ・ある回のくじびきの結果が,他の回に影響しない(独立)
  • 53.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 「公平なくじびき」と当たり確率 19 どのくじも同じ確率で選ばれるのなら, くじの総数のうち20%が当たり →当たりが出る確率は20% (ラプラスの確率の定義)
  • 54.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 度数分布で考えると 20 階級値 . .. 162.5 167.5 172.5 相対度数 15% 20% 20% 10% 177.5 . .. 母集団の度数分布 無作為抽出 階級値172.5の人が 選ばれる確率は
  • 55.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 度数分布で考えると 20 階級値 . .. 162.5 167.5 172.5 相対度数 15% 20% 20% 10% 177.5 . .. 母集団の度数分布 無作為抽出 階級値172.5の人が 選ばれる確率は 20%
  • 56.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 度数分布で考えると 21 階級値 162.5 167.5 172.5 相対度数 15% 20% 20% 10% 177.5 母集団の度数分布 無作為抽出 どの階級についても同じだから 階級値 162.5 167.5 172.5 選ばれる確率 15% 20% 20% 10% 177.5
  • 57.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 度数分布で考えると 21 階級値 162.5 167.5 172.5 相対度数 15% 20% 20% 10% 177.5 母集団の度数分布 無作為抽出 どの階級についても同じだから 階級値 162.5 167.5 172.5 選ばれる確率 15% 20% 20% 10% 177.5 標本の[確率分布]
  • 58.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 確率分布と確率変数 22 母集団の度数分布 (母集団分布) = つまり 階級値 162.5 167.5 172.5 選ばれる確率 15% 20% 20% 10% 177.5 標本の確率分布
  • 59.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 確率分布と確率変数 22 母集団の度数分布 (母集団分布) = つまり 階級値 162.5 167.5 172.5 選ばれる確率 15% 20% 20% 10% 177.5 標本の確率分布 標本は, 値がいくらになるかは決まっていない
  • 60.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 確率分布と確率変数 22 母集団の度数分布 (母集団分布) = つまり 階級値 162.5 167.5 172.5 選ばれる確率 15% 20% 20% 10% 177.5 標本の確率分布 標本は, 値がいくらになるかは決まっていない しかし確率分布が決まっている
  • 61.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 確率分布と確率変数 22 母集団の度数分布 (母集団分布) = つまり 階級値 162.5 167.5 172.5 選ばれる確率 15% 20% 20% 10% 177.5 標本の確率分布 標本は, 値がいくらになるかは決まっていない しかし確率分布が決まっている こういう数を[確率変数]という (中国語では随機変数)
  • 62.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 確率分布と確率変数 22 母集団の度数分布 (母集団分布) = つまり 階級値 162.5 167.5 172.5 選ばれる確率 15% 20% 20% 10% 177.5 標本の確率分布 標本は, 値がいくらになるかは決まっていない しかし確率分布が決まっている こういう数を[確率変数]という (中国語では随機変数) 「標本は,確率変数(の一種)である」
  • 63.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 何が知りたいのか 23 母集団の度数分布が知りたい 標本の確率分布を推定すればよい 標本の確率分布,推定できる? くじを1本だけひいても,当たり確率はわからない どうする?
  • 64.
  • 65.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 母平均の推定 25 標本として数値をいくつか取り出して, それらの平均 母平均が知りたい 母集団 (日本男性全体) 母平均μ が,日本男性全員は調べられない [標本平均]
  • 66.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 母平均の推定 25 標本として数値をいくつか取り出して, それらの平均 母平均が知りたい 母集団 (日本男性全体) 母平均μ が,日本男性全員は調べられない [標本平均] 標本平均は母平均に近い値になるか?
  • 67.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 母平均の推定 26 母集団 (日本男性全体) 母平均μ [標本平均] 標本平均は母平均に近い値になるか?
  • 68.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 母平均の推定 26 母集団 (日本男性全体) 母平均μ [標本平均] 標本平均は母平均に近い値になるか? もし偏った標本が得られていたら, 標本平均は母平均と大きく食い違うことに
  • 69.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 母平均の推定 27 母集団 母平均μ 母分散σ2 X1 X2 … Xn サイズnの標本1セット 標本平均 X
  • 70.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 母平均の推定 27 母集団 母平均μ 仮に,何度も標本を抽出したとしたら? 母分散σ2 X1 X2 … Xn サイズnの標本1セット 標本平均 X
  • 71.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 X1の期待値と分散は 28 母集団 母平均μ 母分散σ2 X1 X2 … Xn サイズnの標本1セット 標本平均 X
  • 72.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 X1の期待値と分散は 28 母集団 母平均μ 母分散σ2 X1 X2 … Xn サイズnの標本1セット 標本平均 X1 X2 … Xn X
  • 73.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 X1の期待値と分散は 28 母集団 母平均μ 母分散σ2 X1 X2 … Xn サイズnの標本1セット 標本平均 X1 X2 … Xn X X
  • 74.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 X1の期待値と分散は 28 母集団 母平均μ 母分散σ2 X1 X2 … Xn サイズnの標本1セット 標本平均 X1 X2 … Xn X1 X2 … Xn X X
  • 75.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 X1の期待値と分散は 28 母集団 母平均μ 母分散σ2 X1 X2 … Xn サイズnの標本1セット 標本平均 X1 X2 … Xn X1 X2 … Xn X X X
  • 76.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 X1の期待値と分散は 28 母集団 母平均μ 母分散σ2 X1 X2 … Xn サイズnの標本1セット 標本平均 X1 X2 … Xn X1 X2 … Xn … X X X
  • 77.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 X1の期待値と分散は 28 母集団 母平均μ 母分散σ2 X1 X2 … Xn サイズnの標本1セット 標本平均 X1 X2 … Xn X1 X2 … Xn … … X X X
  • 78.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 X1の期待値と分散は 28 母集団 母平均μ 母分散σ2 X1 X2 … Xn サイズnの標本1セット 標本平均 X1 X2 … Xn X1 X2 … Xn … … X X X
  • 79.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 X1の期待値と分散は 28 母集団 母平均μ 母分散σ2 X1 X2 … Xn サイズnの標本1セット 標本平均 X1 X2 … Xn X1 X2 … Xn … X1のさまざまな可能性 その平均を, … X X X
  • 80.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 X1の期待値と分散は 28 母集団 母平均μ 母分散σ2 X1 X2 … Xn サイズnの標本1セット 標本平均 X1 X2 … Xn X1 X2 … Xn … X1のさまざまな可能性 その平均を, [期待値]μ … 分散σ2 X X X
  • 81.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 X1の期待値と分散は 28 母集団 母平均μ 母分散σ2 X1 X2 … Xn サイズnの標本1セット 標本平均 X1 X2 … Xn X1 X2 … Xn … X1のさまざまな可能性 その平均を, [期待値]μ … 分散σ2 期待値とは? X X X
  • 82.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 期待値とは? 29 母集団 母平均μ 母分散σ2 X1 X2 … Xn サイズnの標本1セット 標本平均 X1 X1 … 期待値は平均の一種で「すべての可能性にわたっての平均」 X
  • 83.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 期待値とは? 29 母集団 母平均μ 母分散σ2 X1 X2 … Xn サイズnの標本1セット 標本平均 X1 X1 … 期待値は平均の一種で「すべての可能性にわたっての平均」 X1の期待値= X1のすべての可能性にわたっての平均 X
  • 84.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 期待値とは? 29 母集団 母平均μ 母分散σ2 X1 X2 … Xn サイズnの標本1セット 標本平均 X1 X1 … 期待値は平均の一種で「すべての可能性にわたっての平均」 X1の期待値= X1のすべての可能性にわたっての平均 母集団のすべての数値を取り出すのと同じだから, 母平均μと同じ X
  • 85.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 期待値とは? 29 母集団 母平均μ 母分散σ2 X1 X2 … Xn サイズnの標本1セット 標本平均 X1 X1 … 期待値は平均の一種で「すべての可能性にわたっての平均」 X1の期待値= X1のすべての可能性にわたっての平均 母集団のすべての数値を取り出すのと同じだから, 母平均μと同じ X X1の分散も 母分散σ2と同じ
  • 86.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 標本平均の期待値と分散は 30 母集団 母平均μ 母分散σ2 X1 X2 … Xn サイズnの標本1セット 標本平均 X1からXnのなかに極端な数値があっても, 172 195 153 X
  • 87.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 標本平均の期待値と分散は 30 母集団 母平均μ 母分散σ2 X1 X2 … Xn サイズnの標本1セット 標本平均 X1からXnのなかに極端な数値があっても, 172 195 153 n個の数値を平均すれば, そんなに極端な数値にはまずならない X
  • 88.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 標本平均の期待値と分散は 31 母集団 母平均μ 母分散σ2 X1 X2 … Xn サイズnの標本1セット 標本平均 X1 X2 … Xn X1 X2 … Xn 母集団と同じ 期待値μ … 分散σ2 … X X X
  • 89.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 標本平均の期待値と分散は 31 母集団 母平均μ 母分散σ2 X1 X2 … Xn サイズnの標本1セット 標本平均 X1 X2 … Xn X1 X2 … Xn 母集団と同じ 期待値μ … 分散σ2 … X X X
  • 90.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 標本平均の期待値と分散は 31 母集団 母平均μ 母分散σ2 X1 X2 … Xn サイズnの標本1セット 標本平均 X1 X2 … Xn X1 X2 … Xn 母集団と同じ 期待値μ … 分散σ2 … 極端な値はあまりないので 分散が小さくなる X X X
  • 91.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 標本平均の期待値と分散は 31 母集団 母平均μ 母分散σ2 X1 X2 … Xn サイズnの標本1セット 標本平均 X1 X2 … Xn X1 X2 … Xn 母集団と同じ 期待値μ … 分散σ2 … 極端な値はあまりないので 分散が小さくなる 期待値μ X X X
  • 92.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 標本平均の期待値と分散は 31 母集団 母平均μ 母分散σ2 X1 X2 … Xn サイズnの標本1セット 標本平均 X1 X2 … Xn X1 X2 … Xn 母集団と同じ 期待値μ … 分散σ2 … 極端な値はあまりないので 分散が小さくなる 期待値μ 分散 σ2/n X X X
  • 93.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 標本平均の期待値と分散は 31 母集団 母平均μ 母分散σ2 X1 X2 … Xn サイズnの標本1セット 標本平均 X1 X2 … Xn X1 X2 … Xn 母集団と同じ 期待値μ … 分散σ2 … 極端な値はあまりないので 分散が小さくなる 期待値μ 分散 σ2/n X X X 標本平均の分散は,母分散の「標本サイズ分の一」になる
  • 94.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 母平均の推定 32 母平均がμ 母分散がσ2 のとき, 標本平均の期待値がμ 標本平均の分散がσ2 /n
  • 95.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 母平均の推定 32 母平均がμ 母分散がσ2 のとき, 標本平均の期待値がμ 標本平均の分散がσ2 /n 仮に,何度も標本を抽出して, 何度も標本平均を計算したとすると 分散が小さくなっているので, 「たいてい,ほぼ」母平均に近い値になる
  • 96.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 母平均の推定 32 母平均がμ 母分散がσ2 のとき, 標本平均の期待値がμ 標本平均の分散がσ2 /n 仮に,何度も標本を抽出して, 何度も標本平均を計算したとすると 分散が小さくなっているので, 「たいてい,ほぼ」母平均に近い値になる 標本平均を 何度も計算しても
  • 97.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 母平均の推定 32 母平均がμ 母分散がσ2 のとき, 標本平均の期待値がμ 標本平均の分散がσ2 /n 仮に,何度も標本を抽出して, 何度も標本平均を計算したとすると 分散が小さくなっているので, 「たいてい,ほぼ」母平均に近い値になる 標本平均を 何度も計算しても μ
  • 98.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 母平均の推定 32 母平均がμ 母分散がσ2 のとき, 標本平均の期待値がμ 標本平均の分散がσ2 /n 仮に,何度も標本を抽出して, 何度も標本平均を計算したとすると 分散が小さくなっているので, 「たいてい,ほぼ」母平均に近い値になる 標本平均を 何度も計算しても μ X
  • 99.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 母平均の推定 32 母平均がμ 母分散がσ2 のとき, 標本平均の期待値がμ 標本平均の分散がσ2 /n 仮に,何度も標本を抽出して, 何度も標本平均を計算したとすると 分散が小さくなっているので, 「たいてい,ほぼ」母平均に近い値になる 標本平均を 何度も計算しても μ X X
  • 100.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 母平均の推定 32 母平均がμ 母分散がσ2 のとき, 標本平均の期待値がμ 標本平均の分散がσ2 /n 仮に,何度も標本を抽出して, 何度も標本平均を計算したとすると 分散が小さくなっているので, 「たいてい,ほぼ」母平均に近い値になる 標本平均を 何度も計算しても μ X X X
  • 101.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 母平均の推定 32 母平均がμ 母分散がσ2 のとき, 標本平均の期待値がμ 標本平均の分散がσ2 /n 仮に,何度も標本を抽出して, 何度も標本平均を計算したとすると 分散が小さくなっているので, 「たいてい,ほぼ」母平均に近い値になる 標本平均を 何度も計算しても μ X X X X
  • 102.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 母平均の推定 32 母平均がμ 母分散がσ2 のとき, 標本平均の期待値がμ 標本平均の分散がσ2 /n 仮に,何度も標本を抽出して, 何度も標本平均を計算したとすると 分散が小さくなっているので, 「たいてい,ほぼ」母平均に近い値になる 標本平均を 何度も計算しても μ いつ計算しても,たいていそれほどかわらない X X X X
  • 103.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 母平均の推定 33 母平均がμ 母分散がσ2 のとき, 標本平均の期待値がμ 標本平均の分散がσ2 /n 仮に,何度も標本を抽出して, 何度も標本平均を計算したとすると 分散が小さくなっているので, 「たいてい,ほぼ」母平均に近い値になる いま1回だけ計算した標本平均も, たいてい,ほぼ母平均に近い値だろう
  • 104.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 母平均の推定 34 いま1回だけ計算した標本平均も, 「たいてい,ほぼ」母平均に近い値だろう 何度も計算しても μ いつ計算しても,たいていそれほどかわらない X X X X
  • 105.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 母平均の推定 34 いま1回だけ計算した標本平均も, 「たいてい,ほぼ」母平均に近い値だろう いま1回だけ計算した標本平均は 上のどれにあたるかはわからないが, 何度も計算しても μ いつ計算しても,たいていそれほどかわらない X X X X
  • 106.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 母平均の推定 34 いま1回だけ計算した標本平均も, 「たいてい,ほぼ」母平均に近い値だろう いま1回だけ計算した標本平均は 上のどれにあたるかはわからないが, 何度も計算しても μ いつ計算しても,たいていそれほどかわらない ? X X X X
  • 107.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 母平均の推定 34 いま1回だけ計算した標本平均も, 「たいてい,ほぼ」母平均に近い値だろう いま1回だけ計算した標本平均は 上のどれにあたるかはわからないが, 何度も計算しても μ いつ計算しても,たいていそれほどかわらない ? ? X X X X
  • 108.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 母平均の推定 34 いま1回だけ計算した標本平均も, 「たいてい,ほぼ」母平均に近い値だろう いま1回だけ計算した標本平均は 上のどれにあたるかはわからないが, 何度も計算しても μ いつ計算しても,たいていそれほどかわらない ? ? ? X X X X
  • 109.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 母平均の推定 34 いま1回だけ計算した標本平均も, 「たいてい,ほぼ」母平均に近い値だろう いま1回だけ計算した標本平均は 上のどれにあたるかはわからないが, 何度も計算しても μ いつ計算しても,たいていそれほどかわらない ? ? ? ? X X X X
  • 110.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 母平均の推定 34 いま1回だけ計算した標本平均も, 「たいてい,ほぼ」母平均に近い値だろう いま1回だけ計算した標本平均は 上のどれにあたるかはわからないが, 何度も計算しても μ いつ計算しても,たいていそれほどかわらない いずれにせよ,たいていはあまりかわらない ? ? ? ? X X X X
  • 111.
  • 112.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 ところで 36 母分散がσ2のとき,標本平均の分散がσ2 /n 標本平均の分散に関係しているのは 標本の大きさであって,母集団の大きさは関係ない 推測の確かさに影響するのは 標本の大きさであって, 標本の大きさの,母集団の大きさに対する割合 ではない
  • 113.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 標本の大きさとは 37 「10人からなる標本」の意味は, 1,000人からなる母集団でも 100,000人からなる母集団でも同じ 🤔🤔… 理想的な無作為抽出では,復元抽出を行う 標本サイズは, 「取り出された数値の個数」というよりも 「同一の母集団から数値ひとつひとつを取り出す回数」 → 母集団の大きさに対する割合は無関係
  • 114.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 復元抽出と非復元抽出 38 出たくじをすぐに箱に戻す [復元抽出] ・どのくじも同じ確率で選ばれる ・ある回のくじびきの結果が,他の回に影響しない(独立) こうであるためには, 実際にはあまりやらない… 理想的な無作為抽出は,「公平なくじびき」
  • 115.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 母平均の推定 39 いま1回だけ計算した標本平均も, 「たいてい,ほぼ」母平均に近い値だろう
  • 116.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 母平均の推定 39 いま1回だけ計算した標本平均も, 「たいてい,ほぼ」母平均に近い値だろう
  • 117.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 母平均の推定 39 いま1回だけ計算した標本平均も, 「たいてい,ほぼ」母平均に近い値だろう どのくらい近い?
  • 118.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 母平均の推定 39 いま1回だけ計算した標本平均も, 「たいてい,ほぼ」母平均に近い値だろう どのくらい近い?
  • 119.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 母平均の推定 39 いま1回だけ計算した標本平均も, 「たいてい,ほぼ」母平均に近い値だろう どのくらい近い? どのくらいの確率で? はずれる確率は?
  • 120.
    39 2022年度秋学期 統計学 /関西大学総合情報学部 浅野 晃 母平均の推定 39 いま1回だけ計算した標本平均も, 「たいてい,ほぼ」母平均に近い値だろう どのくらい近い? どのくらいの確率で? はずれる確率は? このあたりは次回。