SlideShare a Scribd company logo
1 of 8
統計学とは

 環境学研究科
  垂水 共之
たるみ ともゆき
統計学とは
•   統計学 statistics
•   国勢学
•   国勢調査 census survey
    スタチスチックスの訳名が「統計学」と定まるまでには多少の沿革がある。始め慶応三年四月に
    出版せられた神田孝平氏訳「経済小学」の序には、スタチスチックスを訳して「会計学」として
    あるが、明治三年二月発布の「大学規則」には「国勢学」とある。これは、欧洲において中世よ
    り第十八世紀の始めに至るまでは、この語原の示す如く、国家の状態を研究する学問となってい
    たとのことであるから、その後の沿革を知らずに、二百年前の用例をそのままに「国勢学」と邦
    訳したのであろう。
    <中略>
    明治七年六月になって、箕作麟祥博士が仏人モロー・ド・ジョンネの著書を翻訳して文部省から
    出版せられたものには「統計学一名国勢略論」という標題を用いられた。学名として「統計学」
    という各称を用いたのは、けだしこの書をもって初めとなすべきである。そして前にも述べた如
    く、この後にも「国勢学」「知国学」「政表学」または「表記」「***」などの名称が存在し
    たにもかかわらず、後には「統計学」という名称が一般に行われて、終に学名と定まるに至った
    のである。




•   岩波文庫「法窓夜話」 穂積 陳重 著  1980 年1月 16 日第一刷発行
•   http://web.kyoto-inet.or.jp/people/t-shinya/yowaindx.html
日本の国勢調査
• 1920 年 第一回調査
 – 最終報告書は 1932 年 6 月
   この間に第 2 回調査、第 3 回調査も実施
• 2010 年 第 19 回調査(直近)
 – 最終報告書は 2013 年 10 月?

• 5 年おき 西暦下一桁が 0 と 5 の年
• 調査対象
 – 10 月 1 日午前 0 時 0 分に国内に居住している人
 – 実際の調査は「世帯」が単位
データの縮約
• たくさんのデータからどんな情報を読み
  取るか?
• どうやってデータを眺めるか?

• 10 個、 100 個だと個々にも眺められる。

• 1 万個となると
• 1 億 3 千万人分のデータとなるとお手上
  げ!
データの縮約 (2)
• n個のデータを数個のデータにまとめよ
  う

• 何個に?

• 少ない方が楽!
  じゃあ、 1 個の数値にまとめよう
         代表値
代表値
• n個のデータを 1 個の値で代表させてし
  まう

• どんな値で代表させようか?

• どんな値にするのが良かろうか

• 良い、悪いの基準は
基準 誤差を少なく
• データ                 • 誤差
  x1 x2 ・・・  デー
             xn   代表     誤差     絶対値      2 乗値
             タ    値
• 代表値 a
             x1   a      x1-a   |x1-a|   (x1-a)2
            x2    a      x2-a   |x2-a|   (x2-a)2


            xn    a      xn-a   |xn-a|   (xn-a)2



                       絶対値は難しい!

                       2 乗誤差を小さくしよう!

More Related Content

More from t2tarumi

K060 中心極限定理clt
K060 中心極限定理cltK060 中心極限定理clt
K060 中心極限定理cltt2tarumi
 
K050 t分布f分布
K050 t分布f分布K050 t分布f分布
K050 t分布f分布t2tarumi
 
K020 appstat201202
K020 appstat201202K020 appstat201202
K020 appstat201202t2tarumi
 
K010 appstat201201
K010 appstat201201K010 appstat201201
K010 appstat201201t2tarumi
 
K080 区間推定
K080 区間推定K080 区間推定
K080 区間推定t2tarumi
 
000 統計学入門 目標
000 統計学入門 目標000 統計学入門 目標
000 統計学入門 目標t2tarumi
 
086 独立性の検定
086 独立性の検定086 独立性の検定
086 独立性の検定t2tarumi
 
076 母比率の推定
076 母比率の推定076 母比率の推定
076 母比率の推定t2tarumi
 
080 統計的推測 検定
080 統計的推測 検定080 統計的推測 検定
080 統計的推測 検定t2tarumi
 
070 統計的推測 母集団と推定
070 統計的推測 母集団と推定070 統計的推測 母集団と推定
070 統計的推測 母集団と推定t2tarumi
 
060 期待値・中心極限定理
060 期待値・中心極限定理060 期待値・中心極限定理
060 期待値・中心極限定理t2tarumi
 
050 確率と確率分布
050 確率と確率分布050 確率と確率分布
050 確率と確率分布t2tarumi
 
040 相関
040 相関040 相関
040 相関t2tarumi
 
030 2変数の集計
030 2変数の集計030 2変数の集計
030 2変数の集計t2tarumi
 

More from t2tarumi (14)

K060 中心極限定理clt
K060 中心極限定理cltK060 中心極限定理clt
K060 中心極限定理clt
 
K050 t分布f分布
K050 t分布f分布K050 t分布f分布
K050 t分布f分布
 
K020 appstat201202
K020 appstat201202K020 appstat201202
K020 appstat201202
 
K010 appstat201201
K010 appstat201201K010 appstat201201
K010 appstat201201
 
K080 区間推定
K080 区間推定K080 区間推定
K080 区間推定
 
000 統計学入門 目標
000 統計学入門 目標000 統計学入門 目標
000 統計学入門 目標
 
086 独立性の検定
086 独立性の検定086 独立性の検定
086 独立性の検定
 
076 母比率の推定
076 母比率の推定076 母比率の推定
076 母比率の推定
 
080 統計的推測 検定
080 統計的推測 検定080 統計的推測 検定
080 統計的推測 検定
 
070 統計的推測 母集団と推定
070 統計的推測 母集団と推定070 統計的推測 母集団と推定
070 統計的推測 母集団と推定
 
060 期待値・中心極限定理
060 期待値・中心極限定理060 期待値・中心極限定理
060 期待値・中心極限定理
 
050 確率と確率分布
050 確率と確率分布050 確率と確率分布
050 確率と確率分布
 
040 相関
040 相関040 相関
040 相関
 
030 2変数の集計
030 2変数の集計030 2変数の集計
030 2変数の集計
 

010 統計学とは

  • 1. 統計学とは 環境学研究科 垂水 共之 たるみ ともゆき
  • 2. 統計学とは • 統計学 statistics • 国勢学 • 国勢調査 census survey スタチスチックスの訳名が「統計学」と定まるまでには多少の沿革がある。始め慶応三年四月に 出版せられた神田孝平氏訳「経済小学」の序には、スタチスチックスを訳して「会計学」として あるが、明治三年二月発布の「大学規則」には「国勢学」とある。これは、欧洲において中世よ り第十八世紀の始めに至るまでは、この語原の示す如く、国家の状態を研究する学問となってい たとのことであるから、その後の沿革を知らずに、二百年前の用例をそのままに「国勢学」と邦 訳したのであろう。 <中略> 明治七年六月になって、箕作麟祥博士が仏人モロー・ド・ジョンネの著書を翻訳して文部省から 出版せられたものには「統計学一名国勢略論」という標題を用いられた。学名として「統計学」 という各称を用いたのは、けだしこの書をもって初めとなすべきである。そして前にも述べた如 く、この後にも「国勢学」「知国学」「政表学」または「表記」「***」などの名称が存在し たにもかかわらず、後には「統計学」という名称が一般に行われて、終に学名と定まるに至った のである。 • 岩波文庫「法窓夜話」 穂積 陳重 著  1980 年1月 16 日第一刷発行 • http://web.kyoto-inet.or.jp/people/t-shinya/yowaindx.html
  • 3. 日本の国勢調査 • 1920 年 第一回調査 – 最終報告書は 1932 年 6 月 この間に第 2 回調査、第 3 回調査も実施 • 2010 年 第 19 回調査(直近) – 最終報告書は 2013 年 10 月? • 5 年おき 西暦下一桁が 0 と 5 の年 • 調査対象 – 10 月 1 日午前 0 時 0 分に国内に居住している人 – 実際の調査は「世帯」が単位
  • 4.
  • 5. データの縮約 • たくさんのデータからどんな情報を読み 取るか? • どうやってデータを眺めるか? • 10 個、 100 個だと個々にも眺められる。 • 1 万個となると • 1 億 3 千万人分のデータとなるとお手上 げ!
  • 6. データの縮約 (2) • n個のデータを数個のデータにまとめよ う • 何個に? • 少ない方が楽! じゃあ、 1 個の数値にまとめよう 代表値
  • 7. 代表値 • n個のデータを 1 個の値で代表させてし まう • どんな値で代表させようか? • どんな値にするのが良かろうか • 良い、悪いの基準は
  • 8. 基準 誤差を少なく • データ • 誤差 x1 x2 ・・・  デー xn 代表 誤差 絶対値 2 乗値 タ 値 • 代表値 a x1 a x1-a |x1-a| (x1-a)2 x2 a x2-a |x2-a| (x2-a)2 xn a xn-a |xn-a| (xn-a)2 絶対値は難しい! 2 乗誤差を小さくしよう!