SlideShare a Scribd company logo
データを整理するための基礎知識
藤田 元(合同会社カノープス/上智大学)
第1章で取り扱うこと
 平均とはなにか?
 割り算の2つの意味
 いろいろなグラフ
– 棒グラフ
– 折れ線グラフ
– 円グラフ
– 帯グラフ
 データと変量(質的データと量的データ/度数分布)
 ヒストグラム
 代表値(平均値・中央値・最頻値)
 データのばらつき
 箱ひげ図
平均とはなにか?
 平均とは「平たく均す」こと
2 7 3
平均
データの個数
平均とはなにか?
 平均 = 合計/個数
– 前ページの例では:
 合計:2+7+3=12
 データの個数:3個
 12/3 = 4 (平均:4)
 平均の数学的定義
平均とはなにか?
 例題 1-1:それぞれのクラスの平均を求めよ
 A組:(50+60+40+30+70+50)/6=300/6=50
 B組:(40+30+40+40+100)/5=250/5=50
 A組もB組もどちらも平均点が50点だが、これをグラフで表すと…
A組 50 60 40 30 70 50
B組 40 40 40 100
平均とはなにか?
 例題 1-1:それぞれのクラスの平均を求めよ
 (一般的に)平均値は外れ値の影響を大きく受ける
A組 50 60 40 30 70 50
B組 40 40 40 100
50
40
60
30
40 40
30
40
70
100
50
0
20
40
60
80
100
120
A組 B組
個人の点数を視覚化
1 2 3 4 5 6
割り算の2つの意味
例題:6÷2 を次の図を使って表現せよ。
割り算の2つの意味
1. 全体を等しく分ける(等分除)
– 6個のものを3等分すると、1つあたり2個になる
– (1つあたりの量)× 3 = 6
– 「1つあたりの量」を求める計算をしている
– aをn等分すると1つあたりp個である(a÷n=p)
2. 全体を同じ数に分ける(包含除)
– 6個のものを同じ数に分けるようにすると、同じ数の集合が2つできる
– 3×(いくつ分)= 6
– 「いくつの集合ができるか」を求める計算をしている
– aをnずつに分けるとp個になる
割合
 割合の定義:
 割合 = 比べる量/基準にする量
割合
 例題1-2:50人のクラスがあります。男子は30人です。クラスに占める
男子の割合を求めよ
 割合=比べる量/基準にする量
 男子の割合= 男子の数/クラス全体の数
– 30/50=0.6 (60%)
 同じ単位同士の割合は包含除
– 全体(50人)を30人という集合に分けようとすると、その集合はいくつできるか?:
0.6 個
割合
 例題:スーパーで2種類の牛乳が売っています。どちらがお買い得でしょ
う?
– A:400ml で 120円
– B:900ml で 300円
 割合=比べる量/基準とする量=値段(円)/体積(ml)
– 割合をもとめることで、単位あたりの値段を求めている
– この場合、1ml あたりの牛乳の値段を求めていることになる
– A: 400/120 = 0.3
– B: 300/900 = 0.333… → 単位あたりの値段はAが安い
 異なる単位(円/ml)は等分除:1つあたりの量(この場合1mlあた
りの価格)を計算している
割合
 結論
 同じ単位どうしの割合は包含除
 違う単位どうしの割合は等分除
割合
 例題1-3:AとBと2つのシートがあります。下の表はシートの上に座っている
人数とシートの面積を表しています。
 どちらのシートが混んでいるかを調べるために、下の計算をしました。
– A:12÷6=2
– B:8÷5=1.6
 上の計算からどのようなことがわかりますか?1−4の中から選びなさい。
1. 1m^2Bあたりの人数は2人と1.6人なので、Aの方が混んでいる
2. 1m^2Bあたりの人数は2人と1.6人なので、Bの方が混んでいる
3. 1人あたりの面積は2m^2と1.6m^2なので 、Aの方が混んでいる
4. 1人あたりの面積は2m^2と1.6m^2なので 、Aの方が混んでいる
人数(人) 面積(m^2)
A 12 6
B 8 5

More Related Content

Viewers also liked

201412ことばの理解とワーキングメモリ:基本概念の整理(公開)
201412ことばの理解とワーキングメモリ:基本概念の整理(公開)201412ことばの理解とワーキングメモリ:基本概念の整理(公開)
201412ことばの理解とワーキングメモリ:基本概念の整理(公開)Kosuke Sugai
 
再入門!RESTとSpringMVC
再入門!RESTとSpringMVC再入門!RESTとSpringMVC
再入門!RESTとSpringMVC
terahide
 
SSL入門
SSL入門SSL入門
SSL入門
Takeru Ujinawa
 
Docker超入門
Docker超入門Docker超入門
Docker超入門
Katsunori Kanda
 
Javaバイトコード入門
Javaバイトコード入門Javaバイトコード入門
Javaバイトコード入門
Kota Mizushima
 
HTTP/2入門
HTTP/2入門HTTP/2入門
HTTP/2入門
渉 米須
 
とある情報の超整理術
とある情報の超整理術とある情報の超整理術
とある情報の超整理術
Masahito Zembutsu
 
Jbatch実践入門 #jdt2015
Jbatch実践入門 #jdt2015Jbatch実践入門 #jdt2015
Jbatch実践入門 #jdt2015
Norito Agetsuma
 
ゼロからはじめるKVM超入門
ゼロからはじめるKVM超入門ゼロからはじめるKVM超入門
ゼロからはじめるKVM超入門
VirtualTech Japan Inc.
 
Apache Solr 検索エンジン入門
Apache Solr 検索エンジン入門Apache Solr 検索エンジン入門
Apache Solr 検索エンジン入門
Yahoo!デベロッパーネットワーク
 
負荷試験入門公開資料 201611
負荷試験入門公開資料 201611負荷試験入門公開資料 201611
負荷試験入門公開資料 201611
樽八 仲川
 
Swagger 入門
Swagger 入門Swagger 入門
Swagger 入門
Yoshiaki Yoshida
 
クラウド時代のネットワーク再入門
クラウド時代のネットワーク再入門クラウド時代のネットワーク再入門
クラウド時代のネットワーク再入門
Naoto MATSUMOTO
 
ネットワーク構築訓練 入門
ネットワーク構築訓練 入門ネットワーク構築訓練 入門
ネットワーク構築訓練 入門
株式会社 NTTテクノクロス
 
データベース入門2
データベース入門2データベース入門2
データベース入門2
tadaaki hayashi
 
5分でわかる静的解析入門
5分でわかる静的解析入門5分でわかる静的解析入門
5分でわかる静的解析入門
Kenta USAMI
 
GTDなメール整理術
GTDなメール整理術GTDなメール整理術
GTDなメール整理術
Naoto Azami
 
アイデアを発展・整理するための便利なアプリとその使い方
アイデアを発展・整理するための便利なアプリとその使い方アイデアを発展・整理するための便利なアプリとその使い方
アイデアを発展・整理するための便利なアプリとその使い方
祐磨 堀
 
5S(整理・整頓・清掃・清潔・躾)をA4一枚で理解するシート
5S(整理・整頓・清掃・清潔・躾)をA4一枚で理解するシート5S(整理・整頓・清掃・清潔・躾)をA4一枚で理解するシート
5S(整理・整頓・清掃・清潔・躾)をA4一枚で理解するシート
Taku Aoyama
 
Severe ARDSの初期治療
Severe ARDSの初期治療Severe ARDSの初期治療
Severe ARDSの初期治療
清水 真人
 

Viewers also liked (20)

201412ことばの理解とワーキングメモリ:基本概念の整理(公開)
201412ことばの理解とワーキングメモリ:基本概念の整理(公開)201412ことばの理解とワーキングメモリ:基本概念の整理(公開)
201412ことばの理解とワーキングメモリ:基本概念の整理(公開)
 
再入門!RESTとSpringMVC
再入門!RESTとSpringMVC再入門!RESTとSpringMVC
再入門!RESTとSpringMVC
 
SSL入門
SSL入門SSL入門
SSL入門
 
Docker超入門
Docker超入門Docker超入門
Docker超入門
 
Javaバイトコード入門
Javaバイトコード入門Javaバイトコード入門
Javaバイトコード入門
 
HTTP/2入門
HTTP/2入門HTTP/2入門
HTTP/2入門
 
とある情報の超整理術
とある情報の超整理術とある情報の超整理術
とある情報の超整理術
 
Jbatch実践入門 #jdt2015
Jbatch実践入門 #jdt2015Jbatch実践入門 #jdt2015
Jbatch実践入門 #jdt2015
 
ゼロからはじめるKVM超入門
ゼロからはじめるKVM超入門ゼロからはじめるKVM超入門
ゼロからはじめるKVM超入門
 
Apache Solr 検索エンジン入門
Apache Solr 検索エンジン入門Apache Solr 検索エンジン入門
Apache Solr 検索エンジン入門
 
負荷試験入門公開資料 201611
負荷試験入門公開資料 201611負荷試験入門公開資料 201611
負荷試験入門公開資料 201611
 
Swagger 入門
Swagger 入門Swagger 入門
Swagger 入門
 
クラウド時代のネットワーク再入門
クラウド時代のネットワーク再入門クラウド時代のネットワーク再入門
クラウド時代のネットワーク再入門
 
ネットワーク構築訓練 入門
ネットワーク構築訓練 入門ネットワーク構築訓練 入門
ネットワーク構築訓練 入門
 
データベース入門2
データベース入門2データベース入門2
データベース入門2
 
5分でわかる静的解析入門
5分でわかる静的解析入門5分でわかる静的解析入門
5分でわかる静的解析入門
 
GTDなメール整理術
GTDなメール整理術GTDなメール整理術
GTDなメール整理術
 
アイデアを発展・整理するための便利なアプリとその使い方
アイデアを発展・整理するための便利なアプリとその使い方アイデアを発展・整理するための便利なアプリとその使い方
アイデアを発展・整理するための便利なアプリとその使い方
 
5S(整理・整頓・清掃・清潔・躾)をA4一枚で理解するシート
5S(整理・整頓・清掃・清潔・躾)をA4一枚で理解するシート5S(整理・整頓・清掃・清潔・躾)をA4一枚で理解するシート
5S(整理・整頓・清掃・清潔・躾)をA4一枚で理解するシート
 
Severe ARDSの初期治療
Severe ARDSの初期治療Severe ARDSの初期治療
Severe ARDSの初期治療
 

Similar to データを整理するための基礎知識

データサイエンス概論第一=1-3 平均と分散
データサイエンス概論第一=1-3 平均と分散データサイエンス概論第一=1-3 平均と分散
データサイエンス概論第一=1-3 平均と分散
Seiichi Uchida
 
データ解析4 確率の復習
データ解析4 確率の復習データ解析4 確率の復習
データ解析4 確率の復習
Hirotaka Hachiya
 
K020 appstat201202
K020 appstat201202K020 appstat201202
K020 appstat201202t2tarumi
 
2016年12月18日AITC女子会 データ分析勉強会第7回「Rを使ったデータ分析の基礎・分析手法について知る」
2016年12月18日AITC女子会 データ分析勉強会第7回「Rを使ったデータ分析の基礎・分析手法について知る」2016年12月18日AITC女子会 データ分析勉強会第7回「Rを使ったデータ分析の基礎・分析手法について知る」
2016年12月18日AITC女子会 データ分析勉強会第7回「Rを使ったデータ分析の基礎・分析手法について知る」
aitc_jp
 
統計学における相関分析と仮説検定の基本的な考え方とその実践
統計学における相関分析と仮説検定の基本的な考え方とその実践統計学における相関分析と仮説検定の基本的な考え方とその実践
統計学における相関分析と仮説検定の基本的な考え方とその実践
id774
 
理科教育学研究のための統計分析入門
理科教育学研究のための統計分析入門理科教育学研究のための統計分析入門
理科教育学研究のための統計分析入門
Hiroshi Unzai
 
Rで架空データの発生
Rで架空データの発生Rで架空データの発生
Rで架空データの発生
Makoto Hirakawa
 

Similar to データを整理するための基礎知識 (8)

データサイエンス概論第一=1-3 平均と分散
データサイエンス概論第一=1-3 平均と分散データサイエンス概論第一=1-3 平均と分散
データサイエンス概論第一=1-3 平均と分散
 
データ解析4 確率の復習
データ解析4 確率の復習データ解析4 確率の復習
データ解析4 確率の復習
 
K020 appstat201202
K020 appstat201202K020 appstat201202
K020 appstat201202
 
2016年12月18日AITC女子会 データ分析勉強会第7回「Rを使ったデータ分析の基礎・分析手法について知る」
2016年12月18日AITC女子会 データ分析勉強会第7回「Rを使ったデータ分析の基礎・分析手法について知る」2016年12月18日AITC女子会 データ分析勉強会第7回「Rを使ったデータ分析の基礎・分析手法について知る」
2016年12月18日AITC女子会 データ分析勉強会第7回「Rを使ったデータ分析の基礎・分析手法について知る」
 
20181114 r
20181114 r20181114 r
20181114 r
 
統計学における相関分析と仮説検定の基本的な考え方とその実践
統計学における相関分析と仮説検定の基本的な考え方とその実践統計学における相関分析と仮説検定の基本的な考え方とその実践
統計学における相関分析と仮説検定の基本的な考え方とその実践
 
理科教育学研究のための統計分析入門
理科教育学研究のための統計分析入門理科教育学研究のための統計分析入門
理科教育学研究のための統計分析入門
 
Rで架空データの発生
Rで架空データの発生Rで架空データの発生
Rで架空データの発生
 

データを整理するための基礎知識