SlideShare a Scribd company logo
1 of 13
Download to read offline
統計の基礎を楽しく学ぼう
-箱ひげ図編-
アサヒビジネスソリューションズ
百足山 実花
自己紹介
1
名前:百足山 実花
所属:アサヒビジネスソリューションズ株式会社
好きなお酒:ビール、シードル
趣味:映画&海外ドラマ鑑賞
(Prime、Hulu、Netflix入会済み)
2017年入社。大学において深層学習を研究テーマとしていたことも
あり、入社早々に機械学習および深層学習を用いたプロジェクトに
参画。AIコミュニティ「AI×Analytics×女子部」の主催者でもある。
突然ですが、箱ひげ図ってなんでしょう
2
株価チャート
箱ひげ図
株価チャート
箱ひげ図は、データの特長を捉えるために重要な5つの基本統計量(分布の特長を要約する値)を表現したもの
です。最小値、第1四分位点、中央値、第3四分位点と最大値が以下の図に表現されています。また、外れ値がど
の程度存在するのかを確認するにも有効です。
最大値
第3四分位点
中央値
外れ値
第1四分位点
最小値
※「×」で平均値を表現する場合もあります。
ひげ
四分位範囲
中央値、第1四分位、第3四分位
4
10 11 12 13 10 25 28 31 33 37 41 56 70 87 90
50%50%
「中央値」
中央値はデータを降順か昇順で並び替えて真ん中に位置する値(50パーセンタイル値)を意味し、以下のケースで
は31が中央値にあたります。 4分の1に位置する値(25パーセンタイル値)を第1四分位、4分の3 (75パーセンタイ
ル値)に位置する値を第3四分位といいます。
「第1四分位」 「第3四分位」
箱ひげ図
株価チャート
箱ひげ図は、データの特長を捉えるために重要な5つの基本統計量(分布の特長を要約する値)を表現したもの
です。最小値、第1四分位点、中央値、第3四分位点と最大値が以下の図に表現されています。また、外れ値がど
の程度存在するのかを確認するにも有効です。
理論最大値:第3四分位点 +(1.5 × 四分位範囲)
理論最小値:第1四分位点 -(1.5 × 四分位範囲)
最大値
第3四分位点
中央値
外れ値
第1四分位点
最小値
※「×」で平均値を表現する場合もあります。
ひげ
四分位範囲
箱ひげ図を見てみよう
6
都道府県別統計とランキングで見る県民性:https://todo-ran.com/t/categ/10043
東京都
東京都
大分県 東京都
鹿児島県
新潟県
山梨県
沖縄県
宮城県
秋田県
(ℓ)
SNS分析+統計:箱ひげ図をSNS分析に利用しよう①
キーワード出現数時系列分析
キーワードがどの程度出現
(つぶやかれているか)し
ているかを時間の流れと共
に可視化します。
新商品やサービスの販売時
などにおいて、評価指標の
ひとつとなります。
SNS分析+統計:箱ひげ図をSNS分析に利用しよう②
ある施策を打った際、その施策がSNS上でどの程度響いているのか確認することも重要なのですが、
「響いた(バズった)」「響いてない(バズってない)」
を人の目で確認するのは、見る人によってバイアスがかかってしまうので問題ではないか?
バズってない?バズった?
SNS分析+統計:箱ひげ図をSNS分析に利用しよう③
下記の2016年7月29日のTweet数上昇を「異常値なのか?否か?」を判断できればいいわけです。
単なる
揺らぎなのか?
異常値なのか?
SNS分析+統計:箱ひげ図をSNS分析に利用しよう④
最大値
第3四分位点
中央値
異常値(外れ値)
第1四分位点
最小値
お
!
な
ん
だ
か
応
用
で
き
る
気
が
す
る
平均値: 1220
中央値: 939.5
第1四分位点: 323
第3四分位点: 939.5
四分位範囲: 616.5
理論最大値: 1826.25
この理論最大値を閾値にしよう!
※理論最大値
第3四分位点 +(1.5 × 四分位範囲)
SNS分析+統計:箱ひげ図をSNS分析に利用しよう⑤
経験を重ねながら、理論最大値の計算式(第3四分位点 +(1.5 × 四分位範囲))における、係数部
分(1.5)を調整しながら、適切な検知を学んでゆく。
異常値である
デジタルに
判断できる
終わり
12
ご清聴いただきありがとうございました。

More Related Content

Similar to 統計の基礎を楽しく学ぼうー箱ひげ図編ー

data science study group vol.5(Japanese)
data science study group vol.5(Japanese)data science study group vol.5(Japanese)
data science study group vol.5(Japanese)Yusuke Ohira
 
ビフォーアフターで学ぶ データビジュアライゼーションの基本
ビフォーアフターで学ぶ データビジュアライゼーションの基本ビフォーアフターで学ぶ データビジュアライゼーションの基本
ビフォーアフターで学ぶ データビジュアライゼーションの基本Toshikuni Fuji
 
20220422佐賀銀行新入行員研修
20220422佐賀銀行新入行員研修20220422佐賀銀行新入行員研修
20220422佐賀銀行新入行員研修KazuhitoKitamura
 
統計初心者向け人事データを使った統計セミナー
統計初心者向け人事データを使った統計セミナー統計初心者向け人事データを使った統計セミナー
統計初心者向け人事データを使った統計セミナーTakanori Omote
 
Rで架空データの発生
Rで架空データの発生Rで架空データの発生
Rで架空データの発生Makoto Hirakawa
 
Watson summit 公開用
Watson summit 公開用Watson summit 公開用
Watson summit 公開用Izumi Akiyama
 

Similar to 統計の基礎を楽しく学ぼうー箱ひげ図編ー (8)

20180717 the average
20180717 the average20180717 the average
20180717 the average
 
data science study group vol.5(Japanese)
data science study group vol.5(Japanese)data science study group vol.5(Japanese)
data science study group vol.5(Japanese)
 
企業における統計学入門
企業における統計学入門企業における統計学入門
企業における統計学入門
 
ビフォーアフターで学ぶ データビジュアライゼーションの基本
ビフォーアフターで学ぶ データビジュアライゼーションの基本ビフォーアフターで学ぶ データビジュアライゼーションの基本
ビフォーアフターで学ぶ データビジュアライゼーションの基本
 
20220422佐賀銀行新入行員研修
20220422佐賀銀行新入行員研修20220422佐賀銀行新入行員研修
20220422佐賀銀行新入行員研修
 
統計初心者向け人事データを使った統計セミナー
統計初心者向け人事データを使った統計セミナー統計初心者向け人事データを使った統計セミナー
統計初心者向け人事データを使った統計セミナー
 
Rで架空データの発生
Rで架空データの発生Rで架空データの発生
Rで架空データの発生
 
Watson summit 公開用
Watson summit 公開用Watson summit 公開用
Watson summit 公開用
 

More from Yutaka Terasawa

20190306オープニング
20190306オープニング20190306オープニング
20190306オープニングYutaka Terasawa
 
時系列データの扱い方
時系列データの扱い方時系列データの扱い方
時系列データの扱い方Yutaka Terasawa
 
転移学習やってみた!
転移学習やってみた!転移学習やってみた!
転移学習やってみた!Yutaka Terasawa
 
Google Colaboratoryを使って、MNISTでディープラニング!
Google Colaboratoryを使って、MNISTでディープラニング!Google Colaboratoryを使って、MNISTでディープラニング!
Google Colaboratoryを使って、MNISTでディープラニング!Yutaka Terasawa
 
20181114 TDAを使ったタイタニック生存者分析
20181114 TDAを使ったタイタニック生存者分析20181114 TDAを使ったタイタニック生存者分析
20181114 TDAを使ったタイタニック生存者分析Yutaka Terasawa
 
20180717 unsupervised learning
20180717 unsupervised learning20180717 unsupervised learning
20180717 unsupervised learningYutaka Terasawa
 
Wg for ai_dev_ops_20180713
Wg for ai_dev_ops_20180713Wg for ai_dev_ops_20180713
Wg for ai_dev_ops_20180713Yutaka Terasawa
 

More from Yutaka Terasawa (11)

20190306オープニング
20190306オープニング20190306オープニング
20190306オープニング
 
時系列データの扱い方
時系列データの扱い方時系列データの扱い方
時系列データの扱い方
 
転移学習やってみた!
転移学習やってみた!転移学習やってみた!
転移学習やってみた!
 
Google Colaboratoryを使って、MNISTでディープラニング!
Google Colaboratoryを使って、MNISTでディープラニング!Google Colaboratoryを使って、MNISTでディープラニング!
Google Colaboratoryを使って、MNISTでディープラニング!
 
20181114 TDAを使ったタイタニック生存者分析
20181114 TDAを使ったタイタニック生存者分析20181114 TDAを使ったタイタニック生存者分析
20181114 TDAを使ったタイタニック生存者分析
 
20180717 grid
20180717 grid20180717 grid
20180717 grid
 
20180717 unsupervised learning
20180717 unsupervised learning20180717 unsupervised learning
20180717 unsupervised learning
 
20180717 zeal
20180717 zeal20180717 zeal
20180717 zeal
 
20180717 opening
20180717 opening20180717 opening
20180717 opening
 
Wg for ai_dev_ops_20180713
Wg for ai_dev_ops_20180713Wg for ai_dev_ops_20180713
Wg for ai_dev_ops_20180713
 
Wg for edu_20180713
Wg for edu_20180713Wg for edu_20180713
Wg for edu_20180713
 

Recently uploaded

論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...Toru Tamaki
 
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...博三 太田
 
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)Hiroki Ichikura
 
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する       2024/04/19 の勉強会で発表されたものですSOPを理解する       2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものですiPride Co., Ltd.
 
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfAWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfFumieNakayama
 
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Yuma Ohgami
 
TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdfTSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdftaisei2219
 
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)UEHARA, Tetsutaro
 
論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A surveyToru Tamaki
 
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfクラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfFumieNakayama
 
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案sugiuralab
 
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?akihisamiyanaga1
 
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineerYuki Kikuchi
 
論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNetToru Tamaki
 

Recently uploaded (14)

論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
 
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
 
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
 
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する       2024/04/19 の勉強会で発表されたものですSOPを理解する       2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものです
 
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfAWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
 
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
 
TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdfTSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdf
 
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
 
論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey
 
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfクラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
 
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
 
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
 
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
 
論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet
 

統計の基礎を楽しく学ぼうー箱ひげ図編ー