Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

of

データサイエンス勉強会 第3回 Slide 1 データサイエンス勉強会 第3回 Slide 2 データサイエンス勉強会 第3回 Slide 3 データサイエンス勉強会 第3回 Slide 4 データサイエンス勉強会 第3回 Slide 5 データサイエンス勉強会 第3回 Slide 6 データサイエンス勉強会 第3回 Slide 7 データサイエンス勉強会 第3回 Slide 8 データサイエンス勉強会 第3回 Slide 9 データサイエンス勉強会 第3回 Slide 10 データサイエンス勉強会 第3回 Slide 11 データサイエンス勉強会 第3回 Slide 12 データサイエンス勉強会 第3回 Slide 13 データサイエンス勉強会 第3回 Slide 14 データサイエンス勉強会 第3回 Slide 15 データサイエンス勉強会 第3回 Slide 16
Upcoming SlideShare
What to Upload to SlideShare
Next
Download to read offline and view in fullscreen.

Download to read offline

データサイエンス勉強会 第3回

Download to read offline

【オンライン】#03 Python勉強会 分析データの可視化入門@初学者歓迎
にて使用したスライドです。

Related Books

Free with a 30 day trial from Scribd

See all
  • Be the first to like this

データサイエンス勉強会 第3回

  1. 1. Copyright © EDIX.co.,ltd.2019. All rights reserved. #03 データサイエンス勉強会 ∼分析データの可視化 入門∼ 2021.09.03
  2. 2. Copyright © EDIX.co.,ltd.2021. All rights reserved. #03 データサイエンス勉強会 2 ◆本日のアジェンダ (1) 講師自己紹介 (2) データ可視化の重要性について (3) データ別可視化手法の解説 - 棒グラフ - 円グラフ - 線グラフ - 散布図 - ヒストグラム - エリアチャート (4) 実際にサンプルデータを可視化してみる
  3. 3. Copyright © EDIX.co.,ltd.2021. All rights reserved. #03 データサイエンス勉強会 3
  4. 4. Copyright © EDIX.co.,ltd.2021. All rights reserved. #03 データサイエンス勉強会 4 Q. 世界人口第4位はどの国でしょうか? ◆データ可視化の重要性について
  5. 5. Copyright © EDIX.co.,ltd.2021. All rights reserved. #03 データサイエンス勉強会 5 Q. 世界人口第4位はどの国でしょうか? ◆データ可視化の重要性について 日本 インド パキスタン ブラジル 中国 インドネシア ナイジェリア バングラデシュ ロシア アメリカ メキシコ
  6. 6. Copyright © EDIX.co.,ltd.2021. All rights reserved. #03 データサイエンス勉強会 6 データの可視化とは… データの価値を引き出すこと ・現象 ・関係性 ・変化 数値データを「可視化」して 人間が直感的に理解しやすいものへ変換すること ◆データ可視化の重要性について
  7. 7. Copyright © EDIX.co.,ltd.2021. All rights reserved. #03 データサイエンス勉強会 7 データ可視化の目的 1. 比較したい 2. 分布が知りたい 3. 全体の構成が知りたい 4. 関係性を確認したい ◆データ可視化の観点別手法 データの特徴 1. 時系列が含まれるか 2. カテゴリ数 3. 変数の数 4. データの最小粒度 x データ可視化手法の決定
  8. 8. Copyright © EDIX.co.,ltd.2021. All rights reserved. #03 データサイエンス勉強会 8 ◆データ可視化の観点別手法 データ可視化の目的 比較 分布 構成 相関関係 時系列データが含まれるか YES NO カテゴリ数 少数(1∼2) 多数(3つ以上) 棒グラフ 線グラフ 棒グラフ
  9. 9. Copyright © EDIX.co.,ltd.2021. All rights reserved. #03 データサイエンス勉強会 9 ◆データ可視化の観点別手法 データ可視化の目的 比較 分布 構成 相関関係 変数の数 1つ 2つ 変数の粒度 変数の粒度 小さい 大きい 小さい 大きい ヒストグラム ヒストグラム + (正規分布曲線) 散布図 散布図
  10. 10. Copyright © EDIX.co.,ltd.2021. All rights reserved. #03 データサイエンス勉強会 10 ◆データ可視化の観点別手法 データ可視化の目的 比較 分布 構成 相関関係 割合 値 時系列データが含まれるか 時系列データが含まれるか YES NO YES NO 確認観点 累積エリアチャート 円グラフ (累積棒グラフ) エリアチャート 棒グラフ
  11. 11. Copyright © EDIX.co.,ltd.2021. All rights reserved. #03 データサイエンス勉強会 11 ◆データ可視化の観点別手法 データ可視化の目的 比較 分布 構成 相関関係 変数の数 2つ 3つ 散布図 散布図 (3D, バブルチャート)
  12. 12. Copyright © EDIX.co.,ltd.2021. All rights reserved. #03 データサイエンス勉強会 12 データセット:国際連合の世界の推計人口データ ◆実際にサンプルデータを可視化してみる。 項⽬名 説明 LocID 地域を表す数値コード。国や地域の場合は、ISO3166-1の数値規格 に準拠。 Location 地域、サブリージョン、国、またはエリアの名前。 VarID Variantを示す、数値コード Variant プロジェクションバリアント名(Medium が最も使用される);詳細 は、Definition of projection variants を参照。 Time 単一年(例:1950年)またはデータの期間(例:1950-1955年)を 示すラベル MidPeriod データの中間期を示す数値で、小数点以下は月を表す(例:1950年7 月は1950.5) PopMale 男性の人口 (千) PopFemale 女性の人口 (千) PopTotal 総人口 (千) PopDensity 人口密度
  13. 13. Copyright © EDIX.co.,ltd.2021. All rights reserved. #03 データサイエンス勉強会 13
  14. 14. Copyright © EDIX.co.,ltd.2021. All rights reserved. #03 データサイエンス勉強会 14
  15. 15. Copyright © EDIX.co.,ltd.2021. All rights reserved. #03 データサイエンス勉強会 15
  16. 16. Copyright © EDIX.co.,ltd.2021. All rights reserved. #03 データサイエンス勉強会 16 「lecture-samples-3.ipynb」を開く

【オンライン】#03 Python勉強会 分析データの可視化入門@初学者歓迎 にて使用したスライドです。

Views

Total views

32

On Slideshare

0

From embeds

0

Number of embeds

0

Actions

Downloads

4

Shares

0

Comments

0

Likes

0

×