Tokyor42 ggplot2

13,378 views

Published on

Tokyor42 ggplot2

  1. 1. ggplot2による データ可視化 里 洋平 (@yokkuns) 第42回Tokyo.R 初心者セッション 2014.08.30
  2. 2. AGENDA n 自己紹介 n ggplot2によるデータの可視化 n ggplot2とは n 棒グラフ n 折れ線グラフ n 散布図 n ヒストグラム n 箱ひげ図
  3. 3. AGENDA n 自己紹介 n ggplot2によるデータの可視化 n ggplot2とは n 棒グラフ n 折れ線グラフ n 散布図 n ヒストグラム n 箱ひげ図
  4. 4. 自己紹介 里 洋平 (@yokkuns) Ø やってきたこと Ø Webアプリ開発 Ø 統計解析/データマイニング Ø マーケティング Ø 今やってること Ø 全社横断の分析 Ø 分析環境の整備
  5. 5. 活動例1:やってきたこと
  6. 6. 活動例2:TokyoR Tokyo.Rの主催やってます
  7. 7. 活動例3:執筆
  8. 8. AGENDA n 自己紹介 n ggplot2によるデータの可視化 n ggplot2とは n 棒グラフ n 折れ線グラフ n 散布図 n ヒストグラム n 箱ひげ図
  9. 9. ggplot2パッケージとは 統一されたインタフェースとオプションで 簡単にきれいでパワフルなグラフが作成出来るパッケージ
  10. 10. ggplot2によるグラフ作成のイメージ
  11. 11. ggplot2によるグラフ作成の流れ
  12. 12. 本資料で使用するデータ 仮想の売上データ Ø 商品1の月次売上データ Ø 商品1,2の月次売上データ Ø 店舗1〜3の商品3,4の日次売上データ
  13. 13. データの作成 ①:商品1の月次売上データ
  14. 14. データの作成 ②:商品1,2の月次売上データ メッセージライン
  15. 15. データの作成 ③:店舗1〜3の商品3,4の日次売上データ メッセージライン
  16. 16. AGENDA n 自己紹介 n ggplot2によるデータの可視化 n ggplot2とは n 棒グラフ n 折れ線グラフ n 散布図 n ヒストグラム n 箱ひげ図
  17. 17. 基本的な棒グラフ
  18. 18. 背景色の変更 背景色を白にしたい
  19. 19. 背景色の変更(Rコード) theme_bw関数を使う
  20. 20. 背景色の変更(結果)
  21. 21. 軸ラベル・タイトルの変更 軸ラベルやタイトルを日本語にしたい
  22. 22. 軸ラベル・タイトルの変更(Rコード) xlab、ylab、ggtitle関数を使う
  23. 23. 軸ラベル・タイトルの変更(結果)
  24. 24. 数字フォーマットの変更 y軸の数字をカンマ区切りにしたい
  25. 25. 数字フォーマットの変更(Rコード) scalesパッケージのcomma関数を使う
  26. 26. 数字フォーマットの変更(結果)
  27. 27. テキストの追加 棒グラフの上に数字を載せたい
  28. 28. テキストの追加(Rコード) geom_text関数を使う
  29. 29. テキストの追加(結果)
  30. 30. 追加的ストの加工 テキスト(数字)をカンマ区切りにしたい
  31. 31. 追加的ストの加工(Rコード) scalesパッケージのcomma関数を使う
  32. 32. 追加的ストの加工(結果)
  33. 33. 積み上げ棒グラフの作成 積み上げ棒グラフを作りたい
  34. 34. 積み上げ棒グラフの作成(Rコード) fillオプションにグループとなる変数を指定する
  35. 35. 積み上げ棒グラフの作成(結果)
  36. 36. 色セットの変更 棒の色セットを変更したい
  37. 37. 色セットの変更(パレットの確認) RColorBrewerパッケージ
  38. 38. 色セットの変更(パレットの確認) display.brewer.all関数でパレットを確認
  39. 39. 色セットの変更(Rコード) scale_fill_brewer関数を使う
  40. 40. 色セットの変更(結果)
  41. 41. 棒に枠をつける 棒に枠をつけたい
  42. 42. 棒に枠をつける(Rコード) colオプションに枠色を指定する
  43. 43. 棒に枠をつける(結果)
  44. 44. 100%積み上げ棒グラフの作成 100%積み上げ棒グラフを作りたい
  45. 45. 100%積み上げ棒グラフ (Rコード) positionオプションにfillを指定する
  46. 46. 100%積み上げ棒グラフ (結果)
  47. 47. 棒を水平に並べる 棒を水平に並べたい
  48. 48. 棒を水平に並べる (Rコード) positioinオプションにdodgeを指定する
  49. 49. 棒を水平に並べる (結果)
  50. 50. AGENDA n 自己紹介 n ggplot2によるデータの可視化 n ggplot2とは n 棒グラフ n 折れ線グラフ n 散布図 n ヒストグラム n 箱ひげ図
  51. 51. 折れ線グラフの作成 折れ線グラフを作りたい
  52. 52. 折れ線グラフの作成 (Rコード) geom_line関数を使う
  53. 53. 折れ線グラフの作成 (結果)
  54. 54. y軸の範囲指定 y軸の範囲を指定したい
  55. 55. y軸の範囲指定 (Rコード) scale_y_continuous関数の limitsオプションを使う
  56. 56. y軸の範囲指定 (結果)
  57. 57. 点の追加 折れ線グラフに点を追加したい
  58. 58. 点の追加 (Rコード) geom_point関数を追加する
  59. 59. 点の追加 (結果)
  60. 60. 折れ線グラフのグループ化 グループごとの折れ線グラフを作りたい
  61. 61. 折れ線グラフのグループ化 (Rコード) groupとcolオプションに グループとなる変数を指定する
  62. 62. 折れ線グラフのグループ化 (結果)
  63. 63. 線の種類の変更 グループごとに線の種類を変えたい
  64. 64. 線の種類の変更 (Rコード) ltyオプションにグループとなる変数を指定
  65. 65. 線の種類の変更 (結果)
  66. 66. AGENDA n 自己紹介 n ggplot2によるデータの可視化 n ggplot2とは n 棒グラフ n 折れ線グラフ n 散布図 n ヒストグラム n 箱ひげ図
  67. 67. 散布図の作成 散布図を作りたい
  68. 68. 散布図の作成 (Rコード) geom_point関数を使う
  69. 69. 散布図の作成 (結果)
  70. 70. 色と形の変更 グループごとに色と形を変えたい
  71. 71. 色と形の変更 (Rコード) colとshapeオプションに グループとなる変数を指定する
  72. 72. 色と形の変更 (結果)
  73. 73. 回帰直線の追加 回帰直線を追加したい
  74. 74. 回帰直線の追加 (Rコード) geom_smooth関数を使う
  75. 75. 回帰直線の追加 (結果)
  76. 76. グループ別回帰直線 グループごとに回帰直線を引きたい
  77. 77. グループ別回帰直線 (Rコード) グループ化してgeom_smooth関数を使う
  78. 78. グループ別回帰直線 (結果)
  79. 79. AGENDA n 自己紹介 n ggplot2によるデータの可視化 n ggplot2とは n 棒グラフ n 折れ線グラフ n 散布図 n ヒストグラム n 箱ひげ図
  80. 80. ヒストグラムの作成 ヒストグラムを作りたい
  81. 81. ヒストグラムの作成 (Rコード) geom_histogram関数を使う
  82. 82. ヒストグラムの作成 (結果)
  83. 83. 色の変更 棒を白抜きにしたい
  84. 84. 色の変更 (Rコード) colオプションとfillオプションで 線と棒の色を指定する
  85. 85. 色の変更 (Rコード)
  86. 86. ビン幅の変更 棒の幅を変更したい
  87. 87. ビン幅の変更 (Rコード) binwidthオプションを使う
  88. 88. ビン幅の変更 (結果)
  89. 89. AGENDA n 自己紹介 n ggplot2によるデータの可視化 n ggplot2とは n 棒グラフ n 折れ線グラフ n 散布図 n ヒストグラム n 箱ひげ図
  90. 90. 箱ひげ図の作成 箱ひげ図を作りたい
  91. 91. 箱ひげ図の作成 (Rコード) geom_boxplot関数を使う
  92. 92. 箱ひげ図の作成 (結果)
  93. 93. AGENDA n 自己紹介 n ggplot2によるデータの可視化 n ggplot2とは n 棒グラフ n 折れ線グラフ n 散布図 n ヒストグラム n 箱ひげ図
  94. 94. 参考 ■書籍 ・戦略的データマイニング (シリーズ Useful R 4) - http://amzn.to/1otigKO 第1章 序論 第2章 データ加工 第3章 データ可視化 第4章 問題発見 第5章 問題解決:意思決定支援 第6章 問題解決:自動化・最適化 第7章 効果測定 付録A R/RStudioの導入 ■Rコードと実行結果 ・TokyoR#42 データの可視化(ggplot2) - http://rpubs.com/yokkuns/27108
  95. 95. Enjoy!

×