Rでピボットテーブル

13,733 views

Published on

0 Comments
40 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
13,733
On SlideShare
0
From Embeds
0
Number of Embeds
331
Actions
Shares
0
Downloads
0
Comments
0
Likes
40
Embeds 0
No embeds

No notes for slide

Rでピボットテーブル

  1. 1. TokyoR 初心者セッション Rでピボットテーブル @yokkuns 里 洋平 yohei0511@gmail.com 2013.01.26 第28回Tokyo.R2013年1月26日土曜日
  2. 2. AGENDA ■ 自己紹介 ■ ピボットテーブルって何? ■ Rでピボットテーブル ■ RStudioでHTMLレポート ■ デモ2013年1月26日土曜日
  3. 3. AGENDA ■ 自己紹介 ■ ピボットテーブルって何? ■ Rでピボットテーブル ■ RStudioでHTMLレポート ■ デモ2013年1月26日土曜日
  4. 4. 自己紹介 ◆ 里 洋平(@yokkuns) ◆ 元Webエンジニアのデータサイエンティスト ・今は主にマーケティング周りを見てる ◆ 統計解析やデータマイニングをビジネスに適用 ・時系列解析とか異常検知とか最適化とか ・いろんなモデルの構築2013年1月26日土曜日
  5. 5. 活動例: 勉強会の主催・執筆 Tokyo.R主催 パッケージ本執筆しました!2013年1月26日土曜日
  6. 6. 活動例: 動画レコメンド 閲覧されている動画の情報を用いておすすめ動画を表示する2013年1月26日土曜日
  7. 7. 活動例: 市場予測 Web上の情報から市場予測2013年1月26日土曜日
  8. 8. 活動例: 異常検知 Anomaly detection 複数時系列から異常な振る舞いを検知する C A 時系列のモデリング 複数時系列の異常検知 B 時系列A 時系列A 異常な振る舞い 時系列B 時系列C 時系列B 時系列C 異常な振る舞いの時系列を検出 例1:トラフィック異常検知 例2:CM効果のノイズ除去 トラフィックA ケースA CM効果 トラフィックB ケースB トラフィックC 調査 ケースC 異常な振る舞いをしている 異常な振る舞いをしているケースを トラフィックの原因を調査する 除外して、CMの効果を算出する 852013年1月26日土曜日
  9. 9. 活動例: 時系列解析と影響分析 TV Commercial Effects 時系列的な振る舞いの特徴から各KPIへのCMの影響度を算出 イベン CM時系列 ト 新規 登録 CM ARPP U ARPU 各KPIの時系列 その他 外部 継続率 要因 ケース 872013年1月26日土曜日
  10. 10. 新たな勉強会 TokyoApache.Pig https://groups.google.com/group/tokyo_apache_pig2013年1月26日土曜日
  11. 11. AGENDA ■ 自己紹介 ■ ピボットテーブルって何? ■ Rでピボットテーブル ■ RStudioでHTMLレポート ■ デモ2013年1月26日土曜日
  12. 12. Excelの最大の魅力:ピボットテーブル Excelには、ピボットテーブルという超強力な集計ツールがある マウスでポチポチっとやるだけで、簡単にクロス集計とか出来る Excel(エクセル)実用編:家計簿の作成(ピボットテーブルを使う) http://www.eurus.dti.ne.jp/yoneyama/Excel/jituyou/kake-pib.htm2013年1月26日土曜日
  13. 13. Excelの最大の魅力:ピボットテーブル Excelには、ピボットテーブルという超強力な集計ツールがある マウスでポチポチっとやるだけで、簡単にクロス集計とか出来る Excel(エクセル)実用編:家計簿の作成(ピボットテーブルを使う) http://www.eurus.dti.ne.jp/yoneyama/Excel/jituyou/kake-pib.htm2013年1月26日土曜日
  14. 14. Excelの最大の魅力:ピボットテーブル Excelには、ピボットテーブルという超強力な集計ツールがある マウスでポチポチっとやるだけで、簡単にクロス集計とか出来る Excel(エクセル)実用編:家計簿の作成(ピボットテーブルを使う) http://www.eurus.dti.ne.jp/yoneyama/Excel/jituyou/kake-pib.htm2013年1月26日土曜日
  15. 15. ピボットテーブルの課題2013年1月26日土曜日
  16. 16. ピボットテーブルの課題 簡単だけど手作業になるので再現性が担保出来ない2013年1月26日土曜日
  17. 17. ピボットテーブルの課題 簡単だけど手作業になるので再現性が担保出来ない いろんな軸で切ったグラフとかを一気に見たい時とか面倒2013年1月26日土曜日
  18. 18. ピボットテーブルの課題 簡単だけど手作業になるので再現性が担保出来ない いろんな軸で切ったグラフとかを一気に見たい時とか面倒 定常的に実行する事になったりすると面倒2013年1月26日土曜日
  19. 19. RとRStudioで解決 reshape2パッケージでピボットと同様に整形や集計が出来る HTML出力出来るので一気にグラフ見れるし、再現性も担保 さらにRを使った統計解析を実行出来る2013年1月26日土曜日
  20. 20. AGENDA ■ 自己紹介 ■ ピボットテーブルって何? ■ Rでピボットテーブル ■ RStudioでHTMLレポート ■ デモ2013年1月26日土曜日
  21. 21. 参考資料 @a_bicky さんによる素晴らしい資料があるので こちらもご確認下さい http://www.slideshare.net/abicky/r-101280902013年1月26日土曜日
  22. 22. Rでピボットテーブル: reshape2パッケージ ピボットテーブルと同じように整形や集約処理が出来る melt A variable value 1 B 100 A B C 1 100 300 1 C 300 2 200 400 cast 2 B 200 2 C 4002013年1月26日土曜日
  23. 23. reshape2パッケージ dcast関数とmelt関数の2つを用いてピボットテーブルを実現する dcast(data, formula, fun.aggregate = NULL, ..., margins = NULL, subset = NULL, fill = NULL, drop = TRUE, value.var = guess_value(data)) fourmula: 整形の形式 行となる変数 列となる変数 value.var: 集計対象となる変数 melt(data, id.vars, measure.vars,variable.name = "variable", ..., na.rm = FALSE,value.name = "value") id.vars: idになるカラム名 measure.vars: グループ変数になるカラム名2013年1月26日土曜日
  24. 24. Rでピボットテーブル: データの集計 行となる変数と列となる変数を指定して集約処理を行う 行~列 の形式で集約し 独自の関数を その合計を算出 指定する事も出来る2013年1月26日土曜日
  25. 25. Rでピボットテーブル: データの整形 横に並んでいるデータをカラム名をグループ変数として縦長に整形 melt2013年1月26日土曜日
  26. 26. AGENDA ■ 自己紹介 ■ ピボットテーブルって何? ■ Rでピボットテーブル ■ RStudioでHTMLレポート ■ デモ2013年1月26日土曜日
  27. 27. 参考資料 @wdkz さんによる素晴らしい資料があるので こちらもご確認下さい http://www.slideshare.net/wdkz/rstudio-138669582013年1月26日土曜日
  28. 28. RStudioの導入: インストール Rの総合開発環境(IDE) 補完機能だけでなくレポート出力なども手軽に出来る2013年1月26日土曜日
  29. 29. RStudioの導入: インストール http://www.rstudio.com/ からDownload Desktop版とServer版がある2013年1月26日土曜日
  30. 30. RStudioの導入: 画面構成 4分割の画面構成 (エディタ・コンソール・workspace・その他)2013年1月26日土曜日
  31. 31. RStudioの導入: エディタ画面 Ctrl+Enter(MacはCommand+Enter)で実行 範囲を指定しての実行も可能2013年1月26日土曜日
  32. 32. RStudioの導入: workspace 現在定義されている変数や関数が表示され、 クリックすると中身が見れる2013年1月26日土曜日
  33. 33. RStudioの導入: コンソール・その他 コンソールは通常のコンソールと同じ その他にはファイル一覧やplot時にはグラフが表示される2013年1月26日土曜日
  34. 34. RStudioの導入: Markdownでの記述 R Markdown形式で開発する事で データの解析手順と結果を1つのHTMLで出力出来る2013年1月26日土曜日
  35. 35. RStudioの導入: Markdownでの記述 Markdownとは、シンプルな記法による記述で 構造的に妥当なHTMLに変換するマークアップ言語2013年1月26日土曜日
  36. 36. RStudioの導入: Markdownでの記述 Markdownの記述例2013年1月26日土曜日
  37. 37. RStudioの導入: HTMLレポート出力 knitHTMLを押すだけでHTMLに変換 ローカル、またはサーバに保存する事が出来る2013年1月26日土曜日
  38. 38. AGENDA ■ 自己紹介 ■ ピボットテーブルって何? ■ Rでピボットテーブル ■ RStudioでHTMLレポート ■ デモ2013年1月26日土曜日
  39. 39. デモ2013年1月26日土曜日
  40. 40. AGENDA ■ 自己紹介 ■ ピボットテーブルって何? ■ Rでピボットテーブル ■ RStudioでHTMLレポート ■ デモ2013年1月26日土曜日
  41. 41. ご清聴ありがとうございました2013年1月26日土曜日

×