Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

TokyoR#31 初心者セッション

9,452 views

Published on

TokyoR#31 初心者セッション

  • Be the first to comment

TokyoR#31 初心者セッション

  1. 1. 初心者セッション1
  2. 2. •  所沢義男(ところさわ よしお)•  社内SEやってます•  最近興味あるのはAHPです実名主義
  3. 3. •  Rの入門資料は充実したものがweb上にたくさんあります。•  インストールの仕方、チュートリアルはそちらを見てください。– slideshareというサイトに資料が沢山– @masaha03  「はじめてのR」– これまでのTokyo.R  「初心者セッション資料」いきなりですが
  4. 4. じゃあ今回は何するの•  チュートリアルと、今回のTokyoRの本編の間をつなげられればと思います。•  本編で喋っている人たちが最低限持っている知識の共有を図ります。
  5. 5. 本日の発表• Rを使った分析の流れ• エディタ• 情報収集• さあやってみよう• まとめ
  6. 6. 本日の発表• Rを使った分析の流れ• エディタ• 情報収集• さあやってみよう• まとめ
  7. 7. Rを使った分析の流れ• 入力• 分析• 出力
  8. 8. 入力•  データの読み込み– 組み込み関数• read.table  read.csv…– 外部パッケージを使う• Excel• 画像ファイル•  データ構造– データフレームがメイン
  9. 9. 分析•  分析の前処理– データの結合  merge,  rbind,  cbind– データの抽出  subset•  分析– 各種手法の適用• ここで外部パッケージを使うことが多い• 便利パッケージの紹介は本編で!!!
  10. 10. 出力•  ファイル出力– テキスト、Excel…•  図– 組み込みのplot– 外部パッケージ• lattice• ggplot2•  レポーティング– knitr,  slidify– Rpubs
  11. 11. 繰り返しますが@masaha03はじめての「R」超オススメです
  12. 12. 本日の発表• Rを使った分析の流れ• エディタ• 情報収集• さあやってみよう• まとめ
  13. 13. エディタ•  RGUI•  RStudio– 最近定番になりつつある。超便利。メモリ食う。•  ESS– Emacs。使ったことないけど歴史もあり評判良い。•  EZR– 医学系で流行りつつある。•  Rzパッケージ– SPSSの使いやすさをRで根こそぎ実現。– さっきの@masaha03さんが作った。
  14. 14. 個人的にはRStudioオススメ
  15. 15. 本日の発表• Rを使った分析の流れ• エディタ• 情報収集• さあやってみよう• まとめ
  16. 16. 情報収集• 検索• webの資料• 書籍• 勉強会
  17. 17. 情報収集-検索•  seekR– 検索泣かせの「R」に舞い降りた救世主。– 中の人の解説はこの後すぐ!!•  Rseek– 英語の救世主
  18. 18. 情報収集-webの資料•  各種勉強会(後述)の資料まとめ•  R-tips•  Rjpwiki•  同志社大学 金明哲先生•  群馬大学 青木繁伸先生
  19. 19. 情報収集-書籍•  作業ディレクトリ何それという人向け– Rによるデータプログラミング入門•  他プログラミング言語の経験あり– R言語逆引きハンドブック– Rによるデータサイエンス– Rパッケージガイドブック•  データ分析自体不慣れ– データ解析のための統計モデリング入門– データマイニング入門
  20. 20. 情報収集-勉強会:R関係•  Tsukuba.R•  Nagoya.R•  Osaka.R•  Yamadai.R•  HiRoshima.R•  Japan.R•  Tokyo.lang.R•  Tokyo.lang.R•  ゼロから始めるR言語勉強会•  Wako.R←New!•  TokyoR女子部←New!
  21. 21. Wako.R•  来週土曜(6/8)開催•  今会いに行けるR界のアイドル@dritoshiサン•  Tsukuba.Rが休止状態の今、Rで尖ったプレゼンを聞きたいならここに行くしかない•  世界に誇る理化学研究所の見学もできるよWako.R 検索
  22. 22. で、TokyoR女子部ですよ
  23. 23. ※これはOsaka.R女子部
  24. 24. TokyoR女子部•  女子による女子のためのR勉強会•  Osaka.R女子部の実績をもつ•  @nanaya_sacさんが主催(予定)•  たぶん7月以降
  25. 25. 気になる人はtwitterで@nanaya_sacを今すぐフォロー
  26. 26. 情報収集-勉強会:関連勉強会•  Tokyowebmining– 充実した発表及び議論、そして定評のある主催者の自己紹介•  Zansa(残差)– ガチで意識も技術力も高い大学生たち•  集合知プログラミング勉強会– 今すぐフォローしたい分析野郎  @tetsuroito  主催
  27. 27. 情報収集-勉強会:分野別•  さくさくテキストマイニング•  おしゃれStatistics•  心理・医学系研究者のためのデータ解析環境Rによる統計学の研究会– 医療経済研究機構  奥村泰之先生•  社会科学研究のためのR勉強会– 東北学院大学  鈴木努先生
  28. 28. 情報収集-勉強会:統数研•  統計数理研究所の公開講座– 非常に安価で質の高い統計講座を受講できる– Rのデータ操作については前提知識として要求される•  統計数理研究所の研究集会– Rユーザー会の草分け的存在– 年に1回11月頃
  29. 29. みんな同じ分析をしている仲間に飢えてるので興味があったら会場でコンタクトとってみるといいです
  30. 30. あとR逆引き本と統数研の公開講座まじオススメ
  31. 31. 本日の発表• Rを使った分析の流れ• エディタ• 情報収集• さあやってみよう• まとめ
  32. 32. さあやってみよう•  やりたいことがある人はそれでOK– cran  task  view•  目的別に外部パッケージがまとめられている– Rで学ぶデータサイエンスシリーズ(全20巻)•  目的に近い内容の巻を選んでサンプルを動かしてみる
  33. 33. それRじゃなくてもできるよ•  Julia– Rに我慢ならなくなった人々が作り始めた次世代統計言語•  驚異のPython勢– pandas:RのデータフレームをPythonで– Bokeh:ggplot2ライクな可視化– scikit-learn:機械学習– Orange:統計・機械学習•  Jubatus– 分散したデータを常に素早く深く分析する
  34. 34. まだちょっと何していいか…•  面白そうなデータを見つける– UFO目撃情報•  シナリオにそって手を動かしてみる– Rによるデータマイニング入門  (書籍)– CodeIQ  (練習問題、添削付き)•  コンテスト– kaggle– Crowdsolving
  35. 35. まずは使ってみてやりたいことを不完全でもいいからやってみてそしてぜひ発表しましょう
  36. 36. まとめ•  林真広  「はじめてのR」は名著•  Rじゃない方が目的に沿っている可能性もあるのでエンジニアの方は要検討。•  TokyoRは発表者を大募集しています!!!
  37. 37. enjoy!!!

×