Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

RとPythonによるデータ解析入門

75,299 views

Published on

  • Be the first to comment

RとPythonによるデータ解析入門

  1. 1. 第31回R勉強会@東京(#TokyoR)RとPythonによるデータ解析入門@gepuro
  2. 2. ブログ: http://blog.gepuro.net
  3. 3. 今日は、Pythonの話をしに来ました。* Tokyo.Scipyの人ではありません。
  4. 4. 先日、こんな本が出版されました中身は、まだ読んでいません。http://www.oreilly.co.jp/books/9784873116150/
  5. 5. 目次をみると● 武器と防具の装備● いざマトリックスへ● 8つの魔法の習得● オフィスとトイレの関係● ランチタイムの経済学者になる方法● メールから自分を発見する● 心臓の鼓動● 鳥の群れを表現する● お金と性別と進化
  6. 6. 面白そう目次しか見ていませんが、実際のデータ分析例が書かれているので、勉強になりそうです。
  7. 7. 今日のタイトルは、RとPythonによるデータ解析入門です。
  8. 8. R Python [検索]
  9. 9. 検索でヒットしたhttp://www.okada.jp.org/RWiki/?Python%20%A4%C7%A1%A1R
  10. 10. rpy2PythonからRを呼び出すことが出来る!
  11. 11. 僕が感じるメリット● webのクローラを書く● データベースを操作● 文字列処理● などが楽になる● RとPythonの両方を覚える必要がある。● Pythonで保持しているデータをRに渡す必要僕が感じるデメリット
  12. 12. scikit-learnが物足りない!?scikit-learn(Pythonの機械学習ライブラリ)には、たくさんのモデルが実装されているけど、R言語には敵わない!?
  13. 13. scikit-learnhttp://scikit-learn.org/stable/ワクワクするグラフがたくさんあります!
  14. 14. データ操作はPandasでRでいうデータフレームがPythonで使えます!
  15. 15. scikit-learnとPandas良い組み合わせだと思います。実際に試してみて、便利さを感じました。
  16. 16. Rでの処理csv→前処理→機械学習
  17. 17. よくある分析webからデータ取得→csvに整形→前処理→機械学習全部をRでやりますか?
  18. 18. こんな人がいるのでは?●Perl,Ruby,Pythonとかでデータを集めて、●整形して●Rを使う。awkを使うことも。
  19. 19. 全部を一つの言語からやりたいPythonを使って、awkを使って、Rを使う。
  20. 20. それ、rpy2で出来ますよ●Pythonならwebからのデータ取得も楽々●Pandasで、データフレームを●機械学習は、rpy2でRに任せる
  21. 21. rpy2PythonからRを呼び出すことが出来る!大事な事なので二回言いました
  22. 22. インストールpip install rpy2簡単ですね。
  23. 23. 使用方法http://www.okada.jp.org/RWiki/?Python%20%A4%C7%A1%A1R#nb4e7b5b
  24. 24. 簡単ですね● importして● robjects.r(’関数名)で呼び出して● robjects.FloatVector()で値を渡して● rmean(vec)で実行する
  25. 25. R言語を自在に● robjects.r(“lm”)とすれば、R言語のlm()が使える。● robjects.r(“summary”)も出来る。● plot()の仕方は調べてます。良い方法がありましたら、教えて下さい!!
  26. 26. pandasを使っても●data["変数名"]のようにして、robejectsに渡せます。●numpyからでも大丈夫pandasの中身はnumpyです。
  27. 27. R言語を自在に● robjects.r(“lm”)とすれば、R言語のlm()が使える。● robjects.r(“summary”)も出来る。● plot()の仕方は調べてます。良い方法がありましたら、教えて下さい!!
  28. 28. library(“hogehoge”)●robjects.r(“””library(“MASS”)”””)ってやったら出来た。●もっとスマートな方法がある気がする。これで、stepAIC()も使えるようになるね。
  29. 29. とにかくrpy2を使ってみる
  30. 30. pandasの話もしたいhttp://www.slideshare.net/gepuro/intoroduction-of-pandas-with-python昔、しました。
  31. 31. ご清聴ありがとうございました

×