RとPythonによるデータ解析入門

42,069 views
50,754 views

Published on

0 Comments
87 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
42,069
On SlideShare
0
From Embeds
0
Number of Embeds
18,807
Actions
Shares
0
Downloads
0
Comments
0
Likes
87
Embeds 0
No embeds

No notes for slide

RとPythonによるデータ解析入門

  1. 1. 第31回R勉強会@東京(#TokyoR)RとPythonによるデータ解析入門@gepuro
  2. 2. ブログ: http://blog.gepuro.net
  3. 3. 今日は、Pythonの話をしに来ました。* Tokyo.Scipyの人ではありません。
  4. 4. 先日、こんな本が出版されました中身は、まだ読んでいません。http://www.oreilly.co.jp/books/9784873116150/
  5. 5. 目次をみると● 武器と防具の装備● いざマトリックスへ● 8つの魔法の習得● オフィスとトイレの関係● ランチタイムの経済学者になる方法● メールから自分を発見する● 心臓の鼓動● 鳥の群れを表現する● お金と性別と進化
  6. 6. 面白そう目次しか見ていませんが、実際のデータ分析例が書かれているので、勉強になりそうです。
  7. 7. 今日のタイトルは、RとPythonによるデータ解析入門です。
  8. 8. R Python [検索]
  9. 9. 検索でヒットしたhttp://www.okada.jp.org/RWiki/?Python%20%A4%C7%A1%A1R
  10. 10. rpy2PythonからRを呼び出すことが出来る!
  11. 11. 僕が感じるメリット● webのクローラを書く● データベースを操作● 文字列処理● などが楽になる● RとPythonの両方を覚える必要がある。● Pythonで保持しているデータをRに渡す必要僕が感じるデメリット
  12. 12. scikit-learnが物足りない!?scikit-learn(Pythonの機械学習ライブラリ)には、たくさんのモデルが実装されているけど、R言語には敵わない!?
  13. 13. scikit-learnhttp://scikit-learn.org/stable/ワクワクするグラフがたくさんあります!
  14. 14. データ操作はPandasでRでいうデータフレームがPythonで使えます!
  15. 15. scikit-learnとPandas良い組み合わせだと思います。実際に試してみて、便利さを感じました。
  16. 16. Rでの処理csv→前処理→機械学習
  17. 17. よくある分析webからデータ取得→csvに整形→前処理→機械学習全部をRでやりますか?
  18. 18. こんな人がいるのでは?●Perl,Ruby,Pythonとかでデータを集めて、●整形して●Rを使う。awkを使うことも。
  19. 19. 全部を一つの言語からやりたいPythonを使って、awkを使って、Rを使う。
  20. 20. それ、rpy2で出来ますよ●Pythonならwebからのデータ取得も楽々●Pandasで、データフレームを●機械学習は、rpy2でRに任せる
  21. 21. rpy2PythonからRを呼び出すことが出来る!大事な事なので二回言いました
  22. 22. インストールpip install rpy2簡単ですね。
  23. 23. 使用方法http://www.okada.jp.org/RWiki/?Python%20%A4%C7%A1%A1R#nb4e7b5b
  24. 24. 簡単ですね● importして● robjects.r(’関数名)で呼び出して● robjects.FloatVector()で値を渡して● rmean(vec)で実行する
  25. 25. R言語を自在に● robjects.r(“lm”)とすれば、R言語のlm()が使える。● robjects.r(“summary”)も出来る。● plot()の仕方は調べてます。良い方法がありましたら、教えて下さい!!
  26. 26. pandasを使っても●data["変数名"]のようにして、robejectsに渡せます。●numpyからでも大丈夫pandasの中身はnumpyです。
  27. 27. R言語を自在に● robjects.r(“lm”)とすれば、R言語のlm()が使える。● robjects.r(“summary”)も出来る。● plot()の仕方は調べてます。良い方法がありましたら、教えて下さい!!
  28. 28. library(“hogehoge”)●robjects.r(“””library(“MASS”)”””)ってやったら出来た。●もっとスマートな方法がある気がする。これで、stepAIC()も使えるようになるね。
  29. 29. とにかくrpy2を使ってみる
  30. 30. pandasの話もしたいhttp://www.slideshare.net/gepuro/intoroduction-of-pandas-with-python昔、しました。
  31. 31. ご清聴ありがとうございました

×