Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Rプログラミング01 はじめの一歩

503 views

Published on

統計環境Rの概要と、変数の型と構造について
(デモコードあり)

Published in: Education
  • Be the first to like this

Rプログラミング01 はじめの一歩

  1. 1. 2015/10/24
  2. 2. 目 次 1. 統計環境Rについて 2. なぜRを使うのか 3. Rのインストール 4. ユーザインタフェース 5. Rの起動と終了 6. 変数の作り方 7. 主なデータの型、その検査と変換 8. データの構造(オブジェクト型) 9. 因子について 10. パッケージについて 11. 困ったとき その1、その2 12. さらに学ぶために 2
  3. 3. 演 習 一 覧 [演習1] まず電卓として使ってみよう [演習2] 様々なデータ型の変数を作ってみよう [演習3] 計算ができないデータ型はどれ? [演習4] 様々な構造の変数を作ってみよう 3 ※ デモコードあり
  4. 4. 1. 統計環境Rについて • S言語とほぼ互換の統計計算とグラフィッ クのためのオープンソースのフリーソフト ウェア • 著作権は放棄されていない(コピーレフト) • ユーザはこれを実行し、複製し、修正し、 再配布できるが、その再配布物のライセン スに制限を加えることはできない ライセンス: GNU GPL(General Public License: 一般公衆利用許諾契約書) http://www.opensource.jp/gpl/gpl.ja.html (和訳) 4
  5. 5. 2. なぜRを使うのか • 費用がかからない • プラットフォーム(Win/Mac/Linux)を選ば ない • 利用目的の制限などがない • 巨大なユーザーコミュニティと膨大なライブ ラリ群を活用できる ⇒ たいていの統計手法は誰かがライブラリ を作って公開し、さらに誰かが使い方をど こかに解説していることが多い • 細かいカスタマイズが可能な美しいグラ フィック機能がある 5
  6. 6. 3. Rのインストール • ソフトウェアのダウンロード 以下のサイトから最新版をダウンロード The R Project.org https://www.r-project.org/index.html ※ 8/14現在で最新バージョンは3.2.2 • インストール Rjpwikiのインストールページを参照 http://www.okadajp.org/RWiki/?R%20%E3%81%AE%E3%82%A4%E3% 83%B3%E3%82%B9%E3%83%88%E3%83%BC%E3%83%AB 6
  7. 7. [補足] 32bit版と64bit版について • CPUが64bitのPCで、64bit版のOSを使 う場合はRの32bit版と64bit版はどち らもインストールすれば稼動する • 使用したいパッケージが32bit版しか ない、あるいは古いコードを使いた いという特殊な場合を除き、上のよ うな場合は64bit版がお勧め 7
  8. 8. 4. ユーザインタフェース 「コンピュータと人とを橋渡しする仕組み」 • GUI (Graphical User Interface) OSの種類に関係なく、ウィンドウやアイコン などをマウスで操作して、キーボードで文字入 力を行う種類の仕組みで、視覚的な操作ができ 簡単という利点がある • CUI (Character User Interface) キーボード入力と画面の文字表示でコン ピュータを操作する仕組み。コマンドを知らな いと操作できないが、少し複雑な処理や類似処 理の繰り返しなどの作業効率が高い。 8
  9. 9. CUI の例DOS画面 WindowsのPowerShell画面 Rの画面 9 コマンドがわからな ければ使えない! でも慣れれば作業 効率が高いよ
  10. 10. • 起動はデスクトップのアイコン をクリック • 終了は、プロンプト > に続いて q() と入力する か、メニューバーから「ファイル」⇒「終了」 を選択し、表示される次の質問ダイアログで 「いいえ」を選択 5. Rの起動と終了 10
  11. 11. [演習1] まず電卓として使ってみよう! 11
  12. 12. 6. 変数の作り方 • 英数字、ピリオド(.)、アンダースコア (_)を組み合わせて作る • 大文字・小文字は区別される • 変数名には日本語も使用可能(非推奨) • 数字とアンダースコアを変数名の冒頭に することはできない • 以下の記号は変数名に使用不可 ?, $, %, ^, &, *, (, ), -, #, ?, , , <, >, /, |, , [ ,] ,{ ,}; 12
  13. 13. 変数は <- で値を与える(付値) a <- 10 b <- rep(1, times=5) c <- 1:10 d <- seq(1, 10, by=2) b # ただ変数名を打てば内容が表示される #括弧で囲むと付値の結果を表示する (e <- rep(c(1, 3, 4), times=3)) 13 変数に何を与えるかで、その変数の型や構造が決まる ※ # 以降はコメント扱い
  14. 14. 7. 主なデータ型、その検査と変換 変数のデータ型はmode()で調べられる • 実数 (numeric) ※ 倍精度浮動小数点 [is.numeric() / as.numeric()] • 整数(integer) [is. integer() / as. integer()] • 文字 (character) [is.character() / as.character()] • 論理値 (logical) : TrueとFalseのニ値 [is.logical() / as.logical()] 14
  15. 15. [演習2] 様々なデータ型の変数を作ってみよう! 15
  16. 16. [演習3] 計算ができないデータ型はどれ? 16
  17. 17. 8. データの構造(オブジェクト型) • ベクトル(vector) 一次元 [ is.vector() / as.vector() ] • 行列(matrix) 二次元 [ is.matrix() / as.matrix() ] • 配列(array) 三次元以上 [ is.array() / as.array() ] • リスト(list) 関数の戻り値 [ is.list() / as.list() ] • データフレーム(data frame) [ is.data.frame() / as.data.frame() ] 17
  18. 18. データ構造のイメージ a) ベクトル b) 行列 c) 配列 d) データフレーム e) リスト 18
  19. 19. [演習4] 様々な構造の変数を作ってみよう! 19
  20. 20. 関数 cbind, rbind • cbindは行列を縦に、rbindは横にくっつける cbind: + → rbind: + → ※ Rのベクトルは横に並べて表示されるが縦ベクトル
  21. 21. 9. 因子 (factor)について • 性別や血液型などのカテゴリ変数を効率良 く保存・表示することができるデータのク ラス • 文字のようだが引用符はつかず、実態は数 値として扱われるが、計算には使用できな い • 因子は複数の水準(level)から構成される • データ型と同様、is.factor() / as.factor() で確認や型変換ができる 21
  22. 22. > y <- factor(c("A", "AB", "A", "A", "B", "O", "O")) > y [1] A AB A A B O O Levels: A AB B O > mode(y) # データの保存型を確認 [1] “numeric” > class(y) # データのクラスは因子 [1] "factor" > str(y) # オブジェクト構造を確認 Factor w/ 4 levels "A","AB","B","O": 1 2 1 1 3 4 4 因子について (つづき) 22
  23. 23. 10. パッケージについて • パッケージ(package)とは、様々な機能を持つ関 数やデータをまとめたライブラリ • ユーザが独自に作成や公開をすることができる • CRANでは、一定基準を満たしたユーザ作成の 公認パッケージが公開されている • 公認パッケージ一覧 https://cran.r- project.org/web/packages/available_packages_by_n ame.html
  24. 24. パッケージのインストール方法 メニューバーの「パッケージ」⇒「パッケージのイ ンストール」⇒ CRANミラー選択画面から日本のどこ かを選択 ⇒ インストールしたいパッケージを選択 パッケージ一覧からzipファイルをダウンロードし、 メニューバーから「パッケージ」⇒「ローカルにあ るzipファイルからのパッケージのインストール」を 選択する 24
  25. 25. require("scatterplot3d") # ii)から z <- seq(-10, 10, 0.01) x <- cos(z) y <- sin(z) scatterplot3d(x, y, z, highlight.3d=TRUE, col.axis="blue", col.grid="cyan", main="螺旋の3Dプ ロット", pch=20) パッケージを使ってみよう i. scatterplot3dパッケージのzipファイルをダウ ンロードしてインストール ii. scatterplot3dパッケージをロード iii. 三次元データの作成とプロット 25
  26. 26. 11. 困ったとき、その1 • ヘルプ関数 help(関数名, package = パッケージ名) または?関数名 # ただし、ライブラリをロードないとそのパッケー ジの収録関数のヘルプは有効にならない • 関連関数とそのパッケージをリストアップ help.search("obs") # "obs"は任意の関数名 • パッケージの概要と関数一覧等 library( help = MASS ) # MASSパッケージの場合 • キーワードサーチ ※ インストール済みパッケージは全て考慮される apropos("norm") # キーワードでオブジェクト名から検索 help.search("LATEX") # キーワードでヘルプファイルから検索 26
  27. 27. 11. 困ったとき、その2 • Rjpwikiで単語検索 http://www.okadajp.org/RWiki/?cmd=search • Rのための検索エンジン SeekR http://seekr.jp/ 27
  28. 28. 12. さらに学ぶために ① Webサイトを活用する RjpWiki http://www.okada.jp.org/RWiki/ Rに関する情報交換を目的としたWikiサイト SeekR http://seekr.jp/ Rのための検索エンジン ② 良い参考書を入手する => 次スライド参照 ③ 身近に一緒に勉強できる仲間を作る ④ ③が難しければ地域の勉強会に顔を出してみる Japan.R2015 https://atnd.org/events/71243 12/5開催 Tokyo.R, Fukuoka.R, Kashiwa.R, Kobe.R, Nagoya.R, Okinawa.R, Osaka.r SappoRo.R, Shiga.R, Tsukuba.R, Yokohama.R などが存 在する 28
  29. 29. お勧め書籍 ■ The R Tips第2版 ―データ解析環境Rの基本 技・グラフィックス活用集― 舟尾暢男著、オーム社 http://estore.ohmsha.co.jp/titles/978427406783P ■ みんなのR データ分析と統計解析の新しい教科書 Jared P. Lander著、マイナビ出版 https://book.mynavi.jp/ec/products/detail/id=39763 ■ Rによるデータサイエンス データ解析の基礎から最新手法まで 金 明哲著、森北出版 http://www.morikita.co.jp/books/book/536 29

×