Your SlideShare is downloading. ×

R_note_01_ver1.1

156

Published on

R note version 1.1 by S. Kume...

R note version 1.1 by S. Kume...

Published in: Education
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total Views
156
On Slideshare
0
From Embeds
0
Number of Embeds
1
Actions
Shares
0
Downloads
0
Comments
0
Likes
0
Embeds 0
No embeds

Report content
Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
No notes for slide

Transcript

  • 1. R note on Mac OS X Satoshi Kume, Ph.D. 140729 ver 1.1 「R」 とは? データマイニング(※)、統計計算、およびグラフィックスのための言語・環境である。 多様な統計手法(線形・非線形モデル・古典的統計検定・時系列解析・判別分析など) とグラフィックスを提供し、広汎な拡張が可能である。 ※ データマイニング: 大量のデータを解析し、そのデータの中から情報(相関関係やパターンなど)を 抽出する技法や方法論のこと。 http://www.r-project.org/ index.html 1.「R」のダウンロード・インストール
  • 2. 2.「R」の起動 右のような「Rコンソール」が表示される 3. Rの基本法則 ・ 計算式内に、空白があっても無視される。 ・ セミコロン(;)で複数行を連結が可能。 ・ ESCで、式の途中入力をキャンセルする。 > getwd() # 作業ディレクトリの確認 > dir() # 作業ディレクトリのファイル表示 > setwd(“/Users/home/Desktop/test”) # 作業ディレクトリの変更 (追記) Menu " その他 " 作業ディレクトリの変更... でも可能。 > ?dir() # dir()のヘルプを表示 4. 基本的な R コマンド(1)
  • 3. 5. 基本的な R コマンド(2) > x <- 2 # 変数xに代入する > x # 変数x内の表示 [1] 2 > (x <- 3.22) # 代入・表示を同時に行う [1] 3.22 > print(x) # オブジェクトの表示 [1] 3.22 > str(x) # オブジェクトの情報付き表示 num 3.22 # num: 実数 6. 基本的な演算関数 > + # 足し算 > - # 引き算 > * # 掛算 > / # 割り算 > ^ # 累乗 > sqrt(x) # 平方根 > abs(x) # 絶対値 > round(x, digits = 1) # 小数点第一位で四捨五入 > trunc(x) # 整数の出力 > exp(x) # 指数関数 > log(x) # 自然対数 > log10(x) # 常用対数 > sin(x) # sin関数 > cos(x) # cos関数
  • 4. 7. 基本的なベクトル関数 > z <- c(1, 2, 3, 4, 5) #「ベクトル」として変数zに代入する # c() : 数字を成分とするベクトルをつくる。「c」は、concatenateの頭文字。 > z [1] 1 2 3 4 5 > summary(z) # データの要約統計量 Min. 1st Qu. Median Mean 3rd Qu. Max. 1 2 3 3 4 5 > table(z) # 度数集計した表の表示 z 1 2 3 4 5 1 1 1 1 1 > length(z) # 成分数の表示 > sum(z) # 総和の算出 > mean(z) # 平均値の算出 > median(z) # 中央値の算出 > var(z) #不偏分散の算出 > sd(z) # 標準偏差の算出 > max(z) # 最大値の算出 > min(z) #最小値の算出
  • 5. > z[3] # ベクトル内の3番目を選択・表示する [1] 3 > z[-3] # ベクトル内の3番目以外を選択・表示する [1] 1 2 4 5 > z[3] <- NA # zの3番目にNA(欠損値)を代入する > z [1] 1 2 NA 4 5 > (z1 <- na.omit(z)) # na.omit(): NA or NAを含む行を削除する関数 [1] 1 2 4 5 attr(,"na.action") [1] 3 attr(,"class") [1] "omit" 8. ベクトル操作 (1)
  • 6. 9. ベクトル操作 (2) > head(y <- rnorm(10000)) # rnorm(): 正規分布に従う乱数生成関数 # head(): 変数の先頭だけ表示、default = 6個 [1] -0.6443054 -0.1996644 0.3180832 -0.2864285 0.4732518 1.4134141 > mean(y); var(y) #「;」 複数行を繋げられる [1] -0.007418862 # rnorm()関数は、平均 0 分散 1 に近似される [1] 0.9759483 > z <- c(1, 2, 3, 4, 5) > z <= 3 # 「3」以下の場合、TRUEを返す [1] TRUE TRUE TRUE FALSE FALSE > z >= 3 # 「3」以上の場合、TRUEを返す [1] FALSE FALSE TRUE TRUE TRUE > z == 3 # 「3」と一致する場合、TRUEを返す [1] FALSE FALSE TRUE FALSE FALSE
  • 7. 10. データの読み込み・保存 # データの保存 > write.table(data, file="出力パス", append=FALSE, col.names=TRUE) (追記1)append=TRUE: ファイルの行方向に追記する (追記2)col.names=FALSE: 列名を出力しない # CSVファイル(カンマ区切り)の読み込み(データフレームとして読み込まれる) > data <- read.table(“test.csv”, header= TRUE, sep=”,”) (追記1)header= TRUE: 列名がある場合、sep=: データ間の区切り指定 (追記2)skip=1: 1行目を読み飛ばす (追記3)check.names = FALSE: 文字列をそのまま読み込む (追記4)fill = TRUE: 空欄に「NA」を代入する(default)      ※ NA: Rのデフォルト欠損値コーディング >str(data) # オブジェクトの情報付き表示 (ベクトルとして読み込み) > data <- scan("data.txt") # ベクトルとして読み込み
  • 8. 11. データの変換 data.vector <- as.vector(data) # ベクトルに変換 data.matrix <- as.matrix(data) # 行列に変換 data.array <- as.array(data) # 配列に変換 data.list <- as.list(data) # リストに変換 data.frame <-as.data.frame(data) # データフレームに変換 12. Rエディタの使い方(基本的にプログラムはエディタに書く!) 1. Menu ファイル 新しいスクリプト プログラムを書く 2. スクリプトの選択 3. Menu 編集 カーソル行または選択中のRコードを実行 (スクリプトの保存) 4. Menu ファイル 別名で保存 (追記 拡張子は、”.R”とする)

×