Uploaded on

R note version 1.1 by S. Kume...

R note version 1.1 by S. Kume...

More in: Education
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Be the first to comment
    Be the first to like this
No Downloads

Views

Total Views
133
On Slideshare
0
From Embeds
0
Number of Embeds
1

Actions

Shares
Downloads
0
Comments
0
Likes
0

Embeds 0

No embeds

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
    No notes for slide

Transcript

  • 1. R note on Mac OS X Satoshi Kume, Ph.D. 140729 ver 1.1 「R」 とは? データマイニング(※)、統計計算、およびグラフィックスのための言語・環境である。 多様な統計手法(線形・非線形モデル・古典的統計検定・時系列解析・判別分析など) とグラフィックスを提供し、広汎な拡張が可能である。 ※ データマイニング: 大量のデータを解析し、そのデータの中から情報(相関関係やパターンなど)を 抽出する技法や方法論のこと。 http://www.r-project.org/ index.html 1.「R」のダウンロード・インストール
  • 2. 2.「R」の起動 右のような「Rコンソール」が表示される 3. Rの基本法則 ・ 計算式内に、空白があっても無視される。 ・ セミコロン(;)で複数行を連結が可能。 ・ ESCで、式の途中入力をキャンセルする。 > getwd() # 作業ディレクトリの確認 > dir() # 作業ディレクトリのファイル表示 > setwd(“/Users/home/Desktop/test”) # 作業ディレクトリの変更 (追記) Menu " その他 " 作業ディレクトリの変更... でも可能。 > ?dir() # dir()のヘルプを表示 4. 基本的な R コマンド(1)
  • 3. 5. 基本的な R コマンド(2) > x <- 2 # 変数xに代入する > x # 変数x内の表示 [1] 2 > (x <- 3.22) # 代入・表示を同時に行う [1] 3.22 > print(x) # オブジェクトの表示 [1] 3.22 > str(x) # オブジェクトの情報付き表示 num 3.22 # num: 実数 6. 基本的な演算関数 > + # 足し算 > - # 引き算 > * # 掛算 > / # 割り算 > ^ # 累乗 > sqrt(x) # 平方根 > abs(x) # 絶対値 > round(x, digits = 1) # 小数点第一位で四捨五入 > trunc(x) # 整数の出力 > exp(x) # 指数関数 > log(x) # 自然対数 > log10(x) # 常用対数 > sin(x) # sin関数 > cos(x) # cos関数
  • 4. 7. 基本的なベクトル関数 > z <- c(1, 2, 3, 4, 5) #「ベクトル」として変数zに代入する # c() : 数字を成分とするベクトルをつくる。「c」は、concatenateの頭文字。 > z [1] 1 2 3 4 5 > summary(z) # データの要約統計量 Min. 1st Qu. Median Mean 3rd Qu. Max. 1 2 3 3 4 5 > table(z) # 度数集計した表の表示 z 1 2 3 4 5 1 1 1 1 1 > length(z) # 成分数の表示 > sum(z) # 総和の算出 > mean(z) # 平均値の算出 > median(z) # 中央値の算出 > var(z) #不偏分散の算出 > sd(z) # 標準偏差の算出 > max(z) # 最大値の算出 > min(z) #最小値の算出
  • 5. > z[3] # ベクトル内の3番目を選択・表示する [1] 3 > z[-3] # ベクトル内の3番目以外を選択・表示する [1] 1 2 4 5 > z[3] <- NA # zの3番目にNA(欠損値)を代入する > z [1] 1 2 NA 4 5 > (z1 <- na.omit(z)) # na.omit(): NA or NAを含む行を削除する関数 [1] 1 2 4 5 attr(,"na.action") [1] 3 attr(,"class") [1] "omit" 8. ベクトル操作 (1)
  • 6. 9. ベクトル操作 (2) > head(y <- rnorm(10000)) # rnorm(): 正規分布に従う乱数生成関数 # head(): 変数の先頭だけ表示、default = 6個 [1] -0.6443054 -0.1996644 0.3180832 -0.2864285 0.4732518 1.4134141 > mean(y); var(y) #「;」 複数行を繋げられる [1] -0.007418862 # rnorm()関数は、平均 0 分散 1 に近似される [1] 0.9759483 > z <- c(1, 2, 3, 4, 5) > z <= 3 # 「3」以下の場合、TRUEを返す [1] TRUE TRUE TRUE FALSE FALSE > z >= 3 # 「3」以上の場合、TRUEを返す [1] FALSE FALSE TRUE TRUE TRUE > z == 3 # 「3」と一致する場合、TRUEを返す [1] FALSE FALSE TRUE FALSE FALSE
  • 7. 10. データの読み込み・保存 # データの保存 > write.table(data, file="出力パス", append=FALSE, col.names=TRUE) (追記1)append=TRUE: ファイルの行方向に追記する (追記2)col.names=FALSE: 列名を出力しない # CSVファイル(カンマ区切り)の読み込み(データフレームとして読み込まれる) > data <- read.table(“test.csv”, header= TRUE, sep=”,”) (追記1)header= TRUE: 列名がある場合、sep=: データ間の区切り指定 (追記2)skip=1: 1行目を読み飛ばす (追記3)check.names = FALSE: 文字列をそのまま読み込む (追記4)fill = TRUE: 空欄に「NA」を代入する(default)      ※ NA: Rのデフォルト欠損値コーディング >str(data) # オブジェクトの情報付き表示 (ベクトルとして読み込み) > data <- scan("data.txt") # ベクトルとして読み込み
  • 8. 11. データの変換 data.vector <- as.vector(data) # ベクトルに変換 data.matrix <- as.matrix(data) # 行列に変換 data.array <- as.array(data) # 配列に変換 data.list <- as.list(data) # リストに変換 data.frame <-as.data.frame(data) # データフレームに変換 12. Rエディタの使い方(基本的にプログラムはエディタに書く!) 1. Menu ファイル 新しいスクリプト プログラムを書く 2. スクリプトの選択 3. Menu 編集 カーソル行または選択中のRコードを実行 (スクリプトの保存) 4. Menu ファイル 別名で保存 (追記 拡張子は、”.R”とする)