More Related Content Similar to 10min r study_tokyor25 Similar to 10min r study_tokyor25 (20) More from Nobuaki Oshiro (20) 10min r study_tokyor252. アジェンダ
●
自己紹介
● Rとは
● Rの導入
● Rの基本操作
● Rの情報源
●
まとめ
3. アジェンダ
●
自己紹介
● Rとは
● Rの導入
● Rの基本操作
● Rの情報源
●
まとめ
4. 自己紹介
●
名前:大城信晃
● Twitter:doradora09
● 職業:Webエンジニア
● R:たまに触る程度
– 最近Rを使ったのは120万行の
データをuniqにしてsort
– デスクトップ上のデータに対し
て作業するのには便利かも
●
趣味:
– カクテル作り再開しました
5. カクテル
max18本まで収納できることが判明
何本か持ってきたので懇親会でどうぞ
6. アジェンダ
●
自己紹介
● Rとは
● Rの導入
● Rの基本操作
● Rの情報源
●
まとめ
7. Rとは
統計用の言語(関数型言語)
無料で使える
9. 研究分野以外での実績は?
金融、マーケティング、ソーシャルゲーム
Googleやfacebookでも使われてます
GoogleとFacebookではRをどうやって使っているのか?
http://pracmper.blogspot.jp/2010/01/googlefacebookr.html
・Googleではデータ探索やモデルのプロトタイピングを行っていま
す。一般的にプロダクション(公開している製品の意味?)には使っ
ていません。デスクトップの環境だけです。
・(Googleでの)一般的な使い方は、1.他のツールでデータを抽
出 2.Rへインポート 3.Rで解析とモデリングを作成
4.PythonやC++ でモデリング結果をプロダクションへ実装
10. Rで利用できる解析手法紹介
2000程度のパッケージがあるので大抵の分析はできる
日本語の情報(wiki, 書籍, コミュニティ)も増えてきた
● 主成分分析/因子分析/対応分析
● 多次元尺度法/クラスター分析
● 自己組織化マップ/線形回帰分析
● 非線形回帰分析/線形判別分析
● 非線形判別分析 /生存分析/時系列
● 樹木モデル/ニューラルネットワーク
●
カーネル法とサポートベクターマシン
● 集団学習/アソシエーション分析
など
11. アジェンダ
●
自己紹介
● Rとは
● Rの導入
● Rの基本操作
● Rの情報源
●
まとめ
12. Rの導入
Windows, Mac, Linux版がある
困ったらrjpwikiでググっても出てくる
OS URL
http://cran.md.tsukuba.ac.jp/bin/wind
Windows
ows/base/
Mac, Linux http://cran.md.tsukuba.ac.jp/
13. Rの導入:連打
インストーラーを起動して連打
完了後Rアイコンをダブルクリックで起動
Rコンソール
14. Rの導入:Rコンソール
Rコンソール上で処理内容を記述していきます
エクセル等と比較するとプログラム言語色が強いです
ココに入力して
エンターで実行
15. アジェンダ
●
自己紹介
● Rとは
● Rの導入
● Rの基本操作
● Rの情報源
●
まとめ
16. Rの基本操作
●
四則演算
●
関数の利用
●
作図
●
変数
●
行列
●
行列の要素へのアクセス
●
関数の自作
●
パッケージ
●
ヘルプ
17. Rの基本操作:四則演算
基本的な演算
> 3+5 #足し算
[1] 8
> 10-3 #引き算
[1] 7
> 2*3 #掛け算
[1] 6
> 20/4 #割り算
[1] 5
>
> 5^2 #5の2乗
[1] 25
> 13 %% 5 #13を5で割った余り(剰余)
[1] 3
18. Rの基本操作:関数の利用
様々な関数が利用可能
> sum(10,20,30) #引数をすべて合計する
[1] 60
> sqrt(16) #16の平方根を求める
[1] 4
> date() #日付を表示
[1] "Fri May 25 09:48:09 2012"
20. Rの基本操作:変数
変数は値を格納する箱のようなもの
値の代入には <- (左向きの矢印の意味)を使う
> values <- c(10, 20, 30) #変数valuesに
値をセット
> values #変数名を書くと中身が見れる
[1] 10 20 30
> sum(values) #sum関数に変数を渡す
[1] 60
21. Rの基本操作:行列
行列型の変数も利用可能
> hawks <- matrix(c(173, 178, 189, 183, 182,
+ 17000, 14000, 9000, 50000, 30000), 5, 2)
> hawks #変数の中身確認(行列)
[,1] [,2]
[1,] 173 17000
[2,] 178 14000
[3,] 189 9000
[4,] 183 50000
[5,] 182 30000
22. Rの基本操作:行列の要素へアクセス
行列から指定した位置の値を取り出す
> hawks #行列全体を表示
[,1] [,2]
[1,] 173 17000
[2,] 178 14000
[3,] 189 9000
[4,] 183 50000
[5,] 182 30000
> hawks[1,] #1行目のデータにアクセス
[1] 173 17000
> hawks[,1] #1列目のデータにアクセス
[1] 173 178 189 183 182
> hawks[3,2] #3行2列目のデータにアクセス
[1] 9000
23. Rの基本操作:行列の要素へアクセス
行列から指定した位置の値を取り出す
> hawks #行列全体を表示
[,1] [,2]
[1,] 173 17000
[2,] 178 14000
[3,] 189 9000
[4,] 183 50000
[5,] 182 30000
> hawks[1,] #1行目のデータにアクセス
[1] 173 17000
> hawks[,1] #1列目のデータにアクセス
[1] 173 178 189 183 182
> hawks[3,2] #3行2列目のデータにアクセス
[1] 9000
24. Rの基本操作:行列の要素へアクセス
行列から指定した位置の値を取り出す
> hawks #行列全体を表示
[,1] [,2]
[1,] 173 17000
[2,] 178 14000
[3,] 189 9000
[4,] 183 50000
[5,] 182 30000
> hawks[1,] #1行目のデータにアクセス
[1] 173 17000
> hawks[,1] #1列目のデータにアクセス
[1] 173 178 189 183 182
> hawks[3,2] #3行2列目のデータにアクセス
[1] 9000
25. Rの基本操作:外部ファイル読み込み
CSVファイルを読み込んで変数に格納可能
大量のデータを処理する際に便利
> hawks2 <- read.csv("hawks.csv") #csvファイル
の読み込み
> hawks2 #変数の中身確認
height salary
1 173 17000
2 178 14000
3 180 9000
4 183 50000
5 182 30000
26. Rの基本操作:関数の自作
関数の定義にはfunction()を使う
> varp <- function(x) { #自作関数
+ result <- var(x) * (length(x) - 1) / length(x)
+ result
+ }
>
> hawks2[,1] #ホークスのデータを入れてみる
[1] 173 178 180 183 182
> varp(hawks2[,1]) #標本分散
[1] 12.56
30. アジェンダ
●
自己紹介
● Rとは
● Rの導入
● Rの基本操作
● Rの情報源
●
まとめ
36. アジェンダ
●
自己紹介
● Rとは
● Rの導入
● Rの基本操作
● Rの情報源
●
まとめ
37. まとめ
● Rは無料で使える統計解析用の言語
● Windows, Mac, Linux版がある
●
基本的な演算や変数、関数が使える
– プログラミング言語色が強い
● plotによる作図
● CSVファイル連携
●
その他各種パッケージの利用が可能
● 検索するときはSeekRが便利