SlideShare a Scribd company logo
1 of 50
<#>
はじめての
TOKYO.R #49
簑田 高志
目次
1. 自己紹介
2. ご紹介
3. 変更点
4. はじめてのR
i. インストール
ii. 起動と終了
iii. デモ(demo())
iv. データアクセス方法
v. 変数追加
vi. データ集計
vii. 関数
viii.パッケージ
5. 次のステップ
6. まとめ
※ スクリーンショットや機能等はMac版となります。
• 名前 :簑田 高志
• Twitter :aad34210
• ブログ :http://pracmper.blogspot.com/
• 出身地 :熊本県
• 出身学部 :法学部
• 仕事 :E-commerceのアナリスト
インターネット広告のビジネスアナリスト
自己紹介
ご紹介
本を共同翻訳しました
6月30日(火)発売しました!
書籍の内容
・翻訳者より
・目次
・はじめに
・まえがき
・謝辞
1章 Rを手に入れる
1.1 Rのダウンロード
1.2 Rのバージョン
1.3 32bitと64bit
1.4 インストール
1.5 Revolution R Community Edition
1.6 まとめ
2章 Rの環境
2.1 コマンドラインインターフェイス(CLI)
2.2 RStudio
2.3 Revolution Analytics RPE
(R Productivity Environment)
2.4 まとめ
3章 Rパッケージ
3.1 インストールパッケージ
3.2 ロードパッケージ
3.3 パッケージの作成
3.4 まとめ
4章 Rの基本
4.1 基本的な数学
4.2 変数
4.3 データ型
4.4 ベクトル
4.5 関数(Function)の呼び出し
4.6 関数ドキュメント
4.7 欠損値
4.8 まとめ
5章 高度なデータ構造
5.1 データフレーム(data.frame)
5.2 リスト(List)
5.3 マトリックス(Matrix)
5.4 アレイ(Array)
5.5 まとめ
6章 Rへのデータ取り込み
6.1 CSVの読み込み
6.2 Excelの読み込み
6.3 データベースからの読み込み
6.4 他社統計ツールからの読み込み
6.5 Rバイナリファイル
6.6 Rに入っているデータ
6.7 Webサイトからの抽出
6.8 まとめ
7章 統計的なグラフィクス
7.1 基本グラフィクス
7.2 ggplot2
7.3 まとめ
8章 Rの関数を書く
8.1 ハロー、ワールド!
8.2 関数の引数
8.3 値の返却
8.4 do.call
8.5 まとめ
9章 制御文
9.1 ifとelse
9.2 Switch
9.3 ifelse
9.4 複合テスト
9.5 まとめ
10章 ループ:Rの方法ではない反復方法
10.1 forループ
10.2 whileループ
10.3 ループの制御
10.4 まとめ
11章 グループピング操作
11.1 Applyファミリー
11.2 aggregate
11.3 plyr
11.4 data.table
11.5 まとめ
12章 データ整形
12.1 cbindとrbind
12.2 Join
12.3 reshape2
12.4 まとめ
13章 文字列操作
13.1 paste
13.2 sprintf
13.3 テキストの抽出
13.4 正規表現
13.5 まとめ
14章 確率分布
14.1 正規分布
14.2 二項分布
14.3 ポアソン分布
14.4 その他の分布
14.5 まとめ
15章 基本統計
15.1 要約統計
15.2 相関と共分散
15.3 t検定
15.4 分散分析
15.5 まとめ
16章 線形モデル
16.1 単回帰
16.2 重回帰
16.3 まとめ
17章 一般化線形モデル
17.1 ロジスティック回帰
17.2 ポアソン回帰
17.3 その他の一般化線形モデル
17.4 生存時間分析
17.5 まとめ
18章 モデル評価
18.1 残差
18.2 モデル比較
18.3 クロスバリデーション
18.4 ブートストラップ
18.5 ステップワイズ変数選択法
18.6 まとめ
19章 正則化と縮小
19.1 Elastic Net
19.2 Bayesian shrinkage
19.3 まとめ
20章 非線形モデル
20.1 非線形最小二乗法
20.2 スプライン
20.3 一般化加法モデル
20.4 決定木
20.5 ランダムフォレスト
20.6 まとめ
21章 時系列と自己相関
21.1 自己回帰移動平均
21.2 VAR
21.3 GARCH
21.4 まとめ
22章 クラスタリング
22.1 K-means
22.2 PAM
22.3 階層型クラスタリング
22.4 まとめ
23章 knitrパッケージによる再現性・レポートとスライドショー
23.1 Latexプログラムのインストール
23.2 Latex 入門
23.3 Latexを使ったknitr
23.4 マークダウンのヒント
23.5 knitrとマークダウンの利用
23.6 Pandoc
23.7 まとめ
24章 Rパッケージの構築
24.1 フォルダ構成
24.2 パッケージファイル
24.3 パッケージドキュメンテーション
24.4 チェック、構築とインストール
24.5 CRANへの登録
24.6 C++コード
24.7 まとめ
付録A 情報リソース
A.1 Meetup
A.2 Stack Overflow
A.3 Twitter
A.4 カンファレンス
A.5 Webサイト
A.6 ドキュメント
A.7 書籍
A.8 まとめ
付録B 用語集 / 索引
1章〜24章+α
全448ページ
書籍の内容
 特徴
• Rをはじめたばかりの人から、Rを使って解析に挑戦し
てみたい人、データ分析ってどういう事ができるのだろ
うか?ということを知りたい人に最適。
• もともとはコロンビア大学の統計学の教授のJared.P.
Landarさんが自分が大学院時代に教えてもらいた
かった内容がベース。
• ゼミ生も実験台に…
• Rでできることを「俯瞰」して見ることができる。
書籍の内容
さらに
本を共同翻訳しました
重版決定しました!
書籍の内容
加えて
本を共同翻訳しました
7月末に電子書籍版
配信開始(予定)
本を共同翻訳しました
よろしくおねがいします。
はじめての
インストール
インストール
インストール:Rstudioをインストール
特に問題がなければ、Desktopを選択
http://www.rstudio.com/products/RStudio/
インストール
インストール:Rstudioをインストール
特に問題がなければ、Desktopを選択
http://www.rstudio.com/products/RStudio/
インストール
ダウンロードファイルをダブルクリックして起動。
Macの場合、アイコンをApplicationsにドラッグアンドドロップ
起動と終了
起動と終了
Macの場合、アイコンをApplicationsフォルダにRstudioのアイコンが入っている
Rstudio.appのみダブルクリックして起動。(R.appは起動しなくてもよいです)
起動と終了
Macの場合、アイコンをApplicationsフォルダにRstudioのアイコンが入っている
Rstudio.appのみダブルクリックして起動。(R.appは起動しなくてもよいです)
起動と終了
Tools>Global Optionで背景色、文字フォント、配置を変更することが可能。
起動と終了
通常のアプリケーションと同じように終了できる。
また、コマンドラインにq()を実行しても終了可能。
デモ(demo())
demo()
demo()という関数でパッケージの例を見ることができる。
コンソールに結果が表示されるので、Returnキーを押す
demo()
graphics関数のデモが下のPlotタブに結果が表示
データアクセス
方法
データアクセス方法
実際にデータにデータアクセスしてみましょう。
最初は「iris」というデータセット(データフレーム)から触ってみます
iris
データアクセス方法
最初の数行だけにアクセスしたい場合は、head() を使います。
引数で取り出したい行数を指定可能。(デフォルトは6)
head(iris) / head(iris,10)
データアクセス方法
最後の数行だけにアクセスしたい場合は、tail() を使います。
引数で取り出したい行数を指定可能。(デフォルトは6)
tail(iris) / tail(iris,10)
データアクセス方法
特定の項目(列、変数)にアクセスしたい場合は、いくつかの方法がある。
「$」を使った利用例: iris$Sepal.Length
データアクセス方法
特定の項目(列、変数)にアクセスしたい場合は、いくつかの方法がある。
「[(行) , (列)]」を使った利用例:iris[ 1, 1 ]
データアクセス方法
これらのアクセス方法は組合せて使うことができる
head()と$の組合せ
変数追加
変数追加
データ分析したい場合、変数を追加したい時がある。
・データフレームに<-で追加
変数追加
データ分析したい場合、変数を追加したい時がある。
・dplyr::mutateで追加
データ集計
データをまとめあげたい場合
・applyファミリーを利用
データ集計
データをまとめあげたい場合
・applyファミリーを利用
・tapply(集計データ,集計グループ,関数)
データ集計
データをまとめあげたい場合
・applyファミリーを利用
・aggregate (集計対象,集計カテゴリ,関数)
データ集計
データをまとめあげたい場合
・dplyr::summarize 関数を利用
・group_by(データ、集計対象) 、summarize(group_by , 集計変数)
関数
関数
数多くの関数がサポート対象
sum:合計、mean:平均、median:中央値、sd:標準偏差、cor:相関係数 …
R Reference Card のMathを見てみましょう。
http://cran.r-project.org/doc/contrib/Short-refcard.pdf
パッケージ
パッケージ
Rの大きな特徴。
約6,000以上のパッケージがCRANに登録。Githubのレポジトリを入れるともっと多くのパッケージが存在。
nrow(available.packages()) ⇛ 6,665 (2015/06/20現在)
出典:http://blog.revolutionanalytics.com/2013/11/cran-now-has-5000-r-packages.html
パッケージ
利用方法は2つ
・install.packages(“[パッケージ名]”)
・Rstudioのpackageタブ
次のステップ
次のステップ
本格的にRを使う際に必要な知識を紹介
• 条件分岐
• ループ
• グラフ作成
• データベースとの接続
• 統計解析
次のステップ
本格的にRを使う際に必要な知識を紹介
・次のステップが待ちきれない人はみんなのRの
次の章を確認しましょう。
・条件分岐 :9章コントロール文
・ループ :10章
・グラフ作成 :7章 統計グラフ(ggplot2は必須)
・データベースとの接続
:6章 6.3 データベースからの読み込み
・統計解析 :15章〜22章
本日のまとめ
まとめ
今日話をした内容は以下
i. インストール :Rstudioのインストール
ii. 起動と終了 :アイコンから起動、q()で終了
iii. デモ(demo()) :demo関数
iv. データアクセス方法 :複数のアクセス方法
v. 変数追加 :<- とmutate
vi. データ集計 :applyファミリ、aggregate、
summarize
vii. 関数 :チートシート見てね。
viii. パッケージ :Rの最大特徴。
install.pacagesとpackageタブ
ありがとうございました!

More Related Content

More from Takashi Minoda

Introduction r (R入門)
Introduction r (R入門)Introduction r (R入門)
Introduction r (R入門)Takashi Minoda
 
RStudioでRをはじめよう(R for Beginner using RStudio)
RStudioでRをはじめよう(R for Beginner using RStudio)RStudioでRをはじめよう(R for Beginner using RStudio)
RStudioでRをはじめよう(R for Beginner using RStudio)Takashi Minoda
 
RからGoogle Cloud Vision API を利用する
RからGoogle Cloud Vision API を利用するRからGoogle Cloud Vision API を利用する
RからGoogle Cloud Vision API を利用するTakashi Minoda
 
TokyoR:RMarkdownでレポート作成
TokyoR:RMarkdownでレポート作成TokyoR:RMarkdownでレポート作成
TokyoR:RMarkdownでレポート作成Takashi Minoda
 
Rとデータベース 第61回 Tokyo.R
Rとデータベース 第61回 Tokyo.RRとデータベース 第61回 Tokyo.R
Rとデータベース 第61回 Tokyo.RTakashi Minoda
 
Tokyo r24 r_graph_tutorial
Tokyo r24 r_graph_tutorialTokyo r24 r_graph_tutorial
Tokyo r24 r_graph_tutorialTakashi Minoda
 

More from Takashi Minoda (20)

Introduction r (R入門)
Introduction r (R入門)Introduction r (R入門)
Introduction r (R入門)
 
RStudioでRをはじめよう(R for Beginner using RStudio)
RStudioでRをはじめよう(R for Beginner using RStudio)RStudioでRをはじめよう(R for Beginner using RStudio)
RStudioでRをはじめよう(R for Beginner using RStudio)
 
RからGoogle Cloud Vision API を利用する
RからGoogle Cloud Vision API を利用するRからGoogle Cloud Vision API を利用する
RからGoogle Cloud Vision API を利用する
 
TokyoR:RMarkdownでレポート作成
TokyoR:RMarkdownでレポート作成TokyoR:RMarkdownでレポート作成
TokyoR:RMarkdownでレポート作成
 
Rとデータベース 第61回 Tokyo.R
Rとデータベース 第61回 Tokyo.RRとデータベース 第61回 Tokyo.R
Rとデータベース 第61回 Tokyo.R
 
Tokyo r50 beginner_2
Tokyo r50 beginner_2Tokyo r50 beginner_2
Tokyo r50 beginner_2
 
Tokyo r47 beginner
Tokyo r47 beginnerTokyo r47 beginner
Tokyo r47 beginner
 
Tokyo r47 beginner_2
Tokyo r47 beginner_2Tokyo r47 beginner_2
Tokyo r47 beginner_2
 
Tokyo r45 beginner_2
Tokyo r45 beginner_2Tokyo r45 beginner_2
Tokyo r45 beginner_2
 
Tokyo r39 beginner
Tokyo r39 beginnerTokyo r39 beginner
Tokyo r39 beginner
 
Tokyo r38
Tokyo r38Tokyo r38
Tokyo r38
 
Tokyo r33 beginner
Tokyo r33 beginnerTokyo r33 beginner
Tokyo r33 beginner
 
Tokyo r30 anova_part2
Tokyo r30 anova_part2Tokyo r30 anova_part2
Tokyo r30 anova_part2
 
Tokyo r30 anova
Tokyo r30 anovaTokyo r30 anova
Tokyo r30 anova
 
Tokyo r30 beginner
Tokyo r30 beginnerTokyo r30 beginner
Tokyo r30 beginner
 
Tokyo r28 1
Tokyo r28 1Tokyo r28 1
Tokyo r28 1
 
Tokyo r27
Tokyo r27Tokyo r27
Tokyo r27
 
Tokyo r24 r_graph_tutorial
Tokyo r24 r_graph_tutorialTokyo r24 r_graph_tutorial
Tokyo r24 r_graph_tutorial
 
Tokyo r21 修正版
Tokyo r21 修正版Tokyo r21 修正版
Tokyo r21 修正版
 
Tokyo r21 2
Tokyo r21 2Tokyo r21 2
Tokyo r21 2
 

Tokyo r49 beginner