SlideShare a Scribd company logo
初心者
セッション
1
•  所沢義男(ところさわ よしお)
•  社内SEやってます
•  最近興味あるのはAHPです
実名主義
•  Rの入門資料は充実したものがweb上にたくさ
んあります。
•  インストールの仕方、チュートリアルはそちらを
見てください。
– slideshareというサイトに資料が沢山
– @masaha03  「はじめてのR」
– これまでのTokyo.R  「初心者セッション資料」
いきなりですが
じゃあ
今回は何するの
•  チュートリアルと、今回のTokyoRの本編の間を
つなげられればと思います。
•  本編で喋っている人たちが最低限持っている
知識の共有を図ります。
本日の発表
• Rを使った分析の流れ
• エディタ
• 情報収集
• さあやってみよう
• まとめ
本日の発表
• Rを使った分析の流れ
• エディタ
• 情報収集
• さあやってみよう
• まとめ
Rを使った
分析の流れ
• 入力
• 分析
• 出力
入力
•  データの読み込み
– 組み込み関数
• read.table  read.csv…
– 外部パッケージを使う
• Excel
• 画像ファイル
•  データ構造
– データフレームがメイン
分析
•  分析の前処理
– データの結合  merge,  rbind,  cbind
– データの抽出  subset
•  分析
– 各種手法の適用
• ここで外部パッケージを使うことが多い
• 便利パッケージの紹介は本編で!!!
出力
•  ファイル出力
– テキスト、Excel…
•  図
– 組み込みのplot
– 外部パッケージ
• lattice
• ggplot2
•  レポーティング
– knitr,  slidify
– Rpubs
繰り返しますが
@masaha03
はじめての「R」
超オススメです
本日の発表
• Rを使った分析の流れ
• エディタ
• 情報収集
• さあやってみよう
• まとめ
エディタ
•  RGUI
•  RStudio
– 最近定番になりつつある。超便利。メモリ食う。
•  ESS
– Emacs。使ったことないけど歴史もあり評判良い。
•  EZR
– 医学系で流行りつつある。
•  Rzパッケージ
– SPSSの使いやすさをRで根こそぎ実現。
– さっきの@masaha03さんが作った。
個人的には
RStudio
オススメ
本日の発表
• Rを使った分析の流れ
• エディタ
• 情報収集
• さあやってみよう
• まとめ
情報収集
• 検索
• webの資料
• 書籍
• 勉強会
情報収集-検索
•  seekR
– 検索泣かせの「R」に舞い降りた救世主。
– 中の人の解説はこの後すぐ!!
•  Rseek
– 英語の救世主
情報収集-webの資料
•  各種勉強会(後述)の資料まとめ
•  R-tips
•  Rjpwiki
•  同志社大学 金明哲先生
•  群馬大学 青木繁伸先生
情報収集-書籍
•  作業ディレクトリ何それという人向け
– Rによるデータプログラミング入門
•  他プログラミング言語の経験あり
– R言語逆引きハンドブック
– Rによるデータサイエンス
– Rパッケージガイドブック
•  データ分析自体不慣れ
– データ解析のための統計モデリング入門
– データマイニング入門
情報収集-勉強会:R関係
•  Tsukuba.R
•  Nagoya.R
•  Osaka.R
•  Yamadai.R
•  HiRoshima.R
•  Japan.R
•  Tokyo.lang.R
•  Tokyo.lang.R
•  ゼロから始めるR言語
勉強会
•  Wako.R←New!
•  TokyoR女子部←New!
Wako.R
•  来週土曜(6/8)開催
•  今会いに行けるR界のアイドル@dritoshiサン
•  Tsukuba.Rが休止状態の今、Rで尖ったプレゼ
ンを聞きたいならここに行くしかない
•  世界に誇る理化学研究所の見学もできるよ
Wako.R	
 検索
で、
TokyoR女子部
ですよ
※これはOsaka.R女子部
TokyoR女子部
•  女子による女子のためのR勉強会
•  Osaka.R女子部の実績をもつ
•  @nanaya_sacさんが主催(予定)
•  たぶん7月以降
気になる人は
twitterで
@nanaya_sac
を今すぐフォロー
情報収集-勉強会:関連勉強会
•  Tokyowebmining
– 充実した発表及び議論、そして定評のある主催
者の自己紹介
•  Zansa(残差)
– ガチで意識も技術力も高い大学生たち
•  集合知プログラミング勉強会
– 今すぐフォローしたい分析野郎  @tetsuroito  主催
情報収集-勉強会:分野別
•  さくさくテキストマイニング
•  おしゃれStatistics
•  心理・医学系研究者のためのデータ解析環境
Rによる統計学の研究会
– 医療経済研究機構  奥村泰之先生
•  社会科学研究のためのR勉強会
– 東北学院大学  鈴木努先生
情報収集-勉強会:統数研
•  統計数理研究所の公開講座
– 非常に安価で質の高い統計講座を受講できる
– Rのデータ操作については前提知識として要求さ
れる
•  統計数理研究所の研究集会
– Rユーザー会の草分け的存在
– 年に1回11月頃
みんな同じ分析をしている
仲間に飢えてるので
興味があったら
会場でコンタクトとってみる
といいです
あと
R逆引き本と
統数研の公開講座
まじオススメ
本日の発表
• Rを使った分析の流れ
• エディタ
• 情報収集
• さあやってみよう
• まとめ
さあやってみよう
•  やりたいことがある人はそれでOK
– cran  task  view
•  目的別に外部パッケージがまとめられている
– Rで学ぶデータサイエンスシリーズ(全20巻)
•  目的に近い内容の巻を選んでサンプルを動かしてみる
それRじゃなくてもできるよ
•  Julia
– Rに我慢ならなくなった人々が作り始めた次世代
統計言語
•  驚異のPython勢
– pandas:RのデータフレームをPythonで
– Bokeh:ggplot2ライクな可視化
– scikit-learn:機械学習
– Orange:統計・機械学習
•  Jubatus
– 分散したデータを常に素早く深く分析する
まだちょっと何していいか…
•  面白そうなデータを見つける
– UFO目撃情報
•  シナリオにそって手を動かしてみる
– Rによるデータマイニング入門  (書籍)
– CodeIQ  (練習問題、添削付き)
•  コンテスト
– kaggle
– Crowdsolving
まずは使ってみて
やりたいことを不完全でもい
いからやってみて
そしてぜひ発表しましょう
まとめ
•  林真広  「はじめてのR」は名著
•  Rじゃない方が目的に沿っている可能性もある
のでエンジニアの方は要検討。
•  TokyoRは発表者を大募集しています!!!
enjoy!!!

More Related Content

Viewers also liked

ggplot2 に入門してみた
ggplot2 に入門してみたggplot2 に入門してみた
ggplot2 に入門してみたHidekazu Tanaka
 
第32回Tokyo.R#初心者セッション
第32回Tokyo.R#初心者セッション第32回Tokyo.R#初心者セッション
第32回Tokyo.R#初心者セッション
宏喜 佐野
 
母集団と標本
母集団と標本母集団と標本
母集団と標本
Daisuke Ichikawa
 
Rによるやさしい統計学 第16章 : 因子分析
Rによるやさしい統計学 第16章 : 因子分析Rによるやさしい統計学 第16章 : 因子分析
Rによるやさしい統計学 第16章 : 因子分析Hidekazu Tanaka
 
可視化周辺の進化がヤヴァイ~rChartsを中心として~
可視化周辺の進化がヤヴァイ~rChartsを中心として~可視化周辺の進化がヤヴァイ~rChartsを中心として~
可視化周辺の進化がヤヴァイ~rChartsを中心として~
Nagi Teramo
 
rzmq
rzmqrzmq
第31回TokyoR LT資料
第31回TokyoR LT資料第31回TokyoR LT資料
第31回TokyoR LT資料tetsuro ito
 
中の人が語る seekR.jp の裏側
中の人が語る seekR.jp の裏側中の人が語る seekR.jp の裏側
中の人が語る seekR.jp の裏側
Takekatsu Hiramura
 
R言語で学ぶマーケティング分析 競争ポジショニング戦略
R言語で学ぶマーケティング分析 競争ポジショニング戦略R言語で学ぶマーケティング分析 競争ポジショニング戦略
R言語で学ぶマーケティング分析 競争ポジショニング戦略Yohei Sato
 
Abテストと検定
Abテストと検定Abテストと検定
Abテストと検定
Teruki Shinohara
 
R による文書分類入門
R による文書分類入門R による文書分類入門
R による文書分類入門
Takeshi Arabiki
 
はじめよう多変量解析~主成分分析編~
はじめよう多変量解析~主成分分析編~はじめよう多変量解析~主成分分析編~
はじめよう多変量解析~主成分分析編~
宏喜 佐野
 
10分でわかる主成分分析(PCA)
10分でわかる主成分分析(PCA)10分でわかる主成分分析(PCA)
10分でわかる主成分分析(PCA)
Takanori Ogata
 
RとPythonによるデータ解析入門
RとPythonによるデータ解析入門RとPythonによるデータ解析入門
RとPythonによるデータ解析入門Atsushi Hayakawa
 

Viewers also liked (14)

ggplot2 に入門してみた
ggplot2 に入門してみたggplot2 に入門してみた
ggplot2 に入門してみた
 
第32回Tokyo.R#初心者セッション
第32回Tokyo.R#初心者セッション第32回Tokyo.R#初心者セッション
第32回Tokyo.R#初心者セッション
 
母集団と標本
母集団と標本母集団と標本
母集団と標本
 
Rによるやさしい統計学 第16章 : 因子分析
Rによるやさしい統計学 第16章 : 因子分析Rによるやさしい統計学 第16章 : 因子分析
Rによるやさしい統計学 第16章 : 因子分析
 
可視化周辺の進化がヤヴァイ~rChartsを中心として~
可視化周辺の進化がヤヴァイ~rChartsを中心として~可視化周辺の進化がヤヴァイ~rChartsを中心として~
可視化周辺の進化がヤヴァイ~rChartsを中心として~
 
rzmq
rzmqrzmq
rzmq
 
第31回TokyoR LT資料
第31回TokyoR LT資料第31回TokyoR LT資料
第31回TokyoR LT資料
 
中の人が語る seekR.jp の裏側
中の人が語る seekR.jp の裏側中の人が語る seekR.jp の裏側
中の人が語る seekR.jp の裏側
 
R言語で学ぶマーケティング分析 競争ポジショニング戦略
R言語で学ぶマーケティング分析 競争ポジショニング戦略R言語で学ぶマーケティング分析 競争ポジショニング戦略
R言語で学ぶマーケティング分析 競争ポジショニング戦略
 
Abテストと検定
Abテストと検定Abテストと検定
Abテストと検定
 
R による文書分類入門
R による文書分類入門R による文書分類入門
R による文書分類入門
 
はじめよう多変量解析~主成分分析編~
はじめよう多変量解析~主成分分析編~はじめよう多変量解析~主成分分析編~
はじめよう多変量解析~主成分分析編~
 
10分でわかる主成分分析(PCA)
10分でわかる主成分分析(PCA)10分でわかる主成分分析(PCA)
10分でわかる主成分分析(PCA)
 
RとPythonによるデータ解析入門
RとPythonによるデータ解析入門RとPythonによるデータ解析入門
RとPythonによるデータ解析入門
 

Similar to TokyoR#31 初心者セッション

R超入門
R超入門R超入門
R超入門
Sachiko Hirata
 
グラフデータベース入門
グラフデータベース入門グラフデータベース入門
グラフデータベース入門
Masaya Dake
 
プログラミング『超入門書』から見るPythonと解説テクニック
プログラミング『超入門書』から見るPythonと解説テクニックプログラミング『超入門書』から見るPythonと解説テクニック
プログラミング『超入門書』から見るPythonと解説テクニック
Takeshi Akutsu
 
Twitterにおける即時話題推定技術「どたばたかいぎ」の開発
Twitterにおける即時話題推定技術「どたばたかいぎ」の開発Twitterにおける即時話題推定技術「どたばたかいぎ」の開発
Twitterにおける即時話題推定技術「どたばたかいぎ」の開発
Eric Sartre
 
HiroshimaR6_Introduction
HiroshimaR6_IntroductionHiroshimaR6_Introduction
HiroshimaR6_Introduction
SAKAUE, Tatsuya
 
HiroshimaR5_Intro
HiroshimaR5_IntroHiroshimaR5_Intro
HiroshimaR5_Intro
SAKAUE, Tatsuya
 
20100619 wakhok important_of_io_with_jror
20100619 wakhok important_of_io_with_jror20100619 wakhok important_of_io_with_jror
20100619 wakhok important_of_io_with_jror
Yoshiharu Hashimoto
 
はじめてのテスト技法
はじめてのテスト技法はじめてのテスト技法
はじめてのテスト技法
Tatsuya Saito
 
経済学のための実践的データ分析 1. イントロダクション/Jupyter Notebook をインストールする
経済学のための実践的データ分析 1. イントロダクション/Jupyter Notebook をインストールする経済学のための実践的データ分析 1. イントロダクション/Jupyter Notebook をインストールする
経済学のための実践的データ分析 1. イントロダクション/Jupyter Notebook をインストールする
Yasushi Hara
 
Hijiyama.R Entry session
Hijiyama.R Entry sessionHijiyama.R Entry session
Hijiyama.R Entry session
考司 小杉
 
アジャイルにプロジェクトの"なぜ"を考える、インセプションデッキワークショップ
アジャイルにプロジェクトの"なぜ"を考える、インセプションデッキワークショップアジャイルにプロジェクトの"なぜ"を考える、インセプションデッキワークショップ
アジャイルにプロジェクトの"なぜ"を考える、インセプションデッキワークショップ
You&I
 
Techcircle001-OpenStackハンズオン勉強会
Techcircle001-OpenStackハンズオン勉強会Techcircle001-OpenStackハンズオン勉強会
Techcircle001-OpenStackハンズオン勉強会
Koji Shiraishi
 
IRC セミナー 数字が教えてくれないこと -特許/論文データベース分析入門-
IRC セミナー数字が教えてくれないこと-特許/論文データベース分析入門-IRC セミナー数字が教えてくれないこと-特許/論文データベース分析入門-
IRC セミナー 数字が教えてくれないこと -特許/論文データベース分析入門-
Yasushi Hara
 
swirl パッケージでインタラクティブ学習
swirl パッケージでインタラクティブ学習swirl パッケージでインタラクティブ学習
swirl パッケージでインタラクティブ学習hoxo_m
 
機械学習ビジネス研究会(未踏研究会)
機械学習ビジネス研究会(未踏研究会)機械学習ビジネス研究会(未踏研究会)
機械学習ビジネス研究会(未踏研究会)
Tokoroten Nakayama
 
エンジニアという仕事を楽しみ続けるためのキャリア戦略
エンジニアという仕事を楽しみ続けるためのキャリア戦略エンジニアという仕事を楽しみ続けるためのキャリア戦略
エンジニアという仕事を楽しみ続けるためのキャリア戦略
Shuichi Tsutsumi
 
RPAってツールですか?
RPAってツールですか?RPAってツールですか?
RPAってツールですか?
YasuharuMori2
 
ドキュメントライブラリを便利にするかも?しれないテクニック
ドキュメントライブラリを便利にするかも?しれないテクニックドキュメントライブラリを便利にするかも?しれないテクニック
ドキュメントライブラリを便利にするかも?しれないテクニック
Teruchika Yamada
 
半年間1ヶ月に1回発表して変わったこと
半年間1ヶ月に1回発表して変わったこと半年間1ヶ月に1回発表して変わったこと
半年間1ヶ月に1回発表して変わったこと
takathemax
 
入門系の本を一冊も読まずにデータサイエンスに入門してみる
入門系の本を一冊も読まずにデータサイエンスに入門してみる入門系の本を一冊も読まずにデータサイエンスに入門してみる
入門系の本を一冊も読まずにデータサイエンスに入門してみる
Masayuki Sakamoto
 

Similar to TokyoR#31 初心者セッション (20)

R超入門
R超入門R超入門
R超入門
 
グラフデータベース入門
グラフデータベース入門グラフデータベース入門
グラフデータベース入門
 
プログラミング『超入門書』から見るPythonと解説テクニック
プログラミング『超入門書』から見るPythonと解説テクニックプログラミング『超入門書』から見るPythonと解説テクニック
プログラミング『超入門書』から見るPythonと解説テクニック
 
Twitterにおける即時話題推定技術「どたばたかいぎ」の開発
Twitterにおける即時話題推定技術「どたばたかいぎ」の開発Twitterにおける即時話題推定技術「どたばたかいぎ」の開発
Twitterにおける即時話題推定技術「どたばたかいぎ」の開発
 
HiroshimaR6_Introduction
HiroshimaR6_IntroductionHiroshimaR6_Introduction
HiroshimaR6_Introduction
 
HiroshimaR5_Intro
HiroshimaR5_IntroHiroshimaR5_Intro
HiroshimaR5_Intro
 
20100619 wakhok important_of_io_with_jror
20100619 wakhok important_of_io_with_jror20100619 wakhok important_of_io_with_jror
20100619 wakhok important_of_io_with_jror
 
はじめてのテスト技法
はじめてのテスト技法はじめてのテスト技法
はじめてのテスト技法
 
経済学のための実践的データ分析 1. イントロダクション/Jupyter Notebook をインストールする
経済学のための実践的データ分析 1. イントロダクション/Jupyter Notebook をインストールする経済学のための実践的データ分析 1. イントロダクション/Jupyter Notebook をインストールする
経済学のための実践的データ分析 1. イントロダクション/Jupyter Notebook をインストールする
 
Hijiyama.R Entry session
Hijiyama.R Entry sessionHijiyama.R Entry session
Hijiyama.R Entry session
 
アジャイルにプロジェクトの"なぜ"を考える、インセプションデッキワークショップ
アジャイルにプロジェクトの"なぜ"を考える、インセプションデッキワークショップアジャイルにプロジェクトの"なぜ"を考える、インセプションデッキワークショップ
アジャイルにプロジェクトの"なぜ"を考える、インセプションデッキワークショップ
 
Techcircle001-OpenStackハンズオン勉強会
Techcircle001-OpenStackハンズオン勉強会Techcircle001-OpenStackハンズオン勉強会
Techcircle001-OpenStackハンズオン勉強会
 
IRC セミナー 数字が教えてくれないこと -特許/論文データベース分析入門-
IRC セミナー数字が教えてくれないこと-特許/論文データベース分析入門-IRC セミナー数字が教えてくれないこと-特許/論文データベース分析入門-
IRC セミナー 数字が教えてくれないこと -特許/論文データベース分析入門-
 
swirl パッケージでインタラクティブ学習
swirl パッケージでインタラクティブ学習swirl パッケージでインタラクティブ学習
swirl パッケージでインタラクティブ学習
 
機械学習ビジネス研究会(未踏研究会)
機械学習ビジネス研究会(未踏研究会)機械学習ビジネス研究会(未踏研究会)
機械学習ビジネス研究会(未踏研究会)
 
エンジニアという仕事を楽しみ続けるためのキャリア戦略
エンジニアという仕事を楽しみ続けるためのキャリア戦略エンジニアという仕事を楽しみ続けるためのキャリア戦略
エンジニアという仕事を楽しみ続けるためのキャリア戦略
 
RPAってツールですか?
RPAってツールですか?RPAってツールですか?
RPAってツールですか?
 
ドキュメントライブラリを便利にするかも?しれないテクニック
ドキュメントライブラリを便利にするかも?しれないテクニックドキュメントライブラリを便利にするかも?しれないテクニック
ドキュメントライブラリを便利にするかも?しれないテクニック
 
半年間1ヶ月に1回発表して変わったこと
半年間1ヶ月に1回発表して変わったこと半年間1ヶ月に1回発表して変わったこと
半年間1ヶ月に1回発表して変わったこと
 
入門系の本を一冊も読まずにデータサイエンスに入門してみる
入門系の本を一冊も読まずにデータサイエンスに入門してみる入門系の本を一冊も読まずにデータサイエンスに入門してみる
入門系の本を一冊も読まずにデータサイエンスに入門してみる
 

More from TokorosawaYoshio

R45LT
R45LTR45LT
JapanR2014
JapanR2014JapanR2014
JapanR2014
TokorosawaYoshio
 
Tokyor44
Tokyor44Tokyor44
TokyoR42_around_chaining
TokyoR42_around_chainingTokyoR42_around_chaining
TokyoR42_around_chaining
TokorosawaYoshio
 
データ解析のための勉強会第7章
データ解析のための勉強会第7章データ解析のための勉強会第7章
データ解析のための勉強会第7章TokorosawaYoshio
 
Rから通知をとばす
Rから通知をとばすRから通知をとばす
Rから通知をとばす
TokorosawaYoshio
 
2分でパッケージを作ってインストールする
2分でパッケージを作ってインストールする2分でパッケージを作ってインストールする
2分でパッケージを作ってインストールする
TokorosawaYoshio
 
TokyoR40
TokyoR40TokyoR40
Tokyor36
Tokyor36Tokyor36

More from TokorosawaYoshio (10)

R45LT
R45LTR45LT
R45LT
 
JapanR2014
JapanR2014JapanR2014
JapanR2014
 
Tokyor37
Tokyor37Tokyor37
Tokyor37
 
Tokyor44
Tokyor44Tokyor44
Tokyor44
 
TokyoR42_around_chaining
TokyoR42_around_chainingTokyoR42_around_chaining
TokyoR42_around_chaining
 
データ解析のための勉強会第7章
データ解析のための勉強会第7章データ解析のための勉強会第7章
データ解析のための勉強会第7章
 
Rから通知をとばす
Rから通知をとばすRから通知をとばす
Rから通知をとばす
 
2分でパッケージを作ってインストールする
2分でパッケージを作ってインストールする2分でパッケージを作ってインストールする
2分でパッケージを作ってインストールする
 
TokyoR40
TokyoR40TokyoR40
TokyoR40
 
Tokyor36
Tokyor36Tokyor36
Tokyor36
 

TokyoR#31 初心者セッション