Download free for 30 days
Sign in
Upload
Language (EN)
Support
Business
Mobile
Social Media
Marketing
Technology
Art & Photos
Career
Design
Education
Presentations & Public Speaking
Government & Nonprofit
Healthcare
Internet
Law
Leadership & Management
Automotive
Engineering
Software
Recruiting & HR
Retail
Sales
Services
Science
Small Business & Entrepreneurship
Food
Environment
Economy & Finance
Data & Analytics
Investor Relations
Sports
Spiritual
News & Politics
Travel
Self Improvement
Real Estate
Entertainment & Humor
Health & Medicine
Devices & Hardware
Lifestyle
Change Language
Language
English
Español
Português
Français
Deutsche
Cancel
Save
EN
Uploaded by
Hiroki Matsui
PPTX, PDF
1,721 views
Tokyo r25 hiro_macchan
About Revolution R Enterprise & RevoscaleR
Read more
2
Save
Share
Embed
Embed presentation
Download
Download to read offline
1
/ 36
2
/ 36
3
/ 36
4
/ 36
5
/ 36
6
/ 36
7
/ 36
8
/ 36
9
/ 36
10
/ 36
11
/ 36
12
/ 36
13
/ 36
14
/ 36
15
/ 36
16
/ 36
17
/ 36
18
/ 36
19
/ 36
20
/ 36
21
/ 36
22
/ 36
23
/ 36
24
/ 36
25
/ 36
26
/ 36
27
/ 36
28
/ 36
29
/ 36
30
/ 36
31
/ 36
32
/ 36
33
/ 36
34
/ 36
35
/ 36
36
/ 36
More Related Content
PPTX
Japan r.3
by
Hiroki Matsui
KEY
第5回LinkedData勉強会@yayamamo
by
yayamamo @ DBCLS Kashiwanoha
PDF
SPARQLから入門するLinked Open Data(LOD)ハンズオン 第1回
by
yamahige
PDF
データベース12 - トランザクションと同時実行制御
by
Kenta Oku
PDF
データベース14 - データベース構造とインデックス
by
Kenta Oku
PDF
LOD連続講義 第5回「LODの作り方・使い方」
by
Fuyuko Matsumura
PDF
データベースシステム論13 - データベースの運用
by
Shohei Yokoyama
PDF
データベースシステム論07 - SQL基礎演習2 データの問い合わせ
by
Shohei Yokoyama
Japan r.3
by
Hiroki Matsui
第5回LinkedData勉強会@yayamamo
by
yayamamo @ DBCLS Kashiwanoha
SPARQLから入門するLinked Open Data(LOD)ハンズオン 第1回
by
yamahige
データベース12 - トランザクションと同時実行制御
by
Kenta Oku
データベース14 - データベース構造とインデックス
by
Kenta Oku
LOD連続講義 第5回「LODの作り方・使い方」
by
Fuyuko Matsumura
データベースシステム論13 - データベースの運用
by
Shohei Yokoyama
データベースシステム論07 - SQL基礎演習2 データの問い合わせ
by
Shohei Yokoyama
What's hot
PDF
SPARQLとMashup環境 (年岡先生)
by
Shun Shiramatsu
PDF
データベースシステム論12 - 問い合わせ処理と最適化
by
Shohei Yokoyama
PPTX
Rプログラミング02 データ入出力編
by
wada, kazumi
PDF
汎用Web API“SPARQL”でオープンデータ検索
by
uedayou
PPTX
Rプログラミング01 はじめの一歩
by
wada, kazumi
PPTX
ストリーム処理におけるApache Avroの活用について(NTTデータ テクノロジーカンファレンス 2019 講演資料、2019/09/05)
by
NTT DATA Technology & Innovation
PDF
Oracle Cloud Developers Meetup@東京
by
tuchimur
PDF
SPARQLでオープンデータ活用!
by
uedayou
PDF
学術分野の事例紹介
by
Linked Open Dataチャレンジ実行委員会
PDF
データベース13 - トランザクションと障害回復
by
Kenta Oku
PDF
オープンデータとLinked Open Data(LOD)@神戸R
by
Kouji Kozaki
PDF
データベースシステム論08 - SQL応用演習 結合演算とその他
by
Shohei Yokoyama
PDF
データベースシステム論11 - データベースの構成
by
Shohei Yokoyama
PDF
SPARQLを利用した逆マッシュアップ-プログラミングを必要としないアプリ作成方法-
by
uedayou
PPTX
Luceneインデックスの共起単語分析とSolrによる共起単語サジェスチョン
by
Koji Sekiguchi
PDF
Mongodb 紹介
by
Ryo Matsumura
PDF
Linked Open Data勉強会2020 後編:SPARQLの簡単な使い方、SPARQLを使った簡単なアプリ開発
by
KnowledgeGraph
PDF
Study 20131009
by
fujii_t
PDF
Introduction of Oracle Database Architecture(抜粋版) - JPOUG Oracle Database入学式 ...
by
Ryota Watabe
PDF
データベースシステム論02 - データベースの歴史と今
by
Shohei Yokoyama
SPARQLとMashup環境 (年岡先生)
by
Shun Shiramatsu
データベースシステム論12 - 問い合わせ処理と最適化
by
Shohei Yokoyama
Rプログラミング02 データ入出力編
by
wada, kazumi
汎用Web API“SPARQL”でオープンデータ検索
by
uedayou
Rプログラミング01 はじめの一歩
by
wada, kazumi
ストリーム処理におけるApache Avroの活用について(NTTデータ テクノロジーカンファレンス 2019 講演資料、2019/09/05)
by
NTT DATA Technology & Innovation
Oracle Cloud Developers Meetup@東京
by
tuchimur
SPARQLでオープンデータ活用!
by
uedayou
学術分野の事例紹介
by
Linked Open Dataチャレンジ実行委員会
データベース13 - トランザクションと障害回復
by
Kenta Oku
オープンデータとLinked Open Data(LOD)@神戸R
by
Kouji Kozaki
データベースシステム論08 - SQL応用演習 結合演算とその他
by
Shohei Yokoyama
データベースシステム論11 - データベースの構成
by
Shohei Yokoyama
SPARQLを利用した逆マッシュアップ-プログラミングを必要としないアプリ作成方法-
by
uedayou
Luceneインデックスの共起単語分析とSolrによる共起単語サジェスチョン
by
Koji Sekiguchi
Mongodb 紹介
by
Ryo Matsumura
Linked Open Data勉強会2020 後編:SPARQLの簡単な使い方、SPARQLを使った簡単なアプリ開発
by
KnowledgeGraph
Study 20131009
by
fujii_t
Introduction of Oracle Database Architecture(抜粋版) - JPOUG Oracle Database入学式 ...
by
Ryota Watabe
データベースシステム論02 - データベースの歴史と今
by
Shohei Yokoyama
Viewers also liked
PDF
#FTMA15 第一回 鬼コース 全PDF
by
Yoichi Ochiai
PPTX
130411文献検索の方法(講義用)
by
Yuko Matsumura
PPTX
整形外科外傷理学療法研究会用 足関節
by
orthopedictraumareha
PPTX
THAの適応と成績20130409
by
Masatoshi Oba
PDF
患者報告式アウトカム尺度における臨床的意味のある変化の定め方
by
Yasuyuki Okumura
PDF
ロジスティック回帰分析を扱った予測モデル作成研究事例の要約
by
Michimasa Haga
PDF
"おもしろい研究"への挑戦 - Challenges for "Omoshiroi" research
by
Akihiko Shirai
PDF
地域包括ケアにおけるICT利活用について
by
HealthcareBitStation
PDF
第6章 2つの平均値を比較する - TokyoR #28
by
horihorio
PDF
無作為化比較試験の方法の批判的な読み方
by
Yasuyuki Okumura
PDF
ジャーナルの批判的吟味と委託研究について
by
k-kajiwara
PDF
疾患を意識した関節所見の取り方
by
帝京大学ちば総合医療センター
PDF
プレゼンテーションデザイン
by
猛 近藤
PDF
状態空間モデルの考え方・使い方 - TokyoR #38
by
horihorio
PPT
ロジスティック回帰分析の入門 -予測モデル構築-
by
Koichiro Gibo
PDF
データ活用を推進する「Pivotal HDB(Apache HAWQ(ホーク))」
by
Masayuki Matsushita
PPTX
Rで学ぶ観察データでの因果推定
by
Hiroki Matsui
PDF
ロジスティック回帰分析の書き方
by
Sayuri Shimizu
PDF
2 5 2.一般化線形モデル色々_ロジスティック回帰
by
logics-of-blue
PDF
ロジスティック回帰の考え方・使い方 - TokyoR #33
by
horihorio
#FTMA15 第一回 鬼コース 全PDF
by
Yoichi Ochiai
130411文献検索の方法(講義用)
by
Yuko Matsumura
整形外科外傷理学療法研究会用 足関節
by
orthopedictraumareha
THAの適応と成績20130409
by
Masatoshi Oba
患者報告式アウトカム尺度における臨床的意味のある変化の定め方
by
Yasuyuki Okumura
ロジスティック回帰分析を扱った予測モデル作成研究事例の要約
by
Michimasa Haga
"おもしろい研究"への挑戦 - Challenges for "Omoshiroi" research
by
Akihiko Shirai
地域包括ケアにおけるICT利活用について
by
HealthcareBitStation
第6章 2つの平均値を比較する - TokyoR #28
by
horihorio
無作為化比較試験の方法の批判的な読み方
by
Yasuyuki Okumura
ジャーナルの批判的吟味と委託研究について
by
k-kajiwara
疾患を意識した関節所見の取り方
by
帝京大学ちば総合医療センター
プレゼンテーションデザイン
by
猛 近藤
状態空間モデルの考え方・使い方 - TokyoR #38
by
horihorio
ロジスティック回帰分析の入門 -予測モデル構築-
by
Koichiro Gibo
データ活用を推進する「Pivotal HDB(Apache HAWQ(ホーク))」
by
Masayuki Matsushita
Rで学ぶ観察データでの因果推定
by
Hiroki Matsui
ロジスティック回帰分析の書き方
by
Sayuri Shimizu
2 5 2.一般化線形モデル色々_ロジスティック回帰
by
logics-of-blue
ロジスティック回帰の考え方・使い方 - TokyoR #33
by
horihorio
Similar to Tokyo r25 hiro_macchan
PDF
レボリューションR(RRE)のご紹介
by
Satoshi Kitajima
PDF
Rにおける大規模データ解析(第10回TokyoWebMining)
by
Shintaro Fukushima
PDF
RのffとbigmemoryとRevoScaleRとを比較してみた
by
Kazuya Wada
PDF
10min r study_tokyor25
by
Nobuaki Oshiro
PDF
10min r study_tokyor25
by
Nobuaki Oshiro
PPTX
R超入門機械学習をはじめよう
by
幹雄 小川
PDF
20160220 MSのビッグデータ分析基盤 - データマイニング+WEB@東京
by
Koichiro Sasaki
PDF
10分で分かるr言語入門ver2.10 14 1101
by
Nobuaki Oshiro
PDF
RExcelの紹介
by
Shoichiro Oishi
PDF
20160121 データサイエンティスト協会 木曜セミナー #5
by
Koichiro Sasaki
PDF
財布にやさしいRを使ったデータマイニング
by
Ryoji Yanashima
PDF
Tokyor23 doradora09
by
Nobuaki Oshiro
PDF
10分で分かるr言語入門ver2.9 14 0920
by
Nobuaki Oshiro
PDF
Kashiwa.R #5 RExcel
by
Shoichiro Oishi
PDF
10分で分かるr言語入門ver2 upload用
by
Nobuaki Oshiro
PDF
Jubatusのリアルタイム分散レコメンデーション@TokyoWebmining#17
by
Yuya Unno
PDF
Rあんなときこんなとき(tokyo r#12)
by
Shintaro Fukushima
PDF
LET2011: Rによる教育データ分析入門
by
Yuichiro Kobayashi
PDF
初心者のためのRとRStudio入門 vol.2
by
OWL.learn
PDF
10分で分かるr言語入門ver2.8 14 0712
by
Nobuaki Oshiro
レボリューションR(RRE)のご紹介
by
Satoshi Kitajima
Rにおける大規模データ解析(第10回TokyoWebMining)
by
Shintaro Fukushima
RのffとbigmemoryとRevoScaleRとを比較してみた
by
Kazuya Wada
10min r study_tokyor25
by
Nobuaki Oshiro
10min r study_tokyor25
by
Nobuaki Oshiro
R超入門機械学習をはじめよう
by
幹雄 小川
20160220 MSのビッグデータ分析基盤 - データマイニング+WEB@東京
by
Koichiro Sasaki
10分で分かるr言語入門ver2.10 14 1101
by
Nobuaki Oshiro
RExcelの紹介
by
Shoichiro Oishi
20160121 データサイエンティスト協会 木曜セミナー #5
by
Koichiro Sasaki
財布にやさしいRを使ったデータマイニング
by
Ryoji Yanashima
Tokyor23 doradora09
by
Nobuaki Oshiro
10分で分かるr言語入門ver2.9 14 0920
by
Nobuaki Oshiro
Kashiwa.R #5 RExcel
by
Shoichiro Oishi
10分で分かるr言語入門ver2 upload用
by
Nobuaki Oshiro
Jubatusのリアルタイム分散レコメンデーション@TokyoWebmining#17
by
Yuya Unno
Rあんなときこんなとき(tokyo r#12)
by
Shintaro Fukushima
LET2011: Rによる教育データ分析入門
by
Yuichiro Kobayashi
初心者のためのRとRStudio入門 vol.2
by
OWL.learn
10分で分かるr言語入門ver2.8 14 0712
by
Nobuaki Oshiro
Tokyo r25 hiro_macchan
1.
びっぐでぇた解析環境あ~る ~主としてRevolution R のご紹介
~ 2012/08/04 Tokyo.R #25 Matsui Hiroki
2.
はじめに このプレゼンテーションは個人の見解で 有り、いかなる所属組織の公式見解ではあ りません。 また、このプレゼンテーションにおいて、 営利企業の製品に関する言及がありますが、 購入を推奨するものではないことをご留意 下さい。 2012/8/4
Tokyo.R#25 2
3.
自己紹介 • Matsui Hiroki
(RPT,MPH) • 出身:琵琶湖 住まい:千葉 職場:都内赤 門 • 趣味:サイクリング。一緒に走れる怖くない お嫁様募集中! • 専門:リハビリテーション、臨床疫学・医療 経済学 • 元理学療法士(リハビリ屋)→研究者 • Rは趣味程度に利用→現在は、仕事で利用 未熟者ですので間違い等は指摘して下さい。 • Twitter: Hiro_macchan (できれば、お手柔らかに。。) 2012/8/4 Tokyo.R#25 3
4.
前回までのあらすじ Tokyo.R#24 にて、#25の日程が2012/08/04に 決まる。 2012/8/4 Tokyo.R#25
4
5.
前回までのあらすじ Tokyo.R#24 にて、#25の日程が2012/08/04に 決まる。 当日、法事で実家に帰省する私は参加を見 送る。 2012/8/4 Tokyo.R#25
5
6.
前回までのあらすじ Tokyo.R#24 にて、#25の日程が2012/08/04に 決まる。 当日、法事で実家に帰省する私は参加を見 送る。 発表者リストに自分の名前を発見する。 2012/8/4 Tokyo.R#25
6
7.
前回までのあらすじ Tokyo.R#24 にて、#25の日程が2012/08/04に 決まる。 当日、法事で実家に帰省する私は参加を見 送る。 発表者リストに自分の名前を発見する。 (;゚д゚)ポカーン 2012/8/4 Tokyo.R#25
7
8.
前回までのあらすじ Tokyo.R#24 にて、#25の日程が2012/08/04に 決まる。 当日、法事で実家に帰省する私は参加を見 送る。 発表者リストに自分の名前を発見する。 (;゚д゚)ポカーン 滋賀からとんぼ返り←いまここ!! ※乗り換えた名古屋で赤福買ってきました。 2012/8/4 Tokyo.R#25
8
9.
背景
http://itpro.nikkeibp.co.jp/article/COLUMN/20120709/407924/ 2012/8/4 Tokyo.R#25 9
10.
背景 • R はビッグデータ解析環境として適しているの
か? – 確かに、各種ライブラリのおかげでデータを解析す る目的であれば極めて有用なツールである。 • R は基本的にデータをメモリ上に保持する。 – メモリ上限までしかデータを保持できない。 • R の処理系は決して高速とは呼べない。 – 基本的に単一CPUしか利用しない。 • ビッグデータと呼ばれる大規模データ解析に適し ていない? 2012/8/4 Tokyo.R#25 10
11.
背景 • 偉大な諸先輩方の貴重な資料
@sfchaos さん @wdkz さん (2011/04/10) (2011/11/26) • R で大規模データを扱う各種チャレンジは 継続的に行われている。 2012/8/4 Tokyo.R#25 11
12.
背景 • 今回のプレゼンテーションは以下の点に触れた
い。 – Rの商用パッケージである、RevoscaleR を使用 してHDD上でデータの処理を行う事が出来る。 – +α(LTネタについて) 2012/8/4 Tokyo.R#25 12
13.
RevoScaleRについて • Revolution Analytics
@カルフォルニア製 • Revolution R Enterprize に同梱されたパッ ケージみたいな扱い。 • 最近Revolution R Enterprize 6.0が出た。 • $1,000@1USER • アカデミアにいる人はフリーで利用でき る。 • 何か、ダウンロードするときにセキュリ ティに引っかかるんだけど。。。。広告 2012/8/4 Tokyo.R#25 13
14.
RevoScaleRについて • bigmemory, ff
などと同じくHDD上に一時ファイ ルを作成しそこにアクセスしながら解析する。 • Bigmemoryと違いData.frame を扱える。 • 独自関数で一般化線形モデルをサポート。 Summary Statistics,Crosstabulations Correlation and Covariance,Linear Regression Binomial Logistic Regression, Principal Components Analysis Generalized Linear Modeling,K-means clustering, Predictions • どうも、分散処理をサポートしているらしい。 2012/8/4 Tokyo.R#25 14
15.
今回使用するデータセットについ て • Data Expo
2009 – アメリカの航空旅客機の飛行データ – 1987年~2008年 – http://stat-computing.org/dataexpo/2009/the- data.html – フライトの日時や予定離着陸時間、目的地な どの情報を29カラムで表している。 – 今回は、時間の都合上2008年のデータを使用 2012/8/4 Tokyo.R#25 15
16.
RevoscaleR の使い方 1. データをHDD上にXDFファイル
として格納 2. XDFファイルの編集 3. XDFファイルの解析 4. 分散処理 2012/8/4 Tokyo.R#25 16
17.
RevoscaleR の使い方 1. データをHDD上にXDFファイル
として格納 2. XDFファイルの編集 3. XDFファイルの解析 4. 分散処理 2012/8/4 Tokyo.R#25 17
18.
RevoscaleR の使い方 データの格納 dat.2008.rx
<- rxTextToXdf(inFile="C:/Users/hoge/2008.csv", outFile="C:/Users/hoge/air2008.xdf", overwrite=TRUE) 入力ファイル(テキストファイル) 出力ファイル(.xdf)のパ のパス ス rxImportToXdf(inSource, outSource, rowSelection = NULL, transforms = NULL, transformFunc = NULL, transformVars = NULL, userObjects = NULL, append = "none", overwrite = FALSE, numRows = -1, reportProgress = rxGetOption("reportProgress")) SASのデータセットとかも読めるらし い。 2012/8/4 Tokyo.R#25 18
19.
RevoscaleR の使い方
データの格納 dat.2008.rx <- rxTextToXdf(inFile="C:/Users/hoge/2008.csv", outFile="C:/Users/hoge/air2008.xdf", overwrite=TRUE, colClasses=) colClasses :“logical”, “integer”,“factor”, “numeric”, “character”等が指定できる。 2012/8/4 Tokyo.R#25 19
20.
RevoscaleR の使い方 1. データをHDD上にXDFファイル
として格納 2. XDFファイルの編集 3. XDFファイルの解析 4. 分散処理 2012/8/4 Tokyo.R#25 20
21.
RevoscaleR の使い方
XDFファイルの編集 • XDFファイルの中身の確認 rxGetInfoXdf("C:/hoge/air2008.xdf", getVarInfo = TRUE) File name: C:/hoge/air2008.xdf Number of observations: 7009728 Number of variables: 29 Number of blocks: 15 Variable information: Var 1: Year, Type: integer, Low/High: (2008, 2008) Var 2: Month, Type: integer, Low/High: (1, 12) : 2012/8/4 Tokyo.R#25 21
22.
RevoscaleR の使い方 XDFファイルの編集 • XDFファイルの中身の編集
rxDataStepXdf(inFile = inputFile, outFile = outputFile, transforms = list(a = Year * 20, b = 100 * Month), #rowSelection = Weekday == 0, varsToKeep = varsToKeep, overwrite = TRUE) File name: C:/hoge/air2008.xdf Number of observations: 7009728 : Var 29: LateAircraftDelay, Type: integer, Low/High: (0, 1316) Var 30: a, Type: numeric, Low/High: (4016000.0000, 4016000.0000) Var 31: b, Type: numeric, Low/High: (20.0000, 240.0000) 2012/8/4 Tokyo.R#25 22
23.
RevoscaleR の使い方 1. データをHDD上にXDFファイル
として格納 2. XDFファイルの編集 3. XDFファイルの解析 4. 分散処理 2012/8/4 Tokyo.R#25 23
24.
RevoscaleR の使い方 XDFファイルの解析 • XDFファイルのクロス表集計
CTabs <- rxCrossTabs(ArrDelay ~ Origin, data = "C:/hoge/air2008.xdf") 何かうまく動かなかったです。 最初の読み込み時にちゃんと型設定すべきでした。 雰囲気的にはreshape2みたいなのりでデータの加 工が出来るっぽい? 2012/8/4 Tokyo.R#25 24
25.
RevoscaleR の使い方 XDFファイルの解析 •
XDFファイル→ヒストグラム rxHistogram(~AirTime, data = "C:/hoge/air2008.xdf") 2012/8/4 Tokyo.R#25 25
26.
RevoscaleR の使い方 XDFファイルの解析 • XDFファイルを直接GLMにぶち込む。 •
多分、rxLinMod()あたりにオプション指定する事で出来そ う? 調査中 2012/8/4 Tokyo.R#25 26
27.
RevoscaleR の使い方 1. データをHDD上にXDFファイル
として格納 2. XDFファイルの編集 3. XDFファイルの解析 4. 分散処理 2012/8/4 Tokyo.R#25 27
28.
RevoscaleR の使い方 分散処理 • ニュースリリースには、Revoscale
Rは並列処理機能を有 し、Windows HPC Serverやクラウド環境での並列処理を実 施できるとある。。。 調査中 2012/8/4 Tokyo.R#25 28
29.
まとめに変えて • RevoScaleRでHDD上でのデータ処理が可能
となることから、メモリ上限の制約からR を解き放つ事が出来る。 • ちょっと、遅い気がする。 – 並列処理機能についてもう少し調査が必要 – 高速なドライブ(FusionIO社製 iOdrive)との 相性は? • $1000の価値があるかはもう少し見ないと わからない。 2012/8/4 Tokyo.R#25 29
30.
現在の心境
調査未実施が多いことをお詫びします。 次の機会に、追加情報をお届けします。 2012/8/4 Tokyo.R#25 30
31.
参考文献 @sfchaos さん資料 http://www.slideshare.net/sfchaos/rbigmemory-tokyowebmining10 @wdkz さん資料 http://www.slideshare.net/wdkz/rffbigmemoryrevoscaler-10334116 Revolution
Analytics http://www.revolutionanalytics.com/ 2012/8/4 Tokyo.R#25 31
32.
+α • 実は、今回LT予定でした。 • LTテーマは
「データ前処理・失敗分析」 2012/8/4 Tokyo.R#25 32
33.
某飲み会にて。。。 • “ビールうめー!” • “女性の前では否定的な言葉は使わない。
なんかめんどくさいことがあったら嫌い じゃないんだよねって言うとよいよ!” • “R 使って解析するわけだけど、データの 前処理ってかなり大切だよね?” • “解析って色々やるわけだけど、失敗分析 についても共有すべきだよね?”
34.
分析者のお悩みあるある!!
35.
次回(今回?)予告 • 私のテーマ
「Excelの結合セルに関するごり押し事 例」 • みなさんのバッドノウハウとか、失敗事 例LTで発表しませんか? • 主催者の里さんと、皆様のご意見を賜り たいと思います。 2012/8/4 Tokyo.R#25 35
36.
Thank You ! 2012/8/4
Tokyo.R#25 36
Download