Download free for 30 days
Sign in
Upload
Language (EN)
Support
Business
Mobile
Social Media
Marketing
Technology
Art & Photos
Career
Design
Education
Presentations & Public Speaking
Government & Nonprofit
Healthcare
Internet
Law
Leadership & Management
Automotive
Engineering
Software
Recruiting & HR
Retail
Sales
Services
Science
Small Business & Entrepreneurship
Food
Environment
Economy & Finance
Data & Analytics
Investor Relations
Sports
Spiritual
News & Politics
Travel
Self Improvement
Real Estate
Entertainment & Humor
Health & Medicine
Devices & Hardware
Lifestyle
Change Language
Language
English
Español
Português
Français
Deutsche
Cancel
Save
Submit search
EN
Uploaded by
Shinya Uryu
PDF, PPTX
14,615 views
前処理のための前処理(Tokyo.R#45)
SERIES: Data manipulation in Tokyo.R#45@Shibuya, Tokyo (20150117)
Engineering
◦
Read more
17
Save
Share
Embed
Embed presentation
Download
Download as PDF, PPTX
1
/ 33
2
/ 33
3
/ 33
4
/ 33
5
/ 33
6
/ 33
7
/ 33
8
/ 33
9
/ 33
10
/ 33
11
/ 33
12
/ 33
13
/ 33
14
/ 33
15
/ 33
16
/ 33
17
/ 33
18
/ 33
19
/ 33
20
/ 33
21
/ 33
22
/ 33
23
/ 33
24
/ 33
25
/ 33
26
/ 33
27
/ 33
28
/ 33
29
/ 33
30
/ 33
31
/ 33
32
/ 33
33
/ 33
More Related Content
PPTX
派生開発推進協議会(AFFORDD)紹介
by
AFFORDDstaff
PDF
「R for Cloud Computing」の紹介
by
Takekatsu Hiramura
PPTX
R45LT
by
TokorosawaYoshio
PDF
20151205 Japan.R SparkRとParquet
by
Ryuji Tamagawa
PDF
Jenkins によるレポートスクリプト管理
by
Tatsuya Tojima
PPTX
Tokyo r45 beginner_2
by
Takashi Minoda
PPTX
SeekR Annual Search Trends Report 2015
by
Takekatsu Hiramura
PDF
10分で分かるr言語入門 短縮バージョン 15-0117_upload用
by
Nobuaki Oshiro
派生開発推進協議会(AFFORDD)紹介
by
AFFORDDstaff
「R for Cloud Computing」の紹介
by
Takekatsu Hiramura
R45LT
by
TokorosawaYoshio
20151205 Japan.R SparkRとParquet
by
Ryuji Tamagawa
Jenkins によるレポートスクリプト管理
by
Tatsuya Tojima
Tokyo r45 beginner_2
by
Takashi Minoda
SeekR Annual Search Trends Report 2015
by
Takekatsu Hiramura
10分で分かるr言語入門 短縮バージョン 15-0117_upload用
by
Nobuaki Oshiro
Similar to 前処理のための前処理(Tokyo.R#45)
PDF
R note 01_ver1.2
by
Satoshi Kume
PDF
データ解析技術入門(R編)
by
Takumi Asai
PPT
K010 appstat201201
by
t2tarumi
PDF
Rブートキャンプ
by
Kosuke Sato
ODP
第3回関西ゼロから始めるR勉強会
by
Iida Keisuke
PDF
第3回Japan rパネルディスカッション
by
Yohei Sato
PPTX
R高速化
by
Monta Yashi
PDF
Rの高速化
by
弘毅 露崎
PDF
Tokyor23 doradora09
by
Nobuaki Oshiro
PPTX
関東第1回r勉強会
by
Iida Keisuke
PDF
Rによるemailコミュニケーションの可視化
by
銀平 御園生
PDF
Rあんなときこんなとき(tokyo r#12)
by
Shintaro Fukushima
PPTX
Rプログラミング02 データ入出力編
by
wada, kazumi
DOCX
Ⅲ. 資料編 2017
by
wada, kazumi
PDF
10min r study_tokyor25
by
Nobuaki Oshiro
PDF
10min r study_tokyor25
by
Nobuaki Oshiro
PDF
初心者講習会資料(Osaka.R#7)
by
Masahiro Hayashi
PDF
初心者講習会資料(Osaka.r#6)
by
Masahiro Hayashi
PPT
R intro
by
yayamamo @ DBCLS Kashiwanoha
PDF
レボリューションR(RRE)のご紹介
by
Satoshi Kitajima
R note 01_ver1.2
by
Satoshi Kume
データ解析技術入門(R編)
by
Takumi Asai
K010 appstat201201
by
t2tarumi
Rブートキャンプ
by
Kosuke Sato
第3回関西ゼロから始めるR勉強会
by
Iida Keisuke
第3回Japan rパネルディスカッション
by
Yohei Sato
R高速化
by
Monta Yashi
Rの高速化
by
弘毅 露崎
Tokyor23 doradora09
by
Nobuaki Oshiro
関東第1回r勉強会
by
Iida Keisuke
Rによるemailコミュニケーションの可視化
by
銀平 御園生
Rあんなときこんなとき(tokyo r#12)
by
Shintaro Fukushima
Rプログラミング02 データ入出力編
by
wada, kazumi
Ⅲ. 資料編 2017
by
wada, kazumi
10min r study_tokyor25
by
Nobuaki Oshiro
10min r study_tokyor25
by
Nobuaki Oshiro
初心者講習会資料(Osaka.R#7)
by
Masahiro Hayashi
初心者講習会資料(Osaka.r#6)
by
Masahiro Hayashi
R intro
by
yayamamo @ DBCLS Kashiwanoha
レボリューションR(RRE)のご紹介
by
Satoshi Kitajima
Recently uploaded
PDF
ソフトとハードの二刀流で実現する先進安全・自動運転のアルゴリズム開発【DENSO Tech Night 第二夜】 ー高精度な画像解析 / AI推論モデル ...
by
dots.
PPTX
君をむしばむこの力で_最終発表-1-Monthon2025最終発表用資料-.pptx
by
rintakano624
PDF
krsk_aws_re-growth_aws_devops_agent_20251211
by
uedayuki
PDF
音楽アーティスト探索体験に特化した音楽ディスカバリーWebサービス「DigLoop」|Created byヨハク技研
by
yohakugiken
PDF
ソフトウェアエンジニアがクルマのコアを創る!? モビリティの価値を最大化するソフトウェア開発の最前線【DENSO Tech Night 第一夜】
by
dots.
PDF
2025/12/12 AutoDevNinjaピッチ資料 - 大人な男のAuto Dev環境
by
Masahiro Takechi
ソフトとハードの二刀流で実現する先進安全・自動運転のアルゴリズム開発【DENSO Tech Night 第二夜】 ー高精度な画像解析 / AI推論モデル ...
by
dots.
君をむしばむこの力で_最終発表-1-Monthon2025最終発表用資料-.pptx
by
rintakano624
krsk_aws_re-growth_aws_devops_agent_20251211
by
uedayuki
音楽アーティスト探索体験に特化した音楽ディスカバリーWebサービス「DigLoop」|Created byヨハク技研
by
yohakugiken
ソフトウェアエンジニアがクルマのコアを創る!? モビリティの価値を最大化するソフトウェア開発の最前線【DENSO Tech Night 第一夜】
by
dots.
2025/12/12 AutoDevNinjaピッチ資料 - 大人な男のAuto Dev環境
by
Masahiro Takechi
前処理のための前処理(Tokyo.R#45)
1.
前処理のための前処理 シリーズ前処理 2015 @u_ribo Tokyo.R#45 January
17, 2015
2.
Tokyo.R シリーズ前処理: おさらい
3.
前処理 【広義】手元にある観測データを、 意図する分析手法が適用できる形にまで もっていく方法 http://www.slideshare.net/dichika/maeshori-missing
4.
解析時間のほとんどは前処理 25 50 75 0/100 effort "" time Analysis Manipulation Dasu and
Johnson 2003. Exploratory Data Mining and Data Cleaning. Wiley
5.
[1] “無駄” “無駄”
“無駄” “無駄” “無駄” “無駄” “無駄” “無駄” [9] “無駄” “無駄” “無駄” “無駄” “無駄” “無駄” “無駄” “無駄” [17] “無駄” “無駄” “無駄” “無駄” “無駄” “無駄” “無駄” “無駄” [25] “無駄” “無駄” “無駄” “無駄” “無駄” “無駄” “無 駄” “無駄” [33] “無駄” “無駄” “無駄” “無駄” “無駄” “無駄” “無駄” “無駄” [41] “無駄” “無駄” “無駄” “無駄” “無駄” “無駄” “無駄” “無駄” [49] “無駄” “無駄” “無駄” “無駄” “無駄” “無駄” “無 駄” “無駄” [57] “無駄” “無駄” “無駄” “無駄” “無駄” “無駄” “無駄” “無駄” [65] “無駄” “無駄” “無駄” “無駄” “無駄” “無駄” “無駄” “無駄” [73] “無駄” “無駄” “無駄” “無駄” “無駄” “無駄” “無
6.
前処理に時間がかかる -> 最終的な出力結果の質が低下する
7.
[1] “どうしてこうなった” “どうしてこうなった” [3]
“どうしてこうなった” “どうしてこうなった” [5] “どうしてこうなった” “どうしてこうなった” [7] “どうしてこうなった” “どうしてこうなった” [9] “どうしてこうなった” “どうしてこうなった” [11] “どうしてこうなった” “どうしてこうなった” [13] “どうしてこうなった” “どうしてこうなった” [15] “どうしてこうなった” “どうしてこうなった” [17] “どうしてこうなった” “どうしてこうなった” [19] “どうしてこうなった” “どうしてこうなった” [21] “どうしてこうなった” “どうしてこうなった” [23] “どうしてこうなった” “どうしてこうなった” [25] “どうしてこうなった” “どうしてこうなった”
8.
Tokyo.R シリーズ前処理 今日のテーマ: 前処理のための 前処理
9.
もちべーしょん: 前処理の苦労を減らしたい 内容… データ解析、前処理における環境構築、心がけ
ぼくのがんがえたこうりつてきなまえしょり、 そのためにひつようなまえしょり 議論を通じて知識・理解を深めたい
10.
#Tsurami
11.
#Tsurami https://twitter.com/yamano357/status/552514988137783301
12.
#Tsurami https://twitter.com/gg_hatano/status/551328451068588032
13.
#Tsurami Japan.R2014 所 さわ 沢さんの発表 より... Remember
why are you using SJIS? https://github.com/hadley/dplyr/issues/339
14.
前処理を行う際に生じる問題の原因 Are
you okay? 邪智暴虐な俺々ファイルの存在 コメントのない奇怪なコード 作業過程の再現性の欠如 とりあえず、的に書かれたコード
15.
[1] “滅” “滅”
“滅” “滅” “滅” “滅” “滅” “滅” “滅” “滅” “滅” [12] “滅” “滅” “滅” “滅” “滅” “滅” “滅” “滅” “滅” “滅” “滅” [23] “滅” “滅” “滅” “滅” “滅” “滅” “滅” “滅” “滅” “滅” “滅” [34] “滅” “滅” “滅” “滅” “滅” “滅” “滅” “滅” “滅” “滅” “滅” [45] “滅” “滅” “滅” “滅” “滅” “滅” “滅” “滅” “滅” “滅” “滅” [56] “滅” “滅” “滅” “滅” “滅” “滅” “滅” “滅” “滅” “滅” “滅” [67] “滅” “滅” “滅” “滅” “滅” “滅” “滅” “滅” “滅” “滅” “滅” [78] “滅” “滅” “滅” “滅” “滅” “滅” “滅” “滅” “滅” “滅” “滅” [89] “滅” “滅” “滅” “滅” “滅” “滅” “滅” “滅” “滅” “滅” “滅” [100] “滅” “滅” “滅” “滅” “滅” “滅” “滅” “滅”
16.
R を使った前処理5原則 1. 作業は
RStudio 内ですべて完結させる 2. .Rproj を作成する 3. .Rmd でファイルを保存する 4. Git によるバージョン管理をおこなう 5. プロジェクトのガイドラインを策定する
17.
R における統合開発環境: RStudio
そろそろ ver.0.99 Viewer の強化 パッケージ名の補完 ref) http://goo.gl/inFdt5 これから説明する内容は すべて RStudio 上で行える
18.
話題閑話
19.
絶許 https://twitter.com/gg_hatano/status/555923067675738113
20.
.Rproj フォルダ内にフォルダ名.Rproj というファイ ルが生成
RStudio の設定などが記述される ご利益 面倒なフォルダ指定、setwd からの開放 パッケージ管理ツール Packrat の利用 Git の運用
22.
.Rmd: R +
Markdown + LATEX = POWERFUL このスライドも.Rmd で書いている lab.noteパッケージでどうぞ 1 rmarkdown::draft(”MyReport.Rmd”,template=”basic_report”,package=”lab.note”) 1 ただし Windows、Linux、テメーらはダメだ(未検証)
23.
アウトプットオオオオオオオオ!!!! ぼく「(モニターで確認して)よし、これでいいな」 ボス「図を印刷して見せて」 ぼく「(あああああああああ!!!!!!!!!)」 LATEX おじさんが誕生した 2 2 HTML
での出力はモニター向け。PDF を印刷したいよね、と。Word? しらん
24.
Git: 分散型バージョン管理システム 長い時間を経てプロジェクトは完成される
完成後も管理し続ける必要が生じる 同様の処理を、別プロジェクトで、自分以外の 誰かが行う場合がある 記録として残すことが大事
25.
GitHub で広がるコミュニケーション パッケージを作って公開
今日からあなたも開発者 芝を生やしてもちべーしょんを高めよう!
26.
README ≒ 嫁
リポジトリ(プロジェクト)の顔 迷った際はここを見れば解決できるように 1. 作業のワークフローを書く 2. ファイル名、関数名の規則 3. プロットの色、サイズ
27.
Tips とにかく日本語は NG
SJIS 犬 -> INU にするなら辞書をひいてdog に ローマ字カナも良くない Excel は入力・閲覧用 -> dplyr パッケージで 単位変換、新たな列の作成は闇 ハイフン、アンダーバーをどう扱うか スペースの落とし穴 (LATEX)
28.
「いろいろと面倒だ」
29.
「でも、あなたのちっぽけな 頭では忘れてしまう でしょう(煽り)」 「ぐぬぬ」
30.
自分のため、 仲間のため、
誰かのため Let’s go!
31.
@dichika 進捗どうですか http://www.slideshare.net/dichika/maeshori-missing
32.
みんなで #Tsurami を供養しよう https://github.com/uribo/data_treatment
33.
Sessioninfo: R version
3.1.2 (2014-10-31) [1] “webshot” “ggthemr” “knitcitations” [4] “fortunes” “xtable” “rmarkdown” [7] “devtools” “popbio” “quadprog” [10] “ggplot2” “glmmML” “dplyr” [13] “magrittr” “MASS” “lattice” [16] “stringr” “knitr” Questions?
Download