Download free for 30 days
Sign in
Upload
Language (EN)
Support
Business
Mobile
Social Media
Marketing
Technology
Art & Photos
Career
Design
Education
Presentations & Public Speaking
Government & Nonprofit
Healthcare
Internet
Law
Leadership & Management
Automotive
Engineering
Software
Recruiting & HR
Retail
Sales
Services
Science
Small Business & Entrepreneurship
Food
Environment
Economy & Finance
Data & Analytics
Investor Relations
Sports
Spiritual
News & Politics
Travel
Self Improvement
Real Estate
Entertainment & Humor
Health & Medicine
Devices & Hardware
Lifestyle
Change Language
Language
English
Español
Português
Français
Deutsche
Cancel
Save
EN
HK
Uploaded by
Hiroki K
2,496 views
Factor型の注意点
異常値が混入したデータを読み込むときの注意点
Technology
◦
Read more
2
Save
Share
Embed
Embed presentation
Download
Download to read offline
1
/ 15
2
/ 15
3
/ 15
4
/ 15
5
/ 15
6
/ 15
7
/ 15
8
/ 15
9
/ 15
10
/ 15
11
/ 15
12
/ 15
13
/ 15
14
/ 15
15
/ 15
More Related Content
PDF
XOOPS Cube Conference 2012 Developer Workshop 3
by
Hikawa Kilica
PDF
【第二回Android勉強会】データ永続化
by
Ishin FUKUOKA
PDF
D3.jsによるDOM操作
by
清水 正行
PDF
20150530 pgunconf-pgbench-semi-structured-benchmark
by
Toshi Harada
PPTX
PandasとSQLとの比較
by
iPride Co., Ltd.
PDF
End challenge Part1
by
hisa2
PPTX
PHP Object Injection入門
by
Yu Iwama
PDF
struts2 tag
by
夏雄 山本
XOOPS Cube Conference 2012 Developer Workshop 3
by
Hikawa Kilica
【第二回Android勉強会】データ永続化
by
Ishin FUKUOKA
D3.jsによるDOM操作
by
清水 正行
20150530 pgunconf-pgbench-semi-structured-benchmark
by
Toshi Harada
PandasとSQLとの比較
by
iPride Co., Ltd.
End challenge Part1
by
hisa2
PHP Object Injection入門
by
Yu Iwama
struts2 tag
by
夏雄 山本
Similar to Factor型の注意点
PDF
初心者講習会資料(Osaka.r#6)
by
Masahiro Hayashi
PDF
初心者講習会資料(Osaka.R#7)
by
Masahiro Hayashi
PDF
Introduction to R
by
Yukihiro NAKAJIMA
PDF
初心者講習会資料(Osaka.R#5)
by
Masahiro Hayashi
PDF
第8回 大規模データを用いたデータフレーム操作実習(2)
by
Wataru Shito
PPTX
Rプログラミング02 データ入出力編
by
wada, kazumi
PPTX
統計環境R_データ入出力編2016
by
wada, kazumi
PDF
Rあんなときこんなとき(tokyo r#12)
by
Shintaro Fukushima
DOCX
Ⅲ. 資料編 2017
by
wada, kazumi
PDF
Tokyor23 doradora09
by
Nobuaki Oshiro
PDF
SappoRo.R #2 初心者向けWS資料
by
考司 小杉
PDF
10分で分かるr言語入門ver2.9 14 0920
by
Nobuaki Oshiro
DOCX
Ⅱ. データ分析編 2017
by
wada, kazumi
PDF
10分で分かるr言語入門ver2.10 14 1101
by
Nobuaki Oshiro
PDF
外国語教育メディア学会第54回全国研究大会ワークショップ「Rによる外国語教育データの分析と可視化の基本」
by
SAKAUE, Tatsuya
PPT
K010 appstat201201
by
t2tarumi
PDF
Tokyor60 r data_science_part1
by
Yohei Sato
ODP
第2回R勉強会1
by
Paweł Rusin
PDF
Yamadai.Rデモンストレーションセッション
by
考司 小杉
PDF
LET2011: Rによる教育データ分析入門
by
Yuichiro Kobayashi
初心者講習会資料(Osaka.r#6)
by
Masahiro Hayashi
初心者講習会資料(Osaka.R#7)
by
Masahiro Hayashi
Introduction to R
by
Yukihiro NAKAJIMA
初心者講習会資料(Osaka.R#5)
by
Masahiro Hayashi
第8回 大規模データを用いたデータフレーム操作実習(2)
by
Wataru Shito
Rプログラミング02 データ入出力編
by
wada, kazumi
統計環境R_データ入出力編2016
by
wada, kazumi
Rあんなときこんなとき(tokyo r#12)
by
Shintaro Fukushima
Ⅲ. 資料編 2017
by
wada, kazumi
Tokyor23 doradora09
by
Nobuaki Oshiro
SappoRo.R #2 初心者向けWS資料
by
考司 小杉
10分で分かるr言語入門ver2.9 14 0920
by
Nobuaki Oshiro
Ⅱ. データ分析編 2017
by
wada, kazumi
10分で分かるr言語入門ver2.10 14 1101
by
Nobuaki Oshiro
外国語教育メディア学会第54回全国研究大会ワークショップ「Rによる外国語教育データの分析と可視化の基本」
by
SAKAUE, Tatsuya
K010 appstat201201
by
t2tarumi
Tokyor60 r data_science_part1
by
Yohei Sato
第2回R勉強会1
by
Paweł Rusin
Yamadai.Rデモンストレーションセッション
by
考司 小杉
LET2011: Rによる教育データ分析入門
by
Yuichiro Kobayashi
Factor型の注意点
1.
FACTOR型の注意点 Hiroki. K
2.
Factor型について 水準(Levels)がある変数 デフォルト設定でData.Frameをつくる場合、文字列はFactorとなる (例)
> ans <- data.frame(result=c('yes', 'no', 'yes')) > str(ans) 'data.frame': 3 obs. of 1 variable: $ result: Factor w/ 2 levels "no","yes": 2 1 2 水準(Levels) 順位 no 1 yes 2 result 1 2 1 ans =
3.
Factor型の操作が必要になる場合 水準を任意の順に設定する(デフォルトはアルファベット順) 例1: yes、noの順になるようにData.Frameをつくる >
ans <- data.frame(result=c('yes', 'no', 'yes'), levels=('yes', 'no')) > str(ans) 'data.frame': 3 obs. of 1 variable: $ result: Factor w/ 2 levels “yes",“no": 1 2 1
4.
【準備】以降で使うデータ① #サンプルデータ: 1週間の曜日と値 > set.seed(123) >
data <- data.frame(day = c('mon', 'tue', 'wed', 'thu', 'fri', 'sat', 'sun'), val = rnorm(7)) > str(data) 'data.frame': 7 obs. of 2 variables: $ day: Factor w/ 7 levels "fri","mon","sat",..: 2 6 7 5 1 3 4 $ val: num 0.78 1.456 -0.644 -1.553 -1.598 ...
5.
【準備】以降で使うデータ② #サンプルデータ: 数値にエラーが入る場合 > data$valError
<- c('error', data$val[-1]) > str(data) 'data.frame': 7 obs. of 4 variables: $ day: Factor w/ 7 levels "fri","mon","sat",..: 2 6 7 5 1 3 4 $ val: num 0.62 0.612 -0.162 0.812 2.197 ... $ daySorted: Factor w/ 7 levels "mon","tue","wed",..: 1 2 3 4 5 6 7 $ valError: chr "error" "0.612123492650849" "-0.162310976918126" ...
6.
【準備】以降で使うデータ③ #サンプルデータ: 曜日の水準の並べ替え⇒曜日順にする > data$daySorted
<- factor(data$day, levels=data$day) #data$daySorted <- factor(data$day, levels=c(‘mon’, ‘tue’, ‘wed’, ‘thu’, ‘fri’, ‘sat’, ‘sun’))と同じ > str(data) 'data.frame': 7 obs. of 4 variables: $ day: Factor w/ 7 levels "fri","mon","sat",..: 2 6 7 5 1 3 4 $ val: num 0.62 0.612 -0.162 0.812 2.197 ... $ daySorted: Factor w/ 7 levels "mon","tue","wed",..: 1 2 3 4 5 6 7
7.
【準備】以降で使うデータ④ #サンプルデータ: 一旦CSVで保存して再度読み込む > write.csv(data,
'data.csv', row.names=F) > data1 <- read.csv('data.csv') > data1$daySorted <- factor(data1$daySorted, levels=data1$daySorted) > str(data1) 'data.frame': 7 obs. of 4 variables: $ day: Factor w/ 7 levels "fri","mon","sat",..: 2 6 7 5 1 3 4 $ val: num 0.62 0.612 -0.162 0.812 2.197 ... $ daySorted: Factor w/ 7 levels "mon","tue","wed",..: 1 2 3 4 5 6 7 $ valError: chr "error" "0.612123492650849" "-0.162310976918126" ...
8.
【準備】以降で使うデータ⑤ #ここまでで準備したもの day val daySorted
valError mon 0.6204 mon error tue 0.6121 tue 0.6121 wed -0.1623 wed -0.1623 thu 0.8119 thu 0.8119 fri 2.1968 fri 2.1968 sat 2.0492 sat 2.0492 sun 1.6324 sun 1.6324 data = 保存・再読み込み day val daySorted valError mon 0.6204 mon error tue 0.6121 tue 0.6121 wed -0.1623 wed -0.1623 thu 0.8119 thu 0.8119 fri 2.1968 fri 2.1968 sat 2.0492 sat 2.0492 sun 1.6324 sun 1.6324 data1 = chr num factor chr chr num factor factor
9.
Factorの並び替え デフォルトはアルファベット順 例2: dataのday,
valをグラフ化 そのままグラフ化する場合: > ggplot(data, aes(x=day, y=val)) + geom_bar(stat='identity') + theme_bw()
10.
Factorの並び替え 水準を任意の順に設定する 例3: dataのdaySorted,
valをグラフ化 > ggplot(data, aes(x=day, y=valSorted)) + geom_bar(stat='identity') + theme_bw() 曜日順になっている ⇒
11.
Factorに異常値が混入している場合 まずは異常値が混入していない場合 例3: dataのdaySorted,
valをグラフ化(再掲) > ggplot(data, aes(x=day, y=valSorted)) + geom_bar(stat='identity') + theme_bw()
12.
Factorに異常値が混入している場合 次に異常値(error)が混入している場合 例4: dataのdaySorted,
valErrorをグラフ化 > ggplot(data, aes(x=daySorted, y=as.numeric(valError))) + geom_bar(stat='identity') + theme_bw() as.numericで異常値分が欠損になる(NAに強制変換)
13.
Factorに異常値が混入している場合 異常値(error)が混入しているデータを再読み込みする 例4: data1のdaySorted,
valErrorをグラフ化 > ggplot(data1, aes(x=daySorted, y=as.numeric(valError))) + geom_bar(stat='identity') + theme_bw() as.numericでFactorの順位が数値化されてしまう
14.
Factorに異常値が混入している場合 data valに欠損値 保存・再読み込み
data1 as.numeric(val) as.numeric(val) そのまま数値化できない
15.
Factorに異常値が混入している場合 data valに欠損値 保存・再読み込み
data1 as.numeric(val) as.numeric(as.character(val)) 一回文字列に直してから数値化
Download