Download free for 30 days
Sign in
Upload
Language (EN)
Support
Business
Mobile
Social Media
Marketing
Technology
Art & Photos
Career
Design
Education
Presentations & Public Speaking
Government & Nonprofit
Healthcare
Internet
Law
Leadership & Management
Automotive
Engineering
Software
Recruiting & HR
Retail
Sales
Services
Science
Small Business & Entrepreneurship
Food
Environment
Economy & Finance
Data & Analytics
Investor Relations
Sports
Spiritual
News & Politics
Travel
Self Improvement
Real Estate
Entertainment & Humor
Health & Medicine
Devices & Hardware
Lifestyle
Change Language
Language
English
Español
Português
Français
Deutsche
Cancel
Save
Submit search
EN
Uploaded by
weda654
PPT, PDF
16,446 views
Dummiesパッケージ
Tokyo.Rの42回にて、かんたんにダミー変数がつくれるパッケージを試してみた
Data & Analytics
◦
Read more
12
Save
Share
Embed
Embed presentation
Download
Downloaded 11 times
1
/ 11
2
/ 11
3
/ 11
4
/ 11
5
/ 11
6
/ 11
7
/ 11
8
/ 11
9
/ 11
10
/ 11
11
/ 11
More Related Content
PPTX
多変量解析
by
Yoshihiro_Handa
PDF
ggplot2によるグラフ化@HijiyamaR#2
by
nocchi_airport
PDF
Gephi Quick Start (Japanese)
by
あしたのオープンソース研究所
PDF
スペクトラル・クラスタリング
by
Akira Miyazawa
PDF
Rでソーシャルネットワーク分析
by
Hiroko Onari
PDF
Rによるemailコミュニケーションの可視化
by
銀平 御園生
PPTX
主成分分析
by
大貴 末廣
PDF
SQLで身につける!初めてのレコメンド 〜 基礎から応用まで ~
by
Naoto Tamiya
多変量解析
by
Yoshihiro_Handa
ggplot2によるグラフ化@HijiyamaR#2
by
nocchi_airport
Gephi Quick Start (Japanese)
by
あしたのオープンソース研究所
スペクトラル・クラスタリング
by
Akira Miyazawa
Rでソーシャルネットワーク分析
by
Hiroko Onari
Rによるemailコミュニケーションの可視化
by
銀平 御園生
主成分分析
by
大貴 末廣
SQLで身につける!初めてのレコメンド 〜 基礎から応用まで ~
by
Naoto Tamiya
What's hot
PDF
Road to ggplot2再入門
by
nocchi_airport
PDF
GiNZAで始める日本語依存構造解析 〜CaboCha, UDPipe, Stanford NLPとの比較〜
by
Megagon Labs
PDF
2 5 3.一般化線形モデル色々_Gamma回帰と対数線形モデル
by
logics-of-blue
PDF
プレゼン・ポスターで自分の研究を「伝える」 (How to do technical oral/poster presentation)
by
Toshihiko Yamasaki
PDF
Datamining 8th Hclustering
by
sesejun
PDF
機械学習システムを受託開発 する時に気をつけておきたい事
by
BrainPad Inc.
PPTX
データサイエンス概論第一=2-1 データ間の距離と類似度
by
Seiichi Uchida
PDF
単調回帰を用いた一般化トレンド・ファクター:暗号資産市場への応用 SigFin発表スライド
by
Kei Nakagawa
PPTX
ggplot2再入門(2015年バージョン)
by
yutannihilation
PDF
幾何と機械学習: A Short Intro
by
Ichigaku Takigawa
PDF
Newman アルゴリズムによるソーシャルグラフのクラスタリング
by
Atsushi KOMIYA
PDF
MIXUPは最終層でやった方がいいんじゃないか説
by
亮宏 藤井
PDF
Deformable Part Modelとその発展
by
Takao Yamanaka
PDF
階層的クラスタリング入門の入門
by
Mas Kot
PDF
はじめてのパターン認識輪読会 10章後半
by
koba cky
PDF
データ解析のための統計モデリング入門 1~2章
by
itoyan110
PDF
Rによるやさしい統計学第20章「検定力分析によるサンプルサイズの決定」
by
Takashi J OZAKI
PDF
Stan超初心者入門
by
Hiroshi Shimizu
PDF
Gephi Tutorial Visualization (Japanese)
by
あしたのオープンソース研究所
PPTX
StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章
by
Shushi Namba
Road to ggplot2再入門
by
nocchi_airport
GiNZAで始める日本語依存構造解析 〜CaboCha, UDPipe, Stanford NLPとの比較〜
by
Megagon Labs
2 5 3.一般化線形モデル色々_Gamma回帰と対数線形モデル
by
logics-of-blue
プレゼン・ポスターで自分の研究を「伝える」 (How to do technical oral/poster presentation)
by
Toshihiko Yamasaki
Datamining 8th Hclustering
by
sesejun
機械学習システムを受託開発 する時に気をつけておきたい事
by
BrainPad Inc.
データサイエンス概論第一=2-1 データ間の距離と類似度
by
Seiichi Uchida
単調回帰を用いた一般化トレンド・ファクター:暗号資産市場への応用 SigFin発表スライド
by
Kei Nakagawa
ggplot2再入門(2015年バージョン)
by
yutannihilation
幾何と機械学習: A Short Intro
by
Ichigaku Takigawa
Newman アルゴリズムによるソーシャルグラフのクラスタリング
by
Atsushi KOMIYA
MIXUPは最終層でやった方がいいんじゃないか説
by
亮宏 藤井
Deformable Part Modelとその発展
by
Takao Yamanaka
階層的クラスタリング入門の入門
by
Mas Kot
はじめてのパターン認識輪読会 10章後半
by
koba cky
データ解析のための統計モデリング入門 1~2章
by
itoyan110
Rによるやさしい統計学第20章「検定力分析によるサンプルサイズの決定」
by
Takashi J OZAKI
Stan超初心者入門
by
Hiroshi Shimizu
Gephi Tutorial Visualization (Japanese)
by
あしたのオープンソース研究所
StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章
by
Shushi Namba
Viewers also liked
PDF
R入門(dplyrでデータ加工)-TokyoR42
by
Atsushi Hayakawa
PDF
20170923 excelユーザーのためのr入門
by
Takashi Kitano
PDF
RとStanでクラウドセットアップ時間を分析してみたら #TokyoR
by
Shuyo Nakatani
PDF
Mxnetで回帰 #TokyoR 53th
by
Akifumi Eguchi
PDF
Rで潜在ランク分析
by
Hiroshi Shimizu
PDF
20140625 rでのデータ分析(仮) for_tokyor
by
Takashi Kitano
PDF
20150303ぞくパタLT-ゆるふわ構造学習
by
Toru Imai
PDF
Rcppのすすめ
by
Masaki Tsuda
PPTX
データサイエンティスト必見!M-1グランプリ
by
Satoshi Kitajima
PDF
R を起動するその前に
by
Kosei ABE
PDF
TokyoR42_around_chaining
by
TokorosawaYoshio
PDF
マルコフ連鎖モンテカルロ法入門-1
by
Nagi Teramo
PDF
Rで代数統計 TokyoR #42 LT
by
Toru Imai
PDF
最強のハードディスクはどれだ?
by
Atsushi Hayakawa
PPTX
Tokyor42_r_datamining_18
by
Yohei Sato
PDF
Tokyor42 ggplot2
by
Yohei Sato
PPTX
Tokyo r33 beginner
by
Takashi Minoda
PPTX
Tokyo r30 anova
by
Takashi Minoda
PDF
Rで学ぶ 傾向スコア解析入門 - 無作為割り当てが出来ない時の因果効果推定 -
by
Yohei Sato
PDF
東京R非公式おじさんが教える本当に気持ちいいパッケージ作成法
by
Nagi Teramo
R入門(dplyrでデータ加工)-TokyoR42
by
Atsushi Hayakawa
20170923 excelユーザーのためのr入門
by
Takashi Kitano
RとStanでクラウドセットアップ時間を分析してみたら #TokyoR
by
Shuyo Nakatani
Mxnetで回帰 #TokyoR 53th
by
Akifumi Eguchi
Rで潜在ランク分析
by
Hiroshi Shimizu
20140625 rでのデータ分析(仮) for_tokyor
by
Takashi Kitano
20150303ぞくパタLT-ゆるふわ構造学習
by
Toru Imai
Rcppのすすめ
by
Masaki Tsuda
データサイエンティスト必見!M-1グランプリ
by
Satoshi Kitajima
R を起動するその前に
by
Kosei ABE
TokyoR42_around_chaining
by
TokorosawaYoshio
マルコフ連鎖モンテカルロ法入門-1
by
Nagi Teramo
Rで代数統計 TokyoR #42 LT
by
Toru Imai
最強のハードディスクはどれだ?
by
Atsushi Hayakawa
Tokyor42_r_datamining_18
by
Yohei Sato
Tokyor42 ggplot2
by
Yohei Sato
Tokyo r33 beginner
by
Takashi Minoda
Tokyo r30 anova
by
Takashi Minoda
Rで学ぶ 傾向スコア解析入門 - 無作為割り当てが出来ない時の因果効果推定 -
by
Yohei Sato
東京R非公式おじさんが教える本当に気持ちいいパッケージ作成法
by
Nagi Teramo
More from weda654
PDF
Juliaで前処理
by
weda654
PDF
わかりやすいパターン認識_3章
by
weda654
PDF
わかりやすいパターン認識_2章
by
weda654
PDF
続・わかりやすいパターン認識_3章
by
weda654
PDF
わかパタ 1章
by
weda654
PDF
Mコマンド入門
by
weda654
PPTX
Data frameあれこれ
by
weda654
Juliaで前処理
by
weda654
わかりやすいパターン認識_3章
by
weda654
わかりやすいパターン認識_2章
by
weda654
続・わかりやすいパターン認識_3章
by
weda654
わかパタ 1章
by
weda654
Mコマンド入門
by
weda654
Data frameあれこれ
by
weda654
Dummiesパッケージ
1.
dummiesパッケージ 1 @weda_654
2.
自己紹介 Twitter
ID : @weda_654 勤務先: Google MapとAWSの会社 お仕事: データ分析をやっています 2 (社会人1年目) 近況: 会社の自分の席が正式になくなる (デスクレス)
3.
dummiesパッケージをつかうと 概要 かんたんにダミー変数がつくれるらしいから
とりあえず使ってみた 3
4.
ダミー変数とは 4
ある1個の変数がm個のカテゴリーを持つとき,これ をm個の変数D1,D2,…,Dmで表したもの. 例: 血液型 A,B,O,ABの4つのカテゴリー ↓ 変数A,変数B,変数O,変数ABの4つの変数 (変数A,変数B,変数Oの3つの変数でも表現は可能)
5.
いままでのダミー変数作成 data.frameから対象ベクトルを抜き出す なんやかんやする
data.frameに結合+列名の修正 _人人人人人人人_ > めんどい! <  ̄Y^Y^Y^Y^Y^Y ̄ 5
6.
なんやかんや 6 tmp
<- function(vec){ result <- NULL items <- unique(vec) for(i in items){ dummy <- ifelse(vec %in% i, 1, 0) result <- cbind(result, dummy) } return(result) }
7.
dummy関数 ベクトルからダミー変数を生成
install.packages(“dummies”) library(dummies) blood <- c("A", "AB", "B", "A", "O", "A") d.blood <- dummy(blood) 表1 : 実行結果 bloodA bloodAB bloodB bloodO 1 0 0 0 0 1 0 0 0 0 1 0 1 0 0 0 0 0 0 1 1 0 0 0 7
8.
dummy.data.frame関数(1) data.frame内の質的変数(文字列・順序なし因子)列
からダミー変数を生成 irisデータで試してみる • irisデータには質的変数Speciesがある d.iris <- dummy.data.frame(iris, sep=“:”) rdm <- sample(1:nrow(d.iris), 10) d.iris[rdm, ] 8
9.
dummy.data.frame関数(2) 表2 :
ダミー変数を追加したirisデータ Sepal.Length Sepal.Width Petal.Length Petal.Width Species:setosa Species:versicolor Species:virginica 5 3.3 1.4 0.2 1 0 0 4.9 2.4 3.3 1 0 1 0 5 2.3 3.3 1 0 1 0 5.5 2.6 4.4 1.2 0 1 0 5.6 2.8 4.9 2 0 0 1 6.7 3 5.2 2.3 0 0 1 6 2.7 5.1 1.6 0 1 0 5.4 3 4.5 1.5 0 1 0 6.7 2.5 5.8 1.8 0 0 1 5.7 3 4.2 1.2 0 1 0 生成→結合(置換)をひとまとめにできる 9
10.
get.dummy, which.dummy
get.dummy • 生成したダミー変数を表示する which.dummy • 生成したダミー変数の列番号を表示する 10
11.
11 より良いダミー変数生成ライフ?を もっとイケてる生成方法があったら
教えて下さい!
Editor's Notes
#4
それ以上でも、それ以下でもない 無味無臭なLT
#5
性別とかもよくきくのでは
#6
きっと、みなさんはこんな非効率なことをしてはいないと思いますが… 忘れたそばからやってくる
#11
関数はこれだけ もっと詳しく知りたい方はhelpをみましょう
Download