SlideShare a Scribd company logo
1 of 40
変態にRを与えた結果がこれだよ…2
ラブライブが好きになりすぎて彼女たちを解析する
20130220
Kashiwa.R#6 @東京大学柏キャンパス 柏図書館
YF@Med_KU
前回の反響 #5
わざわざ柏まで来て
気持ち悪い
snowの無駄遣い
当直(病院に夜間いること)の
シフト決めに使えないか?
実装まで
休みがある
同じ科の医師はかぶらない
library(lpSolve)
lp()
線形計画法を整数解で解く
当直(病院に夜間いること)の
シフト決めに使えないか?
主成分分析 prcomp
画像のプロット rasterImage
本日の紹介
某大学異学部
絶体絶命の危機に瀕していた…
これが私、高坂穂乃果。
高校2年。いま、私の通
う大学が大ピンチなの。
それは、昨日突然、理
事長によって伝えられ
た、学校廃校のお知ら
せがきっかけだった…
うそ~
廃校って…つまり、学校がなくな
る、ということですね…
ホノカチャァァン!?!?
ホノカチャァァン!?!? ホノカァァ!?!?
というわけなんですが…
・・・
廃 校 !?!?
こんなときはどうしたらいいんだお?
さすがに大学中退ニートにはなりなくないお!!
UTXへようこそぉ~
これだ…見つけたァ!!
も~海未ちゃ~んいい方法思
いついたんだから聞いてよ~
私達でスクールアイドルを
やるとか言い出すつもりで
しょ?エロ同人みたいに!!
キタァァァァァァァアアアアアアアア
ブヒィィィィィィイイイイイイ
うみちゅわぁぁぁああん
でも彼女たちがアイドルを目指すって言っても、やる夫は
何をしてあげればいいかわからないんだお…
だって毎クール嫁候補が出るたびに(主に外見から)ブヒブヒ
言っているだけなんだからだお…
だから統計学的に彼女たちの特徴をつかむお!!
どの娘がいいか悩むお…
うみちゃんブヒィ!!
みもりんブヒィ!!
データの取得
データ行列を入手
B W H height age name
90 60 82 156 17 東條 希
88 60 84 162 17 絢瀬 絵里
82 60 83 156 15 小泉 花陽
80 58 80 159 16 南 ことり
78 56 83 161 15 西木野 真姫
78 58 82 157 16 高坂 穂乃果
76 58 80 159 16 園田 海未
75 59 80 155 15 星空 凛
74 57 79 154 17 矢澤 にこ
パラメータ間の相関
バストが大きいとヒップも大きい…?
身長が高いとウエストは小さい…?
クソッ よくわからんッ
とりあえず(゚∀゚)o彡゜オッパイオッパイ
でも一番の(゚∀゚)o彡゜オッパイの東條希ってなんだよこの変な
ツインテールやる夫はこれを認めないお!!
とりあえず主成分分析をしてみようぜjk…
主成分分析とは、やらない夫的理解では、なんかパラ
メータがたくさんあって、その中で関係しあっているも
のがありそうなんだけどよくわからんときに、Rに投げ
たらそれっぽくパラメータを統合して新しいパラメータ
ができる解析のことだ。
prcompに行列を投げればおk。
(単位が不揃いなデータでは標準化することが望ましいら
しいが、とりあえずscale = TRUEを指定しておけば問題な
さげ)
prcomp(data, scale = TRUE)
1行で結果が出せるわけだが、中身を見るだろうjk…
パラメータとして、オパーイ、ウエスト、ヒップ、身長、
年齢の5つを使った。これらから、第n主成分(PC_n)とい
う新たなパラメータが生成される。
5つから5つ作ったのではおまいらの解釈能力でわかるわ
けがなくて、たいてい、PC_nをいくつ使えば説明がつく
かを考えることになる。
ここでcumulative proportionというのが、いくつ使えば累
積でどれだけ説明がつくかを示している。PC_2まで使え
ば、95%近くデータが説明できることを示している。
たいてい2つか3つ主成分をとれば、80%は説明
がつくことが多い。これを2次元か3次元の散布
図にすれば、いい感じになる。
主成分はパラメータを統合しているので、意味
付けはおまいらでしないとダメだjk…
PC1は負だとオパーイ、ウエスト、ヒップに対する
寄与が大きい。おそらくこれはボンキュッボンを意味
している。
PC2は身長と年齢が逆相関している。おそらくこ
れはロリギャップ的なものを意味しているだろ
う。
・・・
この図が味気ないんだけど…
うみちゃんブヒィ!!
みもりんブヒィ!!
rasterImage関数を用いた
pngプロット
B W H height age name
90 60 82 156 17 東條 希
88 60 84 162 17 絢瀬 絵里
82 60 83 156 15 小泉 花陽
80 58 80 159 16 南 ことり
78 56 83 161 15 西木野 真姫
78 58 82 157 16 高坂 穂乃果
76 58 80 159 16 園田 海未
75 59 80 155 15 星空 凛
74 57 79 154 17 矢澤 にこ
~かn~
デュフフwwwこれでみんなの特徴が分かった
し思う存分prprできるおっおっおwww
うみちゃんブヒィ!!
真面目に主成分分析
100個のデータから、1つだけあ
る正解(外れ値)を見つけ出す。
教師なし学習をやってみる。
主成分分析 前
この時点で赤と緑が外れ値だとわからなくもないけど…
主成分分析 後
外れ値となる赤と緑が、分布からさらに離れたような気分…??
デュフフwwwこれでみんなの特徴が分かった
し思う存分prprできるおっおっおwww
うみちゃんブヒィ!!
でもにこにーも頭わるそうでブヒィ!!
~完~
次回のラブライブ
30%Rで作るGIFアイコン
機械学習でスリーサイズ推定
30%Rでやる形態素解析(未完)

More Related Content

More from Med_KU

20131109 TokyoR#35 Rでネットワーク解析とGIS
20131109 TokyoR#35 Rでネットワーク解析とGIS20131109 TokyoR#35 Rでネットワーク解析とGIS
20131109 TokyoR#35 Rでネットワーク解析とGISMed_KU
 
20131019 生物物理若手 Journal Club
20131019 生物物理若手 Journal Club20131019 生物物理若手 Journal Club
20131019 生物物理若手 Journal ClubMed_KU
 
20131011 KashiwaR#9
20131011 KashiwaR#920131011 KashiwaR#9
20131011 KashiwaR#9Med_KU
 
20121120 検査と臨床判断
20121120 検査と臨床判断20121120 検査と臨床判断
20121120 検査と臨床判断Med_KU
 
20130701 統計論文勉強会 遺伝的差異の定量的解析法
20130701 統計論文勉強会 遺伝的差異の定量的解析法20130701 統計論文勉強会 遺伝的差異の定量的解析法
20130701 統計論文勉強会 遺伝的差異の定量的解析法Med_KU
 
20130609 アイドルマスター解析
20130609 アイドルマスター解析20130609 アイドルマスター解析
20130609 アイドルマスター解析Med_KU
 
20130201 脳神経外科 脳腫瘍の浸潤数理モデル
20130201 脳神経外科 脳腫瘍の浸潤数理モデル20130201 脳神経外科 脳腫瘍の浸潤数理モデル
20130201 脳神経外科 脳腫瘍の浸潤数理モデルMed_KU
 
20130609 Wako.R トピックモデルを用いたボーカロイド楽曲の流行解析
20130609 Wako.R トピックモデルを用いたボーカロイド楽曲の流行解析20130609 Wako.R トピックモデルを用いたボーカロイド楽曲の流行解析
20130609 Wako.R トピックモデルを用いたボーカロイド楽曲の流行解析Med_KU
 
20130608 Kashiwa.R#8 Rでプロット
20130608 Kashiwa.R#8 Rでプロット20130608 Kashiwa.R#8 Rでプロット
20130608 Kashiwa.R#8 RでプロットMed_KU
 
20130318 統計手法勉強会 外れ値検出 FRaC
20130318 統計手法勉強会 外れ値検出 FRaC20130318 統計手法勉強会 外れ値検出 FRaC
20130318 統計手法勉強会 外れ値検出 FRaCMed_KU
 
20121210 統計論文勉強会
20121210 統計論文勉強会20121210 統計論文勉強会
20121210 統計論文勉強会Med_KU
 
20121130 Kashiwa.R#5
20121130 Kashiwa.R#520121130 Kashiwa.R#5
20121130 Kashiwa.R#5Med_KU
 
20130727niconico
20130727niconico20130727niconico
20130727niconicoMed_KU
 
20130727niconicoLT
20130727niconicoLT20130727niconicoLT
20130727niconicoLTMed_KU
 

More from Med_KU (14)

20131109 TokyoR#35 Rでネットワーク解析とGIS
20131109 TokyoR#35 Rでネットワーク解析とGIS20131109 TokyoR#35 Rでネットワーク解析とGIS
20131109 TokyoR#35 Rでネットワーク解析とGIS
 
20131019 生物物理若手 Journal Club
20131019 生物物理若手 Journal Club20131019 生物物理若手 Journal Club
20131019 生物物理若手 Journal Club
 
20131011 KashiwaR#9
20131011 KashiwaR#920131011 KashiwaR#9
20131011 KashiwaR#9
 
20121120 検査と臨床判断
20121120 検査と臨床判断20121120 検査と臨床判断
20121120 検査と臨床判断
 
20130701 統計論文勉強会 遺伝的差異の定量的解析法
20130701 統計論文勉強会 遺伝的差異の定量的解析法20130701 統計論文勉強会 遺伝的差異の定量的解析法
20130701 統計論文勉強会 遺伝的差異の定量的解析法
 
20130609 アイドルマスター解析
20130609 アイドルマスター解析20130609 アイドルマスター解析
20130609 アイドルマスター解析
 
20130201 脳神経外科 脳腫瘍の浸潤数理モデル
20130201 脳神経外科 脳腫瘍の浸潤数理モデル20130201 脳神経外科 脳腫瘍の浸潤数理モデル
20130201 脳神経外科 脳腫瘍の浸潤数理モデル
 
20130609 Wako.R トピックモデルを用いたボーカロイド楽曲の流行解析
20130609 Wako.R トピックモデルを用いたボーカロイド楽曲の流行解析20130609 Wako.R トピックモデルを用いたボーカロイド楽曲の流行解析
20130609 Wako.R トピックモデルを用いたボーカロイド楽曲の流行解析
 
20130608 Kashiwa.R#8 Rでプロット
20130608 Kashiwa.R#8 Rでプロット20130608 Kashiwa.R#8 Rでプロット
20130608 Kashiwa.R#8 Rでプロット
 
20130318 統計手法勉強会 外れ値検出 FRaC
20130318 統計手法勉強会 外れ値検出 FRaC20130318 統計手法勉強会 外れ値検出 FRaC
20130318 統計手法勉強会 外れ値検出 FRaC
 
20121210 統計論文勉強会
20121210 統計論文勉強会20121210 統計論文勉強会
20121210 統計論文勉強会
 
20121130 Kashiwa.R#5
20121130 Kashiwa.R#520121130 Kashiwa.R#5
20121130 Kashiwa.R#5
 
20130727niconico
20130727niconico20130727niconico
20130727niconico
 
20130727niconicoLT
20130727niconicoLT20130727niconicoLT
20130727niconicoLT
 

20130220 Kashiwa.R#6