データ解析で割安賃貸物件を探せ! 
(山手線沿線編) 
2014.10.21 
@berobero11 
第11回「データ解析のための統計モデリング入門」読書会
目的 
• 広さ・最寄駅・築年や各種設備の割にお得な 
割安物件を探す 
• 首都圏の賃貸物件を全て扱うのは大変 
まずは山手線の各駅から徒歩15分以内の物件 
について解析(32945件)
データはスクレイピングで 
Photo 
Photo
前処理の例 
• 相関がとても高いものを消したりまとめたり 
– [間取り],[専有面積]  [間取り]を消す 
– [2沿線利用可],[2駅利用可]  ORをとる 
– [上階無し],[最上階]  ORをとる 
• 経験で数値に変換したり 
– [駅からXメートルにスーパー有]  푒푥푝 − 
푋 
400 
– 部屋階 1F:0, 2F:0.5, 3F-9F:0.7 10F~:1
応答変数は? 
• 費用.2年間 
=(賃料+管理費)*24 + 礼金+ 敷金+ 仲介手数料+ 
その他初期費用- フリーレント.price
説明変数は? 
• 合計226個 
• 最寄駅, 駅まで徒歩X分, 専有面積, 築年数, 部屋の向き, 
建物のタイプ, 各種設備など 
• 少し多いと感じるので、本来はこれらを階層化したりするべきだと思います 
が今回はパス.
散布図の例
統計モデル 
푙표푔 費用. 2年間푛 = 훼 + 훽駅푛 
+ 훽向き푛 
+ 훽 ∙ 푥 푛 
駅・向き以外の説明変数 
駅と向きはCAR model を使用 
훽駅.東京~ 푑푛표푟푚 
훽駅.神田+ 훽駅.有楽町 
2 
, 휏駅
BUGSコード 
結局説明変数が多くてStanでしか収束しませんでした…
結果| 駅の影響
結果| 部屋の向きの影響
結果| 設備等の影響
結果| 割安物件Top3 
費用. 
2年間 
費用. 
2年間. 
価値 
割引. 
差額 
割引. 
off 
(%) 
最寄駅 
徒歩 
(分) 
賃料管理費礼金敷金 
専有 
面積 
築年 
部 
屋 
階 
向き 
235 439 -204 -46.4 秋葉原9 9.8 0 0 0 66.84 24 4 南 
156 283 -127 -44.9 目白14 6 0 6 6 42 40 4 南東 
71 128 -57 -44.7 巣鴨8 2.7 0.25 0 0 16 49 2 南 
金額の単位は(万円)
まとめ 
• WinBUGSでCAR model を使おう! 
• 『ここ2年の割安ノートPC』とか誰かやりませんか?

データ解析で割安賃貸物件を探せ!(山手線沿線編) LT