SlideShare a Scribd company logo
/ 20
JSAI 2019
2019.6.4
間取り図を用いた賃料予測モデルに関する一検討
1
服部 凌典¹ 岡本 一志¹ 柴田 淳司²


¹ 電気通信大学 大学院情報理工学研究科 情報学専攻 


² 産業技術大学院大学 産業技術研究科 情報アーキテクチャ専攻
/ 20
JSAI 2019
2019.6.4
賃貸物件の特徴


• 同じ物件が存在しない


• 間取り,階数,立地などの物件変数が賃料に影響を与える


賃貸物件の価格決定方法 [大野喜,2016]


• 積算法


• 収益分析法


• 賃貸事例比較法


• 対象物件の周囲の物件や類似する物件を参照して賃料を決定


• 決定支援にヘドニック・アプローチを採用
はじめに
2
大野喜久之輔:継続賃料鑑定評価を再考する,
都市住宅学,住宅新報社,2016.
/ 20
JSAI 2019
2019.6.4
ヘドニック・アプローチ
ある商品の価格をその商品の変数の価値に関する集合とし,
その商品価格の予測モデルを線形回帰で構築する技術[唐渡,2016]


 


既存のヘドニック・アプローチは間取り図が考慮されていない
3
ŷi = ↵1x1 + ↵2x2 + ↵3x3 + · · · + ↵nxn +
<latexit sha1_base64="vQx08F43bZHjET/G6F0shHJHj2A=">AAADG3ichVFNSxxBFKwZYzSbGFdzCSSHJYtBEKR3FRQhIOYSSA5+ZFVYZenptNo4OzPMzC7ZLPkD+QMeJIcEJIT8DC8h5OrBnyAeDeSSQ2pmhxFdTB7MdPXrqlfvdTuBa6JYiFPLHrg1eHto+E7h7r2R+6PFsfH1yG+FSteU7/rhpiMj7RpP12ITu3ozCLVsOq7ecPafJ+cbbR1Gxvdex51Abzflrmd2jJIxU36xji3sQSJGCR00YLiW8IxZCRdBetZAFxW8x9scTZFznVHNGdUbGDM5YyZjHOENfHpHxFN9fC/ne3lFB5p82SiWxbRIo9QPKhkoI4tlv/iF4sRMoYUmi3gso2gnaR6hzrEErWNs004iJDLpuaZ1gdoWWZoMyew+/7vc1bOsx31SM0rVii4uv5DKEibEifgqLsR38U2ciT831uqmNZJeOlydnlYHjdEPD9d+/1fVTJ9w71L1z55j7GA+7dWw9yDNJFOonr797uBibWF1ovtUfBbn7P+TOBXHnMBr/1JHK3r1EAU+QOX6dfeD9ep0hXhltry4lD3FMB7hCSZ533NYxAssowZlPbaWrJfWK/ujfWz/sH/2qLaVaR7gStgnfwFUmKzq</latexit>
<latexit sha1_base64="vQx08F43bZHjET/G6F0shHJHj2A=">AAADG3ichVFNSxxBFKwZYzSbGFdzCSSHJYtBEKR3FRQhIOYSSA5+ZFVYZenptNo4OzPMzC7ZLPkD+QMeJIcEJIT8DC8h5OrBnyAeDeSSQ2pmhxFdTB7MdPXrqlfvdTuBa6JYiFPLHrg1eHto+E7h7r2R+6PFsfH1yG+FSteU7/rhpiMj7RpP12ITu3ozCLVsOq7ecPafJ+cbbR1Gxvdex51Abzflrmd2jJIxU36xji3sQSJGCR00YLiW8IxZCRdBetZAFxW8x9scTZFznVHNGdUbGDM5YyZjHOENfHpHxFN9fC/ne3lFB5p82SiWxbRIo9QPKhkoI4tlv/iF4sRMoYUmi3gso2gnaR6hzrEErWNs004iJDLpuaZ1gdoWWZoMyew+/7vc1bOsx31SM0rVii4uv5DKEibEifgqLsR38U2ciT831uqmNZJeOlydnlYHjdEPD9d+/1fVTJ9w71L1z55j7GA+7dWw9yDNJFOonr797uBibWF1ovtUfBbn7P+TOBXHnMBr/1JHK3r1EAU+QOX6dfeD9ep0hXhltry4lD3FMB7hCSZ533NYxAssowZlPbaWrJfWK/ujfWz/sH/2qLaVaR7gStgnfwFUmKzq</latexit>
<latexit sha1_base64="Mhn41z7d/Q2n10aqYFv7sL5P/oA=">AAADG3ichVHLShxBFD3dxqiTh6PZBJLFkMEQEKRmXCiCIGYTiAsfGRUmMlRXSi3s6W66ewYnQ34gP5BFyMKASMhnuAkhWxd+grg04MZFTvc0LXEwudBdp26dc8+9VU7gmigW4tSyB+4M3h0aHincu//g4WhxbHw98luh0jXlu3646chIu8bTtdjErt4MQi2bjqs3nL2XyflGW4eR8b03cSfQW02545lto2TMlF+s4y12IRGjhA4aMFxLmGdWwkWQnjXQRQUfsJ+jSXJuMqo5o3oLYzpnTGeMQ7yDT++IeLKP7+V8L6/oQJMvG8WymBJplPpBJQNlZLHsF48oTswUWmiyiMcyinaS5hHqHEvQOsYW7SRCIpOea1oXqG2RpcmQzO7xv8NdPct63Cc1o1St6OLyC6ksYUKciG/iQvwQ38WZuLq1VjetkfTS4er0tDpojH58vHb5X1UzfcLda9U/e46xjdm0V8PegzSTTKF6+vb7Txdrc6sT3efiqzhn/wfiVBxzAq/9Wx2u6NXPKPABKjevux+sV6cqxCvV8sJi9hTDeIJneMH7nsECXmEZNSjrqbVovbaW7C/2sf3T/tWj2lameYS/wj75A1P4rOg=</latexit>
占有面積 立地 階数 築年数
賃料
唐渡 広志:ヘドニック・アプローチを利用した不動産価格
指数の推定方法とその問題点,都市住宅学,vol.2016,
no.92,pp.17-20, 2016.
/ 20
JSAI 2019
2019.6.4
ヘドニック・アプローチを用いた関連研究
4
• Ram P. Dahal and Robert K. Grala and Jason S. Gordon and Ian A. Munn and Daniel R. Petrolia and J. Reid Cummings:
A hedonic pricing method to estimate the value of waterfronts in the Gulf of Mexico,Urban Forestry & Urban Greening,vol.41,
pp.184-194,2019.


• Dr. Philipp Deschermeier and Björn Seipelt:
A Hedonic Rent Index for Student Housing in Germany,Cologne Institute for economic research,pp.1–12,2016.


• yung-Jin Jun, Hee-Jae Kim:Measuring the effect of greenbelt proximity on apartment rents in Seoul,Cities,vol. 62, 2017.
建物構造
立地

/アクセス
周辺環境 売買契約 画像
Ram+

2019 ○ ○ ○ × ×
Philipp+

2016 ○ ○ ○ × ×
Jun+

2017 ○ ○ ○ ○ ×
本研究 ○ ○ × ○ ○
説明変数として使用されている変数のカテゴリ
/ 20
JSAI 2019
2019.6.4
間取り図の特性
間取り規格が同じであっても,部屋の形状が違うものが存在


希望の賃貸物件を探す際には間取り図を見る習慣がある[清田+,2017]
5
清田陽司,山崎俊彦,諏訪博彦,清水弘: 
エディトリアル:「不動産とAI 」,人工知能,
vol.32,2017.
同じ建物の間取り規格Kで間取り図が違う例
/ 20
JSAI 2019
2019.6.4
目的: 賃料予測における間取り図の影響を明らかにする


手段: 賃料の予測誤差を比較


• 間取り図を考慮しない予測モデル(LR)


• 間取り図を考慮した予測モデル


• 線形変換による特徴量抽出法(PCA-LR)


• 非線形変換による特徴量抽出法(VGG-LR)
研究内容
6
/ 20
JSAI 2019
2019.6.4
一般的なヘドニック・アプローチ


• 予測式:


• 説明変数に間取り図を含まない


• scikit-learn(version:0.20.2)のLinearRegressionクラス使用


LR(Linear-Regression)
7
ŷi = f(xi) = ↵T
xi +
<latexit sha1_base64="gAXdu8udRiXbYQWOcxxODvbMMjU=">AAACwnichVHLShxBFD12otHxNcaN4KbJYDAIUhMCCYIgJossfY0K9qSpbmtmSqsf6a4ZMun0D+QHssgqQgjiZ7jJD2ThJ0h2GcGNi9zpadCo0dt03VOn7rl1qsoJlYw1Yyd9xoOH/QOPBocKwyOjY+PFicebcdCMXFFxAxVE2w6PhZK+qGipldgOI8E9R4ktZ/91d32rJaJYBv6Gboei6vG6L2vS5Zoou1i1GlybbVuai2ZtNrGcQO3GbY+S+SG1E5k+MxevkInFVdjg6bvE8rhuRF6ykaa3qOZMyxGa28USm2dZmDdBOQcl5LESFH/Awi4CuGjCg4APTViBI6ZvB2UwhMRVkRAXEZLZukCKAmmbVCWoghO7T2OdZjs569O82zPO1C7touiPSGlihv1ih6zDfrIjdsou/tsryXp0vbQpOz2tCO3xz1Pr5/eqPMoajUvVnZ41aniVeZXkPcyY7incnr718UtnfWFtJnnKDthv8v+NnbBjOoHfOnO/r4q1ryjQA5SvX/dNsPl8vkx49UVpaTl/ikFM4wlm6b5fYglvsYIK7XuMU/xBx3hj7BnvjbhXavTlmkn8E8anv2ZjsFI=</latexit>
<latexit sha1_base64="gAXdu8udRiXbYQWOcxxODvbMMjU=">AAACwnichVHLShxBFD12otHxNcaN4KbJYDAIUhMCCYIgJossfY0K9qSpbmtmSqsf6a4ZMun0D+QHssgqQgjiZ7jJD2ThJ0h2GcGNi9zpadCo0dt03VOn7rl1qsoJlYw1Yyd9xoOH/QOPBocKwyOjY+PFicebcdCMXFFxAxVE2w6PhZK+qGipldgOI8E9R4ktZ/91d32rJaJYBv6Gboei6vG6L2vS5Zoou1i1GlybbVuai2ZtNrGcQO3GbY+S+SG1E5k+MxevkInFVdjg6bvE8rhuRF6ykaa3qOZMyxGa28USm2dZmDdBOQcl5LESFH/Awi4CuGjCg4APTViBI6ZvB2UwhMRVkRAXEZLZukCKAmmbVCWoghO7T2OdZjs569O82zPO1C7touiPSGlihv1ih6zDfrIjdsou/tsryXp0vbQpOz2tCO3xz1Pr5/eqPMoajUvVnZ41aniVeZXkPcyY7incnr718UtnfWFtJnnKDthv8v+NnbBjOoHfOnO/r4q1ryjQA5SvX/dNsPl8vkx49UVpaTl/ikFM4wlm6b5fYglvsYIK7XuMU/xBx3hj7BnvjbhXavTlmkn8E8anv2ZjsFI=</latexit>
<latexit sha1_base64="gAXdu8udRiXbYQWOcxxODvbMMjU=">AAACwnichVHLShxBFD12otHxNcaN4KbJYDAIUhMCCYIgJossfY0K9qSpbmtmSqsf6a4ZMun0D+QHssgqQgjiZ7jJD2ThJ0h2GcGNi9zpadCo0dt03VOn7rl1qsoJlYw1Yyd9xoOH/QOPBocKwyOjY+PFicebcdCMXFFxAxVE2w6PhZK+qGipldgOI8E9R4ktZ/91d32rJaJYBv6Gboei6vG6L2vS5Zoou1i1GlybbVuai2ZtNrGcQO3GbY+S+SG1E5k+MxevkInFVdjg6bvE8rhuRF6ykaa3qOZMyxGa28USm2dZmDdBOQcl5LESFH/Awi4CuGjCg4APTViBI6ZvB2UwhMRVkRAXEZLZukCKAmmbVCWoghO7T2OdZjs569O82zPO1C7touiPSGlihv1ih6zDfrIjdsou/tsryXp0vbQpOz2tCO3xz1Pr5/eqPMoajUvVnZ41aniVeZXkPcyY7incnr718UtnfWFtJnnKDthv8v+NnbBjOoHfOnO/r4q1ryjQA5SvX/dNsPl8vkx49UVpaTl/ikFM4wlm6b5fYglvsYIK7XuMU/xBx3hj7BnvjbhXavTlmkn8E8anv2ZjsFI=</latexit>
このLRと間取り図を考慮したPCA-LRとVGG-LRを比較する
f(xi)
xi ŷi
変数
ベクトル
賃料
/ 20
JSAI 2019
2019.6.4
• 主成分分析による特徴抽出


• 抽出した間取り図の特徴量と             
変数ベクトルを組み合わせ,線形回帰で賃料予測


• 間取り図の特徴量: 64,128,256,512,1024,
2048次元の6種類
PCA(Principal Component Analysis)-LR
8
• scikit-learn(version:0.20.2)
のPCAクラス使用


•
LRの説明変数に間取り図を追加したモデル
特
徴
量
主成分
分析
vi
属性
ベクトル
φθ(vi)
ui
xi
ŷi
賃料
f(xi)
x = [u, ✓(v)]
<latexit sha1_base64="tbvrKtiF/xOXDGMbwaD2COlchy8=">AAACqXichVFNSxtBGH6y9SPGr9hehF6WhpQUJUxUUApCsD30mKjRYBLC7jqawf1idxIal/0D/QMeemqhlLY/w4tHLz2k/6B4jNBLD32zWZAYrO8w8z7zvO/zzjszumsKXzLWSyhPJianppMzqdm5+YXF9NLTA99pewavGI7peFVd87kpbF6RQpq86npcs3STH+pnbwbxww73fOHY+7Lr8oalndriRBiaJKqZfhvUdcc89rsWOfV9qG6rtRGqHa6qdbclmmpQly0utTA3Eu+ErxrNdIblWWTqOCjEIIPYSk76K+o4hgMDbVjgsCEJm9Dg06ihAAaXuAYC4jxCIopzhEiRtk1ZnDI0Ys9oPaVdLWZt2g9q+pHaoFNMmh4pVWTZT/aN9dkV+8F+s78P1gqiGoNeuuT1oZa7zcUPy3t/HlVZ5CVad6r/9ixxgq2oV0G9uxEzuIUx1HfOL/p7r3ezwUv2md1Q/59Yj13SDezOrfGlzHc/IkUfULj/3OPgYC1fWM+vlTcyxZ34K5J4jhfI0Xtvooh3KKFC537HNXr4pawoZaWqHA1TlUSseYYRU4x/JIqlEA==</latexit>
/ 20
JSAI 2019
2019.6.4
VGG-LR
9
• ミニバッチ+確率的勾配降下法を適用


• batch size: 100,epoch: 100


• 間取り図の特徴抽出: 64次元
• 活性化関数: ReLU


• Keras(version:2.2.4)のFunction API


•
間取り図を非線変換で特徴抽出するモデル
x = [u, h✓(v)]
<latexit sha1_base64="o9TUYv/8nCTnfgkDaEu18FszFcY=">AAACpnichVFNSyNBEH0ZPzZmVxP1IngZNrhEkNCJCy4LC65ePEnUjRGSEGcmrRkyX8x0wsZh/sD+AQ+eFETEn+HFi0dd/Ani0YW9eLAyGZAoajXd9fpVverqbtUxdE8wdhOTBgaHhj/ERxIfP42OJVPjE5ue3XI1XtRsw3a3VMXjhm7xotCFwbcclyumavCS2lzuxktt7nq6bf0SHYdXTWXX0nd0TRFE1VI//YpqG3WvY5KTfwfyD7ncR7WCOblR8yuiwYUSyJm+YDuYrdZSaZZlockvQS4CaURWsFMnqKAOGxpaMMFhQRA2oMCjUUYODA5xVfjEuYT0MM4RIEHaFmVxylCIbdK6S7tyxFq079b0QrVGpxg0XVLKmGFX7JTdswt2xm7Zw6u1/LBGt5cOebWn5U4t+Wdq4/+7KpO8QONJ9WbPAjv4FvaqU+9OyHRvofX07b39+43v6zP+F3bE7qj/Q3bDzukGVvufdrzG1w+QoA/IPX/ul2Azn83NZ/NrX9OLS9FXxDGNz8jQey9gESsooEjnnuAS1/grZaRVqSiVeqlSLNJMos+k7Uf+WKO9</latexit>
VGG16
vi
ŷi
属性
ベクトル
ui
賃料
xi
f(xi)
f(xi)
特
徴
量
hθ(vi)
/ 20
JSAI 2019
2019.6.4
VGG16の構造
10
Karen Simonyan,and Andrew Zisserman: Very Deep Convolutional
Networks for Large-Scale Image Recognition,Computing Research
Repository,vol.abs/1409.1556,2014.


VGG16 [Karen+,2014]: オックスフォード大学のVGGチームによって開発された
学習済みのニューラルネットワーク
7 × 7 × 512
13
224 × 224 × 3 1 × 1000
1 × 4096
14 × 14 × 512
28 × 28 × 512
・
・
・
層
224 × 224 × 3 28 × 28 × 512
11
1 × 64
・
・
・
層
使用するVGG16


• 後ろの5層を除去


• 64次元の全結合層追加


• 後ろ3層のみ学習
/ 20
JSAI 2019
2019.6.4
実験環境
LIFULL HOME’Sデータセット(2015年9月時点)


• 賃貸物件データ(70変数,533万件)


• 120×120ピクセルの画像データ(8,300万ファイル)


使用する計算機(OS: Ubuntu 18.04.1)


• CPU:Xeon(R) CPU E5-2650 v3 @ 2.30GHz


• GPU:GeForce GTX 1080 Ti 11GB


• メモリ:64GB
11
/ 20
JSAI 2019
2019.6.4
徒歩距離,立地,階数(地上),階数(地下),市町村区,部屋階数,
契約期間,建物構造,駐車場料金,新築・未入居フラグ,占有面積, 
築年数,間取り図


使用賃貸物件データ(14変数,9万件)


• 東京都のデータを使用( 47都道府県で最もデータ量が多いため)


• 目的変数:賃料 + 共益費


• 説明変数:


• 間取り図:グレースケール変換


データセット分割


• 使用賃貸物件データを間取り規格を基準にK,R,DK,LD,LDKの5種類に分割


• LDはデータ数が35件のため使用しない


• 20%をテストデータに,80%を開発用データに分割
データセット
12
/ 20
JSAI 2019
2019.6.4
実験概要
13
1. ハイパーパラメータチューニング


• PCA-LRにおける適切な間取り図の次元数を探索


• 64,128,256,512,1024,2048次元の6種類


• 開発用データに10-fold cross-validationを適用


• 評価指標:平方平均二乗誤差(RMSE: Root Mean Square Error)


2. テストデータに対するLRとVGG-LR,PCA-LRの評価


1. RMSEによる評価と学習時間


2. 予測値の可視化
1. ハイパーパラメータチューニング
DK LDK
K R
/ 20
JSAI 2019
2019.6.4
2-1.RMSEによる評価と学習時間
15
データ数 LR PCA-LR VGG-LR
K 1,712 11,602 11,689 16,862
R 7,525 9,217 8,727 12,541
DK 3,548 11,156 10,957 16,467
LDK 6,842 20,121 19,646 22,878
データ数 LR PCA-LR VGG-LR
K 9,205 0.06 11 2,897
R 39,985 0.08 48 14,566
DK 18,975 0.05 23 6,471
LDK 36,595 0.07 45 13,026
テストデータに対するRMSE[円]
開発用データの学習時間[秒]
LR PCA-LR VGG-LR
間取り規格R
LR PCA-LR VGG-LR
間取り規格K
2-2.予測値の可視化
/ 20
JSAI 2019
2019.6.4
2-2.累積密度関数(1/2)
17
K R
= |1 −
̂
y
y
|
横軸:error rate
縦軸:error rate 以下の誤差に収まっているデータ数の割合
y : 真値 ̂
y :予測値
/ 20
JSAI 2019
2019.6.4
DK LDK
18
2-2.累積密度関数(2/2)
/ 20
JSAI 2019
2019.6.4
LIFULL HOME’Sデータセット外の物件予測
19
間取り図 構造
間取り

規格
賃料 LR PCA-LR VGG-LR
自宅 RC K 65,000 61,361 62,545 83,695
学生寮 RC K 47,700 56,931 49,716 64,526
A宅 木造 K 74,000 66,695 68,701 58,561
B宅 鉄筋 LDK 128,000 130,988 122,887 181,913
/ 20
JSAI 2019
2019.6.4
おわりに
目的:賃料予測における間取り図の影響を明らかにする


実験結果


間取り図を考慮することで予測誤差が改善する


• 特徴量抽出に主成分分析を用いることでRMSEが改善する


• 間取り図の特徴量は1024,2048次元の高次元が望ましい


• 1024,2048次元の間取り図の特徴量で間取り図の大部分の特徴量を 
抽出できる


• 特徴量抽出にVGGを用いることで,error rateが0.1以下の物件数が増える


• 予測誤差のばらつきが課題


• 計算コストが課題
20

More Related Content

More from Okamoto Laboratory, The University of Electro-Communications

発売日前のレビューとPU-Learningを用いた
スパムレビュー検出
発売日前のレビューとPU-Learningを用いた
スパムレビュー検出発売日前のレビューとPU-Learningを用いた
スパムレビュー検出
発売日前のレビューとPU-Learningを用いた
スパムレビュー検出
Okamoto Laboratory, The University of Electro-Communications
 
モデルベース協調フィルタリングにおける推薦の透明性に関する検討
モデルベース協調フィルタリングにおける推薦の透明性に関する検討モデルベース協調フィルタリングにおける推薦の透明性に関する検討
モデルベース協調フィルタリングにおける推薦の透明性に関する検討
Okamoto Laboratory, The University of Electro-Communications
 
重回帰分析による推薦の透明性を有したモデルベース協調フィルタリング
重回帰分析による推薦の透明性を有したモデルベース協調フィルタリング重回帰分析による推薦の透明性を有したモデルベース協調フィルタリング
重回帰分析による推薦の透明性を有したモデルベース協調フィルタリング
Okamoto Laboratory, The University of Electro-Communications
 
Word2Vecによる次元圧縮と重回帰分析型協調フィルタリングへの応用
Word2Vecによる次元圧縮と重回帰分析型協調フィルタリングへの応用Word2Vecによる次元圧縮と重回帰分析型協調フィルタリングへの応用
Word2Vecによる次元圧縮と重回帰分析型協調フィルタリングへの応用
Okamoto Laboratory, The University of Electro-Communications
 
数式からみるWord2Vec
数式からみるWord2Vec数式からみるWord2Vec
Rによるベイジアンネットワーク入門
Rによるベイジアンネットワーク入門Rによるベイジアンネットワーク入門
Rによるベイジアンネットワーク入門
Okamoto Laboratory, The University of Electro-Communications
 
単語の分散表現の 購買履歴への応用
単語の分散表現の 購買履歴への応用単語の分散表現の 購買履歴への応用
単語の分散表現の 購買履歴への応用
Okamoto Laboratory, The University of Electro-Communications
 
機関リポジトリから収集した学術論文のテキスト解析に関する一検討
機関リポジトリから収集した学術論文のテキスト解析に関する一検討機関リポジトリから収集した学術論文のテキスト解析に関する一検討
機関リポジトリから収集した学術論文のテキスト解析に関する一検討
Okamoto Laboratory, The University of Electro-Communications
 
Text Analysis of Academic Papers Archived in Institutional Repositories
Text Analysis of Academic Papers Archived in Institutional RepositoriesText Analysis of Academic Papers Archived in Institutional Repositories
Text Analysis of Academic Papers Archived in Institutional Repositories
Okamoto Laboratory, The University of Electro-Communications
 
Families of Triangular Norm Based Kernel Function and Its Application to Kern...
Families of Triangular Norm Based Kernel Function and Its Application to Kern...Families of Triangular Norm Based Kernel Function and Its Application to Kern...
Families of Triangular Norm Based Kernel Function and Its Application to Kern...
Okamoto Laboratory, The University of Electro-Communications
 
これから始めるディープラーニング
これから始めるディープラーニングこれから始めるディープラーニング
これから始めるディープラーニング
Okamoto Laboratory, The University of Electro-Communications
 

More from Okamoto Laboratory, The University of Electro-Communications (11)

発売日前のレビューとPU-Learningを用いた
スパムレビュー検出
発売日前のレビューとPU-Learningを用いた
スパムレビュー検出発売日前のレビューとPU-Learningを用いた
スパムレビュー検出
発売日前のレビューとPU-Learningを用いた
スパムレビュー検出
 
モデルベース協調フィルタリングにおける推薦の透明性に関する検討
モデルベース協調フィルタリングにおける推薦の透明性に関する検討モデルベース協調フィルタリングにおける推薦の透明性に関する検討
モデルベース協調フィルタリングにおける推薦の透明性に関する検討
 
重回帰分析による推薦の透明性を有したモデルベース協調フィルタリング
重回帰分析による推薦の透明性を有したモデルベース協調フィルタリング重回帰分析による推薦の透明性を有したモデルベース協調フィルタリング
重回帰分析による推薦の透明性を有したモデルベース協調フィルタリング
 
Word2Vecによる次元圧縮と重回帰分析型協調フィルタリングへの応用
Word2Vecによる次元圧縮と重回帰分析型協調フィルタリングへの応用Word2Vecによる次元圧縮と重回帰分析型協調フィルタリングへの応用
Word2Vecによる次元圧縮と重回帰分析型協調フィルタリングへの応用
 
数式からみるWord2Vec
数式からみるWord2Vec数式からみるWord2Vec
数式からみるWord2Vec
 
Rによるベイジアンネットワーク入門
Rによるベイジアンネットワーク入門Rによるベイジアンネットワーク入門
Rによるベイジアンネットワーク入門
 
単語の分散表現の 購買履歴への応用
単語の分散表現の 購買履歴への応用単語の分散表現の 購買履歴への応用
単語の分散表現の 購買履歴への応用
 
機関リポジトリから収集した学術論文のテキスト解析に関する一検討
機関リポジトリから収集した学術論文のテキスト解析に関する一検討機関リポジトリから収集した学術論文のテキスト解析に関する一検討
機関リポジトリから収集した学術論文のテキスト解析に関する一検討
 
Text Analysis of Academic Papers Archived in Institutional Repositories
Text Analysis of Academic Papers Archived in Institutional RepositoriesText Analysis of Academic Papers Archived in Institutional Repositories
Text Analysis of Academic Papers Archived in Institutional Repositories
 
Families of Triangular Norm Based Kernel Function and Its Application to Kern...
Families of Triangular Norm Based Kernel Function and Its Application to Kern...Families of Triangular Norm Based Kernel Function and Its Application to Kern...
Families of Triangular Norm Based Kernel Function and Its Application to Kern...
 
これから始めるディープラーニング
これから始めるディープラーニングこれから始めるディープラーニング
これから始めるディープラーニング
 

間取り図を用いた賃料予測モデルに関する一検討

  • 1. / 20 JSAI 2019 2019.6.4 間取り図を用いた賃料予測モデルに関する一検討 1 服部 凌典¹ 岡本 一志¹ 柴田 淳司² ¹ 電気通信大学 大学院情報理工学研究科 情報学専攻  ² 産業技術大学院大学 産業技術研究科 情報アーキテクチャ専攻
  • 2. / 20 JSAI 2019 2019.6.4 賃貸物件の特徴 • 同じ物件が存在しない • 間取り,階数,立地などの物件変数が賃料に影響を与える 賃貸物件の価格決定方法 [大野喜,2016] • 積算法 • 収益分析法 • 賃貸事例比較法 • 対象物件の周囲の物件や類似する物件を参照して賃料を決定 • 決定支援にヘドニック・アプローチを採用 はじめに 2 大野喜久之輔:継続賃料鑑定評価を再考する, 都市住宅学,住宅新報社,2016.
  • 3. / 20 JSAI 2019 2019.6.4 ヘドニック・アプローチ ある商品の価格をその商品の変数の価値に関する集合とし, その商品価格の予測モデルを線形回帰で構築する技術[唐渡,2016]   既存のヘドニック・アプローチは間取り図が考慮されていない 3 ŷi = ↵1x1 + ↵2x2 + ↵3x3 + · · · + ↵nxn + <latexit sha1_base64="vQx08F43bZHjET/G6F0shHJHj2A=">AAADG3ichVFNSxxBFKwZYzSbGFdzCSSHJYtBEKR3FRQhIOYSSA5+ZFVYZenptNo4OzPMzC7ZLPkD+QMeJIcEJIT8DC8h5OrBnyAeDeSSQ2pmhxFdTB7MdPXrqlfvdTuBa6JYiFPLHrg1eHto+E7h7r2R+6PFsfH1yG+FSteU7/rhpiMj7RpP12ITu3ozCLVsOq7ecPafJ+cbbR1Gxvdex51Abzflrmd2jJIxU36xji3sQSJGCR00YLiW8IxZCRdBetZAFxW8x9scTZFznVHNGdUbGDM5YyZjHOENfHpHxFN9fC/ne3lFB5p82SiWxbRIo9QPKhkoI4tlv/iF4sRMoYUmi3gso2gnaR6hzrEErWNs004iJDLpuaZ1gdoWWZoMyew+/7vc1bOsx31SM0rVii4uv5DKEibEifgqLsR38U2ciT831uqmNZJeOlydnlYHjdEPD9d+/1fVTJ9w71L1z55j7GA+7dWw9yDNJFOonr797uBibWF1ovtUfBbn7P+TOBXHnMBr/1JHK3r1EAU+QOX6dfeD9ep0hXhltry4lD3FMB7hCSZ533NYxAssowZlPbaWrJfWK/ujfWz/sH/2qLaVaR7gStgnfwFUmKzq</latexit> <latexit sha1_base64="vQx08F43bZHjET/G6F0shHJHj2A=">AAADG3ichVFNSxxBFKwZYzSbGFdzCSSHJYtBEKR3FRQhIOYSSA5+ZFVYZenptNo4OzPMzC7ZLPkD+QMeJIcEJIT8DC8h5OrBnyAeDeSSQ2pmhxFdTB7MdPXrqlfvdTuBa6JYiFPLHrg1eHto+E7h7r2R+6PFsfH1yG+FSteU7/rhpiMj7RpP12ITu3ozCLVsOq7ecPafJ+cbbR1Gxvdex51Abzflrmd2jJIxU36xji3sQSJGCR00YLiW8IxZCRdBetZAFxW8x9scTZFznVHNGdUbGDM5YyZjHOENfHpHxFN9fC/ne3lFB5p82SiWxbRIo9QPKhkoI4tlv/iF4sRMoYUmi3gso2gnaR6hzrEErWNs004iJDLpuaZ1gdoWWZoMyew+/7vc1bOsx31SM0rVii4uv5DKEibEifgqLsR38U2ciT831uqmNZJeOlydnlYHjdEPD9d+/1fVTJ9w71L1z55j7GA+7dWw9yDNJFOonr797uBibWF1ovtUfBbn7P+TOBXHnMBr/1JHK3r1EAU+QOX6dfeD9ep0hXhltry4lD3FMB7hCSZ533NYxAssowZlPbaWrJfWK/ujfWz/sH/2qLaVaR7gStgnfwFUmKzq</latexit> <latexit sha1_base64="Mhn41z7d/Q2n10aqYFv7sL5P/oA=">AAADG3ichVHLShxBFD3dxqiTh6PZBJLFkMEQEKRmXCiCIGYTiAsfGRUmMlRXSi3s6W66ewYnQ34gP5BFyMKASMhnuAkhWxd+grg04MZFTvc0LXEwudBdp26dc8+9VU7gmigW4tSyB+4M3h0aHincu//g4WhxbHw98luh0jXlu3646chIu8bTtdjErt4MQi2bjqs3nL2XyflGW4eR8b03cSfQW02545lto2TMlF+s4y12IRGjhA4aMFxLmGdWwkWQnjXQRQUfsJ+jSXJuMqo5o3oLYzpnTGeMQ7yDT++IeLKP7+V8L6/oQJMvG8WymBJplPpBJQNlZLHsF48oTswUWmiyiMcyinaS5hHqHEvQOsYW7SRCIpOea1oXqG2RpcmQzO7xv8NdPct63Cc1o1St6OLyC6ksYUKciG/iQvwQ38WZuLq1VjetkfTS4er0tDpojH58vHb5X1UzfcLda9U/e46xjdm0V8PegzSTTKF6+vb7Txdrc6sT3efiqzhn/wfiVBxzAq/9Wx2u6NXPKPABKjevux+sV6cqxCvV8sJi9hTDeIJneMH7nsECXmEZNSjrqbVovbaW7C/2sf3T/tWj2lameYS/wj75A1P4rOg=</latexit> 占有面積 立地 階数 築年数 賃料 唐渡 広志:ヘドニック・アプローチを利用した不動産価格 指数の推定方法とその問題点,都市住宅学,vol.2016, no.92,pp.17-20, 2016.
  • 4. / 20 JSAI 2019 2019.6.4 ヘドニック・アプローチを用いた関連研究 4 • Ram P. Dahal and Robert K. Grala and Jason S. Gordon and Ian A. Munn and Daniel R. Petrolia and J. Reid Cummings: A hedonic pricing method to estimate the value of waterfronts in the Gulf of Mexico,Urban Forestry & Urban Greening,vol.41, pp.184-194,2019. • Dr. Philipp Deschermeier and Björn Seipelt: A Hedonic Rent Index for Student Housing in Germany,Cologne Institute for economic research,pp.1–12,2016. • yung-Jin Jun, Hee-Jae Kim:Measuring the effect of greenbelt proximity on apartment rents in Seoul,Cities,vol. 62, 2017. 建物構造 立地 /アクセス 周辺環境 売買契約 画像 Ram+ 2019 ○ ○ ○ × × Philipp+ 2016 ○ ○ ○ × × Jun+ 2017 ○ ○ ○ ○ × 本研究 ○ ○ × ○ ○ 説明変数として使用されている変数のカテゴリ
  • 6. / 20 JSAI 2019 2019.6.4 目的: 賃料予測における間取り図の影響を明らかにする 手段: 賃料の予測誤差を比較 • 間取り図を考慮しない予測モデル(LR) • 間取り図を考慮した予測モデル • 線形変換による特徴量抽出法(PCA-LR) • 非線形変換による特徴量抽出法(VGG-LR) 研究内容 6
  • 7. / 20 JSAI 2019 2019.6.4 一般的なヘドニック・アプローチ • 予測式: • 説明変数に間取り図を含まない • scikit-learn(version:0.20.2)のLinearRegressionクラス使用 LR(Linear-Regression) 7 ŷi = f(xi) = ↵T xi + <latexit sha1_base64="gAXdu8udRiXbYQWOcxxODvbMMjU=">AAACwnichVHLShxBFD12otHxNcaN4KbJYDAIUhMCCYIgJossfY0K9qSpbmtmSqsf6a4ZMun0D+QHssgqQgjiZ7jJD2ThJ0h2GcGNi9zpadCo0dt03VOn7rl1qsoJlYw1Yyd9xoOH/QOPBocKwyOjY+PFicebcdCMXFFxAxVE2w6PhZK+qGipldgOI8E9R4ktZ/91d32rJaJYBv6Gboei6vG6L2vS5Zoou1i1GlybbVuai2ZtNrGcQO3GbY+S+SG1E5k+MxevkInFVdjg6bvE8rhuRF6ykaa3qOZMyxGa28USm2dZmDdBOQcl5LESFH/Awi4CuGjCg4APTViBI6ZvB2UwhMRVkRAXEZLZukCKAmmbVCWoghO7T2OdZjs569O82zPO1C7touiPSGlihv1ih6zDfrIjdsou/tsryXp0vbQpOz2tCO3xz1Pr5/eqPMoajUvVnZ41aniVeZXkPcyY7incnr718UtnfWFtJnnKDthv8v+NnbBjOoHfOnO/r4q1ryjQA5SvX/dNsPl8vkx49UVpaTl/ikFM4wlm6b5fYglvsYIK7XuMU/xBx3hj7BnvjbhXavTlmkn8E8anv2ZjsFI=</latexit> <latexit sha1_base64="gAXdu8udRiXbYQWOcxxODvbMMjU=">AAACwnichVHLShxBFD12otHxNcaN4KbJYDAIUhMCCYIgJossfY0K9qSpbmtmSqsf6a4ZMun0D+QHssgqQgjiZ7jJD2ThJ0h2GcGNi9zpadCo0dt03VOn7rl1qsoJlYw1Yyd9xoOH/QOPBocKwyOjY+PFicebcdCMXFFxAxVE2w6PhZK+qGipldgOI8E9R4ktZ/91d32rJaJYBv6Gboei6vG6L2vS5Zoou1i1GlybbVuai2ZtNrGcQO3GbY+S+SG1E5k+MxevkInFVdjg6bvE8rhuRF6ykaa3qOZMyxGa28USm2dZmDdBOQcl5LESFH/Awi4CuGjCg4APTViBI6ZvB2UwhMRVkRAXEZLZukCKAmmbVCWoghO7T2OdZjs569O82zPO1C7touiPSGlihv1ih6zDfrIjdsou/tsryXp0vbQpOz2tCO3xz1Pr5/eqPMoajUvVnZ41aniVeZXkPcyY7incnr718UtnfWFtJnnKDthv8v+NnbBjOoHfOnO/r4q1ryjQA5SvX/dNsPl8vkx49UVpaTl/ikFM4wlm6b5fYglvsYIK7XuMU/xBx3hj7BnvjbhXavTlmkn8E8anv2ZjsFI=</latexit> <latexit sha1_base64="gAXdu8udRiXbYQWOcxxODvbMMjU=">AAACwnichVHLShxBFD12otHxNcaN4KbJYDAIUhMCCYIgJossfY0K9qSpbmtmSqsf6a4ZMun0D+QHssgqQgjiZ7jJD2ThJ0h2GcGNi9zpadCo0dt03VOn7rl1qsoJlYw1Yyd9xoOH/QOPBocKwyOjY+PFicebcdCMXFFxAxVE2w6PhZK+qGipldgOI8E9R4ktZ/91d32rJaJYBv6Gboei6vG6L2vS5Zoou1i1GlybbVuai2ZtNrGcQO3GbY+S+SG1E5k+MxevkInFVdjg6bvE8rhuRF6ykaa3qOZMyxGa28USm2dZmDdBOQcl5LESFH/Awi4CuGjCg4APTViBI6ZvB2UwhMRVkRAXEZLZukCKAmmbVCWoghO7T2OdZjs569O82zPO1C7touiPSGlihv1ih6zDfrIjdsou/tsryXp0vbQpOz2tCO3xz1Pr5/eqPMoajUvVnZ41aniVeZXkPcyY7incnr718UtnfWFtJnnKDthv8v+NnbBjOoHfOnO/r4q1ryjQA5SvX/dNsPl8vkx49UVpaTl/ikFM4wlm6b5fYglvsYIK7XuMU/xBx3hj7BnvjbhXavTlmkn8E8anv2ZjsFI=</latexit> このLRと間取り図を考慮したPCA-LRとVGG-LRを比較する f(xi) xi ŷi 変数 ベクトル 賃料
  • 8. / 20 JSAI 2019 2019.6.4 • 主成分分析による特徴抽出 • 抽出した間取り図の特徴量と              変数ベクトルを組み合わせ,線形回帰で賃料予測 • 間取り図の特徴量: 64,128,256,512,1024, 2048次元の6種類 PCA(Principal Component Analysis)-LR 8 • scikit-learn(version:0.20.2) のPCAクラス使用 • LRの説明変数に間取り図を追加したモデル 特 徴 量 主成分 分析 vi 属性 ベクトル φθ(vi) ui xi ŷi 賃料 f(xi) x = [u, ✓(v)] <latexit sha1_base64="tbvrKtiF/xOXDGMbwaD2COlchy8=">AAACqXichVFNSxtBGH6y9SPGr9hehF6WhpQUJUxUUApCsD30mKjRYBLC7jqawf1idxIal/0D/QMeemqhlLY/w4tHLz2k/6B4jNBLD32zWZAYrO8w8z7zvO/zzjszumsKXzLWSyhPJianppMzqdm5+YXF9NLTA99pewavGI7peFVd87kpbF6RQpq86npcs3STH+pnbwbxww73fOHY+7Lr8oalndriRBiaJKqZfhvUdcc89rsWOfV9qG6rtRGqHa6qdbclmmpQly0utTA3Eu+ErxrNdIblWWTqOCjEIIPYSk76K+o4hgMDbVjgsCEJm9Dg06ihAAaXuAYC4jxCIopzhEiRtk1ZnDI0Ys9oPaVdLWZt2g9q+pHaoFNMmh4pVWTZT/aN9dkV+8F+s78P1gqiGoNeuuT1oZa7zcUPy3t/HlVZ5CVad6r/9ixxgq2oV0G9uxEzuIUx1HfOL/p7r3ezwUv2md1Q/59Yj13SDezOrfGlzHc/IkUfULj/3OPgYC1fWM+vlTcyxZ34K5J4jhfI0Xtvooh3KKFC537HNXr4pawoZaWqHA1TlUSseYYRU4x/JIqlEA==</latexit>
  • 9. / 20 JSAI 2019 2019.6.4 VGG-LR 9 • ミニバッチ+確率的勾配降下法を適用 • batch size: 100,epoch: 100 • 間取り図の特徴抽出: 64次元 • 活性化関数: ReLU • Keras(version:2.2.4)のFunction API • 間取り図を非線変換で特徴抽出するモデル x = [u, h✓(v)] <latexit sha1_base64="o9TUYv/8nCTnfgkDaEu18FszFcY=">AAACpnichVFNSyNBEH0ZPzZmVxP1IngZNrhEkNCJCy4LC65ePEnUjRGSEGcmrRkyX8x0wsZh/sD+AQ+eFETEn+HFi0dd/Ani0YW9eLAyGZAoajXd9fpVverqbtUxdE8wdhOTBgaHhj/ERxIfP42OJVPjE5ue3XI1XtRsw3a3VMXjhm7xotCFwbcclyumavCS2lzuxktt7nq6bf0SHYdXTWXX0nd0TRFE1VI//YpqG3WvY5KTfwfyD7ncR7WCOblR8yuiwYUSyJm+YDuYrdZSaZZlockvQS4CaURWsFMnqKAOGxpaMMFhQRA2oMCjUUYODA5xVfjEuYT0MM4RIEHaFmVxylCIbdK6S7tyxFq079b0QrVGpxg0XVLKmGFX7JTdswt2xm7Zw6u1/LBGt5cOebWn5U4t+Wdq4/+7KpO8QONJ9WbPAjv4FvaqU+9OyHRvofX07b39+43v6zP+F3bE7qj/Q3bDzukGVvufdrzG1w+QoA/IPX/ul2Azn83NZ/NrX9OLS9FXxDGNz8jQey9gESsooEjnnuAS1/grZaRVqSiVeqlSLNJMos+k7Uf+WKO9</latexit> VGG16 vi ŷi 属性 ベクトル ui 賃料 xi f(xi) f(xi) 特 徴 量 hθ(vi)
  • 10. / 20 JSAI 2019 2019.6.4 VGG16の構造 10 Karen Simonyan,and Andrew Zisserman: Very Deep Convolutional Networks for Large-Scale Image Recognition,Computing Research Repository,vol.abs/1409.1556,2014. VGG16 [Karen+,2014]: オックスフォード大学のVGGチームによって開発された 学習済みのニューラルネットワーク 7 × 7 × 512 13 224 × 224 × 3 1 × 1000 1 × 4096 14 × 14 × 512 28 × 28 × 512 ・ ・ ・ 層 224 × 224 × 3 28 × 28 × 512 11 1 × 64 ・ ・ ・ 層 使用するVGG16 • 後ろの5層を除去 • 64次元の全結合層追加 • 後ろ3層のみ学習
  • 11. / 20 JSAI 2019 2019.6.4 実験環境 LIFULL HOME’Sデータセット(2015年9月時点) • 賃貸物件データ(70変数,533万件) • 120×120ピクセルの画像データ(8,300万ファイル) 使用する計算機(OS: Ubuntu 18.04.1) • CPU:Xeon(R) CPU E5-2650 v3 @ 2.30GHz • GPU:GeForce GTX 1080 Ti 11GB • メモリ:64GB 11
  • 12. / 20 JSAI 2019 2019.6.4 徒歩距離,立地,階数(地上),階数(地下),市町村区,部屋階数, 契約期間,建物構造,駐車場料金,新築・未入居フラグ,占有面積,  築年数,間取り図 使用賃貸物件データ(14変数,9万件) • 東京都のデータを使用( 47都道府県で最もデータ量が多いため) • 目的変数:賃料 + 共益費 • 説明変数: • 間取り図:グレースケール変換 データセット分割 • 使用賃貸物件データを間取り規格を基準にK,R,DK,LD,LDKの5種類に分割 • LDはデータ数が35件のため使用しない • 20%をテストデータに,80%を開発用データに分割 データセット 12
  • 13. / 20 JSAI 2019 2019.6.4 実験概要 13 1. ハイパーパラメータチューニング • PCA-LRにおける適切な間取り図の次元数を探索 • 64,128,256,512,1024,2048次元の6種類 • 開発用データに10-fold cross-validationを適用 • 評価指標:平方平均二乗誤差(RMSE: Root Mean Square Error) 2. テストデータに対するLRとVGG-LR,PCA-LRの評価 1. RMSEによる評価と学習時間 2. 予測値の可視化
  • 15. / 20 JSAI 2019 2019.6.4 2-1.RMSEによる評価と学習時間 15 データ数 LR PCA-LR VGG-LR K 1,712 11,602 11,689 16,862 R 7,525 9,217 8,727 12,541 DK 3,548 11,156 10,957 16,467 LDK 6,842 20,121 19,646 22,878 データ数 LR PCA-LR VGG-LR K 9,205 0.06 11 2,897 R 39,985 0.08 48 14,566 DK 18,975 0.05 23 6,471 LDK 36,595 0.07 45 13,026 テストデータに対するRMSE[円] 開発用データの学習時間[秒]
  • 16. LR PCA-LR VGG-LR 間取り規格R LR PCA-LR VGG-LR 間取り規格K 2-2.予測値の可視化
  • 17. / 20 JSAI 2019 2019.6.4 2-2.累積密度関数(1/2) 17 K R = |1 − ̂ y y | 横軸:error rate 縦軸:error rate 以下の誤差に収まっているデータ数の割合 y : 真値 ̂ y :予測値
  • 18. / 20 JSAI 2019 2019.6.4 DK LDK 18 2-2.累積密度関数(2/2)
  • 19. / 20 JSAI 2019 2019.6.4 LIFULL HOME’Sデータセット外の物件予測 19 間取り図 構造 間取り 規格 賃料 LR PCA-LR VGG-LR 自宅 RC K 65,000 61,361 62,545 83,695 学生寮 RC K 47,700 56,931 49,716 64,526 A宅 木造 K 74,000 66,695 68,701 58,561 B宅 鉄筋 LDK 128,000 130,988 122,887 181,913
  • 20. / 20 JSAI 2019 2019.6.4 おわりに 目的:賃料予測における間取り図の影響を明らかにする 実験結果 間取り図を考慮することで予測誤差が改善する • 特徴量抽出に主成分分析を用いることでRMSEが改善する • 間取り図の特徴量は1024,2048次元の高次元が望ましい • 1024,2048次元の間取り図の特徴量で間取り図の大部分の特徴量を  抽出できる • 特徴量抽出にVGGを用いることで,error rateが0.1以下の物件数が増える • 予測誤差のばらつきが課題 • 計算コストが課題 20