Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

不動産価格査定におけるヘドニックアプローチからディープラーニングへの進化の軌跡

1,062 views

Published on

人工知能時代に備えて不動産関連データについて色々語らう勉強会 資料

Published in: Technology
  • Be the first to comment

不動産価格査定におけるヘドニックアプローチからディープラーニングへの進化の軌跡

  1. 1. 不動産価格査定における ヘドニックアプローチから ディープラーニングへの 進化の軌跡
  2. 2. 自己紹介 • 濵田 雄斗(はまだ ゆうと) • 職歴 • イタンジ インターン • イタンジ 就職 • 職業 • データサイエンティスト • エンジニア • 気になる • AIチャット
  3. 3. ITANDIの目指す道 ITANDIとは 不動産の在り方を変えてく 不動産は“動かないモノ”であるがゆえに、取引コスト、情報の偏在、需給の不一致など 摩擦が生じやすい。 我々は不動産(業)のデジタル化を推し進めることで、固定的で硬 直的な不動産のあり方を覆し、すべての人がすべての不動産に自由にアクセスできる 世界を実現する。 不動産取引をなめらかにする 我々はテクノロジーによって不動産業務の分業化、細分化、自動化を推し進め、不動産 取引を滑らかにする。 不動産の価値は使用と交換によって生まれる。世界中の人々が 必用なときに、必用な単位で使用・交換できるようにすることで、不動産の使用価値と 資産価値は最大化する。 人間とテクノロジーの融合 我々は技術を創造し、活用し、世界へ価値を提供する事を生業としている。我々はテク ノロジストであり、アントレプレナーであり、マーケッターである。最高の技術を身につけ、 最高の製品を創りあげ、最高の価値を提供しよう。
  4. 4. VALUE 価格算定機能を持ったAI  過去20年分25万件に及ぶ 区分所有マンションの成約 事例を解析  500名の個人投資家が利用 (2016年6月時点)  価格算出の精度は96%程 度  賃料算出と10年後の再販価 格も予測  DCFとIRRによって投資価値 を判定
  5. 5. 2つのアプローチ ヘドニックアプローチ DeepLearning
  6. 6. ヘドニックアプローチ ヘドニック法は環境条件の違いが どのように地価の違いに 反映されているかを観察し それをもとに環境の価値の計測を 行う手法である。 国土交通政策研究所
  7. 7. ヘドニックアプローチ 「坪単価」 = 2155724 + -18390.59 × 「駅徒歩」 + -15901.88 × 「部屋数」 + 72.31378 × 「管理費」 + -32.82219 × 「修繕費」 + -73772.4 × 「構造」 + 4556.246 × 「所在階」 + 30122.13 × 「総階数」 + -31798.67 × 「築年月」 + 32975.37 × 「バルコニー」 + 0.3641633 × 「駅毎平均坪単価」 + 80394.72 × 「土地権利」 + 323917.2 × 「シリーズ物」 + -54608.89 × 「タワーマンション」 係数 ✕ 変数 ※ダミー変数:数字でないデータを数字変換する。
  8. 8. データ • 使用データ • 約1ヶ月の募集データ(約1万5000件) • クローリング • 路線ごと、平米ごとで分割(120以上に分類) • Ex)山手線の30㎡以下、山手線の30㎡以上50㎡以下 • 理由:精度を上げるため • 物件の条件のみを使用し、経済指標は使用せず • 目的変数 • 販売物件の募集坪単価 • 販売物件の予測月額賃料
  9. 9. データの整形 Ruby でごりごり。。。
  10. 10. モデルの作成 Rでまわす (無理やりRailsで) rrx
  11. 11. 予測 係数をmysqlに保存して、Rails内で計算
  12. 12. 精度 R2 平均0.6
  13. 13. この時の課題 • 精度が低すぎる • 少ないデータ数 • 100以上のモデルのメンテ工数 • 少ない変数
  14. 14. 少ない変数 実業務・実購入の知見がない →眼前のデータからしか変数を作れない 物件を購入する人は何を考えているのか? →弊社代表伊藤の知見
  15. 15. 解決策 • 精度が低すぎる • 少ないデータ数 • 100以上のモデ ルのメンテ工数 • 少ない変数 ? クローリング プロの教え
  16. 16. 新技術(2015年5月当時) Deep Learning chainerまだなかった
  17. 17. H2O Java scala python可能 GUI完備 Sparkの分散処理で 高速化 まだGPUとかそこまで盛り上がっ てなかった
  18. 18. データ -クローリングの結果- • データ数は25万件に増加 • モデルは4つまで減少 モデル数 データ数 4月 6月 1 30 25倍
  19. 19. データ • 使用データ • 過去25年の成約データ(約25万件) • 平米ごとで分割(4つに分割) • 物件の条件と、経済指標を使用 • 金利、空室率、病床数、etc • 目的変数 • 販売物件の成約坪単価 • 販売物件の予測月額賃料
  20. 20. データのクリーニング Rails内で自動化
  21. 21. モデルの作成 (GUIでも可能)
  22. 22. モデルの作成 (scalaでCUI化)
  23. 23. 予測 Railsからコンパイルしたjavaバイナリを実行
  24. 24. 精度 R2 平均0.9
  25. 25. Deep Leaningの課題 • モデルの作成時間 – スポットインスタンスの活用 • ブラックボックス – ヘドニックのような 各変数に対しての説明が不可
  26. 26. まとめ -アルゴリズム- ヘドニックアプローチ Deep Learning メ リ ッ ト • 変数の影響力が明確 • DLほどデータ数が必要で はない • 精度が出る • 変数選定の工数低 デ メ リ ッ ト • 変数選定の工数高 • やりきれば精度出る • 変数の影響力が不明 • 膨大なデータ数が必要
  27. 27. まとめ -データまわり- データだけではわからない必要変数の存在 →実際に購入する、値段を付ける場合に人は何を 見ているか R2が高い ≠ 精度が高い
  28. 28. ご清聴 ありがとうございました

×