Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.
W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 )
「LIFULL HOME'Sデータセット」提
供を通じた不動産テック分野のオー
プンイノベー...
W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 )
清田 陽司
LIFULL Lab 主席研究員
福岡県久留米市生まれ→大学(院)@京都→東京
...
W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 )
W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 )
総掲載物件数No.1の
不動産・住宅情報サイト
暮らしに密着したさまざまな
情報サービス (...
W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 )
W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 )
W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 )
W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 )
LIFULL Lab (リッテルラボラトリー)
• ルーツは2007年設立の
東京大学発スタ...
W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 )
不動産テック?
W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 )
出典: Manyika, James et al. Digital America: A t...
W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 )
学際分野としての不動産テック
• 不動産学
• 経済学
• 建築学
• 都市学
• マーケテ...
W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 )
W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 )
情報科学技術フォーラム(FIT 2017)
@東大 不動産セッション (9/14)
W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 )
不動産と
画像処理・ディープラーニング
W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 )
国内の賃貸不動産物件データ
約530万件
• 所在地 (郵便番号、最寄り駅など)
• 賃料、...
W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 )
NII-IDRユーザ
フォーラム2017
12/4(月)
国立情報学研究所
• 利用者からの...
W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 )
LIFULL HOME’Sデータセット
利用の状況
日本国内の40以上の大学研究室・
研究機...
W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 )
不動産情報サイトで不動産会社を選
ぶ際のポイントは?
(RSC 2015年調査)
物件の写真...
W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 )
どちらの物件情報がユーザーに
とってより嬉しい?
A社 B社
W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 )
料理がしやすいキッチンはど
れ?
W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 )
› どの種類の物件画像なのかを判定する
› LIFULL HOME’Sデータセット画像に付け...
W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 )
画像種別の判別精度
› テストデータの誤り率: 0.143
正答サンプル 不正答サンプル
キ...
W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 )
W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 )
W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 )
キッチンのワークスペース広さ判別タスク
とても狭い 狭い 普通 広い とても広い
まな板が置...
W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 )
キッチンのワークスペース広さ判別タ
スク: 結果
› クラス判別の誤り率: 36.2%
› ...
W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 )
Washington Univ. in St. Louis 古川
泰隆先生のグループによる研...
W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 )
ディープ多形態対応学習
W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 )
どの画像が左の間取り図に対応するかを判別するNN
W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 )
判別精度
※緑色の数字はAmazon Mturkのワーカーによる
判別精度
W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 )
画像にノイズを加えて、写真が間取り
図のどこに対応するかを識別
W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 )
意図的に画像を加工するとどうなる?
W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 )
間取り図ナビゲーションへの応用
W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 )
間取り図画像を解析して
3Dモデルを生成
古川准教授のグループによるLIFULL HOME’...
Upcoming SlideShare
Loading in …5
×

「LIFULL HOME'Sデータセット」提供を通じた不動産テック分野のオープンイノベーション

867 views

Published on

WebDB Forum 2017@お茶の水女子大学
テクノロジーショーケース

Published in: Technology
  • Be the first to comment

  • Be the first to like this

「LIFULL HOME'Sデータセット」提供を通じた不動産テック分野のオープンイノベーション

  1. 1. W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 ) 「LIFULL HOME'Sデータセット」提 供を通じた不動産テック分野のオー プンイノベーション LIF ULL Lab 主席研究員 清田 陽司 2 0 1 7 . 0 9 . 1 8 W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス @ お 茶 の 水 女 子 大 学 C o p y r i g h t © L I F U L L A l l R i g h t s R e s e r v e d .
  2. 2. W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 ) 清田 陽司 LIFULL Lab 主席研究員 福岡県久留米市生まれ→大学(院)@京都→東京 関心分野: 自然言語処理応用 → 検索・推薦 → 情報リテラシー (図書館) → 生活領域 (不動産、介護 etc.) でのメディア技術活用 (画像解析含む) 経歴: 大学教員 → 兼業で起業 → そちらが本業に → 買収 対外的活動 • WebDB Forum 2017産学連携担当幹事 • 情報処理学会データベースシステム研究会 幹事 • IEEE DSAA 2017 Sponsorship co-chair • 人工知能学会 編集委員 • JST「情報管理」誌 外部編集委員 • Code4Lib JAPAN共同代表 etc.
  3. 3. W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 )
  4. 4. W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 ) 総掲載物件数No.1の 不動産・住宅情報サイト 暮らしに密着したさまざまな 情報サービス (引越, 保険, 介護, 子育て, 音楽ライブ, スポーツ選手支援 etc.) 世界約50カ国向けに展開する 住宅・中古車・求職などの アグリゲーションサイト (本社: スペイン バルセロナ) LIFULLグループのサービス群
  5. 5. W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 )
  6. 6. W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 )
  7. 7. W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 )
  8. 8. W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 ) LIFULL Lab (リッテルラボラトリー) • ルーツは2007年設立の 東京大学発スタート アップ (株)リッテル • 住まいや暮らしに関わ る最先端技術のR&D • レコメンデーション • AI関連技術(ディー プラーニングなど) • ユーザーインタ フェース (UX) • VR / AR / MR 新感覚お部屋探しアプリ HOME’Sヘヤサク! 部屋作りシミュレーション GRID VRICK
  9. 9. W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 ) 不動産テック?
  10. 10. W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 ) 出典: Manyika, James et al. Digital America: A tale of the haves and have-mores. McKinsey Global Institute. 2015 http://www.mckinsey.com/industries/high-tech/our-insights/digital-america-a-tale-of-the-haves-and-have-mores
  11. 11. W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 ) 学際分野としての不動産テック • 不動産学 • 経済学 • 建築学 • 都市学 • マーケティング学、行動心理学 • 情報学 • 画像処理 • 自然言語処理 • IoT (ユビキタスコンピューティング)
  12. 12. W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 )
  13. 13. W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 ) 情報科学技術フォーラム(FIT 2017) @東大 不動産セッション (9/14)
  14. 14. W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 ) 不動産と 画像処理・ディープラーニング
  15. 15. W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 ) 国内の賃貸不動産物件データ 約530万件 • 所在地 (郵便番号、最寄り駅など) • 賃料、面積、築年数、部屋タイプ etc. • 建物構造 (木造、鉄骨、鉄筋コンクリート etc.) • 各種こだわり条件 (ペット可、楽器、カウ ンターキッチン、バス・トイレ別 etc.) 物件画像 約8300万点 間取り図 約510万点 重厚な感じの エントランス 日当たりの 良いリビング 主な研究分野: •画像処理 (ディープラーニング) •自然言語処理 •Web・ソーシャルメディア解析 •経済学 (価格推定) •建築学 •都市学 LIFULL HOME’Sデータセット
  16. 16. W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 ) NII-IDRユーザ フォーラム2017 12/4(月) 国立情報学研究所 • 利用者からのポス ター発表 • 招待講演 • パネルセッション
  17. 17. W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 ) LIFULL HOME’Sデータセット 利用の状況 日本国内の40以上の大学研究室・ 研究機関ほか、米国・カナダでも 利用
  18. 18. W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 ) 不動産情報サイトで不動産会社を選 ぶ際のポイントは? (RSC 2015年調査) 物件の写真の点数が多い 物件の写真の見栄えが良い 71.9% 32.5% 出典:不動産情報サイト事業者連絡協議会. 「不動産情報サイト利用者意識アンケート」調査結果. 2016 https://www.rsc-web.jp/pre/img/161027.pdf
  19. 19. W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 ) どちらの物件情報がユーザーに とってより嬉しい? A社 B社
  20. 20. W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 ) 料理がしやすいキッチンはど れ?
  21. 21. W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 ) › どの種類の物件画像なのかを判定する › LIFULL HOME’Sデータセット画像に付けられてい るタグを正解データとして使用 • 13タグ分の画像を使用 • それぞれ訓練用1万枚、検証用1000枚 • ライブラリはChainerを利用  外観  周辺 内装  その他  寝室  子供部屋  洗面  収納  設備  バルコニー  エントランス  駐車場 使用するタグ 使用しないタグ 外観 周辺 居間 間取り 風呂 間取り 地図 玄関 居間 キッチン 風呂 トイレ 画像種別のディープラーニング(CNN)に よる判別
  22. 22. W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 ) 画像種別の判別精度 › テストデータの誤り率: 0.143 正答サンプル 不正答サンプル キッチン97.3% リビング52.0% 間取り91.0% 風呂100.0% 正解:リビング 結果:収納 収納 40.1% リビング 20.6% 洗面 12.1% 正解:洗面 結果:風呂 風呂 64.7% 洗面 26.2% トイレ 3.1% 正解:収納 結果:風呂 風呂 75.0% トイレ 9.2% バルコニー 3.7%
  23. 23. W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 )
  24. 24. W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 )
  25. 25. W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 ) キッチンのワークスペース広さ判別タスク とても狭い 狭い 普通 広い とても広い まな板が置け ない まな板はおけ るが、切った もの等を置け ない まな板、切っ たものなどを 置ける 複数の調理過 程のものを置 ける 調理に十分な スペースがあ る › 置けるものの程度で5段階+その他で6クラス分類 › 5500枚を分類し、各1000枚になるようデータ拡張
  26. 26. W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 ) キッチンのワークスペース広さ判別タ スク: 結果 › クラス判別の誤り率: 36.2% › 相関係数:0.717 分類 スコア とても狭い 20 狭い 40 普通 60 広い 80 とても広い 100
  27. 27. W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 ) Washington Univ. in St. Louis 古川 泰隆先生のグループによる研究 https://arxiv.org/pdf/1612.01225.pdf
  28. 28. W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 ) ディープ多形態対応学習
  29. 29. W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 ) どの画像が左の間取り図に対応するかを判別するNN
  30. 30. W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 ) 判別精度 ※緑色の数字はAmazon Mturkのワーカーによる 判別精度
  31. 31. W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 ) 画像にノイズを加えて、写真が間取り 図のどこに対応するかを識別
  32. 32. W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 ) 意図的に画像を加工するとどうなる?
  33. 33. W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 ) 間取り図ナビゲーションへの応用
  34. 34. W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 ) 間取り図画像を解析して 3Dモデルを生成 古川准教授のグループによるLIFULL HOME’Sデータセット利用研究 https://www.cse.wustl.edu/~chenliu/floorplan-transformation.html → 画像処理のトップレベル国際会議 ICCV 2017に採択

×