Advertisement
Advertisement

More Related Content

Similar to 「LIFULL HOME'Sデータセット」提供を通じた不動産テック分野のオープンイノベーション(17)

More from Yoji Kiyota(20)

Advertisement

Recently uploaded(20)

「LIFULL HOME'Sデータセット」提供を通じた不動産テック分野のオープンイノベーション

  1. W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 ) 「LIFULL HOME'Sデータセット」提 供を通じた不動産テック分野のオー プンイノベーション LIF ULL Lab 主席研究員 清田 陽司 2 0 1 7 . 0 9 . 1 8 W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス @ お 茶 の 水 女 子 大 学 C o p y r i g h t © L I F U L L A l l R i g h t s R e s e r v e d .
  2. W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 ) 清田 陽司 LIFULL Lab 主席研究員 福岡県久留米市生まれ→大学(院)@京都→東京 関心分野: 自然言語処理応用 → 検索・推薦 → 情報リテラシー (図書館) → 生活領域 (不動産、介護 etc.) でのメディア技術活用 (画像解析含む) 経歴: 大学教員 → 兼業で起業 → そちらが本業に → 買収 対外的活動 • WebDB Forum 2017産学連携担当幹事 • 情報処理学会データベースシステム研究会 幹事 • IEEE DSAA 2017 Sponsorship co-chair • 人工知能学会 編集委員 • JST「情報管理」誌 外部編集委員 • Code4Lib JAPAN共同代表 etc.
  3. W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 )
  4. W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 ) 総掲載物件数No.1の 不動産・住宅情報サイト 暮らしに密着したさまざまな 情報サービス (引越, 保険, 介護, 子育て, 音楽ライブ, スポーツ選手支援 etc.) 世界約50カ国向けに展開する 住宅・中古車・求職などの アグリゲーションサイト (本社: スペイン バルセロナ) LIFULLグループのサービス群
  5. W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 )
  6. W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 )
  7. W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 )
  8. W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 ) LIFULL Lab (リッテルラボラトリー) • ルーツは2007年設立の 東京大学発スタート アップ (株)リッテル • 住まいや暮らしに関わ る最先端技術のR&D • レコメンデーション • AI関連技術(ディー プラーニングなど) • ユーザーインタ フェース (UX) • VR / AR / MR 新感覚お部屋探しアプリ HOME’Sヘヤサク! 部屋作りシミュレーション GRID VRICK
  9. W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 ) 不動産テック?
  10. W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 ) 出典: Manyika, James et al. Digital America: A tale of the haves and have-mores. McKinsey Global Institute. 2015 http://www.mckinsey.com/industries/high-tech/our-insights/digital-america-a-tale-of-the-haves-and-have-mores
  11. W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 ) 学際分野としての不動産テック • 不動産学 • 経済学 • 建築学 • 都市学 • マーケティング学、行動心理学 • 情報学 • 画像処理 • 自然言語処理 • IoT (ユビキタスコンピューティング)
  12. W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 )
  13. W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 ) 情報科学技術フォーラム(FIT 2017) @東大 不動産セッション (9/14)
  14. W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 ) 不動産と 画像処理・ディープラーニング
  15. W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 ) 国内の賃貸不動産物件データ 約530万件 • 所在地 (郵便番号、最寄り駅など) • 賃料、面積、築年数、部屋タイプ etc. • 建物構造 (木造、鉄骨、鉄筋コンクリート etc.) • 各種こだわり条件 (ペット可、楽器、カウ ンターキッチン、バス・トイレ別 etc.) 物件画像 約8300万点 間取り図 約510万点 重厚な感じの エントランス 日当たりの 良いリビング 主な研究分野: •画像処理 (ディープラーニング) •自然言語処理 •Web・ソーシャルメディア解析 •経済学 (価格推定) •建築学 •都市学 LIFULL HOME’Sデータセット
  16. W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 ) NII-IDRユーザ フォーラム2017 12/4(月) 国立情報学研究所 • 利用者からのポス ター発表 • 招待講演 • パネルセッション
  17. W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 ) LIFULL HOME’Sデータセット 利用の状況 日本国内の40以上の大学研究室・ 研究機関ほか、米国・カナダでも 利用
  18. W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 ) 不動産情報サイトで不動産会社を選 ぶ際のポイントは? (RSC 2015年調査) 物件の写真の点数が多い 物件の写真の見栄えが良い 71.9% 32.5% 出典:不動産情報サイト事業者連絡協議会. 「不動産情報サイト利用者意識アンケート」調査結果. 2016 https://www.rsc-web.jp/pre/img/161027.pdf
  19. W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 ) どちらの物件情報がユーザーに とってより嬉しい? A社 B社
  20. W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 ) 料理がしやすいキッチンはど れ?
  21. W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 ) › どの種類の物件画像なのかを判定する › LIFULL HOME’Sデータセット画像に付けられてい るタグを正解データとして使用 • 13タグ分の画像を使用 • それぞれ訓練用1万枚、検証用1000枚 • ライブラリはChainerを利用  外観  周辺 内装  その他  寝室  子供部屋  洗面  収納  設備  バルコニー  エントランス  駐車場 使用するタグ 使用しないタグ 外観 周辺 居間 間取り 風呂 間取り 地図 玄関 居間 キッチン 風呂 トイレ 画像種別のディープラーニング(CNN)に よる判別
  22. W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 ) 画像種別の判別精度 › テストデータの誤り率: 0.143 正答サンプル 不正答サンプル キッチン97.3% リビング52.0% 間取り91.0% 風呂100.0% 正解:リビング 結果:収納 収納 40.1% リビング 20.6% 洗面 12.1% 正解:洗面 結果:風呂 風呂 64.7% 洗面 26.2% トイレ 3.1% 正解:収納 結果:風呂 風呂 75.0% トイレ 9.2% バルコニー 3.7%
  23. W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 )
  24. W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 )
  25. W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 ) キッチンのワークスペース広さ判別タスク とても狭い 狭い 普通 広い とても広い まな板が置け ない まな板はおけ るが、切った もの等を置け ない まな板、切っ たものなどを 置ける 複数の調理過 程のものを置 ける 調理に十分な スペースがあ る › 置けるものの程度で5段階+その他で6クラス分類 › 5500枚を分類し、各1000枚になるようデータ拡張
  26. W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 ) キッチンのワークスペース広さ判別タ スク: 結果 › クラス判別の誤り率: 36.2% › 相関係数:0.717 分類 スコア とても狭い 20 狭い 40 普通 60 広い 80 とても広い 100
  27. W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 ) Washington Univ. in St. Louis 古川 泰隆先生のグループによる研究 https://arxiv.org/pdf/1612.01225.pdf
  28. W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 ) ディープ多形態対応学習
  29. W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 ) どの画像が左の間取り図に対応するかを判別するNN
  30. W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 ) 判別精度 ※緑色の数字はAmazon Mturkのワーカーによる 判別精度
  31. W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 ) 画像にノイズを加えて、写真が間取り 図のどこに対応するかを識別
  32. W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 ) 意図的に画像を加工するとどうなる?
  33. W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 ) 間取り図ナビゲーションへの応用
  34. W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 ) 間取り図画像を解析して 3Dモデルを生成 古川准教授のグループによるLIFULL HOME’Sデータセット利用研究 https://www.cse.wustl.edu/~chenliu/floorplan-transformation.html → 画像処理のトップレベル国際会議 ICCV 2017に採択
Advertisement