W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 )
清田 陽司
LIFULL Lab 主席研究員
福岡県久留米市生まれ→大学(院)@京都→東京
関心分野: 自然言語処理応用 → 検索・推薦 → 情報リテラシー (図書館)
→ 生活領域 (不動産、介護 etc.) でのメディア技術活用 (画像解析含む)
経歴: 大学教員 → 兼業で起業 → そちらが本業に → 買収
対外的活動
• WebDB Forum 2017産学連携担当幹事
• 情報処理学会データベースシステム研究会 幹事
• IEEE DSAA 2017 Sponsorship co-chair
• 人工知能学会 編集委員
• JST「情報管理」誌 外部編集委員
• Code4Lib JAPAN共同代表 etc.
W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 )
W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 )
総掲載物件数No.1の
不動産・住宅情報サイト
暮らしに密着したさまざまな
情報サービス (引越, 保険, 介護,
子育て, 音楽ライブ, スポーツ選手支援 etc.)
世界約50カ国向けに展開する
住宅・中古車・求職などの
アグリゲーションサイト
(本社: スペイン バルセロナ)
LIFULLグループのサービス群
W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 )
W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 )
W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 )
W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 )
LIFULL Lab (リッテルラボラトリー)
• ルーツは2007年設立の
東京大学発スタート
アップ (株)リッテル
• 住まいや暮らしに関わ
る最先端技術のR&D
• レコメンデーション
• AI関連技術(ディー
プラーニングなど)
• ユーザーインタ
フェース (UX)
• VR / AR / MR
新感覚お部屋探しアプリ
HOME’Sヘヤサク!
部屋作りシミュレーション
GRID VRICK
W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 )
不動産テック?
W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 )
出典: Manyika, James et al. Digital America: A tale of the haves and have-mores. McKinsey Global Institute. 2015
http://www.mckinsey.com/industries/high-tech/our-insights/digital-america-a-tale-of-the-haves-and-have-mores
W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 )
学際分野としての不動産テック
• 不動産学
• 経済学
• 建築学
• 都市学
• マーケティング学、行動心理学
• 情報学
• 画像処理
• 自然言語処理
• IoT (ユビキタスコンピューティング)
W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 )
W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 )
情報科学技術フォーラム(FIT 2017)
@東大 不動産セッション (9/14)
W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 )
不動産と
画像処理・ディープラーニング
W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 )
国内の賃貸不動産物件データ
約530万件
• 所在地 (郵便番号、最寄り駅など)
• 賃料、面積、築年数、部屋タイプ etc.
• 建物構造 (木造、鉄骨、鉄筋コンクリート
etc.)
• 各種こだわり条件 (ペット可、楽器、カウ
ンターキッチン、バス・トイレ別 etc.)
物件画像 約8300万点 間取り図 約510万点
重厚な感じの
エントランス
日当たりの
良いリビング
主な研究分野:
•画像処理 (ディープラーニング)
•自然言語処理
•Web・ソーシャルメディア解析
•経済学 (価格推定)
•建築学
•都市学
LIFULL HOME’Sデータセット
W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 )
NII-IDRユーザ
フォーラム2017
12/4(月)
国立情報学研究所
• 利用者からのポス
ター発表
• 招待講演
• パネルセッション
W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 )
LIFULL HOME’Sデータセット
利用の状況
日本国内の40以上の大学研究室・
研究機関ほか、米国・カナダでも
利用
W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 )
不動産情報サイトで不動産会社を選
ぶ際のポイントは?
(RSC 2015年調査)
物件の写真の点数が多い
物件の写真の見栄えが良い
71.9%
32.5%
出典:不動産情報サイト事業者連絡協議会. 「不動産情報サイト利用者意識アンケート」調査結果. 2016
https://www.rsc-web.jp/pre/img/161027.pdf
W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 )
どちらの物件情報がユーザーに
とってより嬉しい?
A社 B社
W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 )
料理がしやすいキッチンはど
れ?
W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 )
› どの種類の物件画像なのかを判定する
› LIFULL HOME’Sデータセット画像に付けられてい
るタグを正解データとして使用
• 13タグ分の画像を使用
• それぞれ訓練用1万枚、検証用1000枚
• ライブラリはChainerを利用
外観
周辺
内装
その他
寝室
子供部屋
洗面
収納
設備
バルコニー
エントランス
駐車場
使用するタグ 使用しないタグ
外観 周辺
居間
間取り
風呂
間取り
地図
玄関
居間
キッチン
風呂
トイレ
画像種別のディープラーニング(CNN)に
よる判別
W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 )
画像種別の判別精度
› テストデータの誤り率: 0.143
正答サンプル 不正答サンプル
キッチン97.3% リビング52.0%
間取り91.0%
風呂100.0%
正解:リビング
結果:収納
収納 40.1%
リビング 20.6%
洗面 12.1%
正解:洗面
結果:風呂
風呂 64.7%
洗面 26.2%
トイレ 3.1%
正解:収納
結果:風呂
風呂 75.0%
トイレ 9.2%
バルコニー 3.7%
W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 )
W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 )
W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 )
キッチンのワークスペース広さ判別タスク
とても狭い 狭い 普通 広い とても広い
まな板が置け
ない
まな板はおけ
るが、切った
もの等を置け
ない
まな板、切っ
たものなどを
置ける
複数の調理過
程のものを置
ける
調理に十分な
スペースがあ
る
› 置けるものの程度で5段階+その他で6クラス分類
› 5500枚を分類し、各1000枚になるようデータ拡張
W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 )
キッチンのワークスペース広さ判別タ
スク: 結果
› クラス判別の誤り率: 36.2%
› 相関係数:0.717
分類 スコア
とても狭い 20
狭い 40
普通 60
広い 80
とても広い 100
W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 )
Washington Univ. in St. Louis 古川
泰隆先生のグループによる研究
https://arxiv.org/pdf/1612.01225.pdf
W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 )
ディープ多形態対応学習
W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 )
どの画像が左の間取り図に対応するかを判別するNN
W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 )
判別精度
※緑色の数字はAmazon Mturkのワーカーによる
判別精度
W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 )
画像にノイズを加えて、写真が間取り
図のどこに対応するかを識別
W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 )
意図的に画像を加工するとどうなる?
W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 )
間取り図ナビゲーションへの応用
W e b D B F o r u m 2 0 1 7 テ ク ノ ロ ジ ー シ ョ ー ケ ー ス ( 2 0 1 7 . 0 9 . 1 8 )
間取り図画像を解析して
3Dモデルを生成
古川准教授のグループによるLIFULL HOME’Sデータセット利用研究
https://www.cse.wustl.edu/~chenliu/floorplan-transformation.html
→ 画像処理のトップレベル国際会議 ICCV 2017に採択