DEIM2019_horiuchi

珍スポット検索のためのランキング手法の検
討
堀内進次
静岡大学情報学部情報科学科
2019年2月7日
1
静岡大学情報学部卒業論文発表

研究の背景(1/2)
移動時の変化のない道で飽きてしまう、新鮮味がない。
2

研究の背景(2/2)
 珍スポット
– 見たことがないもの、珍しいものがあれば飽きずに移動できるはず！
https://bqspot.com/photo2006/2006-02-14-01.jpg 3

システムの概要
入力出力都市名珍スポット
ランキング
システム
4

アルゴリズムのフロー図
5
珍スポットを抽出する都市名を入力で与える。
与えられた都市名をクエリとして𝐹𝑜𝑢𝑟𝑆𝑞𝑢𝑎𝑟𝑒1
を用いて作成した
データベースにアクセスし、該当するランドマークを取得する。
取得したランドマーク集合の各ランドマークに対してウェブ検索した
ときにヒットした文書に珍スポットに特有の形容詞がどれだけ
含まれているかでスコアを付ける。
付けられたスコアでソートし出力する。
1)https://ja.foursquare.com/

珍スポット特有の形容詞の抽出(1/3)
珍スポットをランドマーク名で検索したときに得られる
タイトルとスニペットの文書集合に多く含まれる形容詞
が珍スポット特有の形容詞であると仮定する。
𝑓 𝑤 𝑎, 𝐿 =
1
|𝐿|
𝑙∈𝐿
𝐻(𝑙, 𝑤 𝑎)
𝐻(𝑙)
この式を既知の珍スポット100件に対して適応する。
6
𝑤 𝑎 = 任意の形容詞
𝐿 = 任意のランドマーク集合
|𝐿| = ランドマーク集合の要素数
𝐻(𝑙) = 𝑙でウェブ検索したときに得られる文書数
𝐻 𝑙, 𝑤 𝑎 = 𝐻(𝑙)で取得した文書のうちの𝑤 𝑎を含む文書数

前述の式を伊豆の有名観光地40件に対しても適応する。
作成した2つの形容詞ランキングのリストを比較する。
双方のリストに出現する形容詞について算出した値の差
を求め、差の絶対値が0.01以下の形容詞を珍スポット特
有の形容詞リストから除外する。(｢ない｣,｢いい｣など)
7

8

珍スポット抽出のためのランキングアルゴリズム(1/2)
珍スポットである程度の尺度として珍スポット度を定義
する。
ランドマークをウェブ検索したときのタイトルとスニ
ペットの文書集合中に含まれる珍スポット特有の形容詞
を含む割合の大きいランドマークが珍スポットである可
能性が高い。
9

前述した珍スポット特有の形容詞リストを用いた珍ス
ポット度算出の式は次のようになる。
𝑅𝑎𝑛𝑘 𝑙, 𝑊𝑎 =
1
|𝑊𝑎|
𝑤 𝑎∈𝑊𝑎
𝐻(𝑙, 𝑤 𝑎)
𝐻(𝑙)
 本実験では珍スポット特有の形容詞リストから上位3つの形容詞
を用いる。(怪しい,ぼろい,黒い)
珍スポット抽出のためのランキングアルゴリズム(2/2)
10
𝑙 = 任意のランドマーク
𝑊𝑎 = 珍スポット特有の形容詞リスト
|𝑊𝑎| = 珍スポット特有の形容詞リストの要素数
𝐻(𝑙) = 𝑙でウェブ検索したときに得られる文書数
𝐻 𝑙, 𝑤 𝑎 = 𝐻(𝑙)で取得した文書のうちの𝑤 𝑎を含む文書

実験の概要
 提案手法の比較手法として他に2つの手法を用いてランキング手
法の性能比較を行う。ベースラインとなる手法は以下の2つであ
る。
– “ランドマーク名+ 珍スポット”でウェブ検索したときの検索結果ヒット数順に並べる手法
– “ランドマーク名”でウェブ検索したときの検索結果ヒット数順に並べる手法
 それぞれのランキングを評価する尺度としてP@kを定義する。
– P@kはk件目までに存在する正解珍スポットの割合である。
11

ランキングの評価実験
“伊豆”の1214件のランドマークを用いて評価実験を行う。
ランキングの上位30件のランドマークに対して珍スポッ
トかどうか判別するために大学生5人に判定してもらい5
人中3人が珍スポットと判定したランドマークを珍スポッ
トとした。
各手法におけるP@kを求めて性能を比較する。
12

ユーザ目線の珍スポットを用いたランキングの評価実験結果
13

考察
 既知の珍スポットを用いたランキング評価と実ユーザによる珍ス
ポットランキング評価ともに提案手法のP@kの値がkがいくつに
なってもベースラインとなるほか2手法を下回ることがないため
ランキングとして優れている。
14

今後の課題
各形容詞の重みを全て同一であるとしたが、形容詞の頻
出度合いなどから重み付けをすることでより多くの珍ス
ポットを上位にランク付けできると考える。
視覚的特徴など他の観点からパラメータを与えることで
よりランキングの精度を高めることができると考える。
15

おわりに
本実験では珍スポット特有の形容詞に着目し、ランド
マークにスコアを付けてランキング化する手法の提案を
行った。
提案手法の有用性を示すことができた。
今後の課題
– 形容詞の重み付けや視覚的特徴量を考慮したアルゴリズムの設計
– 他の地域での実験
16

DEIM2019_horiuchi

Recommended

Recommended

More Related Content

More from ymmt3-lab

More from ymmt3-lab (20)

DEIM2019_horiuchi

Editor's Notes