SlideShare a Scribd company logo
学習用書籍の推薦のための
観点抽出
永野 里佳奈
静岡大学 情報学部 行動情報学科 4年
nagano@design.inf.shizuoka.ac.jp
卒業研究審査会
2020年2月6日
1
概要
学習用書籍を選ぶとき,消費者が大量の
候補を絞りこめず,選択しにくいという
問題がある
検索結果を絞り込むための,観点抽出
方法を,HITSアルゴリズムを用いて
提案した
2
提案手法による観点例:書籍分野「数学」
例 問題 値段学校
問題背景
ショッピングサイトでは,大量の候補や
ユーザレビューが存在する.
そのため,消費者の選択が困難になる
3
問題背景|関連研究
ジャムの法則(※)
6種類のジャムと,24種類のジャムの試食
を用意した
実際の購入率は,6種類の試食の方が
高かった
選択肢が多い場合,自分の選択結果に
自信がなくなり,購入に至らなかった
4
※Sheena S. Iyengar and Mark R. Lepper, ”When Choice is Demotivating: Can One Desire
Too Much of a Good Thing?”, Journal of Personality and Social Psychology, 2000
問題背景
既存手法
各候補を詳細に比較するために,
各候補のユーザレビューを要約
提案手法
条件を絞り込んで選択肢を少なくする
ために,観点を抽出
5
Amazonのレビューフィルタ Review Spotlight(※)
※Koji Yatani and Michael Novati and Andrew Trusty and Khai N. Truong, ” Review Spotlight: A User Interface for Summarizing User-
generated Reviews Using Adjective-Noun Word Pairs”, Proceedings of the SIGCHI Conference on Human Factors in Computing
Systems, 2011
既存手法と提案手法の違い
6
既存手法と提案手法では,扱う問題が違う
ある数学の本
3冊を,詳しく
比較検討したい
レビュー
要約
レビュー
要約
レビュー
要約
数学書籍のレビュー集合
観点 観点 観点
既存手法
提案手法
問題
問題
数学の本が
ほしい.
たくさんあって
どう選べばよいか
分からない
問題の解決方法
提案手法の対象者:条件を絞り込めない
書籍選択者
提案手法は,ユーザレビューから,
検索結果絞り込みに有用な観点を抽出
観点例:例,学校,問題,値段など
HITSアルゴリズムを用いて,観点候補に
紐づいた形容詞から,観点候補の有用度
を推定
7
提案手法|言葉の定義
観点:
特定分野の商品の評価する要素
観点例:例,学校,問題,値段など
観点候補:
提案手法による絞り込みが
行われていない
観点値:
観点に対する,商品の実際の評価
8
提案手法|定義の具体例
9
特定書籍分野の
レビュー集合
例
難しい
素晴ら
しい
例
例 難しい
例
素晴ら
しい
観点候補 観点値
名詞-形容詞
ペア抽出
提案手法|定義の具体例
10
例 問題 学校
提案手法でランク付
け
上位30件までを観点とする
観点候補
集合
例観点30個
提案手法|観点候補抽出
観点候補抽出
書籍分野ごとのユーザレビューから,
名詞-形容詞ペアを取り出す
– ペアの重複削除
• 同一レビューの同一ペア
• 同一書籍レビューの同一ペア
11
提案手法|観点候補絞り込み
観点候補絞り込み:
HITSアルゴリズムを利用.
観点の質は,紐づいた形容詞(評価を
表すため)によって決まると考えた
12
例
悪い
素晴ら
しい
authority hub
提案手法
提案手法hits:
h𝒊𝒕𝒔 = HITSアルゴリズムの値
上位30件を観点とする
提案手法types:
𝑡𝑦𝑝𝑒𝑠
= 𝐻𝐼𝑇𝑆アルゴリズムの値 × 観点値種類数
上位30件を観点とする
13
提案手法|具体例
提案手法hits:
観点候補「例」のスコア→0.5
提案手法types:
観点候補「例」のスコア→0.5×2=1.0
14
例
悪い
素晴ら
しい
authority hub
0.5
評価実験
1. 各手法の観点が,検索結果絞り込みに
「有用である」か,「有用でない」か
被験者に判断
2. 被験者3人のうち2人以上が,
「有用である」と回答した観点を正解
とする
15
各手法によるランキングの精度を比較.
比較手法より,提案手法の精度が
優れていればよい
評価実験
比較手法:
観点候補の出現頻度で順位付け.
上位30件を観点とする
評価用書籍分野
– 数学
– 料理
– ダイエット
利用データ
Amazonの英語版レビューから,
各書籍分野10,000件を取得
16
評価実験
評価指標
– P@k(k = 5, 10, 20, 30):
上位k件のうち,正解が占める割合
– AP:
正解が得られたときのP@k(適合率)の平均の値
– MAP:
各書籍分野のAPの平均の値.
各手法の精度を判定
17
結果
MAPを見ると,最も結果がよかったのは
比較手法の出現頻度だった
書籍分野「ダイエット」では提案手法の
方が優れていることが分かった
18
AP
書籍分野 hits types 出現頻度
数学 0.73 0.81 0.90
料理 0.74 0.81 0.88
ダイエット 0.63 0.63 0.58
MAP 0.70 0.75 0.79
結果|提案手法による観点
提案手法typesによる観点上位5件
(赤が正解の観点を表す)
19
数学 料理 ダイエット
例 レシピ 食べ物
問題 料理本 情報
読み物 食べ物 ダイエット
テキスト 食事 健康
教科書 アイデア レシピ
考察
出現頻度による絞り込みが,書籍分野に
関わらず,ある程度よい結果を出せる
ことが分かった
改善方法
– 結果がよかった出現頻度を組み合わせる
– 名詞-形容詞ペア抽出に,係り受け解析器を利用
– 名詞-形容詞ペアは,評価形容詞のみに限定
– 出現頻度によって,名詞-形容詞ペアを選別,など
20
まとめ
 学習用書籍を選ぶとき,消費者が候補を
絞りこめず,選択しにくいという問題がある
 検索結果を絞り込むための,観点抽出方法を
提案した
 提案手法は改善の必要性がある
21
レ
ビ
ュ
ー
集
合
観
点
候
補
抽
出
提
案
手
法
で
ラ
ン
ク
付
け
上
位
を
観
点

More Related Content

More from ymmt3-lab

Journalclub sato 20191218
Journalclub sato 20191218Journalclub sato 20191218
Journalclub sato 20191218
ymmt3-lab
 
Journal club 20191211_murata
Journal club 20191211_murataJournal club 20191211_murata
Journal club 20191211_murata
ymmt3-lab
 
Journal_club_1120
Journal_club_1120Journal_club_1120
Journal_club_1120
ymmt3-lab
 
ジャーナルクラブ_20191120
ジャーナルクラブ_20191120ジャーナルクラブ_20191120
ジャーナルクラブ_20191120
ymmt3-lab
 
Journalclub sato 20191031
Journalclub sato 20191031Journalclub sato 20191031
Journalclub sato 20191031
ymmt3-lab
 
静岡大学 山本研究室 勉強会資料 機械学習
静岡大学 山本研究室 勉強会資料 機械学習静岡大学 山本研究室 勉強会資料 機械学習
静岡大学 山本研究室 勉強会資料 機械学習
ymmt3-lab
 
Journal club 20191030 ito
Journal club 20191030 itoJournal club 20191030 ito
Journal club 20191030 ito
ymmt3-lab
 
Journalclub 20191023 nagano
Journalclub 20191023 naganoJournalclub 20191023 nagano
Journalclub 20191023 nagano
ymmt3-lab
 
Journal club 20191023_murata
Journal club 20191023_murataJournal club 20191023_murata
Journal club 20191023_murata
ymmt3-lab
 
DEIM2019発表資料(藤堂晶輝)
DEIM2019発表資料(藤堂晶輝)DEIM2019発表資料(藤堂晶輝)
DEIM2019発表資料(藤堂晶輝)
ymmt3-lab
 
DEIM2019_horiuchi
DEIM2019_horiuchiDEIM2019_horiuchi
DEIM2019_horiuchi
ymmt3-lab
 
DEIM2019 発表資料 「飲食店レビュー情報の集合知分析と意思決定支援」
DEIM2019 発表資料 「飲食店レビュー情報の集合知分析と意思決定支援」DEIM2019 発表資料 「飲食店レビュー情報の集合知分析と意思決定支援」
DEIM2019 発表資料 「飲食店レビュー情報の集合知分析と意思決定支援」
ymmt3-lab
 
DEIM2019 発表資料 「笑えるウェブ情報検索のためのクエリ推薦」
DEIM2019 発表資料 「笑えるウェブ情報検索のためのクエリ推薦」DEIM2019 発表資料 「笑えるウェブ情報検索のためのクエリ推薦」
DEIM2019 発表資料 「笑えるウェブ情報検索のためのクエリ推薦」
ymmt3-lab
 
DEIM2019 発表資料 「脚本の内容と構成要素に基づく映画印象推定」
DEIM2019 発表資料 「脚本の内容と構成要素に基づく映画印象推定」DEIM2019 発表資料 「脚本の内容と構成要素に基づく映画印象推定」
DEIM2019 発表資料 「脚本の内容と構成要素に基づく映画印象推定」
ymmt3-lab
 
DEIM2019 発表資料 「文章表現の曖昧さ指摘による情報精査の態度・行動促進」
DEIM2019 発表資料 「文章表現の曖昧さ指摘による情報精査の態度・行動促進」DEIM2019 発表資料 「文章表現の曖昧さ指摘による情報精査の態度・行動促進」
DEIM2019 発表資料 「文章表現の曖昧さ指摘による情報精査の態度・行動促進」
ymmt3-lab
 
Bookreading7
Bookreading7Bookreading7
Bookreading7
ymmt3-lab
 
誰のためのデザイン?3章
誰のためのデザイン?3章誰のためのデザイン?3章
誰のためのデザイン?3章
ymmt3-lab
 
誰のためのデザイン?2章
誰のためのデザイン?2章誰のためのデザイン?2章
誰のためのデザイン?2章
ymmt3-lab
 
誰のためのデザイン? 第5章
誰のためのデザイン? 第5章誰のためのデザイン? 第5章
誰のためのデザイン? 第5章
ymmt3-lab
 
The design of everyday things cp4
The design of everyday things cp4The design of everyday things cp4
The design of everyday things cp4
ymmt3-lab
 

More from ymmt3-lab (20)

Journalclub sato 20191218
Journalclub sato 20191218Journalclub sato 20191218
Journalclub sato 20191218
 
Journal club 20191211_murata
Journal club 20191211_murataJournal club 20191211_murata
Journal club 20191211_murata
 
Journal_club_1120
Journal_club_1120Journal_club_1120
Journal_club_1120
 
ジャーナルクラブ_20191120
ジャーナルクラブ_20191120ジャーナルクラブ_20191120
ジャーナルクラブ_20191120
 
Journalclub sato 20191031
Journalclub sato 20191031Journalclub sato 20191031
Journalclub sato 20191031
 
静岡大学 山本研究室 勉強会資料 機械学習
静岡大学 山本研究室 勉強会資料 機械学習静岡大学 山本研究室 勉強会資料 機械学習
静岡大学 山本研究室 勉強会資料 機械学習
 
Journal club 20191030 ito
Journal club 20191030 itoJournal club 20191030 ito
Journal club 20191030 ito
 
Journalclub 20191023 nagano
Journalclub 20191023 naganoJournalclub 20191023 nagano
Journalclub 20191023 nagano
 
Journal club 20191023_murata
Journal club 20191023_murataJournal club 20191023_murata
Journal club 20191023_murata
 
DEIM2019発表資料(藤堂晶輝)
DEIM2019発表資料(藤堂晶輝)DEIM2019発表資料(藤堂晶輝)
DEIM2019発表資料(藤堂晶輝)
 
DEIM2019_horiuchi
DEIM2019_horiuchiDEIM2019_horiuchi
DEIM2019_horiuchi
 
DEIM2019 発表資料 「飲食店レビュー情報の集合知分析と意思決定支援」
DEIM2019 発表資料 「飲食店レビュー情報の集合知分析と意思決定支援」DEIM2019 発表資料 「飲食店レビュー情報の集合知分析と意思決定支援」
DEIM2019 発表資料 「飲食店レビュー情報の集合知分析と意思決定支援」
 
DEIM2019 発表資料 「笑えるウェブ情報検索のためのクエリ推薦」
DEIM2019 発表資料 「笑えるウェブ情報検索のためのクエリ推薦」DEIM2019 発表資料 「笑えるウェブ情報検索のためのクエリ推薦」
DEIM2019 発表資料 「笑えるウェブ情報検索のためのクエリ推薦」
 
DEIM2019 発表資料 「脚本の内容と構成要素に基づく映画印象推定」
DEIM2019 発表資料 「脚本の内容と構成要素に基づく映画印象推定」DEIM2019 発表資料 「脚本の内容と構成要素に基づく映画印象推定」
DEIM2019 発表資料 「脚本の内容と構成要素に基づく映画印象推定」
 
DEIM2019 発表資料 「文章表現の曖昧さ指摘による情報精査の態度・行動促進」
DEIM2019 発表資料 「文章表現の曖昧さ指摘による情報精査の態度・行動促進」DEIM2019 発表資料 「文章表現の曖昧さ指摘による情報精査の態度・行動促進」
DEIM2019 発表資料 「文章表現の曖昧さ指摘による情報精査の態度・行動促進」
 
Bookreading7
Bookreading7Bookreading7
Bookreading7
 
誰のためのデザイン?3章
誰のためのデザイン?3章誰のためのデザイン?3章
誰のためのデザイン?3章
 
誰のためのデザイン?2章
誰のためのデザイン?2章誰のためのデザイン?2章
誰のためのデザイン?2章
 
誰のためのデザイン? 第5章
誰のためのデザイン? 第5章誰のためのデザイン? 第5章
誰のためのデザイン? 第5章
 
The design of everyday things cp4
The design of everyday things cp4The design of everyday things cp4
The design of everyday things cp4
 

Research 20200206 nagano

Editor's Notes

  1. 名詞+形容詞の方を先にとる
  2. 関連研究を入れる
  3. 困難になるというエビデンス
  4. 問題背景 既存手法 提案手法の説明 実験結果 考察 まとめ どんな問題をやったのか,貢献
  5. 手法ではなく,扱う問題が違うことを説明する 問題を整理する
  6. 観点を絞り込み 観点候補を絞り込み なのか
  7. 正解という言葉が変
  8. P@kの結果も入れるべきか?時間なさそう
  9. 観点を絞り込み 観点候補を絞り込み なのか HITSアルゴリズムの説明を入れた方がいいのか? Webページの信頼性を,リンク関係によって評価するアルゴリズム 多くのWebページにリンクされているほど,信頼性が高い 多くのWebページをリンクしているほど,信頼性が高い