SlideShare a Scribd company logo
1 of 19
Download to read offline
ユーザコメントのtf-idf法による分析を用いた インタラクティブな関連動画の提示 
複雑系工学講座 調和系工学研究室 
修士2年 江端 佑介
研究背景 
動画の特徴を表す情報 
動画のメタ情報 … 動画に付随する,動画自身の特徴を表す情報(タイトル,タグ等) 
タイトル 飛行機(着陸) 
タグ 飛行機 
説明文 伊丹空港で… 
タイトル 飛行機(着陸)2 
タグ 飛行機,大阪空港 
説明文 大阪空港の… 
→ 動画内容をすべて網羅しているわけではない 
動画にはメタ情報に含まれない情報がまだある 
ANA が好き! 
ジャンボが見たかった 
JAL はオシャレ 
飛行機乗りたい 
メタ情報 
コメント 
動画コメントから動画の特徴を表す情報の取得が実現 
↓ 
動画説明文生成や関連動画表示などの情報源として応用できる可能性 
動画コメント … 動画を見たユーザが書き込む文書 
→ メタ情報には存在しない,動画の特徴を表す情報 を含む可能性がある
目的 
目的 
視聴 
提示 
動画の特徴を表す情報を動画コメントから取得 
応用 
ユーザの視聴した動画のコメントの特徴を考慮しインタラクティブに関連動画を提示 
動画コメントから取得した情報を用いたサービスモデル
仮定と手法 
予備実験概要 
①YouTubeから動画毎にコメント(英語)を収集 
②tf-idf法により動画毎のコメント文書をベクトル表現し特徴語を定義 
③得られた特徴語が動画の特徴を表すかをアンケート調査 
<仮定> 
コメントの特徴が似ている動画どうしは関連性がある 
異なる動画のコメント文書間の類似度を定義する必要 
(情報検索におけるベクトル空間モデルの応用[04 大谷]) 
tf-idf法を利用しコメント文書をベクトル表現 
コメント文書のベクトル表現によって得られた特徴語が 
動画の特徴を表すか否か予備実験にて検討 
コメントからの動画情報の抽出
予備実験 
D1 D2 
D14381 
・・・・ 
・・・・ 
コメントの収集 
①15カテゴリ・15000動画のIDを取得 
②各IDにつき最大1000件のコメントを取得 
14381動画分のコメント文書Dを保存 
特徴語の定義 
YouTube Data APIのカテゴリ検索を利用 
①コメント文書を名詞・動詞・形容詞に絞り込み 
②カテゴリ毎にtf-idf法を用いてコメント文書の特徴ベクトルを求める 
( ( , ), ( , ), ( , )) 
( , ) ( , ) ( ) 
1 
( ) 
( ) log 
log( ( )) 
log( ( , )) 
( , ) 
1 2 d w T D w T D w T D 
w T D tf T D idf T 
dfreq T 
M 
idf T 
NoT D 
tfreq T D 
tf T D 
D N  
 
 
  
    
名 
動 形 
名 
動 形 
名 
動 形 
③特徴語の定義 
名詞・動詞・形容詞のそれぞれについて w(T,D) が最大値をとる単語を特徴語と定義 
文書の特徴ベクトル 
カテゴリ内の総単語数 
 文書における単語の重要度 
 単語が出現する文書数 
 カテゴリ内の総文書数 
 文書の総単語数 
文書中に単語が出現する回数 
文書内の単語 
コメント文書 
: D 
N : 
( , ) : D T 
( ) : T 
: 
( ) : D 
( , ) : D T 
: D 
: 
D d 
w T D 
dfreq T 
M 
NoT D 
tfreq T D 
T 
D 

予備実験 
アンケート調査 
アンケート例 
①動画を視聴(収集した14381動画のうち10動画) 
②質問への回答 
問: 
結果 
特徴語が動画から読み取れた割合 
(10動画の平均) 
名詞 
(%) 
メタ情報 
との合致 
動詞 
(%) 
メタ情報 
との合致 
形容詞 
(%) 
メタ情報 
との合致 
動画1 
64.7 
× 
70.6 
○ 
64.7 
○ 
動画2 
43.8 
○ 
18.8 
× 
61.5 
× 
動画3 
100 
○ 
69.2 
× 
38.5 
× 
動画4 
80.0 
○ 
20.0 
× 
40.0 
× 
動画5 
0 
○ 
87.5 
× 
25.0 
× 
動画6 
85.7 
× 
100 
× 
71.4 
× 
動画7 
28.6 
× 
28.6 
× 
42.9 
× 
動画8 
57.1 
○ 
28.6 
○ 
14.3 
× 
動画9 
42.9 
× 
100 
× 
57.1 
× 
動画10 
0 
× 
57.1 
× 
100 
○ 
動画から特徴語が読み取れたユーザの割合と 
特徴語とメタ情報との合致 
特徴語がメタ情報に含まれず,かつ 
動画から読み取れた被験者が半数以上 
特徴語として定義した名詞・動詞・形容詞が 
動画から読み取れたかどうか 
↓ 
コメント文書から抽出した特徴語が 
動画の特徴を表す可能性
インタラクティブな関連動画提示への利用モデル 
モデル概要 
①動画の提示 
②気になった 
動画の選択 
①動画の提示 
④関連動画提示 
検索キー入力 
③コメント傾向ベクトル算出 
関連動画の選択 
②気になった 
動画の選択 
START 
あり 
なし 
END 
④関連動画の選択 
「①動画の提示」~「④関連動画の選択」までを一試行とする 
③ユーザが選択した動画の 
コメントの傾向ベクトルを算出
ユーザが気になった動画のコメント文書ベクトルの和 
(但し ユーザが選択したら1,しなかったら0) 
傾向ベクトル 
  1         n D D D n u d d d k u 
a b c 
     
   
関連動画の選択 
i 
i 
i 
n D 
n D 
n D 
u d 
u d 
Sim u d   
  
   
( )  , 
, ,: 
インタラクティブな関連動画提示への利用モデル 
「ユーザが選択した動画のコメントの特徴ベクトル」 
及び 
「前の試行における傾向ベクトル」 
を考慮して定義 
前の試行におけるユーザの 
視聴傾向ベクトル 
(但し減衰率kを掛ける) 
カテゴリ内の既に視聴した動画を除くすべての動画に対し 
コメントの特徴ベクトルと傾向ベクトルとの類似度を求める 
類似度 
↓ 
類似度の上位三動画を関連動画と定義
実験 
目的 選択した動画のコメント傾向を反映した関連動画提示の確認 
・ユーザが気になった動画として既に2つを選択したと仮定し実験を行う 
D1 : LIONEL MESSI TOP 30 GOALS!!! : Bret Hart: 2006 Hall of Fame Speech 2 D 
D1 d 
 
D2 d 
 
0 
1 
2 
3 
4 
5 
6 
7 
8 
messi 
globus 
goles 
futbol 
cr9 
pero 
javier 
hacia 
lo 
seleccion 
si 
d10s 
ni 
benoit 
wrestlemania 
kane 
wcw 
dx 
mcmahon 
eddie 
macho 
hartaustin 
willjohnboy 
owens 
cyruss 
tenta 
inducties 
iirc 
fn 
sounds 
match 
x12 
jawoll 
clic 
dh 
yokozuna 
stirring 
rl 
sabu 
nitro 
h 単語 
重要度 
D1 d 
 
D2 d 
 選択した動画の単語と重要度
結果 
関連 
動画 
(1回目) 
D5 d 
 
D3 d 
 
D4 d 
 
0 
1 
2 
3 
4 
5 
6 
7 
8 
messi 
globus 
goles 
futbol 
cr9 
pero 
javier 
hacia 
lo 
seleccion 
si 
d10s 
ni 
benoit 
wrestlemania 
kane 
wcw 
dx 
mcmahon 
eddie 
macho 
hartaustin 
willjohnboy 
owens 
cyruss 
tenta 
inducties 
iirc 
fn 
sounds 
match 
x12 
jawoll 
clic 
dh 
yokozuna 
stirring 
rl 
sabu 
nitro 
h 単語 
重要度 
D1 d 
 
D2 d 
 
D1 d 
 
D2 d 

0 
1 
2 
3 
4 
5 
6 
7 
8 
messi 
globus 
goles 
futbol 
cr9 
pero 
javier 
hacia 
lo 
seleccion 
si 
d10s 
ni 
benoit 
wrestlemania 
kane 
wcw 
dx 
mcmahon 
eddie 
macho 
hartaustin 
willjohnboy 
owens 
cyruss 
tenta 
inducties 
iirc 
fn 
sounds 
match 
x12 
jawoll 
clic 
dh 
yokozuna 
stirring 
rl 
sabu 
nitro 
h 
結果 
関連 
動画 
(1回目) 
D3 d 
 
D4 d 
 
単語 
重要度 
D1 d 
 
D2 d 
 
選択 選択 
D1 d 
 
D2 d 

0 
1 
2 
3 
4 
5 
6 
7 
8 
messi 
globus 
goles 
futbol 
cr9 
pero 
javier 
hacia 
lo 
seleccion 
si 
d10s 
ni 
benoit 
wrestlemania 
kane 
wcw 
dx 
mcmahon 
eddie 
macho 
hartaustin 
willjohnboy 
owens 
cyruss 
tenta 
be 
plisss 
wm25 
lmaoooo 
dynamite 
x12 
jawoll 
clic 
dh 
yokozuna 
stirring 
rl 
sabu 
nitro 
h 
結果 
関連 
動画 
(1回目) 
D3 d 
 
D4 d 
 
選択 選択 
D1 d 
 
D2 d 
 
D3 d 
 
D4 d 
 
単語 
重要度 
重要度が増した語 
bret,hart,hogan,owen, 
hbk,shawn,hitman etc…. 
D1 d 
 
D2 d 

結果 
関連 
動画 
(1回目) 
D3 d 
 
D4 d 
 
関連 
動画 
(2回目) 
>Ric Flair and Shawn 
Michaels... 
>Best of all time with Bret 
Hart right there 
>Bret and HBK totally…. 
>the hitman in a wwe ring 
again but… 
>it cause of hulk hogan… 
>He and shawn Michaels… 
>With all due respect to 
Bret Hart.... 
重要度が増した語 
bret,hart,hogan,owen, 
hbk,shawn,hitman etc…. 
D1 d 
 
D2 d 

結果 
D5 d 
 
D3 d 
 
関連 
動画 
(1回目) 
選択 選択 
0 
1 
2 
3 
4 
5 
6 
messi 
leo 
balon 
que 
1messi 
tna 
hulk 
dx 
suit 
cinzia 
tyson 
wounded 
be 
somfing 
mierdaldo 
soccer 
thoughtss 
gooner 
aguantee 
単語 
重要度 
重要度が増した語 
bret,hart,hogan,owen, 
hbk,shawn,hitman etc…. 
messi,ronaldo,barca, 
bret,hart,hogan etc…. 
D1 d 
 
D2 d 
 
D1 d 
 
D2 d 
 
D3 d 
 
D5 d 

結果 
D5 d 
 
D3 d 
 
関連 
動画 
(1回目) 
選択 選択 
>Ric Flair and Shawn 
Michaels... 
>Best of all time with Bret 
Hart right there 
関連 
動画 
(2回目) 
> didn't kick ric in the nads 
like he did bret hart... 
> Flair is just like Hogan ... 
重要度が増した語 
bret,hart,hogan,owen, 
hbk,shawn,hitman etc…. 
messi,ronaldo,barca, 
bret,hart,hogan etc…. 
> people said ronaldo 
should've won it? 
> the best lionel messi 
video ive watched 
D1 d 
 
D2 d 

まとめ 
目的 
達成事項 
・動画コメントからtf-idf法によって抽出した特徴語が動画の特徴を表すものとして 
利用できる可能性を示した 
・ユーザが視聴し,気になった動画のコメントの特徴ベクトルを合成した傾向ベクトルを 
用いて,ユーザの視聴傾向を反映した関連動画の提示ができる可能性を示した 
動画の特徴を表す情報を動画コメントから取得 
↓応用 
ユーザの選択した動画の特徴を考慮しインタラクティブな関連動画の提示 
研究業績 
国内学会発表:1件
0 
1 
2 
3 
4 
5 
6 
messi 
leo 
balon 
que 
1messi 
tna 
hulk 
dx 
suit 
cinzia 
tyson 
wounded 
be 
somfing 
mierdaldo 
soccer 
thoughtss 
gooner 
aguantee
結果 
D5 d 
 
1,D1 d 
 
1,D2 d 
 
D3 d 
 
関連 
動画 
(1回目) 
選択 選択

More Related Content

More from harmonylab

【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也
【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也
【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也harmonylab
 
【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究
【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究
【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究harmonylab
 
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...harmonylab
 
【卒業論文】印象タグを用いた衣服画像生成システムに関する研究
【卒業論文】印象タグを用いた衣服画像生成システムに関する研究【卒業論文】印象タグを用いた衣服画像生成システムに関する研究
【卒業論文】印象タグを用いた衣服画像生成システムに関する研究harmonylab
 
【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究
【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究
【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究harmonylab
 
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...harmonylab
 
DLゼミ: MobileOne: An Improved One millisecond Mobile Backbone
DLゼミ: MobileOne: An Improved One millisecond Mobile BackboneDLゼミ: MobileOne: An Improved One millisecond Mobile Backbone
DLゼミ: MobileOne: An Improved One millisecond Mobile Backboneharmonylab
 
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Models
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat ModelsDLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Models
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Modelsharmonylab
 
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose EstimationDLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimationharmonylab
 
Voyager: An Open-Ended Embodied Agent with Large Language Models
Voyager: An Open-Ended Embodied Agent with Large Language ModelsVoyager: An Open-Ended Embodied Agent with Large Language Models
Voyager: An Open-Ended Embodied Agent with Large Language Modelsharmonylab
 
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimation
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose EstimationDLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimation
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimationharmonylab
 
ReAct: Synergizing Reasoning and Acting in Language Models
ReAct: Synergizing Reasoning and Acting in Language ModelsReAct: Synergizing Reasoning and Acting in Language Models
ReAct: Synergizing Reasoning and Acting in Language Modelsharmonylab
 
形態素解析を用いた帝国議会議事速記録の変遷に関する研究
形態素解析を用いた帝国議会議事速記録の変遷に関する研究形態素解析を用いた帝国議会議事速記録の変遷に関する研究
形態素解析を用いた帝国議会議事速記録の変遷に関する研究harmonylab
 
【卒業論文】深層生成モデルを用いたユーザ意図に基づく衣服画像の生成に関する研究
【卒業論文】深層生成モデルを用いたユーザ意図に基づく衣服画像の生成に関する研究【卒業論文】深層生成モデルを用いたユーザ意図に基づく衣服画像の生成に関する研究
【卒業論文】深層生成モデルを用いたユーザ意図に基づく衣服画像の生成に関する研究harmonylab
 
灯油タンク内の液面高計測を用いた 灯油残量推定システムに関する研究
灯油タンク内の液面高計測を用いた灯油残量推定システムに関する研究灯油タンク内の液面高計測を用いた灯油残量推定システムに関する研究
灯油タンク内の液面高計測を用いた 灯油残量推定システムに関する研究harmonylab
 
深層自己回帰モデルを用いた俳句の生成と評価に関する研究
深層自己回帰モデルを用いた俳句の生成と評価に関する研究深層自己回帰モデルを用いた俳句の生成と評価に関する研究
深層自己回帰モデルを用いた俳句の生成と評価に関する研究harmonylab
 
競輪におけるレーティングシステムを用いた予想記事生成に関する研究
競輪におけるレーティングシステムを用いた予想記事生成に関する研究競輪におけるレーティングシステムを用いた予想記事生成に関する研究
競輪におけるレーティングシステムを用いた予想記事生成に関する研究harmonylab
 
【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究
【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究
【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究harmonylab
 
A Study on Estimation of Household Kerosene Consumption for Optimization of D...
A Study on Estimation of Household Kerosene Consumption for Optimization of D...A Study on Estimation of Household Kerosene Consumption for Optimization of D...
A Study on Estimation of Household Kerosene Consumption for Optimization of D...harmonylab
 
マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究
マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究
マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究harmonylab
 

More from harmonylab (20)

【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也
【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也
【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也
 
【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究
【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究
【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究
 
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...
 
【卒業論文】印象タグを用いた衣服画像生成システムに関する研究
【卒業論文】印象タグを用いた衣服画像生成システムに関する研究【卒業論文】印象タグを用いた衣服画像生成システムに関する研究
【卒業論文】印象タグを用いた衣服画像生成システムに関する研究
 
【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究
【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究
【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究
 
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...
 
DLゼミ: MobileOne: An Improved One millisecond Mobile Backbone
DLゼミ: MobileOne: An Improved One millisecond Mobile BackboneDLゼミ: MobileOne: An Improved One millisecond Mobile Backbone
DLゼミ: MobileOne: An Improved One millisecond Mobile Backbone
 
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Models
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat ModelsDLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Models
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Models
 
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose EstimationDLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
 
Voyager: An Open-Ended Embodied Agent with Large Language Models
Voyager: An Open-Ended Embodied Agent with Large Language ModelsVoyager: An Open-Ended Embodied Agent with Large Language Models
Voyager: An Open-Ended Embodied Agent with Large Language Models
 
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimation
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose EstimationDLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimation
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimation
 
ReAct: Synergizing Reasoning and Acting in Language Models
ReAct: Synergizing Reasoning and Acting in Language ModelsReAct: Synergizing Reasoning and Acting in Language Models
ReAct: Synergizing Reasoning and Acting in Language Models
 
形態素解析を用いた帝国議会議事速記録の変遷に関する研究
形態素解析を用いた帝国議会議事速記録の変遷に関する研究形態素解析を用いた帝国議会議事速記録の変遷に関する研究
形態素解析を用いた帝国議会議事速記録の変遷に関する研究
 
【卒業論文】深層生成モデルを用いたユーザ意図に基づく衣服画像の生成に関する研究
【卒業論文】深層生成モデルを用いたユーザ意図に基づく衣服画像の生成に関する研究【卒業論文】深層生成モデルを用いたユーザ意図に基づく衣服画像の生成に関する研究
【卒業論文】深層生成モデルを用いたユーザ意図に基づく衣服画像の生成に関する研究
 
灯油タンク内の液面高計測を用いた 灯油残量推定システムに関する研究
灯油タンク内の液面高計測を用いた灯油残量推定システムに関する研究灯油タンク内の液面高計測を用いた灯油残量推定システムに関する研究
灯油タンク内の液面高計測を用いた 灯油残量推定システムに関する研究
 
深層自己回帰モデルを用いた俳句の生成と評価に関する研究
深層自己回帰モデルを用いた俳句の生成と評価に関する研究深層自己回帰モデルを用いた俳句の生成と評価に関する研究
深層自己回帰モデルを用いた俳句の生成と評価に関する研究
 
競輪におけるレーティングシステムを用いた予想記事生成に関する研究
競輪におけるレーティングシステムを用いた予想記事生成に関する研究競輪におけるレーティングシステムを用いた予想記事生成に関する研究
競輪におけるレーティングシステムを用いた予想記事生成に関する研究
 
【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究
【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究
【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究
 
A Study on Estimation of Household Kerosene Consumption for Optimization of D...
A Study on Estimation of Household Kerosene Consumption for Optimization of D...A Study on Estimation of Household Kerosene Consumption for Optimization of D...
A Study on Estimation of Household Kerosene Consumption for Optimization of D...
 
マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究
マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究
マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究
 

ebata m

  • 2. 研究背景 動画の特徴を表す情報 動画のメタ情報 … 動画に付随する,動画自身の特徴を表す情報(タイトル,タグ等) タイトル 飛行機(着陸) タグ 飛行機 説明文 伊丹空港で… タイトル 飛行機(着陸)2 タグ 飛行機,大阪空港 説明文 大阪空港の… → 動画内容をすべて網羅しているわけではない 動画にはメタ情報に含まれない情報がまだある ANA が好き! ジャンボが見たかった JAL はオシャレ 飛行機乗りたい メタ情報 コメント 動画コメントから動画の特徴を表す情報の取得が実現 ↓ 動画説明文生成や関連動画表示などの情報源として応用できる可能性 動画コメント … 動画を見たユーザが書き込む文書 → メタ情報には存在しない,動画の特徴を表す情報 を含む可能性がある
  • 3. 目的 目的 視聴 提示 動画の特徴を表す情報を動画コメントから取得 応用 ユーザの視聴した動画のコメントの特徴を考慮しインタラクティブに関連動画を提示 動画コメントから取得した情報を用いたサービスモデル
  • 4. 仮定と手法 予備実験概要 ①YouTubeから動画毎にコメント(英語)を収集 ②tf-idf法により動画毎のコメント文書をベクトル表現し特徴語を定義 ③得られた特徴語が動画の特徴を表すかをアンケート調査 <仮定> コメントの特徴が似ている動画どうしは関連性がある 異なる動画のコメント文書間の類似度を定義する必要 (情報検索におけるベクトル空間モデルの応用[04 大谷]) tf-idf法を利用しコメント文書をベクトル表現 コメント文書のベクトル表現によって得られた特徴語が 動画の特徴を表すか否か予備実験にて検討 コメントからの動画情報の抽出
  • 5. 予備実験 D1 D2 D14381 ・・・・ ・・・・ コメントの収集 ①15カテゴリ・15000動画のIDを取得 ②各IDにつき最大1000件のコメントを取得 14381動画分のコメント文書Dを保存 特徴語の定義 YouTube Data APIのカテゴリ検索を利用 ①コメント文書を名詞・動詞・形容詞に絞り込み ②カテゴリ毎にtf-idf法を用いてコメント文書の特徴ベクトルを求める ( ( , ), ( , ), ( , )) ( , ) ( , ) ( ) 1 ( ) ( ) log log( ( )) log( ( , )) ( , ) 1 2 d w T D w T D w T D w T D tf T D idf T dfreq T M idf T NoT D tfreq T D tf T D D N          名 動 形 名 動 形 名 動 形 ③特徴語の定義 名詞・動詞・形容詞のそれぞれについて w(T,D) が最大値をとる単語を特徴語と定義 文書の特徴ベクトル カテゴリ内の総単語数  文書における単語の重要度  単語が出現する文書数  カテゴリ内の総文書数  文書の総単語数 文書中に単語が出現する回数 文書内の単語 コメント文書 : D N : ( , ) : D T ( ) : T : ( ) : D ( , ) : D T : D : D d w T D dfreq T M NoT D tfreq T D T D 
  • 6. 予備実験 アンケート調査 アンケート例 ①動画を視聴(収集した14381動画のうち10動画) ②質問への回答 問: 結果 特徴語が動画から読み取れた割合 (10動画の平均) 名詞 (%) メタ情報 との合致 動詞 (%) メタ情報 との合致 形容詞 (%) メタ情報 との合致 動画1 64.7 × 70.6 ○ 64.7 ○ 動画2 43.8 ○ 18.8 × 61.5 × 動画3 100 ○ 69.2 × 38.5 × 動画4 80.0 ○ 20.0 × 40.0 × 動画5 0 ○ 87.5 × 25.0 × 動画6 85.7 × 100 × 71.4 × 動画7 28.6 × 28.6 × 42.9 × 動画8 57.1 ○ 28.6 ○ 14.3 × 動画9 42.9 × 100 × 57.1 × 動画10 0 × 57.1 × 100 ○ 動画から特徴語が読み取れたユーザの割合と 特徴語とメタ情報との合致 特徴語がメタ情報に含まれず,かつ 動画から読み取れた被験者が半数以上 特徴語として定義した名詞・動詞・形容詞が 動画から読み取れたかどうか ↓ コメント文書から抽出した特徴語が 動画の特徴を表す可能性
  • 7. インタラクティブな関連動画提示への利用モデル モデル概要 ①動画の提示 ②気になった 動画の選択 ①動画の提示 ④関連動画提示 検索キー入力 ③コメント傾向ベクトル算出 関連動画の選択 ②気になった 動画の選択 START あり なし END ④関連動画の選択 「①動画の提示」~「④関連動画の選択」までを一試行とする ③ユーザが選択した動画の コメントの傾向ベクトルを算出
  • 8. ユーザが気になった動画のコメント文書ベクトルの和 (但し ユーザが選択したら1,しなかったら0) 傾向ベクトル   1         n D D D n u d d d k u a b c         関連動画の選択 i i i n D n D n D u d u d Sim u d        ( )  , , ,: インタラクティブな関連動画提示への利用モデル 「ユーザが選択した動画のコメントの特徴ベクトル」 及び 「前の試行における傾向ベクトル」 を考慮して定義 前の試行におけるユーザの 視聴傾向ベクトル (但し減衰率kを掛ける) カテゴリ内の既に視聴した動画を除くすべての動画に対し コメントの特徴ベクトルと傾向ベクトルとの類似度を求める 類似度 ↓ 類似度の上位三動画を関連動画と定義
  • 9. 実験 目的 選択した動画のコメント傾向を反映した関連動画提示の確認 ・ユーザが気になった動画として既に2つを選択したと仮定し実験を行う D1 : LIONEL MESSI TOP 30 GOALS!!! : Bret Hart: 2006 Hall of Fame Speech 2 D D1 d  D2 d  0 1 2 3 4 5 6 7 8 messi globus goles futbol cr9 pero javier hacia lo seleccion si d10s ni benoit wrestlemania kane wcw dx mcmahon eddie macho hartaustin willjohnboy owens cyruss tenta inducties iirc fn sounds match x12 jawoll clic dh yokozuna stirring rl sabu nitro h 単語 重要度 D1 d  D2 d  選択した動画の単語と重要度
  • 10. 結果 関連 動画 (1回目) D5 d  D3 d  D4 d  0 1 2 3 4 5 6 7 8 messi globus goles futbol cr9 pero javier hacia lo seleccion si d10s ni benoit wrestlemania kane wcw dx mcmahon eddie macho hartaustin willjohnboy owens cyruss tenta inducties iirc fn sounds match x12 jawoll clic dh yokozuna stirring rl sabu nitro h 単語 重要度 D1 d  D2 d  D1 d  D2 d 
  • 11. 0 1 2 3 4 5 6 7 8 messi globus goles futbol cr9 pero javier hacia lo seleccion si d10s ni benoit wrestlemania kane wcw dx mcmahon eddie macho hartaustin willjohnboy owens cyruss tenta inducties iirc fn sounds match x12 jawoll clic dh yokozuna stirring rl sabu nitro h 結果 関連 動画 (1回目) D3 d  D4 d  単語 重要度 D1 d  D2 d  選択 選択 D1 d  D2 d 
  • 12. 0 1 2 3 4 5 6 7 8 messi globus goles futbol cr9 pero javier hacia lo seleccion si d10s ni benoit wrestlemania kane wcw dx mcmahon eddie macho hartaustin willjohnboy owens cyruss tenta be plisss wm25 lmaoooo dynamite x12 jawoll clic dh yokozuna stirring rl sabu nitro h 結果 関連 動画 (1回目) D3 d  D4 d  選択 選択 D1 d  D2 d  D3 d  D4 d  単語 重要度 重要度が増した語 bret,hart,hogan,owen, hbk,shawn,hitman etc…. D1 d  D2 d 
  • 13. 結果 関連 動画 (1回目) D3 d  D4 d  関連 動画 (2回目) >Ric Flair and Shawn Michaels... >Best of all time with Bret Hart right there >Bret and HBK totally…. >the hitman in a wwe ring again but… >it cause of hulk hogan… >He and shawn Michaels… >With all due respect to Bret Hart.... 重要度が増した語 bret,hart,hogan,owen, hbk,shawn,hitman etc…. D1 d  D2 d 
  • 14. 結果 D5 d  D3 d  関連 動画 (1回目) 選択 選択 0 1 2 3 4 5 6 messi leo balon que 1messi tna hulk dx suit cinzia tyson wounded be somfing mierdaldo soccer thoughtss gooner aguantee 単語 重要度 重要度が増した語 bret,hart,hogan,owen, hbk,shawn,hitman etc…. messi,ronaldo,barca, bret,hart,hogan etc…. D1 d  D2 d  D1 d  D2 d  D3 d  D5 d 
  • 15. 結果 D5 d  D3 d  関連 動画 (1回目) 選択 選択 >Ric Flair and Shawn Michaels... >Best of all time with Bret Hart right there 関連 動画 (2回目) > didn't kick ric in the nads like he did bret hart... > Flair is just like Hogan ... 重要度が増した語 bret,hart,hogan,owen, hbk,shawn,hitman etc…. messi,ronaldo,barca, bret,hart,hogan etc…. > people said ronaldo should've won it? > the best lionel messi video ive watched D1 d  D2 d 
  • 16. まとめ 目的 達成事項 ・動画コメントからtf-idf法によって抽出した特徴語が動画の特徴を表すものとして 利用できる可能性を示した ・ユーザが視聴し,気になった動画のコメントの特徴ベクトルを合成した傾向ベクトルを 用いて,ユーザの視聴傾向を反映した関連動画の提示ができる可能性を示した 動画の特徴を表す情報を動画コメントから取得 ↓応用 ユーザの選択した動画の特徴を考慮しインタラクティブな関連動画の提示 研究業績 国内学会発表:1件
  • 17.
  • 18. 0 1 2 3 4 5 6 messi leo balon que 1messi tna hulk dx suit cinzia tyson wounded be somfing mierdaldo soccer thoughtss gooner aguantee
  • 19. 結果 D5 d  1,D1 d  1,D2 d  D3 d  関連 動画 (1回目) 選択 選択