SlideShare a Scribd company logo
1 of 27
脚本の内容と構成要素に基づく
映画印象推定
静岡大学情報学部
中野裕介 山本祐輔
DEIM2019 I3-3
2019/3/11 1
映画の検索手法
話題作
ジャンル
キーワード
etc…
映画を探すとき…
2019/3/11 2
ジャンルの例
アクション
コメディ
ロマンス
ホラー
etc…
様々な映画を題材、テーマ、物語形式、登場人物
などの共通の特徴を基準に分類したカテゴリー。
映画ジャンルとは…
キネマ旬報『現代映画用語辞典』,キネマ旬報社,P.66.2019/3/11 3
ジャンル機能のあるサイト
ジャンルはポピュラーな
映画の印象推定指標である。
国内最大級の映画情報サイト¹
1)https://eiga.com/
海外大手映画データベースサイト²
2)https://www.imdb.com/
映画配信サービス大手³
3)https://www.amazon.co.jp/Prime-Video/b?ie=UTF8&node=3535604051
2019/3/11 4
ジャンル選定における問題
ジャンルの明確な分類基準は?
2019/3/11 5
その結果…
プライムビデオ¹
• ドラマ
• ホラー
IMDB²
• ホラー
• ミステリー
• スリラー
同じ映画が異なるジャンルに!
1) https://www.amazon.co.jp/gp/video/detail/B016J3EDFY/
ref=pd_cbs_318_2
2) https://www.imdb.com/title/tt0100157/?ref_=nv_sr_1
2019/3/11 6
本研究における妥当な基準
視聴後にそのジャンルの映画を
見たのだと違和感なく思うことが
できる
2019/3/11 7
提案
機械的に高い精度でジャンルを
分類できないか?
2019/3/11 8
ジャンルを(基準)で分類する意義
人によるばらつきがなくなる
印象推定手法としてより統一された
指標に
ジャンル未知の映画の印象を推定で
きる
2019/3/11 9
関連研究
トレーラー動画を用いた演出特徴に
よる分類する¹
ポスター画像から描かれる物体の
傾向を判断し分類する²
映画のあらすじ情報からテキスト
分析を行い分類する³
2019/3/11 10
1) Zhou, H., Hermans, T., Karandikar, A. V. and Rehg, J. M.: Movie Genre Classication via Scene Categorization, Proceedings
of the 18th ACM International Conference on Multimedia (MM 2010), ACM, pp. 747{750 (2010).
2) Chu, W.-T. and Guo, H.-J.: Movie Genre Classication Based on Poster Images with Deep Neural Networks, Proceedings of
the Workshop on Multimodal Understanding of Social, Affective and Subjective Attributes (MUSA2 2017), ACM, pp.39{45
(2017).
3) Ertugrul, A. M. and Karagoz, P.: Movie Genre Classication from Plot Summaries Using Bidirectional LSTM, Proceedings of
IEEE 12th International Conference on Semantic Computing (ICSC 2018), pp. 248{251 (2018).
関連研究
トレーラー動画を用いた演出特徴に
よる分類する¹
ポスター画像から描かれる物体の傾
向を判断し分類する²
映画のあらすじ情報からテキスト分
析を行い分類する³
2019/3/11 11
1) Zhou, H., Hermans, T., Karandikar, A. V. and Rehg, J. M.: Movie Genre Classication via Scene Categorization, Proceedings
of the 18th ACM International Conference on Multimedia (MM 2010), ACM, pp. 747{750 (2010).
2) Chu, W.-T. and Guo, H.-J.: Movie Genre Classication Based on Poster Images with Deep Neural Networks, Proceedings of
the Workshop on Multimodal Understanding of Social, Affective and Subjective Attributes (MUSA2 2017), ACM, pp.39{45
(2017).
3) Ertugrul, A. M. and Karagoz, P.: Movie Genre Classication from Plot Summaries Using Bidirectional LSTM, Proceedings of
IEEE 12th International Conference on Semantic Computing (ICSC 2018), pp. 248{251 (2018).
映画全体の演出や内容から評価
するべきではないか
演出と内容
演出
–感覚的な印象
内容
–論理的な印象
2019/3/11 12
着目する要素
2019/3/11 13
構成要素 脚本内容
(28次元) (300次元)
間接的な演出 内容
手法
2019/3/11 14
1007件の映画脚本データ
構成要素 脚本内容+
機械学習(SVM)によりジャンルを分類
脚本記述ルールを利用 Doc2Vecを利用
映画ベクトルの作成
328次元ベクトル
映画脚本の構成要素と脚本内容に着目
脚本データベースIMSDb
1007件のハリウッド映画脚本データを取得
2019/3/11 15
https://www.imsdb.com/
脚本構造の取得方法
脚本は明確なルールで構造化¹されている
1) SCREENCRAFT https://screencraft.org/2015/05/07/elements-of-screenplay-formatting/
2019/3/11 16
脚本構造の取得方法
上記に基づき
28次元の特徴量を取得
シーン
会話
ト書き
トランジション
最大値 最小値
平均 分散
総数 中央値
歪度
4つの脚本ルール 7つの統計量
2019/3/11 17
脚本内容の取得方法
上記に基づき
300次元の特徴量を取得
Doc2Vec¹によって脚本データをベクトル化
※文書データを入力としてその分散表現を得ることのできる手法
Doc2Vec
分散表現A
分散表現B
分散表現C
分散表現D
⋮
脚本データA
脚本データB
脚本データC
脚本データD
⋮
2019/3/11 181) Le, Q. and Mikolov, T.: Distributed Representations of Sentences and Documents, Proceedings of the 31st
International Conference on International Conference on Machine Learning (ICML 2014), pp. II{1188{II{1196 (2014).
手法
2019/3/11 19
1008件の映画脚本データ
脚本構造 脚本内容+
機械学習(SVM)によりジャンルを分類
脚本記述ルールを利用 Doc2Vecを利用
映画ベクトルの作成
328次元ベクトル
ジャンル分類器の構築(1/3)
入力は328次元の特徴ベクトル
IMSDbで割り当てられたジャンルをラ
ベルに利用
正解ジャンルとそれ以外を判別する
二値分類問題とする
分類手法はSVM¹(RBFカーネル)
2019/3/11 20
1) Boser, B. E., Guyon, I. M. and Vapnik, V. N.: A Training Algorithm for Optimal Margin Classiers, Proceedings of the Fifth
Annual Workshop on ComputationalLearning Theory (COLT 1992), ACM, pp. 144{152 (1992).
ジャンル分類器の構築(2/3)
2019/3/11 21
ジャンル データ件数
Drama 563
Thriller 349
Comedy 322
Action 277
Crime 195
Romance 183
件数が多かった映画ジャンル上位6件
IMSDbの1007件の脚本データを
学習データに利用
ジャンル分類器の構築(3/3)
2019/3/11 22
ジャンル データ件数
Drama 563
Thriller 349
Comedy 322
Action 277
Crime 195
ジャンル データ件数
Romance 183
Adventure 160
Sci-fi 146
Horror 136
mystery 100
件数が多かった映画ジャンル上位10件
100件以上のデータが存在する
10ジャンルを対象に評価を行う
評価指標
𝑝𝑟𝑒𝑐𝑖𝑠𝑖𝑜𝑛 =
正解と分類できた正解データ数
正解と分類したデータ数
𝑟𝑒𝑐𝑎𝑙𝑙 =
正解と分類できた正解データ数
実際に正解であるデータ数
𝐹‐ 𝑣𝑎𝑙𝑢𝑒 =
2𝑟𝑒𝑐𝑎𝑙𝑙・𝑝𝑟𝑒𝑐𝑖𝑠𝑖𝑜𝑛
𝑟𝑒𝑐𝑎𝑙𝑙 + 𝑝𝑟𝑒𝑐𝑖𝑠𝑖𝑜𝑛
𝑎𝑐𝑐𝑢𝑟𝑎𝑐𝑦 =
適切に分類できたデータ数
すべての分類対象データ数
2019/3/11 23
結果
d2v+esf:提案手法
d2v:脚本内容のみ
2019/3/11 24
ジャンル名 d2v+esf d2v データ件数 ジャンル割合(%)
Drama 0.724 0.720 576 57.2
Thriller 0.990 0.990 356 35.3
Comedy 0.734 0.739 327 32.4
Action 0.711 0.722 279 27.7
Crime 0.686 0.681 198 19.7
Romance 0.926 0.926 183 18.2
Adventure 0.701 0.689 160 15.8
Sci-fi 0.839 0.849 146 14.5
Horror 0.622 0.607 136 13.5
Mystery 0.655 0.642 100 9.9
F-value
d2v+esfが最多ジャンルで
最大のF値を得た
具体例
2019/3/11 25
ゲットアウト¹
グッドウィルハンティング²
元のジャンル
Horror,Mystery,Thriller
システムの提案したジャンル
元のジャンル
Comedy,Drama
システムの提案したジャンル
1)https://www.imsdb.com/Movie%20Scripts/Get%20Out%20Script.html
2) https://www.imsdb.com/Movie%20Scripts/Good%20Will%20Hunting%20Script.html
Crime,Horror,Mystery,Thriller
Drama
性能向上の余地
シーン毎の情報を構成要素に含める
複数ジャンルを持たない映画データ
を対象にする
– ジャンル割合の低いジャンルの方が高精度
シーン単位でのジャンル分け
– 詳細な検索のできるアプリケーション
2019/3/11 26
情報をさらに単純で
ジャンル固有のものとする
まとめ
提案
映画ジャンル分類に脚本データを用いる手法
結果
提案手法が最多ジャンルで
F値の最大値を得た
今後の課題
 シーン別で学習できる手法の検討
 ユーザ実験で人間に評価させる
2019/3/11 27

More Related Content

More from ymmt3-lab

研究室勉強会資料「データ分析チュートリアル」
研究室勉強会資料「データ分析チュートリアル」研究室勉強会資料「データ分析チュートリアル」
研究室勉強会資料「データ分析チュートリアル」ymmt3-lab
 
Journalclub sato 20191218
Journalclub sato 20191218Journalclub sato 20191218
Journalclub sato 20191218ymmt3-lab
 
Journal club 20191211_murata
Journal club 20191211_murataJournal club 20191211_murata
Journal club 20191211_murataymmt3-lab
 
Journal_club_1120
Journal_club_1120Journal_club_1120
Journal_club_1120ymmt3-lab
 
ジャーナルクラブ_20191120
ジャーナルクラブ_20191120ジャーナルクラブ_20191120
ジャーナルクラブ_20191120ymmt3-lab
 
Journalclub sato 20191031
Journalclub sato 20191031Journalclub sato 20191031
Journalclub sato 20191031ymmt3-lab
 
静岡大学 山本研究室 勉強会資料 機械学習
静岡大学 山本研究室 勉強会資料 機械学習静岡大学 山本研究室 勉強会資料 機械学習
静岡大学 山本研究室 勉強会資料 機械学習ymmt3-lab
 
Journal club 20191030 ito
Journal club 20191030 itoJournal club 20191030 ito
Journal club 20191030 itoymmt3-lab
 
Journalclub 20191023 nagano
Journalclub 20191023 naganoJournalclub 20191023 nagano
Journalclub 20191023 naganoymmt3-lab
 
Journal club 20191023_murata
Journal club 20191023_murataJournal club 20191023_murata
Journal club 20191023_murataymmt3-lab
 
DEIM2019発表資料(藤堂晶輝)
DEIM2019発表資料(藤堂晶輝)DEIM2019発表資料(藤堂晶輝)
DEIM2019発表資料(藤堂晶輝)ymmt3-lab
 
DEIM2019_horiuchi
DEIM2019_horiuchiDEIM2019_horiuchi
DEIM2019_horiuchiymmt3-lab
 
DEIM2019 発表資料 「飲食店レビュー情報の集合知分析と意思決定支援」
DEIM2019 発表資料 「飲食店レビュー情報の集合知分析と意思決定支援」DEIM2019 発表資料 「飲食店レビュー情報の集合知分析と意思決定支援」
DEIM2019 発表資料 「飲食店レビュー情報の集合知分析と意思決定支援」ymmt3-lab
 
DEIM2019 発表資料 「笑えるウェブ情報検索のためのクエリ推薦」
DEIM2019 発表資料 「笑えるウェブ情報検索のためのクエリ推薦」DEIM2019 発表資料 「笑えるウェブ情報検索のためのクエリ推薦」
DEIM2019 発表資料 「笑えるウェブ情報検索のためのクエリ推薦」ymmt3-lab
 
DEIM2019 発表資料 「文章表現の曖昧さ指摘による情報精査の態度・行動促進」
DEIM2019 発表資料 「文章表現の曖昧さ指摘による情報精査の態度・行動促進」DEIM2019 発表資料 「文章表現の曖昧さ指摘による情報精査の態度・行動促進」
DEIM2019 発表資料 「文章表現の曖昧さ指摘による情報精査の態度・行動促進」ymmt3-lab
 
Bookreading7
Bookreading7Bookreading7
Bookreading7ymmt3-lab
 
誰のためのデザイン?3章
誰のためのデザイン?3章誰のためのデザイン?3章
誰のためのデザイン?3章ymmt3-lab
 
誰のためのデザイン?2章
誰のためのデザイン?2章誰のためのデザイン?2章
誰のためのデザイン?2章ymmt3-lab
 
誰のためのデザイン? 第5章
誰のためのデザイン? 第5章誰のためのデザイン? 第5章
誰のためのデザイン? 第5章ymmt3-lab
 
The design of everyday things cp4
The design of everyday things cp4The design of everyday things cp4
The design of everyday things cp4ymmt3-lab
 

More from ymmt3-lab (20)

研究室勉強会資料「データ分析チュートリアル」
研究室勉強会資料「データ分析チュートリアル」研究室勉強会資料「データ分析チュートリアル」
研究室勉強会資料「データ分析チュートリアル」
 
Journalclub sato 20191218
Journalclub sato 20191218Journalclub sato 20191218
Journalclub sato 20191218
 
Journal club 20191211_murata
Journal club 20191211_murataJournal club 20191211_murata
Journal club 20191211_murata
 
Journal_club_1120
Journal_club_1120Journal_club_1120
Journal_club_1120
 
ジャーナルクラブ_20191120
ジャーナルクラブ_20191120ジャーナルクラブ_20191120
ジャーナルクラブ_20191120
 
Journalclub sato 20191031
Journalclub sato 20191031Journalclub sato 20191031
Journalclub sato 20191031
 
静岡大学 山本研究室 勉強会資料 機械学習
静岡大学 山本研究室 勉強会資料 機械学習静岡大学 山本研究室 勉強会資料 機械学習
静岡大学 山本研究室 勉強会資料 機械学習
 
Journal club 20191030 ito
Journal club 20191030 itoJournal club 20191030 ito
Journal club 20191030 ito
 
Journalclub 20191023 nagano
Journalclub 20191023 naganoJournalclub 20191023 nagano
Journalclub 20191023 nagano
 
Journal club 20191023_murata
Journal club 20191023_murataJournal club 20191023_murata
Journal club 20191023_murata
 
DEIM2019発表資料(藤堂晶輝)
DEIM2019発表資料(藤堂晶輝)DEIM2019発表資料(藤堂晶輝)
DEIM2019発表資料(藤堂晶輝)
 
DEIM2019_horiuchi
DEIM2019_horiuchiDEIM2019_horiuchi
DEIM2019_horiuchi
 
DEIM2019 発表資料 「飲食店レビュー情報の集合知分析と意思決定支援」
DEIM2019 発表資料 「飲食店レビュー情報の集合知分析と意思決定支援」DEIM2019 発表資料 「飲食店レビュー情報の集合知分析と意思決定支援」
DEIM2019 発表資料 「飲食店レビュー情報の集合知分析と意思決定支援」
 
DEIM2019 発表資料 「笑えるウェブ情報検索のためのクエリ推薦」
DEIM2019 発表資料 「笑えるウェブ情報検索のためのクエリ推薦」DEIM2019 発表資料 「笑えるウェブ情報検索のためのクエリ推薦」
DEIM2019 発表資料 「笑えるウェブ情報検索のためのクエリ推薦」
 
DEIM2019 発表資料 「文章表現の曖昧さ指摘による情報精査の態度・行動促進」
DEIM2019 発表資料 「文章表現の曖昧さ指摘による情報精査の態度・行動促進」DEIM2019 発表資料 「文章表現の曖昧さ指摘による情報精査の態度・行動促進」
DEIM2019 発表資料 「文章表現の曖昧さ指摘による情報精査の態度・行動促進」
 
Bookreading7
Bookreading7Bookreading7
Bookreading7
 
誰のためのデザイン?3章
誰のためのデザイン?3章誰のためのデザイン?3章
誰のためのデザイン?3章
 
誰のためのデザイン?2章
誰のためのデザイン?2章誰のためのデザイン?2章
誰のためのデザイン?2章
 
誰のためのデザイン? 第5章
誰のためのデザイン? 第5章誰のためのデザイン? 第5章
誰のためのデザイン? 第5章
 
The design of everyday things cp4
The design of everyday things cp4The design of everyday things cp4
The design of everyday things cp4
 

DEIM2019 発表資料 「脚本の内容と構成要素に基づく映画印象推定」

Editor's Notes

  1. ああああ