SlideShare a Scribd company logo
1 of 21
ゲ ー ム 実 況 動 画 の ハ イ ラ イ ト
シーン自動検出
佐藤 颯哉
静岡大学 情報学部 行動情報学科 4年 山本研究室
sato@design.inf.shizuoka.ac.jp
卒業研究審査会
2020年2月14日
1
本研究の概要
YouTubeに投稿されているゲーム実況の
生配信アーカイブ動画のシーンに対して
書き込まれたコメントから,
「面白いシーン」か「面白くないシーン」
かを判定する分類器の作成方法を提案する
2
本研究における言葉の定義
 動画 :動画全体
 シーン:その動画に含まれる1つの区間
 時刻同期コメント:
コメントが書き込まれた時の動画再生時間の情報を
持ったコメント
3
 ウェブ上には様々なオンデマンド動画 配信
サービスが存在する
 上記のようなサービスは10代,20代の若者を中心
に利用率が高く,利用時間においても1日の時間
比率で考えると大きい*1
研究の背景(1/2)
4
画像出典:(https://www.youtube.com) (https://www.netflix.com/jp/)(https://fod.fujitv.co.jp/s/)
: (https://www.nicovideo.jp/)(https://www.hulu.jp/)(https://tver.jp/)
*1:平成30年度 情報通信メディアの利用時間と情報行動に関する調査より
(https://www.soumu.go.jp/main_content/000644166.pdf)
研究の背景(2/2)
インターネット生配信のジャンルの中で
もゲーム実況は人気で視聴者も多い
YouTubeに投稿された生配信アーカイブ動
画は冗長な部分が多く,面白いシーンの
みを見たい場合でも視聴者自身が探す必
要がある
効率的に面白いシーンを探す手段が
求められている
5
関連研究
サッカーの動画に書き込まれた時刻同期
コメントを用いて感情値を測定しシーン
が持つ感情を推定する*2
– 感情値が高いシーンは特徴的なシーンである
動画の登場人物の名前を含むコメントが
現れる区間を特徴的なシーンとして推定
する*3
– 人物の名前が書き込まれるシーンはその人物が活躍
している特徴的なシーンである
6
*2:末永智彦, 早川智一, 疋田輝雄 「 視聴者の時刻同期コメントを用いた動画の特徴シーンの推定」
*3:佃洸摂, 中村聡史, 山本岳洋, 田中克己
「 映像に付与されたコメントを用いた登場人物が注目されるシーンの推定」
問題解決のための仮説
時刻同期コメントから感情表現と特徴的な
コメントの組み合わせで面白いシーンを
推定できるのではないか?
– 他の動画にはない特徴的なシーンは面白いシーンで
ある
– 笑いの感情を示すコメントがついているシーンは,
面白いと考えられる
感情表現×特徴的なコメントを特徴量
としてシーンを推定する
7
本研究と関連研究との差
分類器作成の過程
8
シーン分類器
コメントデータ
特徴ベクトル化ラベル付け
正解データ 不正解データ
SVMを用いて教師あり学習
シーン
3つの特徴量
tf-idf
コメントに含まれる名詞の頻度
sub
笑いの感情を示す「w」,「草」,「笑」を
文末表現に含むコメントの割合
tf-idf+sub(提案特徴量)
2つを考慮した特徴量
9
特徴ベクトル化(tf-idf)
動画のコメント内の名詞のTF-IDF値
 特徴的なシーンにはそのシーンを表す
特徴的なコメントがつく
TF-IDF値が高いほどその名詞は特徴的だと
考えられ,シーンの特徴を表す
TF-IDF
単語Xが特徴的な単語かどうかを判定する手法
単語Xの出現頻度×単語Xの稀少性
10
特徴ベクトル化(sub)
笑いの感情を示す「w」,「草」,「笑」を
文末表現に含むコメントの割合
 笑いの感情は書き込まれたコメントの文末に
記号的に使われていることが多いのではないか
「w」を文末表現に含む割合
「草」を文末表現に含む割合
「笑」を文末表現に含む割合
いずれかを文末表現に含む割合
11
評価実験(1/2)
評価のためクロスバリデーションを行う
本研究でのデータの内訳
正解データ : 66個
不正解データ:389個 計455個(シーン)
層化2分割交差検証を用いた
– データ数に偏りがあるときに用いる
– 正解データと不正解データの比率を元のデータ
セットと分割後のデータで統一
12
評価実験(2/2)
評価指標には適合率(precision)を用いた
目的は面白いシーンの推定であるため,
面白いシーンを正しく分類できているか
が重要
13
適合率(precision)=
正解を正解と分類できた数
正解と分類した数
結果(1/3)
14
各分類器ごとの評価結果
手法 適合率(precision)
tf-idf 0.426
sub 0.588
tf-idf+sub 0.653
結果(2/3)
 コメント中に出てくる名詞の頻度は特徴量が
1つの時,面白いシーンと判定することに
あまり重要な特徴量ではない
笑いの感情表現を表す文末表現の割合は
面白いシーンを推定するのに名詞の頻度より
重要な特徴量である
15
結果(3/3)
 面白いシーンの推定に名詞の頻度だけでは
あまり重要な特徴量ではなかったが,笑いの
感情表現を表す文末表現の割合と同時に
考慮することで適合率が上昇する
16
シーン検出例
17
【状況】
4人でカレーを作るミニゲームで
全員パーフェクトを出し最高評価
を得たシーン
「インドのプリキュア」と実況者
が叫んでいた
https://www.youtube.com/watch?v=nAOHrQC-hBQ
考察(1/2)
tf-idfを特徴量とした時精度を向上させる
ために対象とするゲームのタイトルを
絞り特徴的なシーンを検出することが
必要
18
考察(2/2)
笑いの感情表現は面白いシーンの判定に
少なからず影響を与えた
別の感情ではどうなのか
コメントの文末表現における感情に着目
して面白さに与える影響を比較し,
特徴量を決定すると分類器の性能向上が
見込める
– 驚きを表す「!」
– 困惑を表す「?」
– 気まずさを表す「…」
– 悲しみを表す「; ;」など
19
今後の課題
客観的な評価を行うために未知の動画の
コメントデータを利用
分類器の性能向上
– データセットの数の担保
• 本研究ではデータセットの総数も少なく,正解
データと不正解データにも大きな偏りが生じた
– 特徴量の決定
• 別の感情表現がどのくらい影響を与えるか比較,
検証
20
まとめ
効率的に面白いシーンを探すために,
コメントからそのシーンが面白いかを
判定する分類器を作成
今後
分類器の性能を向上させる
未知の動画についているコメントを利用
し,面白いシーンを検出
シーンの客観的評価
21

More Related Content

More from ymmt3-lab

Journalclub sato 20191218
Journalclub sato 20191218Journalclub sato 20191218
Journalclub sato 20191218ymmt3-lab
 
Journal club 20191211_murata
Journal club 20191211_murataJournal club 20191211_murata
Journal club 20191211_murataymmt3-lab
 
Journal_club_1120
Journal_club_1120Journal_club_1120
Journal_club_1120ymmt3-lab
 
ジャーナルクラブ_20191120
ジャーナルクラブ_20191120ジャーナルクラブ_20191120
ジャーナルクラブ_20191120ymmt3-lab
 
Journalclub sato 20191031
Journalclub sato 20191031Journalclub sato 20191031
Journalclub sato 20191031ymmt3-lab
 
静岡大学 山本研究室 勉強会資料 機械学習
静岡大学 山本研究室 勉強会資料 機械学習静岡大学 山本研究室 勉強会資料 機械学習
静岡大学 山本研究室 勉強会資料 機械学習ymmt3-lab
 
Journal club 20191030 ito
Journal club 20191030 itoJournal club 20191030 ito
Journal club 20191030 itoymmt3-lab
 
Journalclub 20191023 nagano
Journalclub 20191023 naganoJournalclub 20191023 nagano
Journalclub 20191023 naganoymmt3-lab
 
Journal club 20191023_murata
Journal club 20191023_murataJournal club 20191023_murata
Journal club 20191023_murataymmt3-lab
 
DEIM2019発表資料(藤堂晶輝)
DEIM2019発表資料(藤堂晶輝)DEIM2019発表資料(藤堂晶輝)
DEIM2019発表資料(藤堂晶輝)ymmt3-lab
 
DEIM2019_horiuchi
DEIM2019_horiuchiDEIM2019_horiuchi
DEIM2019_horiuchiymmt3-lab
 
DEIM2019 発表資料 「飲食店レビュー情報の集合知分析と意思決定支援」
DEIM2019 発表資料 「飲食店レビュー情報の集合知分析と意思決定支援」DEIM2019 発表資料 「飲食店レビュー情報の集合知分析と意思決定支援」
DEIM2019 発表資料 「飲食店レビュー情報の集合知分析と意思決定支援」ymmt3-lab
 
DEIM2019 発表資料 「笑えるウェブ情報検索のためのクエリ推薦」
DEIM2019 発表資料 「笑えるウェブ情報検索のためのクエリ推薦」DEIM2019 発表資料 「笑えるウェブ情報検索のためのクエリ推薦」
DEIM2019 発表資料 「笑えるウェブ情報検索のためのクエリ推薦」ymmt3-lab
 
DEIM2019 発表資料 「脚本の内容と構成要素に基づく映画印象推定」
DEIM2019 発表資料 「脚本の内容と構成要素に基づく映画印象推定」DEIM2019 発表資料 「脚本の内容と構成要素に基づく映画印象推定」
DEIM2019 発表資料 「脚本の内容と構成要素に基づく映画印象推定」ymmt3-lab
 
DEIM2019 発表資料 「文章表現の曖昧さ指摘による情報精査の態度・行動促進」
DEIM2019 発表資料 「文章表現の曖昧さ指摘による情報精査の態度・行動促進」DEIM2019 発表資料 「文章表現の曖昧さ指摘による情報精査の態度・行動促進」
DEIM2019 発表資料 「文章表現の曖昧さ指摘による情報精査の態度・行動促進」ymmt3-lab
 
Bookreading7
Bookreading7Bookreading7
Bookreading7ymmt3-lab
 
誰のためのデザイン?3章
誰のためのデザイン?3章誰のためのデザイン?3章
誰のためのデザイン?3章ymmt3-lab
 
誰のためのデザイン?2章
誰のためのデザイン?2章誰のためのデザイン?2章
誰のためのデザイン?2章ymmt3-lab
 
誰のためのデザイン? 第5章
誰のためのデザイン? 第5章誰のためのデザイン? 第5章
誰のためのデザイン? 第5章ymmt3-lab
 
The design of everyday things cp4
The design of everyday things cp4The design of everyday things cp4
The design of everyday things cp4ymmt3-lab
 

More from ymmt3-lab (20)

Journalclub sato 20191218
Journalclub sato 20191218Journalclub sato 20191218
Journalclub sato 20191218
 
Journal club 20191211_murata
Journal club 20191211_murataJournal club 20191211_murata
Journal club 20191211_murata
 
Journal_club_1120
Journal_club_1120Journal_club_1120
Journal_club_1120
 
ジャーナルクラブ_20191120
ジャーナルクラブ_20191120ジャーナルクラブ_20191120
ジャーナルクラブ_20191120
 
Journalclub sato 20191031
Journalclub sato 20191031Journalclub sato 20191031
Journalclub sato 20191031
 
静岡大学 山本研究室 勉強会資料 機械学習
静岡大学 山本研究室 勉強会資料 機械学習静岡大学 山本研究室 勉強会資料 機械学習
静岡大学 山本研究室 勉強会資料 機械学習
 
Journal club 20191030 ito
Journal club 20191030 itoJournal club 20191030 ito
Journal club 20191030 ito
 
Journalclub 20191023 nagano
Journalclub 20191023 naganoJournalclub 20191023 nagano
Journalclub 20191023 nagano
 
Journal club 20191023_murata
Journal club 20191023_murataJournal club 20191023_murata
Journal club 20191023_murata
 
DEIM2019発表資料(藤堂晶輝)
DEIM2019発表資料(藤堂晶輝)DEIM2019発表資料(藤堂晶輝)
DEIM2019発表資料(藤堂晶輝)
 
DEIM2019_horiuchi
DEIM2019_horiuchiDEIM2019_horiuchi
DEIM2019_horiuchi
 
DEIM2019 発表資料 「飲食店レビュー情報の集合知分析と意思決定支援」
DEIM2019 発表資料 「飲食店レビュー情報の集合知分析と意思決定支援」DEIM2019 発表資料 「飲食店レビュー情報の集合知分析と意思決定支援」
DEIM2019 発表資料 「飲食店レビュー情報の集合知分析と意思決定支援」
 
DEIM2019 発表資料 「笑えるウェブ情報検索のためのクエリ推薦」
DEIM2019 発表資料 「笑えるウェブ情報検索のためのクエリ推薦」DEIM2019 発表資料 「笑えるウェブ情報検索のためのクエリ推薦」
DEIM2019 発表資料 「笑えるウェブ情報検索のためのクエリ推薦」
 
DEIM2019 発表資料 「脚本の内容と構成要素に基づく映画印象推定」
DEIM2019 発表資料 「脚本の内容と構成要素に基づく映画印象推定」DEIM2019 発表資料 「脚本の内容と構成要素に基づく映画印象推定」
DEIM2019 発表資料 「脚本の内容と構成要素に基づく映画印象推定」
 
DEIM2019 発表資料 「文章表現の曖昧さ指摘による情報精査の態度・行動促進」
DEIM2019 発表資料 「文章表現の曖昧さ指摘による情報精査の態度・行動促進」DEIM2019 発表資料 「文章表現の曖昧さ指摘による情報精査の態度・行動促進」
DEIM2019 発表資料 「文章表現の曖昧さ指摘による情報精査の態度・行動促進」
 
Bookreading7
Bookreading7Bookreading7
Bookreading7
 
誰のためのデザイン?3章
誰のためのデザイン?3章誰のためのデザイン?3章
誰のためのデザイン?3章
 
誰のためのデザイン?2章
誰のためのデザイン?2章誰のためのデザイン?2章
誰のためのデザイン?2章
 
誰のためのデザイン? 第5章
誰のためのデザイン? 第5章誰のためのデザイン? 第5章
誰のためのデザイン? 第5章
 
The design of everyday things cp4
The design of everyday things cp4The design of everyday things cp4
The design of everyday things cp4
 

Recently uploaded

AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfAWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfFumieNakayama
 
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...博三 太田
 
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)Hiroki Ichikura
 
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfクラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfFumieNakayama
 
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案sugiuralab
 
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineerYuki Kikuchi
 
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版) 2024年4月作成
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版) 2024年4月作成業務で生成AIを活用したい人のための生成AI入門講座(社外公開版) 2024年4月作成
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版) 2024年4月作成Hiroshi Tomioka
 
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?akihisamiyanaga1
 
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)UEHARA, Tetsutaro
 

Recently uploaded (9)

AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfAWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
 
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
 
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
 
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfクラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
 
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
 
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
 
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版) 2024年4月作成
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版) 2024年4月作成業務で生成AIを活用したい人のための生成AI入門講座(社外公開版) 2024年4月作成
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版) 2024年4月作成
 
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
 
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
 

ゲーム実況動画のハイライト自動検出

Editor's Notes

  1. 時刻同期コメント 動画の再生とともに動画とは別の再生領域で時間に応じたコメントの表示が行われる
  2. オンデマンドの動画配信サービスの利用率は10 代で87.9%,20 代で90.9% を記録している. また平日1 日の利用時間においても10 代では平均60.1 分,20 代では39.8 分,休日1 日では10 代95.4 分,20 代70.2 分であり1 日における時間比率も大きい
  3. Youtubeをはじめ,動画配信サイトで動画を配信しを職業としている人が増えている 生配信アーカイブ動画とは 生配信を行ったあとに生成される,その生配信の録画 YouTubeで配信を行った場合,基本的に自動生成され投稿される 通常は編集されたものを投稿するのである程度面白いシーンがピックアップされているか冗長的な部分はカットされている
  4. コメントからシーンを推定する研究 評価実験によって
  5. シーンの特徴ベクトル化については後述 先行研究では笑いの感情x特徴的なコメントで分析を行っていなかった
  6. データを集めた動画をシーンし分割シーンについたコメントデータの前処理を行う 特徴ベクトル化については後述 シーンに紐つくコメントデータの面白いシーンを正解データ,面白くないシーンを不正解データとしてラベル付け 面白い,面白くないシーンの判定には恣意的な判断にならないよう,クラウドソーシングを利用 シーンを見てもらい面白いか面白くないかでのみ評価を行った 面白い面白くないの二値分類問題であるためSVMを利用しカーネル関数にはRBFを用いた
  7. これらの特徴量を用いて3つの分類器を作成した
  8. 2つの観点からシーンをベクトル化した コメントに含まれる名詞を
  9. tf-idfはコメントに含まれる名詞の数だけベクトルの次元数がある Subは「w」を含む割合,「草」を含む割合,「笑」を含む割合,いずれかを含む割合の4次元ベクトル 特徴量 「w」を文末表現に含むコメントの割合 「草」を文末表現に含むコメントの割合 「笑」を文末表現に含むコメントの割合 「w」,「草」,「笑」のいずれかを文末  表現に含むコメントの割合
  10. クロスバリデーション データを訓練データとテストデータに分け訓練データで学習,テストデータで分類器を評価する これを複数回行い平均値を出してこれを分類器の汎化性能とする どのデータも1回は必ず訓練データとテストデータになるように分類する
  11. 提案特徴量を用いた分類器で面白いと分類されてクラウドソーシングでも面白いとされたシーンの例 カレーに関するコメントであるインドや,実況者のプリキュア発言から面白いシーンとして推定できたのではないか
  12. データ数が豊富で同じゲームタイトルのものを複数含む場合は影響は少なさそう 1本しか同じゲームタイトルを含まないとその動画に対する汎用的なコメントが特徴的なシーンとなる可能性がある ゲームタイトル今回集めたデータははやりのゲームであったポケモン関連の動画が約4割ほどであった. 同じゲームであれば同じようなシーンはたくさん存在すると考えられるため特徴的なシーンを検出しやすい またデータセット内で同じゲームタイトルのものが存在しないものがあり,その動画から特徴的なシーンが面白いシーンとして抽出される可能性は高くなる
  13. 今回利用したコメントデータの中で例のようなコメントはされているシーンはあったものの使えるほどのデータ数がそろっているかはわからないのでデータ数を増やす必要がある 感情の種類による重み付けや,組み合わせによって分類器の性能向上が見込めるのではないか
  14. 未知の動画のコメントデータを利用することで本当に面白いシーンを検出できる分類器なのかを客観的評価を用いて検証 前スライドの感情表現を組み合わせたり重み付けを変える
  15. データセットの増量や特徴量を考え分類器の性能向上 訓練データやテストデータで使っていない動画を用いて面白いシーンの検出を試みる その検出したシーンの客観的評価を行い実際の利用シーンを考える
  16. 以上の理由から本研究ではYouTubeを選んだ
  17. TF-IDFはTFとIDFの部分に分かれ最終的にはかけ合わせた値となる 1シーンにつくコメント群を1つの文書とした場合,455シーン分のコメント群を全文書と考える 図だとすごいのTFは0.25,草は0.5,爆発,0.25
  18. 455シーンのうち,あるシーンのみに「運」というコメントが多く書き込まれ,他のシーンには書き込まれていなかった場合,そのシーンにおける「運」のTF-IDF値は高くなる logを使っているのは、文書数の規模に応じた変動影響を緩和するためで1を足しているのはidfが0にならないようにするため シーン500における運log3+1 1.47*0.75=1.1 シーン1における  草log3/2+1 0.18*0.5=0.09
  19. 相手が踏んだり蹴ったりなシーンであった