[論文紹介]A long short term memory framework for predicting humor in dialogues

A Long Short-Term
Memory Framework
for Predicting Humor
in Dialogues
Dario Bertero and Pascale Fung
NAACL2016
紹介者尾形朋哉
2016/7/7 1

Abstract
 対話において、発話がユーモア含んでいるかどうかを推定
 初めてLSTMに基づくモデルを提案
 ベースラインであるCRFのF値を8%分改善
 LSTMにより、false positiveを減らしつつ、recallも増やす
2016/7/7 2

Introduction
ユーモアや皮肉を検出して、理解する様々な試み
先行研究
 Twitterや客のレビュー、おきまりのジョークを分析
本研究
 面白い対話の原稿を分析
 人間とロボットのやり取りにおいて重要なジャンル
 いつ観客が笑うかを予測したい
2016/7/7 3

Introduction
対話における発話
 一般的なジョークや皮肉なつぶやきとは違い、対話の文
脈や過去の出来事に関連してのみ可笑しいと判断される
可笑しな対話
 聞き手に可笑しな会話を受け取る準備をさせる
 会話のオチで緊張を解き、笑いを引き起こす
2016/7/7 4

Introduction
2016/7/7 5
様々な状況のユーモアを含む対話のソース
 人気なシチュエーションコメディのTV番
組「The Big Bang Theory」
 笑いどころがすべての対話に対して与え
られている

Methodology
いつ笑いが起きるかを検出する教師ありの分類問題
 Convolution Neural Networkの連結
 文脈をモデル化するためにLSTMを利用
 LSTMの出力に対し、上位の統語的、構造的、感情的な素
性を追加
2016/7/7 6

Convolution Neural Network
 多次元の入力素性ベクトル→embed層（低次元の密なベクトル）
 各入力素性に対してそれぞれconvolutionとmax poolingが行われ、結合された
ものがLSTMのencoderに与えられる。
 convolutionで特徴マップを生成
 max poolingで最も顕著な特徴を持ってくる
入力素性
 単語
 one-hotベクトル
 各単語がどれだけユーモアを引き起こしやすいかをモデル化
 文字3グラム
 bag of character 3gramベクトル
 word2vec(text9 wikipedia corpus)
 一般的な意味の近さをモデル化
2016/7/7 7

LSTM
 それぞれシーンでの文脈情報を保持
 人間の記憶を模倣
 オチを引き起こすための準備
2016/7/7 8

LSTM
LSTMの出力に結合される素性
 構造の素性
 品詞の割合
 反意語
 感情
 話者の性格、発話の位置
 全体の文に対する発言の割合
2016/7/7 9

Experiments
Corpus
 The Big Bang Theory , season 1~6
 字幕ファイル
 135エピソード
 1589シーン
 42.8%がオチを含んでいる
 80% トレーニングセット(35,856発話)
 10% Devセット(3,904発話)
 10% テストセット(3,903発話)
2016/7/7 10

Experiments
Setup
 CNNとLSTMの隠れ層 100
 Convolutionのウインドウサイズは5
 LSTMの出力の後にDropout正則化層を、softmax出力層にL2正則化を適用する
 それぞれのシーンをトレーニングとして通常のBackpropagationで学習
Baseline
 L2正則化をしたCRF
 発話の1-2-3gram
 発話の1-2-3gram
 過去4つ(文脈窓）の1-2-3gram
 上記二つの組み合わせ
Others
 CNNを全てLSTMの文Encoderに置き換えたものとの比較も行った
2016/7/7 11

Experiments
CRF
 文脈ウインドウからn-gramにより得られる語彙的な素性
がオチの認識に役立ている。
 一方で、異なる文脈で同じn-gramが使われた際には、
false positiveが多くなる問題がある
CNN-LSTM
 CNNは語彙的、意味的な内容をモデル化するのに優れて
いる
 LSTMは過去の文脈と関連した発話を出すので、誤った文
脈からfalse positiveを取り除くことができる。
2016/7/7 13

Conclusion
 F値が62.9%でベースラインのCRF58.1%を上回った
 LSTMは単純なnグラムの文脈窓に比べてFalse Positiveを
少なくした上、recallも増やすことができる
2016/7/7 14

[論文紹介]A long short term memory framework for predicting humor in dialogues

Recommended

Recommended

More Related Content

Featured

Featured (20)

[論文紹介]A long short term memory framework for predicting humor in dialogues