SlideShare a Scribd company logo
1 of 14
A Long Short-Term
Memory Framework
for Predicting Humor
in Dialogues
Dario Bertero and Pascale Fung
NAACL2016
紹介者 尾形朋哉
2016/7/7 1
Abstract
 対話において、発話がユーモア含んでいるかどうかを推定
 初めてLSTMに基づくモデルを提案
 ベースラインであるCRFのF値を8%分改善
 LSTMにより、false positiveを減らしつつ、recallも増やす
2016/7/7 2
Introduction
ユーモアや皮肉を検出して、理解する様々な試み
先行研究
 Twitterや客のレビュー、おきまりのジョークを分析
本研究
 面白い対話の原稿を分析
 人間とロボットのやり取りにおいて重要なジャンル
 いつ観客が笑うかを予測したい
2016/7/7 3
Introduction
対話における発話
 一般的なジョークや皮肉なつぶやきとは違い、対話の文
脈や過去の出来事に関連してのみ可笑しいと判断される
可笑しな対話
 聞き手に可笑しな会話を受け取る準備をさせる
 会話のオチで緊張を解き、笑いを引き起こす
2016/7/7 4
Introduction
2016/7/7 5
様々な状況のユーモアを含む対話のソース
 人気なシチュエーションコメディのTV番
組「The Big Bang Theory」
 笑いどころがすべての対話に対して与え
られている
Methodology
いつ笑いが起きるかを検出する教師ありの分類問題
 Convolution Neural Networkの連結
 文脈をモデル化するためにLSTMを利用
 LSTMの出力に対し、上位の統語的、構造的、感情的な素
性を追加
2016/7/7 6
Convolution Neural Network
 多次元の入力素性ベクトル→embed層(低次元の密なベクトル)
 各入力素性に対してそれぞれconvolutionとmax poolingが行われ、結合された
ものがLSTMのencoderに与えられる。
 convolutionで特徴マップを生成
 max poolingで最も顕著な特徴を持ってくる
入力素性
 単語
 one-hotベクトル
 各単語がどれだけユーモアを引き起こしやすいかをモデル化
 文字3グラム
 bag of character 3gramベクトル
 word2vec(text9 wikipedia corpus)
 一般的な意味の近さをモデル化
2016/7/7 7
LSTM
 それぞれシーンでの文脈情報を保持
 人間の記憶を模倣
 オチを引き起こすための準備
2016/7/7 8
LSTM
LSTMの出力に結合される素性
 構造の素性
 品詞の割合
 反意語
 感情
 話者の性格、発話の位置
 全体の文に対する発言の割合
2016/7/7 9
Experiments
Corpus
 The Big Bang Theory , season 1~6
 字幕ファイル
 135エピソード
 1589シーン
 42.8%がオチを含んでいる
 80% トレーニングセット(35,856発話)
 10% Devセット(3,904発話)
 10% テストセット(3,903発話)
2016/7/7 10
Experiments
Setup
 CNNとLSTMの隠れ層 100
 Convolutionのウインドウサイズは5
 LSTMの出力の後にDropout正則化層を、softmax出力層にL2正則化を適用する
 それぞれのシーンをトレーニングとして通常のBackpropagationで学習
Baseline
 L2正則化をしたCRF
 発話の1-2-3gram
 発話の1-2-3gram
 過去4つ(文脈窓)の1-2-3gram
 上記二つの組み合わせ
Others
 CNNを全てLSTMの文Encoderに置き換えたものとの比較も行った
2016/7/7 11
Experiments
2016/7/7 12
Experiments
CRF
 文脈ウインドウからn-gramにより得られる語彙的な素性
がオチの認識に役立ている。
 一方で、異なる文脈で同じn-gramが使われた際には、
false positiveが多くなる問題がある
CNN-LSTM
 CNNは語彙的、意味的な内容をモデル化するのに優れて
いる
 LSTMは過去の文脈と関連した発話を出すので、誤った文
脈からfalse positiveを取り除くことができる。
2016/7/7 13
Conclusion
 F値が62.9%でベースラインのCRF58.1%を上回った
 LSTMは単純なnグラムの文脈窓に比べてFalse Positiveを
少なくした上、recallも増やすことができる
2016/7/7 14

More Related Content

Featured

Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
Kurio // The Social Media Age(ncy)
 

Featured (20)

Skeleton Culture Code
Skeleton Culture CodeSkeleton Culture Code
Skeleton Culture Code
 
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search Intent
 
How to have difficult conversations
How to have difficult conversations How to have difficult conversations
How to have difficult conversations
 
Introduction to Data Science
Introduction to Data ScienceIntroduction to Data Science
Introduction to Data Science
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best Practices
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project management
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
 
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
 
12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work
 
ChatGPT webinar slides
ChatGPT webinar slidesChatGPT webinar slides
ChatGPT webinar slides
 
More than Just Lines on a Map: Best Practices for U.S Bike Routes
More than Just Lines on a Map: Best Practices for U.S Bike RoutesMore than Just Lines on a Map: Best Practices for U.S Bike Routes
More than Just Lines on a Map: Best Practices for U.S Bike Routes
 
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
 

[論文紹介]A long short term memory framework for predicting humor in dialogues