SlideShare a Scribd company logo
1 of 31
Download to read offline
論文輪読
Learning Sentiment-Specific Word Embedding
for Twitter Sentiment Classification
学際情報学府 総合分析情報学コース
M2 河野 慎
論文について
タイトル
• Learning Sentiment-Specific Word Embedding for Twitter Sentiment Classification
著者
• Duyu Tang, Furu Wei, Nan Yang, Ming Zhou, Ting Liu, BingQin
• Research Center for Social Computing and Information Retrieval Harbin Institute of Technology,
China
• Microsoft Research, Beijing, China
• University of Science and Technology of China, Hefei, China
引用件数
• 43件
学会
• ACL 2014
2
背景
Sentiment classification
• 文章がポジティブ/ネガティブな表現か分類する
- SemEvalタスク
• feature engineering
- 研究者によって素性が設計される
- 重要であるがものすごく大変
• word embedding
- データから説明要因を抜き出す
3
問題意識
既存のword embeddingはsentiment analysisにおいて
十分といえるか?
• 文法的に近くても,意味的に遠いもの
※品詞のタグ付けでは有効
4
he formed the good habit of …
he formed the bad habit of …
同じ文脈
先行研究1
Twitter sentiment classification
• 辞書ベース
- 否定や強調に注目して評価極性を計算する
• 既存の文書カテゴリ分類問題の1つとして扱う
- distant supervision(後述)
- スムージングした言語モデル
- emotional signalsを教師なし学習に組み込む
• いずれもfeature engineeringが重要
5
先行研究2
Learning continuous representations for sentiment classification
• bag-of-words representation
- 各ベクトル:one-hot-vector
• 単語の複雑な言語的特徴を捉えきれない
Deep Learningの登場
• 連続表現によって様々なNLPタスクで発揮
- LSAで初期化→linear weighted of ngram vectorsで表現
- 単語を行列で表現→行列乗算で単語を結びつける
- SdA:ドメイン適応
- RecursiveNN,Recursive Neural Tensor Network,Combinatory Categorial AE

によって任意の長さのフレーズ,文章に対応
• 各手法もタスクに強く依存している
6
目的と提案手法
単語の評価極性を表現できるアルゴリズムの提案
• goodとbadがスペクトラム両端に位置するような表現
Sentiment Specific Word Embedding(SSWE)
• 既存のC&Wモデルを拡張
• 3種類のニューラルネットワークを提案
- 損失関数に文の評価極性(教師)を組み込む
7
C&Wモデル
2層ニューラルネットワーク
8
入力層
隠れ層
出力層
C&Wモデル
Word embedding
9
C&Wモデル
10
=
C&Wモデル
11
C&Wモデル
12
畳み込み層
max pool層
C&Wモデル
13
最終的にスカラー値 f cw(t)を算出
最終的にスカラー値 f cw(t)を算出
C&Wモデル
14
損失関数
HardTanh
Linear
最終的にスカラー値 f cw(t)を算出
C&Wモデル
15
損失関数
HardTanh
Linear
真ん中の単語をwrに置き換えたngram
損失関数
HardTanh
Linear
Back Propagationで学習させる
C&Wモデル
16
提案手法1 SSWEh
C&Wモデルを教師あり学習にする
• ツイートの評価極性を予測する
- softmax層を追加
• 損失関数
- クロスエントロピーを使用
17
提案手法2 SSWEr
制約条件を少し緩める
• 評価極性スコアの大小で決める
• 損失関数
18
提案手法3 SSWEu
単語の文法的なコンテクストとツイートの評価極性の利用
• 両方の損失を考慮する
19
モデルの学習
pos/negの顔文字を含むツイートで学習
• 2013年4月,約1000万ツイート(pos500万/neg500万)
Back-propagation+AdaGrad
• Embedding length = 50 -> Lookup Table ∈ R50×単語数
• Window size = 3 -> おそらくinput windowの大きさ
• Learning rate = 0.1
20
Twitter Sentiment Classification
21
実験1
ツイートの評価極性分類タスク
• データ
- Twitter Sentiment Classification Track in Semantic Evaluation
2013(message-level)
• 評価指標
- Macro-F1
- ベースライン手法との精度比較
22
Distant Supurvision
少量の教師ありデータから教師ありデータを生成する
• 半教師あり学習のひとつとか
• 教師ありデータを直接使うのではなく,教師なしデータ
から教師ありデータを生成
- Freebaseデータベースから二つの単語と関係性を抜き出す
- wikipediaの文章で2つの単語が含まれている文章を探索
- 文章から特徴量を抽出し,その特徴量と関係性を関連付ける
23
実験1
分類アルゴリズム比較
24
Embedding比較
実験1
分類アルゴリズム比較
25
Embedding比較
アルゴリズムの比較といってるけど,基本SVMでは?
実験2
提案手法SSWEuの有効性検証
• αの値による精度変化
• 学習データの量による精度変化
26
実験3
単語の類似度評価
• 評価極性辞書と比較をして評価する
• Lookup Tableに含まれる単語と距離が近いTopN個の単語
の評価極性を検証
• 評価指標
27
実験3
28
まとめ
Twitterの評価極性表現手法の提案
ニューラルネットワークを拡張したSSWEの提案
Twitterの評価極性分類タスクで良いパフォーマンスを発揮
学習結果は公開
• http://ir.hit.edu.cn/~dytang/paper/sswe/embedding-
results.zip
29
感想
読めば読むほどわからなくなる論文
万能みたいな感じになってるword2vecよりも場合に
よってはいい方法がある
convolutional layerの使い方はかなり応用できそう
30
参考文献
第一著者HP+発表スライド
• http://ir.hit.edu.cn/~dytang/
• http://ir.hit.edu.cn/~dytang/paper/sswe/acl-slides.pdf
distsuper
• http://d.hatena.ne.jp/a_bicky/20150309/1425856724
• http://web.stanford.edu/~jurafsky/mintz.pdf
NRC
• http://saifmohammad.com/WebDocs/sentimentMKZ.pdf
convolutional layer(C&Wモデル)
• http://arxiv.org/abs/1103.0398 (こっちのほうが最新でわかりやすい)
• http://www.australianscience.com.au/research/google/35671.pdf
• http://www.slideshare.net/yutakikuchi927/deep-learning-26647407
31

More Related Content

Viewers also liked

Intoroduction of Pandas with Python
Intoroduction of Pandas with PythonIntoroduction of Pandas with Python
Intoroduction of Pandas with Python
Atsushi Hayakawa
 
RとPythonによるデータ解析入門
RとPythonによるデータ解析入門RとPythonによるデータ解析入門
RとPythonによるデータ解析入門
Atsushi Hayakawa
 

Viewers also liked (10)

Pythonデータ分析 第3回勉強会資料 8章
Pythonデータ分析 第3回勉強会資料 8章 Pythonデータ分析 第3回勉強会資料 8章
Pythonデータ分析 第3回勉強会資料 8章
 
Pythonデータ分析 第4回勉強会資料 10章
Pythonデータ分析 第4回勉強会資料 10章Pythonデータ分析 第4回勉強会資料 10章
Pythonデータ分析 第4回勉強会資料 10章
 
Python for Data Analysis第1回勉強会(+git入門)
Python for Data Analysis第1回勉強会(+git入門)Python for Data Analysis第1回勉強会(+git入門)
Python for Data Analysis第1回勉強会(+git入門)
 
20170131 python3 6 PEP526
20170131 python3 6 PEP526 20170131 python3 6 PEP526
20170131 python3 6 PEP526
 
Intoroduction of Pandas with Python
Intoroduction of Pandas with PythonIntoroduction of Pandas with Python
Intoroduction of Pandas with Python
 
Python3 移行への軌跡
Python3 移行への軌跡Python3 移行への軌跡
Python3 移行への軌跡
 
Python 機械学習プログラミング データ分析演習編
Python 機械学習プログラミング データ分析演習編Python 機械学習プログラミング データ分析演習編
Python 機械学習プログラミング データ分析演習編
 
RとPythonによるデータ解析入門
RとPythonによるデータ解析入門RとPythonによるデータ解析入門
RとPythonによるデータ解析入門
 
DeNAの機械学習・深層学習活用した 体験提供の挑戦
DeNAの機械学習・深層学習活用した体験提供の挑戦DeNAの機械学習・深層学習活用した体験提供の挑戦
DeNAの機械学習・深層学習活用した 体験提供の挑戦
 
Python 3.6 リリースパーティー 発表資料
Python 3.6 リリースパーティー 発表資料Python 3.6 リリースパーティー 発表資料
Python 3.6 リリースパーティー 発表資料
 

Similar to DLhacks paperreading_20150902

2012-08-01_平成24年度学術ポータル担当者研修LT
2012-08-01_平成24年度学術ポータル担当者研修LT2012-08-01_平成24年度学術ポータル担当者研修LT
2012-08-01_平成24年度学術ポータル担当者研修LT
Yuka Egusa
 
NIIpotal_tokyo(20120822)
NIIpotal_tokyo(20120822)NIIpotal_tokyo(20120822)
NIIpotal_tokyo(20120822)
真 岡本
 

Similar to DLhacks paperreading_20150902 (20)

マイニング探検会#12
マイニング探検会#12マイニング探検会#12
マイニング探検会#12
 
鷲崎 愛媛大学講演-プロジェクト型演習2014年12月15日
鷲崎 愛媛大学講演-プロジェクト型演習2014年12月15日鷲崎 愛媛大学講演-プロジェクト型演習2014年12月15日
鷲崎 愛媛大学講演-プロジェクト型演習2014年12月15日
 
050830 openforum
050830 openforum050830 openforum
050830 openforum
 
An efficient framework for learning sentence representations
An efficient framework for learning sentence representationsAn efficient framework for learning sentence representations
An efficient framework for learning sentence representations
 
論理的思考力を身に着けるための論文研修
論理的思考力を身に着けるための論文研修論理的思考力を身に着けるための論文研修
論理的思考力を身に着けるための論文研修
 
論文に関する基礎知識2015
論文に関する基礎知識2015論文に関する基礎知識2015
論文に関する基礎知識2015
 
できない学生向けの学習(修)支援サービス 田邊稔
できない学生向けの学習(修)支援サービス 田邊稔できない学生向けの学習(修)支援サービス 田邊稔
できない学生向けの学習(修)支援サービス 田邊稔
 
2012-08-01_平成24年度学術ポータル担当者研修LT
2012-08-01_平成24年度学術ポータル担当者研修LT2012-08-01_平成24年度学術ポータル担当者研修LT
2012-08-01_平成24年度学術ポータル担当者研修LT
 
PBL as a Service
PBL as a ServicePBL as a Service
PBL as a Service
 
Iec 141012
Iec 141012Iec 141012
Iec 141012
 
Tutorial2015 tomida
Tutorial2015 tomidaTutorial2015 tomida
Tutorial2015 tomida
 
C#でもメタプログラミングがしたい!!
C#でもメタプログラミングがしたい!!C#でもメタプログラミングがしたい!!
C#でもメタプログラミングがしたい!!
 
Rm20150701 9key
Rm20150701 9keyRm20150701 9key
Rm20150701 9key
 
改訂版:開発現場で役立つ論文の書き方のお話
改訂版:開発現場で役立つ論文の書き方のお話改訂版:開発現場で役立つ論文の書き方のお話
改訂版:開発現場で役立つ論文の書き方のお話
 
BADUIからユニバーサルデザインへ展開するデザイン教育実践
BADUIからユニバーサルデザインへ展開するデザイン教育実践BADUIからユニバーサルデザインへ展開するデザイン教育実践
BADUIからユニバーサルデザインへ展開するデザイン教育実践
 
Rm20140730 15key
Rm20140730 15keyRm20140730 15key
Rm20140730 15key
 
NIIpotal_tokyo(20120822)
NIIpotal_tokyo(20120822)NIIpotal_tokyo(20120822)
NIIpotal_tokyo(20120822)
 
【報告】いきいき研究室増産プロジェクトFORUM2012
【報告】いきいき研究室増産プロジェクトFORUM2012【報告】いきいき研究室増産プロジェクトFORUM2012
【報告】いきいき研究室増産プロジェクトFORUM2012
 
Point net
Point netPoint net
Point net
 
(講演資料)開発現場で役立つ論文の書き方のお話
(講演資料)開発現場で役立つ論文の書き方のお話(講演資料)開発現場で役立つ論文の書き方のお話
(講演資料)開発現場で役立つ論文の書き方のお話
 

Recently uploaded

TokyoTechGraduateExaminationPresentation
TokyoTechGraduateExaminationPresentationTokyoTechGraduateExaminationPresentation
TokyoTechGraduateExaminationPresentation
YukiTerazawa
 
The_Five_Books_Overview_Presentation_2024
The_Five_Books_Overview_Presentation_2024The_Five_Books_Overview_Presentation_2024
The_Five_Books_Overview_Presentation_2024
koheioishi1
 

Recently uploaded (8)

次世代機の製品コンセプトを描く ~未来の機械を創造してみよう~
次世代機の製品コンセプトを描く ~未来の機械を創造してみよう~次世代機の製品コンセプトを描く ~未来の機械を創造してみよう~
次世代機の製品コンセプトを描く ~未来の機械を創造してみよう~
 
ゲーム理論 BASIC 演習106 -価格の交渉ゲーム-#ゲーム理論 #gametheory #数学
ゲーム理論 BASIC 演習106 -価格の交渉ゲーム-#ゲーム理論 #gametheory #数学ゲーム理論 BASIC 演習106 -価格の交渉ゲーム-#ゲーム理論 #gametheory #数学
ゲーム理論 BASIC 演習106 -価格の交渉ゲーム-#ゲーム理論 #gametheory #数学
 
東京工業大学 環境・社会理工学院 建築学系 大学院入学入試・進学説明会2024_v2
東京工業大学 環境・社会理工学院 建築学系 大学院入学入試・進学説明会2024_v2東京工業大学 環境・社会理工学院 建築学系 大学院入学入試・進学説明会2024_v2
東京工業大学 環境・社会理工学院 建築学系 大学院入学入試・進学説明会2024_v2
 
TokyoTechGraduateExaminationPresentation
TokyoTechGraduateExaminationPresentationTokyoTechGraduateExaminationPresentation
TokyoTechGraduateExaminationPresentation
 
生成AIの回答内容の修正を課題としたレポートについて:お茶の水女子大学「授業・研究における生成系AIの活用事例」での講演資料
生成AIの回答内容の修正を課題としたレポートについて:お茶の水女子大学「授業・研究における生成系AIの活用事例」での講演資料生成AIの回答内容の修正を課題としたレポートについて:お茶の水女子大学「授業・研究における生成系AIの活用事例」での講演資料
生成AIの回答内容の修正を課題としたレポートについて:お茶の水女子大学「授業・研究における生成系AIの活用事例」での講演資料
 
2024年度 東京工業大学 工学院 機械系 大学院 修士課程 入試 説明会 資料
2024年度 東京工業大学 工学院 機械系 大学院 修士課程 入試 説明会 資料2024年度 東京工業大学 工学院 機械系 大学院 修士課程 入試 説明会 資料
2024年度 東京工業大学 工学院 機械系 大学院 修士課程 入試 説明会 資料
 
世界を変えるクレーンを生み出そう! 高知エンジニアリングキャンプ2024プログラム
世界を変えるクレーンを生み出そう! 高知エンジニアリングキャンプ2024プログラム世界を変えるクレーンを生み出そう! 高知エンジニアリングキャンプ2024プログラム
世界を変えるクレーンを生み出そう! 高知エンジニアリングキャンプ2024プログラム
 
The_Five_Books_Overview_Presentation_2024
The_Five_Books_Overview_Presentation_2024The_Five_Books_Overview_Presentation_2024
The_Five_Books_Overview_Presentation_2024
 

DLhacks paperreading_20150902