SlideShare a Scribd company logo
1 of 30
Download to read offline
Copyright © 2017 TIS Inc. All rights reserved.
感情の出どころを探る、一歩進んだ感情解析
戦略技術センター
久保隆宏
Introduction for Aspect Based Sentiment Analysis
Copyright © 2017 TIS Inc. All rights reserved. 2
 観点感情解析(Aspect Based Sentiment Analysis)とは
 既存の感情解析の問題点
 観点感情解析のはじまり
 観点感情解析のタスク
 タスクの定義
 現在行われているアプローチ
 今後のアプローチ
 基本方針
 観点表現の認識を起点にした手法
 1-shot文分類を利用する手法
 観点表現の特定と分類を併用するパターン
 Try Aspect Based Sentiment Analysis!
目次
Copyright © 2017 TIS Inc. All rights reserved. 3
久保隆宏
TIS株式会社 戦略技術センター
 化学系メーカーの業務コンサルタント出身
 既存の技術では業務改善を行える範囲に限界があるとの実感から、戦
略技術センターへと異動
 現在は機械学習や自然言語処理の研究・それらを用いたシステムのプ
ロトタイピングを行う
自己紹介
kintoneアプリ内にたまった
データを簡単に学習・活用
(@Cybozu Days 2016)
チュートリアル講演:深層学習
の判断根拠を理解するための研
究とその意義(@PRMU 2017)
機械学習をシステムに組み込む
際の依存性管理について
(@MANABIYA 2018)
Copyright © 2017 TIS Inc. All rights reserved. 4
chakkiのミッション
Summarize data for human
あらゆるデータを、人間にとってわかりやすく要約
することを目指します。
chakkiが目指す機能:
 要約の観点を、なるべく少ないデータで学習する
 自然言語以外の、画像や数値データの要約も扱う
 図や表といった表現形態にも挑戦する
この機能の実現を通じ、最終的にはいつでもティー
タイム(15:00)に帰れる(=茶帰)社会を目指します。
2018年度より具体化
Copyright © 2017 TIS Inc. All rights reserved. 5
観点を指定した自然言語処理
観点単位にまとめることで、情報の欠落を
防ぐと共に図表化を行いやすくする。
モデルにお任せで「こんなん出ました」で
なく、利用者が出力をコントロールする。
ex: 観点要約
ペンギンのサイズは小さくて、手触りは冷たい。
 「サイズ」は「小さく」
 「手触り」は「冷たい」
サイズ 手触り
ペンギン 小さい 冷たい
ライオン 大きい 温かい
ウサギ 中くらい 温かい
業務要件により観点は異なる。そして、観点の学習データは少ない。
⇒自然言語処理における転移学習に注力し、「少ないデータでカスタマ
イズ可能な分類/生成器の作成」を目指している。
(2/3)
Copyright © 2017 TIS Inc. All rights reserved. 6
(3/3)
 研究開発活動は基本オープンに行っている(GitHub★総計 728)。
 研究に関することであれば、個人のブログ/リポジトリも評価される。
機械学習関連の論文のまとめをGitHubのIssueを使って行っ
ています。月一での輪講も開催中です。
観点感情解析(Aspect Based Sentiment Analysis)とは
Copyright © 2017 TIS Inc. All rights reserved. 8
「何が」肯定的・否定的に評価されているのかわからない。
既存の感情解析の問題点(1/2)
ここのピザは絶品だね!うちの家族はみんな大好き
と言っているよ。
ただ、ここのビールはとても薄いね!ビールの水割
りと思うくらいさ。
店員さんもちょっとぶっきらぼうかな。割られた
ビールの分、サービスしてほしいね!
レビューや論評といった肯定・否定が混在するようなケースでは、単に各
文のポジティブ・ネガティブだけでなく、「何が」肯定的/否定的に評価
されているかを知りたい。
Positive
Negative
Negative
Copyright © 2017 TIS Inc. All rights reserved. 9
以下のように、感情の対象が特定できるとよい。
既存の感情解析の問題点(2/2)
ここのピザは絶品だね!うちの家族はみんな大好き
と言っているよ。
ただ、ここのビールはとても薄いね!ビールの水割
りと思うくらいさ。
店員さんもちょっとぶっきらぼうかな。割られた
ビールの分、サービスしてほしいね!
Positive
Negative
Negative
ただ、対象の種類は非常に多い(ピザ、マルゲリータ、etc...)。また、評
価軸も様々(味、サービス、値段、etc...)。
そのため、同じカテゴリに属するもの=同じ観点はまとめたい。
Copyright © 2017 TIS Inc. All rights reserved. 10
ここのピザは絶品だね!うちの家族はみんな大好き
と言っているよ。
ただ、ここのビールはとても薄いね!ビールの水割
りと思うくらいさ。
店員さんもちょっとぶっきらぼうかな。割られた
ビールの分、サービスしてほしいね!
(ドメインごとに)整理された観点に基づき、感情評価を分析する。
観点感情解析のはじまり
初期(2004~)は、feature-based opinion miningと呼ばれていた。
研究の歴史やアプローチについては、書籍Sentiment Analysis and
Opinion Mining にて体系的にまとめられている。
※この書籍はレビューなどから意見やその極性を抽出する方法について400件以上の文献をまとめている神書籍。
Positive
Negative
Negative
FOODのQUALITY
SERVICE
DRINKのQUALITY
観点感情解析のタスク
Copyright © 2017 TIS Inc. All rights reserved. 12
観点単位の感情解析が、最初に意味解析のワークショップ(SemEval)で取
り上げられたのは2014年。そこから2016年まで3回連続で開催された。
(2017年以降は、TwitterなどのSNS上のメッセージの解析にとってかわられている)
そこでのタスク、つまり「どう観点単位の感情解析を行うか?」について
は年により若干の違いがある。ただ、最終的には以下の3タスクに落ち着
いている。
 Slot1: 各文の観点カテゴリの推定
 ピザは美味しいが価格は高い => カテゴリ: (FOOD#QUALITY、FOOD#PRICE)
 Slot2: 各文の観点カテゴリのエンティティを抽出
 ピザは美味しいが価格高い +カテゴリ: (FOOD#QUALITY、FOOD#PRICE) => エンティティ:
(FOOD#QUALITY=ピザ、 FOOD#PRICE=価格)
 Slot3: 各文の観点カテゴリについて極性の推定
 ピザは美味しいが価格は高い + カテゴリ: (FOOD#QUALITY、FOOD#PRICE) =>極性:
(FOOD#QUALITY =〇、 FOOD#PRICE =×)
タスクの定義(1/5)
Copyright © 2017 TIS Inc. All rights reserved. 13
SemEval 2014 Task4
 SB1: 観点にかかわる表現の抽出
 ピザは美味しいが価格は高い => 表現: (ピザ、価格)、極性: (ピザ=〇、価格=×)
 SB2: 観点にかかわる表現について、その極性を推定
 ピザは美味しいが価格は高い + 表現: (ピザ、価格) => 極性: (ピザ=〇、価格=×)
 SB3: 各文が議論している観点のカテゴリの推定
 ピザは美味しいが価格は高い => カテゴリ: (FOOD、PRICE)
 SB4: 観点にかかわる表現について、その極性を推定
 ピザは美味しいが価格は高い + カテゴリ: (FOOD、PRICE) => 極性: (FOOD=〇、PROCE=×)
タスクの定義(2/5)
ピザ
美味しい
FOOD
観点表現を特定してから、その種別極性を判断する。
Copyright © 2017 TIS Inc. All rights reserved. 14
SemEval 2015 Task12
タスクの定義(3/5)
観点の種別を特定してから、その表現・極性を判断する。
FOOD#
QUALITY
美味しい
ピザ
 Slot1: 各文の観点カテゴリの推定
 ピザは美味しいが価格は高い => カテゴリ: (FOOD#QUALITY、FOOD#PRICE)
 Slot2: 各文の観点カテゴリのエンティティを抽出
 ピザは美味しいが価格高い +カテゴリ: (FOOD#QUALITY、FOOD#PRICE) => エンティティ:
(FOOD#QUALITY=ピザ、 FOOD#PRICE=価格)
 Slot3: 各文の観点カテゴリについて極性の推定
 ピザは美味しいが価格は高い + カテゴリ: (FOOD#QUALITY、FOOD#PRICE) =>極性:
(FOOD#QUALITY =〇、 FOOD#PRICE =×)
Copyright © 2017 TIS Inc. All rights reserved. 15
カテゴリは、エンティティ+属性で表現(FOOD#QUALITYなど)。明言さ
れていなくてもわかる場合付与する。
例:「この神の舌を持つ僕をうならせる」という場合、明示的に「味」とは言っていないが明らかな
ため、FOOD#QUALITYとなる。
また、各文を単独ではなく周辺テキストも含めて考慮する。
例:「ピザの味は本当にいいよ。すごくいい!」という時、二文目(すごくいい!)は単独では何がい
いのかわからないが、一文目から推定可能なためFOOD#QUALITYとなる。
SemEval 2016 Task5
SemEval2015に加え、以下のサブタスクが追加された(SubTask1は2015
と同じ)。
 Subtask2: テキストレベル(レビュー全体)におけるカテゴリの推定・カ
テゴリごとの極性の推定
 Subtask3: ドメイン外のテキストでの性能検証(転移性能)
 ただ提出したチームはなかった?
タスクの定義(4/5)
Copyright © 2017 TIS Inc. All rights reserved. 16
SemEval2014~ SemEval2015,2016でタスクが変更された背景。
2014での傾向として「レビュー内で暗黙的に示唆される性質」の特定が
難しかったとしている(特にPCのドメインで。「僕のPCはずっとうなりを
あげているよ」はPCの性能について話しているが、性能を示す明確な言葉
はない)。
そのため、2015では明示的な表現(Aspect Term)の特定でなく、全体と
して「何を言っているのか」を先に推定する方(Aspect Categoryの推定
=Slot1)に舵を切っている。
ただ、その分少ないデータでエンティティ+属性という多めのカテゴリ
(しかもマルチラベル)の問題を一番先に解く形態になってしまってはいる。
タスクの定義(5/5)
Copyright © 2017 TIS Inc. All rights reserved. 17
SemEval 2016までで定義されたタスクをどうこなすかが一つの論点と
なっている。一つの研究で3つ(Slot1~Slot3)すべてをやっているものはあ
まりなく、どれか一つを選んで行っていることが多い。
 Slot1: 各文の観点カテゴリの推定
 ピザは美味しいが価格は高い => カテゴリ: (FOOD#QUALITY、FOOD#PRICE)
 Slot2: 各文の観点カテゴリのエンティティを抽出
 ピザは美味しいが価格高い +カテゴリ: (FOOD#QUALITY、FOOD#PRICE) => エンティティ:
(FOOD#QUALITY=ピザ、 FOOD#PRICE=価格)
 Slot3: 各文の観点カテゴリについて極性の推定
 ピザは美味しいが価格は高い + カテゴリ: (FOOD#QUALITY、FOOD#PRICE) =>極性:
(FOOD#QUALITY =〇、 FOOD#PRICE =×)
現在行われているアプローチ(1/6)
Copyright © 2017 TIS Inc. All rights reserved. 18
ベースラインモデル、また提出された研究については後述するが、大まか
には以下のような傾向がある。
 Slot1
 単語分散表現を利用することで一定の精度はでる。近いドメインの
コーパスで学習した分散表現だとなおよい
 ニューラル系のモデルではそんなに深い層は使ってない(データが
少ないので過学習する)
 係り受け関係も一定の効果がある
 頻度が少ないカテゴリは切り捨てるのもあり
 Slot2
 CRFがベースで、カテゴリを区別しなくても一定の検出が可能とみ
える(カテゴリごとは、数が少なくそもそも難しい)
 Slot3
 Slot1と同等のアプローチで可能
現在行われているアプローチ(2/6)
Copyright © 2017 TIS Inc. All rights reserved. 19
SemEval 2016でベースラインとして使用されている実装は以下。
シンプルな単語特徴を使用したモデル。
現在行われているアプローチ(3/6)
モデル スコア
Slot1
観点カテゴリの推定
stop wordを除いた1000の上位語を特徴量
としたSVM(One vs All: 一文に複数カテゴ
リがつくため)
ラベルの確率が0.2を超えるものは付与する
F1(micro)
59.928
Slot2
各観点カテゴリのエンティ
ティ抽出
学習データ中にある{"カテゴリ": "エンティ
ティ表現"}のペアを辞書として持っておき、
順番に当てていく
F1(micro)
44.071
Slot3
各観点カテゴリの推定
stop wordを除いた1000の上位語+観点カ
テゴリのインデックスを特徴量としたSVM
accuracy
76.484
Copyright © 2017 TIS Inc. All rights reserved. 20
タスクで提出された研究のアプローチは以下(スコアが良かったもの)。
NLANGP at SemEval-2016 Task 5: Improving Aspect Based
Sentiment Analysis using Neural Network Features
 Slot1
 n-gram、学習データ中のエンティティ表現、係り受け関係にある
単語(HEAD)、単語分散表現、K-meansクラスタなどを特徴使用。
 これらの特徴+これらの特徴の一部使ってCNNで畳み込んで予測し
た結果を一層のニューラルネットに入れて学習
 CNNだけでも精度は高いが、併用するとさらに上がるらしい。
 Slot2
 CRFにRNNの出力を加えて予測。表現だけ予測すればいいので、ど
のAspectのTargetかを区別せず学習。
現在行われているアプローチ(4/6)
Copyright © 2017 TIS Inc. All rights reserved. 21
NileTMRG at SemEval-2016 Task 5: Deep Convolutional Neural
Networks for Aspect Category and Sentiment Extraction
 Slot1
 単語の分散表現(YelpやAmazonレビューなどのセンチメント系の
データセットでも学習したもの)を、CNNで畳み込む。
 Slot3
 同じくCNNをベースにした3つのモデルのアンサンブルで予測する。
AUEB-ABSA at SemEval-2016 Task 5: Ensembles of Classifiers and
Embeddings for Aspect Based Sentiment Analysis
 Slot1/2/3すべてを扱っている。Slot1はSVM、Slot2はCRF、Slot3は
特徴量/単語分散表現をベースにした線形回帰。いずれもアンサンブル
を行うことで精度を上げている。
 実装が公開されている
現在行われているアプローチ(5/6)
Copyright © 2017 TIS Inc. All rights reserved. 22
ECNU: Extracting Effective Features from Multiple Sequential
Sentences for Target-dependent Sentiment Analysis in
Reviews
 Aspectの推定(Slot1)に効く特徴を調べた研究。ドメイン固有の単語
(パソコンなら便利、速い、など)がやはり一番効いている。また、係り
受け関係などの文法的特徴が効いている。
Deep Learning for Aspect-Based Sentiment Analysis
 Slot1
 文中単語の単語分散表現を、2層のニューラルネット(Deepと
は・・・)で予測(深すぎると過学習するためあえて)。なお、予測ラ
ベルで頻度が低いものはOTHERとしてまとめてしまっている。
 Slot3
 CNNを使用。Aspectの分類確率(Slot1の出力)でもって単語ベクト
ルを重みづけしたうえで入力している(これにより、Aspectに関連
する語が重要視されてSentimentが判定される)
現在行われているアプローチ(6/6)
今後のアプローチ方法
Copyright © 2017 TIS Inc. All rights reserved. 24
レストランの評価にはレストランの、ホテルの評価にはホテルの観点単位
のデータが必要、となると評価対象が増えるごとにデータを毎回作らない
といけない。これは厳しい。
 半教師あり学習
 転移学習
こうした技術を活用していく必要がある。
現在までの研究で、最も転移性が期待できるのはSlot2(観点表現の抽出)
の箇所。SemEval 2016でトップの成績を出している手法は、いずれも抽
出にあたり観点カテゴリの指定を行っていない(カテゴリを区別しない)。
そのため観点特定を起点にする手法もあるが、1-shotや事前学習済みモデ
ルで分類をブーストする方法もありうる。
基本方針
Copyright © 2017 TIS Inc. All rights reserved. 25
観点表現の認識を起点にした手法
Pre-trained
Aspect term
Detector
Aspect Category
Classifier
Polality
Classifier
ピザは美味しかった。
ピザは美味しかった。
FOOD#QUALITY
POSITIVE
ただ、弱点として明確な表現がない場合に対応できない(主語/目的語が省
略されているパターン、比喩表現など)。
Copyright © 2017 TIS Inc. All rights reserved. 26
1-shot文分類を利用する手法
Aspect Category
Classifier
Target
Extraction
Polality
Classifier
ピザは美味しかった/パスタはうまい・・・
POSITIVE
あれは僕の舌をうならせた
1/few shot train
Trained Aspect
Category
Classifier
FOOD#QUALITY
NULL
特定できなくて
も問題ない
Copyright © 2017 TIS Inc. All rights reserved. 27
観点表現の特定と分類を併用するパターン
Pre-trained
Aspect term
Detector
Aspect Category
Classifier
Polality
Classifier
ピザは美味しかった。
ピザは美味しかった。
FOOD#QUALITY
POSITIVE
1shot/Pretrainedモ
デルを使うことで
ブースト
Merge
観点表現の特定と分
類は、シリアルに行
う必要は別段ない。
Copyright © 2017 TIS Inc. All rights reserved. 28
観点別の感情解析か・・・面白そうだけど、
どうせ日本語のデータセットはないんだろうな
Try Aspect Based Sentiment Analysis!(1/2)
Copyright © 2017 TIS Inc. All rights reserved. 29
Try Aspect Based Sentiment Analysis!(2/2)
有価証券報告書(2016年度)をベースにアノテーションした
データを無償で公開しています(GitHub/Kaggleで公開)。
今すぐアクセス!
THANK YOU

More Related Content

What's hot

SSII2021 [TS3] 機械学習のアノテーションにおける データ収集​ 〜 精度向上のための仕組み・倫理や社会性バイアス 〜
SSII2021 [TS3] 機械学習のアノテーションにおける データ収集​ 〜 精度向上のための仕組み・倫理や社会性バイアス 〜SSII2021 [TS3] 機械学習のアノテーションにおける データ収集​ 〜 精度向上のための仕組み・倫理や社会性バイアス 〜
SSII2021 [TS3] 機械学習のアノテーションにおける データ収集​ 〜 精度向上のための仕組み・倫理や社会性バイアス 〜SSII
 
先端技術とメディア表現1 #FTMA15
先端技術とメディア表現1 #FTMA15先端技術とメディア表現1 #FTMA15
先端技術とメディア表現1 #FTMA15Yoichi Ochiai
 
Attentionの基礎からTransformerの入門まで
Attentionの基礎からTransformerの入門までAttentionの基礎からTransformerの入門まで
Attentionの基礎からTransformerの入門までAGIRobots
 
SSII2021 [SS1] Transformer x Computer Visionの 実活用可能性と展望 〜 TransformerのCompute...
SSII2021 [SS1] Transformer x Computer Visionの 実活用可能性と展望 〜 TransformerのCompute...SSII2021 [SS1] Transformer x Computer Visionの 実活用可能性と展望 〜 TransformerのCompute...
SSII2021 [SS1] Transformer x Computer Visionの 実活用可能性と展望 〜 TransformerのCompute...SSII
 
全力解説!Transformer
全力解説!Transformer全力解説!Transformer
全力解説!TransformerArithmer Inc.
 
モデルアーキテクチャ観点からの高速化2019
モデルアーキテクチャ観点からの高速化2019モデルアーキテクチャ観点からの高速化2019
モデルアーキテクチャ観点からの高速化2019Yusuke Uchida
 
画像キャプションの自動生成
画像キャプションの自動生成画像キャプションの自動生成
画像キャプションの自動生成Yoshitaka Ushiku
 
トピックモデルの評価指標 Perplexity とは何なのか?
トピックモデルの評価指標 Perplexity とは何なのか?トピックモデルの評価指標 Perplexity とは何なのか?
トピックモデルの評価指標 Perplexity とは何なのか?hoxo_m
 
Word Tour: One-dimensional Word Embeddings via the Traveling Salesman Problem...
Word Tour: One-dimensional Word Embeddings via the Traveling Salesman Problem...Word Tour: One-dimensional Word Embeddings via the Traveling Salesman Problem...
Word Tour: One-dimensional Word Embeddings via the Traveling Salesman Problem...joisino
 
ベイジアンネットとレコメンデーション -第5回データマイニング+WEB勉強会@東京
ベイジアンネットとレコメンデーション -第5回データマイニング+WEB勉強会@東京ベイジアンネットとレコメンデーション -第5回データマイニング+WEB勉強会@東京
ベイジアンネットとレコメンデーション -第5回データマイニング+WEB勉強会@東京Koichi Hamada
 
[DL輪読会]Grokking: Generalization Beyond Overfitting on Small Algorithmic Datasets
[DL輪読会]Grokking: Generalization Beyond Overfitting on Small Algorithmic Datasets[DL輪読会]Grokking: Generalization Beyond Overfitting on Small Algorithmic Datasets
[DL輪読会]Grokking: Generalization Beyond Overfitting on Small Algorithmic DatasetsDeep Learning JP
 
Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料
Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料
Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料Yusuke Uchida
 
協調フィルタリングを利用した推薦システム構築
協調フィルタリングを利用した推薦システム構築協調フィルタリングを利用した推薦システム構築
協調フィルタリングを利用した推薦システム構築Masayuki Ota
 
【メタサーベイ】Video Transformer
 【メタサーベイ】Video Transformer 【メタサーベイ】Video Transformer
【メタサーベイ】Video Transformercvpaper. challenge
 
Deep Learning による視覚×言語融合の最前線
Deep Learning による視覚×言語融合の最前線Deep Learning による視覚×言語融合の最前線
Deep Learning による視覚×言語融合の最前線Yoshitaka Ushiku
 
Transformerを多層にする際の勾配消失問題と解決法について
Transformerを多層にする際の勾配消失問題と解決法についてTransformerを多層にする際の勾配消失問題と解決法について
Transformerを多層にする際の勾配消失問題と解決法についてSho Takase
 
【論文読み会】Autoregressive Diffusion Models.pptx
【論文読み会】Autoregressive Diffusion Models.pptx【論文読み会】Autoregressive Diffusion Models.pptx
【論文読み会】Autoregressive Diffusion Models.pptxARISE analytics
 

What's hot (20)

SSII2021 [TS3] 機械学習のアノテーションにおける データ収集​ 〜 精度向上のための仕組み・倫理や社会性バイアス 〜
SSII2021 [TS3] 機械学習のアノテーションにおける データ収集​ 〜 精度向上のための仕組み・倫理や社会性バイアス 〜SSII2021 [TS3] 機械学習のアノテーションにおける データ収集​ 〜 精度向上のための仕組み・倫理や社会性バイアス 〜
SSII2021 [TS3] 機械学習のアノテーションにおける データ収集​ 〜 精度向上のための仕組み・倫理や社会性バイアス 〜
 
先端技術とメディア表現1 #FTMA15
先端技術とメディア表現1 #FTMA15先端技術とメディア表現1 #FTMA15
先端技術とメディア表現1 #FTMA15
 
Attentionの基礎からTransformerの入門まで
Attentionの基礎からTransformerの入門までAttentionの基礎からTransformerの入門まで
Attentionの基礎からTransformerの入門まで
 
分散表現を用いたリアルタイム学習型セッションベース推薦システム
分散表現を用いたリアルタイム学習型セッションベース推薦システム分散表現を用いたリアルタイム学習型セッションベース推薦システム
分散表現を用いたリアルタイム学習型セッションベース推薦システム
 
SSII2021 [SS1] Transformer x Computer Visionの 実活用可能性と展望 〜 TransformerのCompute...
SSII2021 [SS1] Transformer x Computer Visionの 実活用可能性と展望 〜 TransformerのCompute...SSII2021 [SS1] Transformer x Computer Visionの 実活用可能性と展望 〜 TransformerのCompute...
SSII2021 [SS1] Transformer x Computer Visionの 実活用可能性と展望 〜 TransformerのCompute...
 
全力解説!Transformer
全力解説!Transformer全力解説!Transformer
全力解説!Transformer
 
モデルアーキテクチャ観点からの高速化2019
モデルアーキテクチャ観点からの高速化2019モデルアーキテクチャ観点からの高速化2019
モデルアーキテクチャ観点からの高速化2019
 
Point net
Point netPoint net
Point net
 
画像キャプションの自動生成
画像キャプションの自動生成画像キャプションの自動生成
画像キャプションの自動生成
 
トピックモデルの評価指標 Perplexity とは何なのか?
トピックモデルの評価指標 Perplexity とは何なのか?トピックモデルの評価指標 Perplexity とは何なのか?
トピックモデルの評価指標 Perplexity とは何なのか?
 
Word Tour: One-dimensional Word Embeddings via the Traveling Salesman Problem...
Word Tour: One-dimensional Word Embeddings via the Traveling Salesman Problem...Word Tour: One-dimensional Word Embeddings via the Traveling Salesman Problem...
Word Tour: One-dimensional Word Embeddings via the Traveling Salesman Problem...
 
ベイジアンネットとレコメンデーション -第5回データマイニング+WEB勉強会@東京
ベイジアンネットとレコメンデーション -第5回データマイニング+WEB勉強会@東京ベイジアンネットとレコメンデーション -第5回データマイニング+WEB勉強会@東京
ベイジアンネットとレコメンデーション -第5回データマイニング+WEB勉強会@東京
 
[DL輪読会]Grokking: Generalization Beyond Overfitting on Small Algorithmic Datasets
[DL輪読会]Grokking: Generalization Beyond Overfitting on Small Algorithmic Datasets[DL輪読会]Grokking: Generalization Beyond Overfitting on Small Algorithmic Datasets
[DL輪読会]Grokking: Generalization Beyond Overfitting on Small Algorithmic Datasets
 
Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料
Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料
Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料
 
協調フィルタリングを利用した推薦システム構築
協調フィルタリングを利用した推薦システム構築協調フィルタリングを利用した推薦システム構築
協調フィルタリングを利用した推薦システム構築
 
【メタサーベイ】Video Transformer
 【メタサーベイ】Video Transformer 【メタサーベイ】Video Transformer
【メタサーベイ】Video Transformer
 
MICの解説
MICの解説MICの解説
MICの解説
 
Deep Learning による視覚×言語融合の最前線
Deep Learning による視覚×言語融合の最前線Deep Learning による視覚×言語融合の最前線
Deep Learning による視覚×言語融合の最前線
 
Transformerを多層にする際の勾配消失問題と解決法について
Transformerを多層にする際の勾配消失問題と解決法についてTransformerを多層にする際の勾配消失問題と解決法について
Transformerを多層にする際の勾配消失問題と解決法について
 
【論文読み会】Autoregressive Diffusion Models.pptx
【論文読み会】Autoregressive Diffusion Models.pptx【論文読み会】Autoregressive Diffusion Models.pptx
【論文読み会】Autoregressive Diffusion Models.pptx
 

Similar to 感情の出どころを探る、一歩進んだ感情解析

文章を読み、理解する機能の獲得に向けて-Machine Comprehensionの研究動向-
文章を読み、理解する機能の獲得に向けて-Machine Comprehensionの研究動向-文章を読み、理解する機能の獲得に向けて-Machine Comprehensionの研究動向-
文章を読み、理解する機能の獲得に向けて-Machine Comprehensionの研究動向-Takahiro Kubo
 
バニラで使うTFS
バニラで使うTFSバニラで使うTFS
バニラで使うTFSyasuohosotani
 
JaSST2017_大規模業務システムにおける再利用可能なテスト自動化の取り組み
JaSST2017_大規模業務システムにおける再利用可能なテスト自動化の取り組みJaSST2017_大規模業務システムにおける再利用可能なテスト自動化の取り組み
JaSST2017_大規模業務システムにおける再利用可能なテスト自動化の取り組みHideki Sugimoto
 
DevOpsにおけるAnsibleの立ち位置と使い所
DevOpsにおけるAnsibleの立ち位置と使い所DevOpsにおけるAnsibleの立ち位置と使い所
DevOpsにおけるAnsibleの立ち位置と使い所Hidetoshi Hirokawa
 
20170525 jsug バッチは地味だが役に立つ
20170525 jsug バッチは地味だが役に立つ20170525 jsug バッチは地味だが役に立つ
20170525 jsug バッチは地味だが役に立つYuichi Hasegawa
 
ソフトウェア開発の現場風景
ソフトウェア開発の現場風景ソフトウェア開発の現場風景
ソフトウェア開発の現場風景Koichi ITO
 
文章生成の高速化とチーム開発でのTensor board活用事例
文章生成の高速化とチーム開発でのTensor board活用事例文章生成の高速化とチーム開発でのTensor board活用事例
文章生成の高速化とチーム開発でのTensor board活用事例Atsushi Hara
 
バッチは地味だが役に立つ
バッチは地味だが役に立つバッチは地味だが役に立つ
バッチは地味だが役に立つapkiban
 
【XDev】A-2 アジリティ向上のためのツール活用
【XDev】A-2 アジリティ向上のためのツール活用【XDev】A-2 アジリティ向上のためのツール活用
【XDev】A-2 アジリティ向上のためのツール活用智治 長沢
 
提案に役に立つ情報 (teianlab 勉強会)
提案に役に立つ情報 (teianlab 勉強会)提案に役に立つ情報 (teianlab 勉強会)
提案に役に立つ情報 (teianlab 勉強会)MKT International Inc.
 
Developer Summit Summer 2013 C1セッション CA Technologies
Developer Summit Summer 2013 C1セッション CA TechnologiesDeveloper Summit Summer 2013 C1セッション CA Technologies
Developer Summit Summer 2013 C1セッション CA TechnologiesSA CA
 
ニューノーマルな働き方!?Teams投稿をセンチメント分析!
ニューノーマルな働き方!?Teams投稿をセンチメント分析!ニューノーマルな働き方!?Teams投稿をセンチメント分析!
ニューノーマルな働き方!?Teams投稿をセンチメント分析!Tsukasa Kato
 
今、おさえておきたい DevOps
今、おさえておきたい DevOps 今、おさえておきたい DevOps
今、おさえておきたい DevOps 智治 長沢
 
2025新卒向け_システムコンサルティング本部の紹介.pptx
2025新卒向け_システムコンサルティング本部の紹介.pptx2025新卒向け_システムコンサルティング本部の紹介.pptx
2025新卒向け_システムコンサルティング本部の紹介.pptxCybozu, Inc.
 
チーム×ツール Team Foundation Server & Service 共感しActionできる開発基盤 アルティメイタム【デブサミ 2013 ...
チーム×ツール Team Foundation Server & Service 共感しActionできる開発基盤 アルティメイタム【デブサミ 2013 ...チーム×ツール Team Foundation Server & Service 共感しActionできる開発基盤 アルティメイタム【デブサミ 2013 ...
チーム×ツール Team Foundation Server & Service 共感しActionできる開発基盤 アルティメイタム【デブサミ 2013 ...智治 長沢
 
【17-E-4】 未来はどこにいても誰にでも平等にある。 未来を創るのは自分自身だ。 ~SIerの中で生きるということ~
【17-E-4】 未来はどこにいても誰にでも平等にある。 未来を創るのは自分自身だ。 ~SIerの中で生きるということ~【17-E-4】 未来はどこにいても誰にでも平等にある。 未来を創るのは自分自身だ。 ~SIerの中で生きるということ~
【17-E-4】 未来はどこにいても誰にでも平等にある。 未来を創るのは自分自身だ。 ~SIerの中で生きるということ~Yoshitaka Kawashima
 
XP祭り関西2011 森崎 修司「プラクティスが有効にはたらく前提は明らかになっていますか?」
XP祭り関西2011 森崎 修司「プラクティスが有効にはたらく前提は明らかになっていますか?」XP祭り関西2011 森崎 修司「プラクティスが有効にはたらく前提は明らかになっていますか?」
XP祭り関西2011 森崎 修司「プラクティスが有効にはたらく前提は明らかになっていますか?」Shuji Morisaki
 

Similar to 感情の出どころを探る、一歩進んだ感情解析 (20)

文章を読み、理解する機能の獲得に向けて-Machine Comprehensionの研究動向-
文章を読み、理解する機能の獲得に向けて-Machine Comprehensionの研究動向-文章を読み、理解する機能の獲得に向けて-Machine Comprehensionの研究動向-
文章を読み、理解する機能の獲得に向けて-Machine Comprehensionの研究動向-
 
バニラで使うTFS
バニラで使うTFSバニラで使うTFS
バニラで使うTFS
 
JaSST2017_大規模業務システムにおける再利用可能なテスト自動化の取り組み
JaSST2017_大規模業務システムにおける再利用可能なテスト自動化の取り組みJaSST2017_大規模業務システムにおける再利用可能なテスト自動化の取り組み
JaSST2017_大規模業務システムにおける再利用可能なテスト自動化の取り組み
 
DevOpsにおけるAnsibleの立ち位置と使い所
DevOpsにおけるAnsibleの立ち位置と使い所DevOpsにおけるAnsibleの立ち位置と使い所
DevOpsにおけるAnsibleの立ち位置と使い所
 
Cvpr2017事前読み会
Cvpr2017事前読み会Cvpr2017事前読み会
Cvpr2017事前読み会
 
開発とテストが一体となったソフトウェア開発
開発とテストが一体となったソフトウェア開発開発とテストが一体となったソフトウェア開発
開発とテストが一体となったソフトウェア開発
 
20170525 jsug バッチは地味だが役に立つ
20170525 jsug バッチは地味だが役に立つ20170525 jsug バッチは地味だが役に立つ
20170525 jsug バッチは地味だが役に立つ
 
ソフトウェア開発の現場風景
ソフトウェア開発の現場風景ソフトウェア開発の現場風景
ソフトウェア開発の現場風景
 
文章生成の高速化とチーム開発でのTensor board活用事例
文章生成の高速化とチーム開発でのTensor board活用事例文章生成の高速化とチーム開発でのTensor board活用事例
文章生成の高速化とチーム開発でのTensor board活用事例
 
バッチは地味だが役に立つ
バッチは地味だが役に立つバッチは地味だが役に立つ
バッチは地味だが役に立つ
 
【XDev】A-2 アジリティ向上のためのツール活用
【XDev】A-2 アジリティ向上のためのツール活用【XDev】A-2 アジリティ向上のためのツール活用
【XDev】A-2 アジリティ向上のためのツール活用
 
提案に役に立つ情報 (teianlab 勉強会)
提案に役に立つ情報 (teianlab 勉強会)提案に役に立つ情報 (teianlab 勉強会)
提案に役に立つ情報 (teianlab 勉強会)
 
Developer Summit Summer 2013 C1セッション CA Technologies
Developer Summit Summer 2013 C1セッション CA TechnologiesDeveloper Summit Summer 2013 C1セッション CA Technologies
Developer Summit Summer 2013 C1セッション CA Technologies
 
ニューノーマルな働き方!?Teams投稿をセンチメント分析!
ニューノーマルな働き方!?Teams投稿をセンチメント分析!ニューノーマルな働き方!?Teams投稿をセンチメント分析!
ニューノーマルな働き方!?Teams投稿をセンチメント分析!
 
今、おさえておきたい DevOps
今、おさえておきたい DevOps 今、おさえておきたい DevOps
今、おさえておきたい DevOps
 
Deep learning を用いた画像から説明文の自動生成に関する研究の紹介
Deep learning を用いた画像から説明文の自動生成に関する研究の紹介Deep learning を用いた画像から説明文の自動生成に関する研究の紹介
Deep learning を用いた画像から説明文の自動生成に関する研究の紹介
 
2025新卒向け_システムコンサルティング本部の紹介.pptx
2025新卒向け_システムコンサルティング本部の紹介.pptx2025新卒向け_システムコンサルティング本部の紹介.pptx
2025新卒向け_システムコンサルティング本部の紹介.pptx
 
チーム×ツール Team Foundation Server & Service 共感しActionできる開発基盤 アルティメイタム【デブサミ 2013 ...
チーム×ツール Team Foundation Server & Service 共感しActionできる開発基盤 アルティメイタム【デブサミ 2013 ...チーム×ツール Team Foundation Server & Service 共感しActionできる開発基盤 アルティメイタム【デブサミ 2013 ...
チーム×ツール Team Foundation Server & Service 共感しActionできる開発基盤 アルティメイタム【デブサミ 2013 ...
 
【17-E-4】 未来はどこにいても誰にでも平等にある。 未来を創るのは自分自身だ。 ~SIerの中で生きるということ~
【17-E-4】 未来はどこにいても誰にでも平等にある。 未来を創るのは自分自身だ。 ~SIerの中で生きるということ~【17-E-4】 未来はどこにいても誰にでも平等にある。 未来を創るのは自分自身だ。 ~SIerの中で生きるということ~
【17-E-4】 未来はどこにいても誰にでも平等にある。 未来を創るのは自分自身だ。 ~SIerの中で生きるということ~
 
XP祭り関西2011 森崎 修司「プラクティスが有効にはたらく前提は明らかになっていますか?」
XP祭り関西2011 森崎 修司「プラクティスが有効にはたらく前提は明らかになっていますか?」XP祭り関西2011 森崎 修司「プラクティスが有効にはたらく前提は明らかになっていますか?」
XP祭り関西2011 森崎 修司「プラクティスが有効にはたらく前提は明らかになっていますか?」
 

More from Takahiro Kubo

自然言語処理による企業の気候変動対策分析
自然言語処理による企業の気候変動対策分析自然言語処理による企業の気候変動対策分析
自然言語処理による企業の気候変動対策分析Takahiro Kubo
 
国際会計基準(IFRS)適用企業の財務評価方法
国際会計基準(IFRS)適用企業の財務評価方法国際会計基準(IFRS)適用企業の財務評価方法
国際会計基準(IFRS)適用企業の財務評価方法Takahiro Kubo
 
自然言語処理で新型コロナウィルスに立ち向かう
自然言語処理で新型コロナウィルスに立ち向かう自然言語処理で新型コロナウィルスに立ち向かう
自然言語処理で新型コロナウィルスに立ち向かうTakahiro Kubo
 
財務・非財務一体型の企業分析に向けて
財務・非財務一体型の企業分析に向けて財務・非財務一体型の企業分析に向けて
財務・非財務一体型の企業分析に向けてTakahiro Kubo
 
自然言語処理で読み解く金融文書
自然言語処理で読み解く金融文書自然言語処理で読み解く金融文書
自然言語処理で読み解く金融文書Takahiro Kubo
 
arXivTimes Review: 2019年前半で印象に残った論文を振り返る
arXivTimes Review: 2019年前半で印象に残った論文を振り返るarXivTimes Review: 2019年前半で印象に残った論文を振り返る
arXivTimes Review: 2019年前半で印象に残った論文を振り返るTakahiro Kubo
 
ESG評価を支える自然言語処理基盤の構築
ESG評価を支える自然言語処理基盤の構築ESG評価を支える自然言語処理基盤の構築
ESG評価を支える自然言語処理基盤の構築Takahiro Kubo
 
Expressing Visual Relationships via Language: 自然言語による画像編集を目指して
Expressing Visual Relationships via Language: 自然言語による画像編集を目指してExpressing Visual Relationships via Language: 自然言語による画像編集を目指して
Expressing Visual Relationships via Language: 自然言語による画像編集を目指してTakahiro Kubo
 
Reinforcement Learning Inside Business
Reinforcement Learning Inside BusinessReinforcement Learning Inside Business
Reinforcement Learning Inside BusinessTakahiro Kubo
 
あるべきESG投資の評価に向けた、自然言語処理の活用
あるべきESG投資の評価に向けた、自然言語処理の活用あるべきESG投資の評価に向けた、自然言語処理の活用
あるべきESG投資の評価に向けた、自然言語処理の活用Takahiro Kubo
 
nlpaper.challenge NLP/CV交流勉強会 画像認識 7章
nlpaper.challenge NLP/CV交流勉強会 画像認識 7章nlpaper.challenge NLP/CV交流勉強会 画像認識 7章
nlpaper.challenge NLP/CV交流勉強会 画像認識 7章Takahiro Kubo
 
Curiosity may drives your output routine.
Curiosity may drives  your output routine.Curiosity may drives  your output routine.
Curiosity may drives your output routine.Takahiro Kubo
 
モデルではなく、データセットを蒸留する
モデルではなく、データセットを蒸留するモデルではなく、データセットを蒸留する
モデルではなく、データセットを蒸留するTakahiro Kubo
 
2018年12月4日までに『呪術廻戦』を読む理由
2018年12月4日までに『呪術廻戦』を読む理由2018年12月4日までに『呪術廻戦』を読む理由
2018年12月4日までに『呪術廻戦』を読む理由Takahiro Kubo
 
Graph Attention Network
Graph Attention NetworkGraph Attention Network
Graph Attention NetworkTakahiro Kubo
 
ACL2018の歩き方
 ACL2018の歩き方 ACL2018の歩き方
ACL2018の歩き方Takahiro Kubo
 
機械学習で泣かないためのコード設計 2018
機械学習で泣かないためのコード設計 2018機械学習で泣かないためのコード設計 2018
機械学習で泣かないためのコード設計 2018Takahiro Kubo
 
TISにおける、研究開発の方針とメソッド 2018
TISにおける、研究開発の方針とメソッド 2018TISにおける、研究開発の方針とメソッド 2018
TISにおける、研究開発の方針とメソッド 2018Takahiro Kubo
 
機械学習の力を引き出すための依存性管理
機械学習の力を引き出すための依存性管理機械学習の力を引き出すための依存性管理
機械学習の力を引き出すための依存性管理Takahiro Kubo
 

More from Takahiro Kubo (20)

自然言語処理による企業の気候変動対策分析
自然言語処理による企業の気候変動対策分析自然言語処理による企業の気候変動対策分析
自然言語処理による企業の気候変動対策分析
 
国際会計基準(IFRS)適用企業の財務評価方法
国際会計基準(IFRS)適用企業の財務評価方法国際会計基準(IFRS)適用企業の財務評価方法
国際会計基準(IFRS)適用企業の財務評価方法
 
自然言語処理で新型コロナウィルスに立ち向かう
自然言語処理で新型コロナウィルスに立ち向かう自然言語処理で新型コロナウィルスに立ち向かう
自然言語処理で新型コロナウィルスに立ち向かう
 
財務・非財務一体型の企業分析に向けて
財務・非財務一体型の企業分析に向けて財務・非財務一体型の企業分析に向けて
財務・非財務一体型の企業分析に向けて
 
自然言語処理で読み解く金融文書
自然言語処理で読み解く金融文書自然言語処理で読み解く金融文書
自然言語処理で読み解く金融文書
 
arXivTimes Review: 2019年前半で印象に残った論文を振り返る
arXivTimes Review: 2019年前半で印象に残った論文を振り返るarXivTimes Review: 2019年前半で印象に残った論文を振り返る
arXivTimes Review: 2019年前半で印象に残った論文を振り返る
 
ESG評価を支える自然言語処理基盤の構築
ESG評価を支える自然言語処理基盤の構築ESG評価を支える自然言語処理基盤の構築
ESG評価を支える自然言語処理基盤の構築
 
Expressing Visual Relationships via Language: 自然言語による画像編集を目指して
Expressing Visual Relationships via Language: 自然言語による画像編集を目指してExpressing Visual Relationships via Language: 自然言語による画像編集を目指して
Expressing Visual Relationships via Language: 自然言語による画像編集を目指して
 
Reinforcement Learning Inside Business
Reinforcement Learning Inside BusinessReinforcement Learning Inside Business
Reinforcement Learning Inside Business
 
あるべきESG投資の評価に向けた、自然言語処理の活用
あるべきESG投資の評価に向けた、自然言語処理の活用あるべきESG投資の評価に向けた、自然言語処理の活用
あるべきESG投資の評価に向けた、自然言語処理の活用
 
nlpaper.challenge NLP/CV交流勉強会 画像認識 7章
nlpaper.challenge NLP/CV交流勉強会 画像認識 7章nlpaper.challenge NLP/CV交流勉強会 画像認識 7章
nlpaper.challenge NLP/CV交流勉強会 画像認識 7章
 
Curiosity may drives your output routine.
Curiosity may drives  your output routine.Curiosity may drives  your output routine.
Curiosity may drives your output routine.
 
モデルではなく、データセットを蒸留する
モデルではなく、データセットを蒸留するモデルではなく、データセットを蒸留する
モデルではなく、データセットを蒸留する
 
EMNLP2018 Overview
EMNLP2018 OverviewEMNLP2018 Overview
EMNLP2018 Overview
 
2018年12月4日までに『呪術廻戦』を読む理由
2018年12月4日までに『呪術廻戦』を読む理由2018年12月4日までに『呪術廻戦』を読む理由
2018年12月4日までに『呪術廻戦』を読む理由
 
Graph Attention Network
Graph Attention NetworkGraph Attention Network
Graph Attention Network
 
ACL2018の歩き方
 ACL2018の歩き方 ACL2018の歩き方
ACL2018の歩き方
 
機械学習で泣かないためのコード設計 2018
機械学習で泣かないためのコード設計 2018機械学習で泣かないためのコード設計 2018
機械学習で泣かないためのコード設計 2018
 
TISにおける、研究開発の方針とメソッド 2018
TISにおける、研究開発の方針とメソッド 2018TISにおける、研究開発の方針とメソッド 2018
TISにおける、研究開発の方針とメソッド 2018
 
機械学習の力を引き出すための依存性管理
機械学習の力を引き出すための依存性管理機械学習の力を引き出すための依存性管理
機械学習の力を引き出すための依存性管理
 

感情の出どころを探る、一歩進んだ感情解析

  • 1. Copyright © 2017 TIS Inc. All rights reserved. 感情の出どころを探る、一歩進んだ感情解析 戦略技術センター 久保隆宏 Introduction for Aspect Based Sentiment Analysis
  • 2. Copyright © 2017 TIS Inc. All rights reserved. 2  観点感情解析(Aspect Based Sentiment Analysis)とは  既存の感情解析の問題点  観点感情解析のはじまり  観点感情解析のタスク  タスクの定義  現在行われているアプローチ  今後のアプローチ  基本方針  観点表現の認識を起点にした手法  1-shot文分類を利用する手法  観点表現の特定と分類を併用するパターン  Try Aspect Based Sentiment Analysis! 目次
  • 3. Copyright © 2017 TIS Inc. All rights reserved. 3 久保隆宏 TIS株式会社 戦略技術センター  化学系メーカーの業務コンサルタント出身  既存の技術では業務改善を行える範囲に限界があるとの実感から、戦 略技術センターへと異動  現在は機械学習や自然言語処理の研究・それらを用いたシステムのプ ロトタイピングを行う 自己紹介 kintoneアプリ内にたまった データを簡単に学習・活用 (@Cybozu Days 2016) チュートリアル講演:深層学習 の判断根拠を理解するための研 究とその意義(@PRMU 2017) 機械学習をシステムに組み込む 際の依存性管理について (@MANABIYA 2018)
  • 4. Copyright © 2017 TIS Inc. All rights reserved. 4 chakkiのミッション Summarize data for human あらゆるデータを、人間にとってわかりやすく要約 することを目指します。 chakkiが目指す機能:  要約の観点を、なるべく少ないデータで学習する  自然言語以外の、画像や数値データの要約も扱う  図や表といった表現形態にも挑戦する この機能の実現を通じ、最終的にはいつでもティー タイム(15:00)に帰れる(=茶帰)社会を目指します。 2018年度より具体化
  • 5. Copyright © 2017 TIS Inc. All rights reserved. 5 観点を指定した自然言語処理 観点単位にまとめることで、情報の欠落を 防ぐと共に図表化を行いやすくする。 モデルにお任せで「こんなん出ました」で なく、利用者が出力をコントロールする。 ex: 観点要約 ペンギンのサイズは小さくて、手触りは冷たい。  「サイズ」は「小さく」  「手触り」は「冷たい」 サイズ 手触り ペンギン 小さい 冷たい ライオン 大きい 温かい ウサギ 中くらい 温かい 業務要件により観点は異なる。そして、観点の学習データは少ない。 ⇒自然言語処理における転移学習に注力し、「少ないデータでカスタマ イズ可能な分類/生成器の作成」を目指している。 (2/3)
  • 6. Copyright © 2017 TIS Inc. All rights reserved. 6 (3/3)  研究開発活動は基本オープンに行っている(GitHub★総計 728)。  研究に関することであれば、個人のブログ/リポジトリも評価される。 機械学習関連の論文のまとめをGitHubのIssueを使って行っ ています。月一での輪講も開催中です。
  • 8. Copyright © 2017 TIS Inc. All rights reserved. 8 「何が」肯定的・否定的に評価されているのかわからない。 既存の感情解析の問題点(1/2) ここのピザは絶品だね!うちの家族はみんな大好き と言っているよ。 ただ、ここのビールはとても薄いね!ビールの水割 りと思うくらいさ。 店員さんもちょっとぶっきらぼうかな。割られた ビールの分、サービスしてほしいね! レビューや論評といった肯定・否定が混在するようなケースでは、単に各 文のポジティブ・ネガティブだけでなく、「何が」肯定的/否定的に評価 されているかを知りたい。 Positive Negative Negative
  • 9. Copyright © 2017 TIS Inc. All rights reserved. 9 以下のように、感情の対象が特定できるとよい。 既存の感情解析の問題点(2/2) ここのピザは絶品だね!うちの家族はみんな大好き と言っているよ。 ただ、ここのビールはとても薄いね!ビールの水割 りと思うくらいさ。 店員さんもちょっとぶっきらぼうかな。割られた ビールの分、サービスしてほしいね! Positive Negative Negative ただ、対象の種類は非常に多い(ピザ、マルゲリータ、etc...)。また、評 価軸も様々(味、サービス、値段、etc...)。 そのため、同じカテゴリに属するもの=同じ観点はまとめたい。
  • 10. Copyright © 2017 TIS Inc. All rights reserved. 10 ここのピザは絶品だね!うちの家族はみんな大好き と言っているよ。 ただ、ここのビールはとても薄いね!ビールの水割 りと思うくらいさ。 店員さんもちょっとぶっきらぼうかな。割られた ビールの分、サービスしてほしいね! (ドメインごとに)整理された観点に基づき、感情評価を分析する。 観点感情解析のはじまり 初期(2004~)は、feature-based opinion miningと呼ばれていた。 研究の歴史やアプローチについては、書籍Sentiment Analysis and Opinion Mining にて体系的にまとめられている。 ※この書籍はレビューなどから意見やその極性を抽出する方法について400件以上の文献をまとめている神書籍。 Positive Negative Negative FOODのQUALITY SERVICE DRINKのQUALITY
  • 12. Copyright © 2017 TIS Inc. All rights reserved. 12 観点単位の感情解析が、最初に意味解析のワークショップ(SemEval)で取 り上げられたのは2014年。そこから2016年まで3回連続で開催された。 (2017年以降は、TwitterなどのSNS上のメッセージの解析にとってかわられている) そこでのタスク、つまり「どう観点単位の感情解析を行うか?」について は年により若干の違いがある。ただ、最終的には以下の3タスクに落ち着 いている。  Slot1: 各文の観点カテゴリの推定  ピザは美味しいが価格は高い => カテゴリ: (FOOD#QUALITY、FOOD#PRICE)  Slot2: 各文の観点カテゴリのエンティティを抽出  ピザは美味しいが価格高い +カテゴリ: (FOOD#QUALITY、FOOD#PRICE) => エンティティ: (FOOD#QUALITY=ピザ、 FOOD#PRICE=価格)  Slot3: 各文の観点カテゴリについて極性の推定  ピザは美味しいが価格は高い + カテゴリ: (FOOD#QUALITY、FOOD#PRICE) =>極性: (FOOD#QUALITY =〇、 FOOD#PRICE =×) タスクの定義(1/5)
  • 13. Copyright © 2017 TIS Inc. All rights reserved. 13 SemEval 2014 Task4  SB1: 観点にかかわる表現の抽出  ピザは美味しいが価格は高い => 表現: (ピザ、価格)、極性: (ピザ=〇、価格=×)  SB2: 観点にかかわる表現について、その極性を推定  ピザは美味しいが価格は高い + 表現: (ピザ、価格) => 極性: (ピザ=〇、価格=×)  SB3: 各文が議論している観点のカテゴリの推定  ピザは美味しいが価格は高い => カテゴリ: (FOOD、PRICE)  SB4: 観点にかかわる表現について、その極性を推定  ピザは美味しいが価格は高い + カテゴリ: (FOOD、PRICE) => 極性: (FOOD=〇、PROCE=×) タスクの定義(2/5) ピザ 美味しい FOOD 観点表現を特定してから、その種別極性を判断する。
  • 14. Copyright © 2017 TIS Inc. All rights reserved. 14 SemEval 2015 Task12 タスクの定義(3/5) 観点の種別を特定してから、その表現・極性を判断する。 FOOD# QUALITY 美味しい ピザ  Slot1: 各文の観点カテゴリの推定  ピザは美味しいが価格は高い => カテゴリ: (FOOD#QUALITY、FOOD#PRICE)  Slot2: 各文の観点カテゴリのエンティティを抽出  ピザは美味しいが価格高い +カテゴリ: (FOOD#QUALITY、FOOD#PRICE) => エンティティ: (FOOD#QUALITY=ピザ、 FOOD#PRICE=価格)  Slot3: 各文の観点カテゴリについて極性の推定  ピザは美味しいが価格は高い + カテゴリ: (FOOD#QUALITY、FOOD#PRICE) =>極性: (FOOD#QUALITY =〇、 FOOD#PRICE =×)
  • 15. Copyright © 2017 TIS Inc. All rights reserved. 15 カテゴリは、エンティティ+属性で表現(FOOD#QUALITYなど)。明言さ れていなくてもわかる場合付与する。 例:「この神の舌を持つ僕をうならせる」という場合、明示的に「味」とは言っていないが明らかな ため、FOOD#QUALITYとなる。 また、各文を単独ではなく周辺テキストも含めて考慮する。 例:「ピザの味は本当にいいよ。すごくいい!」という時、二文目(すごくいい!)は単独では何がい いのかわからないが、一文目から推定可能なためFOOD#QUALITYとなる。 SemEval 2016 Task5 SemEval2015に加え、以下のサブタスクが追加された(SubTask1は2015 と同じ)。  Subtask2: テキストレベル(レビュー全体)におけるカテゴリの推定・カ テゴリごとの極性の推定  Subtask3: ドメイン外のテキストでの性能検証(転移性能)  ただ提出したチームはなかった? タスクの定義(4/5)
  • 16. Copyright © 2017 TIS Inc. All rights reserved. 16 SemEval2014~ SemEval2015,2016でタスクが変更された背景。 2014での傾向として「レビュー内で暗黙的に示唆される性質」の特定が 難しかったとしている(特にPCのドメインで。「僕のPCはずっとうなりを あげているよ」はPCの性能について話しているが、性能を示す明確な言葉 はない)。 そのため、2015では明示的な表現(Aspect Term)の特定でなく、全体と して「何を言っているのか」を先に推定する方(Aspect Categoryの推定 =Slot1)に舵を切っている。 ただ、その分少ないデータでエンティティ+属性という多めのカテゴリ (しかもマルチラベル)の問題を一番先に解く形態になってしまってはいる。 タスクの定義(5/5)
  • 17. Copyright © 2017 TIS Inc. All rights reserved. 17 SemEval 2016までで定義されたタスクをどうこなすかが一つの論点と なっている。一つの研究で3つ(Slot1~Slot3)すべてをやっているものはあ まりなく、どれか一つを選んで行っていることが多い。  Slot1: 各文の観点カテゴリの推定  ピザは美味しいが価格は高い => カテゴリ: (FOOD#QUALITY、FOOD#PRICE)  Slot2: 各文の観点カテゴリのエンティティを抽出  ピザは美味しいが価格高い +カテゴリ: (FOOD#QUALITY、FOOD#PRICE) => エンティティ: (FOOD#QUALITY=ピザ、 FOOD#PRICE=価格)  Slot3: 各文の観点カテゴリについて極性の推定  ピザは美味しいが価格は高い + カテゴリ: (FOOD#QUALITY、FOOD#PRICE) =>極性: (FOOD#QUALITY =〇、 FOOD#PRICE =×) 現在行われているアプローチ(1/6)
  • 18. Copyright © 2017 TIS Inc. All rights reserved. 18 ベースラインモデル、また提出された研究については後述するが、大まか には以下のような傾向がある。  Slot1  単語分散表現を利用することで一定の精度はでる。近いドメインの コーパスで学習した分散表現だとなおよい  ニューラル系のモデルではそんなに深い層は使ってない(データが 少ないので過学習する)  係り受け関係も一定の効果がある  頻度が少ないカテゴリは切り捨てるのもあり  Slot2  CRFがベースで、カテゴリを区別しなくても一定の検出が可能とみ える(カテゴリごとは、数が少なくそもそも難しい)  Slot3  Slot1と同等のアプローチで可能 現在行われているアプローチ(2/6)
  • 19. Copyright © 2017 TIS Inc. All rights reserved. 19 SemEval 2016でベースラインとして使用されている実装は以下。 シンプルな単語特徴を使用したモデル。 現在行われているアプローチ(3/6) モデル スコア Slot1 観点カテゴリの推定 stop wordを除いた1000の上位語を特徴量 としたSVM(One vs All: 一文に複数カテゴ リがつくため) ラベルの確率が0.2を超えるものは付与する F1(micro) 59.928 Slot2 各観点カテゴリのエンティ ティ抽出 学習データ中にある{"カテゴリ": "エンティ ティ表現"}のペアを辞書として持っておき、 順番に当てていく F1(micro) 44.071 Slot3 各観点カテゴリの推定 stop wordを除いた1000の上位語+観点カ テゴリのインデックスを特徴量としたSVM accuracy 76.484
  • 20. Copyright © 2017 TIS Inc. All rights reserved. 20 タスクで提出された研究のアプローチは以下(スコアが良かったもの)。 NLANGP at SemEval-2016 Task 5: Improving Aspect Based Sentiment Analysis using Neural Network Features  Slot1  n-gram、学習データ中のエンティティ表現、係り受け関係にある 単語(HEAD)、単語分散表現、K-meansクラスタなどを特徴使用。  これらの特徴+これらの特徴の一部使ってCNNで畳み込んで予測し た結果を一層のニューラルネットに入れて学習  CNNだけでも精度は高いが、併用するとさらに上がるらしい。  Slot2  CRFにRNNの出力を加えて予測。表現だけ予測すればいいので、ど のAspectのTargetかを区別せず学習。 現在行われているアプローチ(4/6)
  • 21. Copyright © 2017 TIS Inc. All rights reserved. 21 NileTMRG at SemEval-2016 Task 5: Deep Convolutional Neural Networks for Aspect Category and Sentiment Extraction  Slot1  単語の分散表現(YelpやAmazonレビューなどのセンチメント系の データセットでも学習したもの)を、CNNで畳み込む。  Slot3  同じくCNNをベースにした3つのモデルのアンサンブルで予測する。 AUEB-ABSA at SemEval-2016 Task 5: Ensembles of Classifiers and Embeddings for Aspect Based Sentiment Analysis  Slot1/2/3すべてを扱っている。Slot1はSVM、Slot2はCRF、Slot3は 特徴量/単語分散表現をベースにした線形回帰。いずれもアンサンブル を行うことで精度を上げている。  実装が公開されている 現在行われているアプローチ(5/6)
  • 22. Copyright © 2017 TIS Inc. All rights reserved. 22 ECNU: Extracting Effective Features from Multiple Sequential Sentences for Target-dependent Sentiment Analysis in Reviews  Aspectの推定(Slot1)に効く特徴を調べた研究。ドメイン固有の単語 (パソコンなら便利、速い、など)がやはり一番効いている。また、係り 受け関係などの文法的特徴が効いている。 Deep Learning for Aspect-Based Sentiment Analysis  Slot1  文中単語の単語分散表現を、2層のニューラルネット(Deepと は・・・)で予測(深すぎると過学習するためあえて)。なお、予測ラ ベルで頻度が低いものはOTHERとしてまとめてしまっている。  Slot3  CNNを使用。Aspectの分類確率(Slot1の出力)でもって単語ベクト ルを重みづけしたうえで入力している(これにより、Aspectに関連 する語が重要視されてSentimentが判定される) 現在行われているアプローチ(6/6)
  • 24. Copyright © 2017 TIS Inc. All rights reserved. 24 レストランの評価にはレストランの、ホテルの評価にはホテルの観点単位 のデータが必要、となると評価対象が増えるごとにデータを毎回作らない といけない。これは厳しい。  半教師あり学習  転移学習 こうした技術を活用していく必要がある。 現在までの研究で、最も転移性が期待できるのはSlot2(観点表現の抽出) の箇所。SemEval 2016でトップの成績を出している手法は、いずれも抽 出にあたり観点カテゴリの指定を行っていない(カテゴリを区別しない)。 そのため観点特定を起点にする手法もあるが、1-shotや事前学習済みモデ ルで分類をブーストする方法もありうる。 基本方針
  • 25. Copyright © 2017 TIS Inc. All rights reserved. 25 観点表現の認識を起点にした手法 Pre-trained Aspect term Detector Aspect Category Classifier Polality Classifier ピザは美味しかった。 ピザは美味しかった。 FOOD#QUALITY POSITIVE ただ、弱点として明確な表現がない場合に対応できない(主語/目的語が省 略されているパターン、比喩表現など)。
  • 26. Copyright © 2017 TIS Inc. All rights reserved. 26 1-shot文分類を利用する手法 Aspect Category Classifier Target Extraction Polality Classifier ピザは美味しかった/パスタはうまい・・・ POSITIVE あれは僕の舌をうならせた 1/few shot train Trained Aspect Category Classifier FOOD#QUALITY NULL 特定できなくて も問題ない
  • 27. Copyright © 2017 TIS Inc. All rights reserved. 27 観点表現の特定と分類を併用するパターン Pre-trained Aspect term Detector Aspect Category Classifier Polality Classifier ピザは美味しかった。 ピザは美味しかった。 FOOD#QUALITY POSITIVE 1shot/Pretrainedモ デルを使うことで ブースト Merge 観点表現の特定と分 類は、シリアルに行 う必要は別段ない。
  • 28. Copyright © 2017 TIS Inc. All rights reserved. 28 観点別の感情解析か・・・面白そうだけど、 どうせ日本語のデータセットはないんだろうな Try Aspect Based Sentiment Analysis!(1/2)
  • 29. Copyright © 2017 TIS Inc. All rights reserved. 29 Try Aspect Based Sentiment Analysis!(2/2) 有価証券報告書(2016年度)をベースにアノテーションした データを無償で公開しています(GitHub/Kaggleで公開)。 今すぐアクセス!