SlideShare a Scribd company logo
Copyright ©2019 by Future Corporation
フューチャー株式会社
ACL参加報告
⽔本 智也
2019年9月28日
第15回 テキストアナリティクス・シンポジウム
【宣伝】NLP技術セミナー開催します
• 2019/11/29 (⾦) 13:00-18:00
• 産業界の⽅々を対象にしたセミナー
– ⾃然⾔語処理ってどんなもの︖
– ⼈⼯知能や⾃然⾔語処理技術を導⼊するにはまず何から始めればいいの︖
– ⾃然⾔語処理に関する技術やツールを⼿っ取り早く学びたい
– 形態素解析が⾃然⾔語処理の基本って聞いたけど,それってどんなもの︖
– 形態素解析以外にどんな⾔語処理技術があるの︖
– ⾃然⾔語処理技術を応⽤したシステムやサービスにはどんなものがあるの︖
– 迅速に⾃然⾔語処理技術を導⼊するためには何に注意すればいいの︖
• 講師:
– 須藤克仁、⾦⼭博、徳久良⼦、⼭下達雄
• 詳細はWebページで
– https://sites.google.com/site/nlpseminarweb/home
Copyright ©2019 by Future Corporation - 2 -
ACL2019会議概要
ACL2019
• ⾃然⾔語処理の難関国際会議
• 57回⽬の開催
• 開催場所: イタリア、フィレンツェ
• 開催時期: 7/28-8/2
– 7/28: チュートリアル
• 9件
– 7/29-7/31: 本会議
• 700件近くの発表
• 6並列+ポスター
– 8/1-8/2: ワークショップ
• 19ワークショップ
Copyright ©2019 by Future Corporation - 4 -
Copyright ©2019 by Future Corporation - 5 -
* ACL2019 Opening slideより
• 2018年参加者の2倍以上
参加者数の推移
Copyright ©2019 by Future Corporation - 6 -
フィレンツェメルボルンバンクーバーベルリン
3160
1322
17721649
* ACL2019 Opening slideより
投稿数の推移
Copyright ©2019 by Future Corporation - 7 -
2905
1544
• 2018年投稿数の約2倍
* ACL2019 Opening slideより
採択率
Copyright ©2019 by Future Corporation - 8 -
• 採択率は例年通り、Accept本数が激増
* ACL2019 Opening slideより
ACLトレンド
Copyright ©2019 by Future Corporation - 9 -
2018
2017 2019
ベストペーパー
• 会議より前にベストペーパー候補が発表 (HPで公開)
– Long papers 17本
– Short papers 11本
– Demo papers 4本
• 本会議最終⽇のクロージングにて発表
Copyright ©2019 by Future Corporation - 10 -
* ACL2019 Closing slideより
Outstanding papers
• Emotion-Cause Pair Extraction: A New Task
to Emotion Analysis in Texts
• A Simple Theoretical Model of Importance
for Summarization
• Transferable Multi-Domain State Generator
for Task-Oriented Dialogue Systems
• We need to talk about standard splits
• Zero-shot Word Sense Disambiguation using
Sense Definition Embeddings
Copyright ©2019 by Future Corporation - 11 -
テキストマイニング
要約
対話
分析系
語義曖昧性解消
Best demo paper
• OpenKiwi: An Open Source Framework
for Quality Estimation
– Fabio Kepler, Jonay Trenous, Marcos Treviso,
Miguel Vera and André F. T. Martins
• Unbabel, Instituto de Telecomunicacoes
– 機械翻訳のQuality Estimation (QE)タスクのためのフレーム
ワークを提供
• QEタスク: 正解データなしで翻訳の質を評価
– 先⾏研究の4つの⼿法を実装し提供
– 新しいデータで上の4つの⼿法のモデルを学習することも可能
– WMT2019のShared Taskのベースラインとしても使⽤
Copyright ©2019 by Future Corporation - 12 -
Best short paper
• Do you know that Florence is packed
with visitors? Evaluating state-of-the-art
models of speaker commitment
– Nanjiang Jiang and Marie-Catherine de Marneffe
• The Ohio State University
– Speaker commitment: 話者の発⾔が、ある事象に対して
どの程度現実のものなのか、不確かなのかの具合
– 先⾏研究の2つのモデルを同⼀データセットにおいて⽐較し分析
• ルールベースモデル v.s. 深層学習モデル
• ルールベースの⽅が良かった
Copyright ©2019 by Future Corporation - 13 -
例: 事象「フィレンツェは観光客でいっぱい」 どっちが現実的か
フィレンツェ は観光客でいっぱいだと知っていますか?
フィレンツェ は観光客でいっぱいだと思いますか?
Best long paper
• Bridging the Gap between Training and
Inference for Neural Machine Translation
– Wen Zhang, Yang Feng, Fandong Meng, Di You
and Qun Liu
• University of Chinese Academy of Sciences, Tencent Inc,
Worcester Polytechnic Institute, Huawei
– 学習時に1つ前の時刻の正解を使って現時刻の単語を予測
– Inference時はモデルによって⽣成された1つ前の単語を使って
現時刻の単語を予測
– 学習時に、確率的に1つ前の予測した単語を⼊れるようにして
モデルを学習することでGapを減らす
– 他の⽣成系タスクにも応⽤可能
Copyright ©2019 by Future Corporation - 14 -
Gap
ホットキーワード
• Bias
– ⼈種、性別など
– 1セッション+ワークショップ
• Health
– 対話から症状を予測したり、良いカウンセラはどういうものか予測
– 1セッション+関連ワークショップ
• Evaluation
– ⽣成系のタスクが主流になり、どう評価するかにフォーカス
– Evaluationがつく発表15件
• Interpretability
– 解釈性
– 7件+ワークショップ
Copyright ©2019 by Future Corporation - 15 -
論⽂紹介
- 16 -
紹介する論⽂
• Health
– Extracting Symptoms and their Status from
Clinical Conversations
• Nan Du, Kai Chen, Anjuli Kannan, Linh Tran, Yuhui Chen,
and Izhak Shafran
• Evaluation
– HighRES: Highlight-based Reference-less
Evaluation of Summarization
• Hardy, Shashi Narayan and Andreas Vlachos
Copyright ©2019 by Future Corporation - 17 -
EXTRACTING SYMPTOMS AND
THEIR STATUS FROM CLINICAL
CONVERSATIONS
Nan Du, Kai Chen, Anjuli Kannan, Linh Tran, Yuhui Chen,
and Izhak Shafran
Google Inc.
Copyright ©2019 by Future Corporation - 18 -
概要
• タスク: 医者と患者の会話からSymptom(症状)と
Status(状態)の予測
• 背景: 11時間の勤務時間のうち4.5時間を診療⽂書
作成に使う(通常勤務終了後、さらに1.4時間)
– この時間を少しでも短くして患者との時間を増やしたい
Copyright ©2019 by Future Corporation - 19 -
医者: How are you feeling?
患者: I have a back pain.
sym:musculo-skeletal:pain, experienced
筋骨格:痛み、経験
会話
症状
状態
データセット
• 元データ: 90,000件の⾮特定化された書き起こし
– 1件あたり医者と患者の10分ほどの⾳声会話
– ⼀部は看護師、介護⼠、配偶者などの⾳声含む
• 症状と状態のアノテーションスキーマ
– 医学書⼠、医者、NLP専⾨家によって定義
– 186の症状でそれぞれが体の部位(14部位)と紐づく
– 3つの状態(experienced, not experienced, other)
• 2950件に対して18⼈のプロの医学書⼠がアノテート
– Inter-labeler agreement (kappa): 0.4
• 医者と患者の症状の話し⽅が曖昧もしくはインフォーマル
• アノテータが関連した似たラベルを付与
• アノテータの付けたラベルのスパンの不⼀致
Copyright ©2019 by Future Corporation - 20 -
2つのモデルを提案
• Span-Attribute Tagging Model (SA-T)
• Sequence-to-sequence Model (Seq2Seq)
Copyright ©2019 by Future Corporation - 21 -
Symptom indicator
Symptom name
Symptom status
← Symptomにあたる箇所を同定
← Symptomの中身とStatusを予測
SA-T Model
• スパンを当てるタスク: CRF (with BIO tags)
• ラベルの数が多すぎて現実的ではない
– ⼆段階に分けて症状と状態を推定
Copyright ©2019 by Future Corporation - 22 -
I O
have O
a O
back B-sym:musculo-skeletal:pain:experienced
pain I-sym:musculo-skeletal:pain:experienced
. O
症状が186種類、状態が3種類、
BIで2つ、Oが1つ
(186 * 3 * 2) + 1 = 1117ラベル
1. CRF-layerで範囲を同定
2. 1で同定された範囲の症状と状
態を推定
Seq2Seq Model
• 症状が明⽰的に出ない、会話を通して出現
Copyright ©2019 by Future Corporation - 23 -
Transcriptを入力してSymptoms+Statusを出力するSeq2Seq
Symptom
indicator
Frequent
urination
experienced
入力 出力
実験結果
Copyright ©2019 by Future Corporation - 24 -
Weighted F1= 複数回出る症状に重みを置いた評価指標
人同士の結果との比較
1. 人でも難しい
2. 人は症状がわかると状態も当
てられる
• 状態の推定性能向上は課題
提案モデルの比較
1. SA-TとSeq2Seqが同程度の
性能(著者からすると驚き)
• SA-Tはまず位置を要特定
2. SA-TはPrecisionが高く、
Seq2SeqはRecallが高い
3. ベースラインへの言及なし
差が小さい
差が大きい
HIGHRES: HIGHLIGHT-BASED
REFERENCE-LESS EVALUATION OF
SUMMARIZATION
Hardy1, Shashi Narayan2 and Andreas Vlachos1,3
1University of Sheffield, 2Google Research, 3University of Cambridge
Copyright ©2019 by Future Corporation - 25 -
Reference = 正解の要約
概要
• 要約の正解⽂を使わない新しい評価⽅法の提案
• 要約の正解は、1つのソースに対して1つのみが多い
– ⽣成タスクにおいて正解となるものは複数あり得る
• 要約の⼈⼿評価は⼤変
– ⼈が評価しても⼀貫的な評価は難しい
– 評価する⼈が変われば結果も変わる
• 元のソースに対して重要なところをマーキング
• その重要単語を元に⾃動評価
– 正解はいらないけど、ソースに⼈⼿でつけるコスト。。。
– ⼀度つければ使い回しは可能
Copyright ©2019 by Future Corporation - 26 -
HIGHRESの3つのコンポーネント
• ハイライトアノテーション
– ソースドキュメント中の重要な単語、フレーズをハイライト
• ハイライトベース内容評価
– 全ての重要な情報が要約に⼊っているか (Recall)
– 重要な情報のみが要約に⼊っているか (Precision)
• 明瞭さ、流暢さの評価
– 明瞭さ: 要約が簡単に理解できるか
– 流暢さ: 要約が⾔語として⾃然、⽂法誤りがないか
Copyright ©2019 by Future Corporation - 27 -
• クラウドソーシングで1つのソースに対して複数⼈
⼈⼿アノテーション
Copyright ©2019 by Future Corporation - 28 -
ハイライトベース
内容評価ハイライトアノテーション
Highlight-based ROUGE
• ハイライトされた重要な単語、フレーズに⾼い重み
Copyright ©2019 by Future Corporation - 29 -
Precisionで分母に重みをかけると、ソース
に出てこない単語が無視されてしまうため、
分母の重みは1にする
単語wjがハイライトされた回数
アノテータの数
Highlight-based ROUGEでの評価
• ハイライトあるなしで傾向は同じ
– Reference > TCONVS2S > PTGEN
• ハイライトありの⽅がTCONVS2SとPTGENで差が⼤
– Prec: 6.48 v.s. 3.98, Rec: 5.54 v.s. 1.83
• 正解を使った評価ではRecallでTCONVS2Sより
PTGENが上回る
Copyright ©2019 by Future Corporation - 30 -
定性的分析
Copyright ©2019 by Future Corporation - 31 -
正解を使った評価だとシ
ステムが生成した単語を
あまり含んでおらず、妥当
なスコアを付けられない
ハイライトベースは、人が
重要とした単語を含むか
どうかで評価できるため、
妥当なスコアを付与

More Related Content

Similar to ACL2019参加報告@テキストアナリティクスシンポジウム

大規模データ時代に求められる自然言語処理
大規模データ時代に求められる自然言語処理大規模データ時代に求められる自然言語処理
大規模データ時代に求められる自然言語処理
Preferred Networks
 
bigdata2012nlp okanohara
bigdata2012nlp okanoharabigdata2012nlp okanohara
bigdata2012nlp okanohara
Preferred Networks
 
IPAB2017 深層学習を使った新薬の探索から創造へ
IPAB2017 深層学習を使った新薬の探索から創造へIPAB2017 深層学習を使った新薬の探索から創造へ
IPAB2017 深層学習を使った新薬の探索から創造へ
Preferred Networks
 
aiconf2017okanohara
aiconf2017okanoharaaiconf2017okanohara
aiconf2017okanohara
Preferred Networks
 
ECCV2020 Oral論文 完全読破(1/2)
ECCV2020 Oral論文 完全読破(1/2)ECCV2020 Oral論文 完全読破(1/2)
ECCV2020 Oral論文 完全読破(1/2)
cvpaper. challenge
 
Dots deep learning部_20161221
Dots deep learning部_20161221Dots deep learning部_20161221
Dots deep learning部_20161221
陽平 山口
 
STAMP/STPA and UML/HAZOP on the IoT and AI/Deep Learning
STAMP/STPA and UML/HAZOP on the IoT and AI/Deep Learning STAMP/STPA and UML/HAZOP on the IoT and AI/Deep Learning
STAMP/STPA and UML/HAZOP on the IoT and AI/Deep Learning
Kiyoshi Ogawa
 
Monitoring.pdf
Monitoring.pdfMonitoring.pdf
Monitoring.pdf
HayamuTakahashi
 
Jla stepup2(20100822)
Jla stepup2(20100822)Jla stepup2(20100822)
Jla stepup2(20100822)真 岡本
 
AgileTourOsaka2011 関係者に理解してもらえるアジャイル開発にむけて
AgileTourOsaka2011 関係者に理解してもらえるアジャイル開発にむけてAgileTourOsaka2011 関係者に理解してもらえるアジャイル開発にむけて
AgileTourOsaka2011 関係者に理解してもらえるアジャイル開発にむけて
Shuji Morisaki
 
国際的な相互運用とオープン技術- 日時と文字 -
国際的な相互運用とオープン技術- 日時と文字 -国際的な相互運用とオープン技術- 日時と文字 -
国際的な相互運用とオープン技術- 日時と文字 -
yamahige
 
Session4:「先進ビッグデータ応用を支える機械学習に求められる新技術」/比戸将平
Session4:「先進ビッグデータ応用を支える機械学習に求められる新技術」/比戸将平Session4:「先進ビッグデータ応用を支える機械学習に求められる新技術」/比戸将平
Session4:「先進ビッグデータ応用を支える機械学習に求められる新技術」/比戸将平
Preferred Networks
 
行動計量シンポジウム20140321 http://lab.synergy-marketing.co.jp/activity/bsj_98th
行動計量シンポジウム20140321 http://lab.synergy-marketing.co.jp/activity/bsj_98th行動計量シンポジウム20140321 http://lab.synergy-marketing.co.jp/activity/bsj_98th
行動計量シンポジウム20140321 http://lab.synergy-marketing.co.jp/activity/bsj_98thYoichi Motomura
 
オープンデータ時代における政府情報アクセスの変容をめぐる試論(古賀崇)
オープンデータ時代における政府情報アクセスの変容をめぐる試論(古賀崇)オープンデータ時代における政府情報アクセスの変容をめぐる試論(古賀崇)
オープンデータ時代における政府情報アクセスの変容をめぐる試論(古賀崇)
Takashi Koga
 
Survey of Scientific Publication Analysis by NLP and CV
Survey of Scientific Publication Analysis by NLP and CVSurvey of Scientific Publication Analysis by NLP and CV
Survey of Scientific Publication Analysis by NLP and CV
Shintaro Yamamoto
 
【CVPR 2020 メタサーベイ】Vision Applications and Systems
【CVPR 2020 メタサーベイ】Vision Applications and Systems【CVPR 2020 メタサーベイ】Vision Applications and Systems
【CVPR 2020 メタサーベイ】Vision Applications and Systems
cvpaper. challenge
 
言語資源と付き合う
言語資源と付き合う言語資源と付き合う
言語資源と付き合うYuya Unno
 
企業における自然言語処理技術の活用の現場(情報処理学会東海支部主催講演会@名古屋大学)
企業における自然言語処理技術の活用の現場(情報処理学会東海支部主催講演会@名古屋大学)企業における自然言語処理技術の活用の現場(情報処理学会東海支部主催講演会@名古屋大学)
企業における自然言語処理技術の活用の現場(情報処理学会東海支部主催講演会@名古屋大学)Yuya Unno
 
(2020.9) 機械学習による化学反応の予測と設計
(2020.9) 機械学習による化学反応の予測と設計(2020.9) 機械学習による化学反応の予測と設計
(2020.9) 機械学習による化学反応の予測と設計
Ichigaku Takigawa
 

Similar to ACL2019参加報告@テキストアナリティクスシンポジウム (20)

大規模データ時代に求められる自然言語処理
大規模データ時代に求められる自然言語処理大規模データ時代に求められる自然言語処理
大規模データ時代に求められる自然言語処理
 
bigdata2012nlp okanohara
bigdata2012nlp okanoharabigdata2012nlp okanohara
bigdata2012nlp okanohara
 
IPAB2017 深層学習を使った新薬の探索から創造へ
IPAB2017 深層学習を使った新薬の探索から創造へIPAB2017 深層学習を使った新薬の探索から創造へ
IPAB2017 深層学習を使った新薬の探索から創造へ
 
aiconf2017okanohara
aiconf2017okanoharaaiconf2017okanohara
aiconf2017okanohara
 
ECCV2020 Oral論文 完全読破(1/2)
ECCV2020 Oral論文 完全読破(1/2)ECCV2020 Oral論文 完全読破(1/2)
ECCV2020 Oral論文 完全読破(1/2)
 
Dots deep learning部_20161221
Dots deep learning部_20161221Dots deep learning部_20161221
Dots deep learning部_20161221
 
STAMP/STPA and UML/HAZOP on the IoT and AI/Deep Learning
STAMP/STPA and UML/HAZOP on the IoT and AI/Deep Learning STAMP/STPA and UML/HAZOP on the IoT and AI/Deep Learning
STAMP/STPA and UML/HAZOP on the IoT and AI/Deep Learning
 
Monitoring.pdf
Monitoring.pdfMonitoring.pdf
Monitoring.pdf
 
Jla stepup2(20100822)
Jla stepup2(20100822)Jla stepup2(20100822)
Jla stepup2(20100822)
 
AgileTourOsaka2011 関係者に理解してもらえるアジャイル開発にむけて
AgileTourOsaka2011 関係者に理解してもらえるアジャイル開発にむけてAgileTourOsaka2011 関係者に理解してもらえるアジャイル開発にむけて
AgileTourOsaka2011 関係者に理解してもらえるアジャイル開発にむけて
 
国際的な相互運用とオープン技術- 日時と文字 -
国際的な相互運用とオープン技術- 日時と文字 -国際的な相互運用とオープン技術- 日時と文字 -
国際的な相互運用とオープン技術- 日時と文字 -
 
Session4:「先進ビッグデータ応用を支える機械学習に求められる新技術」/比戸将平
Session4:「先進ビッグデータ応用を支える機械学習に求められる新技術」/比戸将平Session4:「先進ビッグデータ応用を支える機械学習に求められる新技術」/比戸将平
Session4:「先進ビッグデータ応用を支える機械学習に求められる新技術」/比戸将平
 
行動計量シンポジウム20140321 http://lab.synergy-marketing.co.jp/activity/bsj_98th
行動計量シンポジウム20140321 http://lab.synergy-marketing.co.jp/activity/bsj_98th行動計量シンポジウム20140321 http://lab.synergy-marketing.co.jp/activity/bsj_98th
行動計量シンポジウム20140321 http://lab.synergy-marketing.co.jp/activity/bsj_98th
 
オープンデータ時代における政府情報アクセスの変容をめぐる試論(古賀崇)
オープンデータ時代における政府情報アクセスの変容をめぐる試論(古賀崇)オープンデータ時代における政府情報アクセスの変容をめぐる試論(古賀崇)
オープンデータ時代における政府情報アクセスの変容をめぐる試論(古賀崇)
 
Survey of Scientific Publication Analysis by NLP and CV
Survey of Scientific Publication Analysis by NLP and CVSurvey of Scientific Publication Analysis by NLP and CV
Survey of Scientific Publication Analysis by NLP and CV
 
rcast_20140411
rcast_20140411rcast_20140411
rcast_20140411
 
【CVPR 2020 メタサーベイ】Vision Applications and Systems
【CVPR 2020 メタサーベイ】Vision Applications and Systems【CVPR 2020 メタサーベイ】Vision Applications and Systems
【CVPR 2020 メタサーベイ】Vision Applications and Systems
 
言語資源と付き合う
言語資源と付き合う言語資源と付き合う
言語資源と付き合う
 
企業における自然言語処理技術の活用の現場(情報処理学会東海支部主催講演会@名古屋大学)
企業における自然言語処理技術の活用の現場(情報処理学会東海支部主催講演会@名古屋大学)企業における自然言語処理技術の活用の現場(情報処理学会東海支部主催講演会@名古屋大学)
企業における自然言語処理技術の活用の現場(情報処理学会東海支部主催講演会@名古屋大学)
 
(2020.9) 機械学習による化学反応の予測と設計
(2020.9) 機械学習による化学反応の予測と設計(2020.9) 機械学習による化学反応の予測と設計
(2020.9) 機械学習による化学反応の予測と設計
 

Recently uploaded

FIDO Alliance Osaka Seminar: CloudGate.pdf
FIDO Alliance Osaka Seminar: CloudGate.pdfFIDO Alliance Osaka Seminar: CloudGate.pdf
FIDO Alliance Osaka Seminar: CloudGate.pdf
FIDO Alliance
 
【AI論文解説】Consistency ModelとRectified Flow
【AI論文解説】Consistency ModelとRectified Flow【AI論文解説】Consistency ModelとRectified Flow
【AI論文解説】Consistency ModelとRectified Flow
Sony - Neural Network Libraries
 
FIDO Alliance Osaka Seminar: Welcome Slides.pdf
FIDO Alliance Osaka Seminar: Welcome Slides.pdfFIDO Alliance Osaka Seminar: Welcome Slides.pdf
FIDO Alliance Osaka Seminar: Welcome Slides.pdf
FIDO Alliance
 
FIDO Alliance Osaka Seminar: NEC & Yubico Panel.pdf
FIDO Alliance Osaka Seminar: NEC & Yubico Panel.pdfFIDO Alliance Osaka Seminar: NEC & Yubico Panel.pdf
FIDO Alliance Osaka Seminar: NEC & Yubico Panel.pdf
FIDO Alliance
 
FIDO Alliance Osaka Seminar: PlayStation Passkey Deployment Case Study.pdf
FIDO Alliance Osaka Seminar: PlayStation Passkey Deployment Case Study.pdfFIDO Alliance Osaka Seminar: PlayStation Passkey Deployment Case Study.pdf
FIDO Alliance Osaka Seminar: PlayStation Passkey Deployment Case Study.pdf
FIDO Alliance
 
YugabyteDB適用に向けた取り組みと隠れた魅力 (DSS Asia 2024 発表資料)
YugabyteDB適用に向けた取り組みと隠れた魅力 (DSS Asia 2024 発表資料)YugabyteDB適用に向けた取り組みと隠れた魅力 (DSS Asia 2024 発表資料)
YugabyteDB適用に向けた取り組みと隠れた魅力 (DSS Asia 2024 発表資料)
NTT DATA Technology & Innovation
 
論文紹介: Offline Q-Learning on diverse Multi-Task data both scales and generalizes
論文紹介: Offline Q-Learning on diverse Multi-Task data both scales and generalizes論文紹介: Offline Q-Learning on diverse Multi-Task data both scales and generalizes
論文紹介: Offline Q-Learning on diverse Multi-Task data both scales and generalizes
atsushi061452
 
単腕マニピュレータによる 複数物体の同時組み立ての 基礎的考察 / Basic Approach to Robotic Assembly of Multi...
単腕マニピュレータによる 複数物体の同時組み立ての 基礎的考察 / Basic Approach to Robotic Assembly of Multi...単腕マニピュレータによる 複数物体の同時組み立ての 基礎的考察 / Basic Approach to Robotic Assembly of Multi...
単腕マニピュレータによる 複数物体の同時組み立ての 基礎的考察 / Basic Approach to Robotic Assembly of Multi...
Fukuoka Institute of Technology
 
2024年度_サイバーエージェント_新卒研修「データベースの歴史」.pptx
2024年度_サイバーエージェント_新卒研修「データベースの歴史」.pptx2024年度_サイバーエージェント_新卒研修「データベースの歴史」.pptx
2024年度_サイバーエージェント_新卒研修「データベースの歴史」.pptx
yassun7010
 
【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching
【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching
【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching
harmonylab
 
論文紹介: Exploiting semantic segmentation to boost reinforcement learning in vid...
論文紹介: Exploiting semantic segmentation to boost reinforcement learning in vid...論文紹介: Exploiting semantic segmentation to boost reinforcement learning in vid...
論文紹介: Exploiting semantic segmentation to boost reinforcement learning in vid...
atsushi061452
 
TaketoFujikawa_物語のコンセプトに基づく情報アクセス手法の基礎検討_JSAI2024
TaketoFujikawa_物語のコンセプトに基づく情報アクセス手法の基礎検討_JSAI2024TaketoFujikawa_物語のコンセプトに基づく情報アクセス手法の基礎検討_JSAI2024
TaketoFujikawa_物語のコンセプトに基づく情報アクセス手法の基礎検討_JSAI2024
Matsushita Laboratory
 
MPAなWebフレームワーク、Astroの紹介 (その2) 2024/05/24の勉強会で発表されたものです。
MPAなWebフレームワーク、Astroの紹介 (その2) 2024/05/24の勉強会で発表されたものです。MPAなWebフレームワーク、Astroの紹介 (その2) 2024/05/24の勉強会で発表されたものです。
MPAなWebフレームワーク、Astroの紹介 (その2) 2024/05/24の勉強会で発表されたものです。
iPride Co., Ltd.
 
LoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアル
LoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアルLoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアル
LoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアル
CRI Japan, Inc.
 
FIDO Alliance Osaka Seminar: LY-DOCOMO-KDDI-Mercari Panel.pdf
FIDO Alliance Osaka Seminar: LY-DOCOMO-KDDI-Mercari Panel.pdfFIDO Alliance Osaka Seminar: LY-DOCOMO-KDDI-Mercari Panel.pdf
FIDO Alliance Osaka Seminar: LY-DOCOMO-KDDI-Mercari Panel.pdf
FIDO Alliance
 

Recently uploaded (15)

FIDO Alliance Osaka Seminar: CloudGate.pdf
FIDO Alliance Osaka Seminar: CloudGate.pdfFIDO Alliance Osaka Seminar: CloudGate.pdf
FIDO Alliance Osaka Seminar: CloudGate.pdf
 
【AI論文解説】Consistency ModelとRectified Flow
【AI論文解説】Consistency ModelとRectified Flow【AI論文解説】Consistency ModelとRectified Flow
【AI論文解説】Consistency ModelとRectified Flow
 
FIDO Alliance Osaka Seminar: Welcome Slides.pdf
FIDO Alliance Osaka Seminar: Welcome Slides.pdfFIDO Alliance Osaka Seminar: Welcome Slides.pdf
FIDO Alliance Osaka Seminar: Welcome Slides.pdf
 
FIDO Alliance Osaka Seminar: NEC & Yubico Panel.pdf
FIDO Alliance Osaka Seminar: NEC & Yubico Panel.pdfFIDO Alliance Osaka Seminar: NEC & Yubico Panel.pdf
FIDO Alliance Osaka Seminar: NEC & Yubico Panel.pdf
 
FIDO Alliance Osaka Seminar: PlayStation Passkey Deployment Case Study.pdf
FIDO Alliance Osaka Seminar: PlayStation Passkey Deployment Case Study.pdfFIDO Alliance Osaka Seminar: PlayStation Passkey Deployment Case Study.pdf
FIDO Alliance Osaka Seminar: PlayStation Passkey Deployment Case Study.pdf
 
YugabyteDB適用に向けた取り組みと隠れた魅力 (DSS Asia 2024 発表資料)
YugabyteDB適用に向けた取り組みと隠れた魅力 (DSS Asia 2024 発表資料)YugabyteDB適用に向けた取り組みと隠れた魅力 (DSS Asia 2024 発表資料)
YugabyteDB適用に向けた取り組みと隠れた魅力 (DSS Asia 2024 発表資料)
 
論文紹介: Offline Q-Learning on diverse Multi-Task data both scales and generalizes
論文紹介: Offline Q-Learning on diverse Multi-Task data both scales and generalizes論文紹介: Offline Q-Learning on diverse Multi-Task data both scales and generalizes
論文紹介: Offline Q-Learning on diverse Multi-Task data both scales and generalizes
 
単腕マニピュレータによる 複数物体の同時組み立ての 基礎的考察 / Basic Approach to Robotic Assembly of Multi...
単腕マニピュレータによる 複数物体の同時組み立ての 基礎的考察 / Basic Approach to Robotic Assembly of Multi...単腕マニピュレータによる 複数物体の同時組み立ての 基礎的考察 / Basic Approach to Robotic Assembly of Multi...
単腕マニピュレータによる 複数物体の同時組み立ての 基礎的考察 / Basic Approach to Robotic Assembly of Multi...
 
2024年度_サイバーエージェント_新卒研修「データベースの歴史」.pptx
2024年度_サイバーエージェント_新卒研修「データベースの歴史」.pptx2024年度_サイバーエージェント_新卒研修「データベースの歴史」.pptx
2024年度_サイバーエージェント_新卒研修「データベースの歴史」.pptx
 
【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching
【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching
【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching
 
論文紹介: Exploiting semantic segmentation to boost reinforcement learning in vid...
論文紹介: Exploiting semantic segmentation to boost reinforcement learning in vid...論文紹介: Exploiting semantic segmentation to boost reinforcement learning in vid...
論文紹介: Exploiting semantic segmentation to boost reinforcement learning in vid...
 
TaketoFujikawa_物語のコンセプトに基づく情報アクセス手法の基礎検討_JSAI2024
TaketoFujikawa_物語のコンセプトに基づく情報アクセス手法の基礎検討_JSAI2024TaketoFujikawa_物語のコンセプトに基づく情報アクセス手法の基礎検討_JSAI2024
TaketoFujikawa_物語のコンセプトに基づく情報アクセス手法の基礎検討_JSAI2024
 
MPAなWebフレームワーク、Astroの紹介 (その2) 2024/05/24の勉強会で発表されたものです。
MPAなWebフレームワーク、Astroの紹介 (その2) 2024/05/24の勉強会で発表されたものです。MPAなWebフレームワーク、Astroの紹介 (その2) 2024/05/24の勉強会で発表されたものです。
MPAなWebフレームワーク、Astroの紹介 (その2) 2024/05/24の勉強会で発表されたものです。
 
LoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアル
LoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアルLoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアル
LoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアル
 
FIDO Alliance Osaka Seminar: LY-DOCOMO-KDDI-Mercari Panel.pdf
FIDO Alliance Osaka Seminar: LY-DOCOMO-KDDI-Mercari Panel.pdfFIDO Alliance Osaka Seminar: LY-DOCOMO-KDDI-Mercari Panel.pdf
FIDO Alliance Osaka Seminar: LY-DOCOMO-KDDI-Mercari Panel.pdf
 

ACL2019参加報告@テキストアナリティクスシンポジウム

  • 1. Copyright ©2019 by Future Corporation フューチャー株式会社 ACL参加報告 ⽔本 智也 2019年9月28日 第15回 テキストアナリティクス・シンポジウム
  • 2. 【宣伝】NLP技術セミナー開催します • 2019/11/29 (⾦) 13:00-18:00 • 産業界の⽅々を対象にしたセミナー – ⾃然⾔語処理ってどんなもの︖ – ⼈⼯知能や⾃然⾔語処理技術を導⼊するにはまず何から始めればいいの︖ – ⾃然⾔語処理に関する技術やツールを⼿っ取り早く学びたい – 形態素解析が⾃然⾔語処理の基本って聞いたけど,それってどんなもの︖ – 形態素解析以外にどんな⾔語処理技術があるの︖ – ⾃然⾔語処理技術を応⽤したシステムやサービスにはどんなものがあるの︖ – 迅速に⾃然⾔語処理技術を導⼊するためには何に注意すればいいの︖ • 講師: – 須藤克仁、⾦⼭博、徳久良⼦、⼭下達雄 • 詳細はWebページで – https://sites.google.com/site/nlpseminarweb/home Copyright ©2019 by Future Corporation - 2 -
  • 4. ACL2019 • ⾃然⾔語処理の難関国際会議 • 57回⽬の開催 • 開催場所: イタリア、フィレンツェ • 開催時期: 7/28-8/2 – 7/28: チュートリアル • 9件 – 7/29-7/31: 本会議 • 700件近くの発表 • 6並列+ポスター – 8/1-8/2: ワークショップ • 19ワークショップ Copyright ©2019 by Future Corporation - 4 -
  • 5. Copyright ©2019 by Future Corporation - 5 - * ACL2019 Opening slideより
  • 6. • 2018年参加者の2倍以上 参加者数の推移 Copyright ©2019 by Future Corporation - 6 - フィレンツェメルボルンバンクーバーベルリン 3160 1322 17721649 * ACL2019 Opening slideより
  • 7. 投稿数の推移 Copyright ©2019 by Future Corporation - 7 - 2905 1544 • 2018年投稿数の約2倍 * ACL2019 Opening slideより
  • 8. 採択率 Copyright ©2019 by Future Corporation - 8 - • 採択率は例年通り、Accept本数が激増 * ACL2019 Opening slideより
  • 9. ACLトレンド Copyright ©2019 by Future Corporation - 9 - 2018 2017 2019
  • 10. ベストペーパー • 会議より前にベストペーパー候補が発表 (HPで公開) – Long papers 17本 – Short papers 11本 – Demo papers 4本 • 本会議最終⽇のクロージングにて発表 Copyright ©2019 by Future Corporation - 10 - * ACL2019 Closing slideより
  • 11. Outstanding papers • Emotion-Cause Pair Extraction: A New Task to Emotion Analysis in Texts • A Simple Theoretical Model of Importance for Summarization • Transferable Multi-Domain State Generator for Task-Oriented Dialogue Systems • We need to talk about standard splits • Zero-shot Word Sense Disambiguation using Sense Definition Embeddings Copyright ©2019 by Future Corporation - 11 - テキストマイニング 要約 対話 分析系 語義曖昧性解消
  • 12. Best demo paper • OpenKiwi: An Open Source Framework for Quality Estimation – Fabio Kepler, Jonay Trenous, Marcos Treviso, Miguel Vera and André F. T. Martins • Unbabel, Instituto de Telecomunicacoes – 機械翻訳のQuality Estimation (QE)タスクのためのフレーム ワークを提供 • QEタスク: 正解データなしで翻訳の質を評価 – 先⾏研究の4つの⼿法を実装し提供 – 新しいデータで上の4つの⼿法のモデルを学習することも可能 – WMT2019のShared Taskのベースラインとしても使⽤ Copyright ©2019 by Future Corporation - 12 -
  • 13. Best short paper • Do you know that Florence is packed with visitors? Evaluating state-of-the-art models of speaker commitment – Nanjiang Jiang and Marie-Catherine de Marneffe • The Ohio State University – Speaker commitment: 話者の発⾔が、ある事象に対して どの程度現実のものなのか、不確かなのかの具合 – 先⾏研究の2つのモデルを同⼀データセットにおいて⽐較し分析 • ルールベースモデル v.s. 深層学習モデル • ルールベースの⽅が良かった Copyright ©2019 by Future Corporation - 13 - 例: 事象「フィレンツェは観光客でいっぱい」 どっちが現実的か フィレンツェ は観光客でいっぱいだと知っていますか? フィレンツェ は観光客でいっぱいだと思いますか?
  • 14. Best long paper • Bridging the Gap between Training and Inference for Neural Machine Translation – Wen Zhang, Yang Feng, Fandong Meng, Di You and Qun Liu • University of Chinese Academy of Sciences, Tencent Inc, Worcester Polytechnic Institute, Huawei – 学習時に1つ前の時刻の正解を使って現時刻の単語を予測 – Inference時はモデルによって⽣成された1つ前の単語を使って 現時刻の単語を予測 – 学習時に、確率的に1つ前の予測した単語を⼊れるようにして モデルを学習することでGapを減らす – 他の⽣成系タスクにも応⽤可能 Copyright ©2019 by Future Corporation - 14 - Gap
  • 15. ホットキーワード • Bias – ⼈種、性別など – 1セッション+ワークショップ • Health – 対話から症状を予測したり、良いカウンセラはどういうものか予測 – 1セッション+関連ワークショップ • Evaluation – ⽣成系のタスクが主流になり、どう評価するかにフォーカス – Evaluationがつく発表15件 • Interpretability – 解釈性 – 7件+ワークショップ Copyright ©2019 by Future Corporation - 15 -
  • 17. 紹介する論⽂ • Health – Extracting Symptoms and their Status from Clinical Conversations • Nan Du, Kai Chen, Anjuli Kannan, Linh Tran, Yuhui Chen, and Izhak Shafran • Evaluation – HighRES: Highlight-based Reference-less Evaluation of Summarization • Hardy, Shashi Narayan and Andreas Vlachos Copyright ©2019 by Future Corporation - 17 -
  • 18. EXTRACTING SYMPTOMS AND THEIR STATUS FROM CLINICAL CONVERSATIONS Nan Du, Kai Chen, Anjuli Kannan, Linh Tran, Yuhui Chen, and Izhak Shafran Google Inc. Copyright ©2019 by Future Corporation - 18 -
  • 19. 概要 • タスク: 医者と患者の会話からSymptom(症状)と Status(状態)の予測 • 背景: 11時間の勤務時間のうち4.5時間を診療⽂書 作成に使う(通常勤務終了後、さらに1.4時間) – この時間を少しでも短くして患者との時間を増やしたい Copyright ©2019 by Future Corporation - 19 - 医者: How are you feeling? 患者: I have a back pain. sym:musculo-skeletal:pain, experienced 筋骨格:痛み、経験 会話 症状 状態
  • 20. データセット • 元データ: 90,000件の⾮特定化された書き起こし – 1件あたり医者と患者の10分ほどの⾳声会話 – ⼀部は看護師、介護⼠、配偶者などの⾳声含む • 症状と状態のアノテーションスキーマ – 医学書⼠、医者、NLP専⾨家によって定義 – 186の症状でそれぞれが体の部位(14部位)と紐づく – 3つの状態(experienced, not experienced, other) • 2950件に対して18⼈のプロの医学書⼠がアノテート – Inter-labeler agreement (kappa): 0.4 • 医者と患者の症状の話し⽅が曖昧もしくはインフォーマル • アノテータが関連した似たラベルを付与 • アノテータの付けたラベルのスパンの不⼀致 Copyright ©2019 by Future Corporation - 20 -
  • 21. 2つのモデルを提案 • Span-Attribute Tagging Model (SA-T) • Sequence-to-sequence Model (Seq2Seq) Copyright ©2019 by Future Corporation - 21 - Symptom indicator Symptom name Symptom status ← Symptomにあたる箇所を同定 ← Symptomの中身とStatusを予測
  • 22. SA-T Model • スパンを当てるタスク: CRF (with BIO tags) • ラベルの数が多すぎて現実的ではない – ⼆段階に分けて症状と状態を推定 Copyright ©2019 by Future Corporation - 22 - I O have O a O back B-sym:musculo-skeletal:pain:experienced pain I-sym:musculo-skeletal:pain:experienced . O 症状が186種類、状態が3種類、 BIで2つ、Oが1つ (186 * 3 * 2) + 1 = 1117ラベル 1. CRF-layerで範囲を同定 2. 1で同定された範囲の症状と状 態を推定
  • 23. Seq2Seq Model • 症状が明⽰的に出ない、会話を通して出現 Copyright ©2019 by Future Corporation - 23 - Transcriptを入力してSymptoms+Statusを出力するSeq2Seq Symptom indicator Frequent urination experienced 入力 出力
  • 24. 実験結果 Copyright ©2019 by Future Corporation - 24 - Weighted F1= 複数回出る症状に重みを置いた評価指標 人同士の結果との比較 1. 人でも難しい 2. 人は症状がわかると状態も当 てられる • 状態の推定性能向上は課題 提案モデルの比較 1. SA-TとSeq2Seqが同程度の 性能(著者からすると驚き) • SA-Tはまず位置を要特定 2. SA-TはPrecisionが高く、 Seq2SeqはRecallが高い 3. ベースラインへの言及なし 差が小さい 差が大きい
  • 25. HIGHRES: HIGHLIGHT-BASED REFERENCE-LESS EVALUATION OF SUMMARIZATION Hardy1, Shashi Narayan2 and Andreas Vlachos1,3 1University of Sheffield, 2Google Research, 3University of Cambridge Copyright ©2019 by Future Corporation - 25 - Reference = 正解の要約
  • 26. 概要 • 要約の正解⽂を使わない新しい評価⽅法の提案 • 要約の正解は、1つのソースに対して1つのみが多い – ⽣成タスクにおいて正解となるものは複数あり得る • 要約の⼈⼿評価は⼤変 – ⼈が評価しても⼀貫的な評価は難しい – 評価する⼈が変われば結果も変わる • 元のソースに対して重要なところをマーキング • その重要単語を元に⾃動評価 – 正解はいらないけど、ソースに⼈⼿でつけるコスト。。。 – ⼀度つければ使い回しは可能 Copyright ©2019 by Future Corporation - 26 -
  • 27. HIGHRESの3つのコンポーネント • ハイライトアノテーション – ソースドキュメント中の重要な単語、フレーズをハイライト • ハイライトベース内容評価 – 全ての重要な情報が要約に⼊っているか (Recall) – 重要な情報のみが要約に⼊っているか (Precision) • 明瞭さ、流暢さの評価 – 明瞭さ: 要約が簡単に理解できるか – 流暢さ: 要約が⾔語として⾃然、⽂法誤りがないか Copyright ©2019 by Future Corporation - 27 -
  • 28. • クラウドソーシングで1つのソースに対して複数⼈ ⼈⼿アノテーション Copyright ©2019 by Future Corporation - 28 - ハイライトベース 内容評価ハイライトアノテーション
  • 29. Highlight-based ROUGE • ハイライトされた重要な単語、フレーズに⾼い重み Copyright ©2019 by Future Corporation - 29 - Precisionで分母に重みをかけると、ソース に出てこない単語が無視されてしまうため、 分母の重みは1にする 単語wjがハイライトされた回数 アノテータの数
  • 30. Highlight-based ROUGEでの評価 • ハイライトあるなしで傾向は同じ – Reference > TCONVS2S > PTGEN • ハイライトありの⽅がTCONVS2SとPTGENで差が⼤ – Prec: 6.48 v.s. 3.98, Rec: 5.54 v.s. 1.83 • 正解を使った評価ではRecallでTCONVS2Sより PTGENが上回る Copyright ©2019 by Future Corporation - 30 -
  • 31. 定性的分析 Copyright ©2019 by Future Corporation - 31 - 正解を使った評価だとシ ステムが生成した単語を あまり含んでおらず、妥当 なスコアを付けられない ハイライトベースは、人が 重要とした単語を含むか どうかで評価できるため、 妥当なスコアを付与