Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Online python data_analysis19th_20200516

201 views

Published on

【オンライン】Pythonデータ分析勉強会#19 - connpassでの発表しりょうです。
https://pythondata.connpass.com/event/173020/

Published in: Science
  • Be the first to comment

  • Be the first to like this

Online python data_analysis19th_20200516

  1. 1. 日常会話の含意や推移の実現の考察 ー対話システムの自然言語理解を通じてー https://pythondata.connpass.com/event/173020/ 2020年5月16日 13:30-15:30 太田 博三 1
  2. 2. 自己紹介 1. 環境工学:廃棄物の処理処分に関する研究 →統計学を 副専攻 ↓ 2. Web系企業でレコメンドエンジンの開発・物体認識など ↓ 3. 『ウェブ解析士』の資格本を初版時に執筆協力 https://00m.in/MFxzI ↓ 4. 統計解析⇨データマイニング⇨機械学習・AIへ キャッチアップしつつ、キャリアアップしてきました! ⇨『Juliaデータサイエンス』(2017年刊行: 分担翻訳) https://00m.in/wSR0u
  3. 3. まず、最近、グラフを用いた知識表 現が増えているな・・・ • Network analysis • Deep Graph Reinforcement learning • Deep Graph Recommendation 3
  4. 4. オントロジーのグラフ(分析)の諸相 4
  5. 5. オントロジーのグラフ(分析)と他のネットワークとの相 違点 1.ネットワークの可視化が最終目的ではない 2.「Is-a」, 「has-a」などを使って、定義してゆき、知識体系を構築し, 推論を働かせることにある. 5
  6. 6. 今回,なぜ,オントロジーグラフに着目 したか? 6
  7. 7. 背景 Q1: 上記の会話文に起きていることは何 か? 7 ちょっと暑い ね... 窓を開けよ うか? 1/25
  8. 8. 8 山田さん!部屋 の温度が暑いと 思わないか? うん、そうだね. じゃあ,私があな たのために,窓を 開けようか? 1/25 →A1: 「省略」が多いい!、 「含意」や「推移」が存在してい
  9. 9. 9 山田さん!部屋 の温度が暑いと 思わないか? うん、そうだね. じゃあ,私があな たのために,窓を 開けようか? 部屋が暑くてた まんないから、 山田さんに窓を 開けさせよう! 1/25 Q2: 省略以外に,何が欠けているで しょうか?
  10. 10. →Q2: 「省略」以外に,「含意」 や「推移」が存在している. 10 山田さん!部屋 の温度が暑いと 思わないか? うん、そうだね. じゃあ,私があな たのために,窓を 開けようか? 部屋が暑くてた まんないから、 山田さんに窓を 開けさせよう! 1/25
  11. 11. 背景 →対話システムで実現するには… = 会話文での「省略」や「含意・推意」, さらに、「敬語」,「比喩表現」まで,理 解する必要がある! = 一度、整理する必要がある! 11 1/25
  12. 12. 背景 昨年は,「含意・推意」, 「敬語」の み対象とした! =今年は,会話文での「省略」,「比 喩表現」は,取り組む予定! 12 1/25
  13. 13. 2.目的 →対話システム などに活かした い! 13 3/25
  14. 14. 3.得られた知見 14 3/25
  15. 15. 3.得られた知見 15 12/25 真理: 「お母さん、私が明日泊ま りにゆくの知ってるの?」 美佐: 「ふとんを干してたわ」 Q3: ポライトネス(語用論)と敬語 表現は同じだろうか?
  16. 16. 私たちの日常会話 =省略・含意・推意ばかり =自然な会話 • 上記の会話は親と子の何度も会っていて、省略や含 意・推意が多分に含まれて、会話が成立している 16
  17. 17. これまで試したアプローチ(3つ) 17
  18. 18. 見込まれるアプローチ・手段  Prolog/ Lisp/ Coq ⇒主に三段論法による推論  ディープラーニング(LSTM End-To- End) ⇒学習による対話応答の生成 オントロジー工学による推論(Protégé, 法造)・語用論(言語学) ⇒三段論法より、やや複雑な推論が可能 18
  19. 19. ①Prolog/ Lisp ⇒主に三段論法による推論 • [三段論法] [前提]A→B B→Cならば、[結論]A→C • 前提1:どの人間も死ぬものである。 前提2:ソクラテスは人間である。 結論:したがって、ソクラテスは死ぬものである。 • 形式的に妥当な三段論法は、24パターンも存在 する 引用先URL:三段論法Qiita https://qiita.com/rissy/items/c3e6edb368e325a65f16 24パターン https://qiita-user-contents.imgix.net/https%3A%2F%2Fqiita-image- store.s3.amazonaws.com%2F0%2F318478%2Fb3830579-8e26-f2d0-80e8- 4db2ae1627e0.png?ixlib=rb-1.2.2&auto=format&gif- 19
  20. 20. ②ディープラーニング (LSTM End-To-End) ⇒学習による対話応答の生成 • そもそも,チャットボットなどに,敬語や敬意表現,比 喩などのコーパスが整備されていない・・・ • 場面に応じて,敬意表現は必ず出てくる. 例)上司と部下の会話など →コーパスの整備が必要 →大学の先生に見せてくれと言ったら、ダメだった →やや閉鎖的な領域かも?? 20
  21. 21. ③オントロジー工学による推論 ⇒三段論法より、やや複雑な推論が可能 • 既に,シャーロックホームズの小説を題材に,設定されているナレッジグラフを用 いて,推理・推論しようとするもの.誰彼とは犬猿の関係にあったであろう・・・な どを導き出す. • データは小説で,小説の中の文章と会話が対話応答生成に使えそうだ!と捉 えました. ・古崎先生や溝口先生が中心になって,毎年,開催されている! https://challenge.knowledge-graph.jp/2019/ 21
  22. 22. ③オントロジー工学による推論 今回は既存のエディターを用いて,紹介し ます! 22
  23. 23. ③オントロジー工学による推論 ‐エディターの比較‐ • Protégé: stanford大学が開発したもので、広く使われている。 • 法造:日本製で古崎・溝口先生らが開発、ロールの概念が正しく反映で きる。 ・上記の表:古崎・溝口(2005)「オントロジー構築ツールの現状」より引用 https://jsai.ixsq.nii.ac.jp/ej/?action=pages_view_main&active_action=repository_view_mai n_item_detail&item_id=6427&item_no=1&page_id=13&block_id=23 23
  24. 24. 今回は,Protégéを取り上げます! ◆ Protégé:世界で最も有名かつ利用されている オントロジー構築支援ツール • ユーザ登録数:約17万人(2011年5月) • 開発元:Stanford大学Medical Informatics • 入手先URL:http://protege.stanford.edu/ Cf 法造:日本製で古崎・溝口先生らが開発、ロー ルの概念が正しく反映できる。 • 入手先URL:http://www.hozo.jp/index_jp.html 24
  25. 25. オントロジーエディターによる推論 ≒グラフ分析? • オントロジーとは(イメージでの理解で) オントロジーエディ ターによる推論エン ジンで正規化でき る! ※ 上田(2006)より引用 25
  26. 26. オントロジーのメリット 1.部品などの何層にも渡る「ジャンル分類」に。 2.SEOなど検索エンジンの適用に。 3.三段論法,さらにそれ以上の推論に。 ※三段論法ぐらいなら、人間の頭脳で推論できるが、 それ以上の場合にはコンピュータで推論・管理すること が有用。 26
  27. 27. • クラス階層,プロパティ階層,クラス公理を定義する 必要がある. オントロジーエディターによる推論 (Protege) ① 27
  28. 28. オントロジーエディターによる推論 (Protege)② • 必要十分条件(完全公理)や部分条件(部分公理)等 を設定する必要がある. 28
  29. 29. まとめ① • 私たちの日常会話は省略や含意・推意ばかりです。 ↓ • ナレッジグラフ(オントロジー)を用いるとできそうだ! ↓ • 小説の中での会話文なら、実現しそうだ! • しかし、ナレッジグラフの設定が非常に手間暇がか かる eg.「is-a」, 「has-a」以外にも設定 ⇒尐しでも自動化できるように検討したいです! 29
  30. 30. まとめ② (基本:初心者へ) Protégéや法造で試してみてください! https://protege.stanford.edu/products.php#we b-protege (応用:上級者へ) オントロジーのナレッジグラフ推論のコードを見て試 してください!! https://github.com/KnowledgeGraphJapan/Ch allenge 30
  31. 31. ご清聴ありがとうございました! 31
  32. 32. 質疑応答 • 含意や行間を読むタスクは、一番、 難しいのはないか。 • Poincare Embedding(ポアンカレ エ ンベッディング)など、2017年に広 まった手法を適用したら、少しは単 語間の意味が強まるのではないか。 • 専門外なのでわからなかった。 →すみません。これは自然言語理 解/ NLU(Natural Language Understanding)の分野でした。 32
  33. 33. 参考文献・URL① • 1.古崎・溝口(2005)「オントロジー構築ツールの現状」人工知能学会誌 Vol.20No.6 2005年11月 • 2.川村, 江上, 長野, 大向, 森田, 山本, 古崎(2018) 「第1回ナレッジグ ラフ推論チャレンジ2018 ~解釈可能な人工知能を目指して~」2018年 度人工知能学会全国大会(第32回) • 3.太田(2019)言語学の語用論や配慮表現の先端技術への適用に関す る一考察~敬語や待遇表現などの配慮表現は本当に必要か~ • 人工知能学会 合同研究会 2019 太田 博三(放送大学) • プレゼン資料 • https://www.slideshare.net/otanet/sigconf-2019- slideota20191123 • 論文 • https://www.slideshare.net/otanet/thesis-sigconf2019- 1123hiromitsuota 33
  34. 34. 参考文献・URL② • 4.太田(2018)「文章自動生成における主な手法の比較検討 • 」ソフトウエアジャパン 2018 / IT フォーラムセッション/ ビッグデータ活用実務 フォーラム 2018 年 2 月 2 日(金) https://www.slideshare.net/otanet/slide-software-jpn20180202ota • 5.古崎・笹島・來村 著,溝口編(2006)「オントロジー構築入門」オーム社 • 6.第2回ナレッジグラフ推論チャレンジ2019 • https://challenge.knowledge-graph.jp/results/results2019.html • 7.第1回ナレッジグラフ推論チャレンジ2018開催報告 • ~説明性のある人工知能システムを目指して~ • 川村,・江上・, 田村・ 外園・ 鵜飼・ 小柳・ 西野・ 岡嶋・ 村上・ 高松・ 杉浦・ 白 松・,張・ 古崎 人工知能学会全国大会 第33回全国大会(2019) • https://www.jstage.jst.go.jp/article/pjsai/JSAI2019/0/JSAI2019_1K2J40 4/_pdf/-char/ja • 8.法造 - オントロジーエディタ - Hozo - Ontology Editor • http://www.hozo.jp/index_jp.html 34
  35. 35. 参考文献・URL③ 9.Protégé https://protege.stanford.edu/ 10. Prolog 三段論法 https://qiita.com/rissy/items/c3e6edb368e325a65f16 11.上田(2006)「オントロジーエディタProtege-OWLを使ったOWLオントロジー構築」 人工知能学会誌 12.AIDOS(2005)「オントロジ技術入門」 東京電機大学出版局 13.來村 著,・人工知能学会編集 (2012)「オントロジーの普及と応用」 オーム社 14. 松井(2001), 「関連性理論から見たポライトネス」 30巻No.3特集 月刊言語 15. 久野暲(1978)『談話の文法』大修館書店 35
  36. 36. 三段論法 形式的に妥当な三段論法は、24パターンも存在する 36
  37. 37. 三段論法 形式的に妥当な三段論法は、24パターンも存在する 37

×