Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

文献紹介:An Iterative 'Sudoku Style' Approach to Subgraph-based Word Sense DIsambiguation

522 views

Published on

動画

Published in: Science
  • Be the first to comment

  • Be the first to like this

文献紹介:An Iterative 'Sudoku Style' Approach to Subgraph-based Word Sense DIsambiguation

  1. 1. 文献紹介 2015/02/06 長岡技術科学大学 自然言語処理研究室 岡田 正平
  2. 2. 文献情報 An Iterative ‘Sudoku Style’ Approach to Subgraph-based Word Sense Disambiguation Steve L. Manion and Raazesh Sainudiin In Proc. of *SEM 2014, pp. 40-50. 2014. 2015/02/06 文献紹介 2
  3. 3. 概要 • subgraph-based WSD の改良 • sub-graph の構築と曖昧性解消を相互に行う (iterative approach) • 平均的な WSD system に iterative approach を適用する ことで state-of-the-art に匹敵する性能を示す 2015/02/06 文献紹介 3
  4. 4. 背景 WSDにおける知識獲得(教師データ)のボトルネック  語彙知識ベース(LKB)を利用した教師な手法への期待 • 語彙の粒度,ドメイン,言語横断 その1種である subgraph-based WSD に着目 1. LKBs から semantic subgraph を構築 2. graph に基づく重要度の指標を用いて語義を選択 2015/02/06 文献紹介 4
  5. 5. 既存の subgraph-based WSD 1. 入力中の語の列を見出し語化 • 𝑤1, ⋯ , 𝑤 𝑚 ⟼ ℒ, ℒ = 𝑙1, ⋯ , 𝑙 𝑚 2. LKB を 1つの semantic graph 𝒢 = (𝒮, ℰ)と見做す • 𝒮:ノード(語義)集合 • ℰ:エッヂ(語義間の関係)集合 2015/02/06 文献紹介 5
  6. 6. 既存の subgraph-based WSD 3. subgraph 𝒢ℒ を構築 • subtree paths, shortest paths, local edges 4. 各語の語義を選択 • 見出し語 𝑙𝑖 が持つ語義集合 𝑅 𝑙𝑖 = {𝑠𝑖,1, ⋯ , 𝑠𝑖,𝑘} • subgraph 𝒢ℒ 中の語義 𝑠𝑖,𝑗 の重要度スコア 𝜙(𝑠𝑖,𝑗) 2015/02/06 文献紹介 6
  7. 7. 既存の subgraph-based WSD 2015/02/06 文献紹介 7
  8. 8. 提案手法 • 従来手法では各ステップは独立 • 構築されたsubgraphは変更されない 2015/02/06 文献紹介 8
  9. 9. 提案手法 • 提案手法ではこれまでに WSD 済みの語を用いて subgraph を再構築していく 2015/02/06 文献紹介 9
  10. 10. 「数独」の解法 2015/02/06 文献紹介 10
  11. 11. 「数独」の解法 • 最初にヒントとなる数字がいくつか与えられている • 情報の多い(=曖昧性の少ない)ところから解いていく • 解いた(数字が記入された)マスは次のヒントとなる 2015/02/06 文献紹介 11
  12. 12. subgraph-WSD への適用 2015/02/06 文献紹介 12
  13. 13. subgraph-WSD への適用 • 単一語義語で subgraph を構築 • 語義の少ない(曖昧性が少ない)語から WSD して行く • WSD 済みの語の情報を加えて subgraph を再構築 2015/02/06 文献紹介 13
  14. 14. subgraph-WSD への適用 2015/02/06 文献紹介 14
  15. 15. subgraph-WSD への適用 2015/02/06 文献紹介 15 𝑚:単一語義の語 𝑎, 𝑏:2語義の語 図の例では語義𝑎2と𝑏1が選択される
  16. 16. subgraph-WSD への適用 2015/02/06 文献紹介 16 𝑐:3語義の語 図の例では 語義𝑐2が選択される 𝑎2, 𝑏1がsubgraphに 組み込まれる
  17. 17. subgraph-WSD への適用 2015/02/06 文献紹介 17
  18. 18. 提案手法 2015/02/06 文献紹介 18 𝜌:語義数 𝜌 𝑚𝑚𝑚:最大語義数
  19. 19. 評価実験 1 | 実験設定 提案手法 (Iterative approach) の有効性を確認 • LKB:BabelNet • データセット:SemEval 2013 Task 12 Multilingual WSD (English) data set • subgraph の構築方法 • subtree paths • shortest paths 2015/02/06 文献紹介 19
  20. 20. グラフ中の重要度指標 • In-Degree • Out-Degree • Betweenness Centrality • Sum Inverse Path Length • PageRank • HITS Kleinberg • personalized PageRank 2015/02/06 文献紹介 20
  21. 21. 文書レベルにおける結果 2015/02/06 文献紹介 21
  22. 22. 文レベルにおける結果 2015/02/06 文献紹介 22
  23. 23. 改善例 Spanish [1]football players playing in the All-Start [4]League and in powerful [12]clubs of the [2]Premier League of [9]England are during the [5]year very active in [4]league and local [8]cup [7]competitions and there are high-level [25]shocks in the [10]European Cups and [2]European Champions League. *[ ]内の数字は語義数 2015/02/06 文献紹介 23
  24. 24. 改善例 Spanish [1]football players playing in the All-Start [4]League and in powerful [12]clubs of the [2]Premier League of [9]England are during the [5]year very active in [4]league and local [8]cup [7]competitions and there are high-level [25]shocks in the [10]European Cups and [2]European Champions League. *[ ]内の数字は語義数 2015/02/06 文献紹介 24
  25. 25. 評価実験 2 最適化の後,他手法と比較 • 比較システム:SemEval 2013 Task 12 より 2015/02/06 文献紹介 25
  26. 26. 評価実験 2 | 結果 2015/02/06 文献紹介 26 MFS: Most Frequent Sense + : back-off strategy
  27. 27. 評価実験 2 | 結果 2015/02/06 文献紹介 27 PR: PageRank PPR: Personalized PR
  28. 28. まとめ • subgraph-based WSD の改良 • sub-graph の構築と曖昧性解消を相互に行う (iterative approach) • 平均的な WSD system に iterative approach を適用する ことで state-of-the-art に匹敵する性能を示す 2015/02/06 文献紹介 28

×