Download free for 30 days
Sign in
Upload
Language (EN)
Support
Business
Mobile
Social Media
Marketing
Technology
Art & Photos
Career
Design
Education
Presentations & Public Speaking
Government & Nonprofit
Healthcare
Internet
Law
Leadership & Management
Automotive
Engineering
Software
Recruiting & HR
Retail
Sales
Services
Science
Small Business & Entrepreneurship
Food
Environment
Economy & Finance
Data & Analytics
Investor Relations
Sports
Spiritual
News & Politics
Travel
Self Improvement
Real Estate
Entertainment & Humor
Health & Medicine
Devices & Hardware
Lifestyle
Change Language
Language
English
Español
Português
Français
Deutsche
Cancel
Save
EN
Uploaded by
Kow Kuroda
294 views
MSFAを使った意味(役割)タグづけ: 語彙意味論に基づく言語資源開発, Part 2
言語処理学会第14回年次大会のチュートリアル (2008/03/17) で発表した時に使ったスライド
Science
◦
Related topics:
Lexical Semantics
•
Read more
0
Save
Share
Embed
Embed presentation
Download
Download to read offline
1
/ 60
2
/ 60
3
/ 60
4
/ 60
5
/ 60
6
/ 60
7
/ 60
8
/ 60
9
/ 60
10
/ 60
11
/ 60
12
/ 60
13
/ 60
14
/ 60
15
/ 60
16
/ 60
17
/ 60
18
/ 60
19
/ 60
20
/ 60
21
/ 60
22
/ 60
23
/ 60
24
/ 60
25
/ 60
26
/ 60
27
/ 60
28
/ 60
29
/ 60
30
/ 60
31
/ 60
32
/ 60
33
/ 60
34
/ 60
35
/ 60
36
/ 60
37
/ 60
38
/ 60
39
/ 60
40
/ 60
41
/ 60
42
/ 60
43
/ 60
44
/ 60
45
/ 60
46
/ 60
47
/ 60
48
/ 60
49
/ 60
50
/ 60
51
/ 60
52
/ 60
53
/ 60
54
/ 60
55
/ 60
56
/ 60
57
/ 60
58
/ 60
59
/ 60
60
/ 60
More Related Content
PDF
Is there a NULL there?: Null anaphora in Classical Nahuatl
by
Mitsuya Sasaki
PDF
Python nlp handson_20220225_v5
by
博三 太田
PDF
黒い目の大きな女の子:構文から意味へ
by
Hiroshi Nakagawa
PDF
Code jp2013で行った ショートコーディング について
by
Fumihito Yokoyama
PDF
形容詞と意味フレームの係わり方について
by
Kow Kuroda
PDF
Jsai2021 winter ppt_ota_20211127
by
博三 太田
PPTX
NLTK Book Chapter 2
by
torithetorick
PDF
コーパス事例の観察に基づく日本語清掃表現の記述的一般化,並びに自作例による妥当性の検証
by
Kow Kuroda
Is there a NULL there?: Null anaphora in Classical Nahuatl
by
Mitsuya Sasaki
Python nlp handson_20220225_v5
by
博三 太田
黒い目の大きな女の子:構文から意味へ
by
Hiroshi Nakagawa
Code jp2013で行った ショートコーディング について
by
Fumihito Yokoyama
形容詞と意味フレームの係わり方について
by
Kow Kuroda
Jsai2021 winter ppt_ota_20211127
by
博三 太田
NLTK Book Chapter 2
by
torithetorick
コーパス事例の観察に基づく日本語清掃表現の記述的一般化,並びに自作例による妥当性の検証
by
Kow Kuroda
Viewers also liked
PDF
[教育のための] コミュニケーションは双方向的である
by
Kow Kuroda
PDF
20120906 dalende kosten_voor_nieuwbouw
by
BeBright Consulting
PDF
Wifi Marketing tại sân bay
by
Snow Summer
PDF
บริษัทหลักทรัพย์ หรือโบรกเกอร์ (Broker)
by
Peerapat Teerawattanasuk
PPTX
BME NAG presentation SIS AGM 2014
by
Sussex Interpreting Services
PDF
Learning network
by
tenglifangad
PPTX
Strategisch HR Beleid voor Vitale zorgorganisaties
by
BeBright Consulting
PPT
Rodrigo e edilson
by
edilsonmatheus
PPTX
Congres Sociaal Wonen 2030 dhr. M. Frequin
by
BeBright Consulting
PDF
Swot learning network1
by
tenglifangad
PDF
儿诗
by
tenglifangad
PPTX
Designyourownblog.com On-Site SEO Auidt
by
James Allen
PPTX
Congres Sociaal Wonen 2030 dhr. E. Breunesse
by
BeBright Consulting
PPTX
BeBright MROC
by
BeBright Consulting
PPTX
SIS AGM 2014 Directors' Report
by
Sussex Interpreting Services
PDF
Hitchhikers guide to creativity
by
BeBright Consulting
PPTX
Trend googleritis 0.9
by
BeBright Consulting
PDF
2010111209582136
by
tenglifangad
PPT
Congres Sociaal Wonen 2030 dhr. W. Boonstra
by
BeBright Consulting
PDF
儿诗
by
tenglifangad
[教育のための] コミュニケーションは双方向的である
by
Kow Kuroda
20120906 dalende kosten_voor_nieuwbouw
by
BeBright Consulting
Wifi Marketing tại sân bay
by
Snow Summer
บริษัทหลักทรัพย์ หรือโบรกเกอร์ (Broker)
by
Peerapat Teerawattanasuk
BME NAG presentation SIS AGM 2014
by
Sussex Interpreting Services
Learning network
by
tenglifangad
Strategisch HR Beleid voor Vitale zorgorganisaties
by
BeBright Consulting
Rodrigo e edilson
by
edilsonmatheus
Congres Sociaal Wonen 2030 dhr. M. Frequin
by
BeBright Consulting
Swot learning network1
by
tenglifangad
儿诗
by
tenglifangad
Designyourownblog.com On-Site SEO Auidt
by
James Allen
Congres Sociaal Wonen 2030 dhr. E. Breunesse
by
BeBright Consulting
BeBright MROC
by
BeBright Consulting
SIS AGM 2014 Directors' Report
by
Sussex Interpreting Services
Hitchhikers guide to creativity
by
BeBright Consulting
Trend googleritis 0.9
by
BeBright Consulting
2010111209582136
by
tenglifangad
Congres Sociaal Wonen 2030 dhr. W. Boonstra
by
BeBright Consulting
儿诗
by
tenglifangad
Similar to MSFAを使った意味(役割)タグづけ: 語彙意味論に基づく言語資源開発, Part 2
PPTX
All-but-the-Top: Simple and Effective Postprocessing for Word Representations
by
Makoto Takenaka
PDF
言語資源と付き合う
by
Yuya Unno
PPTX
Deep neural models of semantic shift
by
Makoto Takenaka
PDF
Kuroda & Hasebe NLP15 slides on Pattern Lattice Model
by
Kow Kuroda
PDF
CluBERT: A Cluster-Based Approach for Learning Sense Distributions in Multipl...
by
禎晃 山崎
PPTX
ニューラル日英翻訳における出力文の態制御
by
Hayahide Yamagishi
PDF
20190324 第6章 テキストデータのための素性
by
Kazuki Motohashi
PPTX
自然言語処理.pptx
by
Sora Kubota
PDF
読解支援プレゼン 4 28
by
kentshioda
PDF
入力文への情報の付加によるNMTの出力文の変化についてのエラー分析
by
Hayahide Yamagishi
PPT
111127.lsj143.田川 japanese conjugation and dm
by
Takumi Tagawa
PDF
自然演繹に基づく文間の含意関係の証明を用いたフレーズアライメントの試み
by
Hitomi Yanaka
PDF
Kuroda NLP17 slides on Parallel Simulated Error Correction method
by
Kow Kuroda
PDF
第三回さくさくテキストマイニング勉強会 入門セッション
by
antibayesian 俺がS式だ
PDF
Evaluating non expert_annotations_for_natural_language_tasks
by
浩気 西山
PPTX
Neural Models for Information Retrieval
by
Keisuke Umezawa
PDF
Joint inference of named entity recognition and normalization for tweets
by
Shunsuke Kozawa
PPTX
Microsoft Cognitive Services NLP APIs
by
zuhitoslide
PPTX
JSAI 1K3-2 知識ベースに基づく言語横断質問応答における訳質の影響
by
Kyoshiro Sugiyama
PDF
サポーターズ勉強会スライド 2018/2/27
by
Kensuke Mitsuzawa
All-but-the-Top: Simple and Effective Postprocessing for Word Representations
by
Makoto Takenaka
言語資源と付き合う
by
Yuya Unno
Deep neural models of semantic shift
by
Makoto Takenaka
Kuroda & Hasebe NLP15 slides on Pattern Lattice Model
by
Kow Kuroda
CluBERT: A Cluster-Based Approach for Learning Sense Distributions in Multipl...
by
禎晃 山崎
ニューラル日英翻訳における出力文の態制御
by
Hayahide Yamagishi
20190324 第6章 テキストデータのための素性
by
Kazuki Motohashi
自然言語処理.pptx
by
Sora Kubota
読解支援プレゼン 4 28
by
kentshioda
入力文への情報の付加によるNMTの出力文の変化についてのエラー分析
by
Hayahide Yamagishi
111127.lsj143.田川 japanese conjugation and dm
by
Takumi Tagawa
自然演繹に基づく文間の含意関係の証明を用いたフレーズアライメントの試み
by
Hitomi Yanaka
Kuroda NLP17 slides on Parallel Simulated Error Correction method
by
Kow Kuroda
第三回さくさくテキストマイニング勉強会 入門セッション
by
antibayesian 俺がS式だ
Evaluating non expert_annotations_for_natural_language_tasks
by
浩気 西山
Neural Models for Information Retrieval
by
Keisuke Umezawa
Joint inference of named entity recognition and normalization for tweets
by
Shunsuke Kozawa
Microsoft Cognitive Services NLP APIs
by
zuhitoslide
JSAI 1K3-2 知識ベースに基づく言語横断質問応答における訳質の影響
by
Kyoshiro Sugiyama
サポーターズ勉強会スライド 2018/2/27
by
Kensuke Mitsuzawa
More from Kow Kuroda
PDF
Insights from a large-scale web survey for Acceptability Rating Data for Japa...
by
Kow Kuroda
PDF
Reassessing PCA of Acceptability Rating Data for Japanese (ARDJ) using kernel...
by
Kow Kuroda
PDF
A look inside the distributionally similar terms
by
Kow Kuroda
PDF
屈折パラダイムの(心内)表現はどうなっているのか?
by
Kow Kuroda
PDF
ヒトがメタファー(表現)を使う理由: Reasons for use of metaphor(ic expression)s by human
by
Kow Kuroda
PDF
Kow Kuroda's talk at JCLA 16 Workshop: Methodology in Cognitive Linguistics, ...
by
Kow Kuroda
PDF
Kow Kuroda's talk at Concept Workshop, Japan Psychological Association 2011
by
Kow Kuroda
PDF
Formal Concept Analysis meets grammar typology
by
Kow Kuroda
PDF
表層語形から品詞はどれぐらい正確に予測可能か?
by
Kow Kuroda
PDF
Characterizing transferred epithet as alternation
by
Kow Kuroda
PDF
Situations as attractors for semantic interpretation
by
Kow Kuroda
KEY
言語の「自然態」を捉える理論の必要性
by
Kow Kuroda
KEY
Patter lattice as a model of human's language processing
by
Kow Kuroda
Insights from a large-scale web survey for Acceptability Rating Data for Japa...
by
Kow Kuroda
Reassessing PCA of Acceptability Rating Data for Japanese (ARDJ) using kernel...
by
Kow Kuroda
A look inside the distributionally similar terms
by
Kow Kuroda
屈折パラダイムの(心内)表現はどうなっているのか?
by
Kow Kuroda
ヒトがメタファー(表現)を使う理由: Reasons for use of metaphor(ic expression)s by human
by
Kow Kuroda
Kow Kuroda's talk at JCLA 16 Workshop: Methodology in Cognitive Linguistics, ...
by
Kow Kuroda
Kow Kuroda's talk at Concept Workshop, Japan Psychological Association 2011
by
Kow Kuroda
Formal Concept Analysis meets grammar typology
by
Kow Kuroda
表層語形から品詞はどれぐらい正確に予測可能か?
by
Kow Kuroda
Characterizing transferred epithet as alternation
by
Kow Kuroda
Situations as attractors for semantic interpretation
by
Kow Kuroda
言語の「自然態」を捉える理論の必要性
by
Kow Kuroda
Patter lattice as a model of human's language processing
by
Kow Kuroda
MSFAを使った意味(役割)タグづけ: 語彙意味論に基づく言語資源開発, Part 2
1.
MSFA を使った意味(役割)タグづけ 語彙意味論に基づく言語資源開発 [2] 黒田
航 // NICT NLP14 Tutorial 2008/03/17 1
2.
nlp14 tutorial 概要 ❖ 背景 ❖
自分の位置 ❖ Frame Semantics/FrameNet の予備知識 ❖ 辞書からタグつき用例集へ ❖ MSFA Lite を使ったタグづけの見本と解説 ❖ 知見と議論 ❖ これから 2
3.
Background 3
4.
nlp14 tutorial 私たちの仕事の “位置” Japan U.S. Europe Fillmore's Frame Semantics Berkeley
FrameNet Fillmore's Construction Grammar Ikehara's Theory of Nonlinear Expressions Kunihiro's Theory of Phenomeneme 1980 1990 2000 Japanese FrameNet German FrameNet Spanish FrameNet 2008 Goldberg's Construction Grammar SALSA 4
5.
nlp14 tutorial 私たちの仕事の “位置” Japan U.S. Europe Fillmore's Frame Semantics Berkeley
FrameNet Fillmore's Construction Grammar Ikehara's Theory of Nonlinear Expressions Kunihiro's Theory of Phenomeneme 1980 1990 2000 Japanese FrameNet German FrameNet Spanish FrameNet FOCAL 2008 Goldberg's Construction Grammar SALSA 5
6.
nlp14 tutorial 中心的な問題 ❖ 表現の意味の非構成性=非線形性
(池原ら 2005) をどう扱う か? ❖ 連語/ 慣用句/ 比喩表現などを全部合わせて ❖ 発想の転換: ❖ 非構成的な場合が常態で “例外”的なのは実は構成的に見 える場合の方 ❖ ヒトの言語処理が Rule-based/Principle-based ではなく Example-based/Memory-based なら必然的な帰結 6
7.
nlp14 tutorial 意味の非構成性 Sは Oを
捕まえた 逮捕した 捕獲した 呼び止めた (1) 彼らは 犯人を 1 1 0 0* (2) 彼らは 被害者を 0.5 0 0 0* (3) 彼らは ナマズを 1 0 1 0 (4) 彼らは メダカを 1 0 0.5 0 (5) 彼らは タクシーを 1 0 0 1 (6) 彼らは バスを 0.5 0 0 0.5 7
8.
nlp14 tutorial 状況=事態型のフレーム構造 ❖ <逮捕>の状況のフレーム要素 ❖
<(行)逮捕者 x>, <逮捕の相手 y>, <逮捕の場所 l >, <逮捕の 日付 t>, ... ❖ x の代表値は {警察, 検察},y の代表値は犯罪者 ❖ <捕獲>の状況のフレーム要素 ❖ <捕獲者 x>, <捕獲の対象 y>, <捕獲の道具>, <捕獲の場所 l >, <捕獲の時間帯 t>, ... ❖ y の代表値は x の獲物 8
9.
nlp14 tutorial 状況=事態型のフレーム構造 ❖ <タクシーの呼止め>の状況のフレーム要素 ❖
<呼び止め手=潜在的な利用者 x>, <流しのタクシー y>, < 手段>, <呼び止めの場所 l >, <呼び止めの時間帯 t>, ... ❖ <手段>の代表値は合図 (電話も可?), <呼び止めの場所 l > の代表値は交通の多い通り 9
10.
nlp14 tutorial フレームとフレーム要 素とパターンの関係 ❖ フレームの記述要素 の階層 ❖
#要素を含むものは 正確には意味フレー ムではなく,意味フ レームを実現するパ ターンの記述 超語彙意味論 語彙意味論 <逮捕>フレーム の記述要素 descriptor #が #で 逮捕 捕まえ 犯人 その場#を警察 #し #た 変項 = <逮捕>の フレーム要素 定項 = #要素 <逮捕>喚起要素 {<逮捕.EVO(=PRED)>, <逮捕.GOV>} <逮捕>の非喚起 要素 <逮捕>の述語化不可能な 喚起要素 <逮捕.EVO> <逮捕>の述語化可能な喚起要素 {<逮捕.GOV>, <逮捕.EVO=PRED>} <逮捕>の支配要素 <逮捕>.GOV <逮捕>の非支配要素 <逮捕.EVO=PRED> 単文の意味が記述 できるレベル 10
11.
nlp14 tutorial 意味型分類 意味役割/価値分類 yはその場からなくなる/ いなくなる可能性がある 捕まえ手(x)が 手段(z)で 動的対象(y)を 捕まえる ヒトの捕まえ手(x)が 手段(z)で 有益な動的対象(y)を 利用するために 捕まえる ヒトの捕まえ手(x)が 手段(z)で 有害な動的対象(y)を 制御するために 捕まえる 警察(x)が 捜査(z)で 犯人(y)を 捕まえる 自衛隊(x)が ワナ(z)で クマ(y)を 捕まえる 子供たち(x)が 網(z)で ナマズ(y)を 捕まえる コンサート帰りの一行(x)が 電話(z)で タクシー(y)を 捕まえる ヒトの以外の捕まえ手(x)が 手段(z)で 動的対象(y)を 捕まえる ヒトの捕まえ手(x)が 手段(z)で 動的対象(y)を 捕まえる 捕まえ手(x)が 手段(z)で ヒト以外の動物(y)を 捕まえる サル(x)が 手(z)で カニ(y)を 捕まえる 捕まえ手(x)が 手段(z)で ヒト(y)を 捕まえる 11
12.
nlp14 tutorial <目的>の重要性 ❖ “捕まえ手
x が手段 z で対象 y を捕まえる” の用例の x, y, z 名詞の意味タイプに基づく分類は単に効率が悪いだけでな く見当はずれな結果を生む ❖ “ x が z で y を目的 p のために捕まえる” の目的のレベルで の分類が効率が良く,有意義 ❖ 「チャンスを捕まえる」「イイ男を捕まえる」などのメ タファー用法に拡張しているのは,<捕まえ手 x が, 動的 対象 y を利用するために捕まえる>の方だけ 12
13.
nlp14 tutorial “辞書” からタグつき用例集へ ❖
辞書 (lexicon) = “文脈自由” な語の意味記述の難点 ❖ 低被覆率: 実例には辞書に載っていない例が山ほどある ❖ 低精度: 実例には判別が難しい例が河のようにある ❖ これらは表裏一体 ❖ MSFA は低精度の問題に対する解決策の一つ ❖ ただし被覆率は犠牲にしている 13
14.
nlp14 tutorial 語の使用の創造性? ❖ 文脈依存的な意味記述が必要と言うと「それには際限がな いのでは?」と言われる.理由は次: ❖
語 (の意味) の使われ方は “創造的” でしょ? ❖ “creativity” in word use (Pustejovsky 1995) ❖ だが,これは額面通りに受取るべき主張ではない. ❖ “創造的” な言い方で言われている “内容” には (少なくと も見かけほどは) 創造性も新規性もない ❖ ヒトの理解する内容は本質的に紋切り型 (= “創造的”の反意) 14
15.
nlp14 tutorial 何がしたいのか? ❖ Multidimensional
Semantic Indexing ❖ ただし Indices は固定のリストではなく,一定の “文法” で生成されると考える
16.
nlp14 tutorial 辞書と意味理論の関係 1/2 ❖
語義の分析・記述は辞書編纂の中で最も難しい部分である が,その進歩がおそいのは,基になる現代日本語の意味研 究が未発達であることが大きな原因であるように思われ る.その理由として,学会におけるいままでの現代語研究 の蔑視,意味研究よりも文法研究の重視ということが挙げ られよう.(国広『理想の国語辞典』, p. 2) 16
17.
nlp14 tutorial 辞書と意味理論の関係 2/2 ❖
現行国語辞書の語義記述の不完全な点は以下に示すところ から明らかになると思うが,それならばと,多数の分析者 と時間を投入すればすぐ成果が出るかというと,そう簡単 にはことが運ばないところがこの問題の泣き所である.語 義記述の進歩のためには,その理論的な基礎となる意味論 が発達しなければならない.しかしこちらの進歩は遅々と している.ともかく,意味論の発達と辞典の発達は雁行し ているのである.(国広『理想の国語辞典』, p. 3) 17
18.
nlp14 tutorial 言語資源開発に先立つもの ❖ それは ❖
日本語の意味記述ができる意味分析の専門家の育成 ❖ これがMSFA の実践を通して本当に実現したいこと ❖ 専門家の育成が意味を扱う言語資源の開発に先決するべき なのは当然なのに,それはNLPで一般に理解されていない ❖ 専門家の育成をせず,適当な業者への外注で済ませる風 潮は,長い目で見ると良くない影響を生んでいる ❖ 仕様書を書く人に応用から独立した “理論” がないと致命的では? 18
19.
nlp14 tutorial 人手の無用化は可能か? 1/2 ❖
大規模データの統計処理の産物は,将来的に人手解析を完 全に無用にするような精度に至るか? ❖ 多くのNLP研究者の夢 ❖ それが原理的に不可能だと考える理由はないが,それを “教 師なし” の手法で実現するのは不可能かも知れない ❖ 100年後にはどうなっているかわかりませんが,自分が 生きている間にそんな夢の時代が来るとは信じ難い 19
20.
nlp14 tutorial 人手の無用化は可能か? 2/2 ❖
教師アリの手法が不可欠なら,ちゃんとした教師データが あることが自動化のための必須条件 ❖ だが,誰がちゃんとした教師データを作成するのか? ❖ 業者に外注して作成した産物にそれが期待できるのか? ❖ 目的ごとにちゃんと教師データを作成できる人材を育成し ないとまずいのでは? ❖ MSFA は言語分析者の訓練,育成のための枠組み 20
21.
MSFA Lite Step
by Step 21
22.
nlp14 tutorial 発表後の補足 ❖ “語義”
の扱いに関して ❖ MSFA は (分類ラベルとしての) 語義を想定しない ❖ 語義に想定するのは ❖ 動詞の場合は状況のクラスター ❖ 名詞の場合はおのおのの状況を構成する意味役割の配列
23.
nlp14 tutorial MSFA Lite ❖
2007年夏に導入された新しい仕様で,次が主な特徴 ❖ 効率化のためにタグづけ対象となるフレーム範囲の制限 ❖ 当初は “述語一つについてフレーム一つ” と考えていたが実は ... ❖ NLPの利用条件を考え,フレームごとにフレーム要素の MARKERの値を明示化 ❖ 代表的な述語を選び,その表層格パターンを明示化 ❖ 状況 (のフレーム) は本来,述語とは別に存在する抽象的な実体 ❖ MSFA のパターン辞書化の土台 23
24.
nlp14 tutorial 注意 ❖ MSFA
の目的は辞書の構築ではないが,意味タグづけの副 産物として次のものが構築される A. フレームのデータベース (Frame List) (1000+) B. フレーム要素のデータベース (FrameElement List) (7000+) C. フレーム要素の実現値になっている部分文字列のデータ ベース (Word/Phrase List) (4000+) ❖ A, B の階層化の産物として C が複合表現のシソーラスになる D.意味に対応したパターン/構文のデータベース (未実装) 24
25.
nlp14 tutorial MSFA Lite
の見本 ❖ 高知県の橋本大二郎知事は三十一日、都道府県で初めて一 般事務職の採用資格から国籍条項を撤廃する方針を明らか にした。[京大コーパス: 950101009-001] 25
26.
nlp14 tutorial Step 0:
形態素への分割 ❖ JUMANの解析結果を人手修正 ❖ [高知, 県, の, 橋本, 大二郎, 知事, は, 三十一, 日, 、, 都道府県, で, 初め~, て, 一般, 事務, 職[員], の, 採用, 資格, から, 国籍, 条 項, を, 撤廃, する, 方針, を, 明らか~, に, し~, た, 。] ❖ [...]は補った要素 ❖ “X~Y” は JUMAN より細かい分割 26
27.
nlp14 tutorial ! " # $ % & ' ( ) !* !! !" !# !$ !% !& !' !( !) "* "! "" "# "$ "% "& "' "( ") #* #! #" ## #$ #% #& #' #( + ,
- . / 0 !"#$%&'( !) !* !+ !, !- !"#$%&./& !"#$%01%2#.3/45 !"#$%06#$% 7%..348 9:;<=> ?@ AB CDE FF0G"%H3I#.% J/"0KLM NO PQ345.#4I%&/J PQRS<*T*U +V-,WXX W < YS Z[ O] PQNOWO]X ^ _`a PQbcde,*RX R f TUVW PQRS<*T*U +V-,WX g 9hi 9:;<= >jkML l am ]n o QpX < ?@ ?@jKLM qr st uv PQRSuvX wx y AB ABjKLM z{ |} y Ctsi CD EjkML~G1k( • €i • ‚ Step 1 ❖ 動詞の活用形とサ変名詞を選ん で,フレーム f の喚起要素 f.EVO か支配要素 f.GOV の認 定と暫定的な命名 ❖ Setting の列に背景情報の明示化 [任意] 27
28.
nlp14 tutorial ) !* !! !" !# !$ !% !& !' !( !) "* "! "" "# "$ "% "& "' "( ") #* #! #" ## #$ #% #& #' #( Z[ O] PQNOWO]X ^ _`a
PQbcde,*RX R f TUVW PQRS<*T*U +V-,WX g 9hi 9:;<= >jkML l am ]n o QpX < ?@ ?@jKLM qr st uv PQRSuvX wx y AB ABjKLM z{ |} y Ctsi CD EjkML~G1k( • €i • ‚ Step 1 28
29.
nlp14 tutorial Step 2 ❖
Step 1 で特定されたフレーム f1, ..., fn のフレーム要素の特定 ❖ f者, f体, fの対象, fの手段, fの時 期, fの内容, .. ❖ フレーム要素名の指定には [Attribute: Value] (e.g., f.EVO: f 者) 表記を許している ❖ [Y; (f.EVO:) f.X] という表記で は Y が語彙化された要素 (e.g., 獲物) ! " # $ % & ' ( ) !* !! !" !# !$ !% !& !' !( !) "* "! "" "# "$ "% "& "' "( ") #* #! #" ## #$ #% #& #' #( #) $* $! $" $# + , - . / 0 !"#$%&'( !) !* !+ !, !- !"#$%&./& !"#$%01%2#.3/45 !"#$%06#$% 7%..348 9:;<=>?@ A<B CD EF GHI JJ0K"%L3M#.% N/"0OPQ R GHIS T U?VWB?XWB 9:;<=>?@ A<BW TT YZ[] T U?^WB _`?9:;<= >?@A<B<B TT Y6P6a bc U?345.#4M%&/N U?de<*f*g +h-,iBB jk?9:;<= >?@A<B <Bl*m+no0@A l*m+n CDW ?p$%./4q$3MB EFW ?p$%./4q$3MB jkmrs?GH I<Bl*m+n i < Ytmu Ytmu Ytmu Ytmu ve GHIW wxy c@ U?bcic@B z Yt {|} U?~•€•,*dB ‚ƒ?GHI<B d TT Y„Z… † fghi U?de<*f*g +h-,iB ‡ˆ?9:;<= >?@A<B<B ‰AmŠ‹?EF <B ‰AmŠ‹?GH I<B u Yu 9Œ• 9:;<=>?@ A<BŽaQP • Y• Y• }• jk?9:;<= >?@A<B <Bl+m+no0@A l+m+n jk?CD<B ‘’?EF<B jkmrs?GH I<Bl+m+n @“ ” ?•B < Y– CD CDŽOPQ —˜ Š‹?CD<B ™š YZ›œ•• Y™š žŸ U?dežŸB jk?EF<B Š – Y– EF EFŽOPQ ¡ E FŽOPQŽ7¢KpaU £ ¤¥ – Y– G𙕠GH IŽaQP¦K1a( Z S• § GHIŽaQPŽaU£ ¨29
30.
nlp14 tutorial $ % & ' ( ) !* !! !" !# !$ !% !& !' !( !) "* "! "" "# N/"0OPQ T U?VWB?XWB 9:;<=>?@ A<BW TT
YZ[] T U?^WB _`?9:;<= >?@A<B<B TT Y6P6a bc U?345.#4M%&/N U?de<*f*g +h-,iBB jk?9:;<= >?@A<B <Bl*m+no0@A l*m+n CDW ?p$%./4q$3MB EFW ?p$%./4q$3MB jkmrs?GH I<Bl*m+n i < Ytmu Ytmu Ytmu Ytmu ve GHIW wxy c@ U?bcic@B z Yt {|} U?~•€•,*dB ‚ƒ?GHI<B d TT Y„Z… † fghi U?de<*f*g +h-,iB ‡ˆ?9:;<= >?@A<B<B ‰AmŠ‹?EF <B ‰AmŠ‹?GH I<B u Yu 9Œ• 9:;<=>?@ A<BŽaQP • Y• Y• }• jk?9:;<= >?@A<B jk?CD<B ‘’?EF<B jkmrs?GH Step 2 30
31.
nlp14 tutorial Step 3 任意だが重要 ❖
e.MOD, e.ARG, e.EXT, e.SUP の 認定 ❖ 動詞やサ変名詞が喚起要素に なっていないフレーム (e.g., <予 定>)や背景的なフレーム (e.g., < 報告>) 記述の追加 ❖ Vの資格,(Vする) 方針 ! " # $ % & ' ( ) !* !! !" !# !$ !% !& !' !( !) "* "! "" "# "$ "% "& "' "( ") #* #! #" ## #$ #% #& #' #( #) $* $! $" $# $$ $% $& $' + , - . / 0 1 2 3 !"#$%&'( !) !* !+ !, !- !. !/ !0 !"#$%&12& !"#$% !"#$%34#$% 5%11678 9:;& <=%<2>%?@ ABCDEF;G HD@ IJ KLDEF;MN D@;&<=%<2>%?@ OP QF;& <=%<2>%?@ RST UU3V"%?6W#1% X2"3YZ[ 9:]^_ IJ`_ ab_ QFcde_fg^ _h i j;kl@;ml@ 9:;& <=%<2>%?@l ABCDEF;G HD@l ii nd nop_q i j;rl@ st;9:;& <=%<2>%?@D@ st;ABCDE F;GHD@D@ ii no n4Z4u vw j;67x1#7W%&2X j;yzD*{*| +}-,~@@ •€;9:;& <=%<2>%?@D@ •‚;ABCDE F;GHD@ D@ƒ*f+„…3GH ƒ*f+„ IJl ;†$%127‡$6W@ KLDEF;MN D@;&<=%<2>%?@ l ;†$%127‡$6W@ OPl ;†$%127‡$6W@ QF;& <=%<2>%?@l ;†$%127‡$6W@ •‚f•€;RS TD@ƒ*f+„ ~ D ndfg ndfg ndfg ndfg nd ndfg ˆz RSTl ‰Š‹ wG j;vw~wG@ RSTlŒuj• Ž nd ••‘ j;’“”•,*y@ –—;RSTD@ y ii n˜o™ š {|}~ j;yzD*{*| +}-,~@ ›œ;ABCDE F;GHD@D@ •H;OP D@ŒžŸY •H;QF;& <=%<2>%?@ D@ŒžŸY •H;RST D@ŒžŸY g ng Ab ABCDEF;G HD@Œu[Z •H;OPD@ •H;QF;& <=%<2>%?@D@ •H;RSTD@ ] ng ng ng ‘¡ •‚;ABCDE F;GHD@ D@ƒ+f+„…3GH ƒ+f+„ •‚;IJ D@Œ”Z( •‚;KLDEF ;MND@;& <=%<2>%?@D@ ¢;OPD@Œ”Z( •€;QF;& <=%<2>%?@D@ •‚f•€;RS TD@ƒ+f+„ G£ ¤ •‚;IJD@ ;¥@ D n¦ IJ IJŒYZ[ ii no §¨ KL;IJD@ KLDEF;MN D@;& <=%<2>%?@Œu[Z …3KL©3•‚;EF D@ ¢;OPD@ ª« no¬-^] n¦ nª« ®¯ j;yz®¯@ •‚;OP D@Œ”Z( K° •‚;OPD@ ¦ n¦ OP OPŒYZ[ `_ O PŒYZ[Œ5±V†uj • ii n˜q^²™ ³´ QF;& <=%<2>%?@Œu[Z µVŸu( ¦ n¦ R«ª RS TŒu[ZµVŸu( o ¶ RSTŒu[ZŒuj• ii nq·¸q¦ ¹ 31
32.
nlp14 tutorial ! " # $ % & ' ( ) !* !! !" !# !$ !% !& !' !( !) "* "! "" "# "$ "% "& "' "( ") #* !"#$%&'( !)
!* !+ !, !- !. !/ !0 !"#$%&12& !"#$% !"#$%34#$% 5%11678 9:;& <=%<2>%?@ ABCDEF;G HD@ IJ KLDEF;MN D@;&<=%<2>%?@ OP QF;& <=%<2>%?@ RST UU3V"%?6W#1% X2"3YZ[ 9:]^_ IJ`_ ab_ QFcde_fg^ _h i j;kl@;ml@ 9:;& <=%<2>%?@l ABCDEF;G HD@l ii nd nop_q i j;rl@ st;9:;& <=%<2>%?@D@ st;ABCDE F;GHD@D@ ii no n4Z4u vw j;67x1#7W%&2X j;yzD*{*| +}-,~@@ •€;9:;& <=%<2>%?@D@ •‚;ABCDE F;GHD@ D@ƒ*f+„…3GH ƒ*f+„ IJl ;†$%127‡$6W@ KLDEF;MN D@;&<=%<2>%?@ l ;†$%127‡$6W@ OPl ;†$%127‡$6W@ QF;& <=%<2>%?@l ;†$%127‡$6W@ •‚f•€;RS TD@ƒ*f+„ ~ D ndfg ndfg ndfg ndfg nd ndfg ˆz RSTl ‰Š‹ wG j;vw~wG@ RSTlŒuj• Ž nd ••‘ j;’“”•,*y@ –—;RSTD@ y ii n˜o™ š {|}~ j;yzD*{*| +}-,~@ ›œ;ABCDE F;GHD@D@ •H;OP D@ŒžŸY •H;QF;& <=%<2>%?@ D@ŒžŸY •H;RST D@ŒžŸY g ng Ab ABCDEF;G HD@Œu[Z •H;OPD@ •H;QF;& <=%<2>%?@D@ •H;RSTD@ ] ng ng ng ‘¡ •‚;ABCDE F;GHD@ D@ƒ+f+„…3GH ƒ+f+„ •‚;IJ D@Œ”Z( •‚;KLDEF ;MND@;& <=%<2>%?@D@ ¢;OPD@Œ”Z( •€;QF;& <=%<2>%?@D@ •‚f•€;RS TD@ƒ+f+„ G£ ¤ •‚;IJD@ ;¥@ D n¦ IJ IJŒYZ[ ii no §¨ KL;IJD@ KLDEF;MN D@;& <=%<2>%?@Œu[Z …3KL©3•‚;EF ¢;OPD@ Step 3 32
33.
nlp14 tutorial Step 3
の要点 ❖ 事態喚起名詞 (e.g., Xの資格, Xする方針, Xの姿勢) の認定 ❖ “Xの資格を{もつ, 有する}”, “Xの方針を{取る, 進める}”, “Xの姿勢 を{取る, 見せる}” のように支援動詞構文をなす ❖ “もつ”, “取る” “見せる” が喚起する事態は,連語が喚起する事態 と一致しない ❖ <予定>フレームの認定 ❖ 「*予定する」とは言えないが,元の文で「方針」と「予定」を 交換しても文意が保存される 33
34.
nlp14 tutorial Step 4 任意だが重要 ❖
フレーム間関係の特定 ❖ 語義の階層関係,ズレの 指定によって意味の多重 性の明示化 ! " # $ % & ' ( ) !* !! !" !# !$ !% !& !' !( !) "* "! "" "# "$ "% "& "' "( ") #* #! #" ## #$ #% #& #' #( #) $* $! $" $# $$ $% $& + , - . / 0 1 2 3 4 5 6 !"#$%&'( !) !* !+ !, !- !. !/ !0 !1 !2 !*) !"#$%&34& !"#$% 5%6#37489 :"%9;::49%9 !*) <=#"#<3%"7>%9 !. :"%9;::49%9?!, %6#@4"#3%9ABA 3#"C%39?!0D :"%9;::49%9 3#"C%39?!.D E3#"C%39?!0 :"%9;::49%9?!- 3#"C%39?!*) !"#$%?F#$% G%3378C HIJ& KA%K4L%MN OPQRSTJU VRN WX YZRSTJ[ RNJ&KA%K4L%MN ]^ _` Ja$%3#:=4"7<N ^b cTJ& KA%K4L%MN def gh ii?j"%M7<#3% k4"?lmn HIopqr WXsr tuvpqwr cTxyzr{|q r} ~ •J€•NJ‚•N HIJ& KA%K4L%MN• OPQRSTJU VRN• ~~ ƒy ƒ„…r† ~ •J‡•N ˆ‰JHIJ& KA%K4L%MNRN ˆ‰JOPQRS TJUVRNRN ~~ ƒ„ ƒFmFŠ ‹Œ •J7893#8<%&4k •J•ŽR*•*• +‘-,’NN “”JHIJ& KA%K4L%MNRN •–JOPQRS TJUVRN RN—*{+˜™?UV —*{+˜ WX• Ja$%348š$7<N YZRSTJ[ RNJ&KA%K4L%MN • Ja$%348š$7<N ]^• Ja$%348š$7<N _` Ja$%3#:=4"7<N • Ja$%348š$7<N ^b• Ja$%348š$7<N cTJ& KA%K4L%MN• Ja$%348š$7<N •–{“”Jde fRN—*{+˜ •–{“”Jgh RN—*{+˜ ’ R ƒy{| ƒy{| ƒy{| ƒy{| ƒy{| ƒy{| ƒy ƒy{| ƒy{| ›Ž def• gh• œ•ž ŒU •J‹Œ’ŒUN Ÿ ƒy ƒy ¡¢ •J£¤¥¦,*•N §¨JdefRN §¨JghRN • ~~ ƒv„w ƒv„w © ••‘’ •J•ŽR*•*• +‘-,’N ª«JOPQRS TJUVRNRN ¬VJ]^ RN-®5l ¬VJ_` Ja$%3#:=4"7<N RN-®5l ¬VJ^b RN-®5l ¬VJcTJ& KA%K4L%MN RN-®5l ¬VJdef RN-®5l ¬VJgh RN-®5l | ƒ| Ou¯ OPQRSTJU VRN-Šnm ¬VJ]^RN ¬VJ_` Ja$%3#:=4"7<N ¬VJ^bRN ¬VJcTJ& KA%K4L%MNRN ¬VJdefRN ¬VJghRN p ƒ| ƒ| ƒ| ƒ| ƒ| ƒ| ¢° •–JOPQRS TJUVRN RN—+{+˜™?UV —+{+˜ •–JWX RN-¥m( •–JYZRST J[RNJ& KA%K4L%MN RN-®5l ±J]^RN-¥m( ±J_` Ja$%3#:=4"7<N RN-¥m( •–J^b RN-¥m(-¥m(-¥ m( “”JcTJ& KA%K4L%MNRN •–{“”Jde fRN—+{+˜ •–{“”Jgh RN—+{+˜ U² ³ •–JWXRN J´N R ƒµ ƒR WX WX-lmn •–JYZRST J[RNJ& KA%K4L%MNRN ~~ ƒ„ ¶· YZJWXRN YZRSTJ[ RNJ& KA%K4L%MN-Šnm ™?YZD?•–JST RN ±J]^RN ±J_` Ja$%3#:=4"7<N RN •–J^b RN-¥m(-¥m( ¸¹ ƒ„º»qp ƒµ ƒ¸¹ ƒ¸¹ ƒ„zr{R ¼½ •J•޼½N •–J]^ RN-¥m( •–J_` Ja$%3#:=4"7<N •–J^b RN-¥m( Y¾ •–J]^RN •–J_` •–J^bRN µ ƒµ ƒµ ƒµ ]^ ]^-lmn _` Ja$%3#:=4"7<N- lmn ^b-lmn sr ] ^-lmn-G¿jaŠ• À _` Ja$%3#:=4"7<N- lmn-G¿jaŠ•À ^ b-lmn-G¿jaŠ• À ~~ ƒv†qÁw Âà cTJ& KA%K4L%MN-Šnm Äj5Š( µ ƒµ ƒµ d¹¸¯ def-Šnm gh-ŠnmÄj5Š( „ o¯ def-Šnm-G¿j gh-Šnm-G¿j Å de f-Šnm-G¿j-Š• À g h-Šnm-G¿j-Š• À ~~ ƒ†ÆÇ†µ È 34
35.
nlp14 tutorial " # $ % & ' ( ) !* !! !" !# !$ !% !& !' !( !) "* "! "" "# "$ "% "& "' "( ") #* #! #" !"#$%&34& !"#$% 5%6#37489 :"%9;::49%9 !*) <=#"#<3%"7>%9 !. :"%9;::49%9?!, %6#@4"#3%9ABA 3#"C%39?!0D :"%9;::49%9 3#"C%39?!.D E3#"C%39?!0 :"%9;::49%9?!- 3#"C%39?!*) !"#$%?F#$%
G%3378C HIJ& KA%K4L%MN OPQRSTJU VRN WX YZRSTJ[ RNJ&KA%K4L%MN ]^ _` Ja$%3#:=4"7<N ^b cTJ& KA%K4L%MN def gh ii?j"%M7<#3% k4"?lmn HIopqr WXsr tuvpqwr cTxyzr{|q r} ~ •J€•NJ‚•N HIJ& KA%K4L%MN• OPQRSTJU VRN• ~~ ƒy ƒ„…r† ~ •J‡•N ˆ‰JHIJ& KA%K4L%MNRN ˆ‰JOPQRS TJUVRNRN ~~ ƒ„ ƒFmFŠ ‹Œ •J7893#8<%&4k •J•ŽR*•*• +‘-,’NN “”JHIJ& KA%K4L%MNRN •–JOPQRS TJUVRN RN—*{+˜™?UV —*{+˜ WX• Ja$%348š$7<N YZRSTJ[ RNJ&KA%K4L%MN • Ja$%348š$7<N ]^• Ja$%348š$7<N _` Ja$%3#:=4"7<N • Ja$%348š$7<N ^b• Ja$%348š$7<N cTJ& KA%K4L%MN• Ja$%348š$7<N •–{“”Jde fRN—*{+˜ •–{“”Jgh RN—*{+˜ ’ R ƒy{| ƒy{| ƒy{| ƒy{| ƒy{| ƒy{| ƒy ƒy{| ƒy{| ›Ž def• gh• œ•ž ŒU •J‹Œ’ŒUN Ÿ ƒy ƒy ¡¢ •J£¤¥¦,*•N §¨JdefRN §¨JghRN • ~~ ƒv„w ƒv„w © ••‘’ •J•ŽR*•*• +‘-,’N ª«JOPQRS TJUVRNRN ¬VJ]^ RN-®5l ¬VJ_` Ja$%3#:=4"7<N RN-®5l ¬VJ^b RN-®5l ¬VJcTJ& KA%K4L%MN RN-®5l ¬VJdef RN-®5l ¬VJgh RN-®5l | ƒ| Ou¯ OPQRSTJU VRN-Šnm ¬VJ]^RN ¬VJ_` Ja$%3#:=4"7<N ¬VJ^bRN ¬VJcTJ& KA%K4L%MNRN ¬VJdefRN ¬VJghRN p ƒ| ƒ| ƒ| ƒ| ƒ| ƒ| ¢° •–JOPQRS TJUVRN RN—+{+˜™?UV —+{+˜ •–JWX RN-¥m( •–JYZRST J[RNJ& KA%K4L%MN RN-®5l ±J]^RN-¥m( ±J_` Ja$%3#:=4"7<N RN-¥m( •–J^b RN-¥m(-¥m(-¥ m( “”JcTJ& KA%K4L%MNRN •–{“”Jde fRN—+{+˜ •–{“”Jgh RN—+{+˜ U² ³ •–JWXRN J´N R ƒµ ƒR WX WX-lmn •–JYZRST J[RNJ& KA%K4L%MNRN ~~ ƒ„ ¶· YZJWXRN YZRSTJ[ RNJ& KA%K4L%MN-Šnm ™?YZD?•–JST RN ±J]^RN ±J_` Ja$%3#:=4"7<N RN •–J^b RN-¥m(-¥m( ¸¹ ƒ„º»qp ƒµ ƒ¸¹ ƒ¸¹ ƒ„zr{R Step 4 35
36.
nlp14 tutorial Step 4
の要点 ❖ 「 (条項の) 撤廃」から「 (条項の) 廃止」へ語義の一般化す ると「廃止」がカラ格を項に取らないことがわかる ❖ <廃止者>が, (<条件>{にある, の, *から}) <条項>を, 廃止す る ❖ つまりこの文脈での<撤廃>の意味は<廃止>には帰着できな いことがわかる ❖ <撤廃>の上位クラスにもう一つ,カラを要求する<除去 [+metaphoric]>を認定して解決 36
37.
nlp14 tutorial Steps 3,
4 の重要性 ❖ 次は Step 4 (か Step 3) から判るが Step 2 から判る保証なし ❖ 「撤廃」は<廃止>の特殊な場合を意味するが,その格パ ターン “動作主(x)が 場所(l)から モノ(y)を V” が<除去>の メタファーに由来 ❖ 「明らかにした」の字義通りの意味<明示化>がこの文脈 で<公表>になる ❖ これは「<団体>が (<部外者>に対して) <行動>の方針を明らかに する」という連語の効果 37
38.
nlp14 tutorial 精度と被覆率のジレンマ ❖ フレームが決まっても述語は一つには決まらない ❖
フレームと述語の対応は一対多 ❖ だが,述語を特定しないと#要素 (定項)の値が決まらない ❖ 述語と表層格パターンの対応は一対他 ❖ フレーム記述の一般性=被覆率の低下 => 精度の向上 38
39.
Managing Annotation 39
40.
nlp14 tutorial 精度保証のためのチェック ❖ 文生成プログラム
(+sgen) の出力を見てタグづけの妥当性 を評価 ❖ 定項と変項の実現値をフレームごとに自動連結したもの が自然な日本語文にならないなら,記述は妥当性を欠く ❖ フレーム要素への区切り方と#要素の値の妥当性は検査 できるが,フレーム要素名の妥当性は検査できない 40
41.
nlp14 tutorial 理論 ❖ MSFA
Lite のフレーム記述を非線型表現/パターン (池原ら 2005, 2006) と同一視しするなら,MSFA Lite を使った文 s の分析は,s の複数の非線型表現/パターン p1, p2, ..., pn への 分解だと見なせる ❖ 元の s は p1, p2, ..., pn の行ごとの “重ね合わせ” で得られる ❖ これが正しいなら,pi がおのおの非線型な単文を記述して いるはずなので,pi の妥当性評価が MSFA の間接的な妥当 性評価になる 41
42.
nlp14 tutorial " # $ % & ' ( ) !* !! !" !# !$ !% !& !' !( !) "* "! "" "# "$ "% "& "' "( ") #* #! #" ## #$ #% #& !"#$%&34& !"#$% 5%6#37489 :"%9;::49%9 !*) <=#"#<3%"7>%9 !. :"%9;::49%9?!, %6#@4"#3%9ABA 3#"C%39?!0D :"%9;::49%9 3#"C%39?!.D E3#"C%39?!0 :"%9;::49%9?!- !"#$%?F#$% G%3378C HIJ& KA%K4L%MN OPQRSTJU VRN WX YZRSTJ[ RNJ&KA%K4L%MN ]^ _` Ja$%3#:=4"7<N ^b K ii?j"%M7<#3% k4"?lmn HIopqr
WXsr tuvpqwr cT ~ •J€•NJ‚•N HIJ& KA%K4L%MN• OPQRSTJU VRN• ~~ ƒy ƒ„…r† ~ •J‡•N ˆ‰JHIJ& KA%K4L%MNRN ˆ‰JOPQRS TJUVRNRN ~~ ƒ„ ƒFmFŠ ‹Œ •J7893#8<%&4k •J•ŽR*•*• +‘-,’NN “”JHIJ& KA%K4L%MNRN •–JOPQRS TJUVRN RN—*{+˜™?UV —*{+˜ WX• Ja$%348š$7<N YZRSTJ[ RNJ&KA%K4L%MN • Ja$%348š$7<N ]^• Ja$%348š$7<N _` Ja$%3#:=4"7<N • Ja$%348š$7<N ^b• Ja$%348š$7<N KA Ja ’ R ƒy{| ƒy{| ƒy{| ƒy{| ƒy{| ƒy{| ›Ž œ•ž ŒU •J‹Œ’ŒUN Ÿ ¡¢ •J£¤¥¦,*•N • ~~ © ••‘’ •J•ŽR*•*• +‘-,’N ª«JOPQRS TJUVRNRN ¬VJ]^ RN-®5l ¬VJ_` Ja$%3#:=4"7<N RN-®5l ¬VJ^b RN-®5l ¬ K | ƒ| Ou¯ OPQRSTJU VRN-Šnm ¬VJ]^RN ¬VJ_` Ja$%3#:=4"7<N ¬VJ^bRN ¬ KA p ƒ| ƒ| ƒ| ¢° •–JOPQRS TJUVRN RN—+{+˜™?UV —+{+˜ •–JWX RN-¥m( •–JYZRST J[RNJ& KA%K4L%MN RN-®5l ±J]^RN-¥m( ±J_` Ja$%3#:=4"7<N RN-¥m( •–J^b RN-¥m(-¥m(-¥ m( “ KA U² ³ •–JWXRN J´N R ƒµ ƒR WX WX-lmn •–JYZRST J[RNJ& KA%K4L%MNRN ~~ ƒ„ ¶· YZJWXRN YZRSTJ[ RNJ& KA%K4L%MN-Šnm ™?YZD?•–JST RN ±J]^RN ±J_` Ja$%3#:=4"7<N RN •–J^b RN-¥m(-¥m( ¸¹ ƒ„º»qp ƒµ ƒ¸¹ ƒ¸¹ ƒ„zr{R ¼½ •J•޼½N •–J]^ RN-¥m( •–J_` Ja$%3#:=4"7<N •–J^b RN-¥m( Y¾ •–J]^RN •–J_` •–J^bRN µ ƒµ ƒµ ƒµ ]^ ]^-lmn _` Ja$%3#:=4"7<N- lmn ^b-lmn sr ] ^-lmn-G¿jaŠ• _` Ja$%3#:=4"7<N- ^ b-lmn-G¿jaŠ• 1 2 3 4 5 6 7 8 9 10 +sgen の動作 ❖ #で始まる要素 (e.g., #が) を定項, #で始まらない 要素 (e.g, 採用者) を変項 ❖ 列を縦にスキャンし,範 囲が定項ならその値を, 変項ならその実現値を一 列目の形態素列に取りに 行く.f.GOV, f.X=PRED の場合だけ,フレーム名 か Predicate for GOVの値 を参照 42
43.
nlp14 tutorial !"#$%&'(!)*'!+&&,'-./&0"1#/23'"4'!"#$%&')$./&)$./&'56'"4'!"#$%&')$./&!"#$%&')$./&'-./& 7&2&$.,&8'!&2,&2%&'9:,+'*22",.,:"2
7&2&$.,&8'!&2,&2%&'9:,+"#,'*22",.,:"2 ;<=>=>==;?==>?@,&ABC )> DEF?GH&G"I&8J KK'LMNFOPJFQPJ3RM(*STUSKK'LMNFVPJ3WM(*STUSKK XYK'ZK'[K']K'^_`K'YaK'bK'cdeK'fK'LLMK'gK'h ijZK'kK'lmnK'oK'epK'aqK'rK'FsJK'[K'tuK'LLMK vwK'xyK'z{K'|}K'~K'•€K'•‚K'LLMK'ƒ„K'~K'…yx nK'WK'†nK'‡3ˆ‰Šˆ~M(*STUSKK'DE†o‹‚ MŒSU6F•.88&8JKK KK'LMNFOPJFQPJ3RKK'LMNFVPJ3WKK'XYK'ZK'[K']K ^_`K'YaK'bK'cdeK'fK'LLMK'gK'hijZK'kK'lmnK oK'epK'aqK'rK'FsJK'[K'tuK'LLMK'vwK'xyK'z{K'| }K'~K'•€K'•‚K'LLMK'ƒ„K'~K'…yxnK'WK'†nK'‡3ˆ‰Šˆ ~KK'DE†o‹‚KK ;<=>=>==;?==>?@,&ABB )Ž l••[‘’Fa“ [J KK'LMNFOPJFQPJ3W”‚ˆM(*STUSKK'LMNFV PJ3-•-UM(*STUSKK'XYK'Z3R–kM(*STUSKK'hijZ3 kM(*STUSKK'lmnK'oK'epK'aqK'rK'FsJK'[K'tuK LLMK'vwK'xyK'z{K'|}K'~K'•€K'•‚K -—˜˜MŒSU6F•.88&8JKK KK'LMNFOPJFQPJ3W”‚ˆKK'LMNFVPJ3-•-UKK'XYK'Z3 R–kKK'hijZ3kKK'lmnK'oK'epK'aqK'rK'FsJK'[K't uK'LLMK'vwK'xyK'z{K'|}K'~K'•€K'•‚K'-—˜˜KK ;<=>=>==;?==>?@,&AB< )C tu KK'XYK'Z3R–kM(*STUSKK'epM(•6K'aqK'rK'FsJ3~ M(*STUSKK'tu•‚MŒSU6K'vw3k–W™š‹oM(*STUSKK KK'XYK'Z3R–kKK'epK'aqK'rK'FsJ3~KK'tu•‚K'vw 3k–W™š‹oKK ;<=>=>==;?==>?@,&AB› )B |œ[‘’F•ž[JF? GH&G"I&8J KK'XYK'Z3R–kM(*STUSKK'epM*S7K'aqK'rK'FsJ3[ M(*STUSKK'tu3WM(*STUSKK'vw3~M(*STUSKK'Ÿm o ‹¡‚MŒSU6F•.88&8JKK KK'XYK'Z3R–kKK'epK'aqK'rK'FsJ3[KK'tu3WKK'vw 3~KK'Ÿm o‹¡‚KK ;<=>=>==;?==>?@,&AB¢ )< •€ KK'XYK'Z3R–kM(*STUSKK'hijZM*S7K'kK'lmn3o M(*STUSKK'epM(•6K'aqK'rK'FsJK'[K'tuK'LLMK'vw3 xyM(*STUSKK'z{M(•6K'|}3~M(*STUSKK'•€MŒSU6K •‚M!—ŒK KK'XYK'Z3R–kKK'hijZK'kK'lmn3oKK'epK'aqK'rK FsJK'[K'tuK'LLMK'vw3xyKK'z{K'|}3~KK'•€K'•‚K ;<=>=>==;?==>?@,&AB£ )› ¤¥F•/&,.A+"$:%J KK'XYK'Z3R–kM(*STUSKK'hijZM*S7K'kK'lmn3o M(*STUSKK'epM(•6K'aqK'rK'FsJK'[K'tuK'LLMK'vw3 xyM(*STUSKK'z{M(•6K'|}3~M(*STUSKK'¤¥ F•/&,.A+"$:%JMŒSU6K'•‚M!—ŒK KK'XYK'Z3R–kKK'hijZK'kK'lmn3oKK'epK'aqK'rK FsJK'[K'tuK'LLMK'vw3xyKK'z{K'|}3~KK'¤¥ F•/&,.A+"$:%JK'•‚K ;<=>=>==;?==>?@,&AB; )¢ €¦ KK'XYK'Z3R–kM(*STUSKK'hijZM*S7K'kK'lmn3o M(*STUSKK'epM(•6K'aqK'rK'FsJK'[K'tuK'LLMK'vw M(•63W§‚–[M(*STUSKK'z{M(•6K'|}3~M(*STUSKK €¦MŒSU6K'•‚M!—ŒK KK'XYK'Z3R–kKK'hijZK'kK'lmn3oKK'epK'aqK'rK FsJK'[K'tuK'LLMK'vw3W§‚–[KK'z{K'|}3~KK'€¦K •‚K ;<=>=>==;?==>?@,&AB>= )£ ¨’F?GH&G"I&8J KK'XYK'Z3RM(*STUSKK'hijZM*S7K'kK'lmn3o M(*STUSKK'epK'aqK'rK'FsJK'[K'tuK'LLMK'vwK'xyK z{K'|}K'~K'•€K'•‚3 ˆ‹©¡M(*STUSKK'¨’ªR§‚–k ‹‚«MŒSU6K KK'XYK'Z3RKK'hijZK'kK'lmn3oKK'epK'aqK'rK FsJK'[K'tuK'LLMK'vwK'xyK'z{K'|}K'~K'•€K'•‚ 3 ˆ‹©¡KK'¨’ªR§‚–k‹‚«K ;<=>=>==;?==>?@,&AB>> ); …¬- KK'XYK'Z3R–kM(*STUSKK']K'^_`K'Ya3R M(*STUSKK'cdeK'f3 W¡M(*STUSKK'hijZM*S7K'kK lmn3oM(*STUSKK'epK'aqK'rK'FsJK'[K'tuK'LLMK'v wK'xyK'z{K'|}K'~K'•€K'•‚K'LLMK'ƒ„3~M(*STUSKK …yxnK'WK'†nM!—ŒK'‡MUN®K KK'XYK'Z3R–kKK']K'^_`K'Ya3RKK'cdeK'f 3 W¡KK'hijZK'kK'lmn3oKK'epK'aqK'rK'FsJK'[K't uK'LLMK'vwK'xyK'z{K'|}K'~K'•€K'•‚K'LLMK'ƒ„3~ KK'…yxnK'WK'†nK'‡K ;<=>=>==;?==>?@,&AB>Ž )>= ¯° KK'XYK'Z3R–kM(*STUSKK']K'^_`K'Ya3R M(*STUSKK'cdeK'f3 W¡M(*STUSKK'hijZM*S7K'kK lmn3oM(*STUSKK'epK'aqK'rK'FsJK'[K'tuK'LLMK'v wK'xyK'z{K'|}K'~K'•€K'•‚K'LLMK'ƒ„3~M(*STUSKK ¯°MŒSU6K'†nM!—ŒK'‡MUN®K KK'XYK'Z3R–kKK']K'^_`K'Ya3RKK'cdeK'f 3 W¡KK'hijZK'kK'lmn3oKK'epK'aqK'rK'FsJK'[K't uK'LLMK'vwK'xyK'z{K'|}K'~K'•€K'•‚K'LLMK'ƒ„3~ KK'¯°K'†nK'‡K 43
44.
nlp14 tutorial (•6K'|}3~M(*STUSKK'•€MŒSU6K KK'XYK'Z3R–kKK'hijZK'kK'lmn3oKK'epK'aqK'rK FsJK'[K'tuK'LLMK'vw3xyKK'z{K'|}3~KK'•€K'•‚K STUSKK'hijZM*S7K'kK'lmn3o 6K'aqK'rK'FsJK'[K'tuK'LLMK'vw3 (•6K'|}3~M(*STUSKK'¤¥ '•‚M!—ŒK KK'XYK'Z3R–kKK'hijZK'kK'lmn3oKK'epK'aqK'rK FsJK'[K'tuK'LLMK'vw3xyKK'z{K'|}3~KK'¤¥ F•/&,.A+"$:%JK'•‚K STUSKK'hijZM*S7K'kK'lmn3o 6K'aqK'rK'FsJK'[K'tuK'LLMK'vw TUSKK'z{M(•6K'|}3~M(*STUSKK K KK'XYK'Z3R–kKK'hijZK'kK'lmn3oKK'epK'aqK'rK FsJK'[K'tuK'LLMK'vw3W§‚–[KK'z{K'|}3~KK'€¦K •‚K USKK'hijZM*S7K'kK'lmn3o qK'rK'FsJK'[K'tuK'LLMK'vwK'xyK •‚3
ˆ‹©¡M(*STUSKK'¨’ªR§‚–k KK'XYK'Z3RKK'hijZK'kK'lmn3oKK'epK'aqK'rK FsJK'[K'tuK'LLMK'vwK'xyK'z{K'|}K'~K'•€K'•‚ 3 ˆ‹©¡KK'¨’ªR§‚–k‹‚«K STUSKK']K'^_`K'Ya3R f3 W¡M(*STUSKK'hijZM*S7K'kK epK'aqK'rK'FsJK'[K'tuK'LLMK'v ~K'•€K'•‚K'LLMK'ƒ„3~M(*STUSKK '‡MUN®K KK'XYK'Z3R–kKK']K'^_`K'Ya3RKK'cdeK'f 3 W¡KK'hijZK'kK'lmn3oKK'epK'aqK'rK'FsJK'[K't uK'LLMK'vwK'xyK'z{K'|}K'~K'•€K'•‚K'LLMK'ƒ„3~ KK'…yxnK'WK'†nK'‡K STUSKK']K'^_`K'Ya3R f3 W¡M(*STUSKK'hijZM*S7K'kK epK'aqK'rK'FsJK'[K'tuK'LLMK'v ~K'•€K'•‚K'LLMK'ƒ„3~M(*STUSKK '‡MUN®K KK'XYK'Z3R–kKK']K'^_`K'Ya3RKK'cdeK'f 3 W¡KK'hijZK'kK'lmn3oKK'epK'aqK'rK'FsJK'[K't uK'LLMK'vwK'xyK'z{K'|}K'~K'•€K'•‚K'LLMK'ƒ„3~ KK'¯°K'†nK'‡K 44
45.
nlp14 tutorial 粒度コントロール ❖ フレーム要素が認定される粒度は自明でも一定でもないの で,管理が必要 ❖
統語解析との対応づけの良し悪しは,この分析の粒度に強 く依存する 45
46.
nlp14 tutorial 粒度の異なり ❖ 左に行く粗い ❖
右に行くと細かい ❖ 細かくなるほど,作業 者への要求大 ❖ L2 ぐらいが最適? ❖ MSFA 粒度の統一の予 定はないが,シートに 粒度指標を明示化する 予定 ! " # $ % & ' ( ) !* !! !" !# !$ !% !& !' !( !) "* "! "" "# "$ "% "& "' "( + , - . / 0 1 !"#$ !%&'(&)*+*,&- !.&'(&)*+*,&% !/&'(&)*+*,&. !0&'(&)*+*,&.1 !2'3*"(4" !2'3* !2'3*&5'3* 67 67 67 67 88&92*:;<'(* =42&>?@ AB 67C 67C 67C 67C D E FE FE FE FE GH IJKLMN67 OP IJKLMN67 OPQR?$S&TU IJKLMN67 OPQVW>S&TU IJKLMN67 OPQVW>S&TU X FX FX FX YZ IJKLMN67 OP IJKLMN67 OP IJKLMN67 OP [ F[ F[ F[ F[ ] ^_N67OP ^_N67 OPQR?$S&G` ^_N67 OPQR?$QVW>S aaQVW> ^_N67 OPQR?$S&G `QVW>S aaQVW>QR?$S bc de ff FgOhijO k ^_N67 OPQR?$S&G `QVW>S&aaQVW> NlP O FO FO mn ^_N67 OPQR?$QVW>S aa ^_N67 OPQR?$S&G `QVW>S&aa ff FOhiO FOhiO op ^_N67 OPQR?$ ^_N67 OPQR?$S&G` O F[qrKO F[qrKO F[qrKO Hs ^_N67OP ^_N67OP ^_N67OP It u Fu Fu Fu Fu v7 67Q>?@ 67Qw@?x9Ww$ 67Qw@?x9Ww$ 67Qw@?x9Ww$ y 6 7Qw@?x9Ww$Qz {9 6 7Qw@?x9Ww$Qz {9 6 7Qw@?x9Ww$Qz {9 r 6 7Qw@?x9Ww$Qz {9Qw|} 6 7Qw@?x9Ww$Qz {9Qw|} ~ •4€&••24:'S ‚67CƒEK&‚„…ƒOhi[K ‚†‡ˆƒu67yr •4€&••24:'S ‰Š‹Œ•opŽOtXqr•• u‘’ •4€&••24:'S ‰Š‹Œ•mnŽOtXqr•• u‘’ •4€&••24:'S ‹Œ•klŽO“”•–Xqr• •u‘’ •4€&••24:'S ‰Š‹Œ•YZŽOtXqr•• u‘’ •4€&••24:'S ‰Š‹Œ•mnŽOtXqr•• u‘’ •4€&••24:'S •HsItŽO“”•–Xqr• •u‘’ 46
47.
nlp14 tutorial Granularity Levels ❖
L0 ではフレーム要素 (f.GOV を含む) と MARKER の記述 ❖ Berkeley FrameNet のアノテーションは L0 と同等で意外 とスカスカ ❖ L1 では L0 にフレームの喚起要素 (= f.EVO) と e.SUP と埋め こみなしの e.MOD の記述を追加し,“=PRED” を許容 ❖ L2 では L1 に埋めこみありの e.MOD, e.EXT の記述を追加 ❖ L3では L2 に e.ARG の記述を追加し,強制置換 “=>” を許容 47
48.
Findings & Open
Issues 48
49.
nlp14 tutorial 知見 1 ❖
名詞句がフレームごとに異なる意味役割を担うのは常態 (こ れはメトニミーという効果を生む) ❖ 国広 (1997) の多面的多義性 (cf. 排他的多義) ❖ Pustejovsky (1995) の (特質構造に由来する) 論理的多義 ❖ 名詞の意味記述として文脈不変な型 (e.g, human, place) のみ を指定するのは不充分 49
50.
nlp14 tutorial 知見 2 ❖
“一つの述語に一つの意味” というのは多くの場合,不成立 ❖ MSFA では “F targets G” で文字通りの意味と理解される べき (超語彙的) 意味の関係を記述 ❖ F のみの記述が不充分なのは当然だが,G だけでもダメ ❖ 動詞も多面的多義をもつ ❖ 意味タグづけ作業者に課せられる “語義の択一選択” が実は実行 可能な課題として成立しない可能性を示唆 50
51.
nlp14 tutorial 知見 3 ❖
動詞の語義の overload を回避する必要性 ❖ 文の意味を動詞以外の共起要素に “分担” させる ❖ 多層化をしないと文意が動詞の語義レベルで決まっている のか,共合成の結果として決まっているのかわからない 51
52.
nlp14 tutorial 知見 4 ❖
(国研の “短単位” を使った場合でも) 文中で喚起される全フ レーム記述に共通な形態素境界は保証されない ❖ 「日本国内外」のような重複形態では{日本国内, 日本国 外, 日本国, 日本内, 日本外, 国内外, 内外, 日本, 国, 内, 外} の全部が認定される必要がある ❖ [日本国 = 日本+国内外] なら “日本国” が落ち,[日本国 = 日本国 +内外 ]なら “国内外” が落ちる ❖ 最小単位をフレームごとにチャンキングするのが最良? 52
53.
nlp14 tutorial 知見 5 ❖
修飾/非修飾の関係はフレームごとに違ってもよい ❖ 就任後初めて地元の大分県へ里帰りしていた村山富市首 相は三十一日夕[方]、三泊四日の日程を終え ... [ S-ID: 950101014-001 ] ❖ “里帰り” で喚起される<帰郷>フレーム内では,“首相” は “村山富市” という個人の属性を記述する修飾要素,“日程を 終え” で喚起される<用件の完了>フレーム内では,“村山富 市” は “ (日本の) 首相” という役割の値を記述する修飾要素 53
54.
nlp14 tutorial 知見 6 ❖
名詞句だけからなる “述語を含まない文” は統語解析では無 用なので京大コーパスから除外されているが,このために 後続文の意味が決められない場合は少なくない. 54
55.
nlp14 tutorial 知見 7 ❖
長い文の解析は大変だが短かいほど良いわけではない ❖ 短すぎる文は不定性が高くなり,解釈の決定が難しい 55
56.
Things to Do 56
57.
nlp14 tutorial 問題点 &
課題 ❖ MSFA は文の “意味” 自体は表わしていない ❖ MSFA は “意味” へのリンク集 ❖ 問題 ❖ リンク先にある “状況” の定義がまだない ❖ それらに定義を与えるなら,オントロジーの専門家に相談して, ちゃんとしたものにしたい ❖ だが,“フレーム” の実体は何? 単なるオントロジー? 57
58.
nlp14 tutorial 最後に ❖ 理論も重要!! ❖
デザインが具体的アプリケーションから要請であっても別 にいいのですが,そればかりではダメだと思います ❖ 工学系ではアプリケーションなしのデザインを云々する ことは (机上の空論として) 煙たがられますが ❖ (完全に教師なしの手法で構築できるものでない限り) “理論 の支援なし” の言語資源を開発しても使えるようになるとは 限らないと (反論を覚悟で) 主張しておきます 58
59.
nlp14 tutorial 謝辞 ❖ 李
在鎬 (NICT) ❖ 渋谷 良方 (京都外国語大学/NICT) ❖ 野澤 元 (NICT)
60.
Thank you 60
Download