SlideShare a Scribd company logo
1 of 13
Download to read offline
動詞意味類型の曖昧性解消に向けた格 フレーム情報との関連調査 
長岡技術科学大学電気系 
岡田正平山本和英 
1
中山ら[1]の意味類型 
• 
動作 
客観的に観測者が捉えることの出来る運動で,その 運動が終了すると運動前の状態に戻り,結果状態を 表さない動詞. 
e.g. 泳ぐ,食べる 
• 
変化 
主体に現れる運動の結果状態を表す動詞.主体が意 志を持たず結果のみを表し,かつ運動が終了しても 運動前の状態には戻らない表現. 
e.g. 乾く,死ぬ 
2 
[1]中山匠,山本和英.用言の新しい意味類型ー作用性用言と形状性用言ー.言語処理学会第17回年次大会発表論文集.pp. 560-563.2011.
• 
感覚・感情 
感覚器官の活動や,頭脳や心の働きなどを表す知情 意を表す動詞. 
e.g. 見える,感じる 
• 
形容 
人や物の性質,形,存在,関係を表す動詞. 
e.g. 優れる,異なる 
中山らはIPA辞書の12,648動詞に対して人手で意 味類型を付与 
– 
1動詞に複数付与する場合もある 
3
はじめに 
• 
日本語の用言の形態的分類 
– 
形容詞:いで終わる 
– 
動詞:母音ウを持つ拍で終わる 
• 
外的に観測可能な人や物の動きを表すとされる 
• 
実際には 
– 
物事の特性を表す動詞 
e.g. 優れる,似る,富む 
– 
人の感情を表す動詞 
e.g. 飽きる,むかつく,脅える 
 
形態的な分類と意味的な分類は一致しない 
4
本研究の目的 
• 
複数の意味類型が付与された動詞に対して, 文脈中で曖昧性を解消する 
e.g. 満たす 
• 
コップを水で満たす→動作 
• 
条件を満たす→形容 
– 
今回は意味類型の違いにより動詞の文中での使われ 方が異なると仮定,自動推定のための予備調査を行 う 
5
調査内容 
• 
京都大学格フレームを用いて動詞が取る 表層格および項について調査 
• 
単一の意味類型が付与された動詞が対象 
– 
IPA辞書の表記および京都大学格フレームの述語 (述語タイプ:動詞)の表記が一致した動詞は2372 
6 
表1 意味類型ごとの調査対象動詞数 
動作 
変化 
感覚・感情 
形容 
1516/6637 
418/1530 
360/1141 
78/358 
※分母は単一の意味類型が付与されていた動詞数,分子が京都大学格フレームに共通し て出現する動詞数
調査1 | 表層格について 
• 
表層格ごとの意味類型の出現頻度を調査 
– 
すべてについて調べると意味類型ごとの動詞の 数の違いによって偏りが生じる 
 
意味類型ごとに動詞数が同じになるように サンプリング 
7 
表2 意味類型ごとの表層格数 
動作 
変化 
感覚・感情 
形容 
1296万 
764万 
432万 
2424万
調査1 | 表層格について 
8 
0% 
20% 
40% 
60% 
80% 
100% 
ガ 
ヲ 
ニ 
ヘ 
ト 
デ 
カラ 
ヨリ 
マデ 
計 
形容 
感覚・感情 
変化 
動作
調査1 | 表層格について 
• 
ガ格やト格を取る動詞は”形容”が多い 
• 
ヲ・ヘ・カラ・ヨリ格を取る動詞は”動作”が 多い 
• 
“変化”や”感覚・感情”の動詞は大きな割合を 占める表層格がない 
 
{動作|形容}と{変化|感覚・感情}の判別には 別の情報が必要 
9
調査2 | 項について 
• 
意味類型に固有の表層格-項の名詞意味属性の 対を収集 
• 
名詞の意味属性には日本語語彙大系の 名詞・固有名詞意味属性を利用 
10 
表2 獲得した表層格-名詞属性の組の数 
動作 
変化 
感覚・感情 
形容 
3243 
196 
198 
137
調査2 | 項について 
取得できた対の例 
動作 
カラ格:事象,性質,具体 ヘ格:精神,具体 
ト格:事象,性質,主体 ガ格:抽象,国名 
デ格:表情,性質,衣料 ヨリ格:出来事,地方名,都市 
マデ格:事,行為,状態,形状,数量,組織,人間 
ヲ格:事象 
変化 
ヘ格:感覚,出来事,ト格:生命現象,マデ格:形,デ格:無生物, ヨリ格:食料 
感覚・感情 
ヨリ格:事,行為,道具 
形容 
ヘ格:宗教名,ト格:乗り物,マデ格:特徴,ヨリ格:形,生物 
11
まとめ 
• 
中山らの提案した4つの意味類型の曖昧性解消 を行うための予備調査 
– 
単一意味類型の動詞を対象 
• 
意味類型ごとの表層格の頻度 
– 
“動作”と“形容”については強い傾向が見られる 
• 
意味類型固有の表層格-名詞属性対を収集 
– 
全3774対を収集 
• 
これらの情報を手掛かりに曖昧性解消器を構 築していく 
12
13 
事象:事象 
性質:性質 
具体:有り物,合せ物,具体,公物,個体,三才,人畜,人馬,地物,天地人,万物など 
精神:エスプリ,経験,精神衛生,全精神,体験,追体験 
主体:主体 
抽象:抽象 
事:ああ,現象,こう,こと,事,此,そう,珍現象,フェノメノン 
行為:アクティビティー,一挙,営み,おこない,活動,挙動,行動,沙汰,ふるまいなど 
状態:状態 
形状:仮象,型,形,旧型,形骸,形式,形状,形態,原形,パターン,フォームなど 
組織:オーガニゼーション,システム,組織,地下組織,北部 
人間:猿人,往者,方,旧人,クロマニヨン,衆人,人物,人類,誰かさん,人々など 
表情:思い入れ 
衣料:衣料,衣料品 
出来事:一大事,奇跡,社会現象,日常茶飯事,出来事,ハプニングなど 
感覚:感覚,無感覚,無感覚さ 
生命現象:息の緒,息の根,一命,エターナルライフ,身命,人名,生気,生命など 
形:合判,足型,厚型,いちょう型,打ち違い,円錐型,凹型,体つき,クロソイドなど 
無生物:非情,物体,無生物,もの 
食料:飲食物,栄養食,糧,食い物,健康食,ご馳走,食事,兵糧,フードなど 
特徴:アドホック,怪し,在り来り,異質,一般,型破り,奇異,桁外れ,特質,不思議など 
生物:合の子,亜種,生き物,異性,一代雑種,異類,花鳥,巨生物,自然,天然など

More Related Content

More from 長岡技術科学大学 自然言語処理研究室

説明文と記述要素の関係要因の調査~そこにクエリの「何」が書かれているのか~
説明文と記述要素の関係要因の調査~そこにクエリの「何」が書かれているのか~説明文と記述要素の関係要因の調査~そこにクエリの「何」が書かれているのか~
説明文と記述要素の関係要因の調査~そこにクエリの「何」が書かれているのか~
長岡技術科学大学 自然言語処理研究室
 

More from 長岡技術科学大学 自然言語処理研究室 (20)

用言等換言辞書を用いた換言結果の考察
用言等換言辞書を用いた換言結果の考察用言等換言辞書を用いた換言結果の考察
用言等換言辞書を用いた換言結果の考察
 
用言等換言辞書の構築
用言等換言辞書の構築用言等換言辞書の構築
用言等換言辞書の構築
 
質問意図によるQAサイト質問文の自動分類
質問意図によるQAサイト質問文の自動分類質問意図によるQAサイト質問文の自動分類
質問意図によるQAサイト質問文の自動分類
 
役所からの公的文書に対する「やさしい日本語」への変換システムの構築
役所からの公的文書に対する「やさしい日本語」への変換システムの構築役所からの公的文書に対する「やさしい日本語」への変換システムの構築
役所からの公的文書に対する「やさしい日本語」への変換システムの構築
 
対訳コーパスから生成したワードグラフによる部分的機械翻訳
対訳コーパスから生成したワードグラフによる部分的機械翻訳対訳コーパスから生成したワードグラフによる部分的機械翻訳
対訳コーパスから生成したワードグラフによる部分的機械翻訳
 
用言等換言辞書を人手で作りました
用言等換言辞書を人手で作りました用言等換言辞書を人手で作りました
用言等換言辞書を人手で作りました
 
文字列の出現頻度情報を用いた分かち書き単位の自動取得
文字列の出現頻度情報を用いた分かち書き単位の自動取得文字列の出現頻度情報を用いた分かち書き単位の自動取得
文字列の出現頻度情報を用いた分かち書き単位の自動取得
 
「やさしい日本語」変換システムの試作
「やさしい日本語」変換システムの試作「やさしい日本語」変換システムの試作
「やさしい日本語」変換システムの試作
 
常識表現となり得る用言の自動選定の検討
常識表現となり得る用言の自動選定の検討常識表現となり得る用言の自動選定の検討
常識表現となり得る用言の自動選定の検討
 
二格深層格の定量的分析
二格深層格の定量的分析二格深層格の定量的分析
二格深層格の定量的分析
 
大規模常識知識ベース構築のための常識表現の自動獲得
大規模常識知識ベース構築のための常識表現の自動獲得大規模常識知識ベース構築のための常識表現の自動獲得
大規模常識知識ベース構築のための常識表現の自動獲得
 
文脈の多様性に基づく名詞換言の提案
文脈の多様性に基づく名詞換言の提案文脈の多様性に基づく名詞換言の提案
文脈の多様性に基づく名詞換言の提案
 
保険関連文書を対象とした文章校正支援のための変換誤り検出
保険関連文書を対象とした文章校正支援のための変換誤り検出保険関連文書を対象とした文章校正支援のための変換誤り検出
保険関連文書を対象とした文章校正支援のための変換誤り検出
 
Developing User-friendly and Customizable Text Analyzer
Developing User-friendly and Customizable Text AnalyzerDeveloping User-friendly and Customizable Text Analyzer
Developing User-friendly and Customizable Text Analyzer
 
普通名詞換言辞書の構築
普通名詞換言辞書の構築普通名詞換言辞書の構築
普通名詞換言辞書の構築
 
大規模常識知識ベース構築のための常識表現の自動獲得
大規模常識知識ベース構築のための常識表現の自動獲得大規模常識知識ベース構築のための常識表現の自動獲得
大規模常識知識ベース構築のための常識表現の自動獲得
 
普通名詞換言辞書の構築
普通名詞換言辞書の構築普通名詞換言辞書の構築
普通名詞換言辞書の構築
 
機械学習を用いたニ格深層格の自動付与の検討
機械学習を用いたニ格深層格の自動付与の検討機械学習を用いたニ格深層格の自動付与の検討
機械学習を用いたニ格深層格の自動付与の検討
 
A Comparison of Unsuperviesed Bilingual Term Extraction Methods Using Phrase ...
A Comparison of Unsuperviesed Bilingual Term Extraction Methods Using Phrase ...A Comparison of Unsuperviesed Bilingual Term Extraction Methods Using Phrase ...
A Comparison of Unsuperviesed Bilingual Term Extraction Methods Using Phrase ...
 
説明文と記述要素の関係要因の調査~そこにクエリの「何」が書かれているのか~
説明文と記述要素の関係要因の調査~そこにクエリの「何」が書かれているのか~説明文と記述要素の関係要因の調査~そこにクエリの「何」が書かれているのか~
説明文と記述要素の関係要因の調査~そこにクエリの「何」が書かれているのか~
 

Recently uploaded

Recently uploaded (10)

Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
 
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
 
Utilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native IntegrationsUtilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native Integrations
 
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイスLoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
 
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアルLoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
 
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
 
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
 
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
 
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
 
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半        2024/04/26の勉強会で発表されたものです。新人研修 後半        2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
 

動詞意味類型の曖昧性解消に向けた格フレーム情報との関連調査

  • 2. 中山ら[1]の意味類型 • 動作 客観的に観測者が捉えることの出来る運動で,その 運動が終了すると運動前の状態に戻り,結果状態を 表さない動詞. e.g. 泳ぐ,食べる • 変化 主体に現れる運動の結果状態を表す動詞.主体が意 志を持たず結果のみを表し,かつ運動が終了しても 運動前の状態には戻らない表現. e.g. 乾く,死ぬ 2 [1]中山匠,山本和英.用言の新しい意味類型ー作用性用言と形状性用言ー.言語処理学会第17回年次大会発表論文集.pp. 560-563.2011.
  • 3. • 感覚・感情 感覚器官の活動や,頭脳や心の働きなどを表す知情 意を表す動詞. e.g. 見える,感じる • 形容 人や物の性質,形,存在,関係を表す動詞. e.g. 優れる,異なる 中山らはIPA辞書の12,648動詞に対して人手で意 味類型を付与 – 1動詞に複数付与する場合もある 3
  • 4. はじめに • 日本語の用言の形態的分類 – 形容詞:いで終わる – 動詞:母音ウを持つ拍で終わる • 外的に観測可能な人や物の動きを表すとされる • 実際には – 物事の特性を表す動詞 e.g. 優れる,似る,富む – 人の感情を表す動詞 e.g. 飽きる,むかつく,脅える  形態的な分類と意味的な分類は一致しない 4
  • 5. 本研究の目的 • 複数の意味類型が付与された動詞に対して, 文脈中で曖昧性を解消する e.g. 満たす • コップを水で満たす→動作 • 条件を満たす→形容 – 今回は意味類型の違いにより動詞の文中での使われ 方が異なると仮定,自動推定のための予備調査を行 う 5
  • 6. 調査内容 • 京都大学格フレームを用いて動詞が取る 表層格および項について調査 • 単一の意味類型が付与された動詞が対象 – IPA辞書の表記および京都大学格フレームの述語 (述語タイプ:動詞)の表記が一致した動詞は2372 6 表1 意味類型ごとの調査対象動詞数 動作 変化 感覚・感情 形容 1516/6637 418/1530 360/1141 78/358 ※分母は単一の意味類型が付与されていた動詞数,分子が京都大学格フレームに共通し て出現する動詞数
  • 7. 調査1 | 表層格について • 表層格ごとの意味類型の出現頻度を調査 – すべてについて調べると意味類型ごとの動詞の 数の違いによって偏りが生じる  意味類型ごとに動詞数が同じになるように サンプリング 7 表2 意味類型ごとの表層格数 動作 変化 感覚・感情 形容 1296万 764万 432万 2424万
  • 8. 調査1 | 表層格について 8 0% 20% 40% 60% 80% 100% ガ ヲ ニ ヘ ト デ カラ ヨリ マデ 計 形容 感覚・感情 変化 動作
  • 9. 調査1 | 表層格について • ガ格やト格を取る動詞は”形容”が多い • ヲ・ヘ・カラ・ヨリ格を取る動詞は”動作”が 多い • “変化”や”感覚・感情”の動詞は大きな割合を 占める表層格がない  {動作|形容}と{変化|感覚・感情}の判別には 別の情報が必要 9
  • 10. 調査2 | 項について • 意味類型に固有の表層格-項の名詞意味属性の 対を収集 • 名詞の意味属性には日本語語彙大系の 名詞・固有名詞意味属性を利用 10 表2 獲得した表層格-名詞属性の組の数 動作 変化 感覚・感情 形容 3243 196 198 137
  • 11. 調査2 | 項について 取得できた対の例 動作 カラ格:事象,性質,具体 ヘ格:精神,具体 ト格:事象,性質,主体 ガ格:抽象,国名 デ格:表情,性質,衣料 ヨリ格:出来事,地方名,都市 マデ格:事,行為,状態,形状,数量,組織,人間 ヲ格:事象 変化 ヘ格:感覚,出来事,ト格:生命現象,マデ格:形,デ格:無生物, ヨリ格:食料 感覚・感情 ヨリ格:事,行為,道具 形容 ヘ格:宗教名,ト格:乗り物,マデ格:特徴,ヨリ格:形,生物 11
  • 12. まとめ • 中山らの提案した4つの意味類型の曖昧性解消 を行うための予備調査 – 単一意味類型の動詞を対象 • 意味類型ごとの表層格の頻度 – “動作”と“形容”については強い傾向が見られる • 意味類型固有の表層格-名詞属性対を収集 – 全3774対を収集 • これらの情報を手掛かりに曖昧性解消器を構 築していく 12
  • 13. 13 事象:事象 性質:性質 具体:有り物,合せ物,具体,公物,個体,三才,人畜,人馬,地物,天地人,万物など 精神:エスプリ,経験,精神衛生,全精神,体験,追体験 主体:主体 抽象:抽象 事:ああ,現象,こう,こと,事,此,そう,珍現象,フェノメノン 行為:アクティビティー,一挙,営み,おこない,活動,挙動,行動,沙汰,ふるまいなど 状態:状態 形状:仮象,型,形,旧型,形骸,形式,形状,形態,原形,パターン,フォームなど 組織:オーガニゼーション,システム,組織,地下組織,北部 人間:猿人,往者,方,旧人,クロマニヨン,衆人,人物,人類,誰かさん,人々など 表情:思い入れ 衣料:衣料,衣料品 出来事:一大事,奇跡,社会現象,日常茶飯事,出来事,ハプニングなど 感覚:感覚,無感覚,無感覚さ 生命現象:息の緒,息の根,一命,エターナルライフ,身命,人名,生気,生命など 形:合判,足型,厚型,いちょう型,打ち違い,円錐型,凹型,体つき,クロソイドなど 無生物:非情,物体,無生物,もの 食料:飲食物,栄養食,糧,食い物,健康食,ご馳走,食事,兵糧,フードなど 特徴:アドホック,怪し,在り来り,異質,一般,型破り,奇異,桁外れ,特質,不思議など 生物:合の子,亜種,生き物,異性,一代雑種,異類,花鳥,巨生物,自然,天然など