More Related Content
Similar to 常識表現となり得る用言の自動選定の検討 (10)
More from 長岡技術科学大学 自然言語処理研究室 (20)
常識表現となり得る用言の自動選定の検討
- 4. 既存知識ベースとの違い
既存の
上位オントロジー
e.g.
SUMO,
OpenCyc
利点:
厳密に定義された常識
を利用できる
欠点:
実際の語彙表現との乖
離が激しい
各Conceptに対し,
様々な関係で結
ばれる語や文を
付与
e.g.
ConceptNet
利点:
自然言語処理のタス
クに適用しやすい
欠点:
大半が人手で集めら
れているため,網羅性が低
い
- 5. 常識がもつ性質
次の3つの性質を仮定:
1.
用言aと名詞nとの共起頻度が高いほど,用
言aは名詞nの常識である可能性が高い
2.
どのような名詞とも共起する用言aは,常識
として不適切
3.
用言aが名詞nの常識として適切か否かは,
その名詞と共起する用言の異なり数に依存
する
- 12. 各名詞に対する削除用言数
• 削除用言
– わかる,もつ,みる,なる,ない,とる,できる,つく,しる,くる,おもう,
おおい,いる,いう,ある,良い,入る,でる,つくる,つかう,きく,かく,
おこなう,紹介,よい,ゆく,たつ,たかい,おる,いい,関係,やる,か
ける
1: 各名詞に対する削除用言数 (N=共起する用言の
なり数)
対象となる名詞の範囲 削除数
N≤700 427
700<N≤1,100 267
1,100<N≤1,600 143
1,600<N≤2,500 73
それ以外 33
例えば,N=1,000 の名詞については 227 個の用言が
除対象となる.ただし N=3,600 の際に削除される
個の用言は,対象となる名詞を選ばない用言が多
4
4.1
付
する.
(1)
(2)
(3)
N=3600における
33個の用言は,対
象となる名詞を選
ばない
=常識として不適切
- 14. 名詞に付与される用言の例
(1/2)
表 2: 名詞に対して付与される用言の違い
名詞:いぬ
baseline1 baseline2 baseline3 提案手法 baseline1
かう かう 喰わない 散歩 入学
なる 一緒 飼わない しつける 教育
いる 生活 かみころす 病気 ある
ある 販売 吠えない つれる なる
生活 たのしい 薬殺 くらす 卒業
みる やすい 繋留 訓練 授業
ない わかる 訓練 ほえる 受験
いう 登録 やせこける かわいい かよう
一緒 大きい かまない 介護 学習
できる かんがえる 代参 飼育 指導
- 15. 名詞に付与される用言の例
(2/2)
→
提案手法は,常識として適切な用言が付与されている
付与される用言の違い (スコア順上位 10 件)
名詞:小学校
提案手法 baseline1 baseline2 baseline3 提案手法
散歩 入学 就学 離任 入学
しつける 教育 入学 訓導 教育
病気 ある 付属 めざめない 卒業
つれる なる 参観 さかしい 授業
くらす 卒業 給食 加減乗除 受験
訓練 授業 受験 そばだつ かよう
ほえる 受験 授業 歌わす 学習
かわいい かよう 担任 やり直さない 指導
介護 学習 卒業 のびゆく 依頼
飼育 指導 かよう 実験 就学
- 16. 付与失敗例について
• 文中で名詞と共起しても,ほとんど関係がない
– 名詞に係っている用言のみを利用
• 接尾辞的な使われ方をする名詞(e.g.月)
• 曖昧性のある名詞
– 文中で共起する他名詞との関係性を考慮
• 名詞同士の関係性を定義する名詞(e.g.
原因)
– 常識を付与する対象として適切かどうか議論する必
要がある
→ 常識を付与する対象の名詞をどのように
制限していくか