SlideShare a Scribd company logo
1 of 40
言語とコンピュータ
第12回
domitry
進行
1. 前回までの復習
2. 構文解析とは
3. 構文解析の2つの手法
4. +α
5. 小テスト
前回までの復習
コンピュータで言語を処理するには色々な処理が必要
・形態素解析
・構文解析
・意味解析
前回までの復習
コンピュータで言語を処理するには色々な処理が必要
・形態素解析
・構文解析
・意味解析
今回話すのはこの処理
構文解析①
・修飾関係等、文構造を解析する処理。
・文構造は通常木構造で表現される。
・ツールが公開されている。
・日本語ではKNPやChaboChaが有名
構文解析②
例:宇宙と科学の本
宇宙/と/科学/の/本
(名詞/助詞/名詞/助詞/名詞)
構文解析②
例:宇宙と科学の本
宇宙/と/科学/の/本
(名詞/助詞/名詞/助詞/名詞)
((宇宙と科学)の本)?
((宇宙)と(科学の本))?
構文解析②
例:宇宙と科学の本
宇宙/と/科学/の/本
(名詞/助詞/名詞/助詞/名詞)
宇宙 と 科学 の 本 宇宙 と 科学 の 本
N
N N
N N
N
N
N
N
N
二つの候補を木構造で表現
((宇宙と科学)の本)?
((宇宙)と(科学の本))?
構文解析の手法
文脈自由文法
・実際の文は文脈判断が重要だが、簡単のため文脈を無視
・文法規則に基づいて木構造を作る
S PP* V
PP NP P
NP ADJ* N
S 文
PP 後置詞句
NP 名詞句
N 名詞
V 動詞
P 助詞
ADJ 形容詞
文脈自由文法
・文脈自由文法には2つの観点で2つの種類がある。
・トップダウン法 … 根本(文全体)から探索
・ボトムアップ法 … 下部(単語)から探索
・縦型探索 … とりあえず一つ選び、ダメだったら戻ってくる
・横型探索 … すべての状態を保存しながら進める
トップダウン法
S PP* V
PP NP P
NP ADJ* N
例:今日/の/授業/は/休み/に/なった。
(N/P/N/P/N/P/V)
S
トップダウン法
S PP* V
PP NP P
NP ADJ* N
例:今日/の/授業/は/休み/に/なった。
(N/P/N/P/N/P/V)
S
PP PP* V
トップダウン法
S PP* V
PP NP P
NP ADJ* N
例:今日/の/授業/は/休み/に/なった。
(N/P/N/P/N/P/V)
S
PP PP* V
NP P
トップダウン法
S PP* V
PP NP P
NP ADJ* N
例:今日/の/授業/は/休み/に/なった。
(N/P/N/P/N/P/V)
S
PP PP* V
NP P
ADJ ADJ* N
最小単位まで分割できたので比較
トップダウン法
S PP* V
PP NP P
NP ADJ* N
例:今日/の/授業/は/休み/に/なった。
(N/P/N/P/N/P/V)
S
PP PP* V
NP P
N
少し戻ってもう一度比較
トップダウン法
S PP* V
PP NP P
NP ADJ* N
例:今日/の/授業/は/休み/に/なった。
(N/P/N/P/N/P/V)
S
PP PP
V
NP
PN
NP
PN
NP
PN
PP
今日 の 授業 は 休み に なった 。
ボトムアップ法
S PP* V
PP NP P
NP ADJ* N
例:今日/の/授業/は/休み/に/なった。
(N/P/N/P/N/P/V)
VPN PN PN
今日 の 授業 は 休み に なった 。
ボトムアップ法
S PP* V
PP NP P
NP ADJ* N
例:今日/の/授業/は/休み/に/なった。
(N/P/N/P/N/P/V)
V
NP
PN
NP
PN
NP
PN
今日 の 授業 は 休み に なった 。
ボトムアップ法
S PP* V
PP NP P
NP ADJ* N
例:今日/の/授業/は/休み/に/なった。
(N/P/N/P/N/P/V)
V
NP
PN
NP
PN
NP
PN
今日 の 授業 は 休み に なった 。
PP PP PP
ボトムアップ法
S PP* V
PP NP P
NP ADJ* N
例:今日/の/授業/は/休み/に/なった。
(N/P/N/P/N/P/V)
V
NP
PN
NP
PN
NP
PN
今日 の 授業 は 休み に なった 。
PP PP PP
S
トップダウン?ボトムアップ?
 トップダウンにもボトムアップにも手法が色々
・CKY法,チャート法,アーリー法,一般化LR法…etc.
 優劣はトップダウンかボトムアップかよりもアル
ゴリズムによる。
 そもそもトップダウンとボトムアップの両方を使
う手法もある。
(+α)確率文脈自由文法
確率文脈自由文法①
・教科書には記述がないので補足になります。
・複数の文構造の候補から一つ選ぶ
・形態素解析の時と同じように条件付確率を用いる手法
詳しく知りたい方はこちら:
奥村 学「自然言語処理の基礎」
(総合図書館に置いてあります)
確率文脈自由文法②
・Aがβに書き換えられる条件付確率𝑃 β 𝐴 (Ex. S→PP V)
𝑃 β 𝐴 =
𝐶(β → A)
𝐶(𝐴)
・文Sからある構造木Tが生成される確率𝑃 𝑇 𝑆 はTを
構成する文法規則rの確率の乗算で求められる。
𝑃 𝑇 𝑆 =
𝑖=1
𝑚
𝑃 𝑟𝑖 𝐿𝑒𝑓𝑡(𝑟𝑖)
※ 𝐿𝑒𝑓𝑡(𝑟𝑖)は左側の枝を示す
確率文脈自由文法③
・実際に例文を構文解析してみる。
例:”Astronomers saw stars with ears.”
S→NP VP 1.0 NP→NP PP 0.4
PP→P NP 1.0 NP→astronomers 0.1
VP→V NP 0.7 NP→ears 0.18
VP→VP PP 0.3 NP→saw 0.04
P→with 1.0 NP→stars 0.18
V→saw 1.0 NP→telescope 0.1
確率文脈自由文法③
S→NP VP 1.0 NP→NP PP 0.4 P→with 1.0
PP→P NP 1.0 NP→astronomers 0.1 V→saw 1.0
VP→V NP 0.7 NP→ears 0.18 NP→stars 0.18
VP→VP PP 0.3 NP→saw 0.04 NP→telescope 0.1
S
NP VP
V NP
NP PP
NPP
astronomers
saw
stars
with ears
S
NP VP
V NP PP
NPP
astronomers
saw stars
with ears
VP
候補① 候補②
確率文脈自由文法③
S→NP VP 1.0 NP→NP PP 0.4 P→with 1.0
PP→P NP 1.0 NP→astronomers 0.1 V→saw 1.0
VP→V NP 0.7 NP→ears 0.18 NP→stars 0.18
VP→VP PP 0.3 NP→saw 0.04 NP→telescope 0.1
S
NP VP
V NP
NP PP
NPP
astronomers
saw
stars
with ears
S
NP VP
V NP PP
NPP
astronomers
saw stars
with ears
VP
候補① 候補②1.0
0.1 0.7
1.0 0.4
0.18 1.0
1.0 0.18
1.0
1.0 1.0
1.0
1.0 1.0 1.0
1.0 0.18
確率文脈自由文法③
S→NP VP 1.0 NP→NP PP 0.4 P→with 1.0
PP→P NP 1.0 NP→astronomers 0.1 V→saw 1.0
VP→V NP 0.7 NP→ears 0.18 NP→stars 0.18
VP→VP PP 0.3 NP→saw 0.04 NP→telescope 0.1
S
NP VP
V NP
NP PP
NPP
astronomers
saw
stars
with ears
S
NP VP
V NP PP
NPP
astronomers
saw stars
with ears
VP
候補① 候補②1.0
0.1 0.7
1.0 0.4
0.18 1.0
1.0 0.18
1.0
1.0 0.3
1.0
1.0 1.0 1.0
1.0 0.18
1.0*0.1*0.7*…*0.18=0.0009072 1.0*0.1*1.0*…*0.18=0.0006804
確率文脈自由文法③
S→NP VP 1.0 NP→NP PP 0.4 P→with 1.0
PP→P NP 1.0 NP→astronomers 0.1 V→saw 1.0
VP→V NP 0.7 NP→ears 0.18 NP→stars 0.18
VP→VP PP 0.3 NP→saw 0.04 NP→telescope 0.1
S
NP VP
V NP
NP PP
NPP
astronomers
saw
stars
with ears
S
NP VP
V NP PP
NPP
astronomers
saw stars
with ears
VP
候補① 候補②1.0
0.1 0.7
1.0 0.4
0.18 1.0
1.0 0.18
1.0
1.0 0.3
1.0
1.0 1.0 1.0
1.0 0.18
1.0*0.1*0.7*…*0.18=0.0009072 1.0*0.1*1.0*…*0.18=0.0006804
こちらの方がもっともらしい!
今日のまとめ
 構文解析は修飾関係等の文構造を解析する処理
 構文解析には主に文脈自由文法が使われる
 文脈自由文法には大きく分けてトップダウン法と
ボトムアップ法がある
 複数の候補から選び出すには確率文脈自由文法が
使われる
ここで小テスト
問題
次の文章を以下の文法規則にもとづいて縦型探索の
トップダウン法で解析し、木構造を書いてください。
「庭/に/大きな/ゴリラ/が/いる。」
(N/P/ADJ/N/P/V) S PP* V
PP NP P
NP ADJ* N
解答
S PP* V
PP NP P
NP ADJ* N
庭/に/大きな/ゴリラ/が/いる。
(N/P/ADJ/N/P/V)
S
解答
S PP* V
PP NP P
NP ADJ* N
庭/に/大きな/ゴリラ/が/いる。
(N/P/ADJ/N/P/V)
S
PP PP* V
解答
S PP* V
PP NP P
NP ADJ* N
庭/に/大きな/ゴリラ/が/いる。
(N/P/ADJ/N/P/V)
S
PP PP* V
NP P
解答
S PP* V
PP NP P
NP ADJ* N
庭/に/大きな/ゴリラ/が/いる。
(N/P/ADJ/N/P/V)
S
PP PP* V
NP P
ADJ ADJ* N
解答
S PP* V
PP NP P
NP ADJ* N
庭/に/大きな/ゴリラ/が/いる。
(N/P/ADJ/N/P/V)
S
PP PP* V
NP P
N
解答
S PP* V
PP NP P
NP ADJ* N
庭/に/大きな/ゴリラ/が/いる。
(N/P/ADJ/N/P/V)
S
PP PP
V
NP
PN
NP
ADJ PN
庭 に 大きな ゴリラ が いる 。
ご清聴ありがとうございました

More Related Content

What's hot

ストリーミングのげんざい
ストリーミングのげんざいストリーミングのげんざい
ストリーミングのげんざいTetsuya Morimoto
 
航空力学基礎の基礎
航空力学基礎の基礎航空力学基礎の基礎
航空力学基礎の基礎Fumiya Watanabe
 
RDBにおけるバリデーションをリレーショナルモデルから考える
RDBにおけるバリデーションをリレーショナルモデルから考えるRDBにおけるバリデーションをリレーショナルモデルから考える
RDBにおけるバリデーションをリレーショナルモデルから考えるMikiya Okuno
 
std::pin の勘所
std::pin の勘所std::pin の勘所
std::pin の勘所Hiroaki Goto
 
03 2 断片的情報の構造化_KJ法の実践
03 2 断片的情報の構造化_KJ法の実践03 2 断片的情報の構造化_KJ法の実践
03 2 断片的情報の構造化_KJ法の実践nishio
 
高齢者の意思決定支援 パート1 理論編【ADVANCE】
高齢者の意思決定支援 パート1 理論編【ADVANCE】高齢者の意思決定支援 パート1 理論編【ADVANCE】
高齢者の意思決定支援 パート1 理論編【ADVANCE】NEURALGPNETWORK
 
研究室リテラシー教育スライド
研究室リテラシー教育スライド研究室リテラシー教育スライド
研究室リテラシー教育スライドNobutaka Shimada
 
内科医のための結核診療入門
内科医のための結核診療入門内科医のための結核診療入門
内科医のための結核診療入門Takashi Ohfuji
 
Mobilitydev2019 10 31_slideshare
Mobilitydev2019 10 31_slideshareMobilitydev2019 10 31_slideshare
Mobilitydev2019 10 31_slideshareTier_IV
 
ROS2勉強会 4章前半
ROS2勉強会 4章前半ROS2勉強会 4章前半
ROS2勉強会 4章前半tomohiro kuwano
 
l12l2-NFT-Bridge.pdf
l12l2-NFT-Bridge.pdfl12l2-NFT-Bridge.pdf
l12l2-NFT-Bridge.pdfwei-li
 
脳保護療法の新展開 ー脳低温療法ー
脳保護療法の新展開 ー脳低温療法ー脳保護療法の新展開 ー脳低温療法ー
脳保護療法の新展開 ー脳低温療法ーTakayoshi Shimohata
 
Knowledge graphs + Chatbots with Neo4j
Knowledge graphs + Chatbots with Neo4jKnowledge graphs + Chatbots with Neo4j
Knowledge graphs + Chatbots with Neo4jChristophe Willemsen
 
はじめての生成文法・前編 - #tokyonlp 5
はじめての生成文法・前編 - #tokyonlp 5はじめての生成文法・前編 - #tokyonlp 5
はじめての生成文法・前編 - #tokyonlp 5Shuyo Nakatani
 
Fitnesse を用いたテストの効率化について
Fitnesse を用いたテストの効率化についてFitnesse を用いたテストの効率化について
Fitnesse を用いたテストの効率化についてtecopark
 

What's hot (17)

ストリーミングのげんざい
ストリーミングのげんざいストリーミングのげんざい
ストリーミングのげんざい
 
航空力学基礎の基礎
航空力学基礎の基礎航空力学基礎の基礎
航空力学基礎の基礎
 
為何學程式?
為何學程式?為何學程式?
為何學程式?
 
RDBにおけるバリデーションをリレーショナルモデルから考える
RDBにおけるバリデーションをリレーショナルモデルから考えるRDBにおけるバリデーションをリレーショナルモデルから考える
RDBにおけるバリデーションをリレーショナルモデルから考える
 
std::pin の勘所
std::pin の勘所std::pin の勘所
std::pin の勘所
 
03 2 断片的情報の構造化_KJ法の実践
03 2 断片的情報の構造化_KJ法の実践03 2 断片的情報の構造化_KJ法の実践
03 2 断片的情報の構造化_KJ法の実践
 
高齢者の意思決定支援 パート1 理論編【ADVANCE】
高齢者の意思決定支援 パート1 理論編【ADVANCE】高齢者の意思決定支援 パート1 理論編【ADVANCE】
高齢者の意思決定支援 パート1 理論編【ADVANCE】
 
研究室リテラシー教育スライド
研究室リテラシー教育スライド研究室リテラシー教育スライド
研究室リテラシー教育スライド
 
内科医のための結核診療入門
内科医のための結核診療入門内科医のための結核診療入門
内科医のための結核診療入門
 
Mobilitydev2019 10 31_slideshare
Mobilitydev2019 10 31_slideshareMobilitydev2019 10 31_slideshare
Mobilitydev2019 10 31_slideshare
 
ROS2勉強会 4章前半
ROS2勉強会 4章前半ROS2勉強会 4章前半
ROS2勉強会 4章前半
 
l12l2-NFT-Bridge.pdf
l12l2-NFT-Bridge.pdfl12l2-NFT-Bridge.pdf
l12l2-NFT-Bridge.pdf
 
脳保護療法の新展開 ー脳低温療法ー
脳保護療法の新展開 ー脳低温療法ー脳保護療法の新展開 ー脳低温療法ー
脳保護療法の新展開 ー脳低温療法ー
 
Knowledge graphs + Chatbots with Neo4j
Knowledge graphs + Chatbots with Neo4jKnowledge graphs + Chatbots with Neo4j
Knowledge graphs + Chatbots with Neo4j
 
はじめての生成文法・前編 - #tokyonlp 5
はじめての生成文法・前編 - #tokyonlp 5はじめての生成文法・前編 - #tokyonlp 5
はじめての生成文法・前編 - #tokyonlp 5
 
Fitnesse を用いたテストの効率化について
Fitnesse を用いたテストの効率化についてFitnesse を用いたテストの効率化について
Fitnesse を用いたテストの効率化について
 
Rubyの黒魔術
Rubyの黒魔術Rubyの黒魔術
Rubyの黒魔術
 

Recently uploaded

CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?akihisamiyanaga1
 
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfAWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfFumieNakayama
 
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)NTT DATA Technology & Innovation
 
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfクラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfFumieNakayama
 
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)UEHARA, Tetsutaro
 
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...博三 太田
 
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineerYuki Kikuchi
 
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案sugiuralab
 
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)Hiroshi Tomioka
 

Recently uploaded (9)

CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
 
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfAWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
 
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
 
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfクラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
 
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
 
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
 
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
 
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
 
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
 

基礎セミ 言語とコンピュータ 第12回目 資料