SlideShare a Scribd company logo
.
.
. ..
.
.
レポート課題2
IBM Model 2
大岩 秀和
情報理工学系研究科 数理情報学専攻 修士 1 年
November 30, 2010
大岩 秀和 (情理・数理) レポート課題2 IBM Model 2 November 30, 2010 1 / 8
機械翻訳
.
目的
..
.
. ..
.
.
フランス語の文 f が与えられたとき、良い翻訳結果となる一番最もら
しい英語の文 ˆe に翻訳する。これを P(e|f) を用いて式で書くと、
ˆe = arg max
e
P(e|f) (1)
(1) 式は Bayes の定理を用いて、以下の形に書き換えられる。
ˆe = arg max
e
P(e|f) = arg max
e
P(e)P(f|e)
英文そのものの最もらしさを表す P(e) は、英文のみのコーパスから
計算できるので…
大岩 秀和 (情理・数理) レポート課題2 IBM Model 2 November 30, 2010 2 / 8
機械翻訳
.
目的
..
.
. ..
.
.
フランス語の文 f が与えられたとき、良い翻訳結果となる一番最もら
しい英語の文 ˆe に翻訳する。これを P(e|f) を用いて式で書くと、
ˆe = arg max
e
P(e|f) (1)
(1) 式は Bayes の定理を用いて、以下の形に書き換えられる。
ˆe = arg max
e
P(e|f) = arg max
e
P(e)P(f|e)
英文そのものの最もらしさを表す P(e) は、英文のみのコーパスから
計算できるので…
.
目的の書き換え
..
.
. ..
.
.
対訳コーパス {(f(1), e(1)), . . . , (f(S), e(S))} を用いて、十分良い翻訳
精度を示すような P(f|e) を探す。
大岩 秀和 (情理・数理) レポート課題2 IBM Model 2 November 30, 2010 2 / 8
.
IBM モデル 1 のアルゴリズム
..
.
. ..
.
.
...1 英単語 e がフランス語の単語 f に翻訳される確率 t(f |e) の初期
値を決める
...2 各 (f(s), e(s)) 1 ≤ s ≤ S において、ある英単語 e があるフラン
ス語の単語 f に対応する回数の期待値
c(f |e; f(s)
, e(s)
) =
t(f |e)
t(f |e0) + · · · + t(f |el )
m
∑
j=1
δ(f, f′
)
l
∑
i=0
δ(e, ei )
を計算する。
...3 t(f |e) を再推定する。
t(f |e) =
∑s C(f |e; f(s), e(s))
∑f ∑s C(f |e; f(s), e(s))
...4 収束するまで、ステップ 2 とステップ 3 を繰り返す
大岩 秀和 (情理・数理) レポート課題2 IBM Model 2 November 30, 2010 3 / 8
IBM モデル 2
IBM モデル 1 では、英語とフランス語の間には、単語の出現順
序の関係性はないという制約を課した。
大岩 秀和 (情理・数理) レポート課題2 IBM Model 2 November 30, 2010 4 / 8
IBM モデル 2
IBM モデル 1 では、英語とフランス語の間には、単語の出現順
序の関係性はないという制約を課した。
IBM モデル 2 はこの条件を緩和する。
大岩 秀和 (情理・数理) レポート課題2 IBM Model 2 November 30, 2010 4 / 8
IBM モデル 2
IBM モデル 1 では、英語とフランス語の間には、単語の出現順
序の関係性はないという制約を課した。
IBM モデル 2 はこの条件を緩和する。
フランス語の単語fj と接続する英語の単語の位置 aj は、以下の
変数に依存すると仮定する。
フランス語の単語の位置 j
英語の文の長さ l
フランス語の文の長さ m
大岩 秀和 (情理・数理) レポート課題2 IBM Model 2 November 30, 2010 4 / 8
IBM モデル 2
IBM モデル 1 では、英語とフランス語の間には、単語の出現順
序の関係性はないという制約を課した。
IBM モデル 2 はこの条件を緩和する。
フランス語の単語fj と接続する英語の単語の位置 aj は、以下の
変数に依存すると仮定する。
フランス語の単語の位置 j
英語の文の長さ l
フランス語の文の長さ m
すなわち、フランス語の単語 fj に接続する英語の単語の位置 aj
は、対応付け確率で表現されるとする。
.
Definition (対応付け確率 / alignment probability)
..
.
. ..
.
.
a(aj |j, m, l) = P(aj |a
j−1
1 , f
j−1
1 , m, e)
大岩 秀和 (情理・数理) レポート課題2 IBM Model 2 November 30, 2010 4 / 8
IBM モデル 2
対応付け確率を導入した P(f|e) は、以下の式で記述できる。
P(f|e) = ϵ
l
∑
a1=0
· · ·
l
∑
am=0
m
∏
j=1
t(fj |eaj
)a(aj |j, m, l)
= ϵ
m
∏
j=1
l
∑
aj =0
t(fj |eaj
)a(aj |j, m, l)
.
参考:モデル 1 の場合
..
.
. ..
.
.
P(f|e) =
ϵ
(l + 1)m
m
∏
j=1
l
∑
i=0
t(fj |ei )
大岩 秀和 (情理・数理) レポート課題2 IBM Model 2 November 30, 2010 5 / 8
制約 ∑f t(f |e) = 1 と ∑l
i=0 a(i|j, m, l) = 1 を用いると、ラグラン
ジュ未定乗数法から、
単語 e が単語 f に接続する回数の期待値 C(f |e; f, e)
英語の単語位置 i がフランス語の単語位置 j に接続する回数の期
待値 C(i|j, m, l; f, e)
が導出できる。
.
.
. ..
.
.
C(f |e; f, e) =
m
∑
j=1
l
∑
i=0
t(f |e)a(i|j, m, l)δ(f, fj )δ(e, ei )
t(f |e0)a(0|j, m, l) + · · · + t(f |el )a(l|j, m, l)
.
.
. ..
.
.
C(i|j, m, l; f, e) =
t(fj |ei )a(i|j, m, l)
t(fj |e0)a(0|j, m, l) + · · · + t(fj |el )a(l|j, m, l)
大岩 秀和 (情理・数理) レポート課題2 IBM Model 2 November 30, 2010 6 / 8
青色で書かれている部分が、IBM モデル 1 との違い。
.
IBM モデル 2 のアルゴリズム
..
.
. ..
.
.
...1 英単語 e がフランス語の単語 f に翻訳される確率 t(f |e) と、英
語の単語位置 i がフランス語の単語位置 j に接続する確率
a(i|j, m, l) の初期値を決める
...2 各 (f(s), e(s)) 1 ≤ s ≤ S において、単語 e が単語 f に接続する
回数の期待値 C(f |e; f, e) と、英語の単語位置 i がフランス語の
単語位置 j に接続する回数の期待値 C(i|j, m, l; f, e) を計算する。
...3 t(f |e) と a(i|j, m, l) を再推定する。
a(i|j, m, l) =
∑s C(i|j, m, l; f(s), e(s))
∑l
i=0 ∑s C(i|j, m, l; f(s), e(s))
...4 収束するまで、ステップ 2 とステップ 3 を繰り返す。
大岩 秀和 (情理・数理) レポート課題2 IBM Model 2 November 30, 2010 7 / 8
IBM モデル 2 まとめ
IBM モデル 2 は、IBM モデル 1 の英語とフランス語の間には、
単語の出現順序の関係性はないという制約を緩和したモデル
フランス語の単語に接続する英語の単語の位置を対応付け確
率で表現し、EM アルゴリズムで最尤解を導出
IBM モデル 1 は IBM モデル 2 の特殊系
a(i|j, m, l) = (l + 1)−1
に固定したものが IBM モデル 1
IBM モデル 1 を用いて単語間の関係を推定した後に、その結果
を IBM モデル 2 の初期値として対応付け確率を推定する方法が
よく取られる
IBM モデル 2 は局所解が複数存在し、局所解に陥りやすいため
大岩 秀和 (情理・数理) レポート課題2 IBM Model 2 November 30, 2010 8 / 8

More Related Content

What's hot

半教師あり学習
半教師あり学習半教師あり学習
半教師あり学習syou6162
 
Counterfaual Machine Learning(CFML)のサーベイ
Counterfaual Machine Learning(CFML)のサーベイCounterfaual Machine Learning(CFML)のサーベイ
Counterfaual Machine Learning(CFML)のサーベイ
ARISE analytics
 
機械学習で泣かないためのコード設計 2018
機械学習で泣かないためのコード設計 2018機械学習で泣かないためのコード設計 2018
機械学習で泣かないためのコード設計 2018
Takahiro Kubo
 
[DL輪読会]GLIDE: Guided Language to Image Diffusion for Generation and Editing
[DL輪読会]GLIDE: Guided Language to Image Diffusion  for Generation and Editing[DL輪読会]GLIDE: Guided Language to Image Diffusion  for Generation and Editing
[DL輪読会]GLIDE: Guided Language to Image Diffusion for Generation and Editing
Deep Learning JP
 
fastTextの実装を見てみた
fastTextの実装を見てみたfastTextの実装を見てみた
fastTextの実装を見てみた
Yoshihiko Shiraki
 
Priorに基づく画像/テンソルの復元
Priorに基づく画像/テンソルの復元Priorに基づく画像/テンソルの復元
Priorに基づく画像/テンソルの復元
Tatsuya Yokota
 
[DL輪読会]data2vec: A General Framework for Self-supervised Learning in Speech,...
[DL輪読会]data2vec: A General Framework for  Self-supervised Learning in Speech,...[DL輪読会]data2vec: A General Framework for  Self-supervised Learning in Speech,...
[DL輪読会]data2vec: A General Framework for Self-supervised Learning in Speech,...
Deep Learning JP
 
Iclr2016 vaeまとめ
Iclr2016 vaeまとめIclr2016 vaeまとめ
Iclr2016 vaeまとめ
Deep Learning JP
 
BERTology のススメ
BERTology のススメBERTology のススメ
BERTology のススメ
University of Tsukuba
 
【DL輪読会】SimCSE: Simple Contrastive Learning of Sentence Embeddings (EMNLP 2021)
【DL輪読会】SimCSE: Simple Contrastive Learning of Sentence Embeddings  (EMNLP 2021)【DL輪読会】SimCSE: Simple Contrastive Learning of Sentence Embeddings  (EMNLP 2021)
【DL輪読会】SimCSE: Simple Contrastive Learning of Sentence Embeddings (EMNLP 2021)
Deep Learning JP
 
【DL輪読会】ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
【DL輪読会】ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation【DL輪読会】ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
【DL輪読会】ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
Deep Learning JP
 
GPUいらずの高速動画異常検知
GPUいらずの高速動画異常検知GPUいらずの高速動画異常検知
GPUいらずの高速動画異常検知
Core Concept Technologies
 
CVPR2018 pix2pixHD論文紹介 (CV勉強会@関東)
CVPR2018 pix2pixHD論文紹介 (CV勉強会@関東)CVPR2018 pix2pixHD論文紹介 (CV勉強会@関東)
CVPR2018 pix2pixHD論文紹介 (CV勉強会@関東)
Tenki Lee
 
リクルート式 自然言語処理技術の適応事例紹介
リクルート式 自然言語処理技術の適応事例紹介リクルート式 自然言語処理技術の適応事例紹介
リクルート式 自然言語処理技術の適応事例紹介
Recruit Technologies
 
死にたくない
死にたくない死にたくない
死にたくない
joisino
 
機械学習をこれから始める人が読んでおきたい 特徴選択の有名論文紹介
機械学習をこれから始める人が読んでおきたい 特徴選択の有名論文紹介機械学習をこれから始める人が読んでおきたい 特徴選択の有名論文紹介
機械学習をこれから始める人が読んでおきたい 特徴選択の有名論文紹介
西岡 賢一郎
 
[DL輪読会]Convolutional Conditional Neural Processesと Neural Processes Familyの紹介
[DL輪読会]Convolutional Conditional Neural Processesと Neural Processes Familyの紹介[DL輪読会]Convolutional Conditional Neural Processesと Neural Processes Familyの紹介
[DL輪読会]Convolutional Conditional Neural Processesと Neural Processes Familyの紹介
Deep Learning JP
 
東京大学2020年度深層学習(Deep learning基礎講座) 第9回「深層学習と自然言語処理」
東京大学2020年度深層学習(Deep learning基礎講座) 第9回「深層学習と自然言語処理」東京大学2020年度深層学習(Deep learning基礎講座) 第9回「深層学習と自然言語処理」
東京大学2020年度深層学習(Deep learning基礎講座) 第9回「深層学習と自然言語処理」
Hitomi Yanaka
 
GAN(と強化学習との関係)
GAN(と強化学習との関係)GAN(と強化学習との関係)
GAN(と強化学習との関係)
Masahiro Suzuki
 
CVPR2019読み会@関東CV
CVPR2019読み会@関東CVCVPR2019読み会@関東CV
CVPR2019読み会@関東CV
Takanori Ogata
 

What's hot (20)

半教師あり学習
半教師あり学習半教師あり学習
半教師あり学習
 
Counterfaual Machine Learning(CFML)のサーベイ
Counterfaual Machine Learning(CFML)のサーベイCounterfaual Machine Learning(CFML)のサーベイ
Counterfaual Machine Learning(CFML)のサーベイ
 
機械学習で泣かないためのコード設計 2018
機械学習で泣かないためのコード設計 2018機械学習で泣かないためのコード設計 2018
機械学習で泣かないためのコード設計 2018
 
[DL輪読会]GLIDE: Guided Language to Image Diffusion for Generation and Editing
[DL輪読会]GLIDE: Guided Language to Image Diffusion  for Generation and Editing[DL輪読会]GLIDE: Guided Language to Image Diffusion  for Generation and Editing
[DL輪読会]GLIDE: Guided Language to Image Diffusion for Generation and Editing
 
fastTextの実装を見てみた
fastTextの実装を見てみたfastTextの実装を見てみた
fastTextの実装を見てみた
 
Priorに基づく画像/テンソルの復元
Priorに基づく画像/テンソルの復元Priorに基づく画像/テンソルの復元
Priorに基づく画像/テンソルの復元
 
[DL輪読会]data2vec: A General Framework for Self-supervised Learning in Speech,...
[DL輪読会]data2vec: A General Framework for  Self-supervised Learning in Speech,...[DL輪読会]data2vec: A General Framework for  Self-supervised Learning in Speech,...
[DL輪読会]data2vec: A General Framework for Self-supervised Learning in Speech,...
 
Iclr2016 vaeまとめ
Iclr2016 vaeまとめIclr2016 vaeまとめ
Iclr2016 vaeまとめ
 
BERTology のススメ
BERTology のススメBERTology のススメ
BERTology のススメ
 
【DL輪読会】SimCSE: Simple Contrastive Learning of Sentence Embeddings (EMNLP 2021)
【DL輪読会】SimCSE: Simple Contrastive Learning of Sentence Embeddings  (EMNLP 2021)【DL輪読会】SimCSE: Simple Contrastive Learning of Sentence Embeddings  (EMNLP 2021)
【DL輪読会】SimCSE: Simple Contrastive Learning of Sentence Embeddings (EMNLP 2021)
 
【DL輪読会】ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
【DL輪読会】ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation【DL輪読会】ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
【DL輪読会】ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
 
GPUいらずの高速動画異常検知
GPUいらずの高速動画異常検知GPUいらずの高速動画異常検知
GPUいらずの高速動画異常検知
 
CVPR2018 pix2pixHD論文紹介 (CV勉強会@関東)
CVPR2018 pix2pixHD論文紹介 (CV勉強会@関東)CVPR2018 pix2pixHD論文紹介 (CV勉強会@関東)
CVPR2018 pix2pixHD論文紹介 (CV勉強会@関東)
 
リクルート式 自然言語処理技術の適応事例紹介
リクルート式 自然言語処理技術の適応事例紹介リクルート式 自然言語処理技術の適応事例紹介
リクルート式 自然言語処理技術の適応事例紹介
 
死にたくない
死にたくない死にたくない
死にたくない
 
機械学習をこれから始める人が読んでおきたい 特徴選択の有名論文紹介
機械学習をこれから始める人が読んでおきたい 特徴選択の有名論文紹介機械学習をこれから始める人が読んでおきたい 特徴選択の有名論文紹介
機械学習をこれから始める人が読んでおきたい 特徴選択の有名論文紹介
 
[DL輪読会]Convolutional Conditional Neural Processesと Neural Processes Familyの紹介
[DL輪読会]Convolutional Conditional Neural Processesと Neural Processes Familyの紹介[DL輪読会]Convolutional Conditional Neural Processesと Neural Processes Familyの紹介
[DL輪読会]Convolutional Conditional Neural Processesと Neural Processes Familyの紹介
 
東京大学2020年度深層学習(Deep learning基礎講座) 第9回「深層学習と自然言語処理」
東京大学2020年度深層学習(Deep learning基礎講座) 第9回「深層学習と自然言語処理」東京大学2020年度深層学習(Deep learning基礎講座) 第9回「深層学習と自然言語処理」
東京大学2020年度深層学習(Deep learning基礎講座) 第9回「深層学習と自然言語処理」
 
GAN(と強化学習との関係)
GAN(と強化学習との関係)GAN(と強化学習との関係)
GAN(と強化学習との関係)
 
CVPR2019読み会@関東CV
CVPR2019読み会@関東CVCVPR2019読み会@関東CV
CVPR2019読み会@関東CV
 

More from Hidekazu Oiwa

NIPS2014読み会 NIPS参加報告
NIPS2014読み会 NIPS参加報告NIPS2014読み会 NIPS参加報告
NIPS2014読み会 NIPS参加報告
Hidekazu Oiwa
 
SGD+α: 確率的勾配降下法の現在と未来
SGD+α: 確率的勾配降下法の現在と未来SGD+α: 確率的勾配降下法の現在と未来
SGD+α: 確率的勾配降下法の現在と未来
Hidekazu Oiwa
 
ICML2013読み会 Large-Scale Learning with Less RAM via Randomization
ICML2013読み会 Large-Scale Learning with Less RAM via RandomizationICML2013読み会 Large-Scale Learning with Less RAM via Randomization
ICML2013読み会 Large-Scale Learning with Less RAM via RandomizationHidekazu Oiwa
 
Incentive Compatible Regression Learning (Mathematical Informatics Reading)
Incentive Compatible Regression Learning (Mathematical Informatics Reading)Incentive Compatible Regression Learning (Mathematical Informatics Reading)
Incentive Compatible Regression Learning (Mathematical Informatics Reading)Hidekazu Oiwa
 
PoisoningAttackSVM (ICMLreading2012)
PoisoningAttackSVM (ICMLreading2012)PoisoningAttackSVM (ICMLreading2012)
PoisoningAttackSVM (ICMLreading2012)Hidekazu Oiwa
 
Prml9
Prml9Prml9
Pfi last seminar
Pfi last seminarPfi last seminar
Pfi last seminar
Hidekazu Oiwa
 
PRML5
PRML5PRML5
Arow
ArowArow

More from Hidekazu Oiwa (12)

NIPS2014読み会 NIPS参加報告
NIPS2014読み会 NIPS参加報告NIPS2014読み会 NIPS参加報告
NIPS2014読み会 NIPS参加報告
 
SGD+α: 確率的勾配降下法の現在と未来
SGD+α: 確率的勾配降下法の現在と未来SGD+α: 確率的勾配降下法の現在と未来
SGD+α: 確率的勾配降下法の現在と未来
 
ICML2013読み会 Large-Scale Learning with Less RAM via Randomization
ICML2013読み会 Large-Scale Learning with Less RAM via RandomizationICML2013読み会 Large-Scale Learning with Less RAM via Randomization
ICML2013読み会 Large-Scale Learning with Less RAM via Randomization
 
Incentive Compatible Regression Learning (Mathematical Informatics Reading)
Incentive Compatible Regression Learning (Mathematical Informatics Reading)Incentive Compatible Regression Learning (Mathematical Informatics Reading)
Incentive Compatible Regression Learning (Mathematical Informatics Reading)
 
PoisoningAttackSVM (ICMLreading2012)
PoisoningAttackSVM (ICMLreading2012)PoisoningAttackSVM (ICMLreading2012)
PoisoningAttackSVM (ICMLreading2012)
 
FOBOS
FOBOSFOBOS
FOBOS
 
OnlineClassifiers
OnlineClassifiersOnlineClassifiers
OnlineClassifiers
 
Prml9
Prml9Prml9
Prml9
 
Pfi last seminar
Pfi last seminarPfi last seminar
Pfi last seminar
 
NLPforml5
NLPforml5NLPforml5
NLPforml5
 
PRML5
PRML5PRML5
PRML5
 
Arow
ArowArow
Arow
 

Recently uploaded

FIDO Alliance Osaka Seminar: CloudGate.pdf
FIDO Alliance Osaka Seminar: CloudGate.pdfFIDO Alliance Osaka Seminar: CloudGate.pdf
FIDO Alliance Osaka Seminar: CloudGate.pdf
FIDO Alliance
 
【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching
【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching
【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching
harmonylab
 
CS集会#13_なるほどわからん通信技術 発表資料
CS集会#13_なるほどわからん通信技術 発表資料CS集会#13_なるほどわからん通信技術 発表資料
CS集会#13_なるほどわからん通信技術 発表資料
Yuuitirou528 default
 
FIDO Alliance Osaka Seminar: Welcome Slides.pdf
FIDO Alliance Osaka Seminar: Welcome Slides.pdfFIDO Alliance Osaka Seminar: Welcome Slides.pdf
FIDO Alliance Osaka Seminar: Welcome Slides.pdf
FIDO Alliance
 
This is the company presentation material of RIZAP Technologies, Inc.
This is the company presentation material of RIZAP Technologies, Inc.This is the company presentation material of RIZAP Technologies, Inc.
This is the company presentation material of RIZAP Technologies, Inc.
chiefujita1
 
FIDO Alliance Osaka Seminar: LY-DOCOMO-KDDI-Mercari Panel.pdf
FIDO Alliance Osaka Seminar: LY-DOCOMO-KDDI-Mercari Panel.pdfFIDO Alliance Osaka Seminar: LY-DOCOMO-KDDI-Mercari Panel.pdf
FIDO Alliance Osaka Seminar: LY-DOCOMO-KDDI-Mercari Panel.pdf
FIDO Alliance
 
LoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアル
LoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアルLoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアル
LoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアル
CRI Japan, Inc.
 
FIDO Alliance Osaka Seminar: NEC & Yubico Panel.pdf
FIDO Alliance Osaka Seminar: NEC & Yubico Panel.pdfFIDO Alliance Osaka Seminar: NEC & Yubico Panel.pdf
FIDO Alliance Osaka Seminar: NEC & Yubico Panel.pdf
FIDO Alliance
 
TaketoFujikawa_物語のコンセプトに基づく情報アクセス手法の基礎検討_JSAI2024
TaketoFujikawa_物語のコンセプトに基づく情報アクセス手法の基礎検討_JSAI2024TaketoFujikawa_物語のコンセプトに基づく情報アクセス手法の基礎検討_JSAI2024
TaketoFujikawa_物語のコンセプトに基づく情報アクセス手法の基礎検討_JSAI2024
Matsushita Laboratory
 
JSAI_類似画像マッチングによる器への印象付与手法の妥当性検証_ver.3_高橋りさ
JSAI_類似画像マッチングによる器への印象付与手法の妥当性検証_ver.3_高橋りさJSAI_類似画像マッチングによる器への印象付与手法の妥当性検証_ver.3_高橋りさ
JSAI_類似画像マッチングによる器への印象付与手法の妥当性検証_ver.3_高橋りさ
0207sukipio
 
FIDO Alliance Osaka Seminar: PlayStation Passkey Deployment Case Study.pdf
FIDO Alliance Osaka Seminar: PlayStation Passkey Deployment Case Study.pdfFIDO Alliance Osaka Seminar: PlayStation Passkey Deployment Case Study.pdf
FIDO Alliance Osaka Seminar: PlayStation Passkey Deployment Case Study.pdf
FIDO Alliance
 
論文紹介:When Visual Prompt Tuning Meets Source-Free Domain Adaptive Semantic Seg...
論文紹介:When Visual Prompt Tuning Meets Source-Free Domain Adaptive Semantic Seg...論文紹介:When Visual Prompt Tuning Meets Source-Free Domain Adaptive Semantic Seg...
論文紹介:When Visual Prompt Tuning Meets Source-Free Domain Adaptive Semantic Seg...
Toru Tamaki
 
ReonHata_便利の副作用に気づかせるための発想支援手法の評価---行為の増減の提示による気づきへの影響---
ReonHata_便利の副作用に気づかせるための発想支援手法の評価---行為の増減の提示による気づきへの影響---ReonHata_便利の副作用に気づかせるための発想支援手法の評価---行為の増減の提示による気づきへの影響---
ReonHata_便利の副作用に気づかせるための発想支援手法の評価---行為の増減の提示による気づきへの影響---
Matsushita Laboratory
 
単腕マニピュレータによる 複数物体の同時組み立ての 基礎的考察 / Basic Approach to Robotic Assembly of Multi...
単腕マニピュレータによる 複数物体の同時組み立ての 基礎的考察 / Basic Approach to Robotic Assembly of Multi...単腕マニピュレータによる 複数物体の同時組み立ての 基礎的考察 / Basic Approach to Robotic Assembly of Multi...
単腕マニピュレータによる 複数物体の同時組み立ての 基礎的考察 / Basic Approach to Robotic Assembly of Multi...
Fukuoka Institute of Technology
 

Recently uploaded (14)

FIDO Alliance Osaka Seminar: CloudGate.pdf
FIDO Alliance Osaka Seminar: CloudGate.pdfFIDO Alliance Osaka Seminar: CloudGate.pdf
FIDO Alliance Osaka Seminar: CloudGate.pdf
 
【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching
【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching
【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching
 
CS集会#13_なるほどわからん通信技術 発表資料
CS集会#13_なるほどわからん通信技術 発表資料CS集会#13_なるほどわからん通信技術 発表資料
CS集会#13_なるほどわからん通信技術 発表資料
 
FIDO Alliance Osaka Seminar: Welcome Slides.pdf
FIDO Alliance Osaka Seminar: Welcome Slides.pdfFIDO Alliance Osaka Seminar: Welcome Slides.pdf
FIDO Alliance Osaka Seminar: Welcome Slides.pdf
 
This is the company presentation material of RIZAP Technologies, Inc.
This is the company presentation material of RIZAP Technologies, Inc.This is the company presentation material of RIZAP Technologies, Inc.
This is the company presentation material of RIZAP Technologies, Inc.
 
FIDO Alliance Osaka Seminar: LY-DOCOMO-KDDI-Mercari Panel.pdf
FIDO Alliance Osaka Seminar: LY-DOCOMO-KDDI-Mercari Panel.pdfFIDO Alliance Osaka Seminar: LY-DOCOMO-KDDI-Mercari Panel.pdf
FIDO Alliance Osaka Seminar: LY-DOCOMO-KDDI-Mercari Panel.pdf
 
LoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアル
LoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアルLoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアル
LoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアル
 
FIDO Alliance Osaka Seminar: NEC & Yubico Panel.pdf
FIDO Alliance Osaka Seminar: NEC & Yubico Panel.pdfFIDO Alliance Osaka Seminar: NEC & Yubico Panel.pdf
FIDO Alliance Osaka Seminar: NEC & Yubico Panel.pdf
 
TaketoFujikawa_物語のコンセプトに基づく情報アクセス手法の基礎検討_JSAI2024
TaketoFujikawa_物語のコンセプトに基づく情報アクセス手法の基礎検討_JSAI2024TaketoFujikawa_物語のコンセプトに基づく情報アクセス手法の基礎検討_JSAI2024
TaketoFujikawa_物語のコンセプトに基づく情報アクセス手法の基礎検討_JSAI2024
 
JSAI_類似画像マッチングによる器への印象付与手法の妥当性検証_ver.3_高橋りさ
JSAI_類似画像マッチングによる器への印象付与手法の妥当性検証_ver.3_高橋りさJSAI_類似画像マッチングによる器への印象付与手法の妥当性検証_ver.3_高橋りさ
JSAI_類似画像マッチングによる器への印象付与手法の妥当性検証_ver.3_高橋りさ
 
FIDO Alliance Osaka Seminar: PlayStation Passkey Deployment Case Study.pdf
FIDO Alliance Osaka Seminar: PlayStation Passkey Deployment Case Study.pdfFIDO Alliance Osaka Seminar: PlayStation Passkey Deployment Case Study.pdf
FIDO Alliance Osaka Seminar: PlayStation Passkey Deployment Case Study.pdf
 
論文紹介:When Visual Prompt Tuning Meets Source-Free Domain Adaptive Semantic Seg...
論文紹介:When Visual Prompt Tuning Meets Source-Free Domain Adaptive Semantic Seg...論文紹介:When Visual Prompt Tuning Meets Source-Free Domain Adaptive Semantic Seg...
論文紹介:When Visual Prompt Tuning Meets Source-Free Domain Adaptive Semantic Seg...
 
ReonHata_便利の副作用に気づかせるための発想支援手法の評価---行為の増減の提示による気づきへの影響---
ReonHata_便利の副作用に気づかせるための発想支援手法の評価---行為の増減の提示による気づきへの影響---ReonHata_便利の副作用に気づかせるための発想支援手法の評価---行為の増減の提示による気づきへの影響---
ReonHata_便利の副作用に気づかせるための発想支援手法の評価---行為の増減の提示による気づきへの影響---
 
単腕マニピュレータによる 複数物体の同時組み立ての 基礎的考察 / Basic Approach to Robotic Assembly of Multi...
単腕マニピュレータによる 複数物体の同時組み立ての 基礎的考察 / Basic Approach to Robotic Assembly of Multi...単腕マニピュレータによる 複数物体の同時組み立ての 基礎的考察 / Basic Approach to Robotic Assembly of Multi...
単腕マニピュレータによる 複数物体の同時組み立ての 基礎的考察 / Basic Approach to Robotic Assembly of Multi...
 

IBMModel2

  • 1. . . . .. . . レポート課題2 IBM Model 2 大岩 秀和 情報理工学系研究科 数理情報学専攻 修士 1 年 November 30, 2010 大岩 秀和 (情理・数理) レポート課題2 IBM Model 2 November 30, 2010 1 / 8
  • 2. 機械翻訳 . 目的 .. . . .. . . フランス語の文 f が与えられたとき、良い翻訳結果となる一番最もら しい英語の文 ˆe に翻訳する。これを P(e|f) を用いて式で書くと、 ˆe = arg max e P(e|f) (1) (1) 式は Bayes の定理を用いて、以下の形に書き換えられる。 ˆe = arg max e P(e|f) = arg max e P(e)P(f|e) 英文そのものの最もらしさを表す P(e) は、英文のみのコーパスから 計算できるので… 大岩 秀和 (情理・数理) レポート課題2 IBM Model 2 November 30, 2010 2 / 8
  • 3. 機械翻訳 . 目的 .. . . .. . . フランス語の文 f が与えられたとき、良い翻訳結果となる一番最もら しい英語の文 ˆe に翻訳する。これを P(e|f) を用いて式で書くと、 ˆe = arg max e P(e|f) (1) (1) 式は Bayes の定理を用いて、以下の形に書き換えられる。 ˆe = arg max e P(e|f) = arg max e P(e)P(f|e) 英文そのものの最もらしさを表す P(e) は、英文のみのコーパスから 計算できるので… . 目的の書き換え .. . . .. . . 対訳コーパス {(f(1), e(1)), . . . , (f(S), e(S))} を用いて、十分良い翻訳 精度を示すような P(f|e) を探す。 大岩 秀和 (情理・数理) レポート課題2 IBM Model 2 November 30, 2010 2 / 8
  • 4. . IBM モデル 1 のアルゴリズム .. . . .. . . ...1 英単語 e がフランス語の単語 f に翻訳される確率 t(f |e) の初期 値を決める ...2 各 (f(s), e(s)) 1 ≤ s ≤ S において、ある英単語 e があるフラン ス語の単語 f に対応する回数の期待値 c(f |e; f(s) , e(s) ) = t(f |e) t(f |e0) + · · · + t(f |el ) m ∑ j=1 δ(f, f′ ) l ∑ i=0 δ(e, ei ) を計算する。 ...3 t(f |e) を再推定する。 t(f |e) = ∑s C(f |e; f(s), e(s)) ∑f ∑s C(f |e; f(s), e(s)) ...4 収束するまで、ステップ 2 とステップ 3 を繰り返す 大岩 秀和 (情理・数理) レポート課題2 IBM Model 2 November 30, 2010 3 / 8
  • 5. IBM モデル 2 IBM モデル 1 では、英語とフランス語の間には、単語の出現順 序の関係性はないという制約を課した。 大岩 秀和 (情理・数理) レポート課題2 IBM Model 2 November 30, 2010 4 / 8
  • 6. IBM モデル 2 IBM モデル 1 では、英語とフランス語の間には、単語の出現順 序の関係性はないという制約を課した。 IBM モデル 2 はこの条件を緩和する。 大岩 秀和 (情理・数理) レポート課題2 IBM Model 2 November 30, 2010 4 / 8
  • 7. IBM モデル 2 IBM モデル 1 では、英語とフランス語の間には、単語の出現順 序の関係性はないという制約を課した。 IBM モデル 2 はこの条件を緩和する。 フランス語の単語fj と接続する英語の単語の位置 aj は、以下の 変数に依存すると仮定する。 フランス語の単語の位置 j 英語の文の長さ l フランス語の文の長さ m 大岩 秀和 (情理・数理) レポート課題2 IBM Model 2 November 30, 2010 4 / 8
  • 8. IBM モデル 2 IBM モデル 1 では、英語とフランス語の間には、単語の出現順 序の関係性はないという制約を課した。 IBM モデル 2 はこの条件を緩和する。 フランス語の単語fj と接続する英語の単語の位置 aj は、以下の 変数に依存すると仮定する。 フランス語の単語の位置 j 英語の文の長さ l フランス語の文の長さ m すなわち、フランス語の単語 fj に接続する英語の単語の位置 aj は、対応付け確率で表現されるとする。 . Definition (対応付け確率 / alignment probability) .. . . .. . . a(aj |j, m, l) = P(aj |a j−1 1 , f j−1 1 , m, e) 大岩 秀和 (情理・数理) レポート課題2 IBM Model 2 November 30, 2010 4 / 8
  • 9. IBM モデル 2 対応付け確率を導入した P(f|e) は、以下の式で記述できる。 P(f|e) = ϵ l ∑ a1=0 · · · l ∑ am=0 m ∏ j=1 t(fj |eaj )a(aj |j, m, l) = ϵ m ∏ j=1 l ∑ aj =0 t(fj |eaj )a(aj |j, m, l) . 参考:モデル 1 の場合 .. . . .. . . P(f|e) = ϵ (l + 1)m m ∏ j=1 l ∑ i=0 t(fj |ei ) 大岩 秀和 (情理・数理) レポート課題2 IBM Model 2 November 30, 2010 5 / 8
  • 10. 制約 ∑f t(f |e) = 1 と ∑l i=0 a(i|j, m, l) = 1 を用いると、ラグラン ジュ未定乗数法から、 単語 e が単語 f に接続する回数の期待値 C(f |e; f, e) 英語の単語位置 i がフランス語の単語位置 j に接続する回数の期 待値 C(i|j, m, l; f, e) が導出できる。 . . . .. . . C(f |e; f, e) = m ∑ j=1 l ∑ i=0 t(f |e)a(i|j, m, l)δ(f, fj )δ(e, ei ) t(f |e0)a(0|j, m, l) + · · · + t(f |el )a(l|j, m, l) . . . .. . . C(i|j, m, l; f, e) = t(fj |ei )a(i|j, m, l) t(fj |e0)a(0|j, m, l) + · · · + t(fj |el )a(l|j, m, l) 大岩 秀和 (情理・数理) レポート課題2 IBM Model 2 November 30, 2010 6 / 8
  • 11. 青色で書かれている部分が、IBM モデル 1 との違い。 . IBM モデル 2 のアルゴリズム .. . . .. . . ...1 英単語 e がフランス語の単語 f に翻訳される確率 t(f |e) と、英 語の単語位置 i がフランス語の単語位置 j に接続する確率 a(i|j, m, l) の初期値を決める ...2 各 (f(s), e(s)) 1 ≤ s ≤ S において、単語 e が単語 f に接続する 回数の期待値 C(f |e; f, e) と、英語の単語位置 i がフランス語の 単語位置 j に接続する回数の期待値 C(i|j, m, l; f, e) を計算する。 ...3 t(f |e) と a(i|j, m, l) を再推定する。 a(i|j, m, l) = ∑s C(i|j, m, l; f(s), e(s)) ∑l i=0 ∑s C(i|j, m, l; f(s), e(s)) ...4 収束するまで、ステップ 2 とステップ 3 を繰り返す。 大岩 秀和 (情理・数理) レポート課題2 IBM Model 2 November 30, 2010 7 / 8
  • 12. IBM モデル 2 まとめ IBM モデル 2 は、IBM モデル 1 の英語とフランス語の間には、 単語の出現順序の関係性はないという制約を緩和したモデル フランス語の単語に接続する英語の単語の位置を対応付け確 率で表現し、EM アルゴリズムで最尤解を導出 IBM モデル 1 は IBM モデル 2 の特殊系 a(i|j, m, l) = (l + 1)−1 に固定したものが IBM モデル 1 IBM モデル 1 を用いて単語間の関係を推定した後に、その結果 を IBM モデル 2 の初期値として対応付け確率を推定する方法が よく取られる IBM モデル 2 は局所解が複数存在し、局所解に陥りやすいため 大岩 秀和 (情理・数理) レポート課題2 IBM Model 2 November 30, 2010 8 / 8