SlideShare uses cookies to improve functionality and performance, and to provide you with relevant advertising. If you continue browsing the site, you agree to the use of cookies on this website. See our User Agreement and Privacy Policy.
SlideShare uses cookies to improve functionality and performance, and to provide you with relevant advertising. If you continue browsing the site, you agree to the use of cookies on this website. See our Privacy Policy and User Agreement for details.
Successfully reported this slideshow.
Activate your 30 day free trial to unlock unlimited reading.
7.
⽬次
1. 研究背景
2. 従来のピボット翻訳⼿法
3. 提案⼿法
4. 実験的評価
5. まとめ・今後の課題
6. Appendix
16/06/20 7Akiva Miura AHC-Lab, IS, NAIST
8.
ü 実現が容易、機械翻訳⽅式に依らず組合せ可能
✗ 翻訳誤りが伝播される、システム全体の最適化困難
15/03/15 Akiva Miura AHC-Lab, IS, NAIST 8
SMT
S → P
SMT
P → T
S⽂ P⽂ T⽂
l パイプライン処理によって中間⾔語⽂を介して翻訳
[De Gispert et al.,2006]
逐次的ピボット翻訳 (Cascade)
S: 原⾔語
P: 中間⾔語
T: ⽬的⾔語
9.
ü 独⽴したモデルを⽣成、最適化が容易
ü 逐次的ピボット翻訳よりも⾼精度
• 翻訳確率の推定⽅法に精度が依存
テーブル合成⽅式 (Triangulation)
16/06/20 Akiva Miura AHC-Lab, IS, NAIST 9
SMT
S → P
SMT
P → T
S⽂ T⽂
SMT
S → T
l 2つの翻訳モデルを1つに合成 [Cohn et al., 2007]
S: 原⾔語
P: 中間⾔語
T: ⽬的⾔語
11.
⽬次
1. 研究背景
2. 従来のピボット翻訳⼿法
3. 提案⼿法
4. 実験的評価
5. まとめ・今後の課題
6. Appendix
16/06/20 11Akiva Miura AHC-Lab, IS, NAIST
12.
着想
16/06/20 Akiva Miura AHC-Lab, IS, NAIST 12
ü 翻訳時に⽬的⾔語と中間⾔語の⽂を同時に⽣成
ü 中間⾔語では、豊富な単⾔語資源を取得可能
Ø 中間⾔語⽂の⾃然性を考慮することで適切な語彙選択に貢献?
近似 approccio
(via: approach)
近似 ravvicinamento
(via: approach, approximation)
・・・
l 従来法:テーブル合成後には、関連していたピボットの情報が消失
近似 〈approccio, approach〉
近似 〈ravvicinamento, approach〉
近似 〈ravvicinamento, approximation〉
l 提案法:テーブル合成時に、関連するピボットフレーズも記憶
・・・
13.
提案⼿法: 複数同期ルール合成
16/06/20 Akiva Miura AHC-Lab, IS, NAIST 13
X → 〈 src1, pvt1 〉
X → 〈 src2, pvt1 〉
X → 〈 src3, pvt2 〉
. . .
X → 〈 pvt1, trg1〉
X → 〈 pvt2, trg2〉
X → 〈 pvt2, trg3〉
. . .
l Source-Pivot、Pivot-Targetの同期ルール(Chiang 2007)を個別に学習
Ø 共通するピボットフレーズ毎にSource-Target-Pivotの
複数同期ルール(Neubig et al., 2015)を合成
X → 〈 src1, trg1, pvt1 〉
X → 〈 src2, trg1, pvt1 〉
X → 〈 src3, trg2, pvt2 〉
X → 〈 src3, trg2, pvt3 〉
. . .
同時翻訳確率
を推定
φ(trg,pvt | src)
φ(src | pvt,trg)
翻訳確率
φ(pvt | src)
φ(src | pvt)
φ(trg | pvt)
φ(pvt | trg)
14.
⽬次
1. 研究背景
2. 従来のピボット翻訳⼿法
3. 提案⼿法
4. 実験的評価
5. まとめ・今後の課題
6. Appendix
16/06/20 14Akiva Miura AHC-Lab, IS, NAIST
15.
翻訳タスク
16/06/20 15
直接:
SMT
S → T
S T
SMT
S → P
S P
SMT
P → T
T
逐次:
無記憶合成 (ベースライン):
SMT
S → P
SMT
P → T
SMT
S → T
S T
記憶合成 (提案法):
SMT
S → P
SMT
P → T
SMT (Multi)
S → T, P
S
T
P
Akiva Miura AHC-Lab, IS, NAIST
19.
曖昧性が解消された例
⼊⼒⽂ (ドイツ語):
Ich bedaure , daß es keine gemeinsame Annäherung gegeben hat .
正解訳 (イタリア語):
Sono spiacente del mancato approccio comune .
無記憶合成 (ベースライン):
Mi rammarico per il fatto che non si ravvicinamento comune .
(BLEU+1: 13.84)
記憶合成 (提案法):
Mi dispiace che non esiste un approccio comune . (BLEU+1: 25.10)
I regret that there is no common approach . (同時⽣成された英⽂)
16/06/20 Akiva Miura AHC-Lab, IS, NAIST 19
✔ ピボットフレーズの情報と中間⾔語モデルが曖昧性解消に寄与
↑✗
◯↓
20.
曖昧性を解消できなかった例
⼊⼒⽂ (フランス語):
Vous avez tout à fait raison et je vous remercie dʼavoir attire´
lʼattention sur ce point .
正解訳 (スペイン語):
Tiene usted toda la razón y le agradezco que nos llame la atención
sobre este punto .
直接翻訳 (上限):
Tiene usted razón y le agradezco que haya llamado la atención sobre
este punto . (BLEU+1: 56.00)
記憶合成 (提案法):
Tiene usted mucha razón y gracias por haber conseguido la atención
sobre este punto . (BLEU+1: 38.91)
You have quite right and I thank you for having courageously brought
the attention on this point . (同時⽣成された英⽂)
16/06/20 Akiva Miura AHC-Lab, IS, NAIST 20
✗ 多品詞語「thank」の影響で訳が変わってしまっている
21.
⽬次
1. 研究背景
2. 従来のピボット翻訳⼿法
3. 提案⼿法
4. 実験的評価
5. まとめ・今後の課題
6. Appendix
16/06/20 21Akiva Miura AHC-Lab, IS, NAIST
23.
今後の計画
l 表層的な単語列(語順)の扱いのみでは限界
Ø 統語情報を取り⼊れることで更なる曖昧性の解消を狙う
Ø 構⽂部分⽊を中間表現に⽤いるピボット翻訳⼿法
16/06/20 Akiva Miura AHC-Lab, IS, NAIST 23
NP
NN
X1:DT book
[X1] 本 [X1] 書
( b ) 部分構⽂⽊が中間表現 (多品詞語に対応可)
[X1] 本
( a ) 記号列が中間表現 (多品詞語による問題)
[X1] book [X1] 預訂✗
✔
24.
ご清聴ありがとうございました
l 本会の受賞および発表のきっかけを作って下りました⻑尾真先⽣、
選考に携わって下さった皆様やAAMT役員の皆様
に⼼より感謝申し上げます
l 本発表の元となりました修⼠論⽂の執筆にあたって、
様々な指導をして下さりました中村哲先⽣
指導および本賞へ推薦して下さりましたGraham Neubig先⽣
に⼼より感謝申し上げます
16/06/20 Akiva Miura AHC-Lab, IS, NAIST 24
0 likes
Be the first to like this
Views
Total views
2,336
On SlideShare
0
From Embeds
0
Number of Embeds
480
You have now unlocked unlimited access to 20M+ documents!
Unlimited Reading
Learn faster and smarter from top experts
Unlimited Downloading
Download to take your learnings offline and on the go
You also get free access to Scribd!
Instant access to millions of ebooks, audiobooks, magazines, podcasts and more.
Read and listen offline with any device.
Free access to premium services like Tuneln, Mubi and more.