ü 独⽴したモデルを⽣成、最適化が容易
ü 逐次的ピボット翻訳よりも⾼精度
• 翻訳確率の推定⽅法に精度が依存
テーブル合成⽅式 (Triangulation)
16/06/20 Akiva Miura AHC-Lab, IS, NAIST 9
SMT
S → P
SMT
P → T
S⽂ T⽂
SMT
S → T
l 2つの翻訳モデルを1つに合成 [Cohn et al., 2007]
S: 原⾔語
P: 中間⾔語
T: ⽬的⾔語
翻訳タスク
16/06/20 15
直接:
SMT
S → T
S T
SMT
S → P
S P
SMT
P → T
T
逐次:
無記憶合成 (ベースライン):
SMT
S → P
SMT
P → T
SMT
S → T
S T
記憶合成 (提案法):
SMT
S → P
SMT
P → T
SMT (Multi)
S → T, P
S
T
P
Akiva Miura AHC-Lab, IS, NAIST
曖昧性が解消された例
⼊⼒⽂ (ドイツ語):
Ich bedaure , daß es keine gemeinsame Annäherung gegeben hat .
正解訳 (イタリア語):
Sono spiacente del mancato approccio comune .
無記憶合成 (ベースライン):
Mi rammarico per il fatto che non si ravvicinamento comune .
(BLEU+1: 13.84)
記憶合成 (提案法):
Mi dispiace che non esiste un approccio comune . (BLEU+1: 25.10)
I regret that there is no common approach . (同時⽣成された英⽂)
16/06/20 Akiva Miura AHC-Lab, IS, NAIST 19
✔ ピボットフレーズの情報と中間⾔語モデルが曖昧性解消に寄与
↑✗
◯↓
曖昧性を解消できなかった例
⼊⼒⽂ (フランス語):
Vous avez tout à fait raison et je vous remercie dʼavoir attire´
lʼattention sur ce point .
正解訳 (スペイン語):
Tiene usted toda la razón y le agradezco que nos llame la atención
sobre este punto .
直接翻訳 (上限):
Tiene usted razón y le agradezco que haya llamado la atención sobre
este punto . (BLEU+1: 56.00)
記憶合成 (提案法):
Tiene usted mucha razón y gracias por haber conseguido la atención
sobre este punto . (BLEU+1: 38.91)
You have quite right and I thank you for having courageously brought
the attention on this point . (同時⽣成された英⽂)
16/06/20 Akiva Miura AHC-Lab, IS, NAIST 20
✗ 多品詞語「thank」の影響で訳が変わってしまっている