More Related Content Similar to Improving translation via targeted paraphrasing Similar to Improving translation via targeted paraphrasing (13) More from Hiroshi Matsumoto More from Hiroshi Matsumoto (13) Improving translation via targeted paraphrasing2. 紹介文献
• 著者: Resnik, Philip, et al.
• タイトル: Improving translation via targeted
paraphrasing.
• 学会: Proceedings of the 2010 Conference on
Empirical Methods in Natural Language
Processing. Association for Computational
Linguistics, 2010.
7. 人手手法
1. 初期翻訳: Google翻訳
2. 悪質箇所検知: 単言語(目的言語)話者によって行われる
3. 単語アライメントによる原文の対応箇所の検知
4. 単言語(原言語)話者によっての言い換え
5. 機械翻訳で再度翻訳
8. 例
• John and Mary took a European vacation this
summer!
• Mary went on a European
10. パイロット実験(人手手法):
• 翻訳: 中国語 ̶> 英語
• 実験データ:
• 中国語Wikipediaの見出し文
• 詳細説明文(1段落以降)からランダムに6文
• 翻訳:
• 翻訳手法: Google 翻訳
• 換言:
• 検知: Amazon Mechanical Turk: 3人
• 換言: Amazon Mechanical Turk: 3人
13. 実験
• 手法:
• パイロット実験同様: 中国語 ̶> 英語
• データ:
• NIST MT08 データ: 1,357文中49文
• 検知:
• 人手
14. ターゲットパラフレーズ結果
• 英語
• 115の部分的翻訳誤り
• 平均:2.3箇所/文
• 中国語
• 138の適切な換言の付与
• Mechanicla Turk: $5.06 ≒ $0.11/setence
17. 実験
• 翻訳:
• 英語 ̶> 中国語
• Google 翻訳
• データ:
• NIST MT08 データ: 1,357文
• 検知:
• TERp
• 評価:
• TER: Translation Error Rate
19. 結果
• TERで評価した時
• Oracleの結果では12.16 TER points の向上
• コスト:
• 換言: $117.48 ≒ $0.12/文
20. まとめ
• 換言による訳質改善を行った
• 悪質訳の検知の自動化を図った
• パイロット実験で向上が見られた
• 換言部分も実装は可能
• バイリンガル・フレーズテーブルの利用により
• 機械翻訳部分も後に実装したものを利用して行いたい