SlideShare a Scribd company logo
1 of 28
PEMT
POST-EDITING
OF
MACHINE TRANSLATION
OPZET
•Basisprincipes van MT
•Wat is post-editing?
•Revisie of Post-editing?
•Criteria voor de evaluatie van PEMT-
opdrachten
•Tips voor een efficiënte post-editing
•Tarieven
Basisprincipes van
machinevertaling (MT)
• RBMT - Rule-Based Machine
Translation
• Stochastische MT
• EbMT - Example-based Machine
Translation
• SMT - Statistical Machine Translation
• Hybrid
• MTM - Machine Translation + Translation
Memory
Rule-based Machine Translation
Example-based
Machine Translation (EbMT)
• Het meisje leest een boek
• The girl reads a book
• Het meisje leest een krant
• The girl reads ….
Statistical Machine Translation (SMT)
RbMT vs SMT
Toepassingen van MT
Wat is revisie?
•“The process of checking a draft
translation for errors and making
appropriate amendments.” (Brian
Mossop, Revising and Editing for
Translators, 2011)
Wat is post-editing (PEMT)?
• Reparatie vs verbetering
• The process of improving a machine‐generated
translation with a minimum of manual labor. (TAUS,
2010)
Wat is het verschil tussen PEMT en
revisie?
PEMT: Verschillende niveau’s
• GIST POST-EDITING
• LIGHT POST-EDITING
• FULL POST-EDITING
VOORBEELD – INSTRUCTIES VOOR
FULL POST-EDITING
•
• De gewenste kwaliteit is de kwaliteit van een tekst die
klaar is voor publicatie. Dit betekent dat de tekst geen
doorhalingen bevat en er geen woorden ontbreken, dat de
tekst zorgvuldig is opgesteld, de brontekst nergens
verkeerd is vertaald, de grammaticale regels en de
spelling van de doeltaal correct zijn toegepast en de
terminologie van het meegeleverde glossarium is
aangehouden.
• Maak zo min mogelijk edits
• Corrigeer alleen fouten
• Volg het glossarium
• Wanneer de terminologie afwijkt, vervang deze dan
met die in het glossarium
• Voer geen eigen voorkeurstermen in
• Herschrijf de tekst niet, tenzij er onzin staat
• Probeer de tekst niet te ‘verbeteren’
VOORBEELD – INSTRUCTIES VOOR
LIGHT POST-EDITING
• Duidelijk en beknopt
• Wijk niet af van de stijl
• Taalspecifieke regels
• Nationale/regionale nuances
• Gramaticale, syntactische en spellingregels
• Houd de grove vertaling zo veel mogelijk aan
• Sta niet te lang stil bij een probleem
• Maak je niet druk over stijl
• Vermijd tijdrovend opzoeken van termen
• Breng alleen veranderingen aan wanneer het absoluut noodzakelijk is
• Onzin
• Verkeerde woorden (ook door spellingsfouten in de brontekst)
• Ontbrekende woorden
• Interpunctie, hoofdlettergebruik
• Flexie (verbuiging/vervoeging)
• Geslacht
• Woordvolgorde
• Opmaak
VOORBEELD 1
BRONTEKST
Met de spectrofotometer kun je eenvoudig en snel
de kleur van te spuiten auto’s bepalen. Plaats het
apparaat op het te meten oppervlak en het apparaat
doet de rest. De basis voor het programma is
ICRIS: een database met formules voor alle
kleurvarianten, te vergelijken met een digitale
staalkaartenbak. Deze gebruikershandleiding laat
zien hoe je de spectrofotometer gebruikt.
RbMT vs SMT
RbMT OUTPUT
• With the spectrophotometer you
can simply and rapidly the colour
to spout car to stipulate. Place
the apparatus on surface to
measure and the apparatus does
the rest. The basis for the
programme is ICRIS: a database
with formulas for all colour
alternatives, to compare with a
digital steel card-tray. This user-
manual shows how you use the
spectrophotometer.
SMT OUTPUT
• With the spectrophotometer,
you can easily and quickly
determine the color of
spraying cars. Place the
device on the surface to be
measured and the machine
does the rest. The basis for
the program is ICRIS:
comparable to a digital steel
card catalog a database of
formulas for all color
variants. This manual shows
how to use the
spectrophotometer.
PEMT - VOORBEELD 1A
RbMT OUTPUT
• With the spectrophotometer you
can simply and rapidly the colour
to spout car to stipulate. Place
the apparatus on surface to
measure and the apparatus does
the rest. The basis for the
programme is ICRIS: a database
with formulas for all colour
alternatives, to compare with a
digital steel card-tray. This user-
manual shows how you use the
spectrophotometer.
POST-EDITED VERSIE
With the spectrophotometer you
can simply and rapidly choose
the colour of cars to be spray-
painted. Place the apparatus on
the surface to be measured and
the apparatus does the rest. The
basis for the programme is
ICRIS: a database with formulas
for all colour alternatives,
comparable to a digital box with
sample-sheets. This user manual
shows how you use the
spectrophotometer.
PEMT - VOORBEELD 1B
SMT OUTPUT
• With the spectrophotometer,
you can easily and quickly
determine the color of
spraying cars. Place the
device on the surface to be
measured and the machine
does the rest. The basis for
the program is ICRIS:
comparable to a digital steel
card catalog a database of
formulas for all color
variants. This manual shows
how to use the
spectrophotometer.
POST-EDITED VERSIE
• With the spectrophotometer,
you can quickly and easily
determine the colour of the
cars that need to be spray-
painted. Place the device on
the surface to be analysed
and the device will do the
rest. The basis for the
program is ICRIS: a
database of formulas for all
color variations comparable
to a digital colour catalogue.
This manual shows how to
use the spectrophotometer.
PEMT – Voorbeeld met CL
• RULE I
Write sentences that are shorter than 25 words.
Write:
If you want to modify your profile:
• Inform the editorial board;
• Send a copy of the new profile;
• Confirm once the new profile is published.
Do not write:
Authors wishing to modify their profile on the website
should send an email to the editorial board informing that
they want to change their profile. Then they will send a
copy of their new profile and wait to confirm once the
profile has been published on the journal website.
RbMT
• REGEL I
• Schrijf zinnen die korter zijn dan 25 woorden.
Schrijf:
Als u uw profiel wilt wijzigen:
• Informeer het redactiecomité;
• Verzend een exemplaar van het nieuwe
profiel;
• Bevestig zodra het nieuwe profiel wordt
gepubliceerd.
• Schrijf niet:
Auteurs die hun profiel op de website
shouldsendan e-mail aan het redactiecomité
informeren wensen te wijzigen die dat zij hun
profiel willen veranderen. Dan zullen zij een
exemplaar van hun nieuw profiel verzenden
en zullen wachten te bevestigen zodra het
profiel op de dagboekwebsite is
gepubliceerd.
Post-edited
•
SMT
• IK REGEL
• Schrijven van zinnen die korter dan 25
woorden zijn.
• Schrijven:
• Als u wilt uw profiel wijzigen:
• informeren de redactieraad;
• Stuur een kopie van het nieuwe profiel;
• Bevestigen nadat het nieuwe profiel is
gepubliceerd.
• Schrijf niet:
• auteurs willen wijzigen hun profiel op de
website moeten Stuur een email naar de
redactie te informeren dat ze willen hun
profiel wijzigen. Dan ze een kopie van het
nieuwe profiel sturen en wachten om te
bevestigen nadat u het profiel hebt
gepubliceerd op de website van het
dagboek.
Post-edited
EVALUATIE VAN MT –METRICS
• BLEU Bilingual Evaluation Understuy
• 1 = professionele menselijke vertaling
• .65 = menselijke kwaliteit
• Een verhoogde score betekent niet bij uitstek dat de kwaliteit van de
vertaling beter is
• TER – Translation Edit Rate
• WER (Word Error Rate)
• Meestal gebruikt in spraakherkenning
• NIST
• Gebaseerd op BLEU, met enkele aanpassingen
• METEOR (Metric for Evaluation of Translation with Explicit
ORdering)
• Gebaseerd op BLEU
• F-Measure (F1 Score or F-Score)
• Een meting van de testnauwkeurigheid die in machine-learning
wordt gebruikt
• Gebaseerd op BLEU, met enkele aanpassingen
TIPS - I
• De geschiktheid van de brontekst
• Het schonen van de brontekst
• Het beschikbaar zijn van een erkende
terminologie database
TIPS - II
• MT
• Kwaliteit
• Gebruik van de tekst
• Levertijd
• Duidelijke richtlijnen
• Voorbeeldtekst van 1500 Woorden
TIPS - III
Wie is de Post-editor?
•Eentalige Post-editors
•Professionele tweetalige MT Post-
Editors
TARIEVEN
• Evaluatie per MT engine/projekt
• Combinatie van Automatic Metrics en “menselijke”
evaluatie
• Samenwerking met post-editors
• Soort tekst
• PEMT-niveau (verwachte kwaliteitsniveau)
• Talencombinatie
• Editing distance
DCT - PEMT

More Related Content

More from Isabella Massardo

Alan Turing e il principio di realtà
Alan Turing e il principio di realtàAlan Turing e il principio di realtà
Alan Turing e il principio di realtàIsabella Massardo
 
"I fiori blu" tradotto con la traduzione automatica? Ma nemmeno per sogno.......
"I fiori blu" tradotto con la traduzione automatica? Ma nemmeno per sogno......."I fiori blu" tradotto con la traduzione automatica? Ma nemmeno per sogno.......
"I fiori blu" tradotto con la traduzione automatica? Ma nemmeno per sogno.......Isabella Massardo
 
Zijn onze surfdagen voorbij final std
Zijn onze surfdagen voorbij final stdZijn onze surfdagen voorbij final std
Zijn onze surfdagen voorbij final stdIsabella Massardo
 
CAT Tools for dummies - Corso online organizzato da Langue & Parole 2017
CAT Tools for dummies - Corso online organizzato da Langue & Parole 2017CAT Tools for dummies - Corso online organizzato da Langue & Parole 2017
CAT Tools for dummies - Corso online organizzato da Langue & Parole 2017Isabella Massardo
 
Langue&parole traduzione automatica e post-editing 2015 finale
Langue&parole   traduzione automatica e post-editing 2015 finaleLangue&parole   traduzione automatica e post-editing 2015 finale
Langue&parole traduzione automatica e post-editing 2015 finaleIsabella Massardo
 
The quest for the translation unicorn
The quest for the translation unicornThe quest for the translation unicorn
The quest for the translation unicornIsabella Massardo
 
Standards, technology and europe
Standards, technology and europeStandards, technology and europe
Standards, technology and europeIsabella Massardo
 
TAUS Knowledge Base: Communicating Translation Automation
TAUS Knowledge Base: Communicating Translation AutomationTAUS Knowledge Base: Communicating Translation Automation
TAUS Knowledge Base: Communicating Translation AutomationIsabella Massardo
 

More from Isabella Massardo (10)

Alan Turing e il principio di realtà
Alan Turing e il principio di realtàAlan Turing e il principio di realtà
Alan Turing e il principio di realtà
 
Artigiani slide massardo
Artigiani slide massardoArtigiani slide massardo
Artigiani slide massardo
 
"I fiori blu" tradotto con la traduzione automatica? Ma nemmeno per sogno.......
"I fiori blu" tradotto con la traduzione automatica? Ma nemmeno per sogno......."I fiori blu" tradotto con la traduzione automatica? Ma nemmeno per sogno.......
"I fiori blu" tradotto con la traduzione automatica? Ma nemmeno per sogno.......
 
Zijn onze surfdagen voorbij final std
Zijn onze surfdagen voorbij final stdZijn onze surfdagen voorbij final std
Zijn onze surfdagen voorbij final std
 
CAT Tools for dummies - Corso online organizzato da Langue & Parole 2017
CAT Tools for dummies - Corso online organizzato da Langue & Parole 2017CAT Tools for dummies - Corso online organizzato da Langue & Parole 2017
CAT Tools for dummies - Corso online organizzato da Langue & Parole 2017
 
Langue&parole traduzione automatica e post-editing 2015 finale
Langue&parole   traduzione automatica e post-editing 2015 finaleLangue&parole   traduzione automatica e post-editing 2015 finale
Langue&parole traduzione automatica e post-editing 2015 finale
 
The quest for the translation unicorn
The quest for the translation unicornThe quest for the translation unicorn
The quest for the translation unicorn
 
Standards, technology and europe
Standards, technology and europeStandards, technology and europe
Standards, technology and europe
 
The state of post editing
The state of post editingThe state of post editing
The state of post editing
 
TAUS Knowledge Base: Communicating Translation Automation
TAUS Knowledge Base: Communicating Translation AutomationTAUS Knowledge Base: Communicating Translation Automation
TAUS Knowledge Base: Communicating Translation Automation
 

DCT - PEMT

  • 2. OPZET •Basisprincipes van MT •Wat is post-editing? •Revisie of Post-editing? •Criteria voor de evaluatie van PEMT- opdrachten •Tips voor een efficiënte post-editing •Tarieven
  • 3. Basisprincipes van machinevertaling (MT) • RBMT - Rule-Based Machine Translation • Stochastische MT • EbMT - Example-based Machine Translation • SMT - Statistical Machine Translation • Hybrid • MTM - Machine Translation + Translation Memory
  • 5. Example-based Machine Translation (EbMT) • Het meisje leest een boek • The girl reads a book • Het meisje leest een krant • The girl reads ….
  • 9. Wat is revisie? •“The process of checking a draft translation for errors and making appropriate amendments.” (Brian Mossop, Revising and Editing for Translators, 2011)
  • 10. Wat is post-editing (PEMT)? • Reparatie vs verbetering • The process of improving a machine‐generated translation with a minimum of manual labor. (TAUS, 2010)
  • 11. Wat is het verschil tussen PEMT en revisie?
  • 12. PEMT: Verschillende niveau’s • GIST POST-EDITING • LIGHT POST-EDITING • FULL POST-EDITING
  • 13. VOORBEELD – INSTRUCTIES VOOR FULL POST-EDITING • • De gewenste kwaliteit is de kwaliteit van een tekst die klaar is voor publicatie. Dit betekent dat de tekst geen doorhalingen bevat en er geen woorden ontbreken, dat de tekst zorgvuldig is opgesteld, de brontekst nergens verkeerd is vertaald, de grammaticale regels en de spelling van de doeltaal correct zijn toegepast en de terminologie van het meegeleverde glossarium is aangehouden. • Maak zo min mogelijk edits • Corrigeer alleen fouten • Volg het glossarium • Wanneer de terminologie afwijkt, vervang deze dan met die in het glossarium • Voer geen eigen voorkeurstermen in • Herschrijf de tekst niet, tenzij er onzin staat • Probeer de tekst niet te ‘verbeteren’
  • 14. VOORBEELD – INSTRUCTIES VOOR LIGHT POST-EDITING • Duidelijk en beknopt • Wijk niet af van de stijl • Taalspecifieke regels • Nationale/regionale nuances • Gramaticale, syntactische en spellingregels • Houd de grove vertaling zo veel mogelijk aan • Sta niet te lang stil bij een probleem • Maak je niet druk over stijl • Vermijd tijdrovend opzoeken van termen • Breng alleen veranderingen aan wanneer het absoluut noodzakelijk is • Onzin • Verkeerde woorden (ook door spellingsfouten in de brontekst) • Ontbrekende woorden • Interpunctie, hoofdlettergebruik • Flexie (verbuiging/vervoeging) • Geslacht • Woordvolgorde • Opmaak
  • 15. VOORBEELD 1 BRONTEKST Met de spectrofotometer kun je eenvoudig en snel de kleur van te spuiten auto’s bepalen. Plaats het apparaat op het te meten oppervlak en het apparaat doet de rest. De basis voor het programma is ICRIS: een database met formules voor alle kleurvarianten, te vergelijken met een digitale staalkaartenbak. Deze gebruikershandleiding laat zien hoe je de spectrofotometer gebruikt.
  • 16. RbMT vs SMT RbMT OUTPUT • With the spectrophotometer you can simply and rapidly the colour to spout car to stipulate. Place the apparatus on surface to measure and the apparatus does the rest. The basis for the programme is ICRIS: a database with formulas for all colour alternatives, to compare with a digital steel card-tray. This user- manual shows how you use the spectrophotometer. SMT OUTPUT • With the spectrophotometer, you can easily and quickly determine the color of spraying cars. Place the device on the surface to be measured and the machine does the rest. The basis for the program is ICRIS: comparable to a digital steel card catalog a database of formulas for all color variants. This manual shows how to use the spectrophotometer.
  • 17. PEMT - VOORBEELD 1A RbMT OUTPUT • With the spectrophotometer you can simply and rapidly the colour to spout car to stipulate. Place the apparatus on surface to measure and the apparatus does the rest. The basis for the programme is ICRIS: a database with formulas for all colour alternatives, to compare with a digital steel card-tray. This user- manual shows how you use the spectrophotometer. POST-EDITED VERSIE With the spectrophotometer you can simply and rapidly choose the colour of cars to be spray- painted. Place the apparatus on the surface to be measured and the apparatus does the rest. The basis for the programme is ICRIS: a database with formulas for all colour alternatives, comparable to a digital box with sample-sheets. This user manual shows how you use the spectrophotometer.
  • 18. PEMT - VOORBEELD 1B SMT OUTPUT • With the spectrophotometer, you can easily and quickly determine the color of spraying cars. Place the device on the surface to be measured and the machine does the rest. The basis for the program is ICRIS: comparable to a digital steel card catalog a database of formulas for all color variants. This manual shows how to use the spectrophotometer. POST-EDITED VERSIE • With the spectrophotometer, you can quickly and easily determine the colour of the cars that need to be spray- painted. Place the device on the surface to be analysed and the device will do the rest. The basis for the program is ICRIS: a database of formulas for all color variations comparable to a digital colour catalogue. This manual shows how to use the spectrophotometer.
  • 19. PEMT – Voorbeeld met CL • RULE I Write sentences that are shorter than 25 words. Write: If you want to modify your profile: • Inform the editorial board; • Send a copy of the new profile; • Confirm once the new profile is published. Do not write: Authors wishing to modify their profile on the website should send an email to the editorial board informing that they want to change their profile. Then they will send a copy of their new profile and wait to confirm once the profile has been published on the journal website.
  • 20. RbMT • REGEL I • Schrijf zinnen die korter zijn dan 25 woorden. Schrijf: Als u uw profiel wilt wijzigen: • Informeer het redactiecomité; • Verzend een exemplaar van het nieuwe profiel; • Bevestig zodra het nieuwe profiel wordt gepubliceerd. • Schrijf niet: Auteurs die hun profiel op de website shouldsendan e-mail aan het redactiecomité informeren wensen te wijzigen die dat zij hun profiel willen veranderen. Dan zullen zij een exemplaar van hun nieuw profiel verzenden en zullen wachten te bevestigen zodra het profiel op de dagboekwebsite is gepubliceerd. Post-edited •
  • 21. SMT • IK REGEL • Schrijven van zinnen die korter dan 25 woorden zijn. • Schrijven: • Als u wilt uw profiel wijzigen: • informeren de redactieraad; • Stuur een kopie van het nieuwe profiel; • Bevestigen nadat het nieuwe profiel is gepubliceerd. • Schrijf niet: • auteurs willen wijzigen hun profiel op de website moeten Stuur een email naar de redactie te informeren dat ze willen hun profiel wijzigen. Dan ze een kopie van het nieuwe profiel sturen en wachten om te bevestigen nadat u het profiel hebt gepubliceerd op de website van het dagboek. Post-edited
  • 22. EVALUATIE VAN MT –METRICS • BLEU Bilingual Evaluation Understuy • 1 = professionele menselijke vertaling • .65 = menselijke kwaliteit • Een verhoogde score betekent niet bij uitstek dat de kwaliteit van de vertaling beter is • TER – Translation Edit Rate • WER (Word Error Rate) • Meestal gebruikt in spraakherkenning • NIST • Gebaseerd op BLEU, met enkele aanpassingen • METEOR (Metric for Evaluation of Translation with Explicit ORdering) • Gebaseerd op BLEU • F-Measure (F1 Score or F-Score) • Een meting van de testnauwkeurigheid die in machine-learning wordt gebruikt • Gebaseerd op BLEU, met enkele aanpassingen
  • 23. TIPS - I • De geschiktheid van de brontekst • Het schonen van de brontekst • Het beschikbaar zijn van een erkende terminologie database
  • 24. TIPS - II • MT • Kwaliteit • Gebruik van de tekst • Levertijd • Duidelijke richtlijnen • Voorbeeldtekst van 1500 Woorden
  • 26. Wie is de Post-editor? •Eentalige Post-editors •Professionele tweetalige MT Post- Editors
  • 27. TARIEVEN • Evaluatie per MT engine/projekt • Combinatie van Automatic Metrics en “menselijke” evaluatie • Samenwerking met post-editors • Soort tekst • PEMT-niveau (verwachte kwaliteitsniveau) • Talencombinatie • Editing distance