Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Maschinelle Übersetzung im Erstellprozess von Displaytexten

206 views

Published on

Wie kann maschinelle Übersetzung in den Erstellprozess von Displaytexten integriert werden? Das soll am Beispiel eines Use Case in diesem Vortrag veranschaulicht werden. Ziel unseres Projektes war die Entwicklung eines Editor-Protoypen, mit dem Displaytexte in alle erforderlichen Sprachen übersetzt werden können. Es wird gezeigt, wie Daten zusammengestellt, vorverarbeitet und bereinigt werden und wie sie für das Training von MÜ Engines verwendet werden. Außerdem werden Methoden aufgezeigt, mit denen maschineller Übersetzungsoutput evaluiert und optimiert werden kann.

Published in: Business
  • Be the first to comment

  • Be the first to like this

Maschinelle Übersetzung im Erstellprozess von Displaytexten

  1. 1. Einbindung maschineller Übersetzung in den Erstellprozess von Displaytexten – ein Use Case
  2. 2. • Wir kennen uns in der Content-Branche aus • Wir arbeiten unabhängig von Softwareanbietern und Agenturen • Wir automatisieren und strukturieren Ihre Daten
  3. 3. 3Folie Nr. Welche Daten sich für die maschinelle Übersetzung eignen Wie ein Editor-Prototyp für den Display-Erstellprozess aussehen kann Was man davon hat Was werde ich heute erfahren? Was mit diesen Daten unternommen werden muss
  4. 4. 4Folie Nr. HMI-Displaytexte für… Waschmaschinen Apps Navigationssysteme Kaffeemaschinen Drucker Motorrad Flugzeug-Entertainment Automobil Industrielle Automation
  5. 5. 5Folie Nr. Henry
  6. 6. 6Folie Nr. Das Problem Texte ändern sich bis zu 30 mal Jedes Mal von neuem an Übersetzer Und das bei 40 Sprachen Mann, ist das teuer Und das dauert!
  7. 7. 7Folie Nr. Vorteile maschineller Übersetzung mehr Sprachen als ein Mensch Texte stehen sofort zur Verfügung große Mengen an Daten in kurzer Zeit
  8. 8. 8Folie Nr. Anforderungen an das Pilot-Projekt Lokalisierte Display-Prototypen und –Simulationen für die Entwicklung in Echtzeit Einhaltung rechtlicher Rahmenbedingungen bei MÜ Unnötige Übersetzungsloops vermeiden und Übersetzungskosten senken Finale Version für die Veröffentlichung wird durch Humanübersetzer erstellt
  9. 9. 9Folie Nr. Die Lösung
  10. 10. 10Folie Nr. Ja hallo, hier ist blc?
  11. 11. 11Folie Nr.
  12. 12. 12Folie Nr. Ok, was brauchen wir jetzt alles dafür?
  13. 13. 13Folie Nr. Datenbeschaffung MÜ-Workflow für Displaytext-Daten
  14. 14. 14Folie Nr. Datenbank (z. B. Terminologie) Translation Memory Monolinguale Texte
  15. 15. 15Folie Nr.
  16. 16. 16Folie Nr. Datenbeschaffung Bereinigung MÜ-Workflow für Displaytext-Daten
  17. 17. 17Folie Nr.
  18. 18. 18Folie Nr. Bereinigung der Daten vorher: Parkassistent: zurzeit nichtnverfügbar. vorher: Stabilisierungs-nkontrolle (ESC) ausgeschaltet. nachher: Parkassistent: zurzeit nicht verfügbar. nachher: Stabilisierungskontrolle (ESC) ausgeschaltet.
  19. 19. 19Folie Nr. Terminologie
  20. 20. 20Folie Nr. Was ist mit Daten, die nicht in die Cloud sollen?
  21. 21. 21Folie Nr. Datenbeschaffung Bereinigung MÜ-Workflow für Displaytext-Daten Anonymisierung
  22. 22. 22Folie Nr. Beispiel: Ausgangstext Die Testphase für Ihre MARKENNAME Dienstenläuft zeitnah ab… Beispiel: Nach Pre-Processing / Anonymisierung Die Testphase für Ihre [2] Dienste läuft zeitnah ab… Beispiel: Nach maschineller Übersetzung The trial period for your [2] services ends soon.. Beispiel: Nach Einsetzen der Ursprungsbenennungen The trial period for your MARKENNAME services ends soon… Anonymisierung der Daten
  23. 23. 23Folie Nr. Datenbeschaffung Bereinigung Anonymisierung Training MÜ-Workflow für Displaytext-Daten
  24. 24. 24Folie Nr. Was heißt denn Training?!
  25. 25. 25Folie Nr. Datenbeschaffung Bereinigung Anonymisierung Training MS Translator HUB MÜ-Workflow für Displaytext-Daten
  26. 26. 26Folie Nr. DE-EN DE-ES Engine 1 Engine 2 Engine 3 Engine 2 Engine 1 Engine 3 DE-IT Engine 3 Engine 1 Engine 2
  27. 27. 27Folie Nr. Evaluation und Auswahl der Engines BLEU-Verteilung 20% - 30% 30% - 40% 40% - 50% 50% - 60% Arabisch Bulgarisch Finnisch Koreanisch Englisch_UK Littauisch Lettisch Russisch Frankreich Italienisch Slovenisch Norwegisch Schwedisch Chinesisch Dänisch Türkisch Slovakisch Japanisch Rumänisch Polnisch
  28. 28. 28Folie Nr. Und wie wird das jetzt alles verbunden?
  29. 29. 29Folie Nr. Datenbeschaffung Bereinigung Anonymisierung Training MS Translator HUB MÜ-Workflow für Displaytext-Daten Übersetzung
  30. 30. 30Folie Nr. API Translation Memory DB Kunde
  31. 31. 31Folie Nr.
  32. 32. 32Folie Nr. Schnellere Bereitstellung von Displaytexten für Software-Tests Zwei implementierte Workflows: 1) MÜ-Workflow 2) Qualitätsworkflow Effizienz gesteigert, Kosten gespart glücklicher Henry Resultate Anonymisierung oder Ausschluss geheimer Daten MÜ-Segmente werden eindeutig gekennzeichnet
  33. 33. 33Folie Nr. Die Herausforderungen Kurzfristige vs. Langfristige Ziele Cloudlösungen vs. Datensicherheit MÜ eindeutig auskennzeichnen und von Publikation ausschließen
  34. 34. 34Folie Nr. keine redundanten, kostspieligen und zeitintensiven Humanübersetzungen von ‚Entwicklungsloops‘ MÜ steht ad hoc für Testing in der Entwicklung bereit Fazit Entzerrung des gesamten Übersetzungsprozesses
  35. 35. Vielen Dank! @blcTeam +49 (0) 211 22 06 77 0 info@berns-language-consulting.de www.berns-language-consulting.de www.facebook.com/bernslanguageconsulting

×