SlideShare a Scribd company logo
1 of 14
WAW NLP Meetup #2
Computer Assisted/Aided
Translation
Katarzyna Wojtacha
Warszawa, 7 listopad, 2016
Podstawy lokalizacji
Narzędzia będące częścią CAT:
-spellchecker wbudowany w program bądź stanowiący osobny produkt;
-moduł sprawdzania gramatyki;
-elektroniczne słowniki;
-narzędzia do wyszukiwania całych tekstów (wskaźniki), które pozwalają
użytkownikowi przeszukiwać teksty już przetłumaczone lub różne
dokumenty, do których się odnosi. Narzędzia tego typu to między innymi
Naturel, ISYS Search Software i dtSearch;
-organizator terminologii,
-bazy terminologiczne;
-programy konkordancyjne;
-tekst równoległy (bitext);
-oprogramowanie do zarządzania projektami – Translation Memory
System;
-programy do zarządzania pamięcią tłumaczeń (TMM – z ang. translation
memory manager);
-systemy prawie automatycznego tłumaczenia.
MT vs. MAHT (HAMT)
FAHQT = Fully Automatic High Quality Translation – cel do osiągnięcia.
Najchętniej używane narzędzia CAT:
Pamięć tłumaczeniowa
Stanowi bazę danych
złożoną z rekordów
zwierających co
najmniej dwie wersje
językowe danego
fragmentu tekstu,
najczęściej zdania.
Występuje zwykle w
formie pliku lub kilku
plików, których format
jest obsługiwany
przez
oprogramowanie typu
CAT.
Jest stale
uzupełniana i
poszerzana o
nowy korpus
tłumaczeń
Najczęściej stosowany
format
to TMX (ang. Translati
on Memory eXchange)
lub prosty format
tekstowy txt.
Może być
przechowywana w
różnych formatach
przeznaczonych dla
danego
oprogramowania
plików
wspomagających
tłumaczenie
Zapewnia spójność
terminologiczną i
stylistyczną.
Pozwala na dużą oszczędność
czasu i wysiłku, gdyż
przetłumaczone wcześniej
fragmenty są automatycznie
wyszukiwane w bazie i mogą
być w łatwy sposób
wykorzystane ponownie.
Przykład interface-u narzędzia CAT
Zalety narzędzi CAT
http://www.wordbee.com/computer-assisted-translation:
Much faster and more consistent translations, especially in technical and highly repetitive texts: no
more million copy-paste operations and a lot of typing saved, since a translation can be just edited
where needed;
Interchangeable memories among translators, who can all benefit from each other’s work inside a
project;
Format retaining: the CAT tool does all the dirty work of keeping the layout of the original text exactly
as it is. Without such a tool, the translator would indeed have to worry about tables, footnote
placement, indents, paragraph breaks, font changes and the like. Instead, thanks to the CAT tool’s
ability to assemble the segments together just as they were, the translator only has to focus on the
actual words, not on their placement on the page.
Wady narzędzi CAT
http://forum.mlingua.pl/:
„Programy wspomagają w dużej mierze tłumacza, ale jednak nie zastąpią ludzkiej
intuicji ani wiedzy.”
„Problemy z wybieraniem właściwych odpowiedników, jeżeli tłumacz nie zna dobrze
dziedziny tłumaczenia.”
„CAT przydaje się, gdy mamy do czynienia z powtarzalnością tekstów, natomiast nie
przyda się jeśli mamy do czynienia z tekstami o zróżnicowanej stylistyce.”
„Bezużyteczne w przypadku tłumaczeń literackich i poetyckich.”
Podsumowanie: „Maszyna jednak to maszyna i póki co pierwiastek ludzki jest wciąż
potrzebny do efektywnego działania skomputeryzowanych urządzeń.”
....?
Dlaczego niektórzy tłumacze nie chcą
korzystać z narzędzi CAT?
58% - koszty;
47% - nieprzydatność narzędzia w danej dziedzinie;
czas i wysiłek potrzebny do opanowania narzędzia – trzeba
dobrze znać program, żeby faktycznie zaoszczędzić czas przy
tłumaczeniu;
trudność w wyborze odpowiedniego narzędzia CAT;
CAT: przyszłość i nowości.
Collaborative translation: many translators can work in real time on the same project,
on the exact same interface, whereas revisers can directly insert real-time comments
and changes;
Wyszukiwarka tłumaczeniowa (Language Search Engine software) 
Wyszukiwarka tłumaczeniowa pozwala na dostęp do większego zasobu tłumaczeń,
tworzonego przez wielu użytkowników, niż tradycyjne oprogramowanie
tłumaczeniowe opierające się na tłumaczeniach wykonanych przez jednego tłumacza.
Oprogramowanie porównawcze: analizują ukończone tłumaczenie, dzielą tekst
źródłowy i docelowy próbując stworzyć z nich nową bazę danych.
MLDB - The multilingual lexical data bases - include, for example, EuroDicautom at
the EU (European Commission), Aquila by SITE-Sonovision, and MultiTerm by Trados
EMBT – Example Based MT - aims at producing translation proposals by combining
the translations of similar chunks of texts making up the sentence and previously
identified as possible translation units in the translation memory.
...?
Na koniec...kilka słów o internacjonalizacji i
lokalizacji.
Lokalizacja (l10n)
Lokalizacja jest związana z adaptacją produktu, aplikacji, lub zawartości dokumentu do
specyficznego rynku pod względem językowym, kulturowym i innymi wymaganiami.
Może ona obejmować dopasowanie do potrzeb klienta związane z :
Wartościami numerycznymi, datami, formatami czasu
Walutami
Użycie klawiatury
Porównaniem i sortowaniem
Symbolami, ikonami i kolorami
Tekstem i grafiką odnoszącą się do obiektów, akcji, lub pomysłów, które w danym
kontekscie kulturowym mogą być źle zinterpretowane, lub postrzegane jako niewrażliwe.
Wymaganiami prawnymi.
Note: Lokalizacja może nawet nawet pociągnąć za sobą całkowitą zmianę logiki, projektu
wizualnego, lub prezentacji jeśli prowadzenie biznesu (np: księgowości), lub przyjęty
sposób uczenia się (np: skupienie się na osobniku a nie grupie) jest kompletnie odmienny
w danej kulturze.
Internacjonalizacja –(l18n)
Inne nazwy: globalizacja, umiędzynarodowienie.
Internacjonalizacja jest projektowaniem i rozwijaniem produktów,
aplikacji, lub treści dokumentów, które umożliwiają łatwą lokalizację dla
odbiorców docelowych, którzy różnią się co do kultury, regionu, lub
języka. alizacja.
Internacjonalizacja szczególnie wpływa na łatwość z jaką produkt jest
lokalizowany.
Przystosowanie produktu do funkcjonowania w różnych kręgach
językowych – w przypadku np. oprogramowania komputerowego
będzie to możliwość używania w nim znaków służących do zapisów
różnych języków. Chodzi więc o to, aby bez konieczności dokonywania
zmian technicznych można było dostosowywać aplikację do potrzeb
różnych języków i regionów.
Cytowane strony:
https://pl.wikipedia.org/wiki/T%C5%82umaczenie_wspomagane_komputerowo
https://blog.stepes.com/cat-tools-for-translators-just-arent-doing-enough/
https://prozcomblog.com/2013/03/28/cat-tool-use-by-translators-what-are-they-
using/
http://www.wordbee.com/computer-assisted-translation
http://noradiaz.blogspot.com/2011/08/using-multiterm-termbases-in-sdl-trados.html
http://serwistlumacza.com/content/view/22/32/
http://www.wordfast.com/WFP3/Translating_in_a_project/Leveraging_and_Updating_T
ranslation_Memory.htm
http://www.cslu.ogi.edu/HLTsurvey/ch8node6.html
http://blog.lionbridge.com/poland/2012/10/09/jaka-jest-roznica-pomiedzy-
tlumaczeniem-a-lokalizacja-2/
http://www.boredpanda.com/funny-chinese-translation-fails/
Dowiedzcie sie wiecej o nas na
https://www.meetup.com/WarsawNLP/

More Related Content

Similar to Waw nlp #2 lokalizacja i narzedzia cat

Webinar Lsp Software 2009
Webinar Lsp Software 2009Webinar Lsp Software 2009
Webinar Lsp Software 2009tobi213
 
Program do pisania? Największa lista w sieci 2013 !
Program do pisania? Największa lista w sieci 2013 !Program do pisania? Największa lista w sieci 2013 !
Program do pisania? Największa lista w sieci 2013 !michalip
 
Jak budujemy inteligentnego asystenta biznesowego
Jak budujemy inteligentnego asystenta biznesowegoJak budujemy inteligentnego asystenta biznesowego
Jak budujemy inteligentnego asystenta biznesowego2040.io
 
Modele i metodyki wdrażania i zarządzania projektami eai
Modele i metodyki wdrażania i zarządzania projektami eaiModele i metodyki wdrażania i zarządzania projektami eai
Modele i metodyki wdrażania i zarządzania projektami eaiJaroslaw Zelinski
 
trading_automatyczny-waszczyk-probka
trading_automatyczny-waszczyk-probkatrading_automatyczny-waszczyk-probka
trading_automatyczny-waszczyk-probkaTomasz Waszczyk
 
Zasady technicznej organizacji projektów programistycznych
Zasady technicznej organizacji projektów programistycznychZasady technicznej organizacji projektów programistycznych
Zasady technicznej organizacji projektów programistycznychsztywny
 
Tworzenie czatbotów w PHP z wykorzystaniem NLP
Tworzenie czatbotów w PHP z wykorzystaniem NLPTworzenie czatbotów w PHP z wykorzystaniem NLP
Tworzenie czatbotów w PHP z wykorzystaniem NLPLaravel Poland MeetUp
 
Produkcja aplikacji internetowych
Produkcja aplikacji internetowychProdukcja aplikacji internetowych
Produkcja aplikacji internetowychTomasz Borowski
 
Delphi 8 .NET. Kompendium programisty
Delphi 8 .NET. Kompendium programistyDelphi 8 .NET. Kompendium programisty
Delphi 8 .NET. Kompendium programistyWydawnictwo Helion
 
8. Programowanie w środowisku języka strukturalnego
8. Programowanie w środowisku języka strukturalnego8. Programowanie w środowisku języka strukturalnego
8. Programowanie w środowisku języka strukturalnegokalaxq
 
MARKOS – semantyczne repozytorium otwartego oprogramowania
MARKOS – semantyczne repozytorium otwartego oprogramowaniaMARKOS – semantyczne repozytorium otwartego oprogramowania
MARKOS – semantyczne repozytorium otwartego oprogramowaniabartekel
 

Similar to Waw nlp #2 lokalizacja i narzedzia cat (18)

Analiza języka naturalnego
Analiza języka naturalnegoAnaliza języka naturalnego
Analiza języka naturalnego
 
Webinar Lsp Software 2009
Webinar Lsp Software 2009Webinar Lsp Software 2009
Webinar Lsp Software 2009
 
3
33
3
 
Python. Od podstaw
Python. Od podstawPython. Od podstaw
Python. Od podstaw
 
Dragon software
Dragon softwareDragon software
Dragon software
 
Open Power Template
Open Power TemplateOpen Power Template
Open Power Template
 
Program do pisania? Największa lista w sieci 2013 !
Program do pisania? Największa lista w sieci 2013 !Program do pisania? Największa lista w sieci 2013 !
Program do pisania? Największa lista w sieci 2013 !
 
Jak budujemy inteligentnego asystenta biznesowego
Jak budujemy inteligentnego asystenta biznesowegoJak budujemy inteligentnego asystenta biznesowego
Jak budujemy inteligentnego asystenta biznesowego
 
Słownik informatyczny
Słownik informatycznySłownik informatyczny
Słownik informatyczny
 
Modele i metodyki wdrażania i zarządzania projektami eai
Modele i metodyki wdrażania i zarządzania projektami eaiModele i metodyki wdrażania i zarządzania projektami eai
Modele i metodyki wdrażania i zarządzania projektami eai
 
trading_automatyczny-waszczyk-probka
trading_automatyczny-waszczyk-probkatrading_automatyczny-waszczyk-probka
trading_automatyczny-waszczyk-probka
 
Zasady technicznej organizacji projektów programistycznych
Zasady technicznej organizacji projektów programistycznychZasady technicznej organizacji projektów programistycznych
Zasady technicznej organizacji projektów programistycznych
 
Tworzenie czatbotów w PHP z wykorzystaniem NLP
Tworzenie czatbotów w PHP z wykorzystaniem NLPTworzenie czatbotów w PHP z wykorzystaniem NLP
Tworzenie czatbotów w PHP z wykorzystaniem NLP
 
Nukat2014
Nukat2014Nukat2014
Nukat2014
 
Produkcja aplikacji internetowych
Produkcja aplikacji internetowychProdukcja aplikacji internetowych
Produkcja aplikacji internetowych
 
Delphi 8 .NET. Kompendium programisty
Delphi 8 .NET. Kompendium programistyDelphi 8 .NET. Kompendium programisty
Delphi 8 .NET. Kompendium programisty
 
8. Programowanie w środowisku języka strukturalnego
8. Programowanie w środowisku języka strukturalnego8. Programowanie w środowisku języka strukturalnego
8. Programowanie w środowisku języka strukturalnego
 
MARKOS – semantyczne repozytorium otwartego oprogramowania
MARKOS – semantyczne repozytorium otwartego oprogramowaniaMARKOS – semantyczne repozytorium otwartego oprogramowania
MARKOS – semantyczne repozytorium otwartego oprogramowania
 

Waw nlp #2 lokalizacja i narzedzia cat

  • 1. WAW NLP Meetup #2 Computer Assisted/Aided Translation Katarzyna Wojtacha Warszawa, 7 listopad, 2016
  • 2. Podstawy lokalizacji Narzędzia będące częścią CAT: -spellchecker wbudowany w program bądź stanowiący osobny produkt; -moduł sprawdzania gramatyki; -elektroniczne słowniki; -narzędzia do wyszukiwania całych tekstów (wskaźniki), które pozwalają użytkownikowi przeszukiwać teksty już przetłumaczone lub różne dokumenty, do których się odnosi. Narzędzia tego typu to między innymi Naturel, ISYS Search Software i dtSearch; -organizator terminologii, -bazy terminologiczne; -programy konkordancyjne; -tekst równoległy (bitext); -oprogramowanie do zarządzania projektami – Translation Memory System; -programy do zarządzania pamięcią tłumaczeń (TMM – z ang. translation memory manager); -systemy prawie automatycznego tłumaczenia. MT vs. MAHT (HAMT) FAHQT = Fully Automatic High Quality Translation – cel do osiągnięcia.
  • 4. Pamięć tłumaczeniowa Stanowi bazę danych złożoną z rekordów zwierających co najmniej dwie wersje językowe danego fragmentu tekstu, najczęściej zdania. Występuje zwykle w formie pliku lub kilku plików, których format jest obsługiwany przez oprogramowanie typu CAT. Jest stale uzupełniana i poszerzana o nowy korpus tłumaczeń Najczęściej stosowany format to TMX (ang. Translati on Memory eXchange) lub prosty format tekstowy txt. Może być przechowywana w różnych formatach przeznaczonych dla danego oprogramowania plików wspomagających tłumaczenie Zapewnia spójność terminologiczną i stylistyczną. Pozwala na dużą oszczędność czasu i wysiłku, gdyż przetłumaczone wcześniej fragmenty są automatycznie wyszukiwane w bazie i mogą być w łatwy sposób wykorzystane ponownie.
  • 6. Zalety narzędzi CAT http://www.wordbee.com/computer-assisted-translation: Much faster and more consistent translations, especially in technical and highly repetitive texts: no more million copy-paste operations and a lot of typing saved, since a translation can be just edited where needed; Interchangeable memories among translators, who can all benefit from each other’s work inside a project; Format retaining: the CAT tool does all the dirty work of keeping the layout of the original text exactly as it is. Without such a tool, the translator would indeed have to worry about tables, footnote placement, indents, paragraph breaks, font changes and the like. Instead, thanks to the CAT tool’s ability to assemble the segments together just as they were, the translator only has to focus on the actual words, not on their placement on the page.
  • 7. Wady narzędzi CAT http://forum.mlingua.pl/: „Programy wspomagają w dużej mierze tłumacza, ale jednak nie zastąpią ludzkiej intuicji ani wiedzy.” „Problemy z wybieraniem właściwych odpowiedników, jeżeli tłumacz nie zna dobrze dziedziny tłumaczenia.” „CAT przydaje się, gdy mamy do czynienia z powtarzalnością tekstów, natomiast nie przyda się jeśli mamy do czynienia z tekstami o zróżnicowanej stylistyce.” „Bezużyteczne w przypadku tłumaczeń literackich i poetyckich.” Podsumowanie: „Maszyna jednak to maszyna i póki co pierwiastek ludzki jest wciąż potrzebny do efektywnego działania skomputeryzowanych urządzeń.” ....?
  • 8. Dlaczego niektórzy tłumacze nie chcą korzystać z narzędzi CAT? 58% - koszty; 47% - nieprzydatność narzędzia w danej dziedzinie; czas i wysiłek potrzebny do opanowania narzędzia – trzeba dobrze znać program, żeby faktycznie zaoszczędzić czas przy tłumaczeniu; trudność w wyborze odpowiedniego narzędzia CAT;
  • 9. CAT: przyszłość i nowości. Collaborative translation: many translators can work in real time on the same project, on the exact same interface, whereas revisers can directly insert real-time comments and changes; Wyszukiwarka tłumaczeniowa (Language Search Engine software)  Wyszukiwarka tłumaczeniowa pozwala na dostęp do większego zasobu tłumaczeń, tworzonego przez wielu użytkowników, niż tradycyjne oprogramowanie tłumaczeniowe opierające się na tłumaczeniach wykonanych przez jednego tłumacza. Oprogramowanie porównawcze: analizują ukończone tłumaczenie, dzielą tekst źródłowy i docelowy próbując stworzyć z nich nową bazę danych. MLDB - The multilingual lexical data bases - include, for example, EuroDicautom at the EU (European Commission), Aquila by SITE-Sonovision, and MultiTerm by Trados EMBT – Example Based MT - aims at producing translation proposals by combining the translations of similar chunks of texts making up the sentence and previously identified as possible translation units in the translation memory. ...?
  • 10. Na koniec...kilka słów o internacjonalizacji i lokalizacji.
  • 11. Lokalizacja (l10n) Lokalizacja jest związana z adaptacją produktu, aplikacji, lub zawartości dokumentu do specyficznego rynku pod względem językowym, kulturowym i innymi wymaganiami. Może ona obejmować dopasowanie do potrzeb klienta związane z : Wartościami numerycznymi, datami, formatami czasu Walutami Użycie klawiatury Porównaniem i sortowaniem Symbolami, ikonami i kolorami Tekstem i grafiką odnoszącą się do obiektów, akcji, lub pomysłów, które w danym kontekscie kulturowym mogą być źle zinterpretowane, lub postrzegane jako niewrażliwe. Wymaganiami prawnymi. Note: Lokalizacja może nawet nawet pociągnąć za sobą całkowitą zmianę logiki, projektu wizualnego, lub prezentacji jeśli prowadzenie biznesu (np: księgowości), lub przyjęty sposób uczenia się (np: skupienie się na osobniku a nie grupie) jest kompletnie odmienny w danej kulturze.
  • 12. Internacjonalizacja –(l18n) Inne nazwy: globalizacja, umiędzynarodowienie. Internacjonalizacja jest projektowaniem i rozwijaniem produktów, aplikacji, lub treści dokumentów, które umożliwiają łatwą lokalizację dla odbiorców docelowych, którzy różnią się co do kultury, regionu, lub języka. alizacja. Internacjonalizacja szczególnie wpływa na łatwość z jaką produkt jest lokalizowany. Przystosowanie produktu do funkcjonowania w różnych kręgach językowych – w przypadku np. oprogramowania komputerowego będzie to możliwość używania w nim znaków służących do zapisów różnych języków. Chodzi więc o to, aby bez konieczności dokonywania zmian technicznych można było dostosowywać aplikację do potrzeb różnych języków i regionów.
  • 14. Dowiedzcie sie wiecej o nas na https://www.meetup.com/WarsawNLP/