Deck delivered during one of Warsaw NLP meetups Join us an learn more about Natural Language Processing and meet other localization and NLP specialistshttps://www.meetup.com/WarsawNLP/
2. Podstawy lokalizacji
Narzędzia będące częścią CAT:
-spellchecker wbudowany w program bądź stanowiący osobny produkt;
-moduł sprawdzania gramatyki;
-elektroniczne słowniki;
-narzędzia do wyszukiwania całych tekstów (wskaźniki), które pozwalają
użytkownikowi przeszukiwać teksty już przetłumaczone lub różne
dokumenty, do których się odnosi. Narzędzia tego typu to między innymi
Naturel, ISYS Search Software i dtSearch;
-organizator terminologii,
-bazy terminologiczne;
-programy konkordancyjne;
-tekst równoległy (bitext);
-oprogramowanie do zarządzania projektami – Translation Memory
System;
-programy do zarządzania pamięcią tłumaczeń (TMM – z ang. translation
memory manager);
-systemy prawie automatycznego tłumaczenia.
MT vs. MAHT (HAMT)
FAHQT = Fully Automatic High Quality Translation – cel do osiągnięcia.
4. Pamięć tłumaczeniowa
Stanowi bazę danych
złożoną z rekordów
zwierających co
najmniej dwie wersje
językowe danego
fragmentu tekstu,
najczęściej zdania.
Występuje zwykle w
formie pliku lub kilku
plików, których format
jest obsługiwany
przez
oprogramowanie typu
CAT.
Jest stale
uzupełniana i
poszerzana o
nowy korpus
tłumaczeń
Najczęściej stosowany
format
to TMX (ang. Translati
on Memory eXchange)
lub prosty format
tekstowy txt.
Może być
przechowywana w
różnych formatach
przeznaczonych dla
danego
oprogramowania
plików
wspomagających
tłumaczenie
Zapewnia spójność
terminologiczną i
stylistyczną.
Pozwala na dużą oszczędność
czasu i wysiłku, gdyż
przetłumaczone wcześniej
fragmenty są automatycznie
wyszukiwane w bazie i mogą
być w łatwy sposób
wykorzystane ponownie.
6. Zalety narzędzi CAT
http://www.wordbee.com/computer-assisted-translation:
Much faster and more consistent translations, especially in technical and highly repetitive texts: no
more million copy-paste operations and a lot of typing saved, since a translation can be just edited
where needed;
Interchangeable memories among translators, who can all benefit from each other’s work inside a
project;
Format retaining: the CAT tool does all the dirty work of keeping the layout of the original text exactly
as it is. Without such a tool, the translator would indeed have to worry about tables, footnote
placement, indents, paragraph breaks, font changes and the like. Instead, thanks to the CAT tool’s
ability to assemble the segments together just as they were, the translator only has to focus on the
actual words, not on their placement on the page.
7. Wady narzędzi CAT
http://forum.mlingua.pl/:
„Programy wspomagają w dużej mierze tłumacza, ale jednak nie zastąpią ludzkiej
intuicji ani wiedzy.”
„Problemy z wybieraniem właściwych odpowiedników, jeżeli tłumacz nie zna dobrze
dziedziny tłumaczenia.”
„CAT przydaje się, gdy mamy do czynienia z powtarzalnością tekstów, natomiast nie
przyda się jeśli mamy do czynienia z tekstami o zróżnicowanej stylistyce.”
„Bezużyteczne w przypadku tłumaczeń literackich i poetyckich.”
Podsumowanie: „Maszyna jednak to maszyna i póki co pierwiastek ludzki jest wciąż
potrzebny do efektywnego działania skomputeryzowanych urządzeń.”
....?
8. Dlaczego niektórzy tłumacze nie chcą
korzystać z narzędzi CAT?
58% - koszty;
47% - nieprzydatność narzędzia w danej dziedzinie;
czas i wysiłek potrzebny do opanowania narzędzia – trzeba
dobrze znać program, żeby faktycznie zaoszczędzić czas przy
tłumaczeniu;
trudność w wyborze odpowiedniego narzędzia CAT;
9. CAT: przyszłość i nowości.
Collaborative translation: many translators can work in real time on the same project,
on the exact same interface, whereas revisers can directly insert real-time comments
and changes;
Wyszukiwarka tłumaczeniowa (Language Search Engine software)
Wyszukiwarka tłumaczeniowa pozwala na dostęp do większego zasobu tłumaczeń,
tworzonego przez wielu użytkowników, niż tradycyjne oprogramowanie
tłumaczeniowe opierające się na tłumaczeniach wykonanych przez jednego tłumacza.
Oprogramowanie porównawcze: analizują ukończone tłumaczenie, dzielą tekst
źródłowy i docelowy próbując stworzyć z nich nową bazę danych.
MLDB - The multilingual lexical data bases - include, for example, EuroDicautom at
the EU (European Commission), Aquila by SITE-Sonovision, and MultiTerm by Trados
EMBT – Example Based MT - aims at producing translation proposals by combining
the translations of similar chunks of texts making up the sentence and previously
identified as possible translation units in the translation memory.
...?
11. Lokalizacja (l10n)
Lokalizacja jest związana z adaptacją produktu, aplikacji, lub zawartości dokumentu do
specyficznego rynku pod względem językowym, kulturowym i innymi wymaganiami.
Może ona obejmować dopasowanie do potrzeb klienta związane z :
Wartościami numerycznymi, datami, formatami czasu
Walutami
Użycie klawiatury
Porównaniem i sortowaniem
Symbolami, ikonami i kolorami
Tekstem i grafiką odnoszącą się do obiektów, akcji, lub pomysłów, które w danym
kontekscie kulturowym mogą być źle zinterpretowane, lub postrzegane jako niewrażliwe.
Wymaganiami prawnymi.
Note: Lokalizacja może nawet nawet pociągnąć za sobą całkowitą zmianę logiki, projektu
wizualnego, lub prezentacji jeśli prowadzenie biznesu (np: księgowości), lub przyjęty
sposób uczenia się (np: skupienie się na osobniku a nie grupie) jest kompletnie odmienny
w danej kulturze.
12. Internacjonalizacja –(l18n)
Inne nazwy: globalizacja, umiędzynarodowienie.
Internacjonalizacja jest projektowaniem i rozwijaniem produktów,
aplikacji, lub treści dokumentów, które umożliwiają łatwą lokalizację dla
odbiorców docelowych, którzy różnią się co do kultury, regionu, lub
języka. alizacja.
Internacjonalizacja szczególnie wpływa na łatwość z jaką produkt jest
lokalizowany.
Przystosowanie produktu do funkcjonowania w różnych kręgach
językowych – w przypadku np. oprogramowania komputerowego
będzie to możliwość używania w nim znaków służących do zapisów
różnych języków. Chodzi więc o to, aby bez konieczności dokonywania
zmian technicznych można było dostosowywać aplikację do potrzeb
różnych języków i regionów.