Presenatation Summer School Union of Translators Russia

3,884 views

Published on

Презентация программы памяти переводов Deja Vu X2 на Летней школе Союза переводчиков России.

Presentation of Translation Memory

Published in: Business, Travel
1 Comment
0 Likes
Statistics
Notes
  • Спасибо, доступно и по существу.
       Reply 
    Are you sure you want to  Yes  No
    Your message goes here
  • Be the first to like this

No Downloads
Views
Total views
3,884
On SlideShare
0
From Embeds
0
Number of Embeds
2,404
Actions
Shares
0
Downloads
13
Comments
1
Likes
0
Embeds 0
No embeds

No notes for slide

Presenatation Summer School Union of Translators Russia

  1. 1. Системы автоматизированного перевода <br />Déjà Vu X (DVX)<br />День 1<br />Автор: Олег Добронравов.<br />
  2. 2. 2<br />САТ системы системы автоматизированного перевода <br />САТ системы <br />Computer-assisted translation<br />Машинный перевод<br />QA – контроль качества перевода<br />Электронные словари<br />Локализация ПО<br />ТМ программы<br />(программы памяти перевода )<br />
  3. 3. Зачем нужны САТ системы?<br />3<br /><ul><li>Объективная необходимость
  4. 4. Современные требования
  5. 5. Эффективность и единообразие
  6. 6. Совместимость и многоязычность
  7. 7. Надежность, безопасность и контроль
  8. 8. Интерфейс пользователя
  9. 9. Процедура работы
  10. 10. Память переводов, терминологическая база, лексикон
  11. 11. Версии и информационные ресурсы</li></li></ul><li>4<br />Объективная необходимость<br /><ul><li>Кто из переводчиков не восклицал однажды: </li></ul>«Я подобное уже переводил! Déjà Vu!»<br /><ul><li>Практические примеры документов с повторами:
  12. 12. Новая версия продукта (новая модель автомобиля)
  13. 13. Новая версия программного обеспечения
  14. 14. Новый модельный ряд продуктов
  15. 15. Ситуации разные, смысл один – работа срочная, большая, но déjàvu (уже виденное). Переводчику нужно переводить текст, сходный с ранее переведенным</li></li></ul><li>5<br />В каком виде хранятся переводы?<br />При большом объеме переводов поиск конкретной фразы даже в электронных версиях хранимых документов практически неосуществим<br />
  16. 16. 6<br />Объективная необходимость<br /><ul><li>Работодатели требуют владения автоматизированными системами перевода
  17. 17. Заказчики требуют предоставления перевода в виде базы данных
  18. 18. Высокая конкуренция между переводчиками
  19. 19. Требования к качеству и срокам</li></li></ul><li>7<br />Современные требования<br /><ul><li>Необходимость повышения качества переводов:
  20. 20. Обеспечение единообразия терминологии
  21. 21. Обеспечение единообразного перевода одних и тех же предложений
  22. 22. Необходимость повышения эффективности (снижение трудозатрат, сокращение сроков):
  23. 23. Автоматизация рутинных операций
  24. 24. Исключение полного повторного перевода документации, в которую внесены изменения и дополнения
  25. 25. Исключение повторного перевода одних и тех же слов и предложений</li></li></ul><li>8<br />Целесообразность применения <br />В данном фрагменте Руководства пользователя количество повторов составляет 57%.<br />
  26. 26. 9<br />Структура системы<br />Проект<br />Лексикон<br />Память переводов<br />Терминологическая база<br />
  27. 27. 10<br />Основные понятия – сегментация<br />Исходный текст:<br />CONFIDENTIALITY AGREEMENT<br />August ,2004<br />[address]<br />Re: Confidentiality Agreement<br />Ladies and Gentlemen:<br />You have requested Confidential Information from Company1 Corporation ("Company1") concerning Company1 that is either confidential, proprietary, or publicly unavailable in connection with your consideration of a possible business combination ("Transaction") between you and Company1 involving TLLC. As a condition, and in consideration, of furnishing to you "Confidential Information" (as defined below), Andrew requires that you treat the Confidential Information so furnished confidentially as set forth in this letter agreement (the "Confidentiality Agreement").<br />1. Confidential Information As used in this Confidentiality Agreement, the term "Confidential Information" means all information concerning Company1 and its subsidiaries or affiliates that is furnished or made available to you by Company1 or any agent or representative of Company1 or that is obtained or derived by you from any of the foregoing persons as part of your consideration of the Transaction.<br />
  28. 28. 11<br />Основные понятия – сегментация<br />Сегмент– <br /><ul><li>абзац;
  29. 29. предложение;
  30. 30. ячейка;
  31. 31. слайд.</li></li></ul><li>12<br />Сегмент оригинала<br />Сегмент перевода<br />Основные понятия – память переводовСводная таблица<br />
  32. 32. 13<br />Основные понятия – глоссарий.<br />Обеспечивается правильный и единообразный перевод терминов<br />
  33. 33. 14<br />Основные функции систем <br /><ul><li>Анализ
  34. 34. Предварительный глобальный переводпо ТМ
  35. 35. Автоматический поиск переводов сходных предложений
  36. 36. Пополнение памяти переводов
  37. 37. Сведение – создание TM по готовым переводам
  38. 38. Пополнение и ведение терминологической базы данных
  39. 39. Текстовый редактор</li></li></ul><li>Типичная процедура работы<br />Создание и настройка проекта<br />Переводчик создает и настраивает проект<br />Переводчик импортирует документы<br />Импорт файлов<br />Автоматический поиск в памяти переводов с использованием нечеткой логики<br />Системапытается найти сходные предложения<br />Система автоматически предлагает перевод<br />Автоматическое предложение вариантов перевода <br />Переводчик переводит остальное<br />Ручной перевод<br />Системаэкспортирует документы для заказчика<br />Экспорт<br />15<br />
  40. 40. ПОЧЕМУ DéjàVu X?<br />
  41. 41. 17<br />Почему DéjàVuX?<br />Все системы умеют находить в памяти переводовпредложения дубликаты, сходные переведенным:<br />Запустите Déjà Vu X и откройте нужную память переводов (Translation memory).<br />Выберите в меню Database команду Find Duplicate Sentences и задайте нужные параметры, чтобы удалить дублирующие записи (проверьте правильность указания языков). <br />Выберите в меню Database команду Find Duplicate Sentences. <br />Пометьтеполе Find sets of duplicate source sentences.<br />Пометьтеполе Find sets of duplicate source sentences with identical translations.<br />Пометьте поле Delete redundant sentences in each set of duplicates.<br />Укажите нужные языки.<br />Пометьтевразделе Miscellaneous:<br />Удаление ненужных переводов одного и того же оригинала.<br />Запустите Déjà Vu X и откройте нужную память переводов (Translation memory).<br />Выберите в меню Database команду Find Duplicate Sentences. <br />Пометьте поле Find sets of duplicate source sentences with different translations.<br />Укажите нужные языки.<br />Пометьтевразделе Miscellaneous: <br />Для просмотра дубликатов и их переводов выберите Duplicate Only в фильтре строк.<br />Выберите в меню View команду Toggle Sorting, чтобы упорядочить память переводов по алфавиту.<br />
  42. 42. 18<br />Почему DéjàVuX?<br />Déjà Vu X, кроме того, автоматически подставляет <br />фрагменты предложений из памяти переводов: <br />Запустите DéjàVu X и откройте нужную память переводов (Translation memory).<br />Выберите в меню Database команду Find Duplicate Sentences и задайте нужные параметры, чтобы удалить дублирующие записи (проверьте правильность указания языков). <br />Выберите в меню Database команду Find Duplicate Sentences. <br />Пометьтеполе Find sets of duplicate source sentences.<br />Пометьтеполе Find sets of duplicate source sentences with identical translations.<br />Пометьте полеDelete redundant sentences in each set of duplicates.<br />Укажите нужные языки.<br />Пометьтевразделе Miscellaneous:<br />Удаление ненужных переводов одного и того же оригинала. <br />Запустите DéjàVu X и откройте нужную память переводов (Translation memory).<br />Выберите в меню Database команду Find Duplicate Sentences. <br />Пометьте поле Find sets of duplicate source sentences with different translations.<br />Укажите нужные языки.<br />Пометьтевразделе Miscellaneous: <br />Для просмотра дубликатов и их переводов выберите Duplicate Only в фильтре строк.<br />Выберите в менюView команду Toggle Sorting, чтобы упорядочить память переводов по алфавиту.<br />
  43. 43. 19<br />Почему DéjàVu X<br />Déjà Vu X автоматически подставляет слова<br /> из терминологической базы:<br />ЗапуститеDéjàVu X и откройте нужную память переводов(Translation memory).<br />Выберите в менюDatabaseкомандуFind Duplicate Sentences и задайте нужные параметры, чтобы удалить дублирующиезаписи (проверьте правильность указания языков). <br />Выберите в меню Database команду Find Duplicate Sentences.<br />Пометьтеполе Find sets of duplicate source sentences.<br />Пометьтеполе Find sets of duplicate source sentences with identical translations.<br />Пометьте полеDelete redundant sentences in each set of duplicates.<br />Укажите нужные языки.<br />Пометьтевразделе Miscellaneous:<br />Удаление ненужных переводов одного и того же оригинала.<br />Запустите DéjàVu X и откройте нужную память переводов (Translation memory).<br />Выберите в меню Database команду Find Duplicate Sentences. <br />Пометьте поле Find sets of duplicate source sentences with different translations.<br />Укажите нужные языки.<br />Пометьтевразделе Miscellaneous: <br />Для просмотра дубликатов и их переводоввыберитеDuplicate Only в фильтре строк.<br />Выберите в менюView командуToggle Sorting, чтобы упорядочить память переводов по алфавиту.<br />
  44. 44. 20<br />Почему DéjàVu X<br />Déjà Vuобнаружит дополнительно фрагментов – 40%, итого - 58%.<br />58% против 18%!<br />Благодаряналичиюфункции автоматической "сборки" (AutoAssemble): перевод может автоматически собираться из фрагментов сегментов, найденных в памяти переводов, и терминов из терминологической базы.<br />Запуститеоткройте память переводов<br />Выберите в менюкомандузадайте<br />параметры, удалитьзаписипроверьте<br />Выберите в меню Database команду Find Duplicate Sentences. <br />Пометьтеполе<br />Пометьтеполе Find sets of duplicate source sentences<br />Пометьте поле.<br />Укажитеязыки.<br />Пометьтеразделе<br />Удалениепереводоворигинала.<br />Запустите DéjàVu X и откройте нужную память переводов (Translation memory).<br />Выберите в меню Database команду Find Duplicate Sentences. <br />Пометьте поле Find sets of duplicate source sentences<br />Укажите нужные языки.<br />Пометьтевразделе Miscellaneous: <br />просмотрапереводоввыберите<br />Выберите в менюкомандупамять переводов<br />
  45. 45. 21<br />Эффективность<br />Средний процент повторений в документах, обнаруживаемый системой – 20-30%. <br />Месяц – 22 рабочих дня по 8 часов = 176 часов<br />Норма переводчика: 1 страница в час<br />20% от 176 =35 страниц = 35 часов <br />= 4 рабочих дня !<br />
  46. 46. Скорость<br />Функциональность<br />Качество и надежность программы<br />22<br />Почему DéjàVu X?<br />
  47. 47. 23<br />Эффективность<br /> Статистика для одного из больших документов <br />Точное совпадение с предложениями в памяти переводов 33,1% <br />Неточное совпадение с предложениями в памяти 4,2% <br />Сборка из фрагментов предложений в памяти и терминов 0,3%<br />Копирование перевода аналогичных предложений далее по тексту 37,3%<br />Перевод вручную 25,2%<br />---------------------------------------------------------------------------------------------------<br />Примечание: Высокая степень для похожих документов, например одной серии.<br />
  48. 48. 24<br />Скорость<br /><ul><li>Возможность глобального автоматического предварительного предпереводатекста
  49. 49. Исключение необходимости полного повторного перевода документов, в которые внесены изменения и дополнения
  50. 50. Нет необходимости в последующей верстке документов
  51. 51. Обеспечение однократного перевода аналогичных сегментов. Автоматическое распространение перевода сегмента для остальных аналогичных сегментов оригинала (как с занесением в БД так и без)
  52. 52. Исключение повторного перевода одинаковых фрагментов в переводимом пакете документов
  53. 53. Автоматизация рутинных операций (Например автоперевод, автопоиск)
  54. 54. Удобство интерфейса, все операции в одной рабочей области, в том числе с БД.</li></li></ul><li>25<br />Функциональность<br /><ul><li>Редакторы могут начать работу сразу же после перевода первой строки текста, делая мгновенные рекомендации по терминологии и переводу основных выражений
  55. 55. Возможность организации групповой работы большого коллектива переводчиков над одним крупным или несколькими сходными документами
  56. 56. Возможность удаленной работы переводчиков через Интернет
  57. 57. Использование нечеткой логики при поиске, позволяющей эффективно находить сходные выражения и термины (например, без учета падежных окончаний)
  58. 58. Возможность работать с набором различных файлов одновременно в рамках одного проекта
  59. 59. Возможность работать с файлами разных форматов</li></li></ul><li>26<br />Функциональность<br /><ul><li>Четырехмерная структура классификации содержания памяти перевода и терминологической базы, все записи классифицируются по предметной области, заказчику, проекту и файлу
  60. 60. Возможность подключения большого числа файлов памяти переводов и терминологических баз, которые можно выборочно подключать только для чтения, длязаписи или для чтения и записи
  61. 61. Доступ к любой подключенной базе не блокируется. Не нужно прерывать перевод, чтобы просмотреть и изменить память переводов и терминологическую базу, в том числе есть и в MS Access
  62. 62. В рамках одного проекта может одновременно переводиться большое число файлов на разных языках, причем их форматы могут не совпадать</li></li></ul><li>27<br />Функциональность<br /><ul><li>Возможность ручного поиска слов и словосочетаний в памяти переводов и терминологических базах
  63. 63. Наличие Лексикона позволяет реализовать правило: "Клиент всегда прав" и переводить, например, по требованию заказчика mouse не как "мышь", а как "мышка", не изменяя ничего в основной терминологической базе
  64. 64. Лексикон позволяет быстро составить словарь общей лексики, исключив все редко употребляемые термины, а также словарь клише, отобрав все часто встречающиеся словосочетания. </li></li></ul><li>28<br />Функциональность<br /><ul><li>Мощная система фильтрации сегментов по более чем десятку параметров, включая параметры, заданные пользователем, с использованием операторов SQL
  65. 65. Удобная и гибко настраиваемая система правил сегментации. Правила сегментации можно задавать самостоятельно для совместимости с другими системами, чтобы обеспечить тождественность файлов памяти переводов
  66. 66. Возможность гибкой настройки рабочего пространства
  67. 67. Использование тех же функций Autotext, Autocorrect и Spelling, что и в MS Word</li></li></ul><li>29<br />Качество и надежность<br /><ul><li>Обеспечение единообразия перевода
  68. 68. Возможность создания комментариев к переводу сегментов и снабжения сегментов пометками, для того чтобы вернуться к их анализу в дальнейшем
  69. 69. Встроенный контроль качества перевода
  70. 70. Автоматический контроль пунктуации
  71. 71. Снижение времени редактирования больших проектов и перевод процесса редактирования на качественно иной уровень. Редактор при редактировании видит как текст перевода, так и текст оригинала по отдельным предложениям. Исключается возможность потери части информации в переводе
  72. 72. Обеспечение минимальных трудозатрат на выполнение работ в заданные сроки</li></li></ul><li>30<br />Качество и надежность<br /><ul><li>Система работает практически без сбоев, в случае сбоя информация не теряется
  73. 73. Осуществляется автосохранение всех компонентов
  74. 74. Имеются встроенные утилиты для восстановления поврежденных баз данных и проекта
  75. 75. Отслеживается, кто, когда и какие внес изменения в проект и базы данных</li></li></ul><li>31<br />Качество и надежность<br />Защита от несанкционированного внесения изменений<br /><ul><li>Доступ к различным элементам проекта по паролям
  76. 76. Возможность запрета редактирования текста или записи в память переводов
  77. 77. 10 уровней индивидуальных полномочий пользователей с различными правами для чтения и записи полномочий на доступ и внесение изменений в соответствии с квалификацией или должностными обязанностями (переводчик, редактор, менеджер)
  78. 78. Пользователи с низким уровнем (переводчики) не могут исправлять внесенное пользователями более высокого уровня (редакторами). Элементарно реализуется правило "Желание начальника - закон для подчиненных" </li></li></ul><li>- Простой импорт файлов разных форматов- представление в едином виде - автоматическим восстановление форматирования документа при его экспорте. <br />32<br />Почему DéjàVu X<br />А также:<br />RTF RC Файлы справки GNU PO и POT CC++ IBM TM<br />
  79. 79. Начало работы с Déjà vu X<br />
  80. 80. 34<br />Структура проектаDéjà Vu <br />Проект DVX<br />Память переводов<br />Терминологическая база<br />Лексикон<br />
  81. 81. 35<br />Основные понятия: Терминологическая БД<br />ТерминологическаяБД - словарь<br />Термины<br />Аббревиатуры<br />Перевод<br />Синонимы<br />Антонимы<br />Часть речи, род, падеж<br />Терминологическая база<br />
  82. 82. 36<br />Основные понятия:Память Переводов TM(Translation Memory)<br />TM – место где хранятся все переводы<br />Слова<br />Предложения<br />Абзацы<br />Тексты<br />Слайды<br />Таблицы<br />Память переводов<br />
  83. 83. Основные функции DVX<br />Pretranslate – предперевод с использованием БД<br />37<br />
  84. 84. Автоматические функции DVX<br />AutoAssemble – сборка перевода по БД<br />AutoSearch – автоматический поиск сегментов в БД<br />AutoCheck –автоматическая проверка по ТБД<br />AutoPropagate– автораспространение перевода<br />AutosSend– автоматическая отправка в сегментов в TM<br />38<br />Основные функции DVX<br />
  85. 85. 39<br />Статусы сегментов<br /><ul><li>Exact match – полное (100%) совпадение с БД
  86. 86. Fuzzy match – частичное (0-99%)совпадение с БД
  87. 87. Assembled – собрано из фрагментов БД
  88. 88. Guaranteed matches – контекстное совпадение(101%) </li></li></ul><li>Основные функции Déjà vu <br />Функции доступные в «ручном» режиме:<br /><ul><li>Assemble – сборка перевода из фрагментов БД.
  89. 89. Propogate – распространение перевода внутри
  90. 90. Scan- поиск по ТМ
  91. 91. Database Lookup – поиск по ТБД
  92. 92. Send to TM
  93. 93. QA check – проверка терминологии и пунктуации
  94. 94. Populate – авто замена сегментов перевода
  95. 95. Wordcount / Analize – функции для расчета трудозатрат </li></ul>40<br />
  96. 96. 41<br />Интерфейс программы Déjà vu <br />Сегментированный текст оригинала<br />Сегмент текста перевода<br />Фильтр сегментов<br />Список импорти-рованных файлов<br />Фрагменты, найденные в памяти переводов и терминологической базе<br />Предложения, найденные в памяти переводов<br />
  97. 97. 42<br />Фильтр сегментов<br />
  98. 98. 43<br />Настройки проекта<br /><ul><li> Языки проекта
  99. 99. Подключенные БД
  100. 100. Пользователи
  101. 101. Права доступа</li></li></ul><li><ul><li>Опции «авто сборки»
  102. 102. Опции «авто поиска»
  103. 103. Опции поиска и просмотра БД
  104. 104. Опции приоритетов БД</li></ul>44<br />Настройки программы:General<br />
  105. 105. 45<br />Настройки программы:Environment<br />
  106. 106. <ul><li>Правила разбиения на сегменты
  107. 107. Настройка сегментации для разных языков
  108. 108. Исключения</li></ul>46<br />Настройки программы:Cегментация<br />
  109. 109. Пример:<br />47<br />Работа программы на примере<br />

×