SlideShare a Scribd company logo
1 of 36
Download to read offline
Количественная оценка качества
    письменного перевода
      практический опыт

           Демид Тишин,
       бюро переводов «Окей»
          www.allcorrect.ru
TQ-Metric: какой от неё прок?

                  качество обслуживания
Качественная =    качество исполнителей
   услуга         качество тех.процесса





    Довольный
    клиент
                              ?
                 "You cannot manage
                 what you cannot measure"
                          William Hewlett
TQ-Metric: какой от неё прок?

             !

                                !
TQ-Metric: какой от неё прок?
Основные функции TQ-Metric:
1. Оценка квалификации исполнителей при
  подборе команды на проект;
2. Выходной контроль качества;
3. Предоставление числовых статистических
  данных для управления качеством;
4. Предоставление числовых статистических
  данных для управленческого учета
  (balanced scorecard, KPI и т.д.)
TQ-Metric
TQ-Metric используют:
Lionbridge, Aliquantum, Palex…

Существующие системы:
Публичные
  SAE J 2450
  ATA Framework for Standard Error Marking
  LISA QA Model
Внутренние разработки переводческих компаний
  Lionbridge TQI
  БП «Окей» и др.

Обзор TQ-Metric с рекомендациями по созданию:
http://www.aliquantum.biz/downloads.htm
TQ-Metric
Основополагающие принципы:
1) Перевод поддается формализованной оценке
2) Чем меньше ошибок и чем они «легче»,
тем лучше перевод!

Необходимые компоненты системы:
 Классификатор ошибок с указанием относительного
  «веса» каждой ошибки
 Процедура проверки, дающая повторяемые и
  воспроизводимые результаты
 Проверяющий (компетентный и беспристрастный).
 Форма оценки
Пример классификатора ошибок
Пример текста после проверки
Пример заполненной формы оценки
Подсчет результатов оценки
TQI (Translation Quality Index) – это практический
  результат количественной оценки проверки
  качества перевода.
ATA:                       TQI = EP/W/250
SAE J 2450:                TQI = EP/W
LISA, Lionbridge, БП Окей: TQI = (1 – EP/W) * 100
где EP – суммарное количество баллов
    ошибок (Error Points)
    W – количество слов в образце
Подсчет результатов оценки
            Пороговые значения TQI:
ATA: 18 (т.е. 18 баллов ошибок на 250 слов)
SAE J 2450: предельное значение не задано
LISA: 99 (т.е. 1 балл ошибок на 100 слов)
БП Окей: для переводчика: 86
         (т.е. 14 баллов ошибок на 100 слов)
 для сдачи клиенту: до настоящей презентации
 оставался неопределенным. Cм. слайд 33.
 Внимание: TQI из разных систем не подлежат
                прямому сравнению!
Translation Quality Metric
Преимущества:
 максимальная объективность оценки за счет
  формализованной процедуры и
  отбалансированного классификатора;
 удобство предоставления обратной связи
  исполнителям;
 возможность подстройки под конкретные
  условия (специфику проекта) – гибкий подход
  к принятию решения;
 удобство сохранения и использования
  результатов, наглядное представление о
  сильных и слабых сторонах переводчика;
 Объективные данные для улучшения
  технологического процесса
Translation Quality Metric
Недостатки:
необходимость дополнительной
 методической работы (создание
 классификатора ошибок, разработка формы
 и процедуры оценки, «калибровка» весов
 ошибок);
необходимость заполнения формы при
 оценке тестового задания.
Системы TQ-Metric
    в сравнении
• ATA Framework for Standard
  Error Marking
• SAE J 2450
• БП Окей
Системы TQ-Metric в сравнении:
    охватываемые типы текстов
  АТА          SAE J 2450            БП Окей
любые* за исключением текстов,   за исключением
       для которых стиль         художественных
       является существенным     текстов
       компонентом.



*возможность применения в учебном процессе,
при сертификации переводчиков, в издательствах,
переводческих компаниях и т.д.
Системы TQ-Metric в сравнении:
        требования к образцам

      АТА       SAE J 2450           БП Окей
225-275              -       400-750 слов*;
английских слов              при тестировании
либо                         переводчиков и
эквивалент на                редакторов на проект
другом языке                 содержание терминов в
                             тест-задании ≥ 5%
                             количества слов
 *высокая надежность результатов
Системы TQ-Metric в сравнении:
   количество проверяющих, min.
АТА   SAE J 2450              БП Окей
 2*       1      1 при выходном контроле
                 качества;
                 2 при тестировании переводчиков
                 (на первые 5 образцов по одному
                 проекту привлекается второй
                 проверяющий для максимально
                 полного выявления ошибок)
*повышение объективности результатов,
также повышение затрат
Системы TQ-Metric в сравнении:
    Количество классов ошибок
     АТА          SAE J 2450         БП Окей

     21                7                  16




На практике количество классов ошибок
по классификатору не влияет на удобство
пользования системой
Системы TQ-Metric в сравнении:
      Полнота классификатора
   АТА            SAE J 2450         БП Окей

    да     Не охватывает               да
           стилистические ошибки,
           недочеты внешнего
           вида и оформления*


*сужает область применения системы
Системы TQ-Metric в сравнении:
Строгость построения классификатора

     АТА          SAE J 2450        БП Окей

     да*      нет
              (смысловые ошибки являются
              одним из разделов классификатора)


*на практике упрощает определение типа ошибки
Системы TQ-Metric в сравнении:
  Количество градаций веса ошибки
     АТА           SAE J 2450        БП Окей

      5*               2                  2




*Гибкость (максимальный учет контекста)
Системы TQ-Metric в сравнении:
 Ограничения на максимальный вес
  ошибки в зависимости от класса
     АТА           SAE J 2450        БП Окей

     Нет*             да                  да




*Гибкость (максимальный учет контекста)
Ограничения на максимальный вес ошибки
        в зависимости от класса
           оригинал                      перевод              балл
To reduce the noise different Для снижения уровня шума          5
types of low noise valves and следует предусмотреть           (Т1)
grill plates will be foreseen. разные типы малошумящей
                               арматуры и вентиляционных
                               решеток
Construction employs 15 full     В конструкции применяются
length tie bolts that            15 стяжных болтов, которые
compress the discs <…>           сжимают рабочие колеса <…>
thereby forming a rigid rotor.   образуя жесткий вал.

Балл один и тот же (5), а серьёзность ошибок различная:
в первом примере ошибка может привести к неверным
действиям персонала , а во втором случае – нет
Системы TQ-Metric в сравнении:
        количество действий
         для оценки ошибки
    АТА          SAE J 2450       БП Окей
     3               2              1-2*




*Чем более формален классификатор, тем меньше
действий требуется для оценки ошибки
(экономия времени)
Системы TQ-Metric в сравнении:
     Зачитываются ли ошибки, вызванные
   неустранимыми недостатками оригинала
  (отсутствие контекста, невразумительное и
           неграмотное изложение)?

      АТА         SAE J 2450        БП Окей
  нет данных         да               нет


Система БП Окей больше приспособлена к начальному
тестированию команды, система SAE J 2450 – для
выходного контроля
Системы TQ-Metric в сравнении:
    Если проверяющий сталкивается
        с аналогичной ошибкой
 АТА    SAE J 2450                 БП Окей
  нет  зачитывается   При тестировании команды на проект
данных каждый         – если однотипная ошибка
       случай         оформления повторяется по всему
       неверного      тексту (использование точки вместо
       употребления   запятой для отделения дробной части,
                      употребление лишних заглавных букв
                      в имени собственном и т.д.), она
                      зачитывается один раз.
                      При выходном контроле -
                      зачитывается каждый случай
                      неверного употребления
Сравнение систем в действии
         Исходные данные
• 3 тест-задания в разных тематиках:
  Энергетика (описание газовой турбины)
  Нефтепереработка (звукоизоляция оборудования)
  Юриспруденция (генеральное соглашение
  оказания услуг)
• 5 кандидатов в каждой тематике
• 3 системы проверки
• 2 проверяющих

РЕЗУЛЬТАТ: 90 заполненных форм оценки.
Субъективность оценки
Отношение между средним удельным баллом ошибок
(по всем тематикам) после проверки разными людьми:

                 EP(средн.)1-й чел.
   Kсубъектив. =
                 EP(средн.)2-й чел.

     АТА           SAE J 2450        БП Окей

      1,5             1,0              1,0
Субъективность оценки
• Средний коэффициент по всем тематикам 1,0
  у систем SAE J 2450 и БП Окей говорит о том, что
  субъективность оценки минимальна.
  Следовательно, перевод может проверять один
  человек, и затраты на проверку низкие.
• Средний коэффициент по всем тематикам 1,5
  у системы ATA (а по тематике «газовые турбины»
  вообще 2,0) говорит о высокой субъективности
  оценки. Следовательно, для получения
  достоверных результатов минимальное
  количество проверяющих равняется двум, что
  удваивает затраты на оценку качества.
Распределение балла ошибок между тематиками
        (среднее по 2-м проверяющим)




    Рисунок     Рисунок практически идентичен
   отличается
Распределение среднего балла ошибок
         в разных системах

• Рисунок    распределения      баллов    по
  тематикам в системе АТА значительно
  отличается – за счет того, что фактический
  вес каждой ошибки не зависит от
  ограничений классификатора.
  Это повышает объективность оценки
  (с учетом проверки перевода двумя
  людьми).
Строгость оценки
  Среднее превышение порогового значения
            Балл ошибок (средн.) – Пороговое знач.
Kстрог. =             Пороговое знач.

   АТА           SAE J 2450         БП Окей
   42%          Строгость не           17%
            поддается подсчету,   (относительно
               т.к. пороговое   проходного балла
            значение не задано переводчика = 14)
Строгость оценки
• Требования АТА к качеству конечного текста выше,
  чем требования БП Окей к квалификации
  переводчика (макс. балл ошибок = 14 на 100 слов).
• Исходя из того, что пороговое значение АТА
  является обоснованным, предположим, что
  строгость системы БП Окей в отношении качества
  конечного переводного текста должна равняться
  строгости АТА (т.е. = 42%).
• Согласно формуле, выводим пороговое значение
  для конечного текста по системе БП Окей:
  8,87 баллов на 100 слов, т.е. TQI = 91,1
Средняя скорость оценки
         1 тест-задания
 при условии тщательного предварительного
         изучения текста оригинала

     АТА           SAE J 2450       БП Окей
   13 минут       9,5 минут*         9 минут



*По субъективным впечатлениям,
система SAE J 2450 обладает самым быстрым в
работе классификатором: колебания относительно
класса ошибки возникают крайне редко.
Выводы
                    АТА      SAE J 2450   БП Окей
  Область           Без       Жесткие    Некоторые
применения      ограничений ограничения ограничения

 Стройность      Высокая      Средняя     Низкая

  Конечная       Высокая      Средняя     Средняя
объективность
 Сложность       Высокая      Низкая      Низкая
 внедрения

  Затраты        Высокие      Низкие      Низкие
Спасибо за внимание.

     Вопросы?

More Related Content

What's hot

2.1 Тестирование: основные определения
2.1 Тестирование: основные определения2.1 Тестирование: основные определения
2.1 Тестирование: основные определенияNatalia Odegova
 
2.3 Тестирование: процесс, роли, артефакты
2.3 Тестирование: процесс, роли, артефакты2.3 Тестирование: процесс, роли, артефакты
2.3 Тестирование: процесс, роли, артефактыNatalia Odegova
 
Управление тестированием. Анализ типичных проблем
Управление тестированием. Анализ типичных проблемУправление тестированием. Анализ типичных проблем
Управление тестированием. Анализ типичных проблемSQALab
 
Ошибки начинающего специалиста по нагрузочному тестированию и как их избежать
Ошибки начинающего специалиста по нагрузочному тестированию и как их избежатьОшибки начинающего специалиста по нагрузочному тестированию и как их избежать
Ошибки начинающего специалиста по нагрузочному тестированию и как их избежатьSQALab
 
Роли, в которые играют тестировщики
Роли, в которые играют тестировщикиРоли, в которые играют тестировщики
Роли, в которые играют тестировщикиSQALab
 
Артефакты тестирования: быть или не быть?
Артефакты тестирования: быть или не быть?Артефакты тестирования: быть или не быть?
Артефакты тестирования: быть или не быть?Maksim Grinevich
 
Невыносимая переносимость кроссплатформенных приложений на примере десктопных...
Невыносимая переносимость кроссплатформенных приложений на примере десктопных...Невыносимая переносимость кроссплатформенных приложений на примере десктопных...
Невыносимая переносимость кроссплатформенных приложений на примере десктопных...SQALab
 
DevOps подходы в инфраструктуре автоматизации тестирования
DevOps подходы в инфраструктуре автоматизации тестированияDevOps подходы в инфраструктуре автоматизации тестирования
DevOps подходы в инфраструктуре автоматизации тестированияSQALab
 
технология и отладка по (47)
технология и отладка по (47)технология и отладка по (47)
технология и отладка по (47)romachka_pole
 
Илья Гаврилов
Илья ГавриловИлья Гаврилов
Илья ГавриловSQALab
 
Тестирование ПО (лекция 2)
Тестирование ПО (лекция 2)Тестирование ПО (лекция 2)
Тестирование ПО (лекция 2)Igor Khmelnytskyy
 
Александр Александров -- Надёжный тест-дизайн (мастер-класс)
Александр Александров -- Надёжный тест-дизайн (мастер-класс)Александр Александров -- Надёжный тест-дизайн (мастер-класс)
Александр Александров -- Надёжный тест-дизайн (мастер-класс)sqadays8
 
МАСТЕР-КЛАСС. Риски тестирования
МАСТЕР-КЛАСС. Риски тестированияМАСТЕР-КЛАСС. Риски тестирования
МАСТЕР-КЛАСС. Риски тестированияSQALab
 
Сергей Ревко
Сергей РевкоСергей Ревко
Сергей РевкоSQALab
 
[JAM 1.2] Testing in Android (Dzmitry Ivashnev)
[JAM 1.2] Testing in Android (Dzmitry Ivashnev)[JAM 1.2] Testing in Android (Dzmitry Ivashnev)
[JAM 1.2] Testing in Android (Dzmitry Ivashnev)Evgeny Kaziak
 
Тестирование ПО (лекция 1)
Тестирование ПО (лекция 1)Тестирование ПО (лекция 1)
Тестирование ПО (лекция 1)Igor Khmelnytskyy
 

What's hot (20)

Тест-дизайн "в цикле"
Тест-дизайн "в цикле"Тест-дизайн "в цикле"
Тест-дизайн "в цикле"
 
2.1 Тестирование: основные определения
2.1 Тестирование: основные определения2.1 Тестирование: основные определения
2.1 Тестирование: основные определения
 
2.3 Тестирование: процесс, роли, артефакты
2.3 Тестирование: процесс, роли, артефакты2.3 Тестирование: процесс, роли, артефакты
2.3 Тестирование: процесс, роли, артефакты
 
Управление тестированием. Анализ типичных проблем
Управление тестированием. Анализ типичных проблемУправление тестированием. Анализ типичных проблем
Управление тестированием. Анализ типичных проблем
 
Ошибки начинающего специалиста по нагрузочному тестированию и как их избежать
Ошибки начинающего специалиста по нагрузочному тестированию и как их избежатьОшибки начинающего специалиста по нагрузочному тестированию и как их избежать
Ошибки начинающего специалиста по нагрузочному тестированию и как их избежать
 
Роли, в которые играют тестировщики
Роли, в которые играют тестировщикиРоли, в которые играют тестировщики
Роли, в которые играют тестировщики
 
Артефакты тестирования: быть или не быть?
Артефакты тестирования: быть или не быть?Артефакты тестирования: быть или не быть?
Артефакты тестирования: быть или не быть?
 
Невыносимая переносимость кроссплатформенных приложений на примере десктопных...
Невыносимая переносимость кроссплатформенных приложений на примере десктопных...Невыносимая переносимость кроссплатформенных приложений на примере десктопных...
Невыносимая переносимость кроссплатформенных приложений на примере десктопных...
 
Testing
TestingTesting
Testing
 
DevOps подходы в инфраструктуре автоматизации тестирования
DevOps подходы в инфраструктуре автоматизации тестированияDevOps подходы в инфраструктуре автоматизации тестирования
DevOps подходы в инфраструктуре автоматизации тестирования
 
технология и отладка по (47)
технология и отладка по (47)технология и отладка по (47)
технология и отладка по (47)
 
Илья Гаврилов
Илья ГавриловИлья Гаврилов
Илья Гаврилов
 
Тестирование ПО (лекция 2)
Тестирование ПО (лекция 2)Тестирование ПО (лекция 2)
Тестирование ПО (лекция 2)
 
Александр Александров -- Надёжный тест-дизайн (мастер-класс)
Александр Александров -- Надёжный тест-дизайн (мастер-класс)Александр Александров -- Надёжный тест-дизайн (мастер-класс)
Александр Александров -- Надёжный тест-дизайн (мастер-класс)
 
МАСТЕР-КЛАСС. Риски тестирования
МАСТЕР-КЛАСС. Риски тестированияМАСТЕР-КЛАСС. Риски тестирования
МАСТЕР-КЛАСС. Риски тестирования
 
Simonova sql server-enginetesting
Simonova sql server-enginetestingSimonova sql server-enginetesting
Simonova sql server-enginetesting
 
Test design print
Test design printTest design print
Test design print
 
Сергей Ревко
Сергей РевкоСергей Ревко
Сергей Ревко
 
[JAM 1.2] Testing in Android (Dzmitry Ivashnev)
[JAM 1.2] Testing in Android (Dzmitry Ivashnev)[JAM 1.2] Testing in Android (Dzmitry Ivashnev)
[JAM 1.2] Testing in Android (Dzmitry Ivashnev)
 
Тестирование ПО (лекция 1)
Тестирование ПО (лекция 1)Тестирование ПО (лекция 1)
Тестирование ПО (лекция 1)
 

Viewers also liked

Creating my double page spread
Creating my double page spreadCreating my double page spread
Creating my double page spreadMegan Whitehead
 
07 ภาคผนวก
07 ภาคผนวก07 ภาคผนวก
07 ภาคผนวกAriya Soparux
 
Conventions of a magazine for preliminary task
Conventions of a magazine for preliminary taskConventions of a magazine for preliminary task
Conventions of a magazine for preliminary taskMegan Whitehead
 
แบบเสนอโครงร่างโครงงานคอมพิวเตอร์ ครูสมร
แบบเสนอโครงร่างโครงงานคอมพิวเตอร์ ครูสมรแบบเสนอโครงร่างโครงงานคอมพิวเตอร์ ครูสมร
แบบเสนอโครงร่างโครงงานคอมพิวเตอร์ ครูสมรAriya Soparux
 
02 บทที่ 2-เอกสารที่เกี่ยวข้อง
02 บทที่ 2-เอกสารที่เกี่ยวข้อง02 บทที่ 2-เอกสารที่เกี่ยวข้อง
02 บทที่ 2-เอกสารที่เกี่ยวข้องAriya Soparux
 
Initial ideas for preliminary task
Initial ideas for preliminary taskInitial ideas for preliminary task
Initial ideas for preliminary taskMegan Whitehead
 
Analysis of similar style magazine contents page
Analysis of similar style magazine contents pageAnalysis of similar style magazine contents page
Analysis of similar style magazine contents pageMegan Whitehead
 
แบบเสนอโครงร่างโครงงานคอมพิวเตอร์ ครูสมร
แบบเสนอโครงร่างโครงงานคอมพิวเตอร์ ครูสมรแบบเสนอโครงร่างโครงงานคอมพิวเตอร์ ครูสมร
แบบเสนอโครงร่างโครงงานคอมพิวเตอร์ ครูสมรAriya Soparux
 

Viewers also liked (11)

Faq master
Faq masterFaq master
Faq master
 
Creating my double page spread
Creating my double page spreadCreating my double page spread
Creating my double page spread
 
07 ภาคผนวก
07 ภาคผนวก07 ภาคผนวก
07 ภาคผนวก
 
Conventions of a magazine for preliminary task
Conventions of a magazine for preliminary taskConventions of a magazine for preliminary task
Conventions of a magazine for preliminary task
 
แบบเสนอโครงร่างโครงงานคอมพิวเตอร์ ครูสมร
แบบเสนอโครงร่างโครงงานคอมพิวเตอร์ ครูสมรแบบเสนอโครงร่างโครงงานคอมพิวเตอร์ ครูสมร
แบบเสนอโครงร่างโครงงานคอมพิวเตอร์ ครูสมร
 
02 บทที่ 2-เอกสารที่เกี่ยวข้อง
02 บทที่ 2-เอกสารที่เกี่ยวข้อง02 บทที่ 2-เอกสารที่เกี่ยวข้อง
02 บทที่ 2-เอกสารที่เกี่ยวข้อง
 
Initial ideas for preliminary task
Initial ideas for preliminary taskInitial ideas for preliminary task
Initial ideas for preliminary task
 
Analysis of similar style magazine contents page
Analysis of similar style magazine contents pageAnalysis of similar style magazine contents page
Analysis of similar style magazine contents page
 
Creating my cover page
Creating my cover pageCreating my cover page
Creating my cover page
 
Photoshoot the voice
Photoshoot the voicePhotoshoot the voice
Photoshoot the voice
 
แบบเสนอโครงร่างโครงงานคอมพิวเตอร์ ครูสมร
แบบเสนอโครงร่างโครงงานคอมพิวเตอร์ ครูสมรแบบเสนอโครงร่างโครงงานคอมพิวเตอร์ ครูสมร
แบบเสนอโครงร่างโครงงานคอมพิวเตอร์ ครูสมร
 

Similar to Tq metric compared-0

Оценка трудозатрат на тестирование в проектах сопровождения
Оценка трудозатрат на тестирование в проектах сопровожденияОценка трудозатрат на тестирование в проектах сопровождения
Оценка трудозатрат на тестирование в проектах сопровожденияSQALab
 
Маргарита Сафарова - Аудит процессов тестирования при смене проектной команды
Маргарита Сафарова - Аудит процессов тестирования при смене проектной командыМаргарита Сафарова - Аудит процессов тестирования при смене проектной команды
Маргарита Сафарова - Аудит процессов тестирования при смене проектной командыSQALab
 
Оценка качества переводов от Tqi к компетенциям
Оценка качества переводов от Tqi к компетенциямОценка качества переводов от Tqi к компетенциям
Оценка качества переводов от Tqi к компетенциямDenis Khamin
 
Adding Agility in Testing - Katya Kameneva
Adding Agility in Testing - Katya KamenevaAdding Agility in Testing - Katya Kameneva
Adding Agility in Testing - Katya KamenevaArtem Serdyuk
 
Процесс тестирования
Процесс тестированияПроцесс тестирования
Процесс тестированияAlexander Solosh
 
Человеко-дни на тестирование или как не ошибиться с оценкой
Человеко-дни на тестирование или как не ошибиться с оценкойЧеловеко-дни на тестирование или как не ошибиться с оценкой
Человеко-дни на тестирование или как не ошибиться с оценкойSQALab
 
Метрики автоматизированного тестирования на пальцах
Метрики автоматизированного тестирования на пальцахМетрики автоматизированного тестирования на пальцах
Метрики автоматизированного тестирования на пальцахSQALab
 
Тестирование весна 2013 лекция 2
Тестирование весна 2013 лекция 2Тестирование весна 2013 лекция 2
Тестирование весна 2013 лекция 2Technopark
 
Allure framework. Пример настройки исчерпывающего репорта на реальном проекте
Allure framework. Пример настройки исчерпывающего репорта на реальном проектеAllure framework. Пример настройки исчерпывающего репорта на реальном проекте
Allure framework. Пример настройки исчерпывающего репорта на реальном проектеCOMAQA.BY
 
Оценки тестирования - полезные и условные метрики
Оценки тестирования - полезные и условные метрикиОценки тестирования - полезные и условные метрики
Оценки тестирования - полезные и условные метрикиSQALab
 
Сергей Кащенко - Опыт внедрения метрик
Сергей Кащенко - Опыт внедрения метрикСергей Кащенко - Опыт внедрения метрик
Сергей Кащенко - Опыт внедрения метрикLuxoft Education Center
 
Слайдкаст. Измерения в ИТ и ПО. Часть II
Слайдкаст. Измерения в ИТ и ПО. Часть IIСлайдкаст. Измерения в ИТ и ПО. Часть II
Слайдкаст. Измерения в ИТ и ПО. Часть IISergiy Povolyashko
 
Как оценивать состояние проекта по разработке с помощью формальных метрик и о...
Как оценивать состояние проекта по разработке с помощью формальных метрик и о...Как оценивать состояние проекта по разработке с помощью формальных метрик и о...
Как оценивать состояние проекта по разработке с помощью формальных метрик и о...Dmitry Andreev
 
Андрей Сильчук: "Автоматическое тестирование".
Андрей Сильчук: "Автоматическое тестирование".Андрей Сильчук: "Автоматическое тестирование".
Андрей Сильчук: "Автоматическое тестирование".Hub-IT-School
 
Автоматическое тестирование и с чем его едят
Автоматическое тестирование и с чем его едятАвтоматическое тестирование и с чем его едят
Автоматическое тестирование и с чем его едятMarina Peregud
 
6 сигм. Сокращение количества ошибок в информационной системе
6 сигм. Сокращение количества ошибок в информационной системе6 сигм. Сокращение количества ошибок в информационной системе
6 сигм. Сокращение количества ошибок в информационной системеViktoriia Oleshko
 
стратегия тестирования
стратегия тестированиястратегия тестирования
стратегия тестированияNatalia Zhelnova
 
Татьяна Гориславец - Количественное управление проектом
Татьяна Гориславец - Количественное управление проектомТатьяна Гориславец - Количественное управление проектом
Татьяна Гориславец - Количественное управление проектомLuxoft Education Center
 
Внедрение тестирования в Scrum
Внедрение тестирования в ScrumВнедрение тестирования в Scrum
Внедрение тестирования в ScrumDenis Petelin
 

Similar to Tq metric compared-0 (20)

Оценка трудозатрат на тестирование в проектах сопровождения
Оценка трудозатрат на тестирование в проектах сопровожденияОценка трудозатрат на тестирование в проектах сопровождения
Оценка трудозатрат на тестирование в проектах сопровождения
 
Маргарита Сафарова - Аудит процессов тестирования при смене проектной команды
Маргарита Сафарова - Аудит процессов тестирования при смене проектной командыМаргарита Сафарова - Аудит процессов тестирования при смене проектной команды
Маргарита Сафарова - Аудит процессов тестирования при смене проектной команды
 
Оценка качества переводов от Tqi к компетенциям
Оценка качества переводов от Tqi к компетенциямОценка качества переводов от Tqi к компетенциям
Оценка качества переводов от Tqi к компетенциям
 
Adding Agility in Testing - Katya Kameneva
Adding Agility in Testing - Katya KamenevaAdding Agility in Testing - Katya Kameneva
Adding Agility in Testing - Katya Kameneva
 
DIRECTUM
DIRECTUMDIRECTUM
DIRECTUM
 
Процесс тестирования
Процесс тестированияПроцесс тестирования
Процесс тестирования
 
Человеко-дни на тестирование или как не ошибиться с оценкой
Человеко-дни на тестирование или как не ошибиться с оценкойЧеловеко-дни на тестирование или как не ошибиться с оценкой
Человеко-дни на тестирование или как не ошибиться с оценкой
 
Метрики автоматизированного тестирования на пальцах
Метрики автоматизированного тестирования на пальцахМетрики автоматизированного тестирования на пальцах
Метрики автоматизированного тестирования на пальцах
 
Тестирование весна 2013 лекция 2
Тестирование весна 2013 лекция 2Тестирование весна 2013 лекция 2
Тестирование весна 2013 лекция 2
 
Allure framework. Пример настройки исчерпывающего репорта на реальном проекте
Allure framework. Пример настройки исчерпывающего репорта на реальном проектеAllure framework. Пример настройки исчерпывающего репорта на реальном проекте
Allure framework. Пример настройки исчерпывающего репорта на реальном проекте
 
Оценки тестирования - полезные и условные метрики
Оценки тестирования - полезные и условные метрикиОценки тестирования - полезные и условные метрики
Оценки тестирования - полезные и условные метрики
 
Сергей Кащенко - Опыт внедрения метрик
Сергей Кащенко - Опыт внедрения метрикСергей Кащенко - Опыт внедрения метрик
Сергей Кащенко - Опыт внедрения метрик
 
Слайдкаст. Измерения в ИТ и ПО. Часть II
Слайдкаст. Измерения в ИТ и ПО. Часть IIСлайдкаст. Измерения в ИТ и ПО. Часть II
Слайдкаст. Измерения в ИТ и ПО. Часть II
 
Как оценивать состояние проекта по разработке с помощью формальных метрик и о...
Как оценивать состояние проекта по разработке с помощью формальных метрик и о...Как оценивать состояние проекта по разработке с помощью формальных метрик и о...
Как оценивать состояние проекта по разработке с помощью формальных метрик и о...
 
Андрей Сильчук: "Автоматическое тестирование".
Андрей Сильчук: "Автоматическое тестирование".Андрей Сильчук: "Автоматическое тестирование".
Андрей Сильчук: "Автоматическое тестирование".
 
Автоматическое тестирование и с чем его едят
Автоматическое тестирование и с чем его едятАвтоматическое тестирование и с чем его едят
Автоматическое тестирование и с чем его едят
 
6 сигм. Сокращение количества ошибок в информационной системе
6 сигм. Сокращение количества ошибок в информационной системе6 сигм. Сокращение количества ошибок в информационной системе
6 сигм. Сокращение количества ошибок в информационной системе
 
стратегия тестирования
стратегия тестированиястратегия тестирования
стратегия тестирования
 
Татьяна Гориславец - Количественное управление проектом
Татьяна Гориславец - Количественное управление проектомТатьяна Гориславец - Количественное управление проектом
Татьяна Гориславец - Количественное управление проектом
 
Внедрение тестирования в Scrum
Внедрение тестирования в ScrumВнедрение тестирования в Scrum
Внедрение тестирования в Scrum
 

Tq metric compared-0

  • 1. Количественная оценка качества письменного перевода практический опыт Демид Тишин, бюро переводов «Окей» www.allcorrect.ru
  • 2. TQ-Metric: какой от неё прок? качество обслуживания Качественная = качество исполнителей услуга качество тех.процесса  Довольный клиент ? "You cannot manage what you cannot measure" William Hewlett
  • 3. TQ-Metric: какой от неё прок? ! !
  • 4. TQ-Metric: какой от неё прок? Основные функции TQ-Metric: 1. Оценка квалификации исполнителей при подборе команды на проект; 2. Выходной контроль качества; 3. Предоставление числовых статистических данных для управления качеством; 4. Предоставление числовых статистических данных для управленческого учета (balanced scorecard, KPI и т.д.)
  • 5. TQ-Metric TQ-Metric используют: Lionbridge, Aliquantum, Palex… Существующие системы: Публичные SAE J 2450 ATA Framework for Standard Error Marking LISA QA Model Внутренние разработки переводческих компаний Lionbridge TQI БП «Окей» и др. Обзор TQ-Metric с рекомендациями по созданию: http://www.aliquantum.biz/downloads.htm
  • 6. TQ-Metric Основополагающие принципы: 1) Перевод поддается формализованной оценке 2) Чем меньше ошибок и чем они «легче», тем лучше перевод! Необходимые компоненты системы:  Классификатор ошибок с указанием относительного «веса» каждой ошибки  Процедура проверки, дающая повторяемые и воспроизводимые результаты  Проверяющий (компетентный и беспристрастный).  Форма оценки
  • 10. Подсчет результатов оценки TQI (Translation Quality Index) – это практический результат количественной оценки проверки качества перевода. ATA: TQI = EP/W/250 SAE J 2450: TQI = EP/W LISA, Lionbridge, БП Окей: TQI = (1 – EP/W) * 100 где EP – суммарное количество баллов ошибок (Error Points) W – количество слов в образце
  • 11. Подсчет результатов оценки Пороговые значения TQI: ATA: 18 (т.е. 18 баллов ошибок на 250 слов) SAE J 2450: предельное значение не задано LISA: 99 (т.е. 1 балл ошибок на 100 слов) БП Окей: для переводчика: 86 (т.е. 14 баллов ошибок на 100 слов) для сдачи клиенту: до настоящей презентации оставался неопределенным. Cм. слайд 33. Внимание: TQI из разных систем не подлежат прямому сравнению!
  • 12. Translation Quality Metric Преимущества:  максимальная объективность оценки за счет формализованной процедуры и отбалансированного классификатора;  удобство предоставления обратной связи исполнителям;  возможность подстройки под конкретные условия (специфику проекта) – гибкий подход к принятию решения;  удобство сохранения и использования результатов, наглядное представление о сильных и слабых сторонах переводчика;  Объективные данные для улучшения технологического процесса
  • 13. Translation Quality Metric Недостатки: необходимость дополнительной методической работы (создание классификатора ошибок, разработка формы и процедуры оценки, «калибровка» весов ошибок); необходимость заполнения формы при оценке тестового задания.
  • 14. Системы TQ-Metric в сравнении • ATA Framework for Standard Error Marking • SAE J 2450 • БП Окей
  • 15. Системы TQ-Metric в сравнении: охватываемые типы текстов АТА SAE J 2450 БП Окей любые* за исключением текстов, за исключением для которых стиль художественных является существенным текстов компонентом. *возможность применения в учебном процессе, при сертификации переводчиков, в издательствах, переводческих компаниях и т.д.
  • 16. Системы TQ-Metric в сравнении: требования к образцам АТА SAE J 2450 БП Окей 225-275 - 400-750 слов*; английских слов при тестировании либо переводчиков и эквивалент на редакторов на проект другом языке содержание терминов в тест-задании ≥ 5% количества слов *высокая надежность результатов
  • 17. Системы TQ-Metric в сравнении: количество проверяющих, min. АТА SAE J 2450 БП Окей 2* 1 1 при выходном контроле качества; 2 при тестировании переводчиков (на первые 5 образцов по одному проекту привлекается второй проверяющий для максимально полного выявления ошибок) *повышение объективности результатов, также повышение затрат
  • 18. Системы TQ-Metric в сравнении: Количество классов ошибок АТА SAE J 2450 БП Окей 21 7 16 На практике количество классов ошибок по классификатору не влияет на удобство пользования системой
  • 19. Системы TQ-Metric в сравнении: Полнота классификатора АТА SAE J 2450 БП Окей да Не охватывает да стилистические ошибки, недочеты внешнего вида и оформления* *сужает область применения системы
  • 20. Системы TQ-Metric в сравнении: Строгость построения классификатора АТА SAE J 2450 БП Окей да* нет (смысловые ошибки являются одним из разделов классификатора) *на практике упрощает определение типа ошибки
  • 21. Системы TQ-Metric в сравнении: Количество градаций веса ошибки АТА SAE J 2450 БП Окей 5* 2 2 *Гибкость (максимальный учет контекста)
  • 22. Системы TQ-Metric в сравнении: Ограничения на максимальный вес ошибки в зависимости от класса АТА SAE J 2450 БП Окей Нет* да да *Гибкость (максимальный учет контекста)
  • 23. Ограничения на максимальный вес ошибки в зависимости от класса оригинал перевод балл To reduce the noise different Для снижения уровня шума 5 types of low noise valves and следует предусмотреть (Т1) grill plates will be foreseen. разные типы малошумящей арматуры и вентиляционных решеток Construction employs 15 full В конструкции применяются length tie bolts that 15 стяжных болтов, которые compress the discs <…> сжимают рабочие колеса <…> thereby forming a rigid rotor. образуя жесткий вал. Балл один и тот же (5), а серьёзность ошибок различная: в первом примере ошибка может привести к неверным действиям персонала , а во втором случае – нет
  • 24. Системы TQ-Metric в сравнении: количество действий для оценки ошибки АТА SAE J 2450 БП Окей 3 2 1-2* *Чем более формален классификатор, тем меньше действий требуется для оценки ошибки (экономия времени)
  • 25. Системы TQ-Metric в сравнении: Зачитываются ли ошибки, вызванные неустранимыми недостатками оригинала (отсутствие контекста, невразумительное и неграмотное изложение)? АТА SAE J 2450 БП Окей нет данных да нет Система БП Окей больше приспособлена к начальному тестированию команды, система SAE J 2450 – для выходного контроля
  • 26. Системы TQ-Metric в сравнении: Если проверяющий сталкивается с аналогичной ошибкой АТА SAE J 2450 БП Окей нет зачитывается При тестировании команды на проект данных каждый – если однотипная ошибка случай оформления повторяется по всему неверного тексту (использование точки вместо употребления запятой для отделения дробной части, употребление лишних заглавных букв в имени собственном и т.д.), она зачитывается один раз. При выходном контроле - зачитывается каждый случай неверного употребления
  • 27. Сравнение систем в действии Исходные данные • 3 тест-задания в разных тематиках: Энергетика (описание газовой турбины) Нефтепереработка (звукоизоляция оборудования) Юриспруденция (генеральное соглашение оказания услуг) • 5 кандидатов в каждой тематике • 3 системы проверки • 2 проверяющих РЕЗУЛЬТАТ: 90 заполненных форм оценки.
  • 28. Субъективность оценки Отношение между средним удельным баллом ошибок (по всем тематикам) после проверки разными людьми: EP(средн.)1-й чел. Kсубъектив. = EP(средн.)2-й чел. АТА SAE J 2450 БП Окей 1,5 1,0 1,0
  • 29. Субъективность оценки • Средний коэффициент по всем тематикам 1,0 у систем SAE J 2450 и БП Окей говорит о том, что субъективность оценки минимальна. Следовательно, перевод может проверять один человек, и затраты на проверку низкие. • Средний коэффициент по всем тематикам 1,5 у системы ATA (а по тематике «газовые турбины» вообще 2,0) говорит о высокой субъективности оценки. Следовательно, для получения достоверных результатов минимальное количество проверяющих равняется двум, что удваивает затраты на оценку качества.
  • 30. Распределение балла ошибок между тематиками (среднее по 2-м проверяющим) Рисунок Рисунок практически идентичен отличается
  • 31. Распределение среднего балла ошибок в разных системах • Рисунок распределения баллов по тематикам в системе АТА значительно отличается – за счет того, что фактический вес каждой ошибки не зависит от ограничений классификатора. Это повышает объективность оценки (с учетом проверки перевода двумя людьми).
  • 32. Строгость оценки Среднее превышение порогового значения Балл ошибок (средн.) – Пороговое знач. Kстрог. = Пороговое знач. АТА SAE J 2450 БП Окей 42% Строгость не 17% поддается подсчету, (относительно т.к. пороговое проходного балла значение не задано переводчика = 14)
  • 33. Строгость оценки • Требования АТА к качеству конечного текста выше, чем требования БП Окей к квалификации переводчика (макс. балл ошибок = 14 на 100 слов). • Исходя из того, что пороговое значение АТА является обоснованным, предположим, что строгость системы БП Окей в отношении качества конечного переводного текста должна равняться строгости АТА (т.е. = 42%). • Согласно формуле, выводим пороговое значение для конечного текста по системе БП Окей: 8,87 баллов на 100 слов, т.е. TQI = 91,1
  • 34. Средняя скорость оценки 1 тест-задания при условии тщательного предварительного изучения текста оригинала АТА SAE J 2450 БП Окей 13 минут 9,5 минут* 9 минут *По субъективным впечатлениям, система SAE J 2450 обладает самым быстрым в работе классификатором: колебания относительно класса ошибки возникают крайне редко.
  • 35. Выводы АТА SAE J 2450 БП Окей Область Без Жесткие Некоторые применения ограничений ограничения ограничения Стройность Высокая Средняя Низкая Конечная Высокая Средняя Средняя объективность Сложность Высокая Низкая Низкая внедрения Затраты Высокие Низкие Низкие