В конце апреля на конференции «Российские интернет-технологии» (РИТ++/2011) компания PROMT представила доклад о своей новой разработке в области машинного перевода.
Гибридная технология PROMT совмещает в себе метод машинного перевода, основанный на правилах (его сейчас используют разнообразные решения PROMT и онлайн-сервис компании Translate.Ru), и статистический метод.
Это позволяет сохранить основное преимущество традиционной технологии PROMT – создание связного и грамматически правильного перевода – и прибавить к нему сильные стороны статистического метода – быстрое добавление терминологии из двуязычного текста и обеспечение гладкости получаемого текста.
Лингвистические свойства переводов (на материале RusLTC)Maria Kunilovskaya
Общая характеристика корпуса студенческих переводов и некоторые результаты сравнительного изучения студенческих и профессиональных переводов с английского на фоне непереводного русскоязычного текста
Рассмотрены проблемы пополнения компьютерного семантического словаря новыми словами, встреченными в тексте при его анализе. Предлагаемая для этого система работает в полуавтоматическом диалоговом режиме. На первом этапе определяются морфологические характеристики нового слова, на втором – его синтактико-семантические параметры по аналогам, имеющимся в существующем словаре. Предлагаемые подходы обеспечивают высокий уровень точности. Впервые появилась возможность указания точной семантики новых слов с учетом не только семантических классов, но и аргументов, обеспечивающих связь с подсоединяемыми словами.
Программные средства выявления теминологических вариантов в текстах
1. ПРОГРАММНЫЕ СРЕДСТВА ВЫЯВЛЕНИЯ ТЕРМИНОЛОГИЧЕСКИХ ВАРИАНТОВ В ТЕКСТАХ Антонов Вадим Юрьевич Научный руководитель: Ефремова Наталья Эрнестовна Дипломная работа
2.
3.
4.
5.
6.
7.
8.
9.
10. ПРОГРАММНЫЕ СРЕДСТВА: АРХИТЕКТУРА Компонент выявления терминологических вариантов Консольные утилиты Компонент выявления терминов шаблоны текст шаблоны словари L 1 и L 2 L 1 и L 2 варианты
11.
12.
13.
14.
Editor's Notes
NG2 называется флективным вариантом NG1, если NG2 может быть получено из NG1 вследствие согласованного склонения/спряжения слов, входящих в состав NG1; т.е. NG1 и NG2 отличаются друг от друга окончаниями (флексиями) некоторых (или всех) слов. NG2 называется орфографическим вариантом NG1, если NG2 может быть получено из NG1 путем изменения символьного состава одного из его слов, а именно: добавлением либо удалением одного символа ( языковозависимая система – языково - зависимая система ); заменой одного символа на другой ( IP - адрес – IP адрес , бр а узер – бр о узер ). NG2 называется морфовариантом NG1, если NG2 может быть получено из NG1 путем изменения морфемного состав одного из слов NG1; часть речи этого слова не меняется. Возможны следующие случаи: замена в NG1 одного служебного аффикса (приставки, суффикса) на другой ( классифи кация – классифи цирование , вы полнение – ис полнение ); замена одного корня-морфа сложного слова на другой, синонимичный в данном контексте ( спец символ – спец знак ); отбрасывание части сложносоставного слова ( кэш -память – кэш ). NG2 называется лексико-синтаксическим вариантом NG1, если NG2 может быть получено из NG1 в результате изменения лексического состава NG1; при этом возможны: вставка или отбрасывание слова или словосочетания ( восходящий процесс порождения элементов решетки – восходящий процесс ); замена в NG1 одного слова/словосочетания на другое близкое семантически в данной проблемной области и выступающее как его контекстный синоним ( динамичность информационной модели – динамичность информационной структуры ); замена слова на однокоренное другой части речи с одновременным изменением синтаксических связей словосочетания ( текстовая коллекция – коллекция текстов ).
лексико-синтаксические шаблоны - шаблоны, позволяющие фиксировать лексический состав и синтаксические связи формализуемых языковых конструкций