Программные средства поддержки словаря буквенных и морфемных паронимов
1. Дипломная работа
ПРОГРАММНЫЕ СРЕДСТВА
ПОДДЕРЖКИ СЛОВАРЯ
БУКВЕННЫХ И МОРФЕМНЫХ
ПАРОНИМОВ
Автор:
Белова Татьяна Сергеевна
Научный руководитель:
к.ф.-м.н. доцент Большакова Е.И.
2. Понятие паронима
• Паронимы – это близкие по произношению,
но разные по значению слова
адресат – адресант, песочный - песчаный
• Различие слов может быть формально
измерено в
– звуках исламский – исландский 1 звук
– буквах калинка – калитка 1 буква
– морфах одеть – надеть 1 морф
3. Подходы к построению
компьютерных словарей паронимов
1. Словарь паронимов «КОНТЕКСТ»
• в основе – текстовый словарь паронимов
• небольшой объем
2. Электронный словарь паронимов
В. Гусева и Н. Саломатиной
• автоматический подход
• слишком узкое понимание паронимов
3. Словарь паронимов для задачи исправления
паронимических ошибок (И. Большаков)
• буквенные и морфемные паронимы
• текстовые файлы
4. Постановка задачи
• Разработать и реализовать словарь
буквенных и морфемных паронимов
русского языка, позволяющий:
– загружать готовые лингвистические данные
– автоматически пополнять базу паронимов
– отразить наиболее общее понимание
паронимов, уточняемое настройкой
параметров
• Предоставить прикладной и
пользовательский интерфейсы для
работы со словарем
5. Формализация понятия
паронима
• Сформулированы определения паронимов
(в основе – понятие редакционного расстояния)
Буквенными паронимами на расстоянии d
называются слова, находящиеся на
редакционном расстоянии в буквах, равном d.
Морфемными паронимами на расстоянии d
называются слова, находящиеся на
редакционном расстоянии в морфах, равном d.
• Определен набор параметров, позволяющих
варьировать строгость определений
8. Алгоритм составления
словаря
• Загрузка исходных данных
– Фильтрация, анализ
– Добавление данных в словарь
• Автоматическое пополнение словаря
– Поиск пар паронимов
– Подсчет параметров
– Добавление информации в словарь в
компактном виде
Особенности:
• Расширяемость словарной базы
• Настраиваемые параметры составления
словаря
9. Поиск паронимов
для заданного слова
Параметры:
– максимальное редакционное расстояние
– степень искажения
– совпадение части речи, рода, числа
– различия в конкретных типах морфов
– учет чередующихся корней
– работа с произвольными словоформами
Результат:
– буквенные и морфемные паронимы
– морфемный состав
– грамматические характеристики
11. Результаты работы
Произведен анализ прикладных задач и
существующих словарей паронимов
Разработана реляционная модель
хранения данных
Реализован комплекс программных
средств, отвечающий предъявленным
требованиям
Протестировано заполнение словаря на
основе разных исходных файлов
большого объема