построение и анализ компьютерной модели семантической сети экономических терминов
1. Выпускная квалификационная работа на тему:
«Построение и анализ компьютерной модели
семантической сети экономических терминов»
Исполнитель:
Студент группы ПИ4-4 Федоров С.Н.
Руководитель работы:
к.э.н. Макрушин С.В.
ФИНАНСОВЫЙ УНИВЕРСИТЕТ
ПРИ ПРАВИТЕЛЬСТВЕ
РОССИЙСКОЙ ФЕДЕРАЦИИ
Кафедра «Прикладная информатика»
Москва – 2016
2. 3
Введение
Семантика — раздел лингвистики, изучающий смысловое
значение единиц языка.
Онтология — это попытка всеобъемлющей и подробной
формализации некоторой области знаний с помощью
концептуальной схемы.
Семантическая сеть — модель предметной области,
представленная в виде графа, вершинами которого
являются понятия, а дуги (ребра) – отношения между
ними.
3. 2
Описание работы
Объект исследования: семантическая сеть экономических терминов
Цель работы
Разработка технологии построения модели семантической сети экономических
терминов
Структура работы
Подготовка
исходных
данных
Выбор
инструментария
моделирования
Построение модели
семантической сети
экономических
терминов
Оценка
параметров
модели
Перспективы
применения
модели
5. 5
Подготовка исходных данных
«Современный экономический
словарь»
Райзберг Б.А., Лозовский Л.Ш.,
Стародубцева Е.Б.
Обработка словаря
макросами Visual
Basic
В результате получен список терминов
исходного словаря в пригодном для
моделирования формате:
…
абсолютная ответственность
абсолютное право
авалирование
авалист
аванс
авансирование
… Список экономических
терминов
6. 6
Построение сети экономических терминов
Wikipedia
Список экономических
терминов
Сеть экономических
терминов в Python
NetworkX
Извлечение связей
терминов из Википедии
7. 7
Выявление сообществ методами
Теории сложных сетей
88 815 узлов
288 340 ребер
График распределения сообществ
Визуализация сообществ сети
Сообщества имеют различную плотность
Модулярность - разность между долей ребер
внутри сообщества и ожидаемой доли связей, если
бы ребра были размещены случайно.
51 сообщество
8. 8
Пример сообщества
Выявление центральных узлов
Визуальное отображение
выбранного сообщества
2 322 узлов (2,61%)
19 550 ребер
Выбранное сообщество
объединяет термины
правовой тематики
9. 9
Технология построения семантической
сети на основе сети терминов
Генерация пространства имен онтологии
Запись в файл онтологии
Создание онтологии при помощи
добавления разметки к сети терминов
(необходимо привлечение эксперта)
10. 10
Перспективы применения модели
Шаг к созданию полномасштабной русскоязычной
экономической онтологии
Возможность реализации с привлечением большого
количества экспертов предметной области
Возможность использования полученных результатов для
автоматической классификации текстов
11. 11
Заключение
Результаты работы
Собраны и подготовлены исходные данные
Построена модель сети экономических терминов
Разработана технология построения компьютерной модели
семантической сети экономических терминов
Построена модель семантической сети экономических терминов
Проведен анализ сети методами Теории сложных сетей
Разработана технология обработки сети с
привлечением экспертов в области экономики
Рассмотрены возможности применения модели