Назначает наибольшую вероятность парам предложений с одним значением
Вычисляется по двуязычному корпусу
Анализ текстов
В корне дерева время
По дереву – в прошлое и будущее
Свойства и атрибуты объектов
Связи объектов
Выявление центрального объекта (саммаризация)
Анафорические ссылки
Структура семантики текста
Дерево текста
В корне – время (в предложении – гл.)
Вниз по дереву – в будущее
Вверху по дереву – в прошлое
Кадры текста
Портрет объектов
Портрет объекта
Объект
Уточняющие прилагательные
Уточняющие существительные
Действия (гл)
Время
Связи с другими объектами
Связи между объектами
Стол находится в комнате Ивана.
находится (@Им Стол @Где в (@Пред комнате (@Род Ивана))).
1. Объекты отношений:
НАХОДИТЬСЯ Loc(Z1,МЕСТО:Z2)
Z1:@ОНЪ$17 => СТОЛ $121344
Z2:$1~@Где => В КОМНАТА $123314
Связи между объектами 2
2. Конкретизация объекта
КОМНАТА$123314 (Z1) , Z1 - атрибут
Z1:@Род => ИВАН $1241301000 (значение атрибута)
Аппарат: СГТ, Предложно-падежн. Формы и базисные функции
Синтез предложений
Алгоритм линеаризации
Статистическое упорядочивание
Демо
Алгоритм Линеаризации
На входе: семантическое дерево
На выходе: предложение на естественном языке
Линеаризация (И. Мельчук) – иерархический процесс синтеза предложения по его семантическому дереву, при котором отдельные слова образуют корректные семантические и синтаксические группы, а группы формируют предложение
Иерархическая линеаризация
Мельчук (слабые и сильные связи)
Слово определяет строгий порядок группы слов
Слова соединяются в группы (деепр. обороты)
Слова не вляют на взаимный порядок
Семантическое дерево
STL-like tree
Перенос поддеревьев
Сложные предложения ( Я постучал, и Петя открыл дверь )
Slides I have had when pre-defending my PhD dissert more
Slides I have had when pre-defending my PhD dissertation last week. Includes some minor errata, which in general should distract from understanding (or not understanding) the topic. less
0 comments
Post a comment