1. Системы принятия решений
СЦ с элементами ИИ и
извлечения знаний из
текстов на естественном
языке
ФГАНУ «Центр информационных технологий и систем
органов исполнительной власти – ЦИТиС»
Бетин В.Н., к.т.н, ведущий научный сотрудник
E-mail: betin_v@mail.ru
1
2. Цель и задачи
Цель
Создать качественно новый СЦ,
способный автоматически находить
ответы на непредсказуемые вопросы
Для этого нужно
• 1. Создать программную компоненту,
реализующую аналитические
способности интеллекта
• 2. Разработать программные средства
пополнения БЗ по текстам на
неадаптированном естественном языке
2
3. 1. Создание компоненты,
реализующей аналитические
способности интеллекта
Мозг управляет действиями - операциями, который сознательно и
бессознательно выполняет наш организм.
Интеллект - это механизм адаптации, в основе которого лежит способность
оценить последствия своих и чужих действий без выполнения этих
действий.
А адаптация есть не что иное, как ИЗОБРЕТЕНИЕ СХЕМЫ ВЫПОЛНЕНИЯ
ДЕЙСТВИЙ (своих и чужих) в пространстве и времени, направленной на
изменение среды обитания и самого субъекта в нужную ему сторону.
МОЗГ ЗАНЯТ ИССЛЕДОВАНИЕМ ОПЕРАЦИЙ
3
4. Структура типовой операции
Вх. объект X_1 [ t ] Вых. объект Y_1 [ t+d ]
Преобразование
F (X) -> Y
Вх. объект X_n [ t ] Вых. объект Y_m [ t+d ]
Субъект, выполняющий преобразование
Каждая операция определяет отношение причины и следствия - объекты
на выходе могут быть получены из объектов на входе вследствие
выполнения операции
Поставим в соответствие объектам, участвующим в преобразованиях,
состояние S
S = «есть», если объект относится к ресурсам либо достижим;
S= «нужно», если объект относится целям или промежуточным целям;
S = «?» (неопределенное значение), если у субъекта пока нет данных;
S = «решение», если объект достижим и является целью
4
5. Сеть функциональных нейронов
Задача – это пара (ресурс, цель)
(ФН-сеть)
Решить задачу – это значит найти схему выполнения операций,
трансформирующих ресурсы в цель
ФН-сеть – это представление множества суперпозиций операций (архив
условных рефлексов)
Механизм распространения волн «есть»/«нужно» позволяет выделить из ФН-
сети искомую суперпозицию операций, решающую проблему пользователя (при
условии, что она там есть)
число:"y",
число:"e"
s="нужно "
s=?
+
+
число:"a*x+b*x"
s=? число:"с"
s="есть"
число:"t"
s=есть
+
число:"q" число:"a*x" число: "b*x"
s=? s=? s=?
- X X
число:"x", число:"b",
число:"w" число:"a", s="есть"
s=? s="есть" s="есть"
ФН-сеть для описания задачи вычисления y=a×x+b×x+c (y – нужно, a, b, c, x – есть) 5
6. Трансформация ФН-сети (1)
число:"d", s="есть"
+
"d","есть"
число:"a*x+b*x",s=?
число:"с",s=" есть"
'+':add_2
Логическая переменная:
+ "true", s="есть"
"с","есть" L,"истина","есть"
число:"a*x", s=? число: "b*x", s=? ≠ "a*x+b*x",?
× × число: "a+b", s='?' число: "0", s="есть"
Подстановка #
'+':add_1
+ "0","есть"
число:"a", число:"x", число:"b",
'*':mult_3
s="есть" s="нужно " s="есть"
"a*x",? "b*x",?
ФН-сеть, описывающая задачу '*':mult_1 '*':mult_2 "a+b", ?
a×x+b×x+c=d, (a+b)≠0
'+':add_3
a ×d +b×d ( a + b) × d
Число r
"a","есть" "x","нужно" "b","есть"
+ x
F1
(a × d ) (b × d ) (a + b ) a ×x +b ×x F1:g
( a + b) × x
F2
X X +
Число a Число b Число d
6
Рис. 4 Пример представления классов в БЗ . Они определяют преобразования
G1 : a × d + b × d → ( a + b) × d и G 2 : ( a + b) × d → a × d + b × d
7. Трансформация ФН-сети (2)
Число: B
'+' '-'
Это преобразование добавлено
на третьем шаге расширения
(Подстановка F3) "d","решение"
Это преобразование
Число: A Число: X добавлено на втором
шаге расширения
" b − a = x" '+':add_2 (подстановка F5)
'-':sub_1
" a + x = b"
"с","решение"
F3: "a*x+b*x", решение
" a + x = b → b − a = x"
ТМ добавлен
F4: '/':div_1
после первого '*':mult_3
" b − a = x → a + x = b" расширения
,
ФН-сеть описывающая обратимость "x","решение" "a+b","решение"
операций сложения и вычитания
" b / a = x" Фрагмент сцены с добавленными связями
" a × x = b"
на 2-й и 3-й итерациях
Число: B Число: X
F5:
" a × x = b → b / a = x"
bool:" true",есть
Операция '*''
Операция '/''
Операция ≠ F6:
" b / a = x → a × x = b"
Число: B Число: A
Число: X Число: A Число:" 0"
ФН-сеть, описывающая обратимость
операций умножения и деления 7
8. Двухуровневый автомат поиска решения
Анализ условий окончания
процесса поиска решения
Решение найдено
Обратная волна ( Zr не содержит
r
h (Y )
f k элементов в
состоянии "нужно")
“Или” “Не”
Возможности поиска
Текущее исчерпаны
состояние ( Z r ≡ Z r + 1)
задачи
Zr Продолжать/Завершить
Расширение Текущее
Прямая волна
нейронной сети состояние
r
e f (X n ) Z r + 1 = Ψ ({G}, Z r )
задачи
Преобразования нижнего уровня
(они не меняют структуру База знаний { G } Z r +1
нейронной сети Zr )
нижний уровень – распространение волн
«есть»/«нужно» по ФН-сети
верхний уровень – расширение исходной ФН-сети за
счет подстановок сцен из базы знаний
8
9. Средства формирования базы знаний
Каталог Выбрать Заявка
товар
Счет
Оформить
счет
Накладная
Оплатить
Деньги
Продавец
Товар
Выдать
Товары товар
Покупатель
Кладовщик
из IDEF0 – функциональное представление
и структурная декомпозиция
из UML – классы, объекты и отношения
9
10. Единая форма представления знаний
• информационное представление некоторого объекта g – это кортеж, задающий
его реляционную модель:
<G , g , {( P, p )} >
информационное представление операции f это кортеж:
< F , f , {( X , x)},{(Y , y )} >
• единая форма представления в виде параметризированного
двухполюсника, задающего преобразование сцен:
< G, g , {( P, p)}, {( X , x)},{(Y , y )}, {R} >
На множестве классов определено отношение наследования:
- наследник содержат все параметры предка R;
- наследник может выполнять все операции, которые может выполнять R;
- если объект класса R служит параметром для класса A, то в качестве
значения этого параметра может использоваться и объект класса G;
- если некоторая операция применима к объекту класса R, то она также
применима и к объектам класса G;
- если объект класса G может быть получен в результате выполнения
операции, то и объект класса R может быть получен с помощью той же 10
операции.
11. Пример использования
Прирост
Вырастить Биокорм
+ Прирост форели
exp(-(t-Tp)**2) U Вырастить exp(-(t-Tr)**2) p*Pk
Расход Биокорм
Биокорм
-a*Rk Отловленная +
Пруд форель -v*Rk
0 0 Br
< Bp <
Тепло Q Температура t
/
Выловить
Объем V
Съесть Форель
сыта Рыбовод
Форель
Исходный технологический процесс прудового производства рыбы
Вопросы:
- что будет, если ловить больше рыбы?
- что нужно сделать, если это невозможно? 11
12. Результат решения задачи 1
(реализация логических способностей интеллекта)
1. Определена функциональность 2-х уровневого автомата поиска
решения, обеспечивающая механизм автоматического поиска
аналитических решений
2. Выявлена единая структура данных для классов объектов и
операций, описывающая знания из произвольных предметных
областей.
3. Создан графический язык расширенных IDEF-диаграмм для
представления как математических выражений, так и сцен из
произвольных предметных областей, существующих в виде
словесных описаний
12
13. Механизм преобразования и текста в
непротиворечивую семантическую модель (задача 2)
Исходный текст (предложение) -
последовательность слов <Ai>
Морфологический разбор
Последовательность векторов лексем
W1 W1 W1
W2 W2 W2
*** *** ***
Wn Wn Wn Грамматические правила
с шаблоном сцены
Синтаксический разбор
Семантический разбор
Модуль формирования сцен
Прагматический анализ
Множество Деревьев
разбора
Множество
Непротиворечивых сцен
13
14. Понимание текста
(речи)
Грамматическое правило в виде графа Шаблон сцены
Запятая
Запятая #G
#O1
Инф. #O
Инф=#A Обстоятельство Запятая #O2
Cуществ. Инф #G
#A:
Им.падеж Сказуемое Точка
#P
Вид=несоверш
Инф. #D
Инф #P Дополнение
Определение #D
Cущ
Вин.падеж
#P
Инф #R
Определение
«Большой Вася делает обед в котелке.»,
Котелок
«Большой Вася в котелке делает обед.» Делать
Котелке
В Вася
Обед Большой
Большой Вася Делать
Обед Обед
T Tnext
Большой Вася В Котелке Делать
Обед
T Tnext
Делать
Обед
Котелок: Одежда:
Шляпа материал Паре (объект=Вася,
Одеть: параметр=Одетый)
Результат Вася соответствует сцена, в
Вася Сделать
Материал T* которой описывается,
Одетый что котелок находится
Большой сверху на голове, а
Субъект=? Котелок: голова является
T* <= T частью Васи
Большой
14
15. Выводы
1. Структуры данных в виде ФН-сетей одинаково подходят, как для
представления формул, так и для функционального описания “плохо
формализуемых" произвольных предметных областей.
2. Двух уровневый автомат трансформации ФН-сетей позволяет находить
аналитическое решение проблемы в виде схемы выполнения
операций, преобразующей исходную ситуацию (ресурсы) в желаемую
ситуацию (цель).
3. Семантическое представление в виде ФН-сетей в базе знаний не
используют никаких дополнительных лингвистических знаний и может
быть получено средствами графического редактора,
поддерживающего расширенные IDEF0-диаграммы.
4. Предложенная схема представления грамматических правил в сочетании
с автоматом поиска решения позволяет формировать базы знаний из
неадаптированных текстов на естественном языке.
15
16. • Бетин В.Н., Лукьянов С.Э., Супрун А.П.
Выделение знаний из текстов на
естественном языке в интеллектуальной
аналитической системе //Информация и
связь, 2011 №6 стр.51-54
E-mail: Betin_V@mail.ru
16