SlideShare a Scribd company logo
1 of 17
Лекция 9. Извлечение
знаний из НС
Что такое извлечение знаний (data mining)?
Задача извлечения знаний (data mining) – поиск неявных
закономерностей и взаимосвязей в совокупностях данных большого
объема.
Общая схема решения задачи извлечения знаний
Два типа задач data mining: разработка
приложений
Для нейронных сетей:
- обучение НС;
- использование НС в приложениях
Два типа задач data mining: поддержка
принятия решений
Для нейронных сетей:
- обучение НС;
- извлечение модели из НС;
- использование модели в приложениях
Построение модели в системах поддержки принятия решения
Подходы к извлечению знаний из НС
• анализ реакции НС;
• формирование логических правил функционирования НС;
• визуализация.
Алгоритм NeuroRule (Lu, Setiono, Liu, 1995)
Задача: классификация данных.
Метод: многослойный персептрон, построить
классификационные правила.
C={C1,C2,…,CN} – классы
A1,A2,…,AM – атрибуты.
F: A1,A2,…,AM –> C
Обучающая выборка: {(a1,a2,…,aM,ck)}
1. Обучение НС
2. Прореживание НС
3. Извлечение правил:
если (a1xq1), (a2,q2),…,(an,qn), то …
Обучение сети
Случай двух классов.
N входов, 2 выхода: (1,0); (0,1).
2 слоя: внутренний слой – гиперболический тангенс (-1,1),
выходной слой – сигмоида (0,1).
- выходные значения
Условие правильной классификации:
Функция ошибки:
Метод обучения: обратное распространение ошибки.
Прореживание НС
Полносвязанная сеть: (N+M)*H связей
Условие удаления связи wl
m
Удаление связи выходного слоя:
1. Обучить полносвязанную сеть;
2. Удалить связи, удовлетворяющие условиям;
3. Переобучить получившуюся сеть;
4. Если точность ниже заданного уровня, то выход
иначе перейти на шаг 2.
Дискретизация
Входы: правило градусника
Внутренние нейроны: кластеризация.
Алгоритм (для каждого нейрона):
1. Вычислить значения нейронов
для каждого входного вектора, сгруппировать по правилу:
2. Заменить значения нейронов на средние по
соответствующим кластерам
3. Проверить точность классификации
4. Если точность низкая, то уменьшить e и перейти на шаг 1
Извлечение правил
1. Построить правила для связей внутренний слой –> выходы
2. Выделить значения внутренних нейронов,
задействованные в построенных правилах.
3. Построить правила для связей входы –> внутренний слой
4. Объединить два множества правил посредством значений
нейронов внутреннего слоя.
Алгоритм TREPAN: идея
• Выделение правил => Построение правил,
аппроксимирующих известные данные;
• <Базовые данные> = <Обучающая выборка> +
<дополнительные данные>;
• Нейронная сеть - оракул – генератор дополнительных данных;
• Построение дерева решений.
Структура дерева
• Вершина:
- правило принятия решения;
- примеры, на которых строилась вершина;
- ограничения на значения параметров правил
• Очередь вершин
Схема алгоритма
Оракул
Задачи оракула
• классифицировать примеры из обучающей выборки;
• выбрать правила для вершин;
• идентифицировать листья.
Генерация дополнительных примеров
• Построить распределение значений параметров
• Определить ограничения на значения параметров в
данной вершине
• Сгенерировать примеры.
Правила в вершинах дерева
Правила m-of-n:
~
Построение правила:
• найти лучшее правило по одному параметру
• наращивать правило до m-of-n.
Критерий остановки
1. Оценка вероятности, что в вершине остались примеры
одного класса
2. Ограничение на количество внутренних вершин
Заключение
Достоинства
• независимость от архитектуры сети
• независимость от метода обучения
• масштабируемость
Недостатки
• отсутствие средств построения оптимального решения

More Related Content

Similar to Лекция 9

Нейронные сети. Pureso
Нейронные сети. PuresoНейронные сети. Pureso
Нейронные сети. PuresoAlexey Dmitriev
 
Презентация на семинаре Nvidia в ИТМО 16 мая 2017 г.
Презентация на семинаре Nvidia в ИТМО 16 мая 2017 г.Презентация на семинаре Nvidia в ИТМО 16 мая 2017 г.
Презентация на семинаре Nvidia в ИТМО 16 мая 2017 г.Andrey Sozykin
 
NUG_prezentatsia_o_neyronnykh_setyakh_24_02.pptx
NUG_prezentatsia_o_neyronnykh_setyakh_24_02.pptxNUG_prezentatsia_o_neyronnykh_setyakh_24_02.pptx
NUG_prezentatsia_o_neyronnykh_setyakh_24_02.pptxwhiskeycat17
 
Перечитывая Лео Бреймана
Перечитывая Лео БрейманаПеречитывая Лео Бреймана
Перечитывая Лео БрейманаSerge Terekhov
 
Deep Learning Course Introduction
Deep Learning Course IntroductionDeep Learning Course Introduction
Deep Learning Course IntroductionIhar Nestsiareania
 
Классификация изображений с помощью нейронных сетей. Сжатие и ускорение обуче...
Классификация изображений с помощью нейронных сетей. Сжатие и ускорение обуче...Классификация изображений с помощью нейронных сетей. Сжатие и ускорение обуче...
Классификация изображений с помощью нейронных сетей. Сжатие и ускорение обуче...Yandex
 
Лекция №1 Организация ЭВМ и систем
Лекция №1 Организация ЭВМ и системЛекция №1 Организация ЭВМ и систем
Лекция №1 Организация ЭВМ и системpianist2317
 
Нейросетевые технологии, нечёткая кластеризация и генетические алгоритмы в эк...
Нейросетевые технологии, нечёткая кластеризация и генетические алгоритмы в эк...Нейросетевые технологии, нечёткая кластеризация и генетические алгоритмы в эк...
Нейросетевые технологии, нечёткая кластеризация и генетические алгоритмы в эк...Natalia Polkovnikova
 
#АналитикаРешает - обзорная лекция про аналитику
#АналитикаРешает - обзорная лекция про аналитику#АналитикаРешает - обзорная лекция про аналитику
#АналитикаРешает - обзорная лекция про аналитикуKadimov Mansur
 
Hейронные сети на практике — R&D, Azoft
Hейронные сети на практике — R&D, AzoftHейронные сети на практике — R&D, Azoft
Hейронные сети на практике — R&D, AzoftAzoft
 
Сверточные нейронные сети
Сверточные нейронные сетиСверточные нейронные сети
Сверточные нейронные сетиIvan Kavalerov
 
Нейрокомпьютеры и нейросети
Нейрокомпьютеры и нейросетиНейрокомпьютеры и нейросети
Нейрокомпьютеры и нейросетиrefasw
 
284.прогноз ключевых параметров при помощи искусственных нейронных сетей
284.прогноз ключевых параметров при помощи искусственных нейронных сетей284.прогноз ключевых параметров при помощи искусственных нейронных сетей
284.прогноз ключевых параметров при помощи искусственных нейронных сетейivanov1566359955
 
Hub AI&BigData meetup / Дмитрий Сподарец: Введение в машинное обучение
Hub AI&BigData meetup / Дмитрий Сподарец: Введение в машинное обучениеHub AI&BigData meetup / Дмитрий Сподарец: Введение в машинное обучение
Hub AI&BigData meetup / Дмитрий Сподарец: Введение в машинное обучениеHub-IT-School
 
Анализ структуры магистральных электросетей методами теории сложных сетей
Анализ структуры магистральных электросетей  методами теории сложных сетейАнализ структуры магистральных электросетей  методами теории сложных сетей
Анализ структуры магистральных электросетей методами теории сложных сетейСергей Макрушин
 

Similar to Лекция 9 (20)

Нейронные сети. Pureso
Нейронные сети. PuresoНейронные сети. Pureso
Нейронные сети. Pureso
 
Презентация на семинаре Nvidia в ИТМО 16 мая 2017 г.
Презентация на семинаре Nvidia в ИТМО 16 мая 2017 г.Презентация на семинаре Nvidia в ИТМО 16 мая 2017 г.
Презентация на семинаре Nvidia в ИТМО 16 мая 2017 г.
 
NUG_prezentatsia_o_neyronnykh_setyakh_24_02.pptx
NUG_prezentatsia_o_neyronnykh_setyakh_24_02.pptxNUG_prezentatsia_o_neyronnykh_setyakh_24_02.pptx
NUG_prezentatsia_o_neyronnykh_setyakh_24_02.pptx
 
Нейросети
НейросетиНейросети
Нейросети
 
37359 (1).pptx
37359 (1).pptx37359 (1).pptx
37359 (1).pptx
 
Перечитывая Лео Бреймана
Перечитывая Лео БрейманаПеречитывая Лео Бреймана
Перечитывая Лео Бреймана
 
Deep Learning Course Introduction
Deep Learning Course IntroductionDeep Learning Course Introduction
Deep Learning Course Introduction
 
Классификация изображений с помощью нейронных сетей. Сжатие и ускорение обуче...
Классификация изображений с помощью нейронных сетей. Сжатие и ускорение обуче...Классификация изображений с помощью нейронных сетей. Сжатие и ускорение обуче...
Классификация изображений с помощью нейронных сетей. Сжатие и ускорение обуче...
 
Лекция №1 Организация ЭВМ и систем
Лекция №1 Организация ЭВМ и системЛекция №1 Организация ЭВМ и систем
Лекция №1 Организация ЭВМ и систем
 
Нейросетевые технологии, нечёткая кластеризация и генетические алгоритмы в эк...
Нейросетевые технологии, нечёткая кластеризация и генетические алгоритмы в эк...Нейросетевые технологии, нечёткая кластеризация и генетические алгоритмы в эк...
Нейросетевые технологии, нечёткая кластеризация и генетические алгоритмы в эк...
 
#АналитикаРешает - обзорная лекция про аналитику
#АналитикаРешает - обзорная лекция про аналитику#АналитикаРешает - обзорная лекция про аналитику
#АналитикаРешает - обзорная лекция про аналитику
 
Экспертная система по конструированию и моделированию швейных изделий
Экспертная система по конструированию и моделированию швейных изделийЭкспертная система по конструированию и моделированию швейных изделий
Экспертная система по конструированию и моделированию швейных изделий
 
0907.0229
0907.02290907.0229
0907.0229
 
Hейронные сети на практике — R&D, Azoft
Hейронные сети на практике — R&D, AzoftHейронные сети на практике — R&D, Azoft
Hейронные сети на практике — R&D, Azoft
 
Сверточные нейронные сети
Сверточные нейронные сетиСверточные нейронные сети
Сверточные нейронные сети
 
Нейрокомпьютеры и нейросети
Нейрокомпьютеры и нейросетиНейрокомпьютеры и нейросети
Нейрокомпьютеры и нейросети
 
лекция 32
лекция 32лекция 32
лекция 32
 
284.прогноз ключевых параметров при помощи искусственных нейронных сетей
284.прогноз ключевых параметров при помощи искусственных нейронных сетей284.прогноз ключевых параметров при помощи искусственных нейронных сетей
284.прогноз ключевых параметров при помощи искусственных нейронных сетей
 
Hub AI&BigData meetup / Дмитрий Сподарец: Введение в машинное обучение
Hub AI&BigData meetup / Дмитрий Сподарец: Введение в машинное обучениеHub AI&BigData meetup / Дмитрий Сподарец: Введение в машинное обучение
Hub AI&BigData meetup / Дмитрий Сподарец: Введение в машинное обучение
 
Анализ структуры магистральных электросетей методами теории сложных сетей
Анализ структуры магистральных электросетей  методами теории сложных сетейАнализ структуры магистральных электросетей  методами теории сложных сетей
Анализ структуры магистральных электросетей методами теории сложных сетей
 

More from Ivan Stolyarov

More from Ivan Stolyarov (6)

Лекция 8
Лекция 8Лекция 8
Лекция 8
 
Лекция 6
Лекция 6Лекция 6
Лекция 6
 
Лекция 5
Лекция 5Лекция 5
Лекция 5
 
Лекция 4
Лекция 4Лекция 4
Лекция 4
 
Лекция 3
Лекция 3Лекция 3
Лекция 3
 
Лекция 2
Лекция 2Лекция 2
Лекция 2
 

Лекция 9

  • 2. Что такое извлечение знаний (data mining)? Задача извлечения знаний (data mining) – поиск неявных закономерностей и взаимосвязей в совокупностях данных большого объема. Общая схема решения задачи извлечения знаний
  • 3. Два типа задач data mining: разработка приложений Для нейронных сетей: - обучение НС; - использование НС в приложениях
  • 4. Два типа задач data mining: поддержка принятия решений Для нейронных сетей: - обучение НС; - извлечение модели из НС; - использование модели в приложениях Построение модели в системах поддержки принятия решения
  • 5. Подходы к извлечению знаний из НС • анализ реакции НС; • формирование логических правил функционирования НС; • визуализация.
  • 6. Алгоритм NeuroRule (Lu, Setiono, Liu, 1995) Задача: классификация данных. Метод: многослойный персептрон, построить классификационные правила. C={C1,C2,…,CN} – классы A1,A2,…,AM – атрибуты. F: A1,A2,…,AM –> C Обучающая выборка: {(a1,a2,…,aM,ck)} 1. Обучение НС 2. Прореживание НС 3. Извлечение правил: если (a1xq1), (a2,q2),…,(an,qn), то …
  • 7. Обучение сети Случай двух классов. N входов, 2 выхода: (1,0); (0,1). 2 слоя: внутренний слой – гиперболический тангенс (-1,1), выходной слой – сигмоида (0,1). - выходные значения Условие правильной классификации: Функция ошибки: Метод обучения: обратное распространение ошибки.
  • 8. Прореживание НС Полносвязанная сеть: (N+M)*H связей Условие удаления связи wl m Удаление связи выходного слоя: 1. Обучить полносвязанную сеть; 2. Удалить связи, удовлетворяющие условиям; 3. Переобучить получившуюся сеть; 4. Если точность ниже заданного уровня, то выход иначе перейти на шаг 2.
  • 9. Дискретизация Входы: правило градусника Внутренние нейроны: кластеризация. Алгоритм (для каждого нейрона): 1. Вычислить значения нейронов для каждого входного вектора, сгруппировать по правилу: 2. Заменить значения нейронов на средние по соответствующим кластерам 3. Проверить точность классификации 4. Если точность низкая, то уменьшить e и перейти на шаг 1
  • 10. Извлечение правил 1. Построить правила для связей внутренний слой –> выходы 2. Выделить значения внутренних нейронов, задействованные в построенных правилах. 3. Построить правила для связей входы –> внутренний слой 4. Объединить два множества правил посредством значений нейронов внутреннего слоя.
  • 11. Алгоритм TREPAN: идея • Выделение правил => Построение правил, аппроксимирующих известные данные; • <Базовые данные> = <Обучающая выборка> + <дополнительные данные>; • Нейронная сеть - оракул – генератор дополнительных данных; • Построение дерева решений.
  • 12. Структура дерева • Вершина: - правило принятия решения; - примеры, на которых строилась вершина; - ограничения на значения параметров правил • Очередь вершин
  • 14. Оракул Задачи оракула • классифицировать примеры из обучающей выборки; • выбрать правила для вершин; • идентифицировать листья. Генерация дополнительных примеров • Построить распределение значений параметров • Определить ограничения на значения параметров в данной вершине • Сгенерировать примеры.
  • 15. Правила в вершинах дерева Правила m-of-n: ~ Построение правила: • найти лучшее правило по одному параметру • наращивать правило до m-of-n.
  • 16. Критерий остановки 1. Оценка вероятности, что в вершине остались примеры одного класса 2. Ограничение на количество внутренних вершин
  • 17. Заключение Достоинства • независимость от архитектуры сети • независимость от метода обучения • масштабируемость Недостатки • отсутствие средств построения оптимального решения

Editor's Notes

  1. 1. Причины возникновения. 2. Неформальное определение. 3. Средства запросов, OLAP (online analytical processing), three-dimensional views of data. 4. Принципиальное отличие data mining. 5. Эффективность = прибыль/затраты на data mining
  2. Обучение как метод построения приложений (поиск и реализация моделей данных); генетическое программирование Сравнить с общепринятыми методами: программирование Что это значит применительно к НС Построенный алгоритм не должен быть эффективнее того, который написан вручную, ведь главное, что он получен автоматически.
  3. Два способа поддержки принятия решения: облегчение восприятия информации (визуализация и т.п.); автоматизированное принятие решений Как это касается НС.