Datamining – что это?

297 views

Published on

  • Be the first to comment

  • Be the first to like this

Datamining – что это?

  1. 1. Datamining – что это? Сергей Орешков Аспирант БФУ им. И. Канта
  2. 2. Немного истории
  3. 3. Первый жесткий диск
  4. 4. ДатамайнингKnowledge Discovery in Databases• Математическая статистика• Алгоритмы машинного обучения• Большие объемы данных
  5. 5. Применения датамайнинга:• Бизнес• Наука(CERN, например)• Медицина• Системы поддержки принятия решений• Еще много разных применений…
  6. 6. Бизнес применение• Любой современный бизнес порождает огромное количество информации, содержащей в себе знания• Если информацию правильно обработать или даже просто представить, можно узнать о своей компании много крайне интересных вещей и даже принять какие-то важные решения
  7. 7. Научное применениеТам, где проводят эксперименты, всегда много данных,которые надо обработать и слишком мало людей, которыеразбираются в данных.
  8. 8. Процесс датамайнинга• Выбор данных• Препроцессинг(подготовка данных)• Датамайнинг• Проверка• Интерпретация/использование
  9. 9. Виды датамайнингаВиды задач, которые обычно связывают с понятиямидатамайнинга и KDD: • Выявление аномалий. • Поиск внутренних зависимостей. • Кластеризация. • Классификация. • Статистика, OLAP.
  10. 10. Выявление аномалийНахождение необычных записей - ошибок, чего-тонеобычного, того, что может потребовать расследования.
  11. 11. Поиск внутренних зависимостейВероятностый анализ данных и нахождение корреляций.
  12. 12. КластеризацияРазбиение набора данных на группы
  13. 13. КлассификацияОпределение принадлежности новых данных по ужеимеющимся.
  14. 14. Пример удачнойклассификации
  15. 15. Пример не очень удачнойклассификации

×