1. Облачные базы данных.
Методы АИД: деревья
решений.
Задачи АИД: прогнозирование.
ПО анализа данных: Qlik.
Выполнила:
Лабецкая В.
УИР 451
2. Разделы презентации
Облачные базы данных
Методы интеллектуального
анализа: деревья решений
Задачи интеллектуального анализа:
прогнозирование
ПО анализа данных: Qlik
3. • Облачное хранилище данных — модель онлайн-хранилища,
в котором данные хранятся на многочисленных,
распределённых в сети серверах, предоставляемых в
пользование клиентам, в основном третьей стороной.
• В противовес модели хранения данных на собственных,
выделенных серверах, приобретаемых или арендуемых
специально для подобных целей, количество или какая-либо
внутренняя структура серверов клиенту, в общем случае, не
видна.
• Данные хранятся, а равно и обрабатываются, в так
называемом облаке, которое представляет собой, с точки
зрения клиента, один большой, виртуальный сервер.
Облачные хранилища данных.
1. Облачные базы данных
4. • Файлы хранятся бесплатно, но у каждого сервиса это хранение
ограничено местом и условиями использования.
• Клиент платит только за то место в хранилище, которое фактически
использует, но не за аренду сервера, все ресурсы которого он может
и не использовать.
• Клиенту не нужно заниматься приобретением, поддержкой и
обслуживанием собственной инфраструктуры по хранению данных,
что, в конечном счете, уменьшает общие издержки производства.
• Все процедуры по резервированию и сохранению целостности
данных производятся провайдером облачного центра, который не
вовлекает в этот процесс клиента.
• Облачное хранилище подходит, практически, под все
операционные системы, как ПК, так и мобильных.
• Доступ и синхронизация файлов облака с файлами операционной
системы зависит от самого клиента облака (при выборе облака
нужно обращать внимание на готовность облака к десктопному
клиенту).
Преимущества облачных
хранилищ данных
5. • Облачные шлюзы — технология, которая может
быть использована для более удобного
представления облака клиенту.
• Удобства использования облачных хранилищ
данных велико, так как помимо хранения
данных, еще один плюс облачных сервисов – это
безболезненная пересылка больших файлов,
которые иначе долго и нудно пришлось бы
отправлять по электронной почте.
Десктопный клиент
(облачный шлюз): что это?
6. Определить цели и условия:
• скорость загрузки и выгрузки файла;
• удобное и красивое оформление приложения. Разработчики кросс
платформенных сервисов редко заботятся о таких мелочах и в
большинстве случаев мы получаем клиентское приложение на Java;
• сервис должен быть надежным и конфиденциальным;
• функциональность работы с файлами. В идеале нужно смотреть на
онлайн хранилище файлов с возможностью монтирования его в
виде локального диска с кэшированием;
• бесплатный объем данного «облака», стоимость платного места,
способы получения дополнительного бесплатного места;
• наличие выборочная синхронизация и/или фильтры и нормальная
поддержка всех типов файлов и атрибутов. Не нужно загружать
результаты компиляции программ в папке с проектами;
• нормально реализованное шифрование на клиентской стороне это
несомненный плюс, но не критичный, шифровать можно и
встроенными в систему средствами.
Как выбрать облачное
хранилище?
8. • Интеллектуальный анализ данных ― это не только
используемые инструменты или программное
обеспечение баз данных. Интеллектуальный анализ
данных можно выполнить с относительно скромными
системами баз данных и простыми инструментами,
включая создание своих собственных, или с
использованием готовых пакетов программного
обеспечения.
• Сложный интеллектуальный анализ данных опирается
на прошлый опыт и алгоритмы, определенные с
помощью существующего программного обеспечения и
пакетов, причем с различными методами ассоциируются
разные специализированные инструменты.
2. Методы интеллектуального
анализа: деревья решений
9. • Деревья решений используются в повседневной жизни в
самых разных областях человеческой деятельности,
порой и очень далеких от машинного обучения.
Деревом решений можно назвать наглядную
инструкцию, что делать в какой ситуации.
• Деревья решения являются одним из наиболее
популярных подходов к решению задач Data Mining. Они
создают иерархическую структуру классифицирующих
правил типа "ЕСЛИ... ТО..." (if-then), имеющую вид
дерева.
Деревья решений
10. • Дерево решений, связанное с большинством других
методов (классификации и прогнозирования), можно
использовать либо в рамках критериев отбора, либо для
поддержки выбора определенных данных в рамках
общей структуры.
• Дерево решений начинают с простого вопроса, который
имеет два ответа (иногда больше). Каждый ответ
приводит к следующему вопросу, помогая
классифицировать и идентифицировать данные или
делать прогнозы.
Деревья решений: применение
13. • Описание данных: «деревья решений» позволяют хранить
информацию о данных в компактной форме, вместо них мы
можем хранить дерево решений, которое содержит точное
описание объектов;
• Классификация: «деревья решений» отлично справляются с
задачами классификации, т.е. отнесения объектов к одному
из заранее известных классов. Целевая переменная должна
иметь дискретные значения;
• Регрессия: если целевая переменная имеет непрерывные
значения, «деревья решений» позволяют установить
зависимость целевой переменной от независимых (входных)
переменных. Например, к этому классу относятся задачи
численного прогнозирования (предсказания значений
целевой переменной).
Задачи, решаемые с помощью
«деревьев решений»
14. • Интуитивность деревьев решений ;
• Возможность извлекать правила из базы
данных на естественном языке ;
• Не требует от пользователя выбора
входных атрибутов ;
• Точность моделей ;
• Разработан ряд масштабируемых
алгоритмов;
• Быстрый процесс обучения ;
• Обработка пропущенных значений ;
• Работа и с числовыми, и с
категориальными типами данных .
Основные достоинства
15. • В банковском деле при оценке кредитоспособности
клиентов банка при выдаче кредитов;
• В промышленности осуществляя контроль за качеством
продукции (выявление дефектов), испытаниях без
разрушений (например, проверка качества сварки) и т.д;
• В медицине при диагностике различных заболеваний;
• В молекулярной биологии, проводя анализ строения
аминокислот.
Где применяются?
16.
17. 3. Задачи интеллектуального
анализа: прогнозирование
• Системы интеллектуального анализа данных (ИАД) – класс
программных систем поддержки принятия решений, задачей
которых является поиск скрытых, ранее неизвестных,
содержательных и потенциально полезных
закономерностей в больших объемах разнородных, сложно
структурированных данных.
• Задачи прогнозирования решаются в самых разнообразных
областях человеческой деятельности, таких как наука,
экономика, производство и множество других сфер.
• Прогнозирование является важным элементом организации
управления как отдельными хозяйствующими субъектами, так
и экономики в целом. развитие методов прогнозирования
непосредственно связано с развитием информационных
технологий, в частности, с ростом объемов хранимых данных
и усложнением методов и алгоритмы прогнозирования,
реализованных в инструментах Data Mining.
18. • Задачи прогнозирования решаются в самых
разнообразных областях человеческой деятельности,
таких как наука, экономика, производство и множество
других сфер.
• Прогнозирование является важным элементом
организации управления как отдельными
хозяйствующими субъектами, так и экономики в целом.
развитие методов прогнозирования непосредственно
связано с развитием информационных технологий, в
частности, с ростом объемов хранимых данных и
усложнением методов и алгоритмы прогнозирования,
реализованных в инструментах Data Mining.
19. Прогнозирующие методы
Прогнозирующие методы используют значения одних
переменных для предсказания/прогнозирования
неизвестных (пропущенных) или будущих значений других
(целевых) переменных.
20. Где применяется?
• Этот метод нередко применяется для оценки спроса на
услуги и товары, прогнозирования структуры сбыта,
характеризующегося сезонными колебаниями, или
потребности в кадрах. Если, к примеру, директор
ресторана быстрого питания хочет определить, сколько
гамбургеров заказывать на ноябрь, он должен
проанализировать цифры ноябрьских продаж в
минувшие пять лет.
• С прогнозированием ежедневно сталкиваются и
трейдеры на Forex .
21. 4. ПО анализа данных: Qlik
• QlikView — это профессиональная платформа Business
Discovery для самостоятельного проведения бизнес-
анализа, предназначенная для всех корпоративных
бизнес-пользователей. С помощью программного
обеспечения QlikView можно анализировать данные и
использовать полученные результаты для поддержки
решений.
• Программа QlikView дает возможность задавать себе
вопросы и отвечать на них, самостоятельно идти по пути
познания. Программа QlikView позволяет принимать
решения в совместной работе.
22. • консолидация важных данных из различных источников в
едином приложении;
• исследование ассоциативных связей между данными;
• возможность коллективного принятия решений, поддержка
совместной работы в режиме реального времени и в
защищенной среде;
• наглядное представление данных с помощью эффектной
современной графики;
• поиск по всем данным, прямой и косвенный;
• работа в интерактивном режиме с приложениями,
информационными панелями и аналитическими
инструментами;
• получение данных, их анализ и доступ к ним с
использованием мобильных устройств.
Возможности QlikView
23. • Простая интеграция различных источников данных –
от таблиц до ERP-систем
• Короткие сроки получения первых результатов от
внедрения
• Простое масштабирование
• Ускорение принятия взвешенных решений
• Единый источник правды для всех подразделений
• Получение реальной картины о состоянии дел в
компании
• Соблюдение корпоративных политик безопасности
при работе с данными
• Минимизация влияния человеческого фактора
• Устранение ошибок в данных и дублирующих
данных
• Повышение контроля над бизнесом
• Целенаправленное сокращение определенных
статей расходов и укрепление потоков наличности
• Возможность делегировать полномочия персоналу
для осуществления координированных действий
• Гибкий инструмент визуализации
• Возможность детально исследовать данные до
отдельной транзакции
• Быстрый анализ больших массивов данных
• Исследование ассоциативных связей между
данными
• Интерактивная работа с приложениями,
графиками, диаграммами.
• Совместная работа с аналитикой в режиме
реального времени
• Возможность получать аналитику в новых
разрезах без привлечения IT-специалистов
• Работа с данными с различных устройств, в
том числе – со смартфонов и планшетов
• Возможность быстро обнаруживать скрытые
тенденции
Преимущества
24. • автоматически выявляет и устанавливает связи между
данными;
• рассчитывает итоги на лету, по мере необходимости,
обеспечивая пользователю невероятно высокую
скорость работы;
• выполняет сжатие данных до 10% от первоначального
объема для оптимизации работы процессоров;
• реализует все вышеперечисленные функции в едином
продукте.
В результате ни пользователям, ни разработчикам не
приходится поддерживать взаимосвязи между данными,
поэтому организация может быстро переходить от
проектирования решения к внедрению и
совершенствованию.
Платформа QlikView Business
Discovery
25. • QlikView может повысить эффективность бизнеса и
уже успешно используется в различных отраслях
промышленности:
• Топливно-энергетический комплекс;
• Банки и кредитные организации;
• Дистрибуция и ретейл;
• Здравоохранение;
• Фармацевтика;
• Транспорт;
• Телеком;
• Логистика;
• Производство.
Применение QlikView