SlideShare a Scribd company logo
1 of 26
Облачные базы данных.
Методы АИД: деревья
решений.
Задачи АИД: прогнозирование.
ПО анализа данных: Qlik.
Выполнила:
Лабецкая В.
УИР 451
Разделы презентации
Облачные базы данных
Методы интеллектуального
анализа: деревья решений
Задачи интеллектуального анализа:
прогнозирование
ПО анализа данных: Qlik
• Облачное хранилище данных — модель онлайн-хранилища,
в котором данные хранятся на многочисленных,
распределённых в сети серверах, предоставляемых в
пользование клиентам, в основном третьей стороной.
• В противовес модели хранения данных на собственных,
выделенных серверах, приобретаемых или арендуемых
специально для подобных целей, количество или какая-либо
внутренняя структура серверов клиенту, в общем случае, не
видна.
• Данные хранятся, а равно и обрабатываются, в так
называемом облаке, которое представляет собой, с точки
зрения клиента, один большой, виртуальный сервер.
Облачные хранилища данных.
1. Облачные базы данных
• Файлы хранятся бесплатно, но у каждого сервиса это хранение
ограничено местом и условиями использования.
• Клиент платит только за то место в хранилище, которое фактически
использует, но не за аренду сервера, все ресурсы которого он может
и не использовать.
• Клиенту не нужно заниматься приобретением, поддержкой и
обслуживанием собственной инфраструктуры по хранению данных,
что, в конечном счете, уменьшает общие издержки производства.
• Все процедуры по резервированию и сохранению целостности
данных производятся провайдером облачного центра, который не
вовлекает в этот процесс клиента.
• Облачное хранилище подходит, практически, под все
операционные системы, как ПК, так и мобильных.
• Доступ и синхронизация файлов облака с файлами операционной
системы зависит от самого клиента облака (при выборе облака
нужно обращать внимание на готовность облака к десктопному
клиенту).
Преимущества облачных
хранилищ данных
• Облачные шлюзы — технология, которая может
быть использована для более удобного
представления облака клиенту.
• Удобства использования облачных хранилищ
данных велико, так как помимо хранения
данных, еще один плюс облачных сервисов – это
безболезненная пересылка больших файлов,
которые иначе долго и нудно пришлось бы
отправлять по электронной почте.
Десктопный клиент
(облачный шлюз): что это?
Определить цели и условия:
• скорость загрузки и выгрузки файла;
• удобное и красивое оформление приложения. Разработчики кросс
платформенных сервисов редко заботятся о таких мелочах и в
большинстве случаев мы получаем клиентское приложение на Java;
• сервис должен быть надежным и конфиденциальным;
• функциональность работы с файлами. В идеале нужно смотреть на
онлайн хранилище файлов с возможностью монтирования его в
виде локального диска с кэшированием;
• бесплатный объем данного «облака», стоимость платного места,
способы получения дополнительного бесплатного места;
• наличие выборочная синхронизация и/или фильтры и нормальная
поддержка всех типов файлов и атрибутов. Не нужно загружать
результаты компиляции программ в папке с проектами;
• нормально реализованное шифрование на клиентской стороне это
несомненный плюс, но не критичный, шифровать можно и
встроенными в систему средствами.
Как выбрать облачное
хранилище?
Список облачных хранилищ
данных:
• Интеллектуальный анализ данных ― это не только
используемые инструменты или программное
обеспечение баз данных. Интеллектуальный анализ
данных можно выполнить с относительно скромными
системами баз данных и простыми инструментами,
включая создание своих собственных, или с
использованием готовых пакетов программного
обеспечения.
• Сложный интеллектуальный анализ данных опирается
на прошлый опыт и алгоритмы, определенные с
помощью существующего программного обеспечения и
пакетов, причем с различными методами ассоциируются
разные специализированные инструменты.
2. Методы интеллектуального
анализа: деревья решений
• Деревья решений используются в повседневной жизни в
самых разных областях человеческой деятельности,
порой и очень далеких от машинного обучения.
Деревом решений можно назвать наглядную
инструкцию, что делать в какой ситуации.
• Деревья решения являются одним из наиболее
популярных подходов к решению задач Data Mining. Они
создают иерархическую структуру классифицирующих
правил типа "ЕСЛИ... ТО..." (if-then), имеющую вид
дерева.
Деревья решений
• Дерево решений, связанное с большинством других
методов (классификации и прогнозирования), можно
использовать либо в рамках критериев отбора, либо для
поддержки выбора определенных данных в рамках
общей структуры.
• Дерево решений начинают с простого вопроса, который
имеет два ответа (иногда больше). Каждый ответ
приводит к следующему вопросу, помогая
классифицировать и идентифицировать данные или
делать прогнозы.
Деревья решений: применение
Деревья решений: пример
• Описание данных: «деревья решений» позволяют хранить
информацию о данных в компактной форме, вместо них мы
можем хранить дерево решений, которое содержит точное
описание объектов;
• Классификация: «деревья решений» отлично справляются с
задачами классификации, т.е. отнесения объектов к одному
из заранее известных классов. Целевая переменная должна
иметь дискретные значения;
• Регрессия: если целевая переменная имеет непрерывные
значения, «деревья решений» позволяют установить
зависимость целевой переменной от независимых (входных)
переменных. Например, к этому классу относятся задачи
численного прогнозирования (предсказания значений
целевой переменной).
Задачи, решаемые с помощью
«деревьев решений»
• Интуитивность деревьев решений ;
• Возможность извлекать правила из базы
данных на естественном языке ;
• Не требует от пользователя выбора
входных атрибутов ;
• Точность моделей ;
• Разработан ряд масштабируемых
алгоритмов;
• Быстрый процесс обучения ;
• Обработка пропущенных значений ;
• Работа и с числовыми, и с
категориальными типами данных .
Основные достоинства
• В банковском деле при оценке кредитоспособности
клиентов банка при выдаче кредитов;
• В промышленности осуществляя контроль за качеством
продукции (выявление дефектов), испытаниях без
разрушений (например, проверка качества сварки) и т.д;
• В медицине при диагностике различных заболеваний;
• В молекулярной биологии, проводя анализ строения
аминокислот.
Где применяются?
3. Задачи интеллектуального
анализа: прогнозирование
• Системы интеллектуального анализа данных (ИАД) – класс
программных систем поддержки принятия решений, задачей
которых является поиск скрытых, ранее неизвестных,
содержательных и потенциально полезных
закономерностей в больших объемах разнородных, сложно
структурированных данных.
• Задачи прогнозирования решаются в самых разнообразных
областях человеческой деятельности, таких как наука,
экономика, производство и множество других сфер.
• Прогнозирование является важным элементом организации
управления как отдельными хозяйствующими субъектами, так
и экономики в целом. развитие методов прогнозирования
непосредственно связано с развитием информационных
технологий, в частности, с ростом объемов хранимых данных
и усложнением методов и алгоритмы прогнозирования,
реализованных в инструментах Data Mining.
• Задачи прогнозирования решаются в самых
разнообразных областях человеческой деятельности,
таких как наука, экономика, производство и множество
других сфер.
• Прогнозирование является важным элементом
организации управления как отдельными
хозяйствующими субъектами, так и экономики в целом.
развитие методов прогнозирования непосредственно
связано с развитием информационных технологий, в
частности, с ростом объемов хранимых данных и
усложнением методов и алгоритмы прогнозирования,
реализованных в инструментах Data Mining.
Прогнозирующие методы
Прогнозирующие методы используют значения одних
переменных для предсказания/прогнозирования
неизвестных (пропущенных) или будущих значений других
(целевых) переменных.
Где применяется?
• Этот метод нередко применяется для оценки спроса на
услуги и товары, прогнозирования структуры сбыта,
характеризующегося сезонными колебаниями, или
потребности в кадрах. Если, к примеру, директор
ресторана быстрого питания хочет определить, сколько
гамбургеров заказывать на ноябрь, он должен
проанализировать цифры ноябрьских продаж в
минувшие пять лет.
• С прогнозированием ежедневно сталкиваются и
трейдеры на Forex .
4. ПО анализа данных: Qlik
• QlikView — это профессиональная платформа Business
Discovery для самостоятельного проведения бизнес-
анализа, предназначенная для всех корпоративных
бизнес-пользователей. С помощью программного
обеспечения QlikView можно анализировать данные и
использовать полученные результаты для поддержки
решений.
• Программа QlikView дает возможность задавать себе
вопросы и отвечать на них, самостоятельно идти по пути
познания. Программа QlikView позволяет принимать
решения в совместной работе.
• консолидация важных данных из различных источников в
едином приложении;
• исследование ассоциативных связей между данными;
• возможность коллективного принятия решений, поддержка
совместной работы в режиме реального времени и в
защищенной среде;
• наглядное представление данных с помощью эффектной
современной графики;
• поиск по всем данным, прямой и косвенный;
• работа в интерактивном режиме с приложениями,
информационными панелями и аналитическими
инструментами;
• получение данных, их анализ и доступ к ним с
использованием мобильных устройств.
Возможности QlikView
• Простая интеграция различных источников данных –
от таблиц до ERP-систем
• Короткие сроки получения первых результатов от
внедрения
• Простое масштабирование
• Ускорение принятия взвешенных решений
• Единый источник правды для всех подразделений
• Получение реальной картины о состоянии дел в
компании
• Соблюдение корпоративных политик безопасности
при работе с данными
• Минимизация влияния человеческого фактора
• Устранение ошибок в данных и дублирующих
данных
• Повышение контроля над бизнесом
• Целенаправленное сокращение определенных
статей расходов и укрепление потоков наличности
• Возможность делегировать полномочия персоналу
для осуществления координированных действий
• Гибкий инструмент визуализации
• Возможность детально исследовать данные до
отдельной транзакции
• Быстрый анализ больших массивов данных
• Исследование ассоциативных связей между
данными
• Интерактивная работа с приложениями,
графиками, диаграммами.
• Совместная работа с аналитикой в режиме
реального времени
• Возможность получать аналитику в новых
разрезах без привлечения IT-специалистов
• Работа с данными с различных устройств, в
том числе – со смартфонов и планшетов
• Возможность быстро обнаруживать скрытые
тенденции
Преимущества
• автоматически выявляет и устанавливает связи между
данными;
• рассчитывает итоги на лету, по мере необходимости,
обеспечивая пользователю невероятно высокую
скорость работы;
• выполняет сжатие данных до 10% от первоначального
объема для оптимизации работы процессоров;
• реализует все вышеперечисленные функции в едином
продукте.
В результате ни пользователям, ни разработчикам не
приходится поддерживать взаимосвязи между данными,
поэтому организация может быстро переходить от
проектирования решения к внедрению и
совершенствованию.
Платформа QlikView Business
Discovery
• QlikView может повысить эффективность бизнеса и
уже успешно используется в различных отраслях
промышленности:
• Топливно-энергетический комплекс;
• Банки и кредитные организации;
• Дистрибуция и ретейл;
• Здравоохранение;
• Фармацевтика;
• Транспорт;
• Телеком;
• Логистика;
• Производство.
Применение QlikView
Технологии анализа и обработки данных

More Related Content

What's hot

Преимущества Dell
Преимущества DellПреимущества Dell
Преимущества DellDell_Russia
 
Управление ИТ-инфраструктурой с технологиями Dell Software
Управление ИТ-инфраструктурой с технологиями Dell SoftwareУправление ИТ-инфраструктурой с технологиями Dell Software
Управление ИТ-инфраструктурой с технологиями Dell SoftwareDell_Russia
 
Высокопроизводительные вычисления на платформе Dell
Высокопроизводительные вычисления на платформе DellВысокопроизводительные вычисления на платформе Dell
Высокопроизводительные вычисления на платформе DellDell_Russia
 
Предиктивная аналитика и Big Data: методы, инструменты, решения
Предиктивная аналитика и Big Data: методы, инструменты, решенияПредиктивная аналитика и Big Data: методы, инструменты, решения
Предиктивная аналитика и Big Data: методы, инструменты, решенияDell_Russia
 
Стратегия Microsoft
Стратегия MicrosoftСтратегия Microsoft
Стратегия MicrosoftDell_Russia
 
основные понятия баз данных
основные понятия баз данныхосновные понятия баз данных
основные понятия баз данных23padopi
 
Виртуализация Данных: Введение
Виртуализация Данных: ВведениеВиртуализация Данных: Введение
Виртуализация Данных: ВведениеDenodo
 
Презентация Informatica MDM
Презентация Informatica MDMПрезентация Informatica MDM
Презентация Informatica MDMOleksii Tsipiniuk
 
MONT Решения Micro Focus для резервного копирования
MONT Решения Micro Focus для резервного копированияMONT Решения Micro Focus для резервного копирования
MONT Решения Micro Focus для резервного копированияYuri Yashkin
 
Новая жизнь Ваших даных с PowerBI
Новая жизнь Ваших даных с PowerBI Новая жизнь Ваших даных с PowerBI
Новая жизнь Ваших даных с PowerBI Marina Payvina
 
Модернизируем сеть вместе с Dell
Модернизируем сеть вместе с DellМодернизируем сеть вместе с Dell
Модернизируем сеть вместе с DellDell_Russia
 
Опыт эффективной организации интеллектуального архива
Опыт эффективной организации интеллектуального архиваОпыт эффективной организации интеллектуального архива
Опыт эффективной организации интеллектуального архиваSergey Poltev
 
1 big data oracle digi oct
1 big data oracle digi oct1 big data oracle digi oct
1 big data oracle digi octantishmanti
 
Как Microsoft Power BI меняет процесс принятия управленческих решений?
Как Microsoft Power BI меняет процесс принятия управленческих решений?Как Microsoft Power BI меняет процесс принятия управленческих решений?
Как Microsoft Power BI меняет процесс принятия управленческих решений?FTS Russia
 
Software Analytics in frontend
Software Analytics in frontendSoftware Analytics in frontend
Software Analytics in frontendDenis Kolesnikov
 
Ds the-qlik view-product-family-ru
Ds the-qlik view-product-family-ruDs the-qlik view-product-family-ru
Ds the-qlik view-product-family-ruTimur Ovadia Berezin
 
RBC qlikview возможности конференция минск 2014 а2 консалтинг
RBC  qlikview  возможности конференция минск 2014 а2 консалтингRBC  qlikview  возможности конференция минск 2014 а2 консалтинг
RBC qlikview возможности конференция минск 2014 а2 консалтингa2consulting
 
АНАЛИТИКА ПЛЮС, вебинар 10 декабря «НОВЫЕ ТЕХНОЛОГИИ HP VERTICA + TABLEAU, КА...
АНАЛИТИКА ПЛЮС, вебинар 10 декабря «НОВЫЕ ТЕХНОЛОГИИ HP VERTICA + TABLEAU, КА...АНАЛИТИКА ПЛЮС, вебинар 10 декабря «НОВЫЕ ТЕХНОЛОГИИ HP VERTICA + TABLEAU, КА...
АНАЛИТИКА ПЛЮС, вебинар 10 декабря «НОВЫЕ ТЕХНОЛОГИИ HP VERTICA + TABLEAU, КА...АНАЛИТИКА ПЛЮС
 
Big Data Open Lab
Big Data Open LabBig Data Open Lab
Big Data Open LabDell_Russia
 

What's hot (19)

Преимущества Dell
Преимущества DellПреимущества Dell
Преимущества Dell
 
Управление ИТ-инфраструктурой с технологиями Dell Software
Управление ИТ-инфраструктурой с технологиями Dell SoftwareУправление ИТ-инфраструктурой с технологиями Dell Software
Управление ИТ-инфраструктурой с технологиями Dell Software
 
Высокопроизводительные вычисления на платформе Dell
Высокопроизводительные вычисления на платформе DellВысокопроизводительные вычисления на платформе Dell
Высокопроизводительные вычисления на платформе Dell
 
Предиктивная аналитика и Big Data: методы, инструменты, решения
Предиктивная аналитика и Big Data: методы, инструменты, решенияПредиктивная аналитика и Big Data: методы, инструменты, решения
Предиктивная аналитика и Big Data: методы, инструменты, решения
 
Стратегия Microsoft
Стратегия MicrosoftСтратегия Microsoft
Стратегия Microsoft
 
основные понятия баз данных
основные понятия баз данныхосновные понятия баз данных
основные понятия баз данных
 
Виртуализация Данных: Введение
Виртуализация Данных: ВведениеВиртуализация Данных: Введение
Виртуализация Данных: Введение
 
Презентация Informatica MDM
Презентация Informatica MDMПрезентация Informatica MDM
Презентация Informatica MDM
 
MONT Решения Micro Focus для резервного копирования
MONT Решения Micro Focus для резервного копированияMONT Решения Micro Focus для резервного копирования
MONT Решения Micro Focus для резервного копирования
 
Новая жизнь Ваших даных с PowerBI
Новая жизнь Ваших даных с PowerBI Новая жизнь Ваших даных с PowerBI
Новая жизнь Ваших даных с PowerBI
 
Модернизируем сеть вместе с Dell
Модернизируем сеть вместе с DellМодернизируем сеть вместе с Dell
Модернизируем сеть вместе с Dell
 
Опыт эффективной организации интеллектуального архива
Опыт эффективной организации интеллектуального архиваОпыт эффективной организации интеллектуального архива
Опыт эффективной организации интеллектуального архива
 
1 big data oracle digi oct
1 big data oracle digi oct1 big data oracle digi oct
1 big data oracle digi oct
 
Как Microsoft Power BI меняет процесс принятия управленческих решений?
Как Microsoft Power BI меняет процесс принятия управленческих решений?Как Microsoft Power BI меняет процесс принятия управленческих решений?
Как Microsoft Power BI меняет процесс принятия управленческих решений?
 
Software Analytics in frontend
Software Analytics in frontendSoftware Analytics in frontend
Software Analytics in frontend
 
Ds the-qlik view-product-family-ru
Ds the-qlik view-product-family-ruDs the-qlik view-product-family-ru
Ds the-qlik view-product-family-ru
 
RBC qlikview возможности конференция минск 2014 а2 консалтинг
RBC  qlikview  возможности конференция минск 2014 а2 консалтингRBC  qlikview  возможности конференция минск 2014 а2 консалтинг
RBC qlikview возможности конференция минск 2014 а2 консалтинг
 
АНАЛИТИКА ПЛЮС, вебинар 10 декабря «НОВЫЕ ТЕХНОЛОГИИ HP VERTICA + TABLEAU, КА...
АНАЛИТИКА ПЛЮС, вебинар 10 декабря «НОВЫЕ ТЕХНОЛОГИИ HP VERTICA + TABLEAU, КА...АНАЛИТИКА ПЛЮС, вебинар 10 декабря «НОВЫЕ ТЕХНОЛОГИИ HP VERTICA + TABLEAU, КА...
АНАЛИТИКА ПЛЮС, вебинар 10 декабря «НОВЫЕ ТЕХНОЛОГИИ HP VERTICA + TABLEAU, КА...
 
Big Data Open Lab
Big Data Open LabBig Data Open Lab
Big Data Open Lab
 

Similar to Технологии анализа и обработки данных

Хранилище данных (+ облачные хранилища данных)
Хранилище данных (+ облачные хранилища данных)Хранилище данных (+ облачные хранилища данных)
Хранилище данных (+ облачные хранилища данных)PutinTheJew
 
хранилище данных
хранилище данныххранилище данных
хранилище данныхPutinTheJew
 
Анализ больших данных с помощью инструментов Google
Анализ больших данных с помощью инструментов GoogleАнализ больших данных с помощью инструментов Google
Анализ больших данных с помощью инструментов GoogleNetpeak
 
Знакомство с виртуализацией данных для профессионалов в области данных
Знакомство с виртуализацией данных для профессионалов в области данныхЗнакомство с виртуализацией данных для профессионалов в области данных
Знакомство с виртуализацией данных для профессионалов в области данныхDenodo
 
Построение Data Mesh на основе Виртуальных Данных
Построение Data Mesh на основе Виртуальных ДанныхПостроение Data Mesh на основе Виртуальных Данных
Построение Data Mesh на основе Виртуальных ДанныхDenodo
 
Решения Cisco для защищенного ЦОД снижают риск при переходе к частному облаку
Решения Cisco для защищенного ЦОД снижают риск при переходе к частному облакуРешения Cisco для защищенного ЦОД снижают риск при переходе к частному облаку
Решения Cisco для защищенного ЦОД снижают риск при переходе к частному облакуCisco Russia
 
Персональные данные организации
Персональные данные организацииПерсональные данные организации
Персональные данные организацииAlexey Fedorischev
 
Знакомство с виртуализацией данных для профессионалов в области данных
Знакомство с виртуализацией данных для профессионалов в области данныхЗнакомство с виртуализацией данных для профессионалов в области данных
Знакомство с виртуализацией данных для профессионалов в области данныхDenodo
 
Бизнес-аналитика каналов продаж
Бизнес-аналитика каналов продаж Бизнес-аналитика каналов продаж
Бизнес-аналитика каналов продаж Pavel Ivanov
 
Oracle Data Warehouse Cloud
Oracle Data Warehouse CloudOracle Data Warehouse Cloud
Oracle Data Warehouse CloudAndrey Gorbunov
 
BusinessObjects глазами аналитика - Tern4
BusinessObjects глазами аналитика -  Tern4 BusinessObjects глазами аналитика -  Tern4
BusinessObjects глазами аналитика - Tern4 Valeriy Titov
 
Проектирование программных систем. Занятие 4
Проектирование программных систем. Занятие 4Проектирование программных систем. Занятие 4
Проектирование программных систем. Занятие 4Dima Dzuba
 
6 важнейших качеств платформы для анализа Больших данных
6 важнейших качеств платформы для анализа Больших данных6 важнейших качеств платформы для анализа Больших данных
6 важнейших качеств платформы для анализа Больших данныхElizaveta Alekseeva
 
Критерии гиперконвергенции нового поколения
Критерии гиперконвергенции нового поколенияКритерии гиперконвергенции нового поколения
Критерии гиперконвергенции нового поколенияCisco Russia
 
Повышение доверия и обеспечение безопасности использования облачных сервисов ...
Повышение доверия и обеспечение безопасности использования облачных сервисов ...Повышение доверия и обеспечение безопасности использования облачных сервисов ...
Повышение доверия и обеспечение безопасности использования облачных сервисов ...Positive Hack Days
 
Большие данные и бизнес-аналитика: как найти пользу?
Большие данные и бизнес-аналитика: как найти пользу?Большие данные и бизнес-аналитика: как найти пользу?
Большие данные и бизнес-аналитика: как найти пользу?Marina Payvina
 

Similar to Технологии анализа и обработки данных (20)

Хранилище данных (+ облачные хранилища данных)
Хранилище данных (+ облачные хранилища данных)Хранилище данных (+ облачные хранилища данных)
Хранилище данных (+ облачные хранилища данных)
 
хранилище данных
хранилище данныххранилище данных
хранилище данных
 
Анализ больших данных с помощью инструментов Google
Анализ больших данных с помощью инструментов GoogleАнализ больших данных с помощью инструментов Google
Анализ больших данных с помощью инструментов Google
 
Знакомство с виртуализацией данных для профессионалов в области данных
Знакомство с виртуализацией данных для профессионалов в области данныхЗнакомство с виртуализацией данных для профессионалов в области данных
Знакомство с виртуализацией данных для профессионалов в области данных
 
Построение Data Mesh на основе Виртуальных Данных
Построение Data Mesh на основе Виртуальных ДанныхПостроение Data Mesh на основе Виртуальных Данных
Построение Data Mesh на основе Виртуальных Данных
 
Решения Cisco для защищенного ЦОД снижают риск при переходе к частному облаку
Решения Cisco для защищенного ЦОД снижают риск при переходе к частному облакуРешения Cisco для защищенного ЦОД снижают риск при переходе к частному облаку
Решения Cisco для защищенного ЦОД снижают риск при переходе к частному облаку
 
Персональные данные организации
Персональные данные организацииПерсональные данные организации
Персональные данные организации
 
Знакомство с виртуализацией данных для профессионалов в области данных
Знакомство с виртуализацией данных для профессионалов в области данныхЗнакомство с виртуализацией данных для профессионалов в области данных
Знакомство с виртуализацией данных для профессионалов в области данных
 
Ekran cloud ru
Ekran cloud ruEkran cloud ru
Ekran cloud ru
 
Бизнес-аналитика каналов продаж
Бизнес-аналитика каналов продаж Бизнес-аналитика каналов продаж
Бизнес-аналитика каналов продаж
 
Oracle Data Warehouse Cloud
Oracle Data Warehouse CloudOracle Data Warehouse Cloud
Oracle Data Warehouse Cloud
 
BusinessObjects глазами аналитика - Tern4
BusinessObjects глазами аналитика -  Tern4 BusinessObjects глазами аналитика -  Tern4
BusinessObjects глазами аналитика - Tern4
 
Проектирование программных систем. Занятие 4
Проектирование программных систем. Занятие 4Проектирование программных систем. Занятие 4
Проектирование программных систем. Занятие 4
 
Big data
Big dataBig data
Big data
 
Big Data
Big DataBig Data
Big Data
 
6 важнейших качеств платформы для анализа Больших данных
6 важнейших качеств платформы для анализа Больших данных6 важнейших качеств платформы для анализа Больших данных
6 важнейших качеств платформы для анализа Больших данных
 
Критерии гиперконвергенции нового поколения
Критерии гиперконвергенции нового поколенияКритерии гиперконвергенции нового поколения
Критерии гиперконвергенции нового поколения
 
Повышение доверия и обеспечение безопасности использования облачных сервисов ...
Повышение доверия и обеспечение безопасности использования облачных сервисов ...Повышение доверия и обеспечение безопасности использования облачных сервисов ...
Повышение доверия и обеспечение безопасности использования облачных сервисов ...
 
Большие данные и бизнес-аналитика: как найти пользу?
Большие данные и бизнес-аналитика: как найти пользу?Большие данные и бизнес-аналитика: как найти пользу?
Большие данные и бизнес-аналитика: как найти пользу?
 
Аналитика в SaaS-бизнесе на примере OWOX BI
Аналитика в SaaS-бизнесе на примере OWOX BIАналитика в SaaS-бизнесе на примере OWOX BI
Аналитика в SaaS-бизнесе на примере OWOX BI
 

Технологии анализа и обработки данных

  • 1. Облачные базы данных. Методы АИД: деревья решений. Задачи АИД: прогнозирование. ПО анализа данных: Qlik. Выполнила: Лабецкая В. УИР 451
  • 2. Разделы презентации Облачные базы данных Методы интеллектуального анализа: деревья решений Задачи интеллектуального анализа: прогнозирование ПО анализа данных: Qlik
  • 3. • Облачное хранилище данных — модель онлайн-хранилища, в котором данные хранятся на многочисленных, распределённых в сети серверах, предоставляемых в пользование клиентам, в основном третьей стороной. • В противовес модели хранения данных на собственных, выделенных серверах, приобретаемых или арендуемых специально для подобных целей, количество или какая-либо внутренняя структура серверов клиенту, в общем случае, не видна. • Данные хранятся, а равно и обрабатываются, в так называемом облаке, которое представляет собой, с точки зрения клиента, один большой, виртуальный сервер. Облачные хранилища данных. 1. Облачные базы данных
  • 4. • Файлы хранятся бесплатно, но у каждого сервиса это хранение ограничено местом и условиями использования. • Клиент платит только за то место в хранилище, которое фактически использует, но не за аренду сервера, все ресурсы которого он может и не использовать. • Клиенту не нужно заниматься приобретением, поддержкой и обслуживанием собственной инфраструктуры по хранению данных, что, в конечном счете, уменьшает общие издержки производства. • Все процедуры по резервированию и сохранению целостности данных производятся провайдером облачного центра, который не вовлекает в этот процесс клиента. • Облачное хранилище подходит, практически, под все операционные системы, как ПК, так и мобильных. • Доступ и синхронизация файлов облака с файлами операционной системы зависит от самого клиента облака (при выборе облака нужно обращать внимание на готовность облака к десктопному клиенту). Преимущества облачных хранилищ данных
  • 5. • Облачные шлюзы — технология, которая может быть использована для более удобного представления облака клиенту. • Удобства использования облачных хранилищ данных велико, так как помимо хранения данных, еще один плюс облачных сервисов – это безболезненная пересылка больших файлов, которые иначе долго и нудно пришлось бы отправлять по электронной почте. Десктопный клиент (облачный шлюз): что это?
  • 6. Определить цели и условия: • скорость загрузки и выгрузки файла; • удобное и красивое оформление приложения. Разработчики кросс платформенных сервисов редко заботятся о таких мелочах и в большинстве случаев мы получаем клиентское приложение на Java; • сервис должен быть надежным и конфиденциальным; • функциональность работы с файлами. В идеале нужно смотреть на онлайн хранилище файлов с возможностью монтирования его в виде локального диска с кэшированием; • бесплатный объем данного «облака», стоимость платного места, способы получения дополнительного бесплатного места; • наличие выборочная синхронизация и/или фильтры и нормальная поддержка всех типов файлов и атрибутов. Не нужно загружать результаты компиляции программ в папке с проектами; • нормально реализованное шифрование на клиентской стороне это несомненный плюс, но не критичный, шифровать можно и встроенными в систему средствами. Как выбрать облачное хранилище?
  • 8. • Интеллектуальный анализ данных ― это не только используемые инструменты или программное обеспечение баз данных. Интеллектуальный анализ данных можно выполнить с относительно скромными системами баз данных и простыми инструментами, включая создание своих собственных, или с использованием готовых пакетов программного обеспечения. • Сложный интеллектуальный анализ данных опирается на прошлый опыт и алгоритмы, определенные с помощью существующего программного обеспечения и пакетов, причем с различными методами ассоциируются разные специализированные инструменты. 2. Методы интеллектуального анализа: деревья решений
  • 9. • Деревья решений используются в повседневной жизни в самых разных областях человеческой деятельности, порой и очень далеких от машинного обучения. Деревом решений можно назвать наглядную инструкцию, что делать в какой ситуации. • Деревья решения являются одним из наиболее популярных подходов к решению задач Data Mining. Они создают иерархическую структуру классифицирующих правил типа "ЕСЛИ... ТО..." (if-then), имеющую вид дерева. Деревья решений
  • 10. • Дерево решений, связанное с большинством других методов (классификации и прогнозирования), можно использовать либо в рамках критериев отбора, либо для поддержки выбора определенных данных в рамках общей структуры. • Дерево решений начинают с простого вопроса, который имеет два ответа (иногда больше). Каждый ответ приводит к следующему вопросу, помогая классифицировать и идентифицировать данные или делать прогнозы. Деревья решений: применение
  • 11.
  • 13. • Описание данных: «деревья решений» позволяют хранить информацию о данных в компактной форме, вместо них мы можем хранить дерево решений, которое содержит точное описание объектов; • Классификация: «деревья решений» отлично справляются с задачами классификации, т.е. отнесения объектов к одному из заранее известных классов. Целевая переменная должна иметь дискретные значения; • Регрессия: если целевая переменная имеет непрерывные значения, «деревья решений» позволяют установить зависимость целевой переменной от независимых (входных) переменных. Например, к этому классу относятся задачи численного прогнозирования (предсказания значений целевой переменной). Задачи, решаемые с помощью «деревьев решений»
  • 14. • Интуитивность деревьев решений ; • Возможность извлекать правила из базы данных на естественном языке ; • Не требует от пользователя выбора входных атрибутов ; • Точность моделей ; • Разработан ряд масштабируемых алгоритмов; • Быстрый процесс обучения ; • Обработка пропущенных значений ; • Работа и с числовыми, и с категориальными типами данных . Основные достоинства
  • 15. • В банковском деле при оценке кредитоспособности клиентов банка при выдаче кредитов; • В промышленности осуществляя контроль за качеством продукции (выявление дефектов), испытаниях без разрушений (например, проверка качества сварки) и т.д; • В медицине при диагностике различных заболеваний; • В молекулярной биологии, проводя анализ строения аминокислот. Где применяются?
  • 16.
  • 17. 3. Задачи интеллектуального анализа: прогнозирование • Системы интеллектуального анализа данных (ИАД) – класс программных систем поддержки принятия решений, задачей которых является поиск скрытых, ранее неизвестных, содержательных и потенциально полезных закономерностей в больших объемах разнородных, сложно структурированных данных. • Задачи прогнозирования решаются в самых разнообразных областях человеческой деятельности, таких как наука, экономика, производство и множество других сфер. • Прогнозирование является важным элементом организации управления как отдельными хозяйствующими субъектами, так и экономики в целом. развитие методов прогнозирования непосредственно связано с развитием информационных технологий, в частности, с ростом объемов хранимых данных и усложнением методов и алгоритмы прогнозирования, реализованных в инструментах Data Mining.
  • 18. • Задачи прогнозирования решаются в самых разнообразных областях человеческой деятельности, таких как наука, экономика, производство и множество других сфер. • Прогнозирование является важным элементом организации управления как отдельными хозяйствующими субъектами, так и экономики в целом. развитие методов прогнозирования непосредственно связано с развитием информационных технологий, в частности, с ростом объемов хранимых данных и усложнением методов и алгоритмы прогнозирования, реализованных в инструментах Data Mining.
  • 19. Прогнозирующие методы Прогнозирующие методы используют значения одних переменных для предсказания/прогнозирования неизвестных (пропущенных) или будущих значений других (целевых) переменных.
  • 20. Где применяется? • Этот метод нередко применяется для оценки спроса на услуги и товары, прогнозирования структуры сбыта, характеризующегося сезонными колебаниями, или потребности в кадрах. Если, к примеру, директор ресторана быстрого питания хочет определить, сколько гамбургеров заказывать на ноябрь, он должен проанализировать цифры ноябрьских продаж в минувшие пять лет. • С прогнозированием ежедневно сталкиваются и трейдеры на Forex .
  • 21. 4. ПО анализа данных: Qlik • QlikView — это профессиональная платформа Business Discovery для самостоятельного проведения бизнес- анализа, предназначенная для всех корпоративных бизнес-пользователей. С помощью программного обеспечения QlikView можно анализировать данные и использовать полученные результаты для поддержки решений. • Программа QlikView дает возможность задавать себе вопросы и отвечать на них, самостоятельно идти по пути познания. Программа QlikView позволяет принимать решения в совместной работе.
  • 22. • консолидация важных данных из различных источников в едином приложении; • исследование ассоциативных связей между данными; • возможность коллективного принятия решений, поддержка совместной работы в режиме реального времени и в защищенной среде; • наглядное представление данных с помощью эффектной современной графики; • поиск по всем данным, прямой и косвенный; • работа в интерактивном режиме с приложениями, информационными панелями и аналитическими инструментами; • получение данных, их анализ и доступ к ним с использованием мобильных устройств. Возможности QlikView
  • 23. • Простая интеграция различных источников данных – от таблиц до ERP-систем • Короткие сроки получения первых результатов от внедрения • Простое масштабирование • Ускорение принятия взвешенных решений • Единый источник правды для всех подразделений • Получение реальной картины о состоянии дел в компании • Соблюдение корпоративных политик безопасности при работе с данными • Минимизация влияния человеческого фактора • Устранение ошибок в данных и дублирующих данных • Повышение контроля над бизнесом • Целенаправленное сокращение определенных статей расходов и укрепление потоков наличности • Возможность делегировать полномочия персоналу для осуществления координированных действий • Гибкий инструмент визуализации • Возможность детально исследовать данные до отдельной транзакции • Быстрый анализ больших массивов данных • Исследование ассоциативных связей между данными • Интерактивная работа с приложениями, графиками, диаграммами. • Совместная работа с аналитикой в режиме реального времени • Возможность получать аналитику в новых разрезах без привлечения IT-специалистов • Работа с данными с различных устройств, в том числе – со смартфонов и планшетов • Возможность быстро обнаруживать скрытые тенденции Преимущества
  • 24. • автоматически выявляет и устанавливает связи между данными; • рассчитывает итоги на лету, по мере необходимости, обеспечивая пользователю невероятно высокую скорость работы; • выполняет сжатие данных до 10% от первоначального объема для оптимизации работы процессоров; • реализует все вышеперечисленные функции в едином продукте. В результате ни пользователям, ни разработчикам не приходится поддерживать взаимосвязи между данными, поэтому организация может быстро переходить от проектирования решения к внедрению и совершенствованию. Платформа QlikView Business Discovery
  • 25. • QlikView может повысить эффективность бизнеса и уже успешно используется в различных отраслях промышленности: • Топливно-энергетический комплекс; • Банки и кредитные организации; • Дистрибуция и ретейл; • Здравоохранение; • Фармацевтика; • Транспорт; • Телеком; • Логистика; • Производство. Применение QlikView