SlideShare a Scribd company logo
Хранилище данных
Хранилище данных (англ. Data Warehouse) — предметно-
ориентированная информационная база данных, специально
разработанная и предназначенная для подготовки отчётов и
бизнес-анализа с целью поддержки принятия решений в
организации. Строится на базе систем управления базами
данных и систем поддержки принятия решений.
• Данные, поступающие в хранилище данных,
как правило, доступны только для чтения.
Данные из OLTP-системы копируются в
хранилище данных таким образом, чтобы
построение отчётов и OLAP-анализ не
использовал ресурсы транзакционной системы
и не нарушал её стабильность. Как правило,
данные загружаются в хранилище с
определённой периодичностью, поэтому
актуальность данных может несколько
отставать от OLTP-системы.
Компоненты для анализа в хранилище данных
Принципы организации хранилища
• Проблемно-предметная ориентация. Данные
объединяются в категории и хранятся в соответствии с
областями, которые они описывают, а не с
приложениями, которые они используют.
• Интегрированность. Данные объединены так, чтобы
они удовлетворяли всем требованиям предприятия в
целом, а не единственной функции бизнеса.
• Некорректируемость. Данные в хранилище данных не
создаются: т.е. поступают из внешних источников, не
корректируются и не удаляются.
• Зависимость от времени. Данные в хранилище точны
и корректны только в том случае, когда они привязаны к
некоторому промежутку или моменту времени.
Дизайн хранилищ данных
Нормализованные хранилища
данных
• В нормализованных хранилищах,
данные находятся в предметно
ориентированных таблицах третьей
нормальной формы. Нормализованные
хранилища характеризуются как
простые в создании и управлении,
недостатки нормализованных хранилищ
– большое количество таблиц как
следствие нормализации, из-за чего для
получения какой-либо информации
нужно делать выборку из многих таблиц
одновременно, что приводит к
ухудшению производительности
системы. Для решения этой проблемы
используются денормализованные
таблицы - витрины данных, на основе
которых уже выводятся отчетные
формы. При громадных объемах данных
могут использовать несколько уровней
«витрин»/«хранилищ».
Хранилища с измерениями
• Хранилища с измерениями используют схему
«звезда» или схему «снежинка». При этом в центре
«звезды» находятся данные (Таблица фактов),
а измерения образуют лучи звезды. Различные
таблицы фактов совместно используют таблицы
измерений, что значительно облегчает операции
объединения данных из нескольких предметных
таблиц фактов (Пример – факты продаж и поставок
товара). Таблицы данных и соответствующие
измерениями образуют архитектуру «шина».
Измерения часто создаются в третьей нормальной
форме, в том числе, для протоколирования изменения
в измерениях. Основным достоинством хранилищ с
измерениями является простота и понятность для
разработчиков и пользователей, также, благодаря
более эффективному хранению данных и
формализованным измерениям, облегчается и
ускоряется доступ к данным, особенно при сложных
анализах. Основным недостатком является более
сложные процедуры подготовки и загрузки данных, а
также управление и изменение измерений данных.
• При достаточно большом объеме данных схемы
«звезда» и «снежинка» также дают снижение
производительности при соединениях с измерениями.
Процессы работы с данными
Источниками данных могут быть:
• Традиционные системы регистрации операций
• Отдельные документы
• Наборы данных
Операции с данными:
• Извлечение – перемещение информации от источников данных в
отдельную БД, приведение их к единому формату.
• Преобразование – подготовка информации к хранению в
оптимальной форме для реализации запроса, необходимого для
принятия решений.
• Загрузка – помещение данных в хранилище, производится атомарно,
путем добавления новых фактов или корректировкой существующих.
• Анализ – OLAP, Data Mining, сводные отчёты.
• Представление результатов анализа.
Вся эта информация используется в словаре метаданных. В словарь
метаданных автоматически включаются словари источников данных. Здесь
же форматы данных для их последующего согласования, периодичность
пополнения данных, согласованность во времени.
Задача словаря метаданных состоит в том, чтобы освободить разработчика
от необходимости стандартизировать источники данных.
Создание хранилищ данных не должно противоречить действующим
системам сбора и обработки информации.
Специальные компоненты словарей должны обеспечивать своевременное
извлечение из словарей и обеспечить преобразование к единому формату
на основе словаря метаданных.
Логическая структура данных хранилища данных отличается от структуры
данных источников данных.
Для разработки эффективного процесса преобразования
необходима хорошо проработанная модель корпоративных
данных и модель технологии принятия решений.
Данные для пользователя удобно представлять в
многоразмерных БД, где в качестве измерения могут выступать
время, цена или географический регион.
Кроме извлечения данных из БД, принятия решений важен
процесс извлечения знаний, в соответствии с
информационными потребностями пользователя.
С точки зрения пользователя в процессе извлечения знаний из
БД должны решаться след. преобразования: данные →
информация → знания → полученные решения.
Облачное хранилище данных
• Облачное хранилище
данных (англ. cloud storage) — модель
онлайн-хранилища, в котором данные
хранятся на многочисленных
распределённых в сети серверах,
предоставляемых в пользование
клиентам, в основном, третьей
стороной. В отличие от модели
хранения данных на собственных
выделенных серверах, приобретаемых
или арендуемых специально для
подобных целей, количество или
какая-либо внутренняя структура
серверов клиенту, в общем случае, не
видна. Данные хранятся и
обрабатываются в так
называемом облаке, которое
представляет собой, с точки зрения
клиента, один большой виртуальный
сервер. Физически же такие серверы
могут располагаться удалённо друг от
друга географически, вплоть до
расположения на разных континентах.
Преимущества облачных хранилищ
• Клиент платит только за то место в хранилище, которое
фактически использует, но не за аренду сервера, все
ресурсы которого он может и не использовать.
• Клиенту нет необходимости заниматься
приобретением, поддержкой и обслуживанием
собственной инфраструктуры по хранению данных, что,
в конечном счёте, уменьшает общие издержки
производства.
• Все процедуры по резервированию и сохранению
целостности данных производятся провайдером
облачного центра, который не вовлекает в этот процесс
клиента.
Потенциальные вопросы
• Безопасность при хранении и пересылке данных является
одним из основных вопросов при работе с облаком, особенно в
отношении конфиденциальных, приватных данных.
• Общая производительность при работе с данными
в облаке может быть ниже таковой при работе с локальными
копиями данных.
• Надёжность и своевременность получения и доступности
данных в облаке очень сильно зависит от многих
промежуточных параметров, в основном таких, как каналы
передачи данных на пути от клиента к облаку,
вопрос последней мили, вопрос о надлежащем качестве
работы интернет-провайдера клиента, вопрос о доступности
самого облака в данный момент времени.
Облачные шлюзы
• Облачные шлюзы — технология, которая может
быть использована для более удобного
представления облака клиенту. К примеру, с
помощью соответствующего программного
обеспечения, хранилище в облаке может быть
представлено для клиента как локальный диск на
компьютере. Таким образом, работа с данными
в облаке для клиента становится абсолютно
прозрачной. И при наличии хорошей, быстрой связи
с облаком клиент может даже не замечать, что
работает не с локальными данными у себя на
компьютере, а с данными, хранящимися,
возможно, за много сотен километров от него.

More Related Content

What's hot

Talksum dec2013 rus_generic
Talksum dec2013 rus_genericTalksum dec2013 rus_generic
Talksum dec2013 rus_generic
dartemiev
 
основные понятия баз данных
основные понятия баз данныхосновные понятия баз данных
основные понятия баз данных23padopi
 
14 расширенные возможности корпоративных субд
14 расширенные возможности корпоративных субд14 расширенные возможности корпоративных субд
14 расширенные возможности корпоративных субд
KewpaN
 
Обзор HP Vertica
Обзор HP VerticaОбзор HP Vertica
Обзор HP Vertica
i-Teco & Vitte Consulting
 
Бизнес-ориентированное хранение данных – синхронизация потребностей бизнеса с...
Бизнес-ориентированное хранение данных – синхронизация потребностей бизнеса с...Бизнес-ориентированное хранение данных – синхронизация потребностей бизнеса с...
Бизнес-ориентированное хранение данных – синхронизация потребностей бизнеса с...
Fujitsu Russia
 
HP Vertica
HP VerticaHP Vertica
Описание архитектуры СУБД HP Vertica
Описание архитектуры СУБД HP VerticaОписание архитектуры СУБД HP Vertica
Описание архитектуры СУБД HP Vertica
Andrey Karpov
 
Автоматизация документооборота и хранилища данных
Автоматизация документооборота и хранилища данныхАвтоматизация документооборота и хранилища данных
Автоматизация документооборота и хранилища данныхvo1kov
 
АрхиГраф.MDM: управление мастер-данными
АрхиГраф.MDM: управление мастер-даннымиАрхиГраф.MDM: управление мастер-данными
АрхиГраф.MDM: управление мастер-данными
Sergey Gorshkov
 

What's hot (9)

Talksum dec2013 rus_generic
Talksum dec2013 rus_genericTalksum dec2013 rus_generic
Talksum dec2013 rus_generic
 
основные понятия баз данных
основные понятия баз данныхосновные понятия баз данных
основные понятия баз данных
 
14 расширенные возможности корпоративных субд
14 расширенные возможности корпоративных субд14 расширенные возможности корпоративных субд
14 расширенные возможности корпоративных субд
 
Обзор HP Vertica
Обзор HP VerticaОбзор HP Vertica
Обзор HP Vertica
 
Бизнес-ориентированное хранение данных – синхронизация потребностей бизнеса с...
Бизнес-ориентированное хранение данных – синхронизация потребностей бизнеса с...Бизнес-ориентированное хранение данных – синхронизация потребностей бизнеса с...
Бизнес-ориентированное хранение данных – синхронизация потребностей бизнеса с...
 
HP Vertica
HP VerticaHP Vertica
HP Vertica
 
Описание архитектуры СУБД HP Vertica
Описание архитектуры СУБД HP VerticaОписание архитектуры СУБД HP Vertica
Описание архитектуры СУБД HP Vertica
 
Автоматизация документооборота и хранилища данных
Автоматизация документооборота и хранилища данныхАвтоматизация документооборота и хранилища данных
Автоматизация документооборота и хранилища данных
 
АрхиГраф.MDM: управление мастер-данными
АрхиГраф.MDM: управление мастер-даннымиАрхиГраф.MDM: управление мастер-данными
АрхиГраф.MDM: управление мастер-данными
 

Viewers also liked

хранилище данных
хранилище данныххранилище данных
хранилище данныхPutinTheJew
 
Управление данными (реляционная модель)
Управление данными (реляционная модель)Управление данными (реляционная модель)
Управление данными (реляционная модель)
Ural Federal University named after First President of Russia B.N. Yeltsin
 
Управление данными (распределенная обработка)
Управление данными (распределенная обработка)Управление данными (распределенная обработка)
Управление данными (распределенная обработка)
Ural Federal University named after First President of Russia B.N. Yeltsin
 
Управление данными (дополнительно)
Управление данными (дополнительно)Управление данными (дополнительно)
Управление данными (дополнительно)
Ural Federal University named after First President of Russia B.N. Yeltsin
 
Управление данными. Основы проектирования БД
Управление данными. Основы проектирования БДУправление данными. Основы проектирования БД
Управление данными. Основы проектирования БД
Ural Federal University named after First President of Russia B.N. Yeltsin
 
Управление данными (модели данных)
Управление данными (модели данных)Управление данными (модели данных)
Управление данными (модели данных)
Ural Federal University named after First President of Russia B.N. Yeltsin
 
Управление данными (транзакции)
Управление данными (транзакции)Управление данными (транзакции)
Управление данными (транзакции)
Ural Federal University named after First President of Russia B.N. Yeltsin
 
Управление данными (хранилища данных и OLAP)
Управление данными (хранилища данных и OLAP)Управление данными (хранилища данных и OLAP)
Управление данными (хранилища данных и OLAP)
Ural Federal University named after First President of Russia B.N. Yeltsin
 
Управление данными (литература)
Управление данными (литература)Управление данными (литература)
Управление данными (литература)
Ural Federal University named after First President of Russia B.N. Yeltsin
 
СУБД 2013 Лекция №1 "Введение и начало проектирования"
СУБД 2013 Лекция №1 "Введение и начало проектирования"СУБД 2013 Лекция №1 "Введение и начало проектирования"
СУБД 2013 Лекция №1 "Введение и начало проектирования"
Technopark
 
Масштабирование баз данных. (Database Scalability)
Масштабирование баз данных. (Database Scalability)Масштабирование баз данных. (Database Scalability)
Масштабирование баз данных. (Database Scalability)Andrew Avdeev
 
Управление данными (Введение в СУБД)
Управление данными (Введение в СУБД)Управление данными (Введение в СУБД)
Управление данными (Введение в СУБД)
Ural Federal University named after First President of Russia B.N. Yeltsin
 
Управление данными (sql)
Управление данными (sql)Управление данными (sql)
Бинарные (файловые) хранилища: страшная сказка с мрачным концом / Даниил Подо...
Бинарные (файловые) хранилища: страшная сказка с мрачным концом / Даниил Подо...Бинарные (файловые) хранилища: страшная сказка с мрачным концом / Даниил Подо...
Бинарные (файловые) хранилища: страшная сказка с мрачным концом / Даниил Подо...
Ontico
 
Как устроен поиск / Андрей Аксенов (Sphinx)
Как устроен поиск / Андрей Аксенов (Sphinx)Как устроен поиск / Андрей Аксенов (Sphinx)
Как устроен поиск / Андрей Аксенов (Sphinx)
Ontico
 

Viewers also liked (15)

хранилище данных
хранилище данныххранилище данных
хранилище данных
 
Управление данными (реляционная модель)
Управление данными (реляционная модель)Управление данными (реляционная модель)
Управление данными (реляционная модель)
 
Управление данными (распределенная обработка)
Управление данными (распределенная обработка)Управление данными (распределенная обработка)
Управление данными (распределенная обработка)
 
Управление данными (дополнительно)
Управление данными (дополнительно)Управление данными (дополнительно)
Управление данными (дополнительно)
 
Управление данными. Основы проектирования БД
Управление данными. Основы проектирования БДУправление данными. Основы проектирования БД
Управление данными. Основы проектирования БД
 
Управление данными (модели данных)
Управление данными (модели данных)Управление данными (модели данных)
Управление данными (модели данных)
 
Управление данными (транзакции)
Управление данными (транзакции)Управление данными (транзакции)
Управление данными (транзакции)
 
Управление данными (хранилища данных и OLAP)
Управление данными (хранилища данных и OLAP)Управление данными (хранилища данных и OLAP)
Управление данными (хранилища данных и OLAP)
 
Управление данными (литература)
Управление данными (литература)Управление данными (литература)
Управление данными (литература)
 
СУБД 2013 Лекция №1 "Введение и начало проектирования"
СУБД 2013 Лекция №1 "Введение и начало проектирования"СУБД 2013 Лекция №1 "Введение и начало проектирования"
СУБД 2013 Лекция №1 "Введение и начало проектирования"
 
Масштабирование баз данных. (Database Scalability)
Масштабирование баз данных. (Database Scalability)Масштабирование баз данных. (Database Scalability)
Масштабирование баз данных. (Database Scalability)
 
Управление данными (Введение в СУБД)
Управление данными (Введение в СУБД)Управление данными (Введение в СУБД)
Управление данными (Введение в СУБД)
 
Управление данными (sql)
Управление данными (sql)Управление данными (sql)
Управление данными (sql)
 
Бинарные (файловые) хранилища: страшная сказка с мрачным концом / Даниил Подо...
Бинарные (файловые) хранилища: страшная сказка с мрачным концом / Даниил Подо...Бинарные (файловые) хранилища: страшная сказка с мрачным концом / Даниил Подо...
Бинарные (файловые) хранилища: страшная сказка с мрачным концом / Даниил Подо...
 
Как устроен поиск / Андрей Аксенов (Sphinx)
Как устроен поиск / Андрей Аксенов (Sphinx)Как устроен поиск / Андрей Аксенов (Sphinx)
Как устроен поиск / Андрей Аксенов (Sphinx)
 

Similar to Хранилище данных (+ облачные хранилища данных)

Знакомство с виртуализацией данных для профессионалов в области данных
Знакомство с виртуализацией данных для профессионалов в области данныхЗнакомство с виртуализацией данных для профессионалов в области данных
Знакомство с виртуализацией данных для профессионалов в области данных
Denodo
 
Знакомство с виртуализацией данных для профессионалов в области данных
Знакомство с виртуализацией данных для профессионалов в области данныхЗнакомство с виртуализацией данных для профессионалов в области данных
Знакомство с виртуализацией данных для профессионалов в области данных
Denodo
 
Построение Data Mesh на основе Виртуальных Данных
Построение Data Mesh на основе Виртуальных ДанныхПостроение Data Mesh на основе Виртуальных Данных
Построение Data Mesh на основе Виртуальных Данных
Denodo
 
Технологии анализа и обработки данных
Технологии анализа и обработки данныхТехнологии анализа и обработки данных
Технологии анализа и обработки данных
Кристина Обломова
 
Подходы к построению хранилищ данных в крупных организациях
Подходы к построению хранилищ данных в крупных организацияхПодходы к построению хранилищ данных в крупных организациях
Подходы к построению хранилищ данных в крупных организациях
Сбертех | SberTech
 
Витрины данных - загрузка данных, разработка процессов ETL
Витрины данных - загрузка данных, разработка процессов ETLВитрины данных - загрузка данных, разработка процессов ETL
Витрины данных - загрузка данных, разработка процессов ETL
Sergey Sukharev
 
IBM Technology Day 2013 Sy Storage
IBM Technology Day 2013 Sy StorageIBM Technology Day 2013 Sy Storage
IBM Technology Day 2013 Sy Storage
Sergey Kostenko
 
Преимущества построения оперативной отчетности с помощью технологий Oracle
Преимущества построения оперативной отчетности с помощью технологий OracleПреимущества построения оперативной отчетности с помощью технологий Oracle
Преимущества построения оперативной отчетности с помощью технологий OracleAndrey Akulov
 
Бизнес-контекст, совместная работа и согласованность для интеллектуального уп...
Бизнес-контекст, совместная работа и согласованность для интеллектуального уп...Бизнес-контекст, совместная работа и согласованность для интеллектуального уп...
Бизнес-контекст, совместная работа и согласованность для интеллектуального уп...
Andrew Sovtsov
 
Web весна 2012 лекция 6
Web весна 2012 лекция 6Web весна 2012 лекция 6
Web весна 2012 лекция 6Technopark
 
Облачные тестовые среды Перфоманс лаб
Облачные тестовые среды Перфоманс лабОблачные тестовые среды Перфоманс лаб
Облачные тестовые среды Перфоманс лаб
Глобал Позитив
 
Евгения Курмачева (Oracle): Oracle Database 12c
Евгения Курмачева (Oracle): Oracle Database 12cЕвгения Курмачева (Oracle): Oracle Database 12c
Евгения Курмачева (Oracle): Oracle Database 12c
Expolink
 
03.0 Системы хранения данных
03.0 Системы хранения данных03.0 Системы хранения данных
03.0 Системы хранения данных
КРОК
 
Инфраструктура Big data - от источников до быстрых витрин - версия для МИСиС
Инфраструктура Big data - от источников до быстрых витрин - версия для МИСиСИнфраструктура Big data - от источников до быстрых витрин - версия для МИСиС
Инфраструктура Big data - от источников до быстрых витрин - версия для МИСиС
Yury Petrov
 
High load2007 scaling-web-applications-rus
High load2007 scaling-web-applications-rusHigh load2007 scaling-web-applications-rus
High load2007 scaling-web-applications-rus
Vladd Ev
 
Druid - Interactive Analytics At Scale
Druid - Interactive Analytics At ScaleDruid - Interactive Analytics At Scale
Druid - Interactive Analytics At Scale
Lohika_Odessa_TechTalks
 
Domain Driven Design
Domain Driven DesignDomain Driven Design
Domain Driven Design
Pavel Tsukanov
 
1 big data oracle digi oct
1 big data oracle digi oct1 big data oracle digi oct
1 big data oracle digi oct
antishmanti
 
Организация базы знаний проектной деятельности предприятия
Организация базы знаний проектной деятельности предприятияОрганизация базы знаний проектной деятельности предприятия
Организация базы знаний проектной деятельности предприятияVasily Kazakov
 

Similar to Хранилище данных (+ облачные хранилища данных) (20)

Знакомство с виртуализацией данных для профессионалов в области данных
Знакомство с виртуализацией данных для профессионалов в области данныхЗнакомство с виртуализацией данных для профессионалов в области данных
Знакомство с виртуализацией данных для профессионалов в области данных
 
Знакомство с виртуализацией данных для профессионалов в области данных
Знакомство с виртуализацией данных для профессионалов в области данныхЗнакомство с виртуализацией данных для профессионалов в области данных
Знакомство с виртуализацией данных для профессионалов в области данных
 
Построение Data Mesh на основе Виртуальных Данных
Построение Data Mesh на основе Виртуальных ДанныхПостроение Data Mesh на основе Виртуальных Данных
Построение Data Mesh на основе Виртуальных Данных
 
Технологии анализа и обработки данных
Технологии анализа и обработки данныхТехнологии анализа и обработки данных
Технологии анализа и обработки данных
 
Подходы к построению хранилищ данных в крупных организациях
Подходы к построению хранилищ данных в крупных организацияхПодходы к построению хранилищ данных в крупных организациях
Подходы к построению хранилищ данных в крупных организациях
 
Витрины данных - загрузка данных, разработка процессов ETL
Витрины данных - загрузка данных, разработка процессов ETLВитрины данных - загрузка данных, разработка процессов ETL
Витрины данных - загрузка данных, разработка процессов ETL
 
Data centre
Data centreData centre
Data centre
 
IBM Technology Day 2013 Sy Storage
IBM Technology Day 2013 Sy StorageIBM Technology Day 2013 Sy Storage
IBM Technology Day 2013 Sy Storage
 
Преимущества построения оперативной отчетности с помощью технологий Oracle
Преимущества построения оперативной отчетности с помощью технологий OracleПреимущества построения оперативной отчетности с помощью технологий Oracle
Преимущества построения оперативной отчетности с помощью технологий Oracle
 
Бизнес-контекст, совместная работа и согласованность для интеллектуального уп...
Бизнес-контекст, совместная работа и согласованность для интеллектуального уп...Бизнес-контекст, совместная работа и согласованность для интеллектуального уп...
Бизнес-контекст, совместная работа и согласованность для интеллектуального уп...
 
Web весна 2012 лекция 6
Web весна 2012 лекция 6Web весна 2012 лекция 6
Web весна 2012 лекция 6
 
Облачные тестовые среды Перфоманс лаб
Облачные тестовые среды Перфоманс лабОблачные тестовые среды Перфоманс лаб
Облачные тестовые среды Перфоманс лаб
 
Евгения Курмачева (Oracle): Oracle Database 12c
Евгения Курмачева (Oracle): Oracle Database 12cЕвгения Курмачева (Oracle): Oracle Database 12c
Евгения Курмачева (Oracle): Oracle Database 12c
 
03.0 Системы хранения данных
03.0 Системы хранения данных03.0 Системы хранения данных
03.0 Системы хранения данных
 
Инфраструктура Big data - от источников до быстрых витрин - версия для МИСиС
Инфраструктура Big data - от источников до быстрых витрин - версия для МИСиСИнфраструктура Big data - от источников до быстрых витрин - версия для МИСиС
Инфраструктура Big data - от источников до быстрых витрин - версия для МИСиС
 
High load2007 scaling-web-applications-rus
High load2007 scaling-web-applications-rusHigh load2007 scaling-web-applications-rus
High load2007 scaling-web-applications-rus
 
Druid - Interactive Analytics At Scale
Druid - Interactive Analytics At ScaleDruid - Interactive Analytics At Scale
Druid - Interactive Analytics At Scale
 
Domain Driven Design
Domain Driven DesignDomain Driven Design
Domain Driven Design
 
1 big data oracle digi oct
1 big data oracle digi oct1 big data oracle digi oct
1 big data oracle digi oct
 
Организация базы знаний проектной деятельности предприятия
Организация базы знаний проектной деятельности предприятияОрганизация базы знаний проектной деятельности предприятия
Организация базы знаний проектной деятельности предприятия
 

More from PutinTheJew

Яндекс телепрограмма
Яндекс телепрограммаЯндекс телепрограмма
Яндекс телепрограммаPutinTheJew
 
Яндекс расписание
Яндекс расписаниеЯндекс расписание
Яндекс расписаниеPutinTheJew
 
Презенатация CMS
Презенатация CMSПрезенатация CMS
Презенатация CMSPutinTheJew
 
Business Process Managment
Business Process ManagmentBusiness Process Managment
Business Process ManagmentPutinTheJew
 
CLI Command Line Interface
CLI Command Line InterfaceCLI Command Line Interface
CLI Command Line InterfacePutinTheJew
 
Active Directory
Active DirectoryActive Directory
Active DirectoryPutinTheJew
 
яндекс.переводчик
яндекс.переводчикяндекс.переводчик
яндекс.переводчикPutinTheJew
 
яндекс.словари
яндекс.словарияндекс.словари
яндекс.словариPutinTheJew
 
Джеимс Кемерон
Джеимс КемеронДжеимс Кемерон
Джеимс КемеронPutinTheJew
 
Авторизация
АвторизацияАвторизация
АвторизацияPutinTheJew
 
товары mail.ru
товары mail.ruтовары mail.ru
товары mail.ruPutinTheJew
 
ответы mail.ru
ответы mail.ruответы mail.ru
ответы mail.ruPutinTheJew
 
Command Line Interface
Command Line InterfaceCommand Line Interface
Command Line InterfacePutinTheJew
 
Photoshop express
Photoshop expressPhotoshop express
Photoshop expressPutinTheJew
 

More from PutinTheJew (20)

Яндекс телепрограмма
Яндекс телепрограммаЯндекс телепрограмма
Яндекс телепрограмма
 
Яндекс расписание
Яндекс расписаниеЯндекс расписание
Яндекс расписание
 
Презенатация CMS
Презенатация CMSПрезенатация CMS
Презенатация CMS
 
Business Process Managment
Business Process ManagmentBusiness Process Managment
Business Process Managment
 
Web ex
Web exWeb ex
Web ex
 
Bpm
BpmBpm
Bpm
 
CLI Command Line Interface
CLI Command Line InterfaceCLI Command Line Interface
CLI Command Line Interface
 
Active Directory
Active DirectoryActive Directory
Active Directory
 
яндекс.переводчик
яндекс.переводчикяндекс.переводчик
яндекс.переводчик
 
яндекс.словари
яндекс.словарияндекс.словари
яндекс.словари
 
Джеимс Кемерон
Джеимс КемеронДжеимс Кемерон
Джеимс Кемерон
 
Авторизация
АвторизацияАвторизация
Авторизация
 
Anymeeting.com
Anymeeting.comAnymeeting.com
Anymeeting.com
 
Tiny url
Tiny urlTiny url
Tiny url
 
товары mail.ru
товары mail.ruтовары mail.ru
товары mail.ru
 
ответы mail.ru
ответы mail.ruответы mail.ru
ответы mail.ru
 
Yandex.market
Yandex.marketYandex.market
Yandex.market
 
Command Line Interface
Command Line InterfaceCommand Line Interface
Command Line Interface
 
Photoshop express
Photoshop expressPhotoshop express
Photoshop express
 
Forum2x2.ru
Forum2x2.ruForum2x2.ru
Forum2x2.ru
 

Хранилище данных (+ облачные хранилища данных)

  • 1. Хранилище данных Хранилище данных (англ. Data Warehouse) — предметно- ориентированная информационная база данных, специально разработанная и предназначенная для подготовки отчётов и бизнес-анализа с целью поддержки принятия решений в организации. Строится на базе систем управления базами данных и систем поддержки принятия решений.
  • 2. • Данные, поступающие в хранилище данных, как правило, доступны только для чтения. Данные из OLTP-системы копируются в хранилище данных таким образом, чтобы построение отчётов и OLAP-анализ не использовал ресурсы транзакционной системы и не нарушал её стабильность. Как правило, данные загружаются в хранилище с определённой периодичностью, поэтому актуальность данных может несколько отставать от OLTP-системы.
  • 3. Компоненты для анализа в хранилище данных
  • 4. Принципы организации хранилища • Проблемно-предметная ориентация. Данные объединяются в категории и хранятся в соответствии с областями, которые они описывают, а не с приложениями, которые они используют. • Интегрированность. Данные объединены так, чтобы они удовлетворяли всем требованиям предприятия в целом, а не единственной функции бизнеса. • Некорректируемость. Данные в хранилище данных не создаются: т.е. поступают из внешних источников, не корректируются и не удаляются. • Зависимость от времени. Данные в хранилище точны и корректны только в том случае, когда они привязаны к некоторому промежутку или моменту времени.
  • 5. Дизайн хранилищ данных Нормализованные хранилища данных • В нормализованных хранилищах, данные находятся в предметно ориентированных таблицах третьей нормальной формы. Нормализованные хранилища характеризуются как простые в создании и управлении, недостатки нормализованных хранилищ – большое количество таблиц как следствие нормализации, из-за чего для получения какой-либо информации нужно делать выборку из многих таблиц одновременно, что приводит к ухудшению производительности системы. Для решения этой проблемы используются денормализованные таблицы - витрины данных, на основе которых уже выводятся отчетные формы. При громадных объемах данных могут использовать несколько уровней «витрин»/«хранилищ». Хранилища с измерениями • Хранилища с измерениями используют схему «звезда» или схему «снежинка». При этом в центре «звезды» находятся данные (Таблица фактов), а измерения образуют лучи звезды. Различные таблицы фактов совместно используют таблицы измерений, что значительно облегчает операции объединения данных из нескольких предметных таблиц фактов (Пример – факты продаж и поставок товара). Таблицы данных и соответствующие измерениями образуют архитектуру «шина». Измерения часто создаются в третьей нормальной форме, в том числе, для протоколирования изменения в измерениях. Основным достоинством хранилищ с измерениями является простота и понятность для разработчиков и пользователей, также, благодаря более эффективному хранению данных и формализованным измерениям, облегчается и ускоряется доступ к данным, особенно при сложных анализах. Основным недостатком является более сложные процедуры подготовки и загрузки данных, а также управление и изменение измерений данных. • При достаточно большом объеме данных схемы «звезда» и «снежинка» также дают снижение производительности при соединениях с измерениями.
  • 6. Процессы работы с данными Источниками данных могут быть: • Традиционные системы регистрации операций • Отдельные документы • Наборы данных Операции с данными: • Извлечение – перемещение информации от источников данных в отдельную БД, приведение их к единому формату. • Преобразование – подготовка информации к хранению в оптимальной форме для реализации запроса, необходимого для принятия решений. • Загрузка – помещение данных в хранилище, производится атомарно, путем добавления новых фактов или корректировкой существующих. • Анализ – OLAP, Data Mining, сводные отчёты. • Представление результатов анализа.
  • 7. Вся эта информация используется в словаре метаданных. В словарь метаданных автоматически включаются словари источников данных. Здесь же форматы данных для их последующего согласования, периодичность пополнения данных, согласованность во времени. Задача словаря метаданных состоит в том, чтобы освободить разработчика от необходимости стандартизировать источники данных. Создание хранилищ данных не должно противоречить действующим системам сбора и обработки информации. Специальные компоненты словарей должны обеспечивать своевременное извлечение из словарей и обеспечить преобразование к единому формату на основе словаря метаданных. Логическая структура данных хранилища данных отличается от структуры данных источников данных.
  • 8. Для разработки эффективного процесса преобразования необходима хорошо проработанная модель корпоративных данных и модель технологии принятия решений. Данные для пользователя удобно представлять в многоразмерных БД, где в качестве измерения могут выступать время, цена или географический регион. Кроме извлечения данных из БД, принятия решений важен процесс извлечения знаний, в соответствии с информационными потребностями пользователя. С точки зрения пользователя в процессе извлечения знаний из БД должны решаться след. преобразования: данные → информация → знания → полученные решения.
  • 9. Облачное хранилище данных • Облачное хранилище данных (англ. cloud storage) — модель онлайн-хранилища, в котором данные хранятся на многочисленных распределённых в сети серверах, предоставляемых в пользование клиентам, в основном, третьей стороной. В отличие от модели хранения данных на собственных выделенных серверах, приобретаемых или арендуемых специально для подобных целей, количество или какая-либо внутренняя структура серверов клиенту, в общем случае, не видна. Данные хранятся и обрабатываются в так называемом облаке, которое представляет собой, с точки зрения клиента, один большой виртуальный сервер. Физически же такие серверы могут располагаться удалённо друг от друга географически, вплоть до расположения на разных континентах.
  • 10. Преимущества облачных хранилищ • Клиент платит только за то место в хранилище, которое фактически использует, но не за аренду сервера, все ресурсы которого он может и не использовать. • Клиенту нет необходимости заниматься приобретением, поддержкой и обслуживанием собственной инфраструктуры по хранению данных, что, в конечном счёте, уменьшает общие издержки производства. • Все процедуры по резервированию и сохранению целостности данных производятся провайдером облачного центра, который не вовлекает в этот процесс клиента.
  • 11. Потенциальные вопросы • Безопасность при хранении и пересылке данных является одним из основных вопросов при работе с облаком, особенно в отношении конфиденциальных, приватных данных. • Общая производительность при работе с данными в облаке может быть ниже таковой при работе с локальными копиями данных. • Надёжность и своевременность получения и доступности данных в облаке очень сильно зависит от многих промежуточных параметров, в основном таких, как каналы передачи данных на пути от клиента к облаку, вопрос последней мили, вопрос о надлежащем качестве работы интернет-провайдера клиента, вопрос о доступности самого облака в данный момент времени.
  • 12. Облачные шлюзы • Облачные шлюзы — технология, которая может быть использована для более удобного представления облака клиенту. К примеру, с помощью соответствующего программного обеспечения, хранилище в облаке может быть представлено для клиента как локальный диск на компьютере. Таким образом, работа с данными в облаке для клиента становится абсолютно прозрачной. И при наличии хорошей, быстрой связи с облаком клиент может даже не замечать, что работает не с локальными данными у себя на компьютере, а с данными, хранящимися, возможно, за много сотен километров от него.