SlideShare a Scribd company logo
1 of 31
Докладчик

     Светлана Родионова
  Testing Team Lead in EPAM
       БГУ радиофизика
    опыт работы в IT 5 лет




  skype: svetlana_kolopenko
Перспективы тестирования
хранилищ данных и BI систем
   Светлана Родионова. EPAM Systems
Сложно?
НЕТ!

Заманчиво
Содержание

1. Ждать нельзя внедрять. Или почему BI системы
   выгодно использовать
       - Что такое DWH/BI
       - Преимущества BI систем в цифрах

2. Архитектура DWH/BI. Проблемы и разработанные
best practices

3. Кто такой QA в BI? Высокая востребованность
Содержание

1. Ждать нельзя внедрять. Или почему BI системы
   выгодно использовать
       - Что такое DWH/BI
       - Преимущества BI систем в цифрах

2. Архитектура DWH/BI. Проблемы и разработанные
best practices

3. Кто такой QA в BI? Высокая востребованность
Что такое DWH/BI

Кто использует BI системы?

- Главный/технический директор(CEO/CTO)
- Главы отделов и управлений
- …
Зачем понадобились BI системы
Зачем понадобились BI системы

 Невозможно использовать существующие БД
 Необходимо трансформировать данные в
  информацию
 Необходимо выработать единые методологии
  и алгоритмы внутри компании
 Растут объемы данных и нагрузки

    Эффективное принятие решений
Что такое DWH/BI

BI – это технология и
программное решение
для сбора и анализа данных,
с целью оптимизации принятия
решений.

Источником информации в BI
является хранилище данных
(DWH)
Характеристики хранилищ

предметная ориентированность


     интегрированность


        историчность


       стабильность

  нацеленность на принятие
          решений
Преимущества BI-систем в цифрах
       Преимущества от внедрения BI (по BARC)
45%
40%
35%
30%
25%
20%
15%
10%
5%
0%
Содержание

1. Ждать нельзя внедрять. Или почему BI системы
   выгодно использовать
       - Что такое DWH/BI
       - Преимущества BI систем в цифрах

2. Архитектура DWH/BI. Проблемы и разработанные
best practices

3. Кто такой QA в BI? Высокая востребованность
Архитектура DWH/BI


                           Анализ
                         Отчетность


               DWH
            хранилище
источники
Архитектура DWH/BI




STAGING            MARTS
          STORE
Архитектура DWH/BI




STAGING            MARTS
          STORE
STAGING




Захват              Трансформация          Очистка
• Данные real-      • Разные               • Изоляция
  time                форматы                ошибочных
• Потеря/порча/     • Переименования         записей
  дублирование
  данных


                  + Performance загрузки
Архитектура DWH/BI




STAGING            MARTS
          STORE
STORE




Загрузка/Чистка      Консолидация        Подготовка
• Частичная          • Неверные          • Логические
  загрузка             бизнес правила      ошибки в
• Изоляция ошибок    • Пропущенные         построении
                       записи


                + Performance загрузки
STAGING - STORE
Диаграммы                        Маппинг




SOURCE                                                     TARGET

         Select * from source minus select * from target
Архитектура DWH/BI




STAGING            MARTS
          STORE
MARTS




Агрегация                   Предрасчеты
• Ошибки агрегирующих       • Ошибки расчетов
  функций                   • Неверная логика
• Фильтры                     расчетов
Регрессия

КАК тестировать постоянно изменяющиеся системы?


     STG     ETL1           ETL1
                    STORE             MARTS1
    build1


                                   Сравнить тестовые
                                      результаты



     STG     ETL2           ETL2
                    STORE             MARTS2
    build2
Архитектура DWH/BI


                           Анализ
                         Отчетность


               DWH
            хранилище
источники
Архитектура DWH/BI



           Анализ
         Отчетность




AD                    PRINT
HOC                   READY
Анализ и отчетность

Data Mart        Отчетность
Отчетность




Данные                   Структура          Расчеты
• Ошибки в               • Неверная         • Ошибки в
  запросах в базе          структура или      расчете
• Неверная логика          /и формат          метрик
  отчетов                • Drills


                    + Performance отчетов
Содержание

1. Ждать нельзя внедрять. Или почему BI системы
   выгодно использовать
       - Что такое DWH/BI
       - Преимущества BI систем в цифрах

2. Архитектура DWH/BI. Проблемы и разработанные
best practices

3. Кто такой QA в BI? Высокая востребованность
Кто такой QA в BI?
Кто такой QA в BI?




                    - ETL           - Комплексное
                                    тестовое
                    - OLAP          окружение
- Знания DW/BI
                    - Опыт          - Менеджмент
- SQL
                    автоматизации
                                    - Специфика BI и
                                    заказчиков
Вопросы ?

More Related Content

Similar to Перспективы тестирования хранилищ данных и BI систем

Аналитика для розничного финансового бизнеса
Аналитика для розничного финансового бизнесаАналитика для розничного финансового бизнеса
Аналитика для розничного финансового бизнесаAlexey Glagolev
 
Реализация bi-системы собственными силами или как снизить стоимость проекта. ...
Реализация bi-системы собственными силами или как снизить стоимость проекта. ...Реализация bi-системы собственными силами или как снизить стоимость проекта. ...
Реализация bi-системы собственными силами или как снизить стоимость проекта. ...КРОК
 
Преимущества построения оперативной отчетности с помощью технологий Oracle
Преимущества построения оперативной отчетности с помощью технологий OracleПреимущества построения оперативной отчетности с помощью технологий Oracle
Преимущества построения оперативной отчетности с помощью технологий OracleAndrey Akulov
 
Oracle Business Analytics Overview
Oracle Business Analytics OverviewOracle Business Analytics Overview
Oracle Business Analytics Overviewcrm2life
 
Особенности ETL — инструмента pentaho data integrator. Опыт КРОК
Особенности ETL — инструмента pentaho data integrator. Опыт КРОКОсобенности ETL — инструмента pentaho data integrator. Опыт КРОК
Особенности ETL — инструмента pentaho data integrator. Опыт КРОККРОК
 
Self Service BI. Как перейти от Excel к визуализации / Иван Климович для Data...
Self Service BI. Как перейти от Excel к визуализации / Иван Климович для Data...Self Service BI. Как перейти от Excel к визуализации / Иван Климович для Data...
Self Service BI. Как перейти от Excel к визуализации / Иван Климович для Data...WG_ Events
 
Подходы к построению хранилищ данных в крупных организациях
Подходы к построению хранилищ данных в крупных организацияхПодходы к построению хранилищ данных в крупных организациях
Подходы к построению хранилищ данных в крупных организацияхСбертех | SberTech
 
Презентация аналитической системы для ритейла СуперМаг BI
Презентация аналитической системы для ритейла СуперМаг BIПрезентация аналитической системы для ритейла СуперМаг BI
Презентация аналитической системы для ритейла СуперМаг BIОникс Софт
 
Oracle database In-Memory - новая технология обработки в памяти
Oracle database In-Memory - новая технология обработки в памятиOracle database In-Memory - новая технология обработки в памяти
Oracle database In-Memory - новая технология обработки в памятиAndrey Akulov
 
Informatica for Data Warehouse Optimisation and Data Lake Use-cases
Informatica for Data Warehouse Optimisation and Data Lake Use-casesInformatica for Data Warehouse Optimisation and Data Lake Use-cases
Informatica for Data Warehouse Optimisation and Data Lake Use-casesIlya Gershanov
 
Аналитика в управлении персоналом SAP BI
Аналитика в управлении персоналом SAP BIАналитика в управлении персоналом SAP BI
Аналитика в управлении персоналом SAP BImolga-ru
 
Oracle Big Data proposition
Oracle Big Data propositionOracle Big Data proposition
Oracle Big Data propositionAndrey Akulov
 
Бизнес аналитика от компании "Формула торговли" г. Сыктывкар
Бизнес аналитика от компании "Формула торговли" г. СыктывкарБизнес аналитика от компании "Формула торговли" г. Сыктывкар
Бизнес аналитика от компании "Формула торговли" г. СыктывкарДенис Смирнов
 
Стратегия и тактика улучшения производительности BSS систем оператора мобильн...
Стратегия и тактика улучшения производительности BSS систем оператора мобильн...Стратегия и тактика улучшения производительности BSS систем оператора мобильн...
Стратегия и тактика улучшения производительности BSS систем оператора мобильн...Ontico
 
ИТ: архитектура и стратегия предприятия
ИТ: архитектура и стратегия предприятияИТ: архитектура и стратегия предприятия
ИТ: архитектура и стратегия предприятияYury Kupriyanov
 
Bi For Corporation Usage Oct2012
Bi For Corporation Usage Oct2012Bi For Corporation Usage Oct2012
Bi For Corporation Usage Oct2012Serpen
 
14 расширенные возможности корпоративных субд
14 расширенные возможности корпоративных субд14 расширенные возможности корпоративных субд
14 расширенные возможности корпоративных субдKewpaN
 

Similar to Перспективы тестирования хранилищ данных и BI систем (20)

Аналитика для розничного финансового бизнеса
Аналитика для розничного финансового бизнесаАналитика для розничного финансового бизнеса
Аналитика для розничного финансового бизнеса
 
Реализация bi-системы собственными силами или как снизить стоимость проекта. ...
Реализация bi-системы собственными силами или как снизить стоимость проекта. ...Реализация bi-системы собственными силами или как снизить стоимость проекта. ...
Реализация bi-системы собственными силами или как снизить стоимость проекта. ...
 
Преимущества построения оперативной отчетности с помощью технологий Oracle
Преимущества построения оперативной отчетности с помощью технологий OracleПреимущества построения оперативной отчетности с помощью технологий Oracle
Преимущества построения оперативной отчетности с помощью технологий Oracle
 
Oracle Business Analytics Overview
Oracle Business Analytics OverviewOracle Business Analytics Overview
Oracle Business Analytics Overview
 
Особенности ETL — инструмента pentaho data integrator. Опыт КРОК
Особенности ETL — инструмента pentaho data integrator. Опыт КРОКОсобенности ETL — инструмента pentaho data integrator. Опыт КРОК
Особенности ETL — инструмента pentaho data integrator. Опыт КРОК
 
Self Service BI. Как перейти от Excel к визуализации / Иван Климович для Data...
Self Service BI. Как перейти от Excel к визуализации / Иван Климович для Data...Self Service BI. Как перейти от Excel к визуализации / Иван Климович для Data...
Self Service BI. Как перейти от Excel к визуализации / Иван Климович для Data...
 
Подходы к построению хранилищ данных в крупных организациях
Подходы к построению хранилищ данных в крупных организацияхПодходы к построению хранилищ данных в крупных организациях
Подходы к построению хранилищ данных в крупных организациях
 
Презентация аналитической системы для ритейла СуперМаг BI
Презентация аналитической системы для ритейла СуперМаг BIПрезентация аналитической системы для ритейла СуперМаг BI
Презентация аналитической системы для ритейла СуперМаг BI
 
Oracle database In-Memory - новая технология обработки в памяти
Oracle database In-Memory - новая технология обработки в памятиOracle database In-Memory - новая технология обработки в памяти
Oracle database In-Memory - новая технология обработки в памяти
 
Informatica for Data Warehouse Optimisation and Data Lake Use-cases
Informatica for Data Warehouse Optimisation and Data Lake Use-casesInformatica for Data Warehouse Optimisation and Data Lake Use-cases
Informatica for Data Warehouse Optimisation and Data Lake Use-cases
 
Bi Ыystem
Bi ЫystemBi Ыystem
Bi Ыystem
 
Аналитика в управлении персоналом SAP BI
Аналитика в управлении персоналом SAP BIАналитика в управлении персоналом SAP BI
Аналитика в управлении персоналом SAP BI
 
Operational Reporting
Operational ReportingOperational Reporting
Operational Reporting
 
Oracle Big Data proposition
Oracle Big Data propositionOracle Big Data proposition
Oracle Big Data proposition
 
Бизнес аналитика от компании "Формула торговли" г. Сыктывкар
Бизнес аналитика от компании "Формула торговли" г. СыктывкарБизнес аналитика от компании "Формула торговли" г. Сыктывкар
Бизнес аналитика от компании "Формула торговли" г. Сыктывкар
 
Стратегия и тактика улучшения производительности BSS систем оператора мобильн...
Стратегия и тактика улучшения производительности BSS систем оператора мобильн...Стратегия и тактика улучшения производительности BSS систем оператора мобильн...
Стратегия и тактика улучшения производительности BSS систем оператора мобильн...
 
BI System
BI SystemBI System
BI System
 
ИТ: архитектура и стратегия предприятия
ИТ: архитектура и стратегия предприятияИТ: архитектура и стратегия предприятия
ИТ: архитектура и стратегия предприятия
 
Bi For Corporation Usage Oct2012
Bi For Corporation Usage Oct2012Bi For Corporation Usage Oct2012
Bi For Corporation Usage Oct2012
 
14 расширенные возможности корпоративных субд
14 расширенные возможности корпоративных субд14 расширенные возможности корпоративных субд
14 расширенные возможности корпоративных субд
 

More from SQALab

Готовим стажировку
Готовим стажировкуГотовим стажировку
Готовим стажировкуSQALab
 
Куда приводят мечты? или Искусство развития тестировщика
Куда приводят мечты? или Искусство развития тестировщикаКуда приводят мечты? или Искусство развития тестировщика
Куда приводят мечты? или Искусство развития тестировщикаSQALab
 
Оптимизация Selenium тестов и ускорение их поддержки
Оптимизация Selenium тестов и ускорение их поддержкиОптимизация Selenium тестов и ускорение их поддержки
Оптимизация Selenium тестов и ускорение их поддержкиSQALab
 
Автоматизация 0.0: 0 - бюджет, 0 - опыт программирования
Автоматизация 0.0: 0 - бюджет, 0 - опыт программированияАвтоматизация 0.0: 0 - бюджет, 0 - опыт программирования
Автоматизация 0.0: 0 - бюджет, 0 - опыт программированияSQALab
 
Нагрузочное тестирование нестандартных протоколов с использованием Citrix и J...
Нагрузочное тестирование нестандартных протоколов с использованием Citrix и J...Нагрузочное тестирование нестандартных протоколов с использованием Citrix и J...
Нагрузочное тестирование нестандартных протоколов с использованием Citrix и J...SQALab
 
Continuous performance testing
Continuous performance testingContinuous performance testing
Continuous performance testingSQALab
 
Конфиги вместо костылей. Pytestconfig и зачем он нужен
Конфиги вместо костылей. Pytestconfig и зачем он нуженКонфиги вместо костылей. Pytestconfig и зачем он нужен
Конфиги вместо костылей. Pytestconfig и зачем он нуженSQALab
 
Команда чемпионов в ИТ стихии
Команда чемпионов в ИТ стихииКоманда чемпионов в ИТ стихии
Команда чемпионов в ИТ стихииSQALab
 
API. Серебряная пуля в магазине советов
API. Серебряная пуля в магазине советовAPI. Серебряная пуля в магазине советов
API. Серебряная пуля в магазине советовSQALab
 
Добиваемся эффективности каждого из 9000+ UI-тестов
Добиваемся эффективности каждого из 9000+ UI-тестовДобиваемся эффективности каждого из 9000+ UI-тестов
Добиваемся эффективности каждого из 9000+ UI-тестовSQALab
 
Делаем автоматизацию проектных KPIs
Делаем автоматизацию проектных KPIsДелаем автоматизацию проектных KPIs
Делаем автоматизацию проектных KPIsSQALab
 
Вредные привычки в тест-менеджменте
Вредные привычки в тест-менеджментеВредные привычки в тест-менеджменте
Вредные привычки в тест-менеджментеSQALab
 
Мощь переполняет с JDI 2.0 - новая эра UI автоматизации
Мощь переполняет с JDI 2.0 - новая эра UI автоматизацииМощь переполняет с JDI 2.0 - новая эра UI автоматизации
Мощь переполняет с JDI 2.0 - новая эра UI автоматизацииSQALab
 
Как hh.ru дошли до 500 релизов в квартал без потери в качестве
Как hh.ru дошли до 500 релизов в квартал без потери в качествеКак hh.ru дошли до 500 релизов в квартал без потери в качестве
Как hh.ru дошли до 500 релизов в квартал без потери в качествеSQALab
 
Стили лидерства и тестирование
Стили лидерства и тестированиеСтили лидерства и тестирование
Стили лидерства и тестированиеSQALab
 
"Давайте не будем про качество"
"Давайте не будем про качество""Давайте не будем про качество"
"Давайте не будем про качество"SQALab
 
Apache.JMeter для .NET-проектов
Apache.JMeter для .NET-проектовApache.JMeter для .NET-проектов
Apache.JMeter для .NET-проектовSQALab
 
Тестирование геолокационных систем
Тестирование геолокационных системТестирование геолокационных систем
Тестирование геолокационных системSQALab
 
Лидер или босс? Вот в чем вопрос
Лидер или босс? Вот в чем вопросЛидер или босс? Вот в чем вопрос
Лидер или босс? Вот в чем вопросSQALab
 
От Зефира в коробке к Structure Zephyr или как тест-менеджеру перекроить внут...
От Зефира в коробке к Structure Zephyr или как тест-менеджеру перекроить внут...От Зефира в коробке к Structure Zephyr или как тест-менеджеру перекроить внут...
От Зефира в коробке к Structure Zephyr или как тест-менеджеру перекроить внут...SQALab
 

More from SQALab (20)

Готовим стажировку
Готовим стажировкуГотовим стажировку
Готовим стажировку
 
Куда приводят мечты? или Искусство развития тестировщика
Куда приводят мечты? или Искусство развития тестировщикаКуда приводят мечты? или Искусство развития тестировщика
Куда приводят мечты? или Искусство развития тестировщика
 
Оптимизация Selenium тестов и ускорение их поддержки
Оптимизация Selenium тестов и ускорение их поддержкиОптимизация Selenium тестов и ускорение их поддержки
Оптимизация Selenium тестов и ускорение их поддержки
 
Автоматизация 0.0: 0 - бюджет, 0 - опыт программирования
Автоматизация 0.0: 0 - бюджет, 0 - опыт программированияАвтоматизация 0.0: 0 - бюджет, 0 - опыт программирования
Автоматизация 0.0: 0 - бюджет, 0 - опыт программирования
 
Нагрузочное тестирование нестандартных протоколов с использованием Citrix и J...
Нагрузочное тестирование нестандартных протоколов с использованием Citrix и J...Нагрузочное тестирование нестандартных протоколов с использованием Citrix и J...
Нагрузочное тестирование нестандартных протоколов с использованием Citrix и J...
 
Continuous performance testing
Continuous performance testingContinuous performance testing
Continuous performance testing
 
Конфиги вместо костылей. Pytestconfig и зачем он нужен
Конфиги вместо костылей. Pytestconfig и зачем он нуженКонфиги вместо костылей. Pytestconfig и зачем он нужен
Конфиги вместо костылей. Pytestconfig и зачем он нужен
 
Команда чемпионов в ИТ стихии
Команда чемпионов в ИТ стихииКоманда чемпионов в ИТ стихии
Команда чемпионов в ИТ стихии
 
API. Серебряная пуля в магазине советов
API. Серебряная пуля в магазине советовAPI. Серебряная пуля в магазине советов
API. Серебряная пуля в магазине советов
 
Добиваемся эффективности каждого из 9000+ UI-тестов
Добиваемся эффективности каждого из 9000+ UI-тестовДобиваемся эффективности каждого из 9000+ UI-тестов
Добиваемся эффективности каждого из 9000+ UI-тестов
 
Делаем автоматизацию проектных KPIs
Делаем автоматизацию проектных KPIsДелаем автоматизацию проектных KPIs
Делаем автоматизацию проектных KPIs
 
Вредные привычки в тест-менеджменте
Вредные привычки в тест-менеджментеВредные привычки в тест-менеджменте
Вредные привычки в тест-менеджменте
 
Мощь переполняет с JDI 2.0 - новая эра UI автоматизации
Мощь переполняет с JDI 2.0 - новая эра UI автоматизацииМощь переполняет с JDI 2.0 - новая эра UI автоматизации
Мощь переполняет с JDI 2.0 - новая эра UI автоматизации
 
Как hh.ru дошли до 500 релизов в квартал без потери в качестве
Как hh.ru дошли до 500 релизов в квартал без потери в качествеКак hh.ru дошли до 500 релизов в квартал без потери в качестве
Как hh.ru дошли до 500 релизов в квартал без потери в качестве
 
Стили лидерства и тестирование
Стили лидерства и тестированиеСтили лидерства и тестирование
Стили лидерства и тестирование
 
"Давайте не будем про качество"
"Давайте не будем про качество""Давайте не будем про качество"
"Давайте не будем про качество"
 
Apache.JMeter для .NET-проектов
Apache.JMeter для .NET-проектовApache.JMeter для .NET-проектов
Apache.JMeter для .NET-проектов
 
Тестирование геолокационных систем
Тестирование геолокационных системТестирование геолокационных систем
Тестирование геолокационных систем
 
Лидер или босс? Вот в чем вопрос
Лидер или босс? Вот в чем вопросЛидер или босс? Вот в чем вопрос
Лидер или босс? Вот в чем вопрос
 
От Зефира в коробке к Structure Zephyr или как тест-менеджеру перекроить внут...
От Зефира в коробке к Structure Zephyr или как тест-менеджеру перекроить внут...От Зефира в коробке к Structure Zephyr или как тест-менеджеру перекроить внут...
От Зефира в коробке к Structure Zephyr или как тест-менеджеру перекроить внут...
 

Перспективы тестирования хранилищ данных и BI систем

  • 1. Докладчик Светлана Родионова Testing Team Lead in EPAM БГУ радиофизика опыт работы в IT 5 лет skype: svetlana_kolopenko
  • 2. Перспективы тестирования хранилищ данных и BI систем Светлана Родионова. EPAM Systems
  • 5. Содержание 1. Ждать нельзя внедрять. Или почему BI системы выгодно использовать - Что такое DWH/BI - Преимущества BI систем в цифрах 2. Архитектура DWH/BI. Проблемы и разработанные best practices 3. Кто такой QA в BI? Высокая востребованность
  • 6. Содержание 1. Ждать нельзя внедрять. Или почему BI системы выгодно использовать - Что такое DWH/BI - Преимущества BI систем в цифрах 2. Архитектура DWH/BI. Проблемы и разработанные best practices 3. Кто такой QA в BI? Высокая востребованность
  • 7. Что такое DWH/BI Кто использует BI системы? - Главный/технический директор(CEO/CTO) - Главы отделов и управлений - …
  • 9. Зачем понадобились BI системы  Невозможно использовать существующие БД  Необходимо трансформировать данные в информацию  Необходимо выработать единые методологии и алгоритмы внутри компании  Растут объемы данных и нагрузки Эффективное принятие решений
  • 10. Что такое DWH/BI BI – это технология и программное решение для сбора и анализа данных, с целью оптимизации принятия решений. Источником информации в BI является хранилище данных (DWH)
  • 11. Характеристики хранилищ предметная ориентированность интегрированность историчность стабильность нацеленность на принятие решений
  • 12. Преимущества BI-систем в цифрах Преимущества от внедрения BI (по BARC) 45% 40% 35% 30% 25% 20% 15% 10% 5% 0%
  • 13. Содержание 1. Ждать нельзя внедрять. Или почему BI системы выгодно использовать - Что такое DWH/BI - Преимущества BI систем в цифрах 2. Архитектура DWH/BI. Проблемы и разработанные best practices 3. Кто такой QA в BI? Высокая востребованность
  • 14. Архитектура DWH/BI Анализ Отчетность DWH хранилище источники
  • 17. STAGING Захват Трансформация Очистка • Данные real- • Разные • Изоляция time форматы ошибочных • Потеря/порча/ • Переименования записей дублирование данных + Performance загрузки
  • 19. STORE Загрузка/Чистка Консолидация Подготовка • Частичная • Неверные • Логические загрузка бизнес правила ошибки в • Изоляция ошибок • Пропущенные построении записи + Performance загрузки
  • 20. STAGING - STORE Диаграммы Маппинг SOURCE TARGET Select * from source minus select * from target
  • 22. MARTS Агрегация Предрасчеты • Ошибки агрегирующих • Ошибки расчетов функций • Неверная логика • Фильтры расчетов
  • 23. Регрессия КАК тестировать постоянно изменяющиеся системы? STG ETL1 ETL1 STORE MARTS1 build1 Сравнить тестовые результаты STG ETL2 ETL2 STORE MARTS2 build2
  • 24. Архитектура DWH/BI Анализ Отчетность DWH хранилище источники
  • 25. Архитектура DWH/BI Анализ Отчетность AD PRINT HOC READY
  • 26. Анализ и отчетность Data Mart Отчетность
  • 27. Отчетность Данные Структура Расчеты • Ошибки в • Неверная • Ошибки в запросах в базе структура или расчете • Неверная логика /и формат метрик отчетов • Drills + Performance отчетов
  • 28. Содержание 1. Ждать нельзя внедрять. Или почему BI системы выгодно использовать - Что такое DWH/BI - Преимущества BI систем в цифрах 2. Архитектура DWH/BI. Проблемы и разработанные best practices 3. Кто такой QA в BI? Высокая востребованность
  • 30. Кто такой QA в BI? - ETL - Комплексное тестовое - OLAP окружение - Знания DW/BI - Опыт - Менеджмент - SQL автоматизации - Специфика BI и заказчиков

Editor's Notes

  1. Я могла бы начать рассказывать с детальной архитектуры хранилища данных, но не стану 
  2. Бизнес-анализ ( BI) нацелен на качественное повышение работы бизнеса. Широко применяется в таких сферах деятельности как производство, оптовая или розничная торговля, управление проектами, страхование, маркетинг, управление, бюджетирование и планирование.Невозможно использоватьсуществующие БД для отчетности и анализа данныхХранилища данных решают задачу трансформирования данных в информациюОни могут справиться с нагрузкой, поступающей от аналитиков и персонала, с очень быстрым ростом объема данныхНеобходимость быстрее и эффективнее реагировать на изменчивость рынка, в том числе на динамику потребительского поведения. Необходимость единых для всей компании методологии и алгоритмов расчета показателей
  3. BI – это сбор, управление, распределение и анализ информации с целью выработки такого видения проблемы, которое позволяет принять наилучшее решение. BI – это процесс последовательного преобразования данных в прикладное знание, которое позволяет принимать решение. BI поддерживается данными из хранилищ, методами разработки данных, технологиями поддержки принятия решенийИначе, BI - это совокупность технологий, программного обеспечения и практик, направленных на достижение целей бизнеса путём наилучшего использования имеющихся данных.
  4. предметно-ориентированыв них помещается только та информация, которая может быть полезной для работы систем поддержки принятия решений (DSS).интегрированные данныеОни интегрированы на множестве уровней: на уровне ключа, атрибута, на описательном, структурном уровне и так далее. Общие данные и общая обработка данных консолидированы и являются единообразными для всех данных, которые подобны или схожи в Хранилище данныхДанные в информационное хранилище поступают из различных источников, где они могут иметь разные имена, атрибуты, единицы измерения и способы кодировки. После загрузки в DW данные очищаются от индивидуальных признаков, т. е. как бы приводятся к общему знаменателю. С этого момента они представляются пользователю в виде единого информационного пространства.Если в четырех разных приложениях пол клиента кодировался четырьмя различными способами, то в информационном хранилище будет использована единая для всех данных схема кодировки (например, f,m).- историчностьВ OLTP-системах истинность данных гарантирована только в момент чтения, поскольку уже в следующее мгновение они могут измениться в результате очередной транзакции. Важным отличием DW от OLTP-систем является то, что данные в них сохраняют свою истинность в любой момент процесса чтения.Временная инвариантность данных в DW достигается за счет введения полей с атрибутом "время" (день, неделя, месяц) в ключи таблиц. В результате записи в таблицах DW никогда не изменяются, представляя собой снимки данных, сделанные в определенные отрезки времени. В DW содержатся как бы моментальные снимки данных. Каждый элемент в своем ключе явно или косвенно хранит временной параметр, например день, месяц или год.СтабильностьВ OLTP-системах записи могут регулярно добавляться, удаляться и редактироваться. В DW-системах, как следует из требования временной инвариантности, однажды загруженные данные теоретически никогда не меняются. По отношению к ним возможны только две операции: начальная загрузка и чтение (доступ)
  5. Вопрос об эффекте внедрения BI систем стал одним из ключевых в ходе исследования BARC (Business Application Research Center) в 2011 году. Интересно, что BARC включает этот вопрос в свое исследование с 2002 года, так что данные в отчете компании представлены в динамике. Всего исследователи выделили 11 преимуществ от внедрения BI системы.Как следует из этих данных, наиболее доказанным количественным является достижение следующих преимуществ от использования BI систем: более быстрая подготовка отчетов, аналитики и планирование (39,3%); более точные отчетность, анализ и планирование (37,3%); улучшение качества данных (26,7%). Высокие показатели (более 30%) в категории доказанных, но не измеренных количественно преимуществ набрали помимо выше перечисленных также: повышение удовлетворенности клиентов, оптимизация процессов принятия решений, а также повышение удовлетворенности сотрудников.
  6. Основным назначением BI-систем является обеспечение возможности анализа больших объемов информации для решения бизнес-задач. Это определяет специфику архитектуры таких систем, которая направлена на эффективное получение, обработку и предоставление данных конечным пользователям. В укрупненном виде архитектуру можно представить следующим образом:
  7. End-To-EndтестированиеDWH возможно только на препродакшн среде из-за невозможности сымитировать постоянную нагрузку на базу источник, сымитировать постоянно изменяющиеся данные, а так же из-за больших объёмов данных и большой длительности загрузки данных на каждом этапе.ПОЭТОМУ тестирование DWH разбивается на тестирование отдельных его компонентов, что осложняется тем, что на входе каждого компонента поступают данные, полученные в результате работы предыдущего (+состояние базы, состояние ЕТЛей и др.)Нужно хорошо знать внутреннюю организацию и архитектуру хранилища.
  8. STAGINGЕго назначение — минимизировать нагрузку на источники, поэтому данные на этом уровне представляют собой копии структур на момент извлечения из источников. Для поддержания актуальности данных приходиться применять механизм отслеживания измененных данных, коротко — streams, CDC.Полученные данные преобразуются к унифицированному виду на детальном уровне. При необходимости, на этапе преобразования данных происходит их «очистка» — например удаление дублирующихся записей.
  9. Характеристика Стейджинга – захват и трансформацияДанные в разных форматах -> - проверять, что они резолваются верно проверка сведЕния данных к единой системе2. Часть данных может быть потеряна/испорченаПроверка данных по количеству и качеству на источнике и в хранилище3. Данные поступают real-timeНеобходимость создание урезанного датасетаТестирование процесса репликации4. Перфоманс – инкрементал и инишиал загрузка
  10. Cleansing dataConsolidation dataMerging data- предназначен непосредственно для хранения значимой, проверенной, согласованной, непротиворечивой и хронологически целостной информации, которую с достаточно высокой степенью уверенностиможно считать достоверной. - Стор должен обеспечить целостность и поддерживать хронологию всевозможных корпоративных данных.
  11. Неверные бизнес-правилаПропущенные ошибочные записиПроверка данных по количеству и качеству на STAGING и STOREИспользуем диаграммы и маппинг файлы !!!
  12. Агрегации и предрасчеты
  13. Проверить что агрег.функции работают с нужными данными и верным способомОшибки в логике расчетовПроверка логических правилИспользуем диаграммы и маппинг файлы !!!
  14. Отчетность (Reporting) – создание различных интерактивных отчетов на основе on-line данных, с возможностью приведения их к необходимым стандартизированным формам.Интерактивная информационная панель (Dashboards) – интерактивные отчеты представляют собой удобные информационные формы с возможностью углубления в данные (функции drill-down, drill-up), позволяющие проводить сравнение различных данных и показателей на основе запрашиваемой аналитики.Нестандартные запросы (Adhocquery) – возможность самостоятельного формирования пользователями запросов по требованию для создания необходимых отчетов.
  15. ХД строятся на основе многомерной модели данных. Многомерная модель данных подразумевает выделение отдельных измерений (время, география, клиент, счет) и фактов (объем продаж, доход, количество товара), которые анализируются по выбранным измерениям. Она выполняется по схеме "звезда" или "снежинка". Данные схемы предполагают выделение таблиц фактов и таблиц измерений. Каждая таблица фактов содержит детальные данные и внешние ключи на таблицы измерений. 
  16. Структура отчетности- Верная структура/формат- Соответствует требованиямДанные- Проверка данных на презентационном слое vs STAGINGПерфоманс- Отчеты должны работать в установленных временных промежуткахДоступ к данным- Проверка системы ролейФормулы и расчеты- Проверка расчетных значений метрикDrills- Проверка отображения данных при смещении к детальному уровню и наоборотSQL queries against source and target databases (varying)SQL queries to compare data at each stage of transformation (varying)Custom-built, reusable test utilities (e.g., Excel macros) to populate data from source systems and reports, automate comparison and flash data errors. Such utilities have the following advantages:Reduction in human errors of omission in identifying data mismatchesProductivity enhancementReusability across different stages and objectsTemplates to track defects/test results Test artifacts - test strategy, test plan and test cases; a common and largely re-usable templatesof these documents can prove handy in gaining speed in initiating testing for new functionalareas/reports/projects
  17. знания DW/BI концепции и инструментовSQLпонимание ETL и OLAP архитектурыОпыт автоматизацииРабота с комплексным тестовым окружением Навыки менеджментаПонимание специфики BI систем и заказчиков