SQL Server Analysis Services 2014
табличная модель - альтернатива кубам?
Андрей
Коршиков
korshikov@sqlpass.org
PASS Regional Mentor
for Central Eastern
Europe
@AndreyKorshikov
Global Russian Virtual Chapter
http://russianvc.sqlpass.org/
russianvc@sqlpass.org
Канал на Youtube
http://www.youtube.com/channel/UC0UA5gKnOq9TM1RNvMIArwg
1998 2000 2005 2008 2010 2011 2012 2014
OLAP Services
SQL Server 7
Analysis Services
SQL Server 2005
Analysis Services
SQL Server 2008 R2
OLAP Services
SQL Server 2000
Analysis Services
SQL Server 2008
Analysis Services
SQL Server 2012
Analysis Services
SQL Server 2014
Немного истории
Многомерный анализ данных
2009
1-й квартал
Январь
Февраль
Март
Велосипеды
Шины
Корзины
Меры (показатели)
Время
Продукты
Многомерный анализ данных
1
3
2
6
252009
1-й квартал
Январь
Февраль
Март
Велосипеды
Шины
Корзины
Меры (показатели)
Время
Продукты
Демонстрация
PowerPivot
Vertipaq (x-Velocity)
PowerPivot
Analysis
Services
Tabular Mode
Columnstore
Indexes
Tabular
BI Semantic Model
Виды BI решений в организации
Персональный Командный Организационный
BI Semantic Model
Персональный
PowerPivot for Excel
Командный
PowerPivot for Sharepoint
Организационный
Analysis Services
Пользовательские инструменты
Analytics, Reports, Scorecards,
Dashboards, приложения
Источники данных
БД, LOB-приложения, OData Feeds,
Spreadsheets, Text Files
BI Semantic Model
Модель данных
Бизнес-логика
и запросы
Доступ к данным
Гибкость Широта возможностей Масштабируемость
BI Semantic Model
Гибкость Широта возможностей Масштабируемость
приложения Reporting Services Excel PowerPivot
БД LOB-приложения Файлы OData Feeds Cloud Services
SharePoint
BI Semantic Model: архитектура
Реализация Tabular Mode
Демонстрация
установка Tabular Mode
Процесс разработки
1. Создать проект
2. Импортировать данные, создав таблицы
3. Задать связи между таблицами
4. Расширить модель с помощью вычислимых колонок, иерархий,
мер, KPIs и перспектив
5. Скрыть таблицы, колонки и меры от клиентских приложений
6. Задать секционирование для таблиц
7. Задать роли
8. Развернуть проект на сервере SSAS
21
Создание проекта
Сопровождение готового решения
• Tabular databases управляются в SQL Server Management Studio
(SSMS)
• Возможности включают:
• Восстановление из рабочей книги PowerPivot
• Управление строками соединения (connection strings)
• Добавление и управление секциями таблиц
• Добавление и управление ролями
• Обработка (Processing) баз данных, таблиц и секций таблиц
• Создание скриптов для баз данных, объектов и команд
24
Multidimensional vs Tabular Mode
Параметры сравнения
• Масштабируемость (Scalability)
• Производительность (Performance)
• Время разработки (Time to Develop)
• Обучение (Learning)
Масштабируемость
• Объем данных (Amount of Data)
• Ресурсы сервера (Server Resources)
• Дисковая подсистема (Disk Space)
Масштабируемость
Tabular Multidimensional
Технология In-Memory (x-Velocity) Пре-агрегирует данные
Может хранить большой объем данных Может хранить очень большой объем
данных
Нет агрегаций, хранение на основе
колонок
Используются агрегации для ускорения
запросов
Сжатие данных порядка 10x Сжатие данных порядка 3x
Масштабируемость
PowerPivot PowerPivot for
Sharepoint
Analysis Services
Tabular
Analysis Services
Multidimensional
высокаянизкая
Производительность
Как быстро возвращается результат?
• Агрегированные данные (Aggregate Data)
• Детализированные данные (Detail Data)
• «Кэшированный» результат (Cache Results)
Производительность
Tabular Multidimensional
Быстрее Пре-агрегирует данные
Не требуется настройка
производительности
Может хранить очень большой объем
данных
Лучше возвращает данные низкой
гранулированности
Использование агрегатов увеличивает
производительность запросов
Значительно быстрее Tabular когда
использует «разогретый кэш» (Warm
Cache)
Время разработки
• Дизайн измерений (Dimension Design)
• Создание вычислений (Calculation Creation)
• Ключевые показатели эффективности (Key Performance Indicators)
Время разработки
Tabular Multidimensional
Быстрая разработка Длинный цикл планирования и разработки
Можно создать на основе модели Power
Pivot
Требует модель измерений
Не требует модели измерений
Более простой интерфейс для создания
модели
Время разработки
PowerPivot PowerPivot for
Sharepoint
Analysis Services
Tabular
Analysis Services
Multidimensional
большоенебольшое
Обучение
Как быстро кто-то сможет освоить новую технологию?
• Требуются тренинги (обучение)
• Используются существующие знания
Обучение
Tabular Multidimensional
Используется DAX (Data Analysis Expressions)
для запросов
Используется MDX (Multi-Dimensional
Expressions) для запросов
Легко изучить если знаете формулы Excel Сложно изучить, но есть Benefits (Navigating
Hierarchies)
Обучение
PowerPivot PowerPivot for
Sharepoint
Analysis Services
Tabular
Analysis Services
Multidimensional
Требуется
время
Практически
нетребуется
Итого
выберитеTabular…
• Если у вас короткий процесс разработки
• Если вы работаете с Plethora of Memory
• Если ваша модель данных проста
• Если у вас много Disparate Data Sources
• Если пользователю надо делать запросы к большому количеству детальных данных
выберите Multidimensional…
• Если вы используете SQL Server 2008 R2 или более раннюю версию
• Если вы имеете много-терабайтный источник данных
• Если вы имеете сложную модель данных (Complex Data Model)
• Если вам нужны возможности доступные только в Multidimensional (Actions, Data
Mining, Writeback, Translations)
Сравнение возможностей
Multidimensional Tabular Power Pivot
Actions Yes No No
Aggregations Yes No No
Calculated Measures Yes Yes Yes
Custom Assemblies Yes No No
Custom Rollups Yes No No
Distinct Count Yes Yes (via DAX) Yes (via DAX)
Drillthrough Yes Yes Yes
Hierarchies Yes Yes Yes
KPIs Yes Yes Yes
Linked objects Yes No Yes (linked tables)
Many-to-many relationships Yes No No
Parent-child Hierarchies Yes Yes (via DAX) Yes (via DAX)
Partitions Yes Yes No
Perspectives Yes Yes Yes
Semi-additive Measures Yes Yes Yes
Translations Yes No No
User-defined Hierarchies Yes Yes Yes
Writeback Yes No No
Матрица принятия решения
9 8 8 3 2 4 34
26% 24% 24% 9% 6% 12% 100%
Масштабируемость Безопасность
Производитель
ность
"Гибкость"
источников
данных
Простота языка
запросов
Время
разработки
Очки
Multidimensional 80 70 80 20 40 20 63
Tabular 60 70 50 70 80 70 63
PowerPivot for SharePoint 40 20 40 70 80 80 45
PowerPivot 20 10 20 70 80 80 33
«Место под солнцем» для BISM
MOLAP
PowerPivot
BISM
масштабируемость*
удобство использования
2 GB
100 GB
5 TB
источник: Thomas Kejser, SQLCAT
ROLAP
50 TB
масштабируемость=
- хорошая поддержка для конкурентных запросов
- независимость от доступной памяти
- хорошая «ремонтопригодность»
Ресурсы
• Microsoft SQL Server 2012 Analysis Services: The BISM Tabular Model
• SSAS Team Blog
• Books Online for SQL Server – Analysis Services
• PowerPivotPro
• PowerPivot BI Semantic Model
42

SSAS: multidemention vs tabular mode

  • 1.
    SQL Server AnalysisServices 2014 табличная модель - альтернатива кубам?
  • 2.
  • 3.
    Global Russian VirtualChapter http://russianvc.sqlpass.org/ russianvc@sqlpass.org
  • 4.
  • 5.
    1998 2000 20052008 2010 2011 2012 2014 OLAP Services SQL Server 7 Analysis Services SQL Server 2005 Analysis Services SQL Server 2008 R2 OLAP Services SQL Server 2000 Analysis Services SQL Server 2008 Analysis Services SQL Server 2012 Analysis Services SQL Server 2014 Немного истории
  • 6.
    Многомерный анализ данных 2009 1-йквартал Январь Февраль Март Велосипеды Шины Корзины Меры (показатели) Время Продукты
  • 7.
    Многомерный анализ данных 1 3 2 6 252009 1-йквартал Январь Февраль Март Велосипеды Шины Корзины Меры (показатели) Время Продукты
  • 8.
  • 9.
  • 12.
  • 13.
  • 14.
    Виды BI решенийв организации Персональный Командный Организационный
  • 15.
    BI Semantic Model Персональный PowerPivotfor Excel Командный PowerPivot for Sharepoint Организационный Analysis Services Пользовательские инструменты Analytics, Reports, Scorecards, Dashboards, приложения Источники данных БД, LOB-приложения, OData Feeds, Spreadsheets, Text Files BI Semantic Model Модель данных Бизнес-логика и запросы Доступ к данным Гибкость Широта возможностей Масштабируемость
  • 16.
    BI Semantic Model ГибкостьШирота возможностей Масштабируемость
  • 17.
    приложения Reporting ServicesExcel PowerPivot БД LOB-приложения Файлы OData Feeds Cloud Services SharePoint BI Semantic Model: архитектура
  • 18.
  • 19.
  • 20.
  • 21.
    Процесс разработки 1. Создатьпроект 2. Импортировать данные, создав таблицы 3. Задать связи между таблицами 4. Расширить модель с помощью вычислимых колонок, иерархий, мер, KPIs и перспектив 5. Скрыть таблицы, колонки и меры от клиентских приложений 6. Задать секционирование для таблиц 7. Задать роли 8. Развернуть проект на сервере SSAS 21
  • 22.
  • 24.
    Сопровождение готового решения •Tabular databases управляются в SQL Server Management Studio (SSMS) • Возможности включают: • Восстановление из рабочей книги PowerPivot • Управление строками соединения (connection strings) • Добавление и управление секциями таблиц • Добавление и управление ролями • Обработка (Processing) баз данных, таблиц и секций таблиц • Создание скриптов для баз данных, объектов и команд 24
  • 25.
  • 26.
    Параметры сравнения • Масштабируемость(Scalability) • Производительность (Performance) • Время разработки (Time to Develop) • Обучение (Learning)
  • 27.
    Масштабируемость • Объем данных(Amount of Data) • Ресурсы сервера (Server Resources) • Дисковая подсистема (Disk Space)
  • 28.
    Масштабируемость Tabular Multidimensional Технология In-Memory(x-Velocity) Пре-агрегирует данные Может хранить большой объем данных Может хранить очень большой объем данных Нет агрегаций, хранение на основе колонок Используются агрегации для ускорения запросов Сжатие данных порядка 10x Сжатие данных порядка 3x
  • 29.
    Масштабируемость PowerPivot PowerPivot for Sharepoint AnalysisServices Tabular Analysis Services Multidimensional высокаянизкая
  • 30.
    Производительность Как быстро возвращаетсярезультат? • Агрегированные данные (Aggregate Data) • Детализированные данные (Detail Data) • «Кэшированный» результат (Cache Results)
  • 31.
    Производительность Tabular Multidimensional Быстрее Пре-агрегируетданные Не требуется настройка производительности Может хранить очень большой объем данных Лучше возвращает данные низкой гранулированности Использование агрегатов увеличивает производительность запросов Значительно быстрее Tabular когда использует «разогретый кэш» (Warm Cache)
  • 32.
    Время разработки • Дизайнизмерений (Dimension Design) • Создание вычислений (Calculation Creation) • Ключевые показатели эффективности (Key Performance Indicators)
  • 33.
    Время разработки Tabular Multidimensional Быстраяразработка Длинный цикл планирования и разработки Можно создать на основе модели Power Pivot Требует модель измерений Не требует модели измерений Более простой интерфейс для создания модели
  • 34.
    Время разработки PowerPivot PowerPivotfor Sharepoint Analysis Services Tabular Analysis Services Multidimensional большоенебольшое
  • 35.
    Обучение Как быстро кто-тосможет освоить новую технологию? • Требуются тренинги (обучение) • Используются существующие знания
  • 36.
    Обучение Tabular Multidimensional Используется DAX(Data Analysis Expressions) для запросов Используется MDX (Multi-Dimensional Expressions) для запросов Легко изучить если знаете формулы Excel Сложно изучить, но есть Benefits (Navigating Hierarchies)
  • 37.
    Обучение PowerPivot PowerPivot for Sharepoint AnalysisServices Tabular Analysis Services Multidimensional Требуется время Практически нетребуется
  • 38.
    Итого выберитеTabular… • Если увас короткий процесс разработки • Если вы работаете с Plethora of Memory • Если ваша модель данных проста • Если у вас много Disparate Data Sources • Если пользователю надо делать запросы к большому количеству детальных данных выберите Multidimensional… • Если вы используете SQL Server 2008 R2 или более раннюю версию • Если вы имеете много-терабайтный источник данных • Если вы имеете сложную модель данных (Complex Data Model) • Если вам нужны возможности доступные только в Multidimensional (Actions, Data Mining, Writeback, Translations)
  • 39.
    Сравнение возможностей Multidimensional TabularPower Pivot Actions Yes No No Aggregations Yes No No Calculated Measures Yes Yes Yes Custom Assemblies Yes No No Custom Rollups Yes No No Distinct Count Yes Yes (via DAX) Yes (via DAX) Drillthrough Yes Yes Yes Hierarchies Yes Yes Yes KPIs Yes Yes Yes Linked objects Yes No Yes (linked tables) Many-to-many relationships Yes No No Parent-child Hierarchies Yes Yes (via DAX) Yes (via DAX) Partitions Yes Yes No Perspectives Yes Yes Yes Semi-additive Measures Yes Yes Yes Translations Yes No No User-defined Hierarchies Yes Yes Yes Writeback Yes No No
  • 40.
    Матрица принятия решения 98 8 3 2 4 34 26% 24% 24% 9% 6% 12% 100% Масштабируемость Безопасность Производитель ность "Гибкость" источников данных Простота языка запросов Время разработки Очки Multidimensional 80 70 80 20 40 20 63 Tabular 60 70 50 70 80 70 63 PowerPivot for SharePoint 40 20 40 70 80 80 45 PowerPivot 20 10 20 70 80 80 33
  • 41.
    «Место под солнцем»для BISM MOLAP PowerPivot BISM масштабируемость* удобство использования 2 GB 100 GB 5 TB источник: Thomas Kejser, SQLCAT ROLAP 50 TB масштабируемость= - хорошая поддержка для конкурентных запросов - независимость от доступной памяти - хорошая «ремонтопригодность»
  • 42.
    Ресурсы • Microsoft SQLServer 2012 Analysis Services: The BISM Tabular Model • SSAS Team Blog • Books Online for SQL Server – Analysis Services • PowerPivotPro • PowerPivot BI Semantic Model 42