SlideShare a Scribd company logo
Содержание
Описание архитектуры СУБД HP Vertica....................................................................................................2
Общие сведения......................................................................................................................................2
Представление данных в HP Vertica ......................................................................................................2
Массивная параллельная обработка (MPP)..........................................................................................3
Колоночное хранение данных ...............................................................................................................3
Эффективная компрессия данных .........................................................................................................4
Отказоустойчивость.................................................................................................................................4
Безопасность............................................................................................................................................5
Загрузка данных...........................................................................................................................................5
Загрузка структурированных данных в HP Vertica................................................................................5
Загрузка неструктурированных данных в HP Vertica (Flex Zone).........................................................6
Пользовательский механизм загрузки..................................................................................................6
Выборка и анализ данных ..........................................................................................................................7
Стандартные механизмы доступа..........................................................................................................7
Аналитическая платформа......................................................................................................................7
Аналитические расширения...................................................................................................................7
Интеграции со сторонними системами.....................................................................................................7
Поддержка инструментов BI и средств визуализации.........................................................................8
Поддержка систем класса ETL/ELT и репликаторов.............................................................................8
Интеграция с Hadoop...............................................................................................................................8
Администрирование ...................................................................................................................................8
Разворачивание системы........................................................................................................................8
Требования к аппаратному и общесистемному программному обеспечению ................................9
Инструмент управления Management Console ...................................................................................10
Оптимизация с помощью Database Designer ......................................................................................10
Резервное копирование .......................................................................................................................10
Организация зон разработки и тестирования ....................................................................................11
Лицензирование....................................................................................................................................11
Описание архитектуры СУБД HP Vertica
Общие сведения
Продукт HP Vertica является системой управления базами данных, работающей по принципам
массивной параллельной обработки и разработанной специально для хранения и обработки
больших объемов данных.
HP Vertica поддерживает язык SQL, стандартные интерфейсы доступа к данным ODBC, JDBC,
ADO.NET, а также содержащий множество коннекторов к различным инструментам бизнес-
аналитики и анализа данных.
Кластер СУБД HP Vertica состоит из узлов стандартной архитектуры x86, объединенных сетевым
соединением. Все узлы кластера являются равноценными, любой из узлов кластера может
принимать и обслуживать запросы пользователей, а также выполнять загрузку данных.
Рисунок 1 Кластер HP Vertica
Представление данных в HP Vertica
Данные в HP Vertica хранятся в виде проекций. При создании базы данных создается мастер-
проекция, содержащая весь объем загруженных данных. Также, в процессе эксплуатации системы
пользователь может создавать собственные проекции, задавая произвольно для каждой
проекции правила сортировки и сегментации данных. Инструмент оптимизации Database Designer
упрощает создание новых проекций, анализируя нагрузку и выдавая в автоматическом режиме
рекомендации по созданию и изменению проекций. Различные проекции могут содержать одну
таблицу, либо объединение таблиц, что существенно сокращает время выполнения запросов
благодаря использованию оптимальной сортировки и сегментации под конкретные запросы.
Рисунок 2 Организация проекций в HP Vertica
Массивная параллельная обработка (MPP)
Ключевым свойством системы с массивной параллельной обработки является динамическое
распределения нагрузки и порядка выполнения запросов, любой из узлов кластера может
принимать и диспетчеризировать запросы пользователей.
Рисунок 3 Выполнение запросов в HP Vertica
Выполнение запроса в HP Vertica выглядит следующим образом:
 Узел, к которому подключается пользователь на время выполнения запроса становится узлом-
инициатором (initiator).
 Остальные узлы кластера становятся узлами-исполнителями (executor).
 Узел-инициатор анализирует запрос, формирует план запроса и отправляет его одному или
нескольким узлам-исполнителям.
 Узлы-исполнители выполняют план запроса и возвращают частичные результаты инициатору.
 Узел-инициатор агрегирует результаты и возвращает данные пользователю
Также, обязательным свойством HP Vertica как MPP системы является отсутствие разделяемых
компонентов (shared-nothing), как следствие:
 Система не предполагает использования выделенного разделяемого хранилища, за счет чего
исключается единая точка отказа (СХД), а благодаря использованию локальных дисков
сокращается стоимость владения дисковой подсистемой и повышается её
производительность.
 Все компоненты системы являются одноранговыми, отсутствует единый диспетчер,
балансировщик, каталог и т.п., кластер HP Vertica продолжает работать при отказе любого из
узлов.
Колоночное хранение данных
 В СУБД HP Vertica реализован механизм колоночного хранения данных, что позволяет:
o Осуществлять компрессию данных
o Выполнять выборку только по колонкам данных, за счет чего существенно ускорять
выборку данных
o Осуществлять выборку не выполняя декомпрессию данных
На рис. 4 приведен пример запроса, выполняющегося в СУБД с колоночным хранением и СУБД со
строчным хранением. Пример наглядно демонстрирует, что СУБД с колоночным хранением более
эффективно оперирует с данными при запросе и снижает нагрузку на подсистему ввода-вывода.
Текст запроса:
SELECT avg(price) FROM tickstore WHERE symbol = ‘AAPL” date = ‘5/06/09’
Рисунок 4 Пример выполнения запроса
Эффективная компрессия данных
Благодаря использованию колоночного хранения данных возможна эффективная компрессия
данных внутри колонок.
В HP Vertica реализовано 12 механизмов компрессии, выбор механизма компрессии
осуществляется автоматически в зависимости от типа данных, но также может быть определен
вручную.
Степень компрессии варьируется в зависимости от набора исходных данных и может составлять
до 90%. На ряде наборов данных HP Vertica может выполнять запросы без декомпрессии данных,
что позволяет повысить скорость выполнения запросов и снизить нагрузку на систему ввода-
вывода.
Рисунок 5 Компрессия различных типов данных
Отказоустойчивость
HP Vertica рассчитана на использования с business-critical и mission-critical приложениях и
поддерживает следующие механизмы отказоустойчивости:
 Встроенный механизм отказоустойчивости на уровне кластера (K-Safety)
o Основным принципом механизма K-Safety является копирование данных на любые
один и более узлов кластера
o При выходе любого узла кластера из строя работоспособность системы не
нарушается
Рисунок 6 Организация хранения данных, K-Safety
 Disaster Recovery (DR)
o Помимо основного механизма обеспечения отказоустойчивости, система также
поддерживает возможность кластера Disaster Recovery. Данные могут загружаться
в данном случае следующим образом:
 Применение ETL к первичному и вторичному узлам DR-кластера, таким
образом оба узла DR-кластера остаются активными
 Репликация данных на вторичный узел с помощью инструментария
резервного копирования
o Лицензируется только первая копия данных, копия на вторичный узел DR-кластера
при лицензировании не учитывается.
Безопасность
Так как на основе СУБД HP Vertica строятся хранилища данных с повышенными требованиями к
безопасности, система поддерживает различные механизмы управления безопасностью, в том
числе:
 Возможность внешней аутентификации (LDAP, Kerberos, и т.д.)
 Конфигурируемые политики управления паролями (сложность, жизненный цикл)
 SSL-шифрование для клиент-серверного взаимодействия
 AES шифрование на уровне записи
 Ролевая модель доступа: Предопределенные роли для суперпользователя и
администратора БД
 Предоставление доступа на уровне объектов посредством стандартного синтаксиса SQL
GRANT
Загрузка данных
Загрузка структурированных данных в HP Vertica
В зависимости от структуры загружаемых данных для загрузки можно использовать как Write
Optimized Store (WOS) так и Read Optimized Store (ROS). WOS используется для большого
количества мелких операций записи. ROS используется для записи больших объемов данных.
Рисунок 7 Загрузка данных в HP Vertica
Write Optimized Store (WOS) – хранилище, оптимизированное для записи, обладает следующими
характеристиками:
 Хранит и обрабатывает данные в памяти
 Данные не сортированы
 Данные не компрессированы
 Низкая задержка
Read Optimized Store (ROS) – хранилище, оптимизированное для чтения, обладает следующими
характеристиками:
 Хранит и обрабатывает данные на диске
 Данные сортированы
 Данные компрессированы
Благодаря эффективной архитектуре система поддерживает чтение во время загрузки данных.
Загрузка неструктурированных данных в HP Vertica (Flex Zone)
Благодаря технологии Flex Zone продукт HP Vertica обладает возможностью загрузки
неструктурированных данных, представленных файлами форматов JSON и CSV. Система
анализирует файл с данными, определяет схему (патентованная технология Auto-schematization),
автоматически создает схему и выполняет загрузку данных в созданную таблицу. Благодаря
данной технологии становится возможным выполнять SQL запросы на неструктурированных
данных.
Рисунок 8 Технология Flex Zone
Пользовательский механизм загрузки
HP Vertica включает инструмент User Defined Load (UDL), позволяющий разрабатывать
пользовательские расширения для загрузки данных. UDL позволяет изменить любой из трех
встроенных инструментов загрузки, в том числе:
 Source – получение данных из любого источника
 Filter – трансформация данных в новый формат
 Parser – преобразование исходных данных в записи БД
Использование данного механизма позволяет расширять функциональность HP Vertica за счет
добавления поддержки пользовательских форматов и источников данных.
Выборка и анализ данных
Стандартные механизмы доступа
HP Vertica предоставляет широкие возможности для доступа к данным на языке SQL, посредством
следующих интерфейсов:
 ODBC/JDBC
 ADO.NET
 Python
 Perl
 PHP
Язык HP Vertica SQL полностью соответствует стандарту ANSI SQL-99 и дополнен следующими
аналитическими расширениями:
 Временные ряды
 Окна для событий и разбивка на сессии
 Графы
 Поиск закономерностей
 Цепочки событий
 Статистика
 География
Аналитическая платформа
HP Vertica предоставляет функциональность аналитической платформы, и предоставляет
универсальный доступ к данным, посредством Application Programming Interface (API) и User
Defined Extionsions (UDx) на следующих языках:
 R – язык для статистического анализа с открытым кодом, содержащий множество пакетов
для сложного исследования данных (data mining) и статистического анализа. HP Vertica
поддерживает пользовательские расширения на R и обеспечивает их параллельное
выполнение.
 HP Vertica предоставляет возможность разработки пользовательских расширений User
Defined Extensions (UDx) посредством Java SDK API и C++ SDK API, что позволяет
использовать экспертизу Java и C++ для анализа данных.
Аналитические расширения
Помимо стандартного функционала языка HP Vertica SQL предоставляется доступ к аналитическим
расширениям, таким как HP Vertica Pulse и HP Vertica Place, существенно расширяющих
возможности анализа в части анализа социальных связей и геопространственных данных. Полный
список расширений доступен на портале HP Vertica Marketplace: https://vertica.hpwsportal.com/
Интеграции со сторонними системами
HP Vertica является ключевым элементом аналитической инфраструктуры и предоставляет
широкий набор инструментов для интеграции с продуктами сторонних производителей.
Интеграционные возможности можно условно разделить на три группы:
 Инструменты Business Intelligence (BI) и средства визуализации
 Системы извлечения, загрузки и трансформации данных (ETL/ELT) и репликаторы (CDC)
 Hadoop
Поддержка инструментов BI и средств визуализации
HP Vertica поддерживает интеграции с множеством промышленных инструментов BI и средств
визуализации. Поддерживаются стандартные интерфейсы ODBC, JDBC, ADO.NET, а к ряду систем
разработаны специализированные коннекторы для обеспечения максимальной прозрачности
интеграции. Использование стандартного инструментария BI позволяет использовать
существующую экспертизу в части анализа данных и сохранить инвестиции для реализации
аналитических продуктов. HP Vertica интегрируется со следующими продуктами, и список
постоянно расширяется:
 Tableau
 Microstrategy
 Oracle BI
 IBM Cognos
 SAP Business Objects
 SAS
 Looker
 Pentaho
Поддержка систем класса ETL/ELT и репликаторов
HP Vertica поддерживает интеграции с множеством инструментов извлечения, загрузки и
трансформации данных, а также репликаторов, что позволяет организовать максимально
оперативнный обмен между транзакционной и аналитической базами данных. Поддерживаются
следующие инструменты:
 Informatica
 Talend
 Syncsort
 Oracle Data Integrator
 Microsoft SQL Server Integration Services
 Oracle Golden Gate
 Attunity
 Hit Software DBMoto
Интеграция с Hadoop
Дополнительно к этим двум группам ПО HP Vertica поддерживает интеграцию с Hadoop, в том
числе и для загрузки данных из неструктурированных источников. Интеграция с Hadoop
реализуется с помощью выделенного коннектора, позволяющего:
 Загружать результаты MapReduce в HP Vertica для дальнейшей обработки
 Обрабатывать результаты выборки HP Vertica в Hadoop
 Получать SQL доступ к файлам, находящимся в HDFS
 Загружать файлы, находящиеся в HDFS в таблицы HP Vertica
Помимо этого, HP Vertica также может использоваться в качестве базы для HCatalog.
Администрирование
Разворачивание системы
HP Vertica функционирует на серверах стандартной архитектуры x86 и может разворачиваться в
следующих вариантах:
 На физических серверах x86
 На базе программно-аппаратного комплекса HP Converged System 300 for Vertica
 На облачных сервисах HP Cloud, Amazon EC2, и т.д.
 На виртуальной инфраструктуре (в частном облаке)
Система обладает свойством эластичного расширения, то есть, расширение системы не влияет на
её работоспособность и осуществляется простым добавлением узлов. HP Vertica автоматически
добавляет узлы в кластер и распространяет данные на новые узлы в фоновом режиме.
Система поддерживает функции изменения конфигурации без остановки системы, в том числе:
 Добавление/удаление узлов с автоматической ребалансировкой данных
 Замена/ремонт узлов без остановки кластера
 Добавление дисков на существующие узлы
 Клонирование БД с одного кластера на другой
Требования к аппаратному и общесистемному программному обеспечению
Аппаратное обеспечение должно соответствовать следующим требованиям:
 Узел кластера должен иметь один или два x86 процессора, рекомендуется использовать
двухпроцессорную конфигурацию с 12-ядерными процессорами
 Узел кластера должен содержать объем памяти в расчете 8ГБ на ядро процессора
 Дисковая подсистема должна быть построена на дисках 10K RPM и сконфигурирована с
использованием RAID 10. При расчете объема дисковой подсистемы необходимо
учитывать следующие факторы:
o Уровень компрессии данных (как правило 1:4)
o Объем дискового пространства под временные файлы должен составлять не менее
40%
o Объем дискового пространство под репликацию данных K-Safety (напр. При K-
Safety=1 объем данных удваивается)
o Объем дискового пространства под проекции, определяемый сценариями
использования (от 1,2х до 2х)
 Узлы кластера должны быть идентичными по типу процессора, объемам памяти и
дисковой подсистемы
 Рекомендуется использование 10Gb Ethernet для соединения узлов внутри кластера
 Рекомендуется использование локальных дисков для хранения БД. Возможно, но не
рекомендуется использовать внешнюю СХД для построения продуктивного кластера, так
как в этом случае СХД является единой точкой отказа. Использование внешней СХД в
тестовой среде допустимо.
 Систему можно размещать на виртуальной среде, но существует риск снижения
производительности, обусловленный непрозрачностью виртуальной инфраструктуры.
Рекомендуется использование виртуальных сред в тестовой среде.
 НР Vertica функционирует на одной из следующих операционных системах:
o Red Hat Enterprise Linux 5 and 6
o SUSE Linux Enterprise Server 11
o Oracle Enterprise Linux 6 - Red Hat Compatible Kernel only - HP Vertica does not
support the unbreakable kernel (kernels with a uel suffix)
o Debian Linux 6
o Cent OS 5 and 6
o Ubuntu 12.04LTS
Инструмент управления Management Console
HP Vertica Management Console – это эффективный инструмент управления HP Vertica,
позволяющий:
 Управлять одним или несколькими кластерами
 Осуществлять мониторинг активности СУБД и отслеживать статус кластера
 Коррелировать активность системы и активность СУБД.
Рисунок 9 Management Console
Помимо этого, система поддерживает оповещение по SNMP, таблицы состояний и историю
запросов, содержащую информацию о нагрузке и времени выполнения запросов с целью
дальнейшей оптимизации.
Оптимизация с помощью Database Designer
Database Designer (DBD) – инструмент оптимизации, входящий в комплект поставки HP Vertica.
DBD анализирует запросы пользователей и выдает рекомендации по оптимизации структуры базы
данных путем создания дополнительных проекций. Благодаря его использованию возможно
существенно сократить время выполнения запросов.
Резервное копирование
HP Vertica содержит инструментарий для резервного копирования системы. Инструментарий
позволяет выполнять полные либо инкрементальные копии базы данных. Осуществляется
детализация на уровне объекта (приложение, пользователь, схема). Резервное копирование
выполняется в онлайн-режиме и не требует остановки СУБД.
Рисунок 10 Варианты резервного копирования
Резервные копии могут сохраняться на следующие компоненты:
 На все узлы кластера
 На один узел кластера
 На другой кластер
 На отдельно стоящее хранилище (NAS или ленточное хранилище)
Организация зон разработки и тестирования
HP Vertica участвует в цикле разработки аналитических продуктов, и важным свойством системы
является возможность создания зон разработки и тестирования. Зоны разработки и тестирования
могут разворачиваться как на продуктивной среде, так и на внешней физической, виртуальной или
облачной инфраструктуре. При этом копии данных на эти зоны дополнительно не лицензируется.
Лицензирование
СУБД HP Vertica лицензируется исходя из объема загружаемых в систему «сырых» данных,
стоимость терабайта уменьшается при увеличении объема хранилища в соответствии с
диапазонами лицензирования (1-10ТБ, 11-50ТБ, 51-100ТБ, 101-500ТБ, более 500ТБ).
Лицензируется только первая копия данных, копии на непродуктивные среды, включая Disaster
Recovery, тестовые среды и среды разработки дополнительно не лицензируются.
Гарантийная поддержка на первый год в режиме 24х7 включается в поставку лицензий и
составляет 21% от стоимости лицензий.

More Related Content

Viewers also liked

Andrei Kirilenkov. Vertica
Andrei Kirilenkov. VerticaAndrei Kirilenkov. Vertica
Andrei Kirilenkov. Vertica
Volha Banadyseva
 
Как мы строили аналитическую платформу на несколько миллиардов событии в месяц
Как мы строили аналитическую платформу на несколько миллиардов событии в месяцКак мы строили аналитическую платформу на несколько миллиардов событии в месяц
Как мы строили аналитическую платформу на несколько миллиардов событии в месяц
Mikhail Tabunov
 
Консолидированная система мониторинга на HP BSM
Консолидированная система мониторинга на HP BSMКонсолидированная система мониторинга на HP BSM
Консолидированная система мониторинга на HP BSM
i-Teco & Vitte Consulting
 
Short Infrastructure Overview ru hpe Vertica
Short Infrastructure Overview ru hpe VerticaShort Infrastructure Overview ru hpe Vertica
Short Infrastructure Overview ru hpe Vertica
Andrey Karpov
 
How to install Vertica in a single node.
How to install Vertica in a single node.How to install Vertica in a single node.
How to install Vertica in a single node.
Anil Maharjan
 
Обзор компонентов HP BSM
Обзор компонентов HP BSMОбзор компонентов HP BSM
Обзор компонентов HP BSM
i-Teco & Vitte Consulting
 
NOW! Intelligent Mobility Cloud October 2014
NOW! Intelligent Mobility Cloud October 2014NOW! Intelligent Mobility Cloud October 2014
NOW! Intelligent Mobility Cloud October 2014
NOW! Innovations
 
"Контекстная реклама в Avito: что под капотом?" Вадим Аюев и Андрей Остапец (...
"Контекстная реклама в Avito: что под капотом?" Вадим Аюев и Андрей Остапец (..."Контекстная реклама в Avito: что под капотом?" Вадим Аюев и Андрей Остапец (...
"Контекстная реклама в Avito: что под капотом?" Вадим Аюев и Андрей Остапец (...
AvitoTech
 
NOW! Billing and Payment Solutions for EV Charging
NOW! Billing and Payment Solutions for EV ChargingNOW! Billing and Payment Solutions for EV Charging
NOW! Billing and Payment Solutions for EV Charging
NOW! Innovations
 
Webinar: Live Data Visualisation with Tableau and MongoDB
Webinar: Live Data Visualisation with Tableau and MongoDBWebinar: Live Data Visualisation with Tableau and MongoDB
Webinar: Live Data Visualisation with Tableau and MongoDB
MongoDB
 
How I learned to stop worrying and love the cloud
How I learned to stop worrying and love the cloudHow I learned to stop worrying and love the cloud
How I learned to stop worrying and love the cloud
Shlomo Swidler
 

Viewers also liked (11)

Andrei Kirilenkov. Vertica
Andrei Kirilenkov. VerticaAndrei Kirilenkov. Vertica
Andrei Kirilenkov. Vertica
 
Как мы строили аналитическую платформу на несколько миллиардов событии в месяц
Как мы строили аналитическую платформу на несколько миллиардов событии в месяцКак мы строили аналитическую платформу на несколько миллиардов событии в месяц
Как мы строили аналитическую платформу на несколько миллиардов событии в месяц
 
Консолидированная система мониторинга на HP BSM
Консолидированная система мониторинга на HP BSMКонсолидированная система мониторинга на HP BSM
Консолидированная система мониторинга на HP BSM
 
Short Infrastructure Overview ru hpe Vertica
Short Infrastructure Overview ru hpe VerticaShort Infrastructure Overview ru hpe Vertica
Short Infrastructure Overview ru hpe Vertica
 
How to install Vertica in a single node.
How to install Vertica in a single node.How to install Vertica in a single node.
How to install Vertica in a single node.
 
Обзор компонентов HP BSM
Обзор компонентов HP BSMОбзор компонентов HP BSM
Обзор компонентов HP BSM
 
NOW! Intelligent Mobility Cloud October 2014
NOW! Intelligent Mobility Cloud October 2014NOW! Intelligent Mobility Cloud October 2014
NOW! Intelligent Mobility Cloud October 2014
 
"Контекстная реклама в Avito: что под капотом?" Вадим Аюев и Андрей Остапец (...
"Контекстная реклама в Avito: что под капотом?" Вадим Аюев и Андрей Остапец (..."Контекстная реклама в Avito: что под капотом?" Вадим Аюев и Андрей Остапец (...
"Контекстная реклама в Avito: что под капотом?" Вадим Аюев и Андрей Остапец (...
 
NOW! Billing and Payment Solutions for EV Charging
NOW! Billing and Payment Solutions for EV ChargingNOW! Billing and Payment Solutions for EV Charging
NOW! Billing and Payment Solutions for EV Charging
 
Webinar: Live Data Visualisation with Tableau and MongoDB
Webinar: Live Data Visualisation with Tableau and MongoDBWebinar: Live Data Visualisation with Tableau and MongoDB
Webinar: Live Data Visualisation with Tableau and MongoDB
 
How I learned to stop worrying and love the cloud
How I learned to stop worrying and love the cloudHow I learned to stop worrying and love the cloud
How I learned to stop worrying and love the cloud
 

Similar to Описание архитектуры СУБД HP Vertica

программный комплекс весовой учет
программный комплекс весовой учетпрограммный комплекс весовой учет
программный комплекс весовой учетjamis7005
 
HP Vertica
HP VerticaHP Vertica
DATA CLUSTER
DATA CLUSTERDATA CLUSTER
DATA CLUSTER
soft-point
 
Защита данных от Dell Software
Защита данных от Dell SoftwareЗащита данных от Dell Software
Защита данных от Dell Software
Dell_Russia
 
Защита данных от Dell Software
Защита данных от Dell SoftwareЗащита данных от Dell Software
Защита данных от Dell Software
Dell_Russia
 
Использование Vertica для управления данными, фиксируемыми интеллектуальными ...
Использование Vertica для управления данными, фиксируемыми интеллектуальными ...Использование Vertica для управления данными, фиксируемыми интеллектуальными ...
Использование Vertica для управления данными, фиксируемыми интеллектуальными ...
Elizaveta Alekseeva
 
Использование аналитической платформы HPE Vertica для управления большими объ...
Использование аналитической платформы HPE Vertica для управления большими объ...Использование аналитической платформы HPE Vertica для управления большими объ...
Использование аналитической платформы HPE Vertica для управления большими объ...
Yuri Yashkin
 
Инфраструктура_на_базе_открытого_ПО
Инфраструктура_на_базе_открытого_ПОИнфраструктура_на_базе_открытого_ПО
Инфраструктура_на_базе_открытого_ПО
Alexey Vasyukov
 
Мониторинг ЦОД средствами Dell Foglight
Мониторинг ЦОД средствами Dell FoglightМониторинг ЦОД средствами Dell Foglight
Мониторинг ЦОД средствами Dell Foglight
Marina Gryshko
 
Мониторинг ЦОД средствами Dell Foglight
Мониторинг ЦОД средствами Dell FoglightМониторинг ЦОД средствами Dell Foglight
Мониторинг ЦОД средствами Dell Foglight
BAKOTECH
 
Дмитрий Меньшиков "Топ-10 фейлов на реальном highload проекте"
Дмитрий Меньшиков "Топ-10 фейлов на реальном highload проекте"Дмитрий Меньшиков "Топ-10 фейлов на реальном highload проекте"
Дмитрий Меньшиков "Топ-10 фейлов на реальном highload проекте"
Fwdays
 
HPE adaptive backup and recovery
HPE adaptive backup and recoveryHPE adaptive backup and recovery
HPE adaptive backup and recovery
Anatoliy Arkhipov
 
Symantec Backup Exec 2014 vs. Acronis Backup And Recovery 11.5
Symantec Backup Exec 2014 vs. Acronis Backup And Recovery 11.5Symantec Backup Exec 2014 vs. Acronis Backup And Recovery 11.5
Symantec Backup Exec 2014 vs. Acronis Backup And Recovery 11.5
hdablin
 
Backup commvault data_line
Backup commvault data_lineBackup commvault data_line
Backup commvault data_line
Татьяна Янкина
 
СУБД 2013 Лекция №9 "Безопасность баз данных"
СУБД 2013 Лекция №9 "Безопасность баз данных"СУБД 2013 Лекция №9 "Безопасность баз данных"
СУБД 2013 Лекция №9 "Безопасность баз данных"
Technopark
 
Модуль 14. Лекция 55-56. Управление релизами и развертыванием продукта
Модуль 14. Лекция 55-56. Управление релизами и развертыванием продуктаМодуль 14. Лекция 55-56. Управление релизами и развертыванием продукта
Модуль 14. Лекция 55-56. Управление релизами и развертыванием продукта
Yana Brodetski
 
Кластер высокой готовности @ Лаборатория 50
Кластер высокой готовности @ Лаборатория 50Кластер высокой готовности @ Лаборатория 50
Кластер высокой готовности @ Лаборатория 50
lab50
 
Install guide mac
Install guide macInstall guide mac
Install guide macDim Kin
 

Similar to Описание архитектуры СУБД HP Vertica (20)

программный комплекс весовой учет
программный комплекс весовой учетпрограммный комплекс весовой учет
программный комплекс весовой учет
 
HP Vertica
HP VerticaHP Vertica
HP Vertica
 
DATA CLUSTER
DATA CLUSTERDATA CLUSTER
DATA CLUSTER
 
Защита данных от Dell Software
Защита данных от Dell SoftwareЗащита данных от Dell Software
Защита данных от Dell Software
 
Защита данных от Dell Software
Защита данных от Dell SoftwareЗащита данных от Dell Software
Защита данных от Dell Software
 
Использование Vertica для управления данными, фиксируемыми интеллектуальными ...
Использование Vertica для управления данными, фиксируемыми интеллектуальными ...Использование Vertica для управления данными, фиксируемыми интеллектуальными ...
Использование Vertica для управления данными, фиксируемыми интеллектуальными ...
 
Использование аналитической платформы HPE Vertica для управления большими объ...
Использование аналитической платформы HPE Vertica для управления большими объ...Использование аналитической платформы HPE Vertica для управления большими объ...
Использование аналитической платформы HPE Vertica для управления большими объ...
 
Инфраструктура_на_базе_открытого_ПО
Инфраструктура_на_базе_открытого_ПОИнфраструктура_на_базе_открытого_ПО
Инфраструктура_на_базе_открытого_ПО
 
Мониторинг ЦОД средствами Dell Foglight
Мониторинг ЦОД средствами Dell FoglightМониторинг ЦОД средствами Dell Foglight
Мониторинг ЦОД средствами Dell Foglight
 
Мониторинг ЦОД средствами Dell Foglight
Мониторинг ЦОД средствами Dell FoglightМониторинг ЦОД средствами Dell Foglight
Мониторинг ЦОД средствами Dell Foglight
 
Дмитрий Меньшиков "Топ-10 фейлов на реальном highload проекте"
Дмитрий Меньшиков "Топ-10 фейлов на реальном highload проекте"Дмитрий Меньшиков "Топ-10 фейлов на реальном highload проекте"
Дмитрий Меньшиков "Топ-10 фейлов на реальном highload проекте"
 
HPE adaptive backup and recovery
HPE adaptive backup and recoveryHPE adaptive backup and recovery
HPE adaptive backup and recovery
 
Symantec Backup Exec 2014 vs. Acronis Backup And Recovery 11.5
Symantec Backup Exec 2014 vs. Acronis Backup And Recovery 11.5Symantec Backup Exec 2014 vs. Acronis Backup And Recovery 11.5
Symantec Backup Exec 2014 vs. Acronis Backup And Recovery 11.5
 
Backup commvault data_line
Backup commvault data_lineBackup commvault data_line
Backup commvault data_line
 
СУБД 2013 Лекция №9 "Безопасность баз данных"
СУБД 2013 Лекция №9 "Безопасность баз данных"СУБД 2013 Лекция №9 "Безопасность баз данных"
СУБД 2013 Лекция №9 "Безопасность баз данных"
 
Модуль 14. Лекция 55-56. Управление релизами и развертыванием продукта
Модуль 14. Лекция 55-56. Управление релизами и развертыванием продуктаМодуль 14. Лекция 55-56. Управление релизами и развертыванием продукта
Модуль 14. Лекция 55-56. Управление релизами и развертыванием продукта
 
Кластер высокой готовности @ Лаборатория 50
Кластер высокой готовности @ Лаборатория 50Кластер высокой готовности @ Лаборатория 50
Кластер высокой готовности @ Лаборатория 50
 
Install guide mac
Install guide macInstall guide mac
Install guide mac
 
NI-NM Business Processes
NI-NM Business ProcessesNI-NM Business Processes
NI-NM Business Processes
 
ПК КВГ
ПК КВГПК КВГ
ПК КВГ
 

More from Andrey Karpov

2016 06 VMEx - intro (russian)
2016 06 VMEx - intro (russian)2016 06 VMEx - intro (russian)
2016 06 VMEx - intro (russian)
Andrey Karpov
 
Hpe Data Protector Disaster Recovery Guide
Hpe Data Protector Disaster Recovery GuideHpe Data Protector Disaster Recovery Guide
Hpe Data Protector Disaster Recovery Guide
Andrey Karpov
 
Hpe Zero Downtime Administrator's Guide
Hpe Zero Downtime Administrator's GuideHpe Zero Downtime Administrator's Guide
Hpe Zero Downtime Administrator's Guide
Andrey Karpov
 
Hpe data protector deduplication
Hpe data protector deduplicationHpe data protector deduplication
Hpe data protector deduplication
Andrey Karpov
 
Hpe Data Protector troubleshooting guide
Hpe Data Protector troubleshooting guideHpe Data Protector troubleshooting guide
Hpe Data Protector troubleshooting guide
Andrey Karpov
 
Hpe Data Protector installation guide
Hpe Data Protector installation guideHpe Data Protector installation guide
Hpe Data Protector installation guide
Andrey Karpov
 
Hpe Data Protector integration guide
Hpe Data Protector integration guideHpe Data Protector integration guide
Hpe Data Protector integration guide
Andrey Karpov
 
HPE IDOL Technical Overview - july 2016
HPE IDOL Technical Overview - july 2016HPE IDOL Technical Overview - july 2016
HPE IDOL Technical Overview - july 2016
Andrey Karpov
 
HPE VM Explorer 6 1 user manual
HPE VM Explorer 6 1 user manualHPE VM Explorer 6 1 user manual
HPE VM Explorer 6 1 user manual
Andrey Karpov
 
Краткий обзор аппаратных платформ 2016 нре
Краткий обзор аппаратных платформ 2016 нреКраткий обзор аппаратных платформ 2016 нре
Краткий обзор аппаратных платформ 2016 нре
Andrey Karpov
 
Резервное копирование и оптимизация хранения данных
Резервное копирование и оптимизация хранения данныхРезервное копирование и оптимизация хранения данных
Резервное копирование и оптимизация хранения данных
Andrey Karpov
 
Transform IT Service Delivery Helion
Transform IT Service Delivery Helion Transform IT Service Delivery Helion
Transform IT Service Delivery Helion
Andrey Karpov
 
HPE Data Protector Administrator's Guide
HPE Data Protector Administrator's GuideHPE Data Protector Administrator's Guide
HPE Data Protector Administrator's Guide
Andrey Karpov
 
Idol server 11.0.0_release_notes_en
Idol server 11.0.0_release_notes_enIdol server 11.0.0_release_notes_en
Idol server 11.0.0_release_notes_en
Andrey Karpov
 
Конференция по программным решениям HPE 2016
Конференция по программным решениям HPE 2016Конференция по программным решениям HPE 2016
Конференция по программным решениям HPE 2016
Andrey Karpov
 
Record manager 8.0 presentation
Record manager 8.0  presentationRecord manager 8.0  presentation
Record manager 8.0 presentation
Andrey Karpov
 
IDOL presentation
IDOL presentationIDOL presentation
IDOL presentation
Andrey Karpov
 
Data Protection overview presentation
Data Protection overview presentationData Protection overview presentation
Data Protection overview presentation
Andrey Karpov
 
Hp distributed R User Guide
Hp distributed R User GuideHp distributed R User Guide
Hp distributed R User Guide
Andrey Karpov
 
Connectivity to business outcomes
Connectivity to business outcomesConnectivity to business outcomes
Connectivity to business outcomes
Andrey Karpov
 

More from Andrey Karpov (20)

2016 06 VMEx - intro (russian)
2016 06 VMEx - intro (russian)2016 06 VMEx - intro (russian)
2016 06 VMEx - intro (russian)
 
Hpe Data Protector Disaster Recovery Guide
Hpe Data Protector Disaster Recovery GuideHpe Data Protector Disaster Recovery Guide
Hpe Data Protector Disaster Recovery Guide
 
Hpe Zero Downtime Administrator's Guide
Hpe Zero Downtime Administrator's GuideHpe Zero Downtime Administrator's Guide
Hpe Zero Downtime Administrator's Guide
 
Hpe data protector deduplication
Hpe data protector deduplicationHpe data protector deduplication
Hpe data protector deduplication
 
Hpe Data Protector troubleshooting guide
Hpe Data Protector troubleshooting guideHpe Data Protector troubleshooting guide
Hpe Data Protector troubleshooting guide
 
Hpe Data Protector installation guide
Hpe Data Protector installation guideHpe Data Protector installation guide
Hpe Data Protector installation guide
 
Hpe Data Protector integration guide
Hpe Data Protector integration guideHpe Data Protector integration guide
Hpe Data Protector integration guide
 
HPE IDOL Technical Overview - july 2016
HPE IDOL Technical Overview - july 2016HPE IDOL Technical Overview - july 2016
HPE IDOL Technical Overview - july 2016
 
HPE VM Explorer 6 1 user manual
HPE VM Explorer 6 1 user manualHPE VM Explorer 6 1 user manual
HPE VM Explorer 6 1 user manual
 
Краткий обзор аппаратных платформ 2016 нре
Краткий обзор аппаратных платформ 2016 нреКраткий обзор аппаратных платформ 2016 нре
Краткий обзор аппаратных платформ 2016 нре
 
Резервное копирование и оптимизация хранения данных
Резервное копирование и оптимизация хранения данныхРезервное копирование и оптимизация хранения данных
Резервное копирование и оптимизация хранения данных
 
Transform IT Service Delivery Helion
Transform IT Service Delivery Helion Transform IT Service Delivery Helion
Transform IT Service Delivery Helion
 
HPE Data Protector Administrator's Guide
HPE Data Protector Administrator's GuideHPE Data Protector Administrator's Guide
HPE Data Protector Administrator's Guide
 
Idol server 11.0.0_release_notes_en
Idol server 11.0.0_release_notes_enIdol server 11.0.0_release_notes_en
Idol server 11.0.0_release_notes_en
 
Конференция по программным решениям HPE 2016
Конференция по программным решениям HPE 2016Конференция по программным решениям HPE 2016
Конференция по программным решениям HPE 2016
 
Record manager 8.0 presentation
Record manager 8.0  presentationRecord manager 8.0  presentation
Record manager 8.0 presentation
 
IDOL presentation
IDOL presentationIDOL presentation
IDOL presentation
 
Data Protection overview presentation
Data Protection overview presentationData Protection overview presentation
Data Protection overview presentation
 
Hp distributed R User Guide
Hp distributed R User GuideHp distributed R User Guide
Hp distributed R User Guide
 
Connectivity to business outcomes
Connectivity to business outcomesConnectivity to business outcomes
Connectivity to business outcomes
 

Описание архитектуры СУБД HP Vertica

  • 1. Содержание Описание архитектуры СУБД HP Vertica....................................................................................................2 Общие сведения......................................................................................................................................2 Представление данных в HP Vertica ......................................................................................................2 Массивная параллельная обработка (MPP)..........................................................................................3 Колоночное хранение данных ...............................................................................................................3 Эффективная компрессия данных .........................................................................................................4 Отказоустойчивость.................................................................................................................................4 Безопасность............................................................................................................................................5 Загрузка данных...........................................................................................................................................5 Загрузка структурированных данных в HP Vertica................................................................................5 Загрузка неструктурированных данных в HP Vertica (Flex Zone).........................................................6 Пользовательский механизм загрузки..................................................................................................6 Выборка и анализ данных ..........................................................................................................................7 Стандартные механизмы доступа..........................................................................................................7 Аналитическая платформа......................................................................................................................7 Аналитические расширения...................................................................................................................7 Интеграции со сторонними системами.....................................................................................................7 Поддержка инструментов BI и средств визуализации.........................................................................8 Поддержка систем класса ETL/ELT и репликаторов.............................................................................8 Интеграция с Hadoop...............................................................................................................................8 Администрирование ...................................................................................................................................8 Разворачивание системы........................................................................................................................8 Требования к аппаратному и общесистемному программному обеспечению ................................9 Инструмент управления Management Console ...................................................................................10 Оптимизация с помощью Database Designer ......................................................................................10 Резервное копирование .......................................................................................................................10 Организация зон разработки и тестирования ....................................................................................11 Лицензирование....................................................................................................................................11
  • 2. Описание архитектуры СУБД HP Vertica Общие сведения Продукт HP Vertica является системой управления базами данных, работающей по принципам массивной параллельной обработки и разработанной специально для хранения и обработки больших объемов данных. HP Vertica поддерживает язык SQL, стандартные интерфейсы доступа к данным ODBC, JDBC, ADO.NET, а также содержащий множество коннекторов к различным инструментам бизнес- аналитики и анализа данных. Кластер СУБД HP Vertica состоит из узлов стандартной архитектуры x86, объединенных сетевым соединением. Все узлы кластера являются равноценными, любой из узлов кластера может принимать и обслуживать запросы пользователей, а также выполнять загрузку данных. Рисунок 1 Кластер HP Vertica Представление данных в HP Vertica Данные в HP Vertica хранятся в виде проекций. При создании базы данных создается мастер- проекция, содержащая весь объем загруженных данных. Также, в процессе эксплуатации системы пользователь может создавать собственные проекции, задавая произвольно для каждой проекции правила сортировки и сегментации данных. Инструмент оптимизации Database Designer упрощает создание новых проекций, анализируя нагрузку и выдавая в автоматическом режиме рекомендации по созданию и изменению проекций. Различные проекции могут содержать одну таблицу, либо объединение таблиц, что существенно сокращает время выполнения запросов благодаря использованию оптимальной сортировки и сегментации под конкретные запросы. Рисунок 2 Организация проекций в HP Vertica
  • 3. Массивная параллельная обработка (MPP) Ключевым свойством системы с массивной параллельной обработки является динамическое распределения нагрузки и порядка выполнения запросов, любой из узлов кластера может принимать и диспетчеризировать запросы пользователей. Рисунок 3 Выполнение запросов в HP Vertica Выполнение запроса в HP Vertica выглядит следующим образом:  Узел, к которому подключается пользователь на время выполнения запроса становится узлом- инициатором (initiator).  Остальные узлы кластера становятся узлами-исполнителями (executor).  Узел-инициатор анализирует запрос, формирует план запроса и отправляет его одному или нескольким узлам-исполнителям.  Узлы-исполнители выполняют план запроса и возвращают частичные результаты инициатору.  Узел-инициатор агрегирует результаты и возвращает данные пользователю Также, обязательным свойством HP Vertica как MPP системы является отсутствие разделяемых компонентов (shared-nothing), как следствие:  Система не предполагает использования выделенного разделяемого хранилища, за счет чего исключается единая точка отказа (СХД), а благодаря использованию локальных дисков сокращается стоимость владения дисковой подсистемой и повышается её производительность.  Все компоненты системы являются одноранговыми, отсутствует единый диспетчер, балансировщик, каталог и т.п., кластер HP Vertica продолжает работать при отказе любого из узлов. Колоночное хранение данных  В СУБД HP Vertica реализован механизм колоночного хранения данных, что позволяет: o Осуществлять компрессию данных o Выполнять выборку только по колонкам данных, за счет чего существенно ускорять выборку данных o Осуществлять выборку не выполняя декомпрессию данных На рис. 4 приведен пример запроса, выполняющегося в СУБД с колоночным хранением и СУБД со строчным хранением. Пример наглядно демонстрирует, что СУБД с колоночным хранением более эффективно оперирует с данными при запросе и снижает нагрузку на подсистему ввода-вывода. Текст запроса: SELECT avg(price) FROM tickstore WHERE symbol = ‘AAPL” date = ‘5/06/09’
  • 4. Рисунок 4 Пример выполнения запроса Эффективная компрессия данных Благодаря использованию колоночного хранения данных возможна эффективная компрессия данных внутри колонок. В HP Vertica реализовано 12 механизмов компрессии, выбор механизма компрессии осуществляется автоматически в зависимости от типа данных, но также может быть определен вручную. Степень компрессии варьируется в зависимости от набора исходных данных и может составлять до 90%. На ряде наборов данных HP Vertica может выполнять запросы без декомпрессии данных, что позволяет повысить скорость выполнения запросов и снизить нагрузку на систему ввода- вывода. Рисунок 5 Компрессия различных типов данных Отказоустойчивость HP Vertica рассчитана на использования с business-critical и mission-critical приложениях и поддерживает следующие механизмы отказоустойчивости:  Встроенный механизм отказоустойчивости на уровне кластера (K-Safety) o Основным принципом механизма K-Safety является копирование данных на любые один и более узлов кластера o При выходе любого узла кластера из строя работоспособность системы не нарушается
  • 5. Рисунок 6 Организация хранения данных, K-Safety  Disaster Recovery (DR) o Помимо основного механизма обеспечения отказоустойчивости, система также поддерживает возможность кластера Disaster Recovery. Данные могут загружаться в данном случае следующим образом:  Применение ETL к первичному и вторичному узлам DR-кластера, таким образом оба узла DR-кластера остаются активными  Репликация данных на вторичный узел с помощью инструментария резервного копирования o Лицензируется только первая копия данных, копия на вторичный узел DR-кластера при лицензировании не учитывается. Безопасность Так как на основе СУБД HP Vertica строятся хранилища данных с повышенными требованиями к безопасности, система поддерживает различные механизмы управления безопасностью, в том числе:  Возможность внешней аутентификации (LDAP, Kerberos, и т.д.)  Конфигурируемые политики управления паролями (сложность, жизненный цикл)  SSL-шифрование для клиент-серверного взаимодействия  AES шифрование на уровне записи  Ролевая модель доступа: Предопределенные роли для суперпользователя и администратора БД  Предоставление доступа на уровне объектов посредством стандартного синтаксиса SQL GRANT Загрузка данных Загрузка структурированных данных в HP Vertica В зависимости от структуры загружаемых данных для загрузки можно использовать как Write Optimized Store (WOS) так и Read Optimized Store (ROS). WOS используется для большого количества мелких операций записи. ROS используется для записи больших объемов данных. Рисунок 7 Загрузка данных в HP Vertica Write Optimized Store (WOS) – хранилище, оптимизированное для записи, обладает следующими характеристиками:
  • 6.  Хранит и обрабатывает данные в памяти  Данные не сортированы  Данные не компрессированы  Низкая задержка Read Optimized Store (ROS) – хранилище, оптимизированное для чтения, обладает следующими характеристиками:  Хранит и обрабатывает данные на диске  Данные сортированы  Данные компрессированы Благодаря эффективной архитектуре система поддерживает чтение во время загрузки данных. Загрузка неструктурированных данных в HP Vertica (Flex Zone) Благодаря технологии Flex Zone продукт HP Vertica обладает возможностью загрузки неструктурированных данных, представленных файлами форматов JSON и CSV. Система анализирует файл с данными, определяет схему (патентованная технология Auto-schematization), автоматически создает схему и выполняет загрузку данных в созданную таблицу. Благодаря данной технологии становится возможным выполнять SQL запросы на неструктурированных данных. Рисунок 8 Технология Flex Zone Пользовательский механизм загрузки HP Vertica включает инструмент User Defined Load (UDL), позволяющий разрабатывать пользовательские расширения для загрузки данных. UDL позволяет изменить любой из трех встроенных инструментов загрузки, в том числе:  Source – получение данных из любого источника  Filter – трансформация данных в новый формат  Parser – преобразование исходных данных в записи БД Использование данного механизма позволяет расширять функциональность HP Vertica за счет добавления поддержки пользовательских форматов и источников данных.
  • 7. Выборка и анализ данных Стандартные механизмы доступа HP Vertica предоставляет широкие возможности для доступа к данным на языке SQL, посредством следующих интерфейсов:  ODBC/JDBC  ADO.NET  Python  Perl  PHP Язык HP Vertica SQL полностью соответствует стандарту ANSI SQL-99 и дополнен следующими аналитическими расширениями:  Временные ряды  Окна для событий и разбивка на сессии  Графы  Поиск закономерностей  Цепочки событий  Статистика  География Аналитическая платформа HP Vertica предоставляет функциональность аналитической платформы, и предоставляет универсальный доступ к данным, посредством Application Programming Interface (API) и User Defined Extionsions (UDx) на следующих языках:  R – язык для статистического анализа с открытым кодом, содержащий множество пакетов для сложного исследования данных (data mining) и статистического анализа. HP Vertica поддерживает пользовательские расширения на R и обеспечивает их параллельное выполнение.  HP Vertica предоставляет возможность разработки пользовательских расширений User Defined Extensions (UDx) посредством Java SDK API и C++ SDK API, что позволяет использовать экспертизу Java и C++ для анализа данных. Аналитические расширения Помимо стандартного функционала языка HP Vertica SQL предоставляется доступ к аналитическим расширениям, таким как HP Vertica Pulse и HP Vertica Place, существенно расширяющих возможности анализа в части анализа социальных связей и геопространственных данных. Полный список расширений доступен на портале HP Vertica Marketplace: https://vertica.hpwsportal.com/ Интеграции со сторонними системами HP Vertica является ключевым элементом аналитической инфраструктуры и предоставляет широкий набор инструментов для интеграции с продуктами сторонних производителей. Интеграционные возможности можно условно разделить на три группы:  Инструменты Business Intelligence (BI) и средства визуализации  Системы извлечения, загрузки и трансформации данных (ETL/ELT) и репликаторы (CDC)  Hadoop
  • 8. Поддержка инструментов BI и средств визуализации HP Vertica поддерживает интеграции с множеством промышленных инструментов BI и средств визуализации. Поддерживаются стандартные интерфейсы ODBC, JDBC, ADO.NET, а к ряду систем разработаны специализированные коннекторы для обеспечения максимальной прозрачности интеграции. Использование стандартного инструментария BI позволяет использовать существующую экспертизу в части анализа данных и сохранить инвестиции для реализации аналитических продуктов. HP Vertica интегрируется со следующими продуктами, и список постоянно расширяется:  Tableau  Microstrategy  Oracle BI  IBM Cognos  SAP Business Objects  SAS  Looker  Pentaho Поддержка систем класса ETL/ELT и репликаторов HP Vertica поддерживает интеграции с множеством инструментов извлечения, загрузки и трансформации данных, а также репликаторов, что позволяет организовать максимально оперативнный обмен между транзакционной и аналитической базами данных. Поддерживаются следующие инструменты:  Informatica  Talend  Syncsort  Oracle Data Integrator  Microsoft SQL Server Integration Services  Oracle Golden Gate  Attunity  Hit Software DBMoto Интеграция с Hadoop Дополнительно к этим двум группам ПО HP Vertica поддерживает интеграцию с Hadoop, в том числе и для загрузки данных из неструктурированных источников. Интеграция с Hadoop реализуется с помощью выделенного коннектора, позволяющего:  Загружать результаты MapReduce в HP Vertica для дальнейшей обработки  Обрабатывать результаты выборки HP Vertica в Hadoop  Получать SQL доступ к файлам, находящимся в HDFS  Загружать файлы, находящиеся в HDFS в таблицы HP Vertica Помимо этого, HP Vertica также может использоваться в качестве базы для HCatalog. Администрирование Разворачивание системы HP Vertica функционирует на серверах стандартной архитектуры x86 и может разворачиваться в следующих вариантах:  На физических серверах x86
  • 9.  На базе программно-аппаратного комплекса HP Converged System 300 for Vertica  На облачных сервисах HP Cloud, Amazon EC2, и т.д.  На виртуальной инфраструктуре (в частном облаке) Система обладает свойством эластичного расширения, то есть, расширение системы не влияет на её работоспособность и осуществляется простым добавлением узлов. HP Vertica автоматически добавляет узлы в кластер и распространяет данные на новые узлы в фоновом режиме. Система поддерживает функции изменения конфигурации без остановки системы, в том числе:  Добавление/удаление узлов с автоматической ребалансировкой данных  Замена/ремонт узлов без остановки кластера  Добавление дисков на существующие узлы  Клонирование БД с одного кластера на другой Требования к аппаратному и общесистемному программному обеспечению Аппаратное обеспечение должно соответствовать следующим требованиям:  Узел кластера должен иметь один или два x86 процессора, рекомендуется использовать двухпроцессорную конфигурацию с 12-ядерными процессорами  Узел кластера должен содержать объем памяти в расчете 8ГБ на ядро процессора  Дисковая подсистема должна быть построена на дисках 10K RPM и сконфигурирована с использованием RAID 10. При расчете объема дисковой подсистемы необходимо учитывать следующие факторы: o Уровень компрессии данных (как правило 1:4) o Объем дискового пространства под временные файлы должен составлять не менее 40% o Объем дискового пространство под репликацию данных K-Safety (напр. При K- Safety=1 объем данных удваивается) o Объем дискового пространства под проекции, определяемый сценариями использования (от 1,2х до 2х)  Узлы кластера должны быть идентичными по типу процессора, объемам памяти и дисковой подсистемы  Рекомендуется использование 10Gb Ethernet для соединения узлов внутри кластера  Рекомендуется использование локальных дисков для хранения БД. Возможно, но не рекомендуется использовать внешнюю СХД для построения продуктивного кластера, так как в этом случае СХД является единой точкой отказа. Использование внешней СХД в тестовой среде допустимо.  Систему можно размещать на виртуальной среде, но существует риск снижения производительности, обусловленный непрозрачностью виртуальной инфраструктуры. Рекомендуется использование виртуальных сред в тестовой среде.  НР Vertica функционирует на одной из следующих операционных системах: o Red Hat Enterprise Linux 5 and 6 o SUSE Linux Enterprise Server 11 o Oracle Enterprise Linux 6 - Red Hat Compatible Kernel only - HP Vertica does not support the unbreakable kernel (kernels with a uel suffix) o Debian Linux 6 o Cent OS 5 and 6 o Ubuntu 12.04LTS
  • 10. Инструмент управления Management Console HP Vertica Management Console – это эффективный инструмент управления HP Vertica, позволяющий:  Управлять одним или несколькими кластерами  Осуществлять мониторинг активности СУБД и отслеживать статус кластера  Коррелировать активность системы и активность СУБД. Рисунок 9 Management Console Помимо этого, система поддерживает оповещение по SNMP, таблицы состояний и историю запросов, содержащую информацию о нагрузке и времени выполнения запросов с целью дальнейшей оптимизации. Оптимизация с помощью Database Designer Database Designer (DBD) – инструмент оптимизации, входящий в комплект поставки HP Vertica. DBD анализирует запросы пользователей и выдает рекомендации по оптимизации структуры базы данных путем создания дополнительных проекций. Благодаря его использованию возможно существенно сократить время выполнения запросов. Резервное копирование HP Vertica содержит инструментарий для резервного копирования системы. Инструментарий позволяет выполнять полные либо инкрементальные копии базы данных. Осуществляется детализация на уровне объекта (приложение, пользователь, схема). Резервное копирование выполняется в онлайн-режиме и не требует остановки СУБД. Рисунок 10 Варианты резервного копирования Резервные копии могут сохраняться на следующие компоненты:  На все узлы кластера  На один узел кластера  На другой кластер  На отдельно стоящее хранилище (NAS или ленточное хранилище)
  • 11. Организация зон разработки и тестирования HP Vertica участвует в цикле разработки аналитических продуктов, и важным свойством системы является возможность создания зон разработки и тестирования. Зоны разработки и тестирования могут разворачиваться как на продуктивной среде, так и на внешней физической, виртуальной или облачной инфраструктуре. При этом копии данных на эти зоны дополнительно не лицензируется. Лицензирование СУБД HP Vertica лицензируется исходя из объема загружаемых в систему «сырых» данных, стоимость терабайта уменьшается при увеличении объема хранилища в соответствии с диапазонами лицензирования (1-10ТБ, 11-50ТБ, 51-100ТБ, 101-500ТБ, более 500ТБ). Лицензируется только первая копия данных, копии на непродуктивные среды, включая Disaster Recovery, тестовые среды и среды разработки дополнительно не лицензируются. Гарантийная поддержка на первый год в режиме 24х7 включается в поставку лицензий и составляет 21% от стоимости лицензий.