3. Хранилища данных
• Хранилища данных являются основой
современных систем управления
• "Единый и единственный источник истины"
• Как технические системы характеризуются
• Значительными объемами ввода-вывода
• Массовым параллелизмом операций
• Производительность достигается
применением адекватных программно-
технических средств
3
4. SAN-архитектура простого
хранилища данных
Процессоры
Серверы
HBA
HBA
Адаптеры
Предположим,
что система имеет
сбалансированную
Коммутатор
структуру
Контроллеры
Диски
4
5. Увеличение дискового пространства
в простом хранилище данных (1)
Процессоры
Серверы
HBA
HBA
Адаптеры
Достаточна ли
производительность
дисковых контроллеров?
Коммутатор
Контроллеры
Диски
5
6. Увеличение дискового пространства
в простом хранилище данных (2)
Процессоры
Серверы
HBA
HBA
Адаптеры
Достаточна ли
производительность
сетевых компонентов?
Коммутатор
Контроллеры
Диски
6
7. Увеличение дискового пространства
в простом хранилище данных (3)
Процессоры
Серверы
HBA1
HBA1
HBA2
HBA2
Адаптеры
Достаточна ли
производительность
Коммутаторы процессоров?
Диски
7
8. Уже не столь простое хранилище...
HBA1
HBA2
HBA1
HBA2
HBA1
HBA2
HBA1
HBA2
Сбалансированная
по пропускной
способности система
8
10. А как будет выглядеть такая
система?
8= ?
HBA
HBA
Х
10
11. Вертикальное масштабирование
• Можно сменить
платформу,
увеличить
количество
HBA1
HBA2
HBA1
HBA2
HBA1
HBA2
HBA1
HBA2
процессоров,
заменить массивы
?
на более
производительные...
• ...Но каналы
передачи данных
требуемой
производительности
не обеспечивают
11
13. InfiniBand
Пропускная способность соединения
МБ/сек
1400
1200
1000
800 В 3 раза
600 медленнее
В 12 раз
400 медленнее
200
0
Gigabit Ethernet 4Gb Fibre 20Gb InfiniBand
13
14. Радикальное увеличение
производительности хранилищ
• Достигается снижением объема данных,
передаваемых от дисковых массивов к серверу
• Объемы трафика сократятся, если сам дисковый
массив выполнит первичную обработку данных
• Элементарные, но массовые операции фильтрации
строк и столбцов, поиска пар при соединениях и т.п.
• Дисковый массив становится интеллектуальным
устройством, взаимодействующим с СУБД Oracle
• Фактически таким устройством может быть простой
сервер с большим количеством локальных дисков
• Основная идея технологии Exadata
14
15. Что такое Exadata (1)
Кластерные
серверы БД
InfiniBand
Индивидуальные
серверы хранения
15
16. Что такое Exadata (2)
Кластерные
серверы БД
Real
Application
Cluster
Интерконнект InfiniBand
Индивидуальные
серверы хранения
16
17. Что такое Exadata (3)
Кластерные
серверы БД
Серверы хранения
InfiniBand
не взаимодействуют!
Индивидуальные
серверы хранения
17
18. Что такое Exadata (4)
Кластерные
серверы БД
SELECT customer_id
FROM calls customer_id,
InfiniBand
WHERE amount > 200; amount > 200
Индивидуальные
серверы хранения
18
19. Что такое Exadata (5)
Кластерные
серверы БД
InfiniBand
Индивидуальные
серверы хранения
19
20. Что такое Exadata (6)
Кластерные
серверы БД
InfiniBand Параллельное
выполнение
Индивидуальные
серверы хранения
20
21. Что такое Exadata (7)
Кластерные
серверы БД
...
InfiniBand
...
Индивидуальные
серверы хранения
21
22. HP Oracle Database Machine
Extreme Performance
• Специализированная система для
хранилищ данных на базе Oracle
• Совместная разработка Oracle и HP
• Предустановленные OE Linux и Oracle
• ASM, RAC, Partitioning, плагин OEM
• Сверхвысокая производительность
• На ПОРЯДОК быстрее других платформ
• Скорость обработки от 14 ГБ/с
• Массовый параллелизм
• Каскадируемость
• Противовес Netezza,Teradata, Greenplum
22
24. Тесты для розничной торговли
От 3 до 50 раз быстрее
Merchandising Level 1 Detail:
Period Ago
Merchandising Level 1 Detail:
Current - 52 weeks
Supply Chain Vendor - Year - Item
Movement
Merchandising Level 1 Detail by
Week
Materialized Views Rebuild
Date to Date Movement
Comparison - 53 weeks
Prompt04 Clone for ACL audit
Sales and Customer Counts
Gift Card Activations
Recall Query
- 5.0 10.0 15.0 20.0 25.0 30.0 35.0 40.0 45.0 50.0
24
25. HP Oracle Database Machine
Что внутри?
• 8 серверов баз данных
• HP DL360 G5 с 2-мя 4-ядерными Intel
CPU, 32 ГБ ОЗУ, 4 SAS-диска 146 ГБ,
2-портовый адаптер InfiniBand
• Oracle Enterprise Linux
• Oracle DB 11g EE плюс RAC и Partitioning
25
26. HP Oracle Database Machine
Что внутри?
• 8 серверов баз данных
• HP DL360 G5 с 2-мя 4-ядерными Intel
CPU, 32 ГБ ОЗУ, 4 SAS-диска 146 ГБ,
2-портовый адаптер InfiniBand
• Oracle Enterprise Linux
• Oracle DB 11g EE плюс RAC и Partitioning
• 1Гб коммутатор Ethernet
• 4 24-портовых коммутатора InfiniBand
26
27. HP Oracle Database Machine
Что внутри?
• 8 серверов баз данных
• HP DL360 G5 с 2-мя 4-ядерными Intel
CPU, 32 ГБ ОЗУ, 4 SAS-диска 146 ГБ,
2-портовый 4x DDR адаптер InfiniBand
• Oracle Enterprise Linux
• Oracle DB 11g EE плюс RAC и Partitioning
• 4 24-портовых коммутатора InfiniBand
• 14 дисковых серверов (Exadata Storage)
• HP DL180 G5 с 2-мя 4-ядерными Intel
CPU, 8 ГБ ОЗУ, 12 дисков (SAS или SATA),
2-портовый 4x DDR адаптер InfiniBand
• Oracle Enterpise Linux
• Oracle Exadata Storage Server Software
27
28. HP Oracle Database Machine
Дисковые объемы и производительность
• При использовании SAS-дисков
• Производительность до 14 ГБ/сек
• Скорость загрузки до 1 ТБ/час
• До 21 ТБ пользовательских данных
• С учетом зеркалирования и
служебных структур базы данных
• При использовании SATA-дисков
• Производительность до 10.5 ГБ/сек
• Скорость загрузки до 1 ТБ/час
• До 46 ТБ пользовательских данных
28
30. Наращивание емкости хранилища
До 18 серверов
хранения в шкафу Увеличение количества шкафов
По лный шкаф
# SAS диски 97 TБ
# SATA диски 216 TБ
# Производите льность
боле е 18 ГБ /с
30
31. Exadata Storage Grid
Интеллектуальное дисковое пространство
• Масштабируемость
• Линейный рост производительности при
добавлении новых серверов хранения ...
• Данные автоматически (ASM) распределяются
между серверами хранения
• Данные перераспределяются в фоновом режиме
при добавлении или удалении серверов
• Отказоустойчивость
• Данные зеркалируются между серверами хранения
• Сбой диска или сервера хранения не критичен
• Простота применения
• Приложения не требуют какой-либо модификации
31
33. Итак, Exadata…
Основные моменты
• Массивно-параллельная архитектура с большим
количеством каналов передачи данных между
дисками и серверами БД
• Каждый из каналов передачи данных имеет
высокую пропускную способность
• Дисковая подсистема Exadata является частью
СУБД Oracle, выполняющей предварительную
обработку данных
• Многократное снижение нагрузки на каналы передачи
данных между дисками и серверами
• Высочайшая производительность в результате
33