Семинар «Отказоустойчивость приложений – проблемы и простые решения. Выбор оптимального метода защиты для приложений различных классов».
Подробнее о мероприятии http://www.croc.ru/action/detail/1630/
Презентация Дмитрия Дощаного, ведущего инженера компании КРОК
2. КЛЮЧЕВЫЕ ФАКТОРЫ ПРИ ВЫБОРЕ
ОТКАЗОУСТОЙЧИВОГО РЕШЕНИЯ
• RPO/RTO
• От каких сбоев защищает?
• Стоимость
• Обеспечение консистентности данных приложения
• Техническая сложность поддержки и восстановления
• Организационная сложность эксплуатации решения
3. ЗАЩИТА ОТ СБОЕВ В ПРЕДЕЛАХ
ОДНОГО ВЫЧИСЛИТЕЛЬНОГО ЦЕНТРА
• Механизмы “log shipping” (Oracle DataGuard и его
аналоги для других приложений)
• Кластеризация средствами приложения (Oracle RAC)
• Кластер Аctive/Passive (MCSC, Veritas, AutoStart,
HACMP)
• High Availability в виртуальной среде
• Fault Tolerance в виртуальной среде
• Решения по непрерывной защите данных (EMC
RecoverPoint CDP)
• Oracle Flashback
4. LOG SHIPPING - ПРЕИМУЩЕСТВА
• Собственное средство производителя
• 100% обеспечение консистентности данных
• Возможность работы как в синхронном, так и в
асинхронном режиме
• Защита от порчи данных
• Полный контроль администратора СУБД
за процессом резервирования/восстановления
• Standby-база данных частично доступна
• Передаются только записи в лог-файлы
• Может защитить от сбоя системы хранения
5. • Труднореализуемо автоматическое
восстановление, на практике почти не применяется
• Настраивается и поддерживается на уровне
каждого приложения
• Необходимы лицензии на две копии СУБД
• Задействует ресурсы сервера
• Требует столько же дискового пространства,
сколько основные данные приложения
LOG SHIPPING - НЕДОСТАТКИ
6. КЛАСТЕРИЗАЦИЯ СРЕДСТВАМИ
ПРИЛОЖЕНИЯ (ORACLE RAC)
• Модель Active/Active
• От 0 секунд простоя при выходе из строя одного из
узлов кластера
• Полный контроль администратора СУБД
за процессом резервирования/восстановления
• Защищает только Oracle
• Не защищает от порчи данных
• Для каждой копии СУБД настраивается отдельно
• Не защищает от выхода из строя СХД/SAN
7. ACTIVE/PASSIVE КЛАСТЕР
• Расширенные возможности мониторинга
• Возможность автоматического восстановления в
случае сбоя
• Схожий способ настройки и управления
восстановлением для различных приложений
• Возможность быстрого восстановления большого
количества защищаемых приложений
• Не защищает от порчи данных
• Модель Active/Passive
• Не защищает от выхода из строя СХД/SAN
8. HIGH AVAILABILITY В ВИРТУАЛЬНОЙ
СРЕДЕ
• Настраивается на уровне гипервизора для многих
виртуальных серверов одновременно
• Низкая стоимость решения
• Требуется лицензия на одну копию ОС и
защищаемых приложений
• Не защищает от логической порчи данных
• Возможности мониторинга и автоматизации
восстановления хуже, чем в кластерном ПО
• Не защищает от выхода из строя СХД/SAN
9. FAULT TOLERANCE
• Нет перезапуска приложения
• От 0 секунд простоя при выходе из строя одного из
узлов кластера
• Возможность одинаково успешной работы в случае
последовательного отказа нескольких узлов
• Поддержка только одного CPU в защищаемой
виртуальной машине
• Некоторые ограничения на мобильность
виртуальной машины
• Не защищает от порчи данных
• Модель Active/Passive
10. RECOVERPOINT CDP -
ПРЕИМУЩЕСТВА
• Многократное быстрое восстановление на любой
момент времени
• Защита от порчи данных
• Единая консоль управления восстановлением для
нескольких серверов
• Интеграция с основными СУБД
• Возможность простого тестирования процесса
восстановления
• Независимость от аппаратного обеспечения
• Может защищать от выхода из строя СХД
11. RECOVERPOINT CDP - НЕДОСТАТКИ
• Интеграция с приложениями ограничена
• Консистентность восстановленных данных
только на уровне I/O
• Работает только в сети хранения FC
12. ЗАЩИТА ОТ СБОЕВ В
РАСПРЕДЕЛЕННОМ ВЦ
• Механизмы “log shipping”
• Удаленная репликация данных на уровне СХД (EMC
SRDF, MirrorView)
• Репликация на уровне ОС сервера (LVM, файловой
системы)
• Кластер Аctive/Passive на основе репликации между
СХД (Cluster Enabler for MCSC, Veritas, AutoStart,
HACMP)
• VMWare Site Recovery Manager
• Решения по непрерывной защите данных (EMC
RecoverPoint CRR)
13. LOG SHIPPING
• Связь между ОВЦ и РВЦ нужна только по IP
• Все остальные упомянутые раньше плюсы/минусы
сохраняются
14. УДАЛЕННАЯ РЕПЛИКАЦИЯ ДАННЫХ
НА УРОВНЕ СХД
• Не зависит от защищаемых серверов
• Простая настройка
• Настраивается одинаково для всех приложения
• Консистентность только на уровне I/O
• Не защищает от порчи данных
• Зачастую требует общего SAN между ОВЦ и РВЦ
15. УДАЛЕННАЯ РЕПЛИКАЦИЯ ДАННЫХ
НА УРОВНЕ ОС СЕРВЕРА
• Не зависит от систем хранения
• Защищает от сбоя СХД
• Не защищает от порчи данных
• Сложность в настройке
• При сбое сервера репликация прекращается
• Необходимость индивидуальной настройки и
управления для каждого сервера
16. КЛАСТЕР АCTIVE/PASSIVE НА
ОСНОВЕ РЕПЛИКАЦИИ МЕЖДУ СХД
• Сохраняются все основные плюсы/минусы кластера
• Защищает от сбоя СХД и целого ОВЦ
17. VMWARE SITE RECOVERY MANAGER
• Возможность перевода всей виртуальной структуры
в ОВЦ всего одним кликом
• Возможность простого тестирования процесса
восстановления
• Простая настройка
• Отсутствие автоматического режима работы
• Требуется репликация между СХД
18. RECOVERPOINT CRR
• Репликация консистентных данных на резервные
площадки
• Оптимальное использование каналов передачи