Защита данных
и датацентров от
катастроф
Подход Nutanix
Защита: Принципы
• Отказ от RAID, в особенности аппаратных
• Интеллектуальная распределенная ФС (локализация I/O)
• Двойное (или тройное) резервирование блоков данных
• Резервирование путей доступа к данным
• Распределение данных с учетом аппаратных компонентов
Защита: Принципы
• Интегрированные снэпшоты
• Контроль над расписанием репликаций и политиками
• Минимизация RPO / RTO
• Асинхронная/синхронная репликация VM и датасторов
• Резервирование в public cloud
Защита: Нюансы
• Общий принцип – приложение знает
лучше как резервировать / реплицировать свои данные
• НО: Существует множество приложений, не умеющих это
делать или делающих плохо
• Синхронная репликация безопаснее всего = нулевая потеря
данных
• НО: На больших расстояниях (больше сотен километров)
высокая latency убьёт производительность системы
• Асинхронная репликация данных = потеря части данных в
случае аварии
• НО: Поэтому проектируйте или бизнес-логику исходя
из возможной потери данных, или датацентры располагайте
рядом
Защита: Практики
• Гибридная защита: на уровне приложений там где возможно.
Затем, асинхронная репликация как общее решение. Наконец,
синхронные метро-кластеры для ключевых и наиболее
чувствительных данных.
• Выбор правильного решения: Для большинства СХД
репликация не проектировалась с учетом современных
требований (работают на примитивном уровне LUN,
и не являются VM-centric)
• Репликация данных не заменяет бэкап. Испорченные данные
на одном сайте быстро станут испорченными на всех сайтах.
Бэкап = версионность.
Используйте регулярные снэпшоты данных как бэкап.
Nutanix Distributed File System
• Основан на доработанном коде Apache Cassandra
VM VM
Гипервизор
Контроллерная VM
Гипервизор
Контроллерная VM
Гипервизор
Контроллерная VM
DEF GHI
VM
ABCданные данные данные
Резервирование данных
внутри кластера
VM
DEFданные
Гипервизор
Контроллерная VM
Гипервизор
Контроллерная VM
Гипервизор
Контроллерная VM
VM
ABCданные
VM
GHIданные
VM
ABCданные
Высокая доступность (HA)
Интегрированная защита данных
 Безлимитные локальные
снапшоты с Time Stream
 Восстановление данных «одним
кликом»
 WAN-оптимизированная
репликация для DR
 Работает с ESXi, Hyper-V и
KVM
vdisk
Локальные
снапшоты
Снэпшоты в другом ДЦ
DR Кластер
Основной кластер
Локальные бэкапы (вне
кластера)
Onsite вторичные
Интеграция с бэкап ПО
Metro Availability
VMware HA
DC1 DC2
POC-01a POC-01b
Metro_A_to_B (active) Metro_A_to_B (standby)
Metro_B_to_A (active)Metro_B_to_A (standby)
ProtectionDomain:
Metro_B_to_A
ProtectionDomain:
Metro_A_to_B
Анатомия: MetroA
1. Операция записи
2. Пишем локально, и сразу…
3. Передаем на удаленную систему; ждем оттуда отклика
4. Ответ «Запись ОК» (Ack) от локального OpLog гипервизору
Анатомия: MetroA
1. Чтение
2. Передаем операцию в Active Container
3. Читаем данные из Active Container
4. Передаем данные в VM
MetroA: Результаты
● Параметры тестовой VM
○ 16vCPU, 64GB RAM, Win2012, MSSQL
○ TPC-C: 200 warehouses, 100 users
○ WANEM для симуляции задержек канала WAN между
кластерами
● Результаты:
Async Replica
• Передача на любое расстояние
• Любые схемы репликации
one-to-one, one-to-many, many-to-one, и т.д.
• Эффективно по расходу трафика (diff+dedup)
• Гранулярность – один vDisk
• Домены защиты для групп VM
• Без потери производительности!
Резервирование данных
в облаках – ключевые параметры
RTORPO Nutanix
Минуты Минуты Time Stream
Часы Часы Cloud Connect
Ноль Минуты Metro Availability
Минуты Минуты Remote Replication
Незначительные
инциденты
Cерьезные
инциденты
Recovery point objective Recovery time objective
Пример: FBI (2015г.)
• FBI Enclave Consolidation Initiative (2008-2015 гг.)
Программа технологического перевооружения и
консолидации IT-ресурсов
• 2 сайта Active-Active Async replica (1500 миль)
• По 35000 VDI-мест на каждом
Крупнейшая инсталляция VDI в США (70 000 VDI seats)
• Mission critical
• 544 системы Dell XC630-10 (OEM Nutanix)
• Hypervisor: ESXi
• VDI: Citrix XenDesktop
• Client: ERAS Raytheon TTC
ERAS Raytheon TTC
• «Тонкий» защищенный клиент
• Работает на BYOD
• Содержит в себе OS, гипервизор,
клиент к VDI и VPN клиент
• Позволяет работать в защищенной
среде сотрудникам FBI «в поле»
Cпасибо за внимание!
www.nutanix.ru
rhmelevsky@nutanix.com

Защита данных и датацентров от катастроф. Подход Nutanix / Максим Шапошников (Nutanix Inc.)

  • 1.
    Защита данных и датацентровот катастроф Подход Nutanix
  • 2.
    Защита: Принципы • Отказот RAID, в особенности аппаратных • Интеллектуальная распределенная ФС (локализация I/O) • Двойное (или тройное) резервирование блоков данных • Резервирование путей доступа к данным • Распределение данных с учетом аппаратных компонентов
  • 3.
    Защита: Принципы • Интегрированныеснэпшоты • Контроль над расписанием репликаций и политиками • Минимизация RPO / RTO • Асинхронная/синхронная репликация VM и датасторов • Резервирование в public cloud
  • 4.
    Защита: Нюансы • Общийпринцип – приложение знает лучше как резервировать / реплицировать свои данные • НО: Существует множество приложений, не умеющих это делать или делающих плохо • Синхронная репликация безопаснее всего = нулевая потеря данных • НО: На больших расстояниях (больше сотен километров) высокая latency убьёт производительность системы • Асинхронная репликация данных = потеря части данных в случае аварии • НО: Поэтому проектируйте или бизнес-логику исходя из возможной потери данных, или датацентры располагайте рядом
  • 5.
    Защита: Практики • Гибриднаязащита: на уровне приложений там где возможно. Затем, асинхронная репликация как общее решение. Наконец, синхронные метро-кластеры для ключевых и наиболее чувствительных данных. • Выбор правильного решения: Для большинства СХД репликация не проектировалась с учетом современных требований (работают на примитивном уровне LUN, и не являются VM-centric) • Репликация данных не заменяет бэкап. Испорченные данные на одном сайте быстро станут испорченными на всех сайтах. Бэкап = версионность. Используйте регулярные снэпшоты данных как бэкап.
  • 6.
    Nutanix Distributed FileSystem • Основан на доработанном коде Apache Cassandra
  • 7.
    VM VM Гипервизор Контроллерная VM Гипервизор КонтроллернаяVM Гипервизор Контроллерная VM DEF GHI VM ABCданные данные данные Резервирование данных внутри кластера
  • 8.
  • 9.
    Интегрированная защита данных Безлимитные локальные снапшоты с Time Stream  Восстановление данных «одним кликом»  WAN-оптимизированная репликация для DR  Работает с ESXi, Hyper-V и KVM vdisk Локальные снапшоты Снэпшоты в другом ДЦ DR Кластер Основной кластер Локальные бэкапы (вне кластера) Onsite вторичные Интеграция с бэкап ПО
  • 10.
    Metro Availability VMware HA DC1DC2 POC-01a POC-01b Metro_A_to_B (active) Metro_A_to_B (standby) Metro_B_to_A (active)Metro_B_to_A (standby) ProtectionDomain: Metro_B_to_A ProtectionDomain: Metro_A_to_B
  • 11.
    Анатомия: MetroA 1. Операциязаписи 2. Пишем локально, и сразу… 3. Передаем на удаленную систему; ждем оттуда отклика 4. Ответ «Запись ОК» (Ack) от локального OpLog гипервизору
  • 12.
    Анатомия: MetroA 1. Чтение 2.Передаем операцию в Active Container 3. Читаем данные из Active Container 4. Передаем данные в VM
  • 13.
    MetroA: Результаты ● Параметрытестовой VM ○ 16vCPU, 64GB RAM, Win2012, MSSQL ○ TPC-C: 200 warehouses, 100 users ○ WANEM для симуляции задержек канала WAN между кластерами ● Результаты:
  • 14.
    Async Replica • Передачана любое расстояние • Любые схемы репликации one-to-one, one-to-many, many-to-one, и т.д. • Эффективно по расходу трафика (diff+dedup) • Гранулярность – один vDisk • Домены защиты для групп VM • Без потери производительности!
  • 15.
    Резервирование данных в облаках– ключевые параметры RTORPO Nutanix Минуты Минуты Time Stream Часы Часы Cloud Connect Ноль Минуты Metro Availability Минуты Минуты Remote Replication Незначительные инциденты Cерьезные инциденты Recovery point objective Recovery time objective
  • 16.
    Пример: FBI (2015г.) •FBI Enclave Consolidation Initiative (2008-2015 гг.) Программа технологического перевооружения и консолидации IT-ресурсов • 2 сайта Active-Active Async replica (1500 миль) • По 35000 VDI-мест на каждом Крупнейшая инсталляция VDI в США (70 000 VDI seats) • Mission critical • 544 системы Dell XC630-10 (OEM Nutanix) • Hypervisor: ESXi • VDI: Citrix XenDesktop • Client: ERAS Raytheon TTC
  • 17.
    ERAS Raytheon TTC •«Тонкий» защищенный клиент • Работает на BYOD • Содержит в себе OS, гипервизор, клиент к VDI и VPN клиент • Позволяет работать в защищенной среде сотрудникам FBI «в поле»
  • 18.

Editor's Notes

  • #9 Seamless HA Metaданные service can access replicas from anywhere New copies are created to ensure continued fault tolerance