Вебинар «Дедупликация vs Hеконтролируемый рост данных»
Подробнее о мероприятии http://www.croc.ru/action/detail/5668/
Презентация Котцова Антона, технического менеджера компании КРОК
2. Virtual
Server A
Virtual
Server B
Virtual
Server C
Традиционный подход
Физическая среда: Общее использование
ресурсов серверов зачастую весьма мало
Использование виртуализации
Виртуальная среда: Использование
компонент системы затрудняет решение
«дежурных» задач, в т.ч. и бэкапа
Активно используется порядка
20% ресурсов
100%
80%
40%
0%
60%
20%
УтилизацияCPU
100%
80%
40%
0%
60%
20%
УтилизацияCPU
Server A Server B Server C
ESXServer
Hardware
Shared Physical Resources
НЕХВАТКА «СВОБОДНЫХ»
РЕСУРСОВ ДЛЯ БЭКАПА
Активно используется порядка
80% ресурсов
3. Resource
Pool
VMware Virtualization Layer
x86 Architecture
~200%
изменяемых
данных
еженедельно
(на 1
виртуальную
машину)
Ленточные накопители
• Традиционный подход к бэкапу не эффективен
• Копируемые данные при еженедельном полном бэкапе и ежедневных
инкрементальных бэкапах достигают 200% от первоначального объема
за неделю
• Не решаются задачи по устранению «узких мест»: нагрузка на сеть,
сервер бэкапа или целевое устройство хранения
OS OS
Сервер
резервного
копирования
~200%
изменяемых
данных
еженедельно
(на 1
виртуальную
машину)
РОСТ ОБЪЕМОВ КОПИРУЕМЫХ
ДАННЫХ
4. Дедупликация в целевом устройствеДедупликация в источнике
Avamar
• Преимущества
– Уменьшение окна резервного копирования
– Сокращение нагрузки на виртуальную
инфраструктуру
– Сокращение нагрузки на полосу пропускания
при резервном копировании
между клиентом и сервером
Data Domain
• Преимущества
– Совместимость с существующим
ПО резервного копирования
– Высокая производительность при передаче
больших наборов данных и копировании
на ленточные накопители
– Независимость от протоколов: виртуальная
ленточная библиотека (VTL), NAS, NetBackup
Open Storage Option
Сеть
Сеть
ПОДХОДЫ ЗАЩИТЕ ДАННЫХ
5. Добавьте
дедупликацию в вашу
систему резервного
копирования
Никогда не копируйте
одни и те же данные
дважды
Data Domain
Системы хранения
Avamar
Системы резервного копирования
ОТЛИЧИЯ В ДВУХ ПОДХОДАХ
6. В устоявшемся режиме
дневные объемы снижаются
в десятки (сотни) раз
• При первом проходе
данных хранится
на 30-50% меньше
• Копируются только
уникальные блоки
Уникальные блоки
переменной длиныAvamar Server
День 1 День 2 День 3
ЭФФЕКТИВНОСТЬ AVAMAR
7. РЕЗЕРВНОЕ КОПИРОВАНИЕ
И ВОССТАНОВЛЕНИЕ
• Изменение традиционной
схемы резервного
копирования
– Ежедневные «виртуальные»
полные копии
– До 10 раз быстрее, чем обычно
До внедрения Avamar
После внедрения Avamar
Daily
Incre-
mental
Weekend
Full
Weekend
Full
Daily
Full
Daily
Full
Daily
Full
Daily
Full
Daily
Full
Daily
Full
Daily
Full
Daily
Incre-
mental
Daily
Incre-
mental
Daily
Incre-
mental
Daily
Incre-
mental
Каждая резервная копия —
это «полная» копия
Восстановление за один шаг
Восстановление отдельных
файлов или каталогов
8. ЭФФЕКТИВНОЕ ИСПОЛЬЗОВАНИЕ
РЕСУРСОВ
Загрузка диска
Загрузка сети
До 99% снижение объема данных
До 90% сокращение времени
До 95% снижение влияния на диск
До 95% снижение влияния на сеть
До 85% снижение влияния на CPU
Использование CPU
9. НАДЕЖНОСТЬ
ХРАНЕНИЯ
• Redundant Array of Independent
Nodes (RAIN)
– Защита от потери узла
– Масштабируемость (on-line)
• Avamar узлы (2U) — каждый
с дисками для хранения данных
– Архитектура GRID —
масштабируемость
и производительность
• RAID-защита дисков в каждом
узле
• Ежедневные проверки
целостности данных
• Репликация для защиты
от катастроф
Сервер Avamar
Четность между
узлами
Проверки
Управляющий и
запасной узел
10. • Использует существующую
инфраструктуру
– iSCSI, SAN или DAS
• Репликация снимает необходимость
транспортировки лент
– Также возможна репликация между
virtual Avamar и физическими
серверами Avamar
• Быстрое внедрение
• Поддерживает VMotion
• До 2х Avamar Virtual Edition на ESX server
Avamar
VM
Resource
Pool
VMware Virtualization Layer
x86 Architecture
Avamar
VM
Avamar
VM
EMC AVAMAR VIRTUAL EDITION:
ПРЕИМУЩЕСТВА
11. • Полная интеграция с VMWare
Virtual Center
• Auto-discovery серверов
VMWare и виртуальных машин
в окружении
• Отслеживание изменений,
интеграция с VMotion и Dynamic
Resource Scheduling (DRS)
• Поддержка всех методов
резервного копирования
VMWare: Support for Guest, VCB
and Console backup options
ИСПОЛЬЗОВАНИЕ ДЛЯ БЭКАПА
ВИРТУАЛЬНЫХ СРЕД
12. ЭФФЕКТИВНОСТЬ ДЕДУПЛИКАЦИИ
Тип данных
Размер
первого
Backup
Ежедневный
Backup
Степень
дедупликации
Файловые системы Windows 3,573 GB 6.1 GB 586:1
Файловые системы Windows, Linux, UNIX 5,097 GB 11.7 GB 436:1
Файлы, расположенные на NAS (NDMP
backups)
3,265 GB 24.2 GB 135:1
20% СУБД, 80% файловые системы
(Windows и UNIX)
9,583 GB 80.0 GB 120:1
Файловые системы Linux и СУБД 7,831 GB 104.2 GB 75:1
Реальный пример:
Тип данных
Оригинальный
объем
Внутри
Avamar
DataStore
Степень
дедупликации
Файлы MS Office на ноутбуках 4,7 TB 240 GB 20:1
13. ТУПИК? НЕТ, ВЫХОД ЕСТЬ!
• У вас уже есть система резервного копирования
• Вы не собираетесь менять ПО, процессы,
инфраструктуру
• Но вам нужно повысить эффективность
EMC Data Domain — простое открытое решение
14. ПРОСТОТА И СОВМЕСТИМОСТЬ
Репликация
CIFS, NFS,
NDMP, OpenStorage
Ethernet
VTL over FC
Backup and Archive
Applications
10 Gb and 1 Gb Ethernet
4 Gb Fibre Channel
RAID-6
5.4 до 71 TB используемая емкость
Data Domain DD880 Appliance
• Бесшовная инсталляция в существующую ИТ-инфраструктуру
• Поддержка большинства приложений резервного копирования
и архивирования
15. DATA DOMAIN И ОБЫЧНЫЙ B2D
12 TB raw space
160 TB usable space
120 TB raw space
80 TB usable space
• Энергопотребление
• Охлаждение
• Место в стойках
• Поддержка
• Управление
• Вероятность сбоя
Продуктивные данные 5 TB, храним 14 копий
1 неделя Fulls и Incrementals = 5.5 TB
8 недельных + 6 месячных копий = 74 TB
16. • Автоматическая репликация резервных копий
• Передаются только уникальные блоки данных
• Все резервные копии доступны на двух сайтах
Копия Реплика
200 GB
write
200 GB
200 GB
write
ПРОСТАЯ БЫСТРАЯ РЕПЛИКАЦИЯ
Backup
Server A
10 TB
Backup
Server B
10 TB
Site A Site B
10 TB
10 TB
10 TB
10 TB
10 TB
10 TB
10 TB
10 TB
10 TB
10 TB
17. ПРОДУКТОВАЯ ЛИНЕЙКА
DD140 DD610 DD630 DD660 DD690 DD880
Скорость (Max) 450 ГБ/ч 675 ГБ/ч 1,1 ТБ/ч 2,0 ТБ/ч 2,7 ТБ/ч 5,4 ТБ/ч
Скорость (DD Boost) 490 ГБ/ч 1,3 ТБ/ч 2,1 ТБ/ч 2,7 ТБ/ч 3,9 ТБ/ч 8,8 ТБ/ч
Логическая емкость 17–43 ТБ 75–195 ТБ 165–420 ТБ 0,520–1,31 ПБ 0,710–1,7 ПБ 2,8–7,1 ПБ
Полезная емкость 0,86 ТБ До 3,98 ТБ До 8,4 ТБ До 26,1 ТБ До 35,3 ТБ До 142,5 ТБ
Серия массивов DDX
Программные возможности
DD Boost, DD Virtual Tape Library,
DD Replicator, DD Retention Lock и
DD Encryption
До 16 контроллеров
Программно-
аппаратный
комплекс
для удаленных
офисов DD140
Серия программно-
аппаратных комплексов
DD600
DD880
18. ПРЕИМУЩЕСТВА EMC DATA DOMAIN
• Дедупликация в реальном времени (inline)
– Минимизация требуемого пространства в десять раз и более, по сравнению
с обычными системами
– Эффективная репликация по низкоскоростным каналам
– Предсказуемая производительность и простота управления
• Правильная архитектура
– Производительность — максимальна даже при неполной набивке дисками
– Надежность — сквозная проверка целостности
– Открытость — поддержка любых данных и ПО резервного копирования
• Зрелость решения
– 10000 систем установлено
– Средний уровень дедупликации 17.4:1
– В среднем одна открытая эскалация в службе техподдержки
– Система, которая «просто работает»