Управление непрерывностью
ИТ-услуг

Лекция 18
Основные понятия
Чрезвычайная
ситуация
—
стихийное
бедствие,
пожар,
аварийное
отключение
электроэнергии,
умышленные
разрушающие
действия
преступников
и
прочие
события,
затрудняющие
или
вовсе
прекращающие
предоставление ИТ-услуг.
Период времени восстановления — время
после возникновения чрезвычайной ситуации до
восстановления
предоставления ИТ-услуг
до
уровня, необходимого для продолжения бизнеспроцессов .
Цель процесса
Цель
процесса
управления
непрерывностью
ИТ-услуг
—
обеспечить
гарантированное восстановление предоставления
ИТ-услуг до уровня, необходимого для продолжения
бизнес-процессов за заданный период времени
после возникновения чрезвычайной ситуации.
Взаимосвязи с другими
процессами ITIL
с процессом управления уровнем услуг;
с процессом управления доступностью;
с процессом управления конфигурациями;
с процессом управления мощностями;
с процессом управления изменениями.

Виды деятельности
Определение области действия процесса
Анализ воздействия на бизнес
Оценка рисков
Стратегия обеспечения непрерывности ИТ-услуг
Организация процесса и планирования внедрения
Применение упреждающих мер и способов восстановления
Разработка планов и процедур восстановления
Начальное тестирование
Обучение и осведомление
Анализ и аудит
Тестирование
Обеспечение гарантий

Функции руководителя
координация работ по разработке и изменениям
документов и процедур;


формирование восстановительных команд для
каждой ИТ-услуги;


оперативное управление работами по
реагированию во время чрезвычайной ситуации.

Преимущества внедрения
процесса
возможность управлять восстановлением своих
систем;


возможность уменьшить простои в работе;



возможность свести к минимуму перерывы в
выполнении бизнес-процессов и ведении бизнеса в
целом.

Факторы успешного
внедрения процесса
наличие эффективного процесса управления
конфигурациями;


поддержка процесса всеми сотрудниками
компании, в первую очередь, руководства;


наличие современных эффективных
инструментальных средств;


проведение специального обучения для всех
участников данного процесса;


регулярное тестирование плана восстановления
в условиях, приближенных к реальным, без
предварительного уведомления задействованных
сотрудников.

Ключевые показатели
эффективности (KPI)
количество выявленных ошибок в планах и
процедурах восстановления;


потеря дохода организации в результате
чрезвычайной ситуации;


стоимость внедрения и поддержки процесса.


Проблемы и риски
внедрения процесса
недостаток ресурсов для разработки и тестирования
плана;


отсутствие понимания стратегии управления процессом у
высшего руководства;


отсутствие доступа ИТ-службы к средствам
восстановления для проведения регулярного тестирования;


сложность оценки потерь;



постоянное откладывание «на потом» внедрения
процесса;


разделенная, неконкретизированная ответственность;



ИТ-служба в своей работе руководствуется не
требованиями бизнеса, а своими предположениями;

Затраты
затраты времени и средств на внедрение
процесса;


затраты на организацию управления рисками и
связанное с этим дополнительное аппаратное
обеспечение;


переходящие затраты на поддержку выбранных
способов восстановления;


повторяющиеся операционные расходы на
тестирование, аудит и корректировку планов.


лекция 18 управление непрерывностью