SOMMAIRE
L’approche préventive (p. 3)
L’approche curative (p. 4)
Activités critiques, hiérarchisation des systèmes! (p. 5)
Etude des activités critiques (p. 5)
Hiérarchisation des systèmes et données critiques (p. 6)
Evaluer les types de solutions, définir les périmètres (p. 7)!
Les métriques de base (p. 7)
Périmètre des données (p. 9)
Périmètre des systèmes (crash recovery) (p. 9)
Périmètre entreprise (site survey)! (p. 10)
Définir les procédures (p. 10)
Contenu de la documentation PRA (p. 11)
Annexe
Document de procédure PRA (p. 12-23)
Les droits de distribution de ce document sont libres.
Vous ne pouvez pas le reproduire, le copier, le modifier ou le vendre et devez en respecter le copyright.
2
Plan de reprise d’activité
Karim Abdi – www.exam-pm.com
Plan de reprise d’activité
Un plan de secours ou plan de reprise ou plan de continuité d’activité
ne peut être que du seul ressort de la direction informatique.!
Le PRA est un projet d’entreprise qui doit être dirigé par le comité de
direction afin de définir les priorités.
!Ici je me concentrerai sur la partie SI.
L’approche préventive
L’étude du PRA, basé sur les scenarii (plus de 220 au total) de la
méthode MEHARI demande un travail de préparation conséquent.!
Il faut tout d’abord définir le périmètre d’intervention du PRA.!
Les scenarii étant exhaustifs (de la simple panne ou effacement de
fichier à une grève, une catastrophe naturelle, un sabotage ou du
terrorisme), un premier tri doit être effectué.!
Chaque scénario découle d’un incident.!
Chaque incident a une ou plusieurs causes, nécessite une ou
plusieurs mesures de prévention ainsi que d’une ou plusieurs mesures
curatives (en fonction du cas de figure, des causes, etc.).!
Cette méthodologie ne peut être efficace que si elle est exhaustive
(dans le périmètre défini).
3
Plan de reprise d’activité
Karim Abdi – www.exam-pm.com
L’approche curative
Je vous propose une autre méthode, essentiellement applicable en
PME.!
C’est une approche combinant une méthodologie définie par Hewlett
Packard et les recommandations du CLUSIF.
On peut résumer cette méthode de la manière suivante.! En cas de
problème, et ce quelque soit la nature du problème, on ne peut se
retrouver que face à 3 situations différentes dans 99% des cas:!
- Problème ne touchant qu’un seul système / données /
application / utilisateur.
- Problème touchant plusieurs systèmes / données / applications
/ utilisateurs.!
- Problème touchant tous les systèmes et/ou le site.
Il suffit de mettre en place des solutions en fonction de ces trois cas
pour couvrir n’importe quel sinistre.!
Bien sûr, dans la démarche, des actions préventives peuvent et
doivent être mises en place.
4
Plan de reprise d’activité
Karim Abdi – www.exam-pm.com
Activités critiques, hiérarchisation des systèmes!
Etude des activités critiques
Dans cette approche, il n’est pas nécessaire d’avoir un niveau de
granularité proche des processus. Une étude des activités critiques
peut suffire.
Le schéma ci dessous ne représente pas toutes les activités de
l’entreprise mais celles dont l’arrêt peut causer des pertes financières.
!Les activités critiques sont en rouge.
Ici il s’agit du circuit de commande d’articles : quel que soit le canal
de commande (téléphone, fax, email) celui ci ne doit jamais
s’interrompre.! Il en va de même pour les payements. !L’ERP, qui gère
les commandes et la chaine logistique, ne doit pas, lui aussi, être
interrompu.
5
Plan de reprise d’activité
Karim Abdi – www.exam-pm.com
Hiérarchisation des systèmes et données critiques
Il est important d’avoir une connaissance exhaustive et à jour de
l’existant : téléphonie, wan, lan, alimentation électrique, postes
clients…!C’est sur cette base que le projet sera réalisé.! Une topologie
à jour de votre réseau est primordiale à la réalisation de la
hiérarchisation des systèmes critiques.
En fonction du schéma précédent sur les activités critiques, vous allez
définir l’ordre de priorité pour le redémarrage des équipements.
Au dessus de chaque élément se trouve une bulle dont la couleur est
fonction du type d’élément (système, réseau, périphérique, etc.).!
6
Plan de reprise d’activité
Karim Abdi – www.exam-pm.com
Dans chaque bulle se trouve un numéro : l’importance de
l’équipement et donc son ordre de remise en route suite à un incident.!
Et au dessus de la bulle, une annotation avec une durée : c’est la
durée maximale souhaitée avant une reprise en mode normal. !Vous
devez en faire de même avec les données.
Evaluer les types de solutions, définir les périmètres!
Les métriques de base!
- Estimation du coût d’arrêt de production : impact du sinistre
Un calcul d’impact de sinistre s’impose afin de positionner le point de
rupture (intersection des courbes, Cf. figure ci-dessus).!
Le périmètre défini par un rectangle rouge qualifiera une fourchette
pour votre temps de reprise après sinistre (recovery time objectif ou
RTO) et l’investissement correspondant. Il vous faudra en avoir
terminé avec ce qui suit pour compléter la courbe rouge.
7
Plan de reprise d’activité
Karim Abdi – www.exam-pm.com
- RPO recovery point objective : Désigne la durée maximale
d’enregistrement des données qu’il est acceptable de perdre lors
d’une avarie.
- RTO recovery time objective : Spécifie le délai maximum que
l’entreprise tolère avant de reprendre son activité.
Plus vos points et temps de reprise seront proches du sinistre et plus
la solution sera onéreuse.
!L’estimation du coût d’arrêt de production permet de ne pas
surdimensionner la solution.
8
Plan de reprise d’activité
Karim Abdi – www.exam-pm.com
Périmètre des données
- S’assurer que toute donnée importante pour l’activité soit
sauvegardée!
- Optimiser les sauvegardes!
- Supprimer du pool de sauvegarde les données “inutiles”
Périmètre des systèmes (crash recovery)
Définition des systèmes intégrés au PRA : alimentation électrique,
téléphonie, poste utilisateur, serveurs, lan, wan, …
9
Plan de reprise d’activité
Karim Abdi – www.exam-pm.com
Périmètre entreprise (site survey)!
Définition des parties (ou la totalité) du SI intégrées au site de secours.
Nous venons d’estimer l’investissement à faire pour notre PRA, de
définir le périmètre des éléments pris en compte ainsi que de définir
une partie du niveau de service (RTO et RPO).
Comme chaque plan de reprise est différent, il est difficile d’aller plus
loin dans le contenu des périmètres.! Mais vous avez tous les éléments
pour mettre en place les mesures de reprise en cas de sinistre.
Définir les procédures
Une fois le PRA en place, vous mettrez à disposition un document
aux formats papier et électronique (disponible quoi qu’il arrive donc
hors de la salle serveur avec une copie hors site).
Les procédures, et documents associés, sont le facteur clé de
réussite d’un plan de reprise et de continuité d’activité en cas de
sinistre (les tests aussi, mais nous n’en sommes pas encore là).!
Afin de ne pas noyer les intervenants dans un document imbuvable en
situation de stress (j’ai vu des pavés de plus de 200 pages… lorsque
la maison brûle, il y a peu de chance de se poser sur un canapé pour
le lire), j’ai pris le parti de réaliser un format inférieur à 20 pages, avec
des renvois suivant les situations.!
Partir d’un document général (celui fourni en annexe) pour descendre
au niveau de détails le plus fin suivant le rôle de l’intervenant, l’état
d’avancement du plan, le problème rencontré etc.
10
Plan de reprise d’activité
Karim Abdi – www.exam-pm.com
Contenu de la documentation PRA!
- Les contraintes du niveau de service,!
- La hiérarchisation des éléments du réseau,!
- Aide à la décision (gain de temps): Les arbres de décisions /
Identifier les scenarii possibles, !
- Les manuels d’utilisation, !
- La liste des contacts.
Pas plus de 25 pages, rappelez vous que ce genre de document ne
se lit jamais lorsque tout va bien et qu’en situation de stress on doit
trouver l’essentiel pour redémarrer l’activité.
Pour terminer, un PRA s’entretient et se met à jour.
Des tests réguliers (1 à 2 fois par an) doivent être réalisés pour vérifier
les solutions en place et entrainer les équipes à réagir.
11
Plan de reprise d’activité
Karim Abdi – www.exam-pm.com
ANNEXE
Le but de ce document (donné dans cette annexe) est d’apporter un
support et une aide à la décision lors d’un plan de reprise et de
continuité d’activité en cas de sinistre informatique.
- ce document est un exemple - il peut être pris comme base pour réaliser le votre Contenu :
§ Les contraintes du niveau de service
§ Une description des éléments du réseau
§ Une topologie du réseau et la hiérarchisation des systèmes
critiques
§ Les arbres de décisions
§ La liste des contacts fournisseurs
§ Une documentation sur l’utilisation du logiciel de « snapshot »
Dans la section « les arbres de décisions », les références aux
documents « incidents.xls », « contacts.doc » … servent à la
documentation électronique.
Dans le document papier, ces références sont présentes dans ce
même document.
12
Plan de reprise d’activité
Karim Abdi – www.exam-pm.com
SOMMAIRE de l’annexe
Les contraintes du niveau de service (p. 14)
Les éléments du réseau (p. 14)
Topologie réseau et la hiérarchisation des systèmes critiques (p. 15)
Les arbres de décisions (p. 16)
Plan de secours (p. 17)
Procédure : serveurs Windows et données (p. 18)
Snapshot : restauration d’une image (p. 18)
Procédure : LAN (p. 19)
Procédure : WAN (p. 20)
Procédure : PABX (p. 20)
Procédure : Alimentation électrique (p. 21)
Procédure : Site survey (p. 22)
Liste des contacts fournisseurs (p. 23)
13
Plan de reprise d’activité
Karim Abdi – www.exam-pm.com
Les contraintes du niveau de service
Les premières 24h
(après déclaration du sinistre)
Les premières 36h
(après déclaration du sinistre)
Les premières 72h
(après déclaration du sinistre)
Actions
Actions
Actions
Les éléments du réseau
14
Plan de reprise d’activité
Karim Abdi – www.exam-pm.com
Topologie du réseau et la hiérarchisation des systèmes
critiques
15
Plan de reprise d’activité
Karim Abdi – www.exam-pm.com
Les arbres de décisions
1ère étape en cas de sinistre informatique : Invocation ou non du plan
de secours et dans quelle mesure, ainsi que l’organisation des
équipes et prise de décisions.
Membres :
Cellule de veille :
Comité de crise :
Cellule de coordination :
Equipe d’intervention :
Service informatique
x
x
Service informatique
16
Plan de reprise d’activité
Karim Abdi – www.exam-pm.com
Plan de secours
En fonction de la nature du sinistre : choisir la procédure
correspondante.
Les procédures se trouvent dans ce document (voir sommaire).
17
Plan de reprise d’activité
Karim Abdi – www.exam-pm.com
Procédure : serveurs Windows et données
Snapshot : restauration d’une image
Indiquer ici la procédure de restauration avec le logiciel de snapshot.
18
Plan de reprise d’activité
Karim Abdi – www.exam-pm.com
Procédure : LAN
Le câblage provisoire sera l’achat de câbles réseau au mètre (voir
contacts) puis sertissage sur place afin de desservir les utilisateurs
directement depuis la salle serveur en cas de disfonctionnement du
réseau LAN (câblage).
19
Plan de reprise d’activité
Karim Abdi – www.exam-pm.com
Procédure : Site survey
La procédure « sitesecours.doc » donne les détails sur l’activation des
serveurs du site de secours, la restauration des données depuis les
bandes de sauvegarde externalisées, le paramétrage des postes
utilisateurs reçus…
22
Plan de reprise d’activité
Karim Abdi – www.exam-pm.com
Liste des contacts fournisseurs
- Téléphonie
- Alimentation électrique
- Postes utilisateurs
- LAN
- WAN
- Site de secours
- Serveurs
Pour chaque élément, ayez le maximum d’information :
- n° de téléphone
- Nom de contact privilégié
- Adresse email, site Web
- n° de contrat
- Les éléments contractuels importants : délai d’intervention par
ex.
- Vos identifiants, mots de passe (attention à la manière dont sera
conservé le document et qui y aura accès)
- etc. etc.
23
Plan de reprise d’activité
Karim Abdi – www.exam-pm.com