Reprise sur incident - RMLL 2011
Upcoming SlideShare
Loading in...5
×
 

Reprise sur incident - RMLL 2011

on

  • 1,549 views

Que se soit suite à une attaque, une défaillance matérielle ou un bogue applicatif, et malgré toute les précautions prises en amont, aucune application en production n’est à l’abri d’une ...

Que se soit suite à une attaque, une défaillance matérielle ou un bogue applicatif, et malgré toute les précautions prises en amont, aucune application en production n’est à l’abri d’une catastrophe.

L’important est d’avoir un plan de reprise sur incident efficace pour limiter le plus possible l’impact d’un tel incident sur la qualité de service.

Cela passe par une phase de préparation (mise en place de logs, sauvegardes régulière, etc) et par un plan d’action pour le jour J (Communication de crise, diagnostiques, priorisation des tâches, etc.)

Statistics

Views

Total Views
1,549
Views on SlideShare
1,549
Embed Views
0

Actions

Likes
2
Downloads
10
Comments
0

0 Embeds 0

No embeds

Accessibility

Categories

Upload Details

Uploaded via as Adobe PDF

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment
  • Pas besoin d'argumenter : un dépôt de code est indispensable à partir d'un seul développeur

Reprise sur incident - RMLL 2011 Reprise sur incident - RMLL 2011 Presentation Transcript

  • Reprise sur incident RMLL 2011
  • Qui suis-je ?» Jean-Marc Fontaine» Consultant pour Alter Way Consulting» Président de lAFUP» Formateur / Professeur vacataire à luniversité de Saint Quentin» Co-auteur du livre blanc « Industrialisation PHP »» Auteur du blog Industrialisation-PHP.com
  • Cela va arriver !
  • Diminuer la gravité» Durée dindisponibilité» Perte de données» Rupture de la confidentialité22/07/11 ALTER WAY - Reprise sur incident
  • Minimiser limpact» En terme dimage» Financier22/07/11 ALTER WAY - Reprise sur incident
  • Se préparer22/07/11
  • Avoir un plan» Se préparer pour être efficace le jour J» Equipe spécialisée» Implication des fournisseurs22/07/11 ALTER WAY - Reprise sur incident
  • Mesures de mitigation» Machines virtuelles configurées» Réplication de la base de données» Désactivation de certaines fonctionnalités» Version statique22/07/11 ALTER WAY - Reprise sur incident
  • Sauvegardes» Sauvegarder tout» Sauvegarder régulièrement» Garder un historique intelligent22/07/11 ALTER WAY - Reprise sur incident
  • Journalisation (1/2)» Système» Application» Déploiements» Opérations de maintenance22/07/11 ALTER WAY - Reprise sur incident
  • Journalisation (2/2)» Privilégier les formats plats – Manipulation aisée – Signature – Compressibles – Gestion des droits aisées – Rotation22/07/11 ALTER WAY - Reprise sur incident
  • Communiquer en interne» Certains pics de fréquentations sont anticipables : – Période de lannée – Publicité – Promotion – Communication dans les médias22/07/11 ALTER WAY - Reprise sur incident
  • Déploiement automatisé» Rapide» Pas sujet à la pression» Outils : – Ant – Capistrano – Phing22/07/11 ALTER WAY - Reprise sur incident
  • Tester les procédures» Régulièrement» Avec précaution22/07/11 ALTER WAY - Reprise sur incident
  • Détecter22/07/11
  • Supervision» Ressources – Nagios – Centreon – Zabbix» Journaux» Application» Disponibilité – Pingdom – NetVigie22/07/11 ALTER WAY - Reprise sur incident
  • Facilitez le contact» Personne / service à contacter identifiés» Moyens de contact disponibles facilement» Réactivité aux contacts entrants22/07/11 ALTER WAY - Reprise sur incident
  • Communiquer22/07/11
  • Communication» Isoler léquipe dintervention» Escalader en interne si nécessaire» Communication externe : – Régulière – Aussi transparente que possible – Page détat22/07/11 ALTER WAY - Reprise sur incident
  • Analyser22/07/11
  • Identification de la cause» Interne – Panne matérielle – Instabilité logicielle – Bogue applicatif – Erreur humaine» Externe – Attaque – Panne matérielle – Pic de fréquentation22/07/11 ALTER WAY - Reprise sur incident
  • Portée» Quels sont les éléments touchés ?» Le service est-il réduit ou coupé ?22/07/11 ALTER WAY - Reprise sur incident
  • Impact» Problème de sécurité ?» Perte de données ?» Atteinte à limage ?22/07/11 ALTER WAY - Reprise sur incident
  • Corriger22/07/11
  • Correction» Activer les mesures de mitigation si nécessaire» Appliquer les mesures correctives» Déployer lapplication si nécessaire» En dernier recours tout couper22/07/11 ALTER WAY - Reprise sur incident
  • Apprendre22/07/11
  • Capitaliser» Méthode des 5 pourquoi» Intégrer le résultat aux procédures de test22/07/11 ALTER WAY - Reprise sur incident
  • Récapitulatif» Se préparer» Communiquer» Analyser» Corriger» Apprendre22/07/11 ALTER WAY - Reprise sur incident
  • Merci !» Email : jm@jmfontaine.net» Twitter : jmfontaine» Blog : www.jmfontaine.net» Autre blog : www.industrialisation-php.net22/07/11 ALTER WAY - Reprise sur incident
  • Crédits photos» http://www.flickr.com/photos/r000pert/136999467/» http://www.flickr.com/photos/illetirres/2214018398/» http://www.flickr.com/photos/larimdame/2575986601/» http://www.flickr.com/photos/techne/107093245/» http://www.flickr.com/photos/p-doodle/466500483/» http://www.flickr.com/photos/dennissylvesterhurd/141183312/22/07/11 ALTER WAY - Reprise sur incident