Reprise sur incident - RMLL 2011

1,553 views
1,469 views

Published on

Que se soit suite à une attaque, une défaillance matérielle ou un bogue applicatif, et malgré toute les précautions prises en amont, aucune application en production n’est à l’abri d’une catastrophe.

L’important est d’avoir un plan de reprise sur incident efficace pour limiter le plus possible l’impact d’un tel incident sur la qualité de service.

Cela passe par une phase de préparation (mise en place de logs, sauvegardes régulière, etc) et par un plan d’action pour le jour J (Communication de crise, diagnostiques, priorisation des tâches, etc.)

Published in: Technology, Business
0 Comments
2 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
1,553
On SlideShare
0
From Embeds
0
Number of Embeds
1
Actions
Shares
0
Downloads
20
Comments
0
Likes
2
Embeds 0
No embeds

No notes for slide
  • Pas besoin d'argumenter : un dépôt de code est indispensable à partir d'un seul développeur
  • Reprise sur incident - RMLL 2011

    1. 1. Reprise sur incident RMLL 2011
    2. 2. Qui suis-je ?» Jean-Marc Fontaine» Consultant pour Alter Way Consulting» Président de lAFUP» Formateur / Professeur vacataire à luniversité de Saint Quentin» Co-auteur du livre blanc « Industrialisation PHP »» Auteur du blog Industrialisation-PHP.com
    3. 3. Cela va arriver !
    4. 4. Diminuer la gravité» Durée dindisponibilité» Perte de données» Rupture de la confidentialité22/07/11 ALTER WAY - Reprise sur incident
    5. 5. Minimiser limpact» En terme dimage» Financier22/07/11 ALTER WAY - Reprise sur incident
    6. 6. Se préparer22/07/11
    7. 7. Avoir un plan» Se préparer pour être efficace le jour J» Equipe spécialisée» Implication des fournisseurs22/07/11 ALTER WAY - Reprise sur incident
    8. 8. Mesures de mitigation» Machines virtuelles configurées» Réplication de la base de données» Désactivation de certaines fonctionnalités» Version statique22/07/11 ALTER WAY - Reprise sur incident
    9. 9. Sauvegardes» Sauvegarder tout» Sauvegarder régulièrement» Garder un historique intelligent22/07/11 ALTER WAY - Reprise sur incident
    10. 10. Journalisation (1/2)» Système» Application» Déploiements» Opérations de maintenance22/07/11 ALTER WAY - Reprise sur incident
    11. 11. Journalisation (2/2)» Privilégier les formats plats – Manipulation aisée – Signature – Compressibles – Gestion des droits aisées – Rotation22/07/11 ALTER WAY - Reprise sur incident
    12. 12. Communiquer en interne» Certains pics de fréquentations sont anticipables : – Période de lannée – Publicité – Promotion – Communication dans les médias22/07/11 ALTER WAY - Reprise sur incident
    13. 13. Déploiement automatisé» Rapide» Pas sujet à la pression» Outils : – Ant – Capistrano – Phing22/07/11 ALTER WAY - Reprise sur incident
    14. 14. Tester les procédures» Régulièrement» Avec précaution22/07/11 ALTER WAY - Reprise sur incident
    15. 15. Détecter22/07/11
    16. 16. Supervision» Ressources – Nagios – Centreon – Zabbix» Journaux» Application» Disponibilité – Pingdom – NetVigie22/07/11 ALTER WAY - Reprise sur incident
    17. 17. Facilitez le contact» Personne / service à contacter identifiés» Moyens de contact disponibles facilement» Réactivité aux contacts entrants22/07/11 ALTER WAY - Reprise sur incident
    18. 18. Communiquer22/07/11
    19. 19. Communication» Isoler léquipe dintervention» Escalader en interne si nécessaire» Communication externe : – Régulière – Aussi transparente que possible – Page détat22/07/11 ALTER WAY - Reprise sur incident
    20. 20. Analyser22/07/11
    21. 21. Identification de la cause» Interne – Panne matérielle – Instabilité logicielle – Bogue applicatif – Erreur humaine» Externe – Attaque – Panne matérielle – Pic de fréquentation22/07/11 ALTER WAY - Reprise sur incident
    22. 22. Portée» Quels sont les éléments touchés ?» Le service est-il réduit ou coupé ?22/07/11 ALTER WAY - Reprise sur incident
    23. 23. Impact» Problème de sécurité ?» Perte de données ?» Atteinte à limage ?22/07/11 ALTER WAY - Reprise sur incident
    24. 24. Corriger22/07/11
    25. 25. Correction» Activer les mesures de mitigation si nécessaire» Appliquer les mesures correctives» Déployer lapplication si nécessaire» En dernier recours tout couper22/07/11 ALTER WAY - Reprise sur incident
    26. 26. Apprendre22/07/11
    27. 27. Capitaliser» Méthode des 5 pourquoi» Intégrer le résultat aux procédures de test22/07/11 ALTER WAY - Reprise sur incident
    28. 28. Récapitulatif» Se préparer» Communiquer» Analyser» Corriger» Apprendre22/07/11 ALTER WAY - Reprise sur incident
    29. 29. Merci !» Email : jm@jmfontaine.net» Twitter : jmfontaine» Blog : www.jmfontaine.net» Autre blog : www.industrialisation-php.net22/07/11 ALTER WAY - Reprise sur incident
    30. 30. Crédits photos» http://www.flickr.com/photos/r000pert/136999467/» http://www.flickr.com/photos/illetirres/2214018398/» http://www.flickr.com/photos/larimdame/2575986601/» http://www.flickr.com/photos/techne/107093245/» http://www.flickr.com/photos/p-doodle/466500483/» http://www.flickr.com/photos/dennissylvesterhurd/141183312/22/07/11 ALTER WAY - Reprise sur incident

    ×