Your SlideShare is downloading. ×

Reprise sur incident - RMLL 2011

1,181

Published on

Que se soit suite à une attaque, une défaillance matérielle ou un bogue applicatif, et malgré toute les précautions prises en amont, aucune application en production n’est à l’abri d’une …

Que se soit suite à une attaque, une défaillance matérielle ou un bogue applicatif, et malgré toute les précautions prises en amont, aucune application en production n’est à l’abri d’une catastrophe.

L’important est d’avoir un plan de reprise sur incident efficace pour limiter le plus possible l’impact d’un tel incident sur la qualité de service.

Cela passe par une phase de préparation (mise en place de logs, sauvegardes régulière, etc) et par un plan d’action pour le jour J (Communication de crise, diagnostiques, priorisation des tâches, etc.)

Published in: Technology, Business
0 Comments
2 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total Views
1,181
On Slideshare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
11
Comments
0
Likes
2
Embeds 0
No embeds

Report content
Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
No notes for slide
  • Pas besoin d'argumenter : un dépôt de code est indispensable à partir d'un seul développeur
  • Transcript

    • 1. Reprise sur incident RMLL 2011
    • 2. Qui suis-je ?» Jean-Marc Fontaine» Consultant pour Alter Way Consulting» Président de lAFUP» Formateur / Professeur vacataire à luniversité de Saint Quentin» Co-auteur du livre blanc « Industrialisation PHP »» Auteur du blog Industrialisation-PHP.com
    • 3. Cela va arriver !
    • 4. Diminuer la gravité» Durée dindisponibilité» Perte de données» Rupture de la confidentialité22/07/11 ALTER WAY - Reprise sur incident
    • 5. Minimiser limpact» En terme dimage» Financier22/07/11 ALTER WAY - Reprise sur incident
    • 6. Se préparer22/07/11
    • 7. Avoir un plan» Se préparer pour être efficace le jour J» Equipe spécialisée» Implication des fournisseurs22/07/11 ALTER WAY - Reprise sur incident
    • 8. Mesures de mitigation» Machines virtuelles configurées» Réplication de la base de données» Désactivation de certaines fonctionnalités» Version statique22/07/11 ALTER WAY - Reprise sur incident
    • 9. Sauvegardes» Sauvegarder tout» Sauvegarder régulièrement» Garder un historique intelligent22/07/11 ALTER WAY - Reprise sur incident
    • 10. Journalisation (1/2)» Système» Application» Déploiements» Opérations de maintenance22/07/11 ALTER WAY - Reprise sur incident
    • 11. Journalisation (2/2)» Privilégier les formats plats – Manipulation aisée – Signature – Compressibles – Gestion des droits aisées – Rotation22/07/11 ALTER WAY - Reprise sur incident
    • 12. Communiquer en interne» Certains pics de fréquentations sont anticipables : – Période de lannée – Publicité – Promotion – Communication dans les médias22/07/11 ALTER WAY - Reprise sur incident
    • 13. Déploiement automatisé» Rapide» Pas sujet à la pression» Outils : – Ant – Capistrano – Phing22/07/11 ALTER WAY - Reprise sur incident
    • 14. Tester les procédures» Régulièrement» Avec précaution22/07/11 ALTER WAY - Reprise sur incident
    • 15. Détecter22/07/11
    • 16. Supervision» Ressources – Nagios – Centreon – Zabbix» Journaux» Application» Disponibilité – Pingdom – NetVigie22/07/11 ALTER WAY - Reprise sur incident
    • 17. Facilitez le contact» Personne / service à contacter identifiés» Moyens de contact disponibles facilement» Réactivité aux contacts entrants22/07/11 ALTER WAY - Reprise sur incident
    • 18. Communiquer22/07/11
    • 19. Communication» Isoler léquipe dintervention» Escalader en interne si nécessaire» Communication externe : – Régulière – Aussi transparente que possible – Page détat22/07/11 ALTER WAY - Reprise sur incident
    • 20. Analyser22/07/11
    • 21. Identification de la cause» Interne – Panne matérielle – Instabilité logicielle – Bogue applicatif – Erreur humaine» Externe – Attaque – Panne matérielle – Pic de fréquentation22/07/11 ALTER WAY - Reprise sur incident
    • 22. Portée» Quels sont les éléments touchés ?» Le service est-il réduit ou coupé ?22/07/11 ALTER WAY - Reprise sur incident
    • 23. Impact» Problème de sécurité ?» Perte de données ?» Atteinte à limage ?22/07/11 ALTER WAY - Reprise sur incident
    • 24. Corriger22/07/11
    • 25. Correction» Activer les mesures de mitigation si nécessaire» Appliquer les mesures correctives» Déployer lapplication si nécessaire» En dernier recours tout couper22/07/11 ALTER WAY - Reprise sur incident
    • 26. Apprendre22/07/11
    • 27. Capitaliser» Méthode des 5 pourquoi» Intégrer le résultat aux procédures de test22/07/11 ALTER WAY - Reprise sur incident
    • 28. Récapitulatif» Se préparer» Communiquer» Analyser» Corriger» Apprendre22/07/11 ALTER WAY - Reprise sur incident
    • 29. Merci !» Email : jm@jmfontaine.net» Twitter : jmfontaine» Blog : www.jmfontaine.net» Autre blog : www.industrialisation-php.net22/07/11 ALTER WAY - Reprise sur incident
    • 30. Crédits photos» http://www.flickr.com/photos/r000pert/136999467/» http://www.flickr.com/photos/illetirres/2214018398/» http://www.flickr.com/photos/larimdame/2575986601/» http://www.flickr.com/photos/techne/107093245/» http://www.flickr.com/photos/p-doodle/466500483/» http://www.flickr.com/photos/dennissylvesterhurd/141183312/22/07/11 ALTER WAY - Reprise sur incident

    ×