Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

La Duck Conf 2018 : "Stop à la résilience à la papa"

1,098 views

Published on

Appréhender les nouveaux modèles de résilience

Published in: Technology
  • Be the first to comment

La Duck Conf 2018 : "Stop à la résilience à la papa"

  1. 1. Stop à la résilience à la papa Ludovic Chauvaux Architecte François Xavier Vendé Architecte @vendefx @alcahest
  2. 2. Photo licensed CC0 Résilience, de quoi on parle ?
  3. 3. Qu’est ce que la résilience ? 3 Capacité d'un système à résister à la panne d’un ou plusieurs composants Tolérance aux pannes Reprise sur erreur Prévention des pannes
  4. 4. Pour quels risques ? 4 Manque à gagner Impact en terme d’image Remise en route complexe
  5. 5. Une disponibilité relative au service ! 5 99,999 %
  6. 6. Photo licensed CC0 Everything is ok
  7. 7. 7 L’état actuel SAN SAN Resilience applicative Resilience infrastructure Middleware OS App Middleware OS App
  8. 8. L’organisation actuelle Resilience applicative Resilience infrastructure Ouch, cela va être encore pour bibi ! C’est cool l’infra est toujours disponible !
  9. 9. >03 La cascade Vous croyez que ça va le faire ? Photo by Barbara Friedman licensed CC BY-NC 2.0
  10. 10. Situation actuel Un modèle arrivé en fin de vie 10 AUJOURD’HUI Cout de la disponibilité Disponibilité des services Attentes métier
  11. 11. Une nécessité d’aller au delà de l’infrastructure ! Applications et Services Architectures et Topologies Infrastructure
  12. 12. >04 On palme…. ...et surtout on sort la boîte à outils Photo credit : Summitdaily.com
  13. 13. Patterns et enjeux 13 Tolérance aux pannes Reprise sur erreur Prévention des pannes
  14. 14. Problème 1 14 Comment gérer la perte d’un serveur de données ?
  15. 15. Service Producteur Pattern Réplication Service Client Tolérance aux pannes Reprise sur erreur Nombre de nœuds impairs Besoin d’un réseau fiable et bien dimensionnée
  16. 16. Problème 2 16 Comment découpler mes services : “consommateurs” et “producteurs” ?
  17. 17. Service Producteur Messaging Service Client API Consommateur Stockage ID de corrélation à définir Reprise sur erreur Tolérance aux pannes Consommateur Idempotent
  18. 18. En cas de perte d’un composant comment éviter la panne généralisée ? Problème 3 18
  19. 19. Service Producteur BulkHead (Cloisonnement ) 19 Service Client 1 Bulk A Bulk B Bulk C Prévention des pannes Tolérance aux pannes Service Client 2 Service Client 3 Bulk au niveau “App” ou “Data”
  20. 20. Problème 4 20 Comment protéger un service “consommateur” ?
  21. 21. Circuit Breaker 21 Service Client Service Producteur Réponse alternative Réponse attendue Nécessite de s’accorder sur un comportement alternatif Tolérance aux pannes Réponse alternative Appel KO Coupure jusqu’à ce que Service A OK Appel OK
  22. 22. Problème 5 22 Comment agir en cas de service défaillant ?
  23. 23. Destroy and redeploy 23 Destroy1 Redeploy2 Mise en oeuvre de l’Infra as Code Nécessité d’avoir un orchestrateur Infra as a Service Prévention des pannes
  24. 24. Comment appeler un service “Producteur” sans en connaître l'adresse ? Problème 6 24
  25. 25. Service Registry Service Producteur Service Client Service Registry Interrogation de la registry1 Accès au service2 Service d’infrastructure Intégration nécessaire avec la registry Tolérance aux pannes
  26. 26. Comment anticiper la panne d’un service ? Problème 7 26
  27. 27. Service Producteur Monitoring Réactif 27 Prévention des pannes Service Client Remontée de métriques Simulation d’appels Remontée d’alertes Actions 1 1 2 3 Upscale Monitoring Alerting
  28. 28. Photo licensed CC0 Le torrent maîtrisé
  29. 29. 29 SAN SAN Middleware OS App Middleware OS App L’état actuel
  30. 30. Intégration d’un nouveau système tiers 30 SAN SAN Middleware OS App Middleware OS App Circuit Breaker Circuit Breaker Nouveau Système
  31. 31. Utilisation d’une Service Registry 31 SAN SAN Middleware OS App Middleware OS App Circuit Breaker Circuit Breaker Service Registry Nouveau Système
  32. 32. 32 SAN SAN Middleware OS App Middleware OS App Circuit Breaker Circuit Breaker Service Registry Ajout de monitoring "métier” Nouveau Système Monitoring
  33. 33. Et c’est bon côté organisation ? 33 BIZ OPS DEV PRODUIT Agilité DevOps DevOps
  34. 34. Take Away Photo by Florentijn Hofman licensed CC BY-NC 2.0
  35. 35. Take Away 35 Pensez la résilience au-delà de l’infrastructure ! Gérez votre infrastructure comme du bétail ! Utilisez du “commodity hardware” ! Utilisez un pattern en réponse à un besoin ! Adaptez votre organisation en mode produit !
  36. 36. Merci ! WP OCTO DevOps WP OCTO Cloud Ready Apps Ludovic Chauvaux Architecte @alcahest En savoir plus François Xavier Vendé Architecte @vendefx

×