Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

XebiCon'17 - Comment j’ai automatisé la gestion des incidents de Photobox en 13h - Alexis "Horgix" Chotard

228 views

Published on

L’objectif de cette fast track est de vous démontrer l’intérêt du « everything as a REST API » ou comment faire communiquer de multiples services ensemble, la plupart n’étant pas développés en interne ni même modifiables, tout en gardant l’objectif d’avoir un prototype fonctionnel très rapidement.
Ce sujet sera abordé au travers d’un mini retour d’expérience basé sur l’automatisation de la gestion d’incidents – alors intégralement gérée à la main – réalisée lors d’un Hackathon client interne, au cours duquel je me suis retrouvé parachuté à développer un outil Ops, dans un temps contraint.
La solution finale obtenue, un bot Slack exploitant du Machine Learning pour reconnaître les intentions exprimées, est intégrée avec Jira et propose une page de status basée sur CachetHQ. Elle est capable de notifier les équipes par mail, et stocke les incidents dans Elasticsearch, ce qui permet de mener des analyses via différents dashboards de suivi, et bien plus encore.
Cette track s’attachera plus au « comment » qu’au « quoi », même si ce dernier sera bien sûr évoqué !

Published in: Technology
  • Be the first to comment

  • Be the first to like this

XebiCon'17 - Comment j’ai automatisé la gestion des incidents de Photobox en 13h - Alexis "Horgix" Chotard

  1. 1. Comment j’ai automatisé la gestion des incidents de Photobox en 13h Alexis “Horgix” Chotard 1
  2. 2. Photobox Automatisation de gestion d’incidents Contexte 2
  3. 3. Automatisation de gestion d’incidents Contexte “En 13h” ? ● Hackathon interne ● Objectif : innover par équipe en l’espace de 2j ● Principalement côté développeurs 3
  4. 4. Automatisation de gestion d’incidents Contexte Processus initial 4 Channel Slack #incidents E-mail au support Déclaration back-office Suivi via Google Doc Channel Slack dédié à l’incident #code-red-1337
  5. 5. 5 Automatisation de gestion d’incidents Contexte En résumé ● Point central de communication : ○ Slack ● Points d’information secondaires : ○ Emails ○ Jira ○ Google Doc ... Problèmes ● Synchronisation ● Processus douloureux ● Informations contradictoires ● Dépendances humaines
  6. 6. Automatisation de gestion d’incidents Automatisation Architecture cible 6
  7. 7. Automatisation de gestion d’incidents Bilan … et améliorations ● Hackathon != “quick’n’dirty” ○ Livré dans du Docker :) ○ Évènements de test : mock de Dialogflow ● Améliorations : ○ Responsables par projet avec invitation automatique ○ HTTP/2 pour notifier les clients ○ Réponse directement via Dialogflow ○ Statuspage.io ○ … 7
  8. 8. Conclusion Automatisation de gestion d’incidents Take away ● Beaucoup de solutions pour chaque pièce du puzzle ● Intégration facilitée par les APIs ● “Custom” vs solution existantes 8
  9. 9. Questions ? 9 @Horgix Horgix/incidents-automation-app Horgix/incidents-automation-infra

×