Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Incidente: agora o negócio ficou sério!

314 views

Published on

Palestra apresentada no Agile Testers Conference 2017 (Florianópolis)

Link para o template de post-mortem: https://docs.google.com/a/resultadosdigitais.com.br/document/d/1I9cDNclMwI0cIt_3nGH-sMAI8dUS3QwIWLoaxG14D-s/edit?usp=sharing

Um incidente é basicamente uma situação em que o sistema exibe comportamentos questionáveis, causando a interrupção ou redução na qualidade do serviço. Nessa palestra vou apresentar como a Resultados Digitais trata um incidente para que ele tenha o menor impacto possível em seus clientes e o time retire o máximo de aprendizado para garantir que no futuro isso não aconteça novamente.

Published in: Technology
  • Be the first to comment

Incidente: agora o negócio ficou sério!

  1. 1. Já encontrou algum problema grave em um software?
  2. 2. Nunca enfrentou algum problema grave em um software?
  3. 3. INCIDENTE agora o negócio ficou sério!
  4. 4. E u a j u d o e m p r e s a s d e T I a m e l h o r a r e m a q u a l i d a d e d o s e u p r o d u t o . CALIFORNIA ORGANIC FARMING EST 1995 QA CALIFORNIA ORGANIC FARMING danielle-moreira-093562a2 danielle.alexandre@resultadosdigitais.com.br
  5. 5. Interrupção inesperada ou redução na qualidade de um serviço de TI.
  6. 6. EVERYTHING FAILS ALL THE TIME Werner Vogels (Amazon, CTO)
  7. 7. Show me the incidents
  8. 8. Rápido Menor impacto nos clientes Aprender Repetir erros
  9. 9. PLANO DE TRATAMENTO DE INCIDENTE
  10. 10. IDENTIFIQUE O PROBLEMA 01 .
  11. 11. CRITÉRIOS GERAIS 1 Downtime do sistema 2 3 4 5 Degradação de um indicador Perda de dados de qualquer tipo Indisponibilidade de um dos serviços de terceiros Defeito impeditivo no fluxo principal
  12. 12. CRIE UM CANAL DE COMUNICAÇÃO INTERNO
  13. 13. COMUNIQUE O CLIENTE 02
  14. 14. A CONFIANÇA É O REFLEXO DO CONHECIMENTO.
  15. 15. PÁGINA DE STATUS - Investigando - Identificado - Monitorando - Resolvido - Funcionalidades afetadas - Detalhamento do incidente - Em operação - Performance degradada - Interrupção parcial do serviço - Interrupção do serviço - Incidente de segurança ESTADO ATUAL DESCRIÇÃO STATUS
  16. 16. RESOLVA O INCIDENTE 02
  17. 17. SOLUÇÃO 1 Conter 2 3 Contornar Corrigir
  18. 18. EXECUTE 04APRENDA 03
  19. 19. POST-MORTEM
  20. 20. 1 SEMANA APÓS A RESOLUÇÃO DO INCIDENTE ANÁLISE DA CAUSA RAIZ PASSOS PARA AVALIAR, DIAGNOSTICAR E RESOLVER LINHA DO TEMPO DAS ATIVIDADES RESUMO DE ALTO NÍVEL APRENDIZADOS E PRÓXIMOS PASSOS POST-MORTEM Template
  21. 21. PLANO DE AÇÃO
  22. 22. A Ç Õ E S D E P R E V E N Ç Ã O R E S P O N S Á V E L D A T A D E R E S O L U Ç Ã O
  23. 23. PROCESSO VISUAL
  24. 24. OBRIGADA! Um erro se torna uma boa lição se escolhemos aprender com ele. Estamos contratando

×