Identificação Interativa da Causa Raiz deProblemas no Gerenciamento de Mudanças de TIRicardo Luis dos SantosAluno de Mestr...
Roteiro•   Introdução•   Solução Proposta    • Processo de Diagnóstico    • Arquitetura Conceitual    • Root Cause Analyze...
Introdução•   Contexto      • A complexidade das infraestruturas de TI torna a tarefa de        gerenciamento uma missão c...
Introdução•   Gerenciamento de Problemas      • Define como o ciclo de vida de problemas de TI deve ser        gerenciado ...
Introdução•   Cenário Atual      • Muitas organizações utilizam ferramentas que auxiliam na        identificação da causa ...
Introdução•   Problemas      • Diversos diagnósticos deixam de ser concluídos        corretamente devido a desatualização ...
Introdução•   Objetivos      •   Otimizar o processo de identificação de causas raiz de          falhas ocorridas em mudan...
Solução Proposta Processo de Diagnóstico   Help Desk       Root Cause              Operator                    Analyzer   ...
Solução PropostaArquitetura Conceitual          Change                Change                    Deployment          Design...
Solução PropostaArquitetura Conceitual          Change                Change                          Deployment          ...
Solução PropostaArquitetura Conceitual          Change                 Change                             Deployment      ...
Solução PropostaRoot Cause Analyzer                      Reports the           Operator    problem                        ...
Solução PropostaRoot Cause Analyzer           Operator                                                                 Dia...
Solução PropostaRoot Cause Analyzer                                           Calculates the                   Identificat...
Solução PropostaRoot Cause Analyzer•   Um exemplo de infraestrutura de TI12 de 55
Solução PropostaRoot Cause Analyzer                   Log                   Log                  Log                CI    ...
Solução PropostaRoot Cause Analyzer                                           Calculates the                   Identificat...
Solução PropostaRoot Cause Analyzer            Log            Log           Log                          CI               ...
Solução Proposta Root Cause Analyzer                                                                                      ...
Server                                          System                                                    Computer System ...
Solução PropostaRoot Cause Analyzer                                           Calculates the                   Identificat...
Solução PropostaRoot Cause Analyzer                                           Calculates the                   Identificat...
26                                            35                                                         30               ...
Solução PropostaRoot Cause Analyzer                                           Calculates the                   Identificat...
26                                            35                                                         30               ...
26                                            35                                                         30               ...
Solução PropostaRoot Cause Analyzer                                           Calculates the                   Identificat...
Solução Proposta               Root Cause Analyzer                                                                    Soft...
Solução Proposta               Root Cause Analyzer                                                                    Soft...
Solução PropostaRoot Cause Analyzer                                           Calculates the                   Identificat...
Solução PropostaRoot Cause Analyzer                                           Calculates the                   Identificat...
Solução PropostaModelo de Informação                                                                    ManagedElement    ...
Solução PropostaEstratégias para Seleção de Perguntas•   A estrutura modular da solução permite utilizar    diferentes est...
Solução PropostaEstratégias para Seleção de Perguntas•   Estratégia 1 – Apenas diagnósticos concluídos      • Considera ap...
Solução PropostaEstratégias para Seleção de Perguntas•   Estratégia 1 – Apenas diagnósticos concluídos      • Considera ap...
Solução PropostaEstratégias para Seleção de Perguntas•   Estratégia 2 - Todos os diagnósticos      • Considera os diagnóst...
Solução PropostaEstratégias para Seleção de Perguntas•   Estratégia 2 - Todos os diagnósticos                             ...
Solução PropostaEstratégias para Seleção de Perguntas•   Estratégia 2 - Todos os diagnósticos                             ...
Solução PropostaEstratégias para Seleção de Perguntas•   Estratégia 3 - Idade dos diagnósticos      • Considera os diagnós...
Solução PropostaEstratégias para Seleção de Perguntas•   Estratégia 3 - Idade dos diagnósticos                            ...
Solução PropostaEstratégias para Seleção de Perguntas•    Estratégia 3 - Idade dos diagnósticos                           ...
Solução PropostaEstratégias para Seleção de Perguntas•    Estratégia 3 - Idade dos diagnósticos100% (1 - 4) + 10% (24 - 8)...
Solução PropostaEstratégias para Seleção de Perguntas•   Estratégia 4 – Popularidade das perguntas      • Considera os dia...
Solução PropostaEstratégias para Seleção de Perguntas•   Estratégia 4 – Popularidade das perguntas                        ...
Solução PropostaEstratégias para Seleção de Perguntas•   Estratégia 4 – Popularidade das perguntas                        ...
Solução PropostaEstratégias para Seleção de Perguntas•   Estratégia 4 – Popularidade das perguntas19 – 3 = 16            2...
AvaliaçãoEstudo de Caso 1•   O principal objetivo é evidenciar as seguintes    características da solução      • A capacid...
AvaliaçãoEstudo de Caso 1•   Uma RFC tem o propósito de instalar um serviço de    webmail      • Cenário 1 – As atividades...
AvaliaçãoEstudo de Caso 1•   Uma RFC tem o propósito de instalar um serviço de    webmail      • Cenário 1 – As atividades...
AvaliaçãoEstudo de Caso 1•   Infraestruturas identificadas38 de 55
AvaliaçãoEstudo de Caso 1•    Cenário 1              CI                          Categorias               Pesos    E-mail ...
AvaliaçãoEstudo de Caso 1•    Cenário 1              CI                          Categorias               Pesos    E-mail ...
AvaliaçãoEstudo de Caso 1•    Cenário 2              CI                             Categorias                Pesos    E-m...
AvaliaçãoEstudo de Caso 1•    Cenário 2              CI                             Categorias                Pesos    E-m...
AvaliaçãoEstudo de Caso 1•   Workflows de diagnóstico gerados41 de 55
AvaliaçãoEstudo de Caso 1•   Workflows de diagnóstico gerados                      O path dos arquivos de e-mail          ...
AvaliaçãoEstudo de Caso 2•   O principal objetivo é analisar os resultados gerados    pela aplicação das quatro estratégia...
AvaliaçãoEstudo de Caso 2•   Alguns serviços oferecidos pela empresa      • Hospedagem de sites      • Envio/recebimento d...
AvaliaçãoEstudo de Caso 2•   A RFC abaixo visa a instalar 2 novos servidores e a    migrar os serviços existentes44 de 55
AvaliaçãoEstudo de Caso 2•   A RFC abaixo visa a instalar 2 novos servidores e a    migrar os serviços existentes         ...
AvaliaçãoEstudo de Caso 2•   Ilustração da infraestrutura da empresa45 de 55
AvaliaçãoEstudo de Caso 2•   Ilustração da infraestrutura identificada45 de 55
AvaliaçãoEstudo de Caso 2•   Ilustração da infraestrutura identificada45 de 55
AvaliaçãoEstudo de Caso 2                                                 Pesos Calculados                 Categorias     ...
AvaliaçãoEstudo de Caso 2•   Workflows de diagnóstico gerados47 de 55
AvaliaçãoEstudo de Caso 2•   Workflows de diagnóstico gerados                   A configuração do PHP não permite         ...
AvaliaçãoEstudo de Caso 2•   Workflows de diagnóstico gerados48 de 55
AvaliaçãoEstudo de Caso 2•   Workflows de diagnóstico gerados                   A configuração do PHP não permite         ...
Conclusões•   Neste trabalho foi enfatizada a necessidade das    organizações em otimizar o processo de identificação    d...
Conclusões•   Principais contribuições      • A solução modular que permite as organizações        personalizar partes da ...
Conclusões•   Resultados obtidos      • Evidenciam a flexibilidade dos diagnósticos gerados      • As estratégias proposta...
Conclusões•   Resultados da pesquisa      • 2 trabalhos diretamente relacionados ao tema da pesquisa        publicados em ...
Conclusões•   Resultados da pesquisa     • 5 trabalhos colaborando com outros colegas           • NOMS 2010 (12th IEEE/IFI...
Trabalhos Futuros•   Explorar novas métricas e estratégias para a seleção    de perguntas      • Taxa de falsos positivos ...
Obrigado pela sua atenção!       Perguntas?
Referências•   J. P. Sauvé, R. A. Santos, R. R. Almeida et al., “On the Risk Exposure and Priority    Determination of Cha...
Referências•   J. Sauvé, R. Santos, R. Reboucas, A. Moura, and C. Bartolini, “Change priority    determination in it servi...
Referências•   K. Appleby, G. Goldszmidt, and M. Steinder, “Yemanja-a layered event correlation    engine for multi-domain...
AvaliaçãoEstudo de Caso 2•   CIs identificados e categorias associadas        CI                   Categorias        Hoste...
Sistema ChangeLedge        Change                   Operator               Change                 Operator        Initiato...
Solução PropostaModelo de Informação  Logical Element  EnabledLogical     Element                            ◄ recordedPro...
26                                            35                                                         30               ...
26                                             35                                                           30            ...
26                                            35                                                         30               ...
Solução Proposta               Root Cause Analyzer                                                                Software...
Solução Proposta               Root Cause Analyzer                                                                Software...
Solução PropostaRoot Cause Analyzer              16 bits    How many       32 bits                         bits is the    ...
Solução Proposta               Root Cause Analyzer                                                                Software...
Solução Proposta               Root Cause Analyzer                                                                Software...
Solução Proposta               Root Cause Analyzer                                                                Software...
26                                            35                                                         30               ...
26                                            35                                                         30               ...
26                                            35                                                         30               ...
Solução Proposta               Root Cause Analyzer                                                                Software...
Solução Proposta               Root Cause Analyzer                                                                Software...
Solução PropostaRoot Cause Analyzer              16 bits    How many       32 bits                         bits is the    ...
Solução Proposta               Root Cause Analyzer                                                                Software...
Solução Proposta               Root Cause Analyzer                                                                Software...
Solução PropostaRoot Cause Analyzer              16 bits    How many            32 bits                         bits is th...
Solução Proposta               Root Cause Analyzer                                                                Software...
Solução Proposta               Root Cause Analyzer                                                                Software...
Identificação Interativa da Causa Raiz de Problemas no Gerenciamento de Mudanças de TI
Upcoming SlideShare
Loading in …5
×

Identificação Interativa da Causa Raiz de Problemas no Gerenciamento de Mudanças de TI

2,803 views
2,678 views

Published on

Apresentação utilizada na minha defesa de mestrado.

0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
2,803
On SlideShare
0
From Embeds
0
Number of Embeds
3
Actions
Shares
0
Downloads
15
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Identificação Interativa da Causa Raiz de Problemas no Gerenciamento de Mudanças de TI

  1. 1. Identificação Interativa da Causa Raiz deProblemas no Gerenciamento de Mudanças de TIRicardo Luis dos SantosAluno de MestradoProf. Dr. Lisandro Zambenedetti GranvilleOrientadorUniversidade Federal do Rio Grande do Sul, Brasil
  2. 2. Roteiro• Introdução• Solução Proposta • Processo de Diagnóstico • Arquitetura Conceitual • Root Cause Analyzer • Modelo de Informação • Estratégias para Seleção de Perguntas• Avaliação• Conclusões• Trabalhos Futuros
  3. 3. Introdução• Contexto • A complexidade das infraestruturas de TI torna a tarefa de gerenciamento uma missão crítica • O Gerenciamento de Serviços tem por objetivo implantar e controlar os processos de TI • ITIL (Information Technology Infrastructure Library) tornou- se a mais importante coletânea de boas práticas e processos• Gerenciamento de Mudanças de TI • Dita a forma como uma infraestrutura de TI deve evoluir de maneira consistente e segura • Determina como uma mudança deve ser conduzida3 de 55
  4. 4. Introdução• Gerenciamento de Problemas • Define como o ciclo de vida de problemas de TI deve ser gerenciado • Os principais objetivos são • Prevenir a ocorrência de problemas • Eliminar problemas recorrentes • Minimizar o impacto de incidentes que não possam ser evitados • Para atingir esses objetivos é fundamental identificar a causa raiz de problemas de TI4 de 55
  5. 5. Introdução• Cenário Atual • Muitas organizações utilizam ferramentas que auxiliam na identificação da causa de falhas • A causa da falha é identificada através de um conjunto de passos pré- definidos, também chamado de caso • Quando não identificam a causa da falha, tais ferramentas fornecem informações relevantes • Possibilitam a reutilização do conhecimento, o que resulta em uma redução de custos • Porém, tais ferramentas possuem sérias limitações • Não possuem um padrão para descrever os casos, que são especificados de forma estática e ad hoc • Dificuldade na reutilização de casos • Por serem de difícil manutenção, os casos tornam-se desatualizados5 de 55
  6. 6. Introdução• Problemas • Diversos diagnósticos deixam de ser concluídos corretamente devido a desatualização dos casos • A infraestrutura de TI, na qual ocorre a falha, é ignorada • Dados de identificações anteriores não são considerados em novos diagnósticos• Estado da arte • Diversos aspectos relacionados à falhas e ao gerenciamento de TI são abordados, tais como, riscos, priorização, categorização e automatização • No entanto, nenhuma das pesquisas permite identificar a causa raiz de falhas na execução de mudanças6 de 55
  7. 7. Introdução• Objetivos • Otimizar o processo de identificação de causas raiz de falhas ocorridas em mudanças de TI • Propor uma solução para a identificação de causas de falhas em processos de mudança • Ser flexível às evoluções da infraestrutura de TI • Possuir casos adaptáveis à falhas similares • Ser compatível com o padrão para representação de infraestruturas • Reutilizar o conhecimento adquirido por experiências anteriores7 de 55
  8. 8. Solução Proposta Processo de Diagnóstico Help Desk Root Cause Operator Analyzer PR RC Interactive DiagnosisProblem Report Question Answered Root Cause Selection Question 8 de 55
  9. 9. Solução PropostaArquitetura Conceitual Change Change Deployment Designer Planner System RFC Change Management System Config. Mgmt. Database Operator9 de 55
  10. 10. Solução PropostaArquitetura Conceitual Change Change Deployment Designer Planner System RFC Change Management System Root Cause Analyzer Config. Mgmt. RC Database Diagnosis Log Operator Recorder Diagnosis System9 de 55
  11. 11. Solução PropostaArquitetura Conceitual Change Change Deployment Designer Planner System RFC Change Management System Root Cause Analyzer Config. Mgmt. RC Database Diagnosis Log Operator Recorder Diagnosis System CI Log CI Input Question QuestionPR RC Processor Selector Verifier RC RC RC Root Cause Analyzer9 de 55
  12. 12. Solução PropostaRoot Cause Analyzer Reports the Operator problem Diagnosis System Log Log Log CI CICI PR CI Priority …10 de 55
  13. 13. Solução PropostaRoot Cause Analyzer Operator Diagnosis System Log Log Log CI CICI PR IDENTIFIES: •Logs of previous diagnoses •RCs, Diagnostic Sets (categories) •Affected CIs10 de 55
  14. 14. Solução PropostaRoot Cause Analyzer Calculates the Identification weights Obvious? based on PR according to the strategy RC RC Selects the RC Identification Category that based on 80% with the has the greatest categories same answer weight Selects the Threshold CI Log CI Identification based on RCs Question has the greatest weight/level Input Processor Question Selector Question Verifier Root Cause Analyzer11 de 55
  15. 15. Solução PropostaRoot Cause Analyzer• Um exemplo de infraestrutura de TI12 de 55
  16. 16. Solução PropostaRoot Cause Analyzer Log Log Log CI CICI PR Diagnosis System CI Category CI Category Internet Third Party Services WEB Server (215) System ► Computer System ► Server ► Web Server DNS Server (423) System ► Computer System ► Server ► DNS Server Apache 2.2 Software ► Web Server PHP 5.0.2 Software ► Programming Language Hard Disk Device ► Storage Devices Network Card Device ► Network Cards13 de 55
  17. 17. Solução PropostaRoot Cause Analyzer Calculates the Identification weights Obvious? based on PR according to the strategy RC RC Selects the RC Identification Category that based on 80% with the has the greatest categories same answer weight Selects the Threshold CI Log CI Identification based on RCs Question has the greatest weight/level Input Processor Question Selector Question Verifier Root Cause Analyzer14 de 55
  18. 18. Solução PropostaRoot Cause Analyzer Log Log Log CI CICI PR Diagnosis System Select diagnostic sets RCs and Diagnostic Sets based on categories of CIs identified Configuration Mgmt. DataBase RC RC RC RC RC15 de 55
  19. 19. Solução Proposta Root Cause Analyzer RC RC RCSystem ► Computer System ► Server ► Web Server RC RC RC RC RC RCApplication ► Web Server RC RC RC RC RC RCDevice ► Network Cards RC RC RC RC RC RCThird Party Services RC Application System Device Computer System Network Card Web Server Server Third Party Services Web Server 16 de 55
  20. 20. Server System Computer System Web ServerSolução Proposta Software Web Server Root Cause Analyzer Third Party Services 17 de 55 Device Network Card
  21. 21. Solução PropostaRoot Cause Analyzer Calculates the Identification weights Obvious? based on PR according to the strategy RC RC Selects the RC Identification Category that based on 80% with the has the greatest categories same answer weight Selects the Threshold CI Log CI Identification based on RCs Question has the greatest weight/level Input Processor Question Selector Question Verifier Root Cause Analyzer18 de 55
  22. 22. Solução PropostaRoot Cause Analyzer Calculates the Identification weights Obvious? based on PR according to the strategy RC RC Selects the RC Identification Category that based on 80% with the has the greatest categories same answer weight Selects the Threshold CI Log CI Identification based on RCs Question has the greatest weight/level Input Processor Question Selector Question Verifier Root Cause Analyzer18 de 55
  23. 23. 26 35 30 20 Server System Computer System Web Server 95 70Solução Proposta 5 Software Web Server 74 Root Cause Analyzer 30 Third Party Services 19 de 55 Device Network Card
  24. 24. Solução PropostaRoot Cause Analyzer Calculates the Identification weights Obvious? based on PR according to the strategy RC RC Selects the RC Identification Category that based on 80% with the has the greatest categories same answer weight Selects the Threshold CI Log CI Identification based on RCs Question has the greatest weight/level Input Processor Question Selector Question Verifier Root Cause Analyzer20 de 55
  25. 25. 26 35 30 20 Server System Computer System Web Server 95 70Solução Proposta 5 Software Web Server 74 Root Cause Analyzer 30 Third Party Services 21 de 55 Device Network Card
  26. 26. 26 35 30 20 Server System Computer System Web Server 95 70Solução Proposta 5 Software Web Server 74 Root Cause Analyzer 30 Third Party Services 21 de 55 Device Network Card
  27. 27. Solução PropostaRoot Cause Analyzer Calculates the Identification weights Obvious? based on PR according to the strategy RC RC Selects the RC Identification Category that based on 80% with the has the greatest categories same answer weight Selects the Threshold CI Log CI Identification based on RCs Question has the greatest weight/level Input Processor Question Selector Question Verifier Root Cause Analyzer22 de 55
  28. 28. Solução Proposta Root Cause Analyzer Software Questions RC 1 (10) System Device 74 95 35 Questions RC 2 (20) Computer System Questions RC 3 (40)Network Card Web Server Questions RC 4 (25) 30 70 30 Questions RC 1,3 (50) Server 26 Third Party Services Web Server 5 20 23 de 55
  29. 29. Solução Proposta Root Cause Analyzer Software Questions RC 1 (10) System Device 74 95 35 Questions RC 2 (20) Computer System Questions RC 3 (40)Network Card Web Server Questions RC 4 (25) 30 70 30 Questions RC 1,3 (50) Server 26 Third Party Services Web Server 5 20 23 de 55
  30. 30. Solução PropostaRoot Cause Analyzer Calculates the Identification weights Obvious? based on PR according to the strategy RC RC Selects the RC Identification Category that based on 80% with the has the greatest categories same answer weight Selects the Threshold CI Log CI Identification based on RCs Question has the greatest weight/level Input Processor Question Selector Question Verifier Root Cause Analyzer24 de 55
  31. 31. Solução PropostaRoot Cause Analyzer Calculates the Identification weights Obvious? based on PR according to the strategy RC RC Selects the RC Identification Category that based on 80% with the has the greatest categories same answer weight Selects the Threshold CI Log CI Identification based on RCs Question has the greatest weight/level Input Processor Question Selector Question Verifier Root Cause Analyzer24 de 55
  32. 32. Solução PropostaModelo de Informação ManagedElement ExchangeElement SolutionCategory 1..* SolutionCategory ► * 1 ServiceIncident SolutionElement Category 1..* 1..* * * CategoryParentChild► QuestionCategory ► ServiceProblem ► 0..1 1 0..1 0..1 Problem RootCause determinesProblem► 0..1 determinesOthersQuestions ► 1..* * 1..* ◄possibleAnswers 1 Answer Question 1..* 1..* 0..*25 de 55
  33. 33. Solução PropostaEstratégias para Seleção de Perguntas• A estrutura modular da solução permite utilizar diferentes estratégias para a seleção das perguntas• As estratégias desenvolvidas utilizam as mesmas entradas e retornam uma única pergunta como resultado• 4 diferentes estratégias propostas • Estratégia 1 – Apenas diagnósticos concluídos • Estratégia 2 – Todos os diagnósticos do sistema • Estratégia 3 – Idade dos diagnósticos • Estratégia 4 – Popularidade das perguntas26 de 55
  34. 34. Solução PropostaEstratégias para Seleção de Perguntas• Estratégia 1 – Apenas diagnósticos concluídos • Considera apenas os diagnósticos concluídos com sucesso • Os pesos calculados não sofrem nenhuma penalização • O peso do elemento é computado através do somatório de todos os diagnósticos concluídos associados Causas Raiz Perguntas Respostas Diagnósticos Concluídos RC1 P1, P2 R1, R3 20 RC2 P1, P3 R2, R5 3027 de 55
  35. 35. Solução PropostaEstratégias para Seleção de Perguntas• Estratégia 1 – Apenas diagnósticos concluídos • Considera apenas os diagnósticos concluídos com sucesso • Os pesos calculados não sofrem nenhuma penalização • O peso do elemento é computado através do somatório de todos os diagnósticos concluídos associados Causas Raiz Perguntas Respostas Diagnósticos Concluídos RC1 P1, P2 R1, R3 20 RC2 P1, P3 R2, R5 30 30 20 + 30 = 50 2027 de 55
  36. 36. Solução PropostaEstratégias para Seleção de Perguntas• Estratégia 2 - Todos os diagnósticos • Considera os diagnósticos concluídos com sucesso e os diagnósticos frustrados • O peso de um elemento é igual ao somatório dos diagnósticos concluídos, porém, subtraindo o somatório dos diagnósticos frustrados • Um diagnóstico é considerado frustrado, quando uma pergunta é utilizada, porém, não integra o conjunto de diagnóstico da RC identificada28 de 55
  37. 37. Solução PropostaEstratégias para Seleção de Perguntas• Estratégia 2 - Todos os diagnósticos Diagnósticos Causas Raiz Perguntas Respostas Concluídos Frustrados RC1 P1, P2 R1, R3 20 10 RC2 P1, P3 R2, R5 30 1529 de 55
  38. 38. Solução PropostaEstratégias para Seleção de Perguntas• Estratégia 2 - Todos os diagnósticos Diagnósticos Causas Raiz Perguntas Respostas Concluídos Frustrados RC1 P1, P2 R1, R3 20 10 RC2 P1, P3 R2, R5 30 15 30 – 15 = 15 (20 + 30) – (10 + 15) = 25 20 – 10 = 1029 de 55
  39. 39. Solução PropostaEstratégias para Seleção de Perguntas• Estratégia 3 - Idade dos diagnósticos • Considera os diagnósticos concluídos e frustrados • Os diagnósticos são penalizados pela sua idade Idade Tempo de Diagnóstico Penalização 1ª Até 120 dias Não se aplica 2ª Entre 121 dias e 150 dias 10% 3ª Entre 151 dias e 180 dias 20% 4ª Entre 181 dias e 210 dias 30% 5ª Entre 211 dias e 240 dias 40% 6ª Entre 241 dias e 270 dias 50% 7ª Entre 271 dias e 300 dias 60% 8ª Entre 301 dias e 330 dias 70% 9ª Entre 331 dias e 360 dias 80% 10ª A partir de 360 dias 90%30 de 55
  40. 40. Solução PropostaEstratégias para Seleção de Perguntas• Estratégia 3 - Idade dos diagnósticos 10 pesoElemen to ( x )   i  (i  i ) i 1 i – idade de um diagnóstico βi – diferença entre 100% e o percentual de penalização aplicado à idade i αi – total de diagnósticos concluídos ωi – total de diagnósticos frustrados31 de 55
  41. 41. Solução PropostaEstratégias para Seleção de Perguntas• Estratégia 3 - Idade dos diagnósticos 10 pesoElemen to ( x )   i  (i  i ) i 1 Diagnósticos Diagnósticos Causas Raiz Perguntas Respostas Concluídos Frustrados 1ª idade 10ª idade 1ª idade 10ª idade RC1 P1, P2 R1, R3 1 24 4 8 RC2 P1, P3 R2, R5 4 15 1 232 de 55
  42. 42. Solução PropostaEstratégias para Seleção de Perguntas• Estratégia 3 - Idade dos diagnósticos100% (1 - 4) + 10% (24 - 8) = 1,6 1,6 Diagnósticos Diagnósticos Causas Raiz Perguntas Respostas Concluídos Frustrados 1ª idade 10ª idade 1ª idade 10ª idade RC1 P1, P2 R1, R3 1 24 4 8 RC2 P1, P3 R2, R5 4 15 1 2100% (4 - 1) + 10% (15 - 2) = 4,3 4,3 + 1,6 = 5,932 de 55
  43. 43. Solução PropostaEstratégias para Seleção de Perguntas• Estratégia 4 – Popularidade das perguntas • Considera os diagnósticos concluídos e frustrados • O peso das categorias e RCs é efetuado conforme a Estratégia 2 • O peso de uma pergunta considera o peso das RCs associadas e a popularidade • Popularidade é definida como a razão entre quantidade de ocorrências de uma pergunta e o número total de RCs selecionadas33 de 55
  44. 44. Solução PropostaEstratégias para Seleção de Perguntas• Estratégia 4 – Popularidade das perguntas x n   RCi  RCi , x n pesoPergunta ( x )  i 1 2 αx – ocorrências da pergunta x nos conjuntos de diagnóstico selecionados n – total de RCs selecionadas βRCi – probabilidade de identificação de uma RC αRCi, x – quantidade de ocorrências da pergunta no conjunto de diagnóstico analisado34 de 55
  45. 45. Solução PropostaEstratégias para Seleção de Perguntas• Estratégia 4 – Popularidade das perguntas x n   RCi  RCi , x n pesoPergunta ( x )  i 1 2 Diagnósticos Diagnósticos Causas Raiz Perguntas Respostas Concluídos Frustrados 1ª idade 10ª idade 1ª idade 10ª idade RC1 P1, P2 R1, R3 1 24 4 8 RC2 P1, P3 R2, R5 4 15 1 235 de 55
  46. 46. Solução PropostaEstratégias para Seleção de Perguntas• Estratégia 4 – Popularidade das perguntas19 – 3 = 16 25 – 12 = 13 (1/2 + ((13/29 * 1) + (16/29 * 0))) /2 = 0,4741 Diagnósticos Diagnósticos Causas Raiz Perguntas Respostas Concluídos Frustrados 1ª idade 10ª idade 1ª idade 10ª idade RC1 P1, P2 R1, R3 1 24 4 8 RC2 P1, P3 R2, R5 4 15 1 2(2/2 + ((13/29 * 1) + (16/29 * 1))) /2 = 1 (1/2 + ((13/29 * 0) + (16/29 * 1))) /2 = 0,525935 de 55
  47. 47. AvaliaçãoEstudo de Caso 1• O principal objetivo é evidenciar as seguintes características da solução • A capacidade de adaptar o diagnóstico às nuances da infraestrutura de TI • A possibilidade de gerar de diagnósticos diferentes a partir de uma mesma falha• Considere • Uma empresa possui a necessidade de instalar um servidor de webmail • Dois cenários com diferentes infraestruturas36 de 55
  48. 48. AvaliaçãoEstudo de Caso 1• Uma RFC tem o propósito de instalar um serviço de webmail • Cenário 1 – As atividades da RFC são executadas em apenas 1 servidor • Cenário 2 – As atividades da RFC são executadas em 2 servidores37 de 55
  49. 49. AvaliaçãoEstudo de Caso 1• Uma RFC tem o propósito de instalar um serviço de webmail • Cenário 1 – As atividades da RFC são executadas em apenas 1 servidor • Cenário 2 – As atividades da RFC são executadas em 2 servidores Ocorre uma falha37 de 55
  50. 50. AvaliaçãoEstudo de Caso 1• Infraestruturas identificadas38 de 55
  51. 51. AvaliaçãoEstudo de Caso 1• Cenário 1 CI Categorias Pesos E-mail Service Service  E-mail 25  17 Web Page Access Service  Web Page Server 25  7 Webmail Access Service  Webmail 25  1 Exim Software  Mail Server 35  15 SquirrelMail Software  Webmail 35  9 Apache Software  Web Server 35  1 WebServer System  Computer System  Web Server 21  16  739 de 55
  52. 52. AvaliaçãoEstudo de Caso 1• Cenário 1 CI Categorias Pesos E-mail Service Service  E-mail 25  17 Web Page Access Service  Web Page Server 25  7 Webmail Access Service  Webmail 25  1 Exim Software  Mail Server 35  15 SquirrelMail Software  Webmail 35  9 Apache Software  Web Server 35  1 WebServer System  Computer System  Web Server 21  16  739 de 55
  53. 53. AvaliaçãoEstudo de Caso 1• Cenário 2 CI Categorias Pesos E-mail Service Service  E-mail 25  17 Web Page Access Service  Web Page Server 25  7 Webmail Access Service  Webmail 25  1 Exim Software  Mail Server 35  15 SquirrelMail Software  Webmail 35  9 Apache Software  Web Server 35  1 WebServer System  Computer System  Web Server 26  21  5 E-mail Server System  Computer System  Mail Server 26  21  7 Logical Connection Network 38 Switch Devices  Network Devices 40  3640 de 55
  54. 54. AvaliaçãoEstudo de Caso 1• Cenário 2 CI Categorias Pesos E-mail Service Service  E-mail 25  17 Web Page Access Service  Web Page Server 25  7 Webmail Access Service  Webmail 25  1 Exim Software  Mail Server 35  15 SquirrelMail Software  Webmail 35  9 Apache Software  Web Server 35  1 WebServer System  Computer System  Web Server 26  21  5 E-mail Server System  Computer System  Mail Server 26  21  7 Logical Connection Network 38 Switch Devices  Network Devices 40  3640 de 55
  55. 55. AvaliaçãoEstudo de Caso 1• Workflows de diagnóstico gerados41 de 55
  56. 56. AvaliaçãoEstudo de Caso 1• Workflows de diagnóstico gerados O path dos arquivos de e-mail está errado As portas do Switch não foram configuradas corretamente41 de 55
  57. 57. AvaliaçãoEstudo de Caso 2• O principal objetivo é analisar os resultados gerados pela aplicação das quatro estratégias • Não há alterações, durante o estudo de caso, na infraestrutura identificada e na atividade que falhou • Caso uma pergunta seja selecionada por mais de uma estratégia, a resposta, fornecida pelo operador, será a mesma• Considere • Uma empresa atua na prestação de serviços Web • A atual infraestrutura consiste de 2 servidores • DB Server – Utilizado para serviços relacionados ao Banco de Dados • Web Server – Utilizado para propósito geral42 de 55
  58. 58. AvaliaçãoEstudo de Caso 2• Alguns serviços oferecidos pela empresa • Hospedagem de sites • Envio/recebimento de e-mails • Site para e-commerce • Webmail• A fim de atender a crescente demanda 2 novos servidores serão instalados • Hosting Server – Será utilizado para hospedar os sites dos clientes • Mail Server – Será utilizado para hospedar os serviços de e- mail43 de 55
  59. 59. AvaliaçãoEstudo de Caso 2• A RFC abaixo visa a instalar 2 novos servidores e a migrar os serviços existentes44 de 55
  60. 60. AvaliaçãoEstudo de Caso 2• A RFC abaixo visa a instalar 2 novos servidores e a migrar os serviços existentes Ocorre uma falha44 de 55
  61. 61. AvaliaçãoEstudo de Caso 2• Ilustração da infraestrutura da empresa45 de 55
  62. 62. AvaliaçãoEstudo de Caso 2• Ilustração da infraestrutura identificada45 de 55
  63. 63. AvaliaçãoEstudo de Caso 2• Ilustração da infraestrutura identificada45 de 55
  64. 64. AvaliaçãoEstudo de Caso 2 Pesos Calculados Categorias Nível Est. 1 Est. 2 Est. 3 Est. 4 Service 1 1083 242 157,30 242 Web Page Server 2 558 82 33,20 82 DataBase 2 519 195 127,60 195 Network 1 1058 345 188,10 345 Services 2 512 189 113,40 189 Devices 2 485 136 66,20 136 System 1 603 167 54,30 167 Computer System 2 545 153 52,90 153 Hosting Server 3 319 175 49,90 175 DB Server 3 192 -22 3,00 -22 Software 1 1115 343 126,60 343 Web Server 2 607 138 86,80 138 DB Server 2 443 169 36,20 16946 de 55
  65. 65. AvaliaçãoEstudo de Caso 2• Workflows de diagnóstico gerados47 de 55
  66. 66. AvaliaçãoEstudo de Caso 2• Workflows de diagnóstico gerados A configuração do PHP não permite a utilização da linguagem em sites de usuários47 de 55
  67. 67. AvaliaçãoEstudo de Caso 2• Workflows de diagnóstico gerados48 de 55
  68. 68. AvaliaçãoEstudo de Caso 2• Workflows de diagnóstico gerados A configuração do PHP não permite a utilização da linguagem em sites de usuários48 de 55
  69. 69. Conclusões• Neste trabalho foi enfatizada a necessidade das organizações em otimizar o processo de identificação da causa raiz falhas em mudanças de TI• Na prática, muitas organizações utilizam ferramentas que possuem diversas limitações• A solução proposta permite o processo de identificação de causa raiz de falhas, observando • A interatividade com o operador • O reúso do conhecimento adquirido • A flexibilidade às evoluções da infraestrutura • Compatibilidade com o CIM, largamente utilizado49 de 55
  70. 70. Conclusões• Principais contribuições • A solução modular que permite as organizações personalizar partes da solução para melhor refletirem suas necessidades especiais • Outras contribuições • Expansão do CIM para representar informações de diagnósticos anteriores e de casos adaptáveis • Flexibilidade do diagnóstico gerado e a utilização de casos adaptáveis • Estratégias propostas para a seleção de perguntas50 de 55
  71. 71. Conclusões• Resultados obtidos • Evidenciam a flexibilidade dos diagnósticos gerados • As estratégias propostas geram workflows diferentes, considerando a mesma infraestrutura e a mesma falha • Permitem recomendar o uso das estratégias para históricos de diagnósticos com diferentes características • Estratégia 1 – históricos com uma pequena quantidade de registros • Estratégia 2 – históricos volumosos e recentes • Estratégia 3 – históricos com no mínimo 10 meses de registros • Estratégia 4 – base de dados com uma grande quantidade de perguntas populares51 de 55
  72. 72. Conclusões• Resultados da pesquisa • 2 trabalhos diretamente relacionados ao tema da pesquisa publicados em eventos de grande relevância • IM 2011 (Mini-conference of 12th IFIP/IEEE International Symposium on Integrated Network Management): “A Solution for Identifying the Root Cause of Problems in IT Change Management” • SBRC 2011 (XXIX Simpósio Brasileiro de Redes de Computadores e Sistemas Distribuídos): “Identificação Interativa da Causa Raiz de Problemas em Execuções de Mudanças de TI” • 1 trabalho a ser submetido a partir dos resultados da dissertação ainda não publicados • IM 2013 - 13th IFIP/IEEE International Symposium on Integrated Network Management52 de 55
  73. 73. Conclusões• Resultados da pesquisa • 5 trabalhos colaborando com outros colegas • NOMS 2010 (12th IEEE/IFIP Network Operations and Management Symposium) • Computer-Generated Comprehensive Risk Assessment for IT Project Management • On Strategies for Planning the Assignment of Human Resources to IT Change Activities • WGRS/SBRC 2010 (15º Workshop de Gerência e Operação de Redes e Serviços) • Similaridade para Avalição de Riscos em Planos de Mudança de TI • SBES 2011 (25º Simpósio Brasileiro de Engenharia de Software) • Variáveis de Projetos de TI na Balança : Uma Abordagem Bayesiana para Previsão de Custos de Suporte • IM 2011 (12th IFIP/IEEE International Symposium on Integrated Network Management) • Leveraging IT Project Lifecycle Data to Predict Support Costs53 de 55
  74. 74. Trabalhos Futuros• Explorar novas métricas e estratégias para a seleção de perguntas • Taxa de falsos positivos e negativos • Confiança• Aplicar a solução em outros contextos• Obter dados reais para avaliação• Investigar o uso de classes do CIM (actions e checks) visando a melhorar o bootstrapping do sistema• Automatizar a identificação de determinados tipos de falhas54 de 55
  75. 75. Obrigado pela sua atenção! Perguntas?
  76. 76. Referências• J. P. Sauvé, R. A. Santos, R. R. Almeida et al., “On the Risk Exposure and Priority Determination of Changes in IT Service Management,” in XVIII IFIP/IEEE International Workshop on Distributed Systems: Operations and Management (DSOM 2007), 2007, pp. 147–158• ITIL, “ITIL - Information Technology Infrastructure Library. Office of Government Commerce (OGC),” 2009, Available: http://www.itilofficialsite.com/. Accessed: aug. 2010• G. Machado, F. Daitx, W. Cordeiro et al., “Enabling rollback support in IT change management systems,” in Network Operations and Management Symposium, 2008. NOMS 2008. IEEE, April 2008, pp. 347–354• W. Cordeiro, G. Machado, F. Andreis et al., “ChangeLedge: Change design and planning in networked systems based on reuse of knowledge and automation,” Computer Networks, vol. 53, no. 16, pp. 2782 – 2799, 2009• ITIL, “ITIL - Information Technology Infrastructure Library: Service Operation Version 3.0. Office of Government Commerce (OGC),” 2007• DMTF, “Distributed Management Task Force: Common Information Model. Distributed Management Task Force (DMTF),” 2009, Available: http://www.dmtf.org/standards/cim. Accessed: aug. 2010
  77. 77. Referências• J. Sauvé, R. Santos, R. Reboucas, A. Moura, and C. Bartolini, “Change priority determination in it service management based on risk exposure,” Network and Service Management, IEEE Transactions on, vol. 5, no. 3, pp. 178 –187, september 2008• A. Brown and A. Keller, “A best practice approach for automating it management processes,” in Network Operations and Management Symposium, 2006. NOMS 2006. 10th IEEE/IFIP, 3-7 2006, pp. 33 –44• A. Moura, J. Sauve, and C. Bartolini, “Business-driven it management - upping the ante of it : exploring the linkage between it and business to improve both it and business results,” Communications Magazine, IEEE, vol. 46, no. 10, pp. 148 –153, october 2008• A. Keller, J. Hellerstein, J. Wolf, K.-L. Wu, and V. Krishnan, “The champs system: change management with planning and scheduling,” in Network Operations and Management Symposium, 2004. NOMS 2004. IEEE/IFIP, vol. 1, 23-23 2004, pp. 395 – 408 Vol.1• M. Jantti and A. Eerola, “A Conceptual Model of IT Service Problem Management,” in Service Systems and Service Management, 2006 International Conference on, vol. 1, Oct. 2006, pp. 798–803• R. Gupta, K. Prasad, and M. Mohania, “Automating itsm incident management process,” in Autonomic Computing, 2008. ICAC ’08. International Conference on, 2-6 2008, pp. 141 –150
  78. 78. Referências• K. Appleby, G. Goldszmidt, and M. Steinder, “Yemanja-a layered event correlation engine for multi-domain server farms,” in Integrated Network Management Proceedings, 2001 IEEE/IFIP International Symposium on, 2001• M. Steinder and A. S. Sethi, “Probabilistic fault diagnosis in communication systems through incremental hypothesis updating,” Computer Networks, vol. 45, no. 4, pp. 537 – 562, 2004• W. L. C. Cordeiro, G. Machado, D. F.F. et al., “A template-based solution to support knowledge reuse in IT change design,” in Network Operations and Management Symposium, 2008. NOMS 2008. IEEE, April 2008, pp. 355–362• J. A. Wickboldt, L. A. Bianchin, R. C. Lunardi et al., “Improving it change management processes with automated risk assessment,” in XII IFIP/IEEE International Workshop on Distributed Systems: Operations and Management (DSOM 2009), 2009• R. C. Lunardi, F. G. Andreis, W. L. d. C. Cordeiro, J. A. Wickboldt, B. L. Dalmazo, R. L. d. Santos, L. A. Bianchin, L. P. Gaspary, L. Z. Granville, and C. Bartolini, “On strategies for planning the assignment of human resources to it change activities,” in Network Operations and Management Symposium, 2010. NOMS 2010. IEEE, apr. 2010, pp. 248–255
  79. 79. AvaliaçãoEstudo de Caso 2• CIs identificados e categorias associadas CI Categorias Hosted Sites Service  Web Page Server DataBase Access Service  DataBase Web Page Access Service  Web Page Server PHP Interpreter Service  Web Page Server CMS Service Service  Web Page Server Logical Connection Network  Services Joomla Software  Web Server PHP Software  Web Server Apache Software  Web Server MySQL Software  Web Server DB Server System  Computer System  DB Server Hosting Server System  Computer System  Hosting Server Switch Network  Devices
  80. 80. Sistema ChangeLedge Change Operator Change Operator Initiator Authority Rollback Support Generator Change Change Risk Rollback Designer Planner Analyzer Planner Change CI CI Deployer CI Config. Mgmt. Database Rollback EngineChange Management System Deployment System
  81. 81. Solução PropostaModelo de Informação Logical Element EnabledLogical Element ◄ recordedProblem 0..1 MessageLog Problem RootCause 1 1 1 0..1 0..1 determines ► Problem 1..* ◄recordedAnswers 1..* RecordLog Answer 1 1 1 1 1..* OthersQuestions possibles ► ◄determines Answers 1 ◄recordedQuestions Question 1 *
  82. 82. 26 35 30 20 Server System Computer System 95 70 Web ServerSolução Proposta 5 Software Web Server 74 Root Cause Analyzer 30 Third Party Services Device Network Card
  83. 83. 26 35 30 20 Server System Computer System 95 70 Web ServerSolução Proposta 5 Application Web Server 74 Root Cause Analyzer 30 Third Party Services Device Network Card
  84. 84. 26 35 30 20 Server System Computer System 95 70 Web ServerSolução Proposta 5 Software Web Server 74 Root Cause Analyzer 30 Third Party Services Device Network Card
  85. 85. Solução Proposta Root Cause Analyzer Software Questions RC 1 (10) System Device 74 95 35 Questions RC 2 (20) Computer System Questions RC 3 (40)Network Card Web Server Questions RC 4 (25) 30 70 30 Qestions RC 1, 3 (50) Server 26 Third Party Services Web Server 5 20
  86. 86. Solução Proposta Root Cause Analyzer Software Questions RC 1 (10) System Device 74 95 35 Questions RC 2 (20) Computer System Questions RC 3 (40)Network Card Web Server Questions RC 4 (25) 30 70 30 Common Questions Server 26 Third Party Services Web Server 5 20
  87. 87. Solução PropostaRoot Cause Analyzer 16 bits How many 32 bits bits is the application? 64 bits
  88. 88. Solução Proposta Root Cause Analyzer Software Questions RC 1 (10) System Device 74 95 35 Questions RC 2 (20) Computer System Questions RC 3 (40)Network Card Web Server Questions RC 4 (25) 30 70 30 Common Questions Server 26 Third Party Services Web Server 5 20
  89. 89. Solução Proposta Root Cause Analyzer Software Questions RC 1 (10) System Device 74 95 35 Questions RC 2 (20) Computer System Questions RC 3 (40)Network Card Web Server Questions RC 4 (25) 30 70 30 Common Questions Server 26 Third Party Services Web Server 5 20
  90. 90. Solução Proposta Root Cause Analyzer Software Questions RC 1 (10) System Device 74 95 35 Questions RC 2 (20) Computer System Questions RC 3 (40)Network Card Web Server Questions RC 4 (25) 30 95 – 70 = 25 70 30 Common Questions Server 26 Third Party Services Web Server 5 20
  91. 91. 26 35 30 20 Server System Computer System 25 70 Web ServerSolução Proposta 5 Software Web Server 74 Root Cause Analyzer 30 Third Party Services Device Network Card
  92. 92. 26 35 30 20 Server System Computer System 25 70 Web ServerSolução Proposta 5 Software Web Server 74 Root Cause Analyzer 30 Third Party Services Device Network Card
  93. 93. 26 35 30 20 Server System Computer System 25 70 Web ServerSolução Proposta 5 Software Web Server 74 Root Cause Analyzer 30 Third Party Services Device Network Card
  94. 94. Solução Proposta Root Cause Analyzer Software Questions RC 5 (15) System Device 74 Questions RC 6 (5) 25 35 Questions RC 7 (12) Computer SystemNetwork Card Web Server Questions RC 8 (12) 30 30 Questions RC 9 (2)70 Questions RC 10 (3) Server Questions RC 11 (25) 26 Third Party Services Common Questions Web Server 5 20
  95. 95. Solução Proposta Root Cause Analyzer Software Questions RC 5 (15) System Device 74 Questions RC 6 (5) 25 35 Questions RC 7 (12) Computer SystemNetwork Card Web Server Questions RC 8 (12) 30 30 Questions RC 9 (2)70 Questions RC 10 (3) Server Questions RC 11 (25) 26 Third Party Services Common Questions Web Server 5 20
  96. 96. Solução PropostaRoot Cause Analyzer 16 bits How many 32 bits bits is the application? 64 bits No The devices Yes are well plugged?
  97. 97. Solução Proposta Root Cause Analyzer Software Questions RC 5 (15) System Device 74 Questions RC 6 (5) 25 35 Questions RC 7 (12) Computer SystemNetwork Card Web Server Questions RC 8 (12) 30 30 Questions RC 9 (2)70 Questions RC 10 (3) Server Questions RC 11 (25) 26 Third Party Services Common Questions Web Server 5 20
  98. 98. Solução Proposta Root Cause Analyzer Software Questions RC 5 (15) System Device 74 Questions RC 6 (5) 25 35 Questions RC 7 (12) Computer SystemNetwork Card Web Server Questions RC 8 (12) 30 30 Questions RC 9 (2)70 Questions RC 10 (3) Server Questions RC 11 (25) 26 Third Party Services Common Questions Web Server 5 20
  99. 99. Solução PropostaRoot Cause Analyzer 16 bits How many 32 bits bits is the application? 64 bits No The devices Yes are well plugged? No Network Yes card detected?
  100. 100. Solução Proposta Root Cause Analyzer Software Questions RC 5 (15) System Device 74 Questions RC 6 (5) 25 35 Questions RC 7 (12) Computer SystemNetwork Card Web Server Questions RC 8 (12) 30 30 Questions RC 9 (2)70 Questions RC 10 (3) Server Questions RC 11 (25) 26 Third Party Services Common Questions Web Server 5 20
  101. 101. Solução Proposta Root Cause Analyzer Software Questions RC 5 (15) System Device 74 Questions RC 6 (5) 25 35 Questions RC 7 (12) Computer SystemNetwork Card Web Server Questions RC 8 (12) 30 30 Questions RC 9 (2)70 Questions RC 10 (3) Server Questions RC 11 (25) 26 Third Party Services Common Questions Web Server 5 20

×