SlideShare a Scribd company logo
1 of 16
Modelo de falhas
Sistemas Distribuídos 2011.2
• Define e classifica as falhas, fornecendo uma base para a
  análise de seus efeitos em potencial e para projetar
  sistemas capazes de tolerar certos tipos de falhas e
  continuar funcionando




Conceito
• Defeito – Sistema não cumpre o que foi especificado
• Erro – Estado do sistema causado por uma falha




Conceitos Básicos
• Estes atributos podem ocorrem tanto em Processos de
  sistema como em canais de comunicação




Ocorrência de falhas
• A tolerância a falhas é a propriedade de um sistema
  distribuído que lhe permite recuperar da existência de
  falhas, sem introduzir comportamentos incorretos.
Um sistema deste tipo pode mascarar as falhas e
continuar a operar, ou parar e voltar a operar
mais tarde, de forma coerente, após reparação
da falha.




Definições
• Disponibilidade - mede a fração de tempo em que um
  serviço está a operar corretamente, isto é, de acordo com
  a sua especificação.
Para um sistema ser altamente disponível (highly available)
deve combinar um reduzido número de falhas com um curto
período de recuperação das falhas (durante o qual não está
disponível).




Definições
• Confiabilidade - mede o tempo desde um instante inicial
  até à primeira falha, isto é, o tempo que um sistema
  funciona corretamente sem falhas.
Um sistema que falha com grande frequência e recupere
rapidamente tem baixa confiabilidade, mas alta
disponibilidade.




Definições
• Pontualidade - Em sistemas de tempo real é a garantia de
  que o sistema é capaz de obedecer a constrangimentos
  temporais, isto é, a capacidade que o sistema tem de
  garantir limites para o tempo que as diferentes ações
  levam a executar.




Definições
• Falhas por omissão
  • De envio
  • De recebimento
• Falhas arbitrárias
• Falhas de tempo
• Falhas de resposta
  • Valor
  • Transição de estado
• Falhas por queda




Classificação
Falhas de omissão e arbitrárias
Falhas de tempo
• Transiente
– Ocorre uma vez e depois desaparece
– Se a operação for repetida, a falha não acontecera novamente
• Intermitente
– Ocorre e desaparece por “sua própria vontade”.
– Difícil de diagnosticar;
• Permanente
– Continua a existir até que o componente faltoso seja substituído




Tipos
• Técnicas para mascarar falhas
• Redundância de informação
– Bits extras são adicionados para permitir recuperação de
bits deteriorados
• Redundância de tempo para falhas de omissão
– Uma ação é realizada e, então, se for preciso, ela é
executada novamente.
• Redundância física
– Componentes físicos replicados são usados

Mascaramento de Falha
por Redundância
• O termo comunicação confiável é definido em termos de validade e
  integridade:
   • Validade: qualquer mensagem do buffer de envio é entregue ao buffer de
     recepção de seu
     destino, independente do tempo necessário
     para tal.

   • Integridade: a mensagem recebida é idêntica à enviada e nenhuma mensagem
     é entregue duas vezes.

• A tarefa para preservar a Integridade vem de duas premissas:
   • Qualquer protocolo que retransmita mensagens, mas não rejeite uma
     mensagem que entregue duas vezes.

   • Usuários mal-intencionados que podem injetar mensagens
     modificadas, reproduzir mensagens antigas ou falsificar mensagens.




Confiabilidade na
comunicação Um para Um
• Resiliência de Processos
– Replicação de processos em grupos
– Grupos Simples ou Hierárquicos
• Comunicação Confiável Cliente-Servidor
– Falhas de Comunicação
– Canal de Comunicação pode exibir falhas por queda, por omissão, arbitrarias
– TCP(ponto-a-ponto); RPC
• Comunicação Confiável de Grupo
– Como implementar entrega confiável de mensagens a todos os processos?
• Comprometimento Distribuído
– Envolve a realização de uma operação por cada membro de um grupo de
processos ou por absolutamente nenhum.


Estratégias de Tolerância
a Falhas
FIM

More Related Content

What's hot

Especificação de Requisitos de Software
Especificação de Requisitos de SoftwareEspecificação de Requisitos de Software
Especificação de Requisitos de SoftwareRalph Rassweiler
 
IMEI Módulo 8 (Curso profissional de Gestão de Equipamentos Informáticos)
IMEI Módulo 8 (Curso profissional de Gestão de Equipamentos Informáticos)IMEI Módulo 8 (Curso profissional de Gestão de Equipamentos Informáticos)
IMEI Módulo 8 (Curso profissional de Gestão de Equipamentos Informáticos)Luis Ferreira
 
Arquitetura de Software Visão Geral
Arquitetura de Software Visão GeralArquitetura de Software Visão Geral
Arquitetura de Software Visão Geralsergiocrespo
 
Aula1 e aula2 - Analise e Projeto de Sistemas
Aula1 e aula2 - Analise e Projeto de SistemasAula1 e aula2 - Analise e Projeto de Sistemas
Aula1 e aula2 - Analise e Projeto de SistemasGustavo Gonzalez
 
Arquitetura de Software
Arquitetura de SoftwareArquitetura de Software
Arquitetura de SoftwareAricelio Souza
 
Questoesde fso
Questoesde fsoQuestoesde fso
Questoesde fsopaulocsm
 
Sistemas Operacionais
Sistemas OperacionaisSistemas Operacionais
Sistemas OperacionaisVirgínia
 
Vantagens e desvantagens em topologias de redes
Vantagens e desvantagens em topologias de redesVantagens e desvantagens em topologias de redes
Vantagens e desvantagens em topologias de redesMarco Martins
 
Algoritmos - Lógica de Programação
Algoritmos - Lógica de ProgramaçãoAlgoritmos - Lógica de Programação
Algoritmos - Lógica de ProgramaçãoElaine Cecília Gatto
 
SQL Server 2017 Tunning Automatico
SQL Server 2017 Tunning AutomaticoSQL Server 2017 Tunning Automatico
SQL Server 2017 Tunning AutomaticoEduardo Castro
 
Comparação de Desempenho entre máquinas virtuais e containers - por Bruno Rod...
Comparação de Desempenho entre máquinas virtuais e containers - por Bruno Rod...Comparação de Desempenho entre máquinas virtuais e containers - por Bruno Rod...
Comparação de Desempenho entre máquinas virtuais e containers - por Bruno Rod...Joao Galdino Mello de Souza
 
Sistemas Operacionais - Aula 2 - Visão Geral de Sistemas Operacionais
Sistemas Operacionais - Aula 2 - Visão Geral de Sistemas OperacionaisSistemas Operacionais - Aula 2 - Visão Geral de Sistemas Operacionais
Sistemas Operacionais - Aula 2 - Visão Geral de Sistemas OperacionaisCharles Fortes
 
Topologias Fisicas de rede
Topologias Fisicas de redeTopologias Fisicas de rede
Topologias Fisicas de redediogoaaf
 

What's hot (20)

Planejamento rede
Planejamento rede Planejamento rede
Planejamento rede
 
Especificação de Requisitos de Software
Especificação de Requisitos de SoftwareEspecificação de Requisitos de Software
Especificação de Requisitos de Software
 
IMEI Módulo 8 (Curso profissional de Gestão de Equipamentos Informáticos)
IMEI Módulo 8 (Curso profissional de Gestão de Equipamentos Informáticos)IMEI Módulo 8 (Curso profissional de Gestão de Equipamentos Informáticos)
IMEI Módulo 8 (Curso profissional de Gestão de Equipamentos Informáticos)
 
Arquitetura de Software Visão Geral
Arquitetura de Software Visão GeralArquitetura de Software Visão Geral
Arquitetura de Software Visão Geral
 
Aula1 e aula2 - Analise e Projeto de Sistemas
Aula1 e aula2 - Analise e Projeto de SistemasAula1 e aula2 - Analise e Projeto de Sistemas
Aula1 e aula2 - Analise e Projeto de Sistemas
 
Arquitetura de Software
Arquitetura de SoftwareArquitetura de Software
Arquitetura de Software
 
Aula1 historia das redes
Aula1   historia das redesAula1   historia das redes
Aula1 historia das redes
 
Questoesde fso
Questoesde fsoQuestoesde fso
Questoesde fso
 
Sistemas Operacionais
Sistemas OperacionaisSistemas Operacionais
Sistemas Operacionais
 
Uml
UmlUml
Uml
 
Vantagens e desvantagens em topologias de redes
Vantagens e desvantagens em topologias de redesVantagens e desvantagens em topologias de redes
Vantagens e desvantagens em topologias de redes
 
Sd05 (si) relógios e sincronização
Sd05 (si)   relógios e sincronizaçãoSd05 (si)   relógios e sincronização
Sd05 (si) relógios e sincronização
 
Algoritmos - Lógica de Programação
Algoritmos - Lógica de ProgramaçãoAlgoritmos - Lógica de Programação
Algoritmos - Lógica de Programação
 
SQL Server 2017 Tunning Automatico
SQL Server 2017 Tunning AutomaticoSQL Server 2017 Tunning Automatico
SQL Server 2017 Tunning Automatico
 
Comparação de Desempenho entre máquinas virtuais e containers - por Bruno Rod...
Comparação de Desempenho entre máquinas virtuais e containers - por Bruno Rod...Comparação de Desempenho entre máquinas virtuais e containers - por Bruno Rod...
Comparação de Desempenho entre máquinas virtuais e containers - por Bruno Rod...
 
Sistemas Operacionais - Aula 2 - Visão Geral de Sistemas Operacionais
Sistemas Operacionais - Aula 2 - Visão Geral de Sistemas OperacionaisSistemas Operacionais - Aula 2 - Visão Geral de Sistemas Operacionais
Sistemas Operacionais - Aula 2 - Visão Geral de Sistemas Operacionais
 
Topologias Fisicas de rede
Topologias Fisicas de redeTopologias Fisicas de rede
Topologias Fisicas de rede
 
Arquitetura de Software
Arquitetura de SoftwareArquitetura de Software
Arquitetura de Software
 
Instalação manutenção equip_informáticos
Instalação manutenção equip_informáticosInstalação manutenção equip_informáticos
Instalação manutenção equip_informáticos
 
Aula 7 - Modelagem de Software
Aula 7 - Modelagem de SoftwareAula 7 - Modelagem de Software
Aula 7 - Modelagem de Software
 

Viewers also liked

Aula 2 introdução a sistemas distribuídos
Aula 2   introdução a sistemas distribuídosAula 2   introdução a sistemas distribuídos
Aula 2 introdução a sistemas distribuídosEduardo de Lucena Falcão
 
Práticas e Modelos de Segurança
Práticas e Modelos de SegurançaPráticas e Modelos de Segurança
Práticas e Modelos de SegurançaDiego Souza
 
Dependabilidade e Segurança
Dependabilidade e SegurançaDependabilidade e Segurança
Dependabilidade e SegurançaRafael Barbolo
 
Redes de computadores volume 2
Redes de computadores   volume 2Redes de computadores   volume 2
Redes de computadores volume 2Marques Silva
 
Sistemas operativos distribuidos e de redes
Sistemas operativos distribuidos e de redesSistemas operativos distribuidos e de redes
Sistemas operativos distribuidos e de redesPortal_do_Estudante_SD
 
O trabalho como realmente ele é | Falha de comunicação
O trabalho como realmente ele é | Falha de comunicaçãoO trabalho como realmente ele é | Falha de comunicação
O trabalho como realmente ele é | Falha de comunicaçãoCentralInfo Kaspersky
 
79361331 barreiras-comunicacao
79361331 barreiras-comunicacao79361331 barreiras-comunicacao
79361331 barreiras-comunicacaoAnabela Silva
 
Barreiras á comunicação
Barreiras á comunicaçãoBarreiras á comunicação
Barreiras á comunicaçãoJoana Lima
 
Falhas na Comunicação
Falhas na ComunicaçãoFalhas na Comunicação
Falhas na ComunicaçãoKelly Ruas
 
Variedades linguísticas- exercício
Variedades linguísticas-  exercícioVariedades linguísticas-  exercício
Variedades linguísticas- exercícioCláudia Heloísa
 
Arquitetura cliente servidor
Arquitetura cliente servidorArquitetura cliente servidor
Arquitetura cliente servidorMarcia Abrahim
 

Viewers also liked (15)

Aula 2 introdução a sistemas distribuídos
Aula 2   introdução a sistemas distribuídosAula 2   introdução a sistemas distribuídos
Aula 2 introdução a sistemas distribuídos
 
Práticas e Modelos de Segurança
Práticas e Modelos de SegurançaPráticas e Modelos de Segurança
Práticas e Modelos de Segurança
 
Dependabilidade e Segurança
Dependabilidade e SegurançaDependabilidade e Segurança
Dependabilidade e Segurança
 
Redes de computadores volume 2
Redes de computadores   volume 2Redes de computadores   volume 2
Redes de computadores volume 2
 
Sistemas operativos distribuidos e de redes
Sistemas operativos distribuidos e de redesSistemas operativos distribuidos e de redes
Sistemas operativos distribuidos e de redes
 
O trabalho como realmente ele é | Falha de comunicação
O trabalho como realmente ele é | Falha de comunicaçãoO trabalho como realmente ele é | Falha de comunicação
O trabalho como realmente ele é | Falha de comunicação
 
Segurança em sistemas distribuidos
Segurança em sistemas distribuidosSegurança em sistemas distribuidos
Segurança em sistemas distribuidos
 
79361331 barreiras-comunicacao
79361331 barreiras-comunicacao79361331 barreiras-comunicacao
79361331 barreiras-comunicacao
 
Comunicação
ComunicaçãoComunicação
Comunicação
 
Barreiras á comunicação
Barreiras á comunicaçãoBarreiras á comunicação
Barreiras á comunicação
 
Problemas de comunicação
Problemas de comunicaçãoProblemas de comunicação
Problemas de comunicação
 
Falhas na Comunicação
Falhas na ComunicaçãoFalhas na Comunicação
Falhas na Comunicação
 
Desafios da Comunicação
Desafios da ComunicaçãoDesafios da Comunicação
Desafios da Comunicação
 
Variedades linguísticas- exercício
Variedades linguísticas-  exercícioVariedades linguísticas-  exercício
Variedades linguísticas- exercício
 
Arquitetura cliente servidor
Arquitetura cliente servidorArquitetura cliente servidor
Arquitetura cliente servidor
 

Similar to Modelo de falhas

Aula 3 (alta disponibilidade)
Aula 3 (alta disponibilidade)Aula 3 (alta disponibilidade)
Aula 3 (alta disponibilidade)Evandro Júnior
 
Sistemas Distribuídos
Sistemas DistribuídosSistemas Distribuídos
Sistemas DistribuídosRoberto Aragy
 
Tolerancia a falhas sistema distribuído .pdf
Tolerancia a falhas sistema distribuído .pdfTolerancia a falhas sistema distribuído .pdf
Tolerancia a falhas sistema distribuído .pdfHurgelNeto
 
Aula 03 qs - confiabilidade de sw
Aula 03   qs - confiabilidade de swAula 03   qs - confiabilidade de sw
Aula 03 qs - confiabilidade de swJunior Gomes
 
Sistemas de Tempo Real No Âmbito De Dependabilidade
Sistemas de Tempo Real No Âmbito De DependabilidadeSistemas de Tempo Real No Âmbito De Dependabilidade
Sistemas de Tempo Real No Âmbito De Dependabilidadechevreux
 
Sistemas Distribuídos Utilizando Microserviços e AWS
Sistemas Distribuídos Utilizando Microserviços e AWSSistemas Distribuídos Utilizando Microserviços e AWS
Sistemas Distribuídos Utilizando Microserviços e AWSJonas Silveira
 
2 Ads
2 Ads2 Ads
2 Adslcbj
 
Gerência de Processos: Processos
Gerência de Processos: ProcessosGerência de Processos: Processos
Gerência de Processos: ProcessosAlexandre Duarte
 
Categorias de escalonamento e objetivos do algoritmo de escalonamento
Categorias de escalonamento e objetivos do algoritmo de escalonamentoCategorias de escalonamento e objetivos do algoritmo de escalonamento
Categorias de escalonamento e objetivos do algoritmo de escalonamentoThaís Favore
 
Categorias de Escalonamento e Objetivos do Algorítmo Escalonador
Categorias de Escalonamento e Objetivos do Algorítmo EscalonadorCategorias de Escalonamento e Objetivos do Algorítmo Escalonador
Categorias de Escalonamento e Objetivos do Algorítmo EscalonadorSofia Trindade
 
Sistemas Distribuídos - Aula 4
Sistemas Distribuídos - Aula 4Sistemas Distribuídos - Aula 4
Sistemas Distribuídos - Aula 4Edison Santos
 
Técnicas para implementar aspectos de confiança em Web services
Técnicas para implementar aspectos de confiança em Web servicesTécnicas para implementar aspectos de confiança em Web services
Técnicas para implementar aspectos de confiança em Web servicesJaguaraci Silva
 
Sistemas Distribuídos - Aspectos de Projeto
Sistemas Distribuídos - Aspectos de ProjetoSistemas Distribuídos - Aspectos de Projeto
Sistemas Distribuídos - Aspectos de ProjetoAdriano Teixeira de Souza
 
UnP Eng. Software - Aula 26
UnP Eng. Software - Aula 26UnP Eng. Software - Aula 26
UnP Eng. Software - Aula 26Hélio Medeiros
 

Similar to Modelo de falhas (20)

Aula 3 (alta disponibilidade)
Aula 3 (alta disponibilidade)Aula 3 (alta disponibilidade)
Aula 3 (alta disponibilidade)
 
Sistemas Distribuídos
Sistemas DistribuídosSistemas Distribuídos
Sistemas Distribuídos
 
Tolerancia a falhas sistema distribuído .pdf
Tolerancia a falhas sistema distribuído .pdfTolerancia a falhas sistema distribuído .pdf
Tolerancia a falhas sistema distribuído .pdf
 
Sd04 (si) comunicação em sd
Sd04 (si)   comunicação em sdSd04 (si)   comunicação em sd
Sd04 (si) comunicação em sd
 
Aula sd 2008_02aspectosprojectosds
Aula sd 2008_02aspectosprojectosdsAula sd 2008_02aspectosprojectosds
Aula sd 2008_02aspectosprojectosds
 
Aula 03 qs - confiabilidade de sw
Aula 03   qs - confiabilidade de swAula 03   qs - confiabilidade de sw
Aula 03 qs - confiabilidade de sw
 
Servidores de Aplicações
Servidores de AplicaçõesServidores de Aplicações
Servidores de Aplicações
 
Sistemas de Tempo Real No Âmbito De Dependabilidade
Sistemas de Tempo Real No Âmbito De DependabilidadeSistemas de Tempo Real No Âmbito De Dependabilidade
Sistemas de Tempo Real No Âmbito De Dependabilidade
 
SISTEMA SD
SISTEMA SDSISTEMA SD
SISTEMA SD
 
Circuit Breaker
Circuit BreakerCircuit Breaker
Circuit Breaker
 
Alta Disponibilidade
Alta Disponibilidade Alta Disponibilidade
Alta Disponibilidade
 
Sistemas Distribuídos Utilizando Microserviços e AWS
Sistemas Distribuídos Utilizando Microserviços e AWSSistemas Distribuídos Utilizando Microserviços e AWS
Sistemas Distribuídos Utilizando Microserviços e AWS
 
2 Ads
2 Ads2 Ads
2 Ads
 
Gerência de Processos: Processos
Gerência de Processos: ProcessosGerência de Processos: Processos
Gerência de Processos: Processos
 
Categorias de escalonamento e objetivos do algoritmo de escalonamento
Categorias de escalonamento e objetivos do algoritmo de escalonamentoCategorias de escalonamento e objetivos do algoritmo de escalonamento
Categorias de escalonamento e objetivos do algoritmo de escalonamento
 
Categorias de Escalonamento e Objetivos do Algorítmo Escalonador
Categorias de Escalonamento e Objetivos do Algorítmo EscalonadorCategorias de Escalonamento e Objetivos do Algorítmo Escalonador
Categorias de Escalonamento e Objetivos do Algorítmo Escalonador
 
Sistemas Distribuídos - Aula 4
Sistemas Distribuídos - Aula 4Sistemas Distribuídos - Aula 4
Sistemas Distribuídos - Aula 4
 
Técnicas para implementar aspectos de confiança em Web services
Técnicas para implementar aspectos de confiança em Web servicesTécnicas para implementar aspectos de confiança em Web services
Técnicas para implementar aspectos de confiança em Web services
 
Sistemas Distribuídos - Aspectos de Projeto
Sistemas Distribuídos - Aspectos de ProjetoSistemas Distribuídos - Aspectos de Projeto
Sistemas Distribuídos - Aspectos de Projeto
 
UnP Eng. Software - Aula 26
UnP Eng. Software - Aula 26UnP Eng. Software - Aula 26
UnP Eng. Software - Aula 26
 

More from Diogenes Freitas

Visitando a literatura em redes neurais recorrentes
Visitando a literatura em redes neurais recorrentesVisitando a literatura em redes neurais recorrentes
Visitando a literatura em redes neurais recorrentesDiogenes Freitas
 
Proposta de identificação de impressões digitais empregando redes neurais art...
Proposta de identificação de impressões digitais empregando redes neurais art...Proposta de identificação de impressões digitais empregando redes neurais art...
Proposta de identificação de impressões digitais empregando redes neurais art...Diogenes Freitas
 
Uma Proposta de identificação de Impressões Digitais empregando Redes Neurais...
Uma Proposta de identificação de Impressões Digitais empregando Redes Neurais...Uma Proposta de identificação de Impressões Digitais empregando Redes Neurais...
Uma Proposta de identificação de Impressões Digitais empregando Redes Neurais...Diogenes Freitas
 
Um estudo sobre gerenciamento de variabilidade de requisitos em linha de prod...
Um estudo sobre gerenciamento de variabilidade de requisitos em linha de prod...Um estudo sobre gerenciamento de variabilidade de requisitos em linha de prod...
Um estudo sobre gerenciamento de variabilidade de requisitos em linha de prod...Diogenes Freitas
 
Paradigma Lógico e Funcional
Paradigma Lógico e FuncionalParadigma Lógico e Funcional
Paradigma Lógico e FuncionalDiogenes Freitas
 
Apresentacao banco de dados moveis
Apresentacao   banco de dados moveisApresentacao   banco de dados moveis
Apresentacao banco de dados moveisDiogenes Freitas
 
Um estudo sobre o gerenciamento de variabilidade em LInha de produto de software
Um estudo sobre o gerenciamento de variabilidade em LInha de produto de softwareUm estudo sobre o gerenciamento de variabilidade em LInha de produto de software
Um estudo sobre o gerenciamento de variabilidade em LInha de produto de softwareDiogenes Freitas
 

More from Diogenes Freitas (12)

Visitando a literatura em redes neurais recorrentes
Visitando a literatura em redes neurais recorrentesVisitando a literatura em redes neurais recorrentes
Visitando a literatura em redes neurais recorrentes
 
Reúso
ReúsoReúso
Reúso
 
Reconhecimento de digital
Reconhecimento de digitalReconhecimento de digital
Reconhecimento de digital
 
Proposta de identificação de impressões digitais empregando redes neurais art...
Proposta de identificação de impressões digitais empregando redes neurais art...Proposta de identificação de impressões digitais empregando redes neurais art...
Proposta de identificação de impressões digitais empregando redes neurais art...
 
Processadores de rede (2)
Processadores de rede (2)Processadores de rede (2)
Processadores de rede (2)
 
Tokenring
TokenringTokenring
Tokenring
 
Uma Proposta de identificação de Impressões Digitais empregando Redes Neurais...
Uma Proposta de identificação de Impressões Digitais empregando Redes Neurais...Uma Proposta de identificação de Impressões Digitais empregando Redes Neurais...
Uma Proposta de identificação de Impressões Digitais empregando Redes Neurais...
 
Open nebula
Open nebulaOpen nebula
Open nebula
 
Um estudo sobre gerenciamento de variabilidade de requisitos em linha de prod...
Um estudo sobre gerenciamento de variabilidade de requisitos em linha de prod...Um estudo sobre gerenciamento de variabilidade de requisitos em linha de prod...
Um estudo sobre gerenciamento de variabilidade de requisitos em linha de prod...
 
Paradigma Lógico e Funcional
Paradigma Lógico e FuncionalParadigma Lógico e Funcional
Paradigma Lógico e Funcional
 
Apresentacao banco de dados moveis
Apresentacao   banco de dados moveisApresentacao   banco de dados moveis
Apresentacao banco de dados moveis
 
Um estudo sobre o gerenciamento de variabilidade em LInha de produto de software
Um estudo sobre o gerenciamento de variabilidade em LInha de produto de softwareUm estudo sobre o gerenciamento de variabilidade em LInha de produto de software
Um estudo sobre o gerenciamento de variabilidade em LInha de produto de software
 

Modelo de falhas

  • 1. Modelo de falhas Sistemas Distribuídos 2011.2
  • 2. • Define e classifica as falhas, fornecendo uma base para a análise de seus efeitos em potencial e para projetar sistemas capazes de tolerar certos tipos de falhas e continuar funcionando Conceito
  • 3. • Defeito – Sistema não cumpre o que foi especificado • Erro – Estado do sistema causado por uma falha Conceitos Básicos
  • 4. • Estes atributos podem ocorrem tanto em Processos de sistema como em canais de comunicação Ocorrência de falhas
  • 5. • A tolerância a falhas é a propriedade de um sistema distribuído que lhe permite recuperar da existência de falhas, sem introduzir comportamentos incorretos. Um sistema deste tipo pode mascarar as falhas e continuar a operar, ou parar e voltar a operar mais tarde, de forma coerente, após reparação da falha. Definições
  • 6. • Disponibilidade - mede a fração de tempo em que um serviço está a operar corretamente, isto é, de acordo com a sua especificação. Para um sistema ser altamente disponível (highly available) deve combinar um reduzido número de falhas com um curto período de recuperação das falhas (durante o qual não está disponível). Definições
  • 7. • Confiabilidade - mede o tempo desde um instante inicial até à primeira falha, isto é, o tempo que um sistema funciona corretamente sem falhas. Um sistema que falha com grande frequência e recupere rapidamente tem baixa confiabilidade, mas alta disponibilidade. Definições
  • 8. • Pontualidade - Em sistemas de tempo real é a garantia de que o sistema é capaz de obedecer a constrangimentos temporais, isto é, a capacidade que o sistema tem de garantir limites para o tempo que as diferentes ações levam a executar. Definições
  • 9. • Falhas por omissão • De envio • De recebimento • Falhas arbitrárias • Falhas de tempo • Falhas de resposta • Valor • Transição de estado • Falhas por queda Classificação
  • 10. Falhas de omissão e arbitrárias
  • 12. • Transiente – Ocorre uma vez e depois desaparece – Se a operação for repetida, a falha não acontecera novamente • Intermitente – Ocorre e desaparece por “sua própria vontade”. – Difícil de diagnosticar; • Permanente – Continua a existir até que o componente faltoso seja substituído Tipos
  • 13. • Técnicas para mascarar falhas • Redundância de informação – Bits extras são adicionados para permitir recuperação de bits deteriorados • Redundância de tempo para falhas de omissão – Uma ação é realizada e, então, se for preciso, ela é executada novamente. • Redundância física – Componentes físicos replicados são usados Mascaramento de Falha por Redundância
  • 14. • O termo comunicação confiável é definido em termos de validade e integridade: • Validade: qualquer mensagem do buffer de envio é entregue ao buffer de recepção de seu destino, independente do tempo necessário para tal. • Integridade: a mensagem recebida é idêntica à enviada e nenhuma mensagem é entregue duas vezes. • A tarefa para preservar a Integridade vem de duas premissas: • Qualquer protocolo que retransmita mensagens, mas não rejeite uma mensagem que entregue duas vezes. • Usuários mal-intencionados que podem injetar mensagens modificadas, reproduzir mensagens antigas ou falsificar mensagens. Confiabilidade na comunicação Um para Um
  • 15. • Resiliência de Processos – Replicação de processos em grupos – Grupos Simples ou Hierárquicos • Comunicação Confiável Cliente-Servidor – Falhas de Comunicação – Canal de Comunicação pode exibir falhas por queda, por omissão, arbitrarias – TCP(ponto-a-ponto); RPC • Comunicação Confiável de Grupo – Como implementar entrega confiável de mensagens a todos os processos? • Comprometimento Distribuído – Envolve a realização de uma operação por cada membro de um grupo de processos ou por absolutamente nenhum. Estratégias de Tolerância a Falhas
  • 16. FIM