Tolerância a falhas

É a capacidade de um sistema apresentar um comportamento muito bem definido na ocorrência de falhas ativas, utilizando-se de técnicas que aumentem a segurança e a operacionalidade do sistema.

  1. Mascaramento: empregado para encobrir ou ocultar as falhas, porém sem apresentar defeito, é a forma mais completa de tolerância a falhas, a mais desejada e a de maior custo.
  2. Não tolerância a falhas é uma forma extrema, porém a solução mais trivial, mais frágil e com o custo mais reduzido, sendo a mais indesejada, visto que o sistema apresentará defeito.

Há também duas formas intermediárias de tolerância as falhas: o defeito seguro, que garante o estado seguro do sistema, mas nada diz sobre o seu estado operacional; e, tolerância a falhas sem mascaramento, onde o sistema permanecerá operacional, mesmo que ingresse num estado inseguro.

A redundância é a chave para se conseguir a tolerância a falhas e os sistemas distribuídos se utilizam de múltiplas formas de redundância, como:

  1. estrutura;
  2. hardware e software;
  3. informação;
  4. tempo.
Copyright © 2016 AIEC.