Ao longo dos meus quase 40 anos na carreira de TI, não só como desenvolvedor, mas principalmente na operação, trabalhei com pessoas das mais variadas e cada uma delas possuía a sua maneira de administrar componentes de hardware e software.
É desnecessário reforçar a ideia de que tudo o que tem importância precisa ser monitorado constantemente e existem inúmeras ferramentas para isso. Porém, ferramentas de monitoração servem, normalmente, para nos alertar de que algo está errado, sejam falhas de hardware ou de software que, por vezes, indisponibilizam sistemas total ou parcialmente e, quando isto ocorre, temos o que chamamos de “incidente”.
Um incidente ocorre sempre que um componente do sistema apresenta mal funcionamento ou impede o funcionamento do sistema como um todo. Alguns tipos de incidentes, como as falhas de hardware, não podem ser evitados porque faz parte da natureza de alguns componentes o seu desgaste natural. Mas, apesar disso, podemos criar sistemas redundantes e resilientes, onde cada componente pode ser acompanhado de uma réplica que assume a função em caso de falha no componente principal ou mesmo divide a carga de trabalho minimizando o desgaste.
Mas, será que não podemos prever quando estas falhas ocorrerão? A resposta para essa pergunta é “Sim, podemos!”. Quando nos antecipamos a uma falha de software ou de hardware, podemos planejar a substituição do componente com calma e programar a intervenção no momento mais confortável, seja porque o componente não está em uso ou mesmo em um momento de menor utilização, em que o impacto de uma interrupção no sistema cause o menor prejuízo possível. Esta preocupação antecipada é o que chamo de “Administração Proativa”.