Métodologia de Resolução de Problemas em Rede

 Introdução

O funcionamento de uma rede é como um relógio: temos várias peças que se encaixam umas nas outras e que precisam funcionar corretamente, para que o todo funcione.

Quando se percebe um problema na rede, é preciso seguir uma abordagem sistemática para proporcionar uma solução rápida e barata, em termos de consumo de recursos.

No entanto, antes de falar sobre as abordagens "corretas", vamos falar das "erradas", por serem as mais comuns: a abordagem "Ciência de Foguetes" e a abordagem "Troglodita".

O Troglodita

A abordagem Troglodita é aquela onde o técnico recebe a reclamação e, sem qualquer investigação ou análise, sai alterando parâmetros, reiniciando serviços, reinstalando sistemas, etc., como quem brande um tacape. Olhando a figura, parece que pra ele, tudo pode ser resolvido na base da vontade e da força bruta.

Não é preciso pensar muito pra perceber o quanto isso custa em termos de downtime (interrupção de serviços) e recursos. Sério, por favor, não seja um troglodita.

O Cientista de Foguetes

A abordagem Ciência de Foguetes é o extremo oposto do espectro do troglodita. Nela, o técnico perde tempo precioso analisando cada parte e minúcia do sistema, mesmo aquelas que visivelmente estão em perfeito funcionamento. Esquemas altamente complexos são usados, mesmo para redes que não têm qualquer necessidade especial.

Abordagem Sistemática

Já falamos várias vezes nos modelos de camadas propostos pela ISO e pela IETF. Na proposta da ISO, a rede é dividida em 7 camadas com funções e características separadas; este modelo também é conhecido como Modelo OSI. Já a proposta da IETF define 4 camadas, no chamado modelo TCP/IP (se você está sentindo falta de uma camada, não estranhe; na realidade, o modelo TCP/IP pressupõe a existência de mais uma camada, abaixo de todas as outras, porém não a define, tendo apenas algumas poucas exigências quanto a ela).

Qual a vantagem que os modelos de camadas nos trazem, no momento da solução de problemas? Como as camadas definem e separam serviços, é possível associar de forma clara um determinado comportamento (correto ou incorreto) a uma determinada camada. Conforme veremos à frente, isso torna a solução de problemas muito mais simples.

Existem vários tipos de abordagem sistemática, sendo os principais, a abordagem Top-Down, a abordagem Down-Up, e a abordagem Dividir-e-Conquistar. A diferença entre elas está no ponto inicial de análise do problema, conforme veremos adiante.

Independente do tipo de abordagem adotado, é preciso que o técnico recolha o máximo de informações sobre o problema, que podem incluir, mas não se limitam, a queixa do usuário, o momento em que o problema ocorreu, os sistemas afetados pelo problema. De posse dessas informações, o técnico deve formular uma hipótese da origem do problema, comparar essa hipótese com os dados levantados, e verificar se, à luz desses dados, a hipótese se confirma. Em seguida, deve propor uma ação corretiva, aplicá-la, e verificar se essa ação resolveu o problema.

Caso os dados não sejam suficientes para confirmar ou refutar a hipótese, o técnico deve reunir mais dados, entrevistando novamente o usuário, consultando registros de atividade, ou mesmo observando diretamente o funcionamento do sistema.

Após aplicar a ação corretiva e confirmar que o problema foi resolvido, é essencial documentar o fato, de forma que, caso o problema torne a ocorrer, ou mesmo no caso de um problema relacionado, o histórico de manutenção possa ser utilizado.

Porém, caso a ação não surta o efeito desejado, o técnico deve desfazê-la, e formular uma nova hipótese, reunindo novos dados, e reiniciando o processo.

Abordagem Top-Down

Na abordagem Top-Down, o técnico inicia a análise pela camada mais alta --- a Aplicação. Compara-se os dados levantados com as características de um problema na aplicação, e caso não haja correspondência, passa-se às camadas inferiores, descendo até a camada física.

Abordagem Down-Up

Na abordagem Down-Up, ao contrário, o técnico inicia a análise pela camada mais baixa --- a camada física. Comparando os dados levantados com as características de problemas na camada física, não havendo correspondência, passa-se à camada imediatamente superior, subindo camada por camada até a camada de aplicação.

Abordagem Dividir-e-Conquistar

 Tanto a abordagem Top-Down quanto a Down-Up são pouco eficientes, e pelo mesmo motivo: quando o problema está na extremidade oposta do modelo de camadas, perde-se muito tempo verificando o funcionamento de camadas que obviamente estão funcionando.

A abordagem Dividir-e-Conquistar procura sanar esse problema ao trazer para o processo de análise a experiência do técnico. Este, ao ver a queixa do usuário e levantar os dados adicionais, cria sua hipótese com auxílio de sua experiência anterior, bem como da documentação de manutenção do sistema. A partir daí, escolhe-se uma camada intermediária para iniciar a análise, e, com base nos dados coletados, subir ou descer as camadas até encontrar a verdadeira localização do problema.

A Linha de Base

O objetivo de toda a manutenção é restabelecer o funcionamento correto da rede. Porém, o que é esse "funcionamento correto"? Por exemplo, numa reclamação de que determinado sistema está inoperante, é fácil verificar o problema, mas, e no caso de uma reclamação de lentidão? Como diferenciar uma lentidão característica de problema, do tempo normal de funcionamento? Como identificar quando o sistema está sobrecarregado, de quando ele está sendo utilizado no máximo de sua capacidade projetada?

O ponto chave, aqui, é registrar o que é o "funcionamento correto" do sistema, quais são os parâmetros verificados de funcionamento em condições normais, e criar uma documentação disso, que é chamada Linha de Base

A Linha de Base deve conter uma descrição do funcionamento esperado do sistema, inclusive tempo de resposta, em vários momentos de funcionamento, e sob diversas demandas de carga de utilização. Isso permite, por exemplo, diferenciar uma lentidão associada com um problema, do tempo normal de funcionamento do sistema.

Outra vantagem do uso da Linha de Base é que ela facilita o planejamento da expansão do sistema. Sendo a queixa de lentidão uma das mais comuns, entre os usuários, o técnico pode identificar mais facilmente o momento em que o sistema não consegue mais lidar com a carga de serviço imposta, e assim alocar novos recursos de maneira eficiente.

No próximo artigo, veremos um exemplo da aplicação da metodologia Dividir-e-Conquistar na resolução de um problema.

Até lá.

Comentários

Postar um comentário

Postagens mais visitadas deste blog

A Saga do Upgrade (Parte 2)

Meios Óticos x Meios Metálicos