Saltar da navegação

Resumo do Relatório da averiguação da avaria na rede de telecomunicações da Companhia de Telecomunicações de Macau, S.A.R.L., ocorrida no dia 6 de Fevereiro de 2012


No dia 6 de Fevereiro de 2012, a rede da Companhia de Telecomunicações de Macau, S.A.R.L., doravante designada por CTM, sofreu uma interrupção grave no seu funcionamento, tendo afectado as comunicações na RAEM entre as 16:20 e 22:20 desse dia. De acordo com os dados estatísticos proporcionados por vários operadores, em relação ao serviço de telecomunicações móveis de 3G, os pontos de acesso ao serviço de 3G dos operadores ficaram comprometidos entre 63% e 96%, por outro lado, relativamente ao serviço de ligação de alta velocidade, foram afectados 17.5% dos pontos de acesso do serviço de circuitos alugados e 17.7% dos Multiplexadores de Acesso a Linha Digital do Assinante(Digital Subscriber Line Access Multiplexers – DSLAMs) . Uma vez que, durante o período do incidente da interrupção da rede, os utilizadores de 3G foram obrigados a transitar da rede de 3G para a rede de 2G pela CTM, a entrada de utilizadores em grande número provocou uma taxa média de bloqueio na rede de 2G superior a 30% (relativamente, a taxa de acesso ao serviço foi inferior a 70%). No período do incidente, a CTM recebeu um total de 6835 consultas e queixas relativas à interrupção da sua rede, das quais 6241 foram casos relacionados com o serviço de telecomunicações móveis. Às 16H15 do dia 6 de Fevereiro, a CTM recebeu o alarme do sistema emitido pela sua rede de transmissão IP e detectou a anormalidade e interrupção da rede. A seguir, o grupo da rede de transmissão IP e o grupo de serviços Internet da CTM acederam imediatamente ao sistema de supervisão da rede para investigar a origem do alarme. A CTM confirmou, às 16H30, que se verificou uma anormalidade em 5 dos nós da rede IP e os seus funcionários comunicaram com o fornecedor do sistema para solicitar um apoio urgente. Até às 18H20, mesmo adoptando vários métodos, incluindo o desligamento dos cabos de rede recém-ligados, a reinstalação e troca do cartão de controlo dos nós da rede IP, os funcionários não conseguiram controlar os nós da rede IP que foram afectados. A partir das 18H20, a CTM começou a reactivar, gradualmente, os 5 nós afectados, e tiveram, por fim, acesso ao seu sistema de gestão da rede. A partir das 20H17, a CTM iniciou a remoção do serviço VPLS(Virtual Private LAN Service - VPLS)récem-instalado, que se destinava a prestar o serviço de voz sobre IP, através do sistema de gestão da rede. Os nós da rede IP afectados começaram a voltar ao normal, bem como todos os serviços de comunicação de voz de 3G e de dados móveis, respectivamente, a partir das 21H30 e das 22H20. Através de inspecção no local e de oito reuniões com os funcionários da CTM, e levando a cabo um estudo sobre o relatório do incidente apresentado pela CTM e pelo fornecedor do sistema, o Grupo de Trabalho procedeu à averiguação e análise aprofundada do incidente, confirmando, a final, que a interrupção da rede da CTM se deveu ao que se designa de "flood storm" ocorrido na rede de transmissão IP. A principal razão para o aparecimento da anormalidade na rede de transmissão IP deveu-se à anterior instalação de um serviço VPLS (Virtual Private LAN Service), o qual provocou uma espiral no tráfego das comunicações na rede IP, o que, em situação normal, não deveria acontecer. Em geral, adopta-se a tecnologia "Split Horizon" para evitar a espiral no tráfego do serviço VPLS e consequentemente o "flood storm". No entanto, foram detectados dois erros sérios na operação pela CTM do serviço VPLS. O primeiro erro tem a ver com a introdução dos dados, os parâmetros importantes para o funcionamento do mecanismo "split horizon" não foram introduzidos. O segundo erro tem a ver com o procedimento operacional, a CTM não observou os padrões de procedimento de configuração deste serviço, sendo que o funcionário configurou primeiro o serviço e apenas depois procedeu à sua ligação física à rede IP, o que teve como consequência o erro na configuração não ter sido oportunamente detectado. Ao mesmo tempo, o Grupo de Trabalho detectou três defeitos relevantes da CTM. O primeiro defeito é a insuficiência de técnicos e funcionários com formação profissional na área do serviço VPLS e da rede de transmissão IP e a falta de conhecimentos aprofundados sobre as tecnologias relacionadas. O segundo defeito é a imperfeição da configuração do serviço VPLS na rede de transmissão IP, bem como a imperfeição do mecanismo de verificação relacionado com a ligação de cabos e a falta da capacidade de detecção de riscos, as quais tiveram como consequência a emissão do serviço VPLS, que foi configurado de forma incorrecta, sem uma verificação rigorosa. O último defeito é a falta de planeamento de transportes para o fornecedor do sistema em caso de emergência, como por exemplo, o transporte através de helicóptero, shuttle bus do Terminal Marítimo, etc, ou seja, não existiu um planeamento de transporte rápido , e não se deu prioridade à redução do tempo do incidente.