Apagão no Sistema CrowdStrike: O Que Aconteceu e Seus Impactos
Hoje, a CrowdStrike, multinacional americana especializada em cibersegurança, confirmou que o apagão global que afetou desde bancos até companhias aéreas não foi causado por um ataque hacker, mas por um defeito em uma atualização do seu sistema Falcon Sensor. Este incidente trouxe instabilidades significativas para várias organizações, incluindo a infraestrutura de nuvem da Microsoft Azure.
Detalhes do Incidente
O apagão foi desencadeado por um defeito identificado em uma única atualização de conteúdo destinada a hosts Windows, deixando de lado os usuários de sistemas Mac e Linux. O Falcon Sensor, um agente de detecção e resposta de endpoint (EDR), é projetado para monitorar continuamente dispositivos de usuários finais, detectando e respondendo a ameaças como ransomware e malware. No entanto, um arquivo defeituoso em uma atualização automática causou um ciclo de colapsos nos computadores Windows, resultando na temida "tela azul".
Impacto na Microsoft Azure
A falha no Falcon Sensor também afetou a estrutura de nuvem da Microsoft Azure, tornando máquinas virtuais indisponíveis e causando instabilidades em aplicativos como Power BI e Teams. Entre os serviços impactados estavam o Microsoft Defender, Intune, Teams, PowerBI, Fabric, OneNote, OneDrive for Business, SharePoint Online, Windows 365, Viva Engage, Microsoft Purview e o centro de administração do Microsoft 365.
Explicação Técnica
De acordo com um comunicado da Microsoft, um fluxo de trabalho de gerenciamento de cluster de backend implantou uma alteração de configuração que bloqueou o acesso ao backend entre um subconjunto de clusters do Azure Storage e recursos de computação na região central dos EUA. Isso resultou em reinicializações automáticas dos recursos de computação quando a conectividade com os discos virtuais era perdida.
Resolução do Problema
A CrowdStrike solucionou o problema às 5h27 no fuso horário UTC (2h27 no horário de Brasília). A empresa identificou que o arquivo problemático era o "C-00000291*.sys" com registro de data e hora 04:09 UTC (1h09 no horário de Brasília). Após isolar e corrigir o defeito, a CrowdStrike encaminhou seus clientes ao portal de suporte para atualizações contínuas.
Na Microsoft, a falha foi identificada às 2h30 (horário de Brasília) e corrigida por volta das 8h. No entanto, serviços que utilizam a plataforma Microsoft 365 continuaram a enfrentar problemas.
Repercussões no Mercado
Após o incidente e com a abertura da bolsa de Nova Iorque, as ações da CrowdStrike caíram 18%, enquanto as da Microsoft registraram uma queda de 1,6%.
Conclusão
O apagão no sistema da CrowdStrike destacou a vulnerabilidade das infraestruturas digitais a defeitos de software, mesmo em atualizações rotineiras. A resposta rápida e as ações corretivas tomadas pelas empresas envolvidas foram cruciais para mitigar os impactos, mas o incidente deixou um alerta sobre a importância de processos rigorosos de teste e monitoramento contínuo para garantir a resiliência dos sistemas de TI.
Nenhum comentário