AWS causa pane em US-EAST-1 e derruba Fortnite, Roblox, Snapchat e Slack

Uma falha de DNS na região US-EAST-1 da AWS afetou serviços como Fortnite, Roblox, Slack e bancos online, causando lentidão e quedas; a recuperação está em andamento.
Escrito por:
Lucas Amaral

A manhã virou bagunça digital quando a região US-EAST-1 da Amazon Web Services (norte da Virgínia) começou a apresentar “taxas significativas de erro” em solicitações ao serviço de armazenamento DynamoDB — e isso acabou derrubando uma boa fatia da internet que depende dessa região. Jogos, redes sociais, plataformas de trabalho e até serviços bancários online relataram falhas ou lentidão. Qual a gravidade real? Para quem joga online, a diferença entre uma partida fluida e um disconnect pode ser só um endpoint mal resolvido.

O que caiu e por quê

Segundo relatórios do Downdetector, títulos populares como Roblox e Fortnite sofreram impacto; Snapchat e Slack ficaram lentos para vários usuários; fãs de Wordle tiveram problemas para logar; e alguns bancos online relataram indisponibilidade parcial. A Epic confirmou o problema em Fortnite com uma declaração direta. “Um incidente afetando vários serviços na internet também está impactando logins do Fortnite. Estamos investigando agora e vamos atualizar quando tivermos mais detalhes.” — Epic Games.

A AWS informou que, com base na investigação, o problema parecia estar relacionado à resolução DNS do endpoint da API do DynamoDB em US-EAST-1, afetando também outros serviços nessa região e recursos globais que dependem dela, como atualizações de IAM e tabelas globais do DynamoDB. “Com base em nossa investigação, o problema parece estar relacionado à resolução DNS do endpoint da API DynamoDB em US-EAST-1. Estamos trabalhando em múltiplos caminhos paralelos para acelerar a recuperação.” — Amazon Web Services.

Vários serviços que você usa podem ter sido impactados por causa de uma falha de DNS em um centro específico. A AWS recomendou que os clientes tentem reenviar requisições que falharam e alertou que, mesmo após mitigação inicial, haveria latência e backlog de trabalho a ser processado.

Status e recuperação

Em atualizações subsequentes, a AWS disse ter aplicado mitigações iniciais e que via “sinais significativos de recuperação”. “A maioria das solicitações agora deve estar sendo bem-sucedida. Continuamos trabalhando para processar o backlog de requisições em fila.” — Amazon Web Services. Ainda assim, ela avisou que alguns serviços demorariam para normalizar completamente.

Se você ficou preso em uma fila de login ou viu partidas caírem, a recomendação é simples: tente novamente e tenha paciência. Falhas em infraestruturas centralizadas deixam claro o quanto dependemos de regiões críticas — e que até um único ponto de falha pode causar um efeito dominó. Quem joga ou administra serviços precisa monitorar status pages e preparar planos de contingência para reduzir impacto na próxima vez que algo assim acontecer.