Un apagón masivo en Amazon Web Services (AWS) el lunes 20 de octubre de 2025 dejó sin acceso a millones de personas a aplicaciones bancarias, redes sociales y portales de reserva de vuelos en todo el mundo. Amazon confirmó el martes por la mañana que la mayoría de sus sistemas en la nube habían vuelto a la normalidad tras reparaciones de emergencia, aunque las empresas aún evaluaban los daños.
El apagón de varias horas subrayó la concentración del internet moderno en manos de pocos proveedores. AWS controla aproximadamente el 37 por ciento del mercado mundial de computación en la nube e ingresó 107.600 millones de dólares el año pasado, según datos de la empresa citados por CNN. Cuando sus servidores fallan, los efectos se extienden mucho más allá del imperio minorista de Amazon, llegando a hospitales, instituciones financieras, empresas logísticas y consumidores cotidianos que rara vez piensan en dónde realmente viven sus aplicaciones.
Amazon confirmó que el incidente comenzó cuando una avería en su infraestructura del Sistema de Nombres de Dominio (DNS) impidió que los servidores tradujeran direcciones web legibles en las rutas numéricas de IP que los dispositivos utilizan para conectarse. El fallo se extendió a DynamoDB, una de las bases de datos insignia de AWS que almacena información de clientes en tiempo real. A las 6:35 a.m. (hora del Este), los ingenieros contenían el error de DNS e indicaban a los clientes que limpiaran los datos en caché para que el tráfico fluyera normalmente.
Rob Jardin de NymVPN, una empresa de ciberseguridad que monitorea la salud de la red, enfatizó que el apagón parecía ser una mala configuración técnica en lugar de un ataque cibernético hostil. «Internet fue construido para la descentralización», afirmó Jardin, «pero la nube comercial ha efectivamente recentralizado grandes porciones de infraestructura crítica en un puñado de regiones de centros de datos». Esa concentración, añadió, convierte cualquier punto único de falla en un problema global.
Qué se apagó y por qué importa
En el pico de la interrupción, los motores de búsqueda de vuelos tuvieron dificultades para mostrar tarifas, los portales de banca móvil se detuvieron en el inicio de sesión y los feeds populares de redes sociales no se actualizaban. El momento resultó especialmente problemático en el este de Estados Unidos, donde los desplazantes comenzaban la semana laboral y confiaban en herramientas alojadas en la nube para todo, desde viajes compartidos hasta nómina. Las empresas con planes de recuperación ante desastres pudieron cambiar a proveedores alternativos, pero muchas organizaciones más pequeñas tuvieron poco remedio que esperar.
Mike Chapple, experto en ciberseguridad de la Universidad de Notre Dame, observó que tales apagones gigantes siguen siendo relativamente raros pero atraen atención debido a su efecto dominó. «Un único error en un centro de datos puede propagarse a través de servicios interconectados en segundos», afirmó. «Los usuarios nunca ven la transferencia entre microservicios en el servidor, pero cuando un enlace se rompe, toda la cadena se paraliza».
El impacto financiero aún es incierto
Si bien Amazon no ha publicado una cifra en dólares de pérdidas directas, analistas citados por CNN dijeron que el impacto económico total podría alcanzar eventualmente «cientos de miles de millones de dólares» una vez que se contabilicen la productividad perdida, las compras de comercio electrónico no realizadas y los gastos de emergencia en TI. Esa estimación refleja el alcance de la base de clientes de AWS: gigantes del streaming, bancos de Fortune 500, redes de atención médica e innumerables startups alquilan poder computacional de la nube de Amazon.
La comparación con interrupciones previas de la industria es evidente. Un error de actualización de software en 2024 del proveedor de seguridad CrowdStrike desencadenó cancelaciones de vuelos en todo el mundo y obligó a los hospitales a sistemas manuales, produciendo una pérdida comercial directa estimada de 5.000 millones de dólares. El operador móvil AT&T, por su parte, ha sufrido varias fallas de red en años recientes, aunque ninguna se acercó a la escala geográfica alcanzada el lunes por AWS.
Cómo respondió Amazon
Según su registro de incidentes, los ingenieros de AWS primero detectaron anomalías en la capa de DNS que vincula solicitudes de usuarios a servicios subyacentes. Después de aislar los servidores defectuosos, redirigieron el tráfico e implementaron configuraciones parcheadas. Se aconsejó a los clientes que borraran cachés locales de DNS—esencialmente, limpiar la memoria a corto plazo en portátiles, enrutadores y puertas de enlace corporativas—para que las tablas de enrutamiento actualizadas se propagaran rápidamente.
Al amanecer del martes, Amazon declaró que «la mayoría de los sistemas están de nuevo en línea», un mensaje que reiteró en comunicados difundidos por CNN. Aun así, los problemas residuales persistían. Algunas empresas reportaron tiempos de respuesta lentos mientras resincronizaban bases de datos o procesaban acumulación de transacciones. Los consultores de la industria dijeron que puede tomar varios días antes de que todas las métricas, desde puertas de pago hasta inventarios de asientos de aerolíneas, se normalicen completamente.
Vulnerabilidades estructurales expuestas
El apagón reavivó el debate sobre la prudencia de depender de un único proveedor de nube para operaciones críticas. Mientras que los proveedores de hipergigante como AWS, Microsoft Azure y Google Cloud promocionan múltiples zonas de disponibilidad diseñadas para contener fallas, la economía de escala a menudo lleva a los clientes a consolidar cargas de trabajo en la región más económica o la más cercana a los usuarios finales. Esa optimización puede dejar industrias enteras vulnerables cuando un concentrador regional falla.
Chapple advirtió que la redundancia dentro de un proveedor no es lo mismo que la resiliencia en múltiples nubes. «Un depósito de respaldo en la siguiente región de AWS ayuda si un tornado golpea un centro de datos», dijo, «pero hace poco si un plano de control compartido como DNS se comporta de forma errática en toda la flota». Construir verdadera resiliencia, argumentó, significa distribuir cargas de trabajo entre diferentes proveedores—un enfoque que conlleva sus propios costos y complejidades.
Lecciones de la crisis
La interrupción del lunes ofrece un recordatorio de manual de que las cadenas de suministro digital son tan fuertes como su eslabón más débil. Incluso una plataforma que publica «cinco nueves» de disponibilidad—lo que significa menos de cinco minutos de inactividad al año—puede sufrir fallas en cascada cuando un servicio fundamental como DNS falla. El evento también cuestiona suposiciones de que los gigantes de la nube han eliminado efectivamente grandes apagones de la historia.
Para reguladores y legisladores, el apagón podría informar discusiones futuras sobre designaciones de infraestructura crítica para plataformas de nube, un tema que ya está ganando tracción en la Unión Europea y Estados Unidos. Si AWS y sus pares se consideran servicios públicos similares a redes eléctricas o redes de telecomunicaciones, podrían enfrentar mandatos más estrictos de tiempo de actividad y reglas de divulgación.
La continuidad empresarial en el centro de atención
Las empresas más afectadas fueron aquellas con servicios orientados al cliente que dependen de datos en tiempo real. Los carritos de comercio electrónico no pudieron cargar listas de inventario almacenadas en DynamoDB, las aplicaciones de viajes compartidos no pudieron obtener ubicaciones de conductores, y los operadores en línea vieron congelarse paneles conforme feeds de datos de mercado se paralizaban. Algunas organizaciones redirigieron tráfico a servidores locales u nubes competidoras, pero no todas las aplicaciones están diseñadas para tal conmutación elegante.
Los departamentos de TI, por lo tanto, deben revisar planes de continuidad. Los consultores predicen un aumento en la demanda de herramientas que automatizan despliegues en múltiples nubes, replican bases de datos entre proveedores y prueben continuamente rutas de conmutación. Al mismo tiempo, los directores financieros que pesan el costo de la redundancia contra la probabilidad de apagones pueden necesitar revisar sus modelos de riesgo después de ver cuán rápidamente un único incidente puede infligir trastorno generalizado.
Análisis y perspectiva
Aunque la computación en la nube retiene claras ventajas económicas, el drama del lunes expone el trato en su núcleo: la conveniencia conlleva dependencia. Las empresas descargan dolores de cabeza de mantenimiento a proveedores como AWS, pero al hacerlo también renuncian a cierto control sobre su propio tiempo de actividad. Conforme la transformación digital se profundiza—desde telemedicina hasta vehículos autónomos—las apuestas de esa dependencia aumentan.
El incidente también ofrece una prueba de estrés rara casi en tiempo real de la resiliencia de la industria. Porque AWS se recuperó en cuestión de horas, los mercados financieros evitaron turbulencias prolongadas, y servicios críticos como sistemas de registros hospitalarios y centros de emergencia 911 reportaron solo retrasos intermitentes en lugar de paralizaciones completas. Sin embargo, la pura magnitud del fallo insinúa qué podría ocurrir si un evento similar coincidiera con un feriado importante o un ataque cibernético coordinado.
En las próximas semanas se espera que Amazon publique un análisis post-mortem detallando exactamente cómo comenzó el fallo de DNS, qué salvaguardas fallaron y qué nuevas barreras se erigirán. Clientes y competidores por igual examinarán ese informe en busca de pistas sobre cómo reforzar sus propios sistemas.
Por ahora, la conclusión es tanto familiar como urgente: la nube es potente pero no infalible. Conforme la estructura que vincula la economía global se vuelve cada vez más digital, garantizar que ningún hilo individual pueda deshacer el tejido se convierte en una responsabilidad colectiva—una que se extiende desde proveedores de hipergigante hasta el desarrollador que lanza código a medianoche.
Fuentes
- https://www.cnn.com/business/live-news/amazon-tech-outage-10-20-25-intl
