Esta mañana Delta se unió a la lista de las mayores aerolíneas estadounidenses que este año experimentan importantes interrupciones en su sistema, causando estragos para su público viajero. En el caso de Delta, la compañía anunció que la falla comenzó con un corte del suministro eléctrico a las 2:30 AM (EST) en su centro principal de datos en Atlanta, y desactivó todos los sistemas informáticos y de operaciones a nivel mundial.
Más de 740 viajes fueron cancelados, y miles fueron retrasados en el transcurso del día, mientras la compañía restauraba la energía a su centro de datos. Esto llevó a que la aerolínea tuviera más problemas y titulares que los señalaban.
Según su rueda de prensa, “la falla hizo que algunos sistemas y redes no pasaran al sistema de respaldo de Delta”. La compañía no respondió de manera inmediata a la solicitud de comentarios sobre si tenía múltiples centros de datos en los Estados Unidos, diseñados para funcionar de forma transparente en caso de fallas, pero, independientemente de la arquitectura de conmutación de Delta, es evidente que las cosas no funcionaron como lo esperaban .
En junio, Kalev Leetaru, quien escribe para la revista Forbes se preguntó si los centros de datos corporativos se habían transformado en obsoletos en la era de la nube. Mientras que los principales proveedores de productos en la nube han sufrido cortes, los cortes prolongados son raros en su entorno. Cuando suceden, las compañías son capaces de recurrir a grandes equipos de ingenieros élites, generalmente los autores de las piezas fundamentales de la arquitectura de software que se ejecutan en los entornos informáticos actuales, para que los ayuden a reparar la falla rápidamente.
Sin embargo, una de las mayores razones para irse a la nube comercial es la resistencia masiva que ofrece. Además de los sofisticados mecanismos de seguridad, todos los principales proveedores de la nube ofrecen múltiples centros de datos distribuidos en todo el mundo.
Incluso si el suministro de la red eléctrica es golpeado por cuatro impactos de rayos separados en tiempos cercanos, las aplicaciones pueden migrar de manera transparente a cualquier otro centro de datos con mínimo tiempo de inactividad. Hasta las compañías que operan su propio centro de datos corporativos pueden mantener los espejos de conmutación por error activos en la nube, lo que les permite transferir inmediatamente las operaciones en caso de un fallo local.
Hoy en día, es extremadamente sorprendente que todas las semanas aparezcan noticias sobre un centro de datos corporativo importante que sufra de fallas que causen una interrupción crítica en sus operaciones. Simplemente no hay excusa técnica para no tener redundancia geográfica con conmutación por error automatizada. La mayoría de los proveedores de la nube como Google y Amazon ofrecen altos niveles de redundancias creativas. Por ejemplo, el disco de almacenamiento estándar de Google escribe 3.3 veces toda la data de manera automática, y las capturas de este disco están disponibles a nivel mundial, mientras que las máquinas virtuales migran automáticamente en casos de fallas de hardware y las máquinas nuevas se pueden hilar por capturas instantáneas a cualquier centro de datos de Google a nivel mundial.
Numerosas ofertas de Google, Amazon y sus partners permiten que las aplicaciones se extiendan de forma automática a los centros de datos, transfiriendo automáticamente el tráfico en caso de un corte de luz o cualquier otro problema.
Google y Amazon ofrecen centros de datos en muchos países del mundo. Como señal de lo común que es la distribución geográfica, la documentación estándar de Google recomienda distribuir geográficamente las aplicaciones a través de los centros de datos, de manera que incluso en caso de un desastre natural masivo, no se requiera ninguna intervención del usuario para enrutar todo el tráfico de manera transparente a un centro de datos derribado.
Mientras que lo ocurrido en el caso de Delta es incierto, muchas compañías con las que Kalev Leetaru ha hablado han enfocado sus esfuerzos en un solo centro de datos, empleando equipos redundantes y sistemas de energía y enfriamiento, pero fallan en la planificación del escenario de la pérdida de todo su centro de datos.
¿Por qué es que no pasa ni una semana sin alguna interrupción en el mundo empresarial estadounidense, pero incluso hasta el más pequeños de los arranques web tienden a tener redundancia a prueba de fallas y recuperación rápida y masiva a través de centros de datos cortesía de la nube pública? Ahora que estas tecnologías están disponibles como ofertas de la corriente principal de la nube pública a tan solo pocos clicks, es difícil excusar los cortes en centros de datos que causan impacto en las operaciones comerciales en 2016.
Inclusive, el mes pasado Google anunció que está utilizando algoritmos de aprendizaje profundos para reducir el consumo de energía en sus centros de datos mediante la entrega parcial de sus controles a sus redes neuronales, lo que muestra qué tan innovador y rápido de evolucionar son estos centros de datos. Con cada titular de una compañía derribada por una falla en el centro de datos, u otra nueva oferta masiva de la nube comercial, viene otra razón para migrar a la nube para siempre.
-
¿Conoce otros cortes que hayan sufrido grandes empresas? Le invitamos a dejar sus preguntas y opiniones en nuestra sección de comentarios.