Fastly, la plataforma detrás de la caída global de cientos de páginas web este martes, ofreció información sobre el problema. “Experimentamos una interrupción global debido a un error de software no descubierto que surgió el 8 de junio cuando fue provocado por un cambio de configuración válido de un cliente. Detectamos la interrupción en un minuto, luego identificamos y aislamos la causa y deshabilitamos la configuración. En 49 minutos, el 95% de nuestra red funcionaba con normalidad”, publicó la compañía en su blog.
La caída, que se produjo el martes y que duró aproximadamente una hora, hizo inaccesibles las páginas de medios de comunicación como The New York Times, The Guardian, CNN y de plataformas como Twitch o Reddit.
En el centro de la caída está Fastly y su CDN (content delivery network), o red de distribución de contenidos, una herramienta que actúa como agente de movilidad y permite el acceso a webs en todo el mundo y sin esperas. Esto es posible gracias a sus nodos, que optimizan la conexión sin importar en qué país estén sus servidores.
Fastly tiene una amplia cartera de clientes y se especializa en ofrecer, principalmente, servicios que apuntan a optimizar el funcionamiento de las páginas web. Aquí entran en juego las CDN o redes de distribución de contenido que fue el eje del problema que afectó varios sitios.
La red de distribución de contenidos permite, como ellos mismos explican en su página, “distribuir aplicaciones y sitios más rápidos, difundir vídeos de la mejor calidad y gozar de visibilidad en tiempo real con una plataforma ágil que da prioridad a las API”.La plataforma explicó que el problema surgió por una actualización realizada hace casi un mes
El vicepresidente sénior de Ingeniería e Infraestructura de Fastly, Nick Rockwell, publicó un comunicado en el que proporcionó más detalles sobre el problema de servicio del 8 de junio.
Rockwell explica que la compañía detectó el error en solo un minuto, y procedió a identificar la causa y deshabilitar la configuración que generó los problemas.
Según la empresa, el problema se originó en un despliegue de software que llevó a cabo la empresa en el 12 de mayo, que contenía un error que podía activarse “por una configuración de cliente específica en circunstancias específicas”.
Este martes, un cliente de Fastly llevó a cabo un cambio de configuración que, aunque la compañía asegura que fue válido, provocó el error en el código vulnerable introducido casi un mes antes. Como resultado, el 85 por ciento de la red de Fastly devolvía errores a los internautas que intentaban usar los servicios.
En poco tiempo, tras la identificación del incidente, Fastly lanzó una solución permanente para el problema de software, y la compañía se comprometió a desplegar este parche “de la manera más rápida y segura posible”, según Rockwell.
Fastly llevará a cabo también una investigación completa sobre las prácticas que se realizaron durante el incidente, así como para determinar por qué no detectó en sus procesos de revisión el error que ocasionó la caída global. También evaluará formas de mejorar su tiempo de solución de problemas.