La mayoría de los sensores Falcon de CrowdStrike afectados por una actualización de respuesta rápida fallida volvieron a funcionar antes del fin de semana del 27 y 28 de julio, mientras continúan los esfuerzos para remediar el incidente del 19 de julio que provocó que más de ocho millones de máquinas Windows se bloquearan. El 26 de julio, el director ejecutivo de CrowdStrike, George Kurtz, que ha estado comunicando información sobre el incidente a un ritmo constante desde que se produjo por primera vez, escribió en LinkedIn que, a fecha del jueves 25 de julio, «más del 97 %» de los sensores de Windows estaban nuevamente en línea. «Este progreso se debe a los esfuerzos incansables de nuestros clientes, socios y la dedicación de nuestro equipo en CrowdStrike. Sin embargo, entendemos que nuestro trabajo aún no ha terminado y seguimos comprometidos con la restauración de todos los sistemas afectados», dijo Kurtz. «A nuestros clientes que aún están afectados, sepan que no descansaremos hasta lograr una recuperación completa. En CrowdStrike, nuestra misión es ganarnos su confianza salvaguardando sus operaciones. Lamento profundamente la interrupción que ha causado esta interrupción y me disculpo personalmente con todos los afectados. Aunque no puedo prometer la perfección, puedo prometer una respuesta centrada, eficaz y con sentido de urgencia”. Kurtz dijo que los esfuerzos de reparación habían sido de gran ayuda gracias al uso de técnicas de recuperación automatizadas y a la movilización de todos los recursos posibles para apoyar a los clientes afectados. Reiteró el compromiso de CrowdStrike con su misión principal -detener las infracciones- pero con un nuevo enfoque en los controles y la resiliencia del cliente, como se detalla en el informe preliminar de incidentes de la empresa la semana pasada. Actualización corregida lista para su implementación pronto Mientras tanto, CrowdStrike confirmó a TechTarget Security, publicación hermana de Computer Weekly, antes del fin de semana, que el error lógico en su herramienta de validación que causó el caos fue definitivamente corregido, y ahora se están realizando pruebas intensivas antes de que la actualización pueda ser implementada en sus sistemas backend, programada para los próximos días. La actualización contaminada fue parte de un lanzamiento de respuesta rápida que normalmente utiliza CrowdStrike para mejorar los mecanismos de protección dinámica de su plataforma Falcon, es decir, fue diseñada para identificar nuevos problemas de seguridad cibernética y ayudar a los clientes a mitigarlos. La empresa realiza este tipo de actualizaciones todo el tiempo, pero en esta ocasión, un contenido problemático en un archivo de canal logró pasar por los ojos del validador de contenido automático de CrowdStrike. Los dos problemas combinados llevaron a una condición de memoria fuera de límites, que desencadenó una excepción que abrumó al sistema operativo Windows y provocó que los dispositivos vulnerables fallaran y se bloquearan, lo que resultó en la infame pantalla azul de la muerte. CrowdStrike está intentando asegurarse de que el problema no se pueda replicar en el futuro mejorando la resistencia de sus actualizaciones de respuesta rápida a través de pruebas mejoradas en múltiples niveles y agregando controles de validación actualizados a la herramienta de validación de contenido automática que lo dejó fuera de servicio. Ahora también planea implementar actualizaciones de respuesta rápida de forma escalonada, implementándolas en la base de sensores Falcon más lentamente y haciendo uso de implementaciones «canarias» diseñadas para resaltar cualquier problema importante antes de que se propague. Esto hará que el rendimiento del sensor y del sistema reciba una mejor supervisión y, en algún momento, los clientes de CrowdStrike tendrán más opciones para administrar las actualizaciones de respuesta rápida por sí mismos. Impactos en la vida real Mientras tanto, los impactos en el mundo real siguen sintiéndose por el apagón, que en particular provocó que las aerolíneas de todo el mundo retrasaran, reprogramaran y cancelaran vuelos. Entre las historias que han surgido está la de un hombre de 83 años que se convirtió en objeto de una operación de búsqueda por parte de las autoridades en los EE. UU. Patrick Bailey, que tenía previsto volar a casa desde Florida a California el 19 de julio, fue alojado en un hotel local cuando su vuelo fue cancelado. Aunque Bailey hizo el check out a la mañana siguiente, accidentalmente dejó su teléfono móvil en su habitación y desapareció durante varios días. Bailey finalmente apareció en California el 28 de julio, habiendo decidido en cambio tomar un autobús Greyhound de larga distancia a través de los EE. UU.