El día de ayer el diario The New York Times experimentó un problema de disponibilidad de su sitio web, en horas de la tarde. El incidente no fue nada fuera de lo común, un sitio web que deja de funcionar por unas horas. Sin embargo, me pareció por demás eficiente la forma en que el diario (a traves de su cuentas de Twitter y Facebook) mantuvo informados a sus lectores sobre el incidente. La respuesta a incidentes es parte fundamental de un programa de Seguridad de la Información: los incidentes pueden ocurrir y, cuando esto ocurre, hay que estar preparados para dar una respuesta eficiente. ¿Ocurrió en este caso? Veamos.
Algunos en las redes sociales compartieron la hipótesis de que se trató de un ataque de denegación de servicio, algo que en lineas generales no puede ser comprobado. Vale destacar que la relativa velocidad con la que se resolvió el incidente y el hecho de que el diario rápidamente informó que fue un problema interno, podrían ser motivos que confirmen la teoría oficial: una empresa que se encuentra ante un ataque de denegación de servicio puede requerir más tiempo para recuperarse y probablemente no se comprometa tan rápido a una veloz remediación, pero esto también es una conjetura y ambas teorías pueden ser correctas. De todas formas, para los fines de este post, esto es irrelevante. Como les comentaba, lo que me interesa es ver tres cosas que el The New York Times hizo muy bien en su manejo del incidente. Veamos entonces la evolución del incidente en términos de la comunicación y, luego de que lean estos, repasemos un poco lo que, a mi criterio, vale destacar como aspectos positivos en la respuesta a incidentes. Vean primero la historia en tweets y, debajo, las breves reflexiones, adelante...
1. Hazte cargo y comunica eficientemente el problema
Lo primero que hizo el diario fue comunicar a través de sus redes sociales que había un problema en el sitio. Punto a favor. Es muy común que en las empresas los problemas de este tipo tarden en comunicarse a las personas interesadas en el incidente. Y en este caso, no hay nadie más interesado en la caída de un diario online que los propios lectores, y el diario se ocupó de ello: a través de otros recursos que estaban activos, avisó del inconveniente, dio algo de información sobre las posibles causas. La comunicación tiene que ser parte fundamental de un programa de respuesta a incidentes.
2. Ten un plan alternativo hasta restaurar los servicios
Aquí va otro punto a favor. Como podrán ver en la historia de tweets más arriba, ante la caída del sitio web, y teniendo notas que publicar y lectores con ánimos de leer, el diario comenzó a publicar las noticias en su perfil de Facebook hasta que el sitio fue restaurado. Contar con un workaround también es algo que debería considerarse en un plan de respuesta a incidentes. Muchas veces, se pone todo el esfuerzo en resolver el problema y no se ofrece ninguna solución alternativa "mientras tanto". Además, el hecho de contar con esta solución alternativa puede muchas veces permitir tomarse algo de tiempo adicional para resolver el problema de fondo definitivamente (sin que este sea tan extenso, por supuesto).
3. Avisa cuando se restauren los sistemas
Finalmente, cuando el problema estuvo resuelto, el diario rápidamente emitió un corto pero eficiente comunicado informando lo ocurrido, haciendose cargo del incidente y confirmando que el servicio volvió a la normalidad. Este hecho es fundamental para minimizar el impacto: los lectores pueden sentir empatía ante este tipo de actitudes y así minimizar el costo de algo que ocurre ante estos incidentes y es tan dificil de medir, que es el impacto en la imagen de marca. Aquí el texto (y screenshot) del mensaje:
A nuestros clientes
Como muchos de ustedes sabrán, nuestro sitio web no estuvo disponible por un periodo del tiempo hoy más temprano. El incidente ocurrió unos pocos segundos después de una actualización de mantenimiento programada, por lo que creemos que esa fue la causa. Estamos trabajando para restaurar completamente los servicios y pedimos disculpas por cualquier inconveniente causado.
Como ya comentaba al iniciar el post, lo de ayer no fue nada extraordinario, un sitio web supera una denegación de servicio de unas pocas horas. Sin embargo, la forma en que el diario respondió, es algo que no estamos tan acostumbrados en lo que respecta a respuesta a incidentes de Seguridad de la Información. Recomiendo analizar estos aspectos y si aún no estás preparado en tu empresa para actuar ante estos escenarios, ¿qué estás esperando? Tenemos un curso en nuestra Plataforma Educativa esperándote.
Sebastián Bortnik
Gerente de Educación y Servicios