google.com, pub-9826011386271019, DIRECT, f08c47fec0942fa0
top of page
Writer's pictureEliana González

Facebook aclara la causa de la caída global de sus plataformas

La interrupción global que dejó a Facebook y a sus otras plataformas fuera de línea durante horas fue causada por un error durante un mantenimiento de rutina, dijo la compañía.


Facebook culpa a la interrupción del servicio de sus plataformas a un error durante el mantenimiento de rutina.
Facebook culpa a la interrupción del servicio de sus plataformas a un error durante un mantenimiento de rutina.

Santosh Janardhan, vicepresidente de infraestructura de Facebook, dijo en una publicación de blog que el apagón de Facebook, Instagram y WhatsApp "no fue causado por un ataque malicioso, sino por un error que causamos nosotros mismos".



El problema se produjo cuando los ingenieros realizaban el trabajo diario en la red troncal global de Facebook; las computadoras, enrutadores y software en sus centros de datos en todo el mundo junto con los cables de fibra óptica que los conectan.


“Durante uno de estos trabajos de mantenimiento de rutina, se emitió un comando con la intención de evaluar la disponibilidad de la capacidad de la red troncal global, que accidentalmente cortó todas las conexiones en nuestra red troncal, desconectando efectivamente los centros de datos de Facebook a nivel mundial”, dijo Janardhan.

Los sistemas de Facebook están diseñados para detectar tales errores; pero en este caso un error en la herramienta de auditoría le impidió detener correctamente el comando, dijo Janardhan.


Ese cambio también desencadenó un segundo problema que empeoró las cosas al hacer imposible llegar a los servidores de Facebook a pesar de que estaban operativos.


Los ingenieros se apresuraron a solucionar el problema en el sitio, pero esto llevó tiempo debido a las capas adicionales de seguridad, dijo Janardhan. Los centros de datos son "de difícil acceso y, una vez dentro, el hardware y los enrutadores están diseñados para ser difíciles de modificar incluso cuando se tiene acceso físico a ellos".


Una vez que se restableció la conectividad, los servicios se restablecieron gradualmente para evitar aumentos repentinos de tráfico que podrían causar más accidentes.



EDICIÓN Y TRADUCCIÓN POR: ELIANA GONZÁLEZ


Comments


bottom of page