Esta es la razón por la que WhatsApp, Facebook e Instagram se cayeron (y así afectó al resto de Internet)

Como te contábamos anoche, tres de las mayores herramientas de comunicación online del mundo (Facebook, WhatsApp e Instagram, todas ellas propiedad de la compañía fundada por Mark Zuckerberg) se cayeron simultáneamente durante aproximadamente seis horas.

Las caídas —individuales o simultáneas— de estos servicios no son algo extraño, pero sí suelen relativamente breves y/o limitadas en su ámbito geográfico. Sin embargo, anoche presenciamos algo más grave… y que, además, tuvo repercusiones notables más allá de los servicios directamente afectados por la caída.

En su blog oficial, Facebook ha publicado una nota de prensa que explica así lo ocurrido ayer:

"Nuestros equipos de ingeniería descubrieron que los cambios de configuración en los enrutadores troncales que coordinan el tráfico de red entre nuestros centros de datos causaron problemas que interrumpieron dicha comunicación. Esta interrupción en el tráfico de red tuvo una repercusión en cascada afectando al modo en que se comunican nuestros centros de datos, causando así que nuestros servicios se detuvieran".

¿Te has quedado igual que antes? Bien, pues intentemos explicar con más detenimiento lo ocurrido ayer y responder a la gran pregunta: ¿por qué cayeron Facebook, WhatsAppp e Instagram?

Los motivos tras la caída de Facebook

En su blog corporativo, Cloudflare da información bastante más completa y detallada sobre lo ocurrido. Así describe el escenario con el que se encontraron de repente:

"Facebook y sus servicios afiliados […] estaban, de hecho, todos caídos. Sus nombres DNS dejaron de resolverse y sus IP de infraestructura estaban inaccesibles. Era como si alguien hubiera 'desconectado todos los cables' de sus centros de datos de repente y los hubiera desconectado de Internet".

El problema radicaba en que los registros DNS de los dominios afectados habían desaparecido; o, siendo más preciso, lo que han desaparecieron fueron las rutas BGP que dan acceso a dichos registros, y que especifican cómo acceder a sus dominios y subdominios.

Recordemos que BGP es el protocolo que mantiene unidas las distintas redes que forman Internet… y es la herramienta usada para propagar los citados registros por todo Internet.

Eso significa que, cada vez que un dispositivo solicitaba un acceso, por ejemplo, a facebook.com, los resolvedores DNS eran incapaces de traducir dicha dirección a una dirección IP (numérica), por lo que aunque el contenido seguía online, las apps y los navegadores no 'sabían' cómo dar con el mismo.

De hecho, a efectos prácticos, este problema 'borró' el dominio facebook.com de Internet. No es que la compañía perdiera el control legal del dominio ni nada parecido, sino que los servidores DNS son sencillamente incapaces de encontrar dicho dominio por ahora, como se ve en la siguiente captura de pantalla:

Eso, claro, provocó que los registradores de dominio ofrecieran facebook.com como un dominio 'disponible' y listo para comprar:

No, no es previsible que vayas a poder quedártelo.
"¿Te imaginas trabajar en Facebook ahora mismo, cuando tu correo electrónico ya no funciona y todas tus herramientas internas basadas en Facebook también fallan?" (Brian Krebs)

El problema, en cualquier caso, afectaba a los propios sistemas de Facebook. Y tuvieron que resolverlo accediendo físicamente a sus propios sistemas. De hecho, si la caída duró tanto como lo hizo se debió a que Facebook tuvo que enviar específicamente un equipo de ingenieros a uno de sus centros de datos, para restablecer sus servidores de manera manual, porque el equipo residente no contaba con las herramientas técnicas adecuadas.

Las consecuencias para el resto de Internet

Todo esto, a su vez, tuvo consecuencias graves fuera de los servicios online de Facebook, pues la sobrecarga repentina generada en el tráfico DNS global ralentizó el acceso a muchos otros dominios web.

John Graham-Cumming, el CTO de Cloudflare, explicaba así el problema que está generando a todo Internet la caída de Facebook:

"Cloudflare gestiona un resolvedor DNS gratuito, 1.1.1.1, y mucha gente lo usa. Entonces, Facebook se cae y… ¿adivinas qué ocurre? Que la gente sigue intentando acceder. El software sigue intentando acceder. Y a nosotros nos golpe una enorme avalancha de tráfico preguntando por facebook.com.

[…] Un buen recordatorio de que Internet es una red de redes que funciona a través de estándares y de cooperación".

Así que, como explica en Twitter el usuario Manu Quiroga, una comparación rápida de lo que le está pasando a Internet ahora mismo es que es un edificio en el que vive alguien muy conocido (Facebook) al que todo el mundo está llamando una y otra vez por el telefonillo (DNS) y, como no contesta, la gente lo sigue intentando y los pocos que intentan llamar a otros pisos se quedan sin poder hacerlo en muchos casos.

Telegram podría ser el próximo en caer

Y si Twitter saca pecho cuando Facebook se cae, no hablemos ya de cómo crece el tráfico de Telegram cuando su archirrival en el campo de la mensajería instantánea, WhatsApp, deja de enviar mensajes —instantáneos o no—. De hecho, esta caída hizo crecer tanto el tráfico de la app creada por Pável Dúrov, que hasta su cuenta de Twitter reconoció —ante las quejas de los usuarios— que,

"Con toda la gente nueva que se está inscribiendo, las cosas van un poco lentas; es bueno teneros, pero todos a la vez es demasiado. ¡Perdón!".

Lo cierto es que, lo que para alguno es "un poco lento", durante algunos momentos para otros usuarios se percibió como otra caída más, la del propio Telegram:

Imagen | Basada en original de Marco Verch

Ver todos los comentarios en https://www.genbeta.com

VER 8 Comentarios

Portada de Genbeta