Não apenas fora do ar. Nesse exato momento o Facebook está literalmente fora da internet.
Falhas e indisponibilidades não são algo raro na nossa vida moderna, quase que semanalmente uma ou outra plataforma que utilizamos enfrenta problemas técnicos e fica desde alguns minutos até várias horas fora do ar.
Porém no dia de hoje a indisponibilidade do Facebook é especial. A gigante das redes sociais não está somente com indisponibilidade em alguns serviços, servidores, ou lentidão. Nesse exato momento o Facebook está literalmente fora da internet. É como se ele não existisse entende? O Facebook literalmente retirou a si mesmo da internet hoje.
Quando você acessa um serviço qualquer, os pacotes enviados e recebidos do seu dispositivo, passam por algumas dezenas de nós de roteamento pela internet. A internet é composta de protocolos, então não é raro que qualquer grande plataforma, sofra com problemas de resolução de DNS, ou indisponibilidade do serviços como o HTTP por exemplo, porém em sua base a internet é uma rede, e um dos protocolos que serve de base para formar essa rede é o BGP.
O BGP é um protocolo de borda, sua função é basicamente construir um sistema autonomo que se entrelaça a outros sistemas BGPs e provê o "pavimento" para que se construam redes interconectadas como a internet. A indisponibilidade de hoje no Facebook se deu porque, a princípio por acidente, a rede social fez uma série de alterações em seus sistemas BGP que basicamente retiraram seus próprios servidores da internet.
O BGP pavimenta tudo, é um protocolo que funciona na camada 4 do protocolo TCP, ou seja acaba dando sustentação para tudo que esteja acima disso. Se existe um problema com os roteamentos BGP, DNS, HTTPS, FTP e qualquer outro protocolo da internet morre.
Consegue explicar melhor? Bom posso tentar. Pense assim, existem mais de 4 bilhões de endereços IPs disponíveis, se cada roteador da internet mantivesse uma lista completa do caminho para cada um desses endereços, haveriam problemas significativos de performance e gerenciamento, então ao invés disso, roteadores mantém listas de sub-redes próximas a eles.
Sub-redes contém em média somente 4 mil endereços, o que torna a operação toda muito mais simples e rápida. Porém isso cria uma necessidade que roteadores próximos, anunciem aos outros quais são os seus endereços. Esses roteadores em troca anunciam esses endereços a seus vizinhos, e assim por diante até que a internet toda conheça você.
Se por alguma razão você parar de anunciar sua localização, não vai demorar muito até que os roteadores parem de rotear os pacotes destinados a você, e em pouco tempo a internet basicamente "esquecerá" quem você é. Foi isso que o Facebook fez.
Essa é a razão pela qual caiu literalmente tudo: Facebook, WhatsApp, Instagram, Messenger, etc... Nesse momento é como se o endereço simplesmente não existisse, não há um apontamento indicando o "caminho" para lá, pior ainda, não há um registro quem é Facebook entende? É como se a internet tivesse "esquecido" quem é Facebook, porque eles mesmos "se apagaram da internet". Algo sem precedentes em qualquer outra indisponibilidade que a rede social já tenha sofrido
Mas e por que outros serviços cairam? É um efeito em cascata, sem BGP o DNS quebra, sem DNS basicamente a internet quebra, são bilhões de requisições por minuto, procurando um endereço que basicamente não existe. Por causa da maneira como o protocolo DNS funciona, requisições bem sucedidas entram em cache, porém quando são mal sucedidas, elas continuam repetindo sequencialmente, até porque pressupõe-se que você quer uma resposta positiva, assim que ela estiver disponível. Isso faz com que os servidores DNS principais, ficassem inundados com trilhões de requisições por minuto. As primeiras a sofrer com isso são naturalmente as operadores, mas grandes players como AWS, Google e Cloudflare, também estão sentindo os efeitos
Embora não existam evidências de um ataque, o tempo que está levando para que a rede social se recupere, aumenta a suspeita de que a alteração possa não ter sido acidental, mas talvez parte de algum tipo de ciberataque, orquestrado contra o Facebook. Porém como nos ensina a navalha de Occam, até que se prove o contrário, a explicação mais simples deve ser a mais aceita, e sim é perfeitamente possível que a falha tenha ocorrido, por um erro humano. O Facebook tem dispendido esforços para integrar sua infraestrutura, com a de empresas compradas como Instagram e WhatsApp. Durante um processo de re-construção de sua infra, é perfeitamente possível que alguém tenha cometido um erro num script que tenha causado tudo isso.
Porém um fator complicador aqui é que como a falha afetou a camada de rede, se faz necessário que o problema seja corrigido fisicamente nos equipamentos, e foi nessa hora que o problema ficou mais divertido, porque o Facebook implementou controles de acesso que obviamente dependiam de sua infraestrutura para autorizar ou negar acesso, como ele se encontra nesse momento num voo de "apertem os cintos, a rede sumiu" seus funcionários tiveram dificuldades para sequer conseguir acessar os locais onde estão os equipamentos.