Notícia

Facebook explica o que causou a longa queda de ontem

Ontem, 04, o Facebook e todos os seus serviços ficaram fora do ar – todo mundo percebeu e comentou. Essa foi a queda mais extrema de anos, e de longe a mais longa. Bilhões de usuários em todo o mundo foram afetados por cerca de 6h, sem poder acessar também Instagram, WhatsApp, Messenger e qualquer outro serviço da empresa, ou que dependesse dela.

Com a situação ainda não resolvida quando o mercado fechou, as ações da empresa estavam caindo cerca de 5% abaixo de seu preço de abertura na segunda-feira, varrendo quase US$ 50 bilhões do valor de mercado da empresa. Estima-se também que a queda do serviço deve ter custado ao Facebook cerca de US$ 79 milhões em receita de anúncios.

Diversas suposições e teorias surgiram enquanto o Facebook não fornecia um explicação oficial, mas na noite de ontem, quando o serviço já estava praticamente restaurado, um post no blog oficial da engenharia do Facebook apresentou uma razão para o acontecido.

A princípio um ato de hacking ou uma ação proposital foi descartada e a explicação oficial é de que a interrupção foi causada por alterações de configuração nos roteadores, que impediram seus sistemas de se comunicarem entre si.

“Nossas equipes de engenharia aprenderam que as alterações de configuração nos roteadores de backbone que coordenam o tráfego de rede entre nossos data centers causaram problemas que interromperam essa comunicação. Essa interrupção no tráfego de rede teve um efeito cascata no forma como nossos data centers se comunicam, interrompendo nossos serviços”.

Não foram oferecidos detalhes específicos, mas o post reforça: “Queremos deixar claro neste momento que acreditamos que a causa raiz dessa interrupção foi uma alteração de configuração com defeito. Também não temos evidências de que os dados do usuário tenham sido comprometidos como resultado desse tempo de inatividade”.

A empresa ainda explicou que o problema demorou mais do que o esperado para ser corrigido porque também foram afetadas ferramentas e sistemas internos que são usados em suas operações diárias, dificultando o diagnóstico e solução. E acrescentou: “Pedimos desculpas a todos os afetados e estamos trabalhando para entender mais sobre o que aconteceu hoje, para que possamos continuar a tornar nossa infraestrutura mais resiliente”.

A Cloudflare, uma das grande empresas de redes, ofereceu uma explicação bastante detalhada do que deu errado, que pode ser conferida aqui, caso você tenha interesse. John Graham-Cumming, CTO da Cloudflare, disse que o Facebook “desapareceu da internet em uma enxurrada de atualizações do BGP” em uma janela de dois minutos. BGP, ou Border Gateway Protocol, é o sistema que as redes usam para descobrir a maneira mais rápida de enviar dados pela Internet para outra rede.

De uma forma mais ilustrada o TechCrunch explicou: “As atualizações foram especificamente retiradas de rota BGP. Essencialmente, o Facebook havia enviado uma mensagem para a internet que estava fechado para negócios, como o fechamento da ponte levadiça de seu castelo. Sem nenhuma rota para a rede, o Facebook estava basicamente isolado do resto da internet e, devido à forma como a rede do Facebook está estruturada, as retiradas de rota também tiraram WhatsApp, Instagram, Facebook Messenger e tudo dentro de suas paredes digitais”.


Durante a paralisação a empresa (e todas as suas plataformas) usaram o Twitter para reconhecer a situação e se desculpar pelo transtorno. E milhões de pessoas também foram:

Olá, literalmente, todo mundo!

E aí os Social Media Managers de diversas grandes empresas (incluindo alguns perfis do próprio Facebook) aproveitaram e fizeram piadinhas com a situação. Ao clicar no primeiro tweet acima, do Twitter, será possível ver as respostas de dezenas de marcas comentando a situação e fazendo graça. Além disso, hoje a internet está cheia de sites que compilaram os memes mais compartilhados sobre o Facebook outage.

 

Fonte: DigitalTrends e TechCrunch

Talvez você também goste:

Leia mais