
Ieri, giovedì 23 settembre 2010, ore 20.30 italiane, Facebook è stato inaccessibile per la quasi totalità degli utenti. Ma cos’è successo realmente?
Si è trattato di un black out vero e proprio che è durato più di tre ore ed ha paralizzato l’intera rete sociale. Le ipotesi più fantasiose che girano nella rete, sono di vario tipo e parlano di hacker cinesi e russi. Ma, in realtà, cos’è successo ai server di Palo Alto?
La spiegazione ufficiale riguarda un sistema automatico per verificare i valori di livello di configurazione della cache, come ha spiegato il direttore del software engineering Robert Johnson, in una nota sul sito: È la peggiore interruzione in più di quattro anni, e vogliamo chiedere scusa per questo. Abbiamo anche voluto fornire più dettagli su quello che è successo e condividere una grande lezione che abbiamo imparato. L’intento del sistema automatizzato è quello di verificare la presenza di valori di configurazione che non sono validi nella cache e li sostituisce con i valori aggiornati. Questo funziona bene per un problema temporaneo, ma non funziona quando è persistente.
Abbiamo modificato la copia di un valore di configurazione che è stato interpretato come scorretto. Questo significa che ogni singolo client ha visto il valore non valido e ha tentato di risolvere il problema. Poiché la correzione consiste nel fare una query a un cluster di database, il cluster è stato rapidamente sopraffatto da centinaia di migliaia di richieste al secondo.
Intanto il popolo della rete si mette in guardia da un’eventuale ripetizione di black out, come dimostra il video proposto, che suggerisce 15 cose da fare mentre Facebook è irraggiungibile.
Condividi questo articolo con i tuoi amici di Facebook