G-Fail door overbelaste servers

Vorig artikel Volgend artikel
G-Fail door overbelaste servers

De Gmail storing van gisteravond was het gevolg van een routineonderhoud. Een klein gedeelte van de servers werd offline gezet om een upgrade te doen. Dit wordt regelmatig gedaan en zou dus eigenlijk geen probleem mogen zijn. Toch ging het hierdoor mis. Door een onderschatting van het dataverkeer raakte een aantal servers oververhit en uiteindelijk ging het hele systeem plat.

Het grootste probleem was de piekbelasting die de servers aankunnen. Hierdoor werd dataverkeer doorgestuurd naar andere servers die ook al overbelast waren. Hierdoor viel uiteindelijk het hele systeem uit. Het probleem werd snel ontdekt maar het duurde toch 100 minuten voor alles weer op de rit was. Mensen die gebruik maken van IMPA/POP hadden geen last van de uitval.

Ook Twitter had last van de Gfail. Als snel ging het op Twitter alleen nog maar over de Gmail outage.

Volgens Ben Treynor, van Google: The Gmail engineering team was alerted to the failures within seconds (we take monitoring very seriously). After establishing that the core problem was insufficient available capacity, the team brought a LOT of additional request routers online (flexible capacity is one of the advantages of Google's architecture), distributed the traffic across the request routers, and the Gmail web interface came back online.

-690.jpg
Harold Kuepers

Reageren is uitgeschakeld omdat er geen cookies opgeslagen worden.

Cookies toestaan Meer informatie over cookies