V oblačne storitve udarila strela iz oblaka in onesposobila Azure AD

Matej Huš

6. sep 2018 ob 09:28:25

Microsoftovi inženirji so imeli zadnje dni precej dela, saj je imel večji del sveta težave z dostopom do storitev Azure in Office 365. Razlog je bil precej nenavaden, in sicer je šlo za udar strele. Ta je v torek dopoldne udarila v bližini Microsoftovega podatkovnega centra blizu San Antonia, kar je povzročilo nihanja v električnem omrežju. Zaradi motene dobave električne energije je prenehal delovati hladilni sistem, zaradi česar se je podatkovni center ustavil. Težave niso bile omejene le na ZDA, temveč so jih čutili tudi v Evropi, zavlekle pa so se še v sredo.

Glavni problem je predstavljala preobremenitev ostalih strežnikov. Alex Simons iz Microsofta je pojasnil, da je nekaj večjih strank s povečanjem prometa (ponavljanje auth retry) povzročilo upad dostopnosti storitve na 70 odstotkov. Čeprav je trdil, da so težave omejene na Severno Ameriko, so o težavah pri dostopu do Azure AD poročale tudi stranke iz Evrope. To je povzročilo težave pri dostopu do Microsoftovih orodij, kot je Office 365 (Exchange, SharePoint, Teams), in tudi do storitev drugih proizvajalcev, ki uporabljajo infrastrukturo Azure.

Enodnevni izpad je seveda poskrbel za vprašanja, kako dobro je pri Microsoftu poskrbljeno za redundanco. Načeloma izpad enega podatkovnega centra ne bi smel vplivati na delovanje storitev. Čeprav v tem primeru niso izgubili nobenih podatkov in so v enem dnevu storitve večinoma obnovili, grenak priokus obstaja. Nasprotniki storitev v oblaku so težave seveda takoj izkoristili za vnovično svarilo, naj se podjetja ne zanašajo zgolj na enega zunanjega izvajalca, temveč poskrbijo za lastne sisteme.