Zakaj je Amazon v ponedeljek ugonobil polovico interneta

Matej Huš

21. okt 2025 ob 22:01:00

V ponedeljek zjutraj po slovenskem času, ko so v ZDA ravno dobro zatisnili oči, je imel Amazon velik problem. Več storitev AWS v regiji US-EAST-1 je kmalu po polnoči po lokalnem času postalo nedostopnih, kar se je v naslednji uri še stopnjevalo. Okrog 2. ure ponoči je Amazon ugotovil, kje tiči razlog, šele popoldne istega dne pa so težave dokončno odpravili. Medtem je bil v Evropi in Aziji delovni dan v polnem teku, številne storitve pa nedosegljive.

To je bil največji globalni izpad informacijskih storitev po lanskem fiasku CrowdStrikovega Falcona, ki je onesposobil več kot sedem milijonov računalnikov. Težave Amazonovem oblaku pa so bile še bolj vseobsegajoče, saj je izpadla kopica storitev, ki jih sploh ne nudi Amazon, a pri njem gostujejo. Reddit, Signal, Snapchat in številne druge platforme so onemele. Seveda so izpadli tudi Alexa, Prime in nekatere Amazonove storitve, a bistveno več je bilo zunanjih.

Podjetja so imela za več milijard dolarjev škode, saj so klecnile tudi spletne banke, prodaja letalskih vozovnic in še marsikaj. Ključni problem je bil izpad US-EAST-1, ki je Amazonov najstarejši in najpomembnejši podatkovni center, ki hkrati krmili marsikaj drugega. Tam so tudi komponente celotne infrastrukture AWS (IAM, DNS, CloudFront), ki zagotavljajo delovanje celotnega oblaka. Nazadnje se je Amazonu isto na isti lokaciji primerilo v letih 2020 in 2021.

Težava je tičala v razreševanju domen prek DNS, ki ni delovalo za končno točko DynamoDB API. Od te so odvisne storitve, ki gostujejo v AWS. Kasneje je Amazon zaznal še težave z zaganjanjem novih instanc virtualnih strojev (EC2 Instance) in v sistemu za uravnavanje zasedenosti (Network Load Balancer). Težave so dokončno odpravili ob 15. uri po lokalnem času, še nekaj ur pa je trajalo, da so izginile vse posledice.