» »

Amazon pojasnil podrobnosti izpada EC2

Amazon pojasnil podrobnosti izpada EC2

Slo-Tech - Amazon je po dobrem tednu od izpada oblaka Elastic Compute Cloud (EC2) objavil podrobnosti o vzrokih za izpad in njegovem poteku, ukrepih za preprečitev v prihodnosti in opravičilo.

Amazon odseke svojega oblaka deli na večje enote med seboj skoraj neodvisne enote regije in znotraj njih manjša, bolj soodvisna območja. V območju ZDA vzhod je 21. aprila kmalu po polnoči (6.47 po slovenskem času) zaradi nepravilne izvedbe načrtovane nadgradnje izpadel eden izmed nosilcev podatkov, ki ni mogel več odgovarjati na zahteve po pisanju ali branju podatkov. Pred nadgradnjo infrastrukture bi bili morali preusmeriti promet s pomožnih usmerjevalnikov na glavno omrežje, a so pomotoma storili ravno nasprotno. Pomožno omrežje obremenitve ni zdržalo. Napaka se je potem kaskadno razširila po večjem delu območja, saj so delujoči podatkovni nosilci poizkušali sinhronizirati svojo vsebino na nove lokacije (postopek se imenuje re-mirroring in se izvede, ko primarna varnostna kopija postane nedosegljiva), kar je izčrpalo kapaciteto omrežja. Kmalu je bilo 13 odstotkov zapisov v območju ZDA vzhod nedosegljivih.

Amazon se je opravičil vsem prizadetim stranem in jim ponudili kompenzacijo v višini zneska, ki ga plačujejo za 10-dnevni najem Amazonovih storitev. Hkrati so še napovedali nekaj ukrepov, ki jih bodo sprejeli za izboljšanje omrežja in preprečitev podobnih težav v prihodnosti. Predvsem bodo strankam olajšali delo z več območji, tako da bodo imele večjo redundanco. Zanimivo je, da je ta velik izpad povzročil človeški faktor. Čeprav je šlo za kombinacijo nesrečnih naključij in slabe konfiguracije omrežja, je celotno kaskado sprožila napačna poteza pri nadgradnji sistema.

8 komentarjev

Gregor P ::

Meni se to zdi dokaj velika mera nesposobnosti; mislim za tako veliko firmo; ali pretiravam?:8)
The main failure in computers is usually located between keyboard and chair.
You read what you believe and you believe what you read ...
Nisam čit'o, ali osudjujem (nisem bral, a obsojam).

jype ::

Od kdaj so pa velike firme sposobne?

Tr0n ::

Se zgodi.

So vsaj lepo razlozili zadevo, na dolgo in siroko, in se opravicili. Sony si jih lahko vzame za vzgled.

Zgodovina sprememb…

  • spremenilo: Tr0n ()

KoMar- ::

Upam, da so se uporabniki iz tega naučili, da Oblak ni mišljen za kritične aplikacije oz. da je potrebno imeti backup plan.

Zgodovina sprememb…

  • spremenil: KoMar- ()

Gandalfar ::

@Komar: kje pa ne rabis backup plana za kriticne aplikacije? :)

Gregor P ::

Tisti ki proti plačilu ponujajo oblačne storitve, bi lahko tudi imeli kaj vsaj dvakrat zavarovano;((
The main failure in computers is usually located between keyboard and chair.
You read what you believe and you believe what you read ...
Nisam čit'o, ali osudjujem (nisem bral, a obsojam).

Bistri007 ::

Gandalfar je izjavil:

@Komar: kje pa ne rabis backup plana za kriticne aplikacije? :)

Kaj ti bo dvojni backup, če ni idiot proof? Sicer pa piše, da je problem, ker je timeout read-write operacij povzročil izgubo podatkov.
Največja napaka desetletja je bila narejena 4. novembra 2008
Oni so goljufali in Alah je goljufal, Alah je najboljši prevarant. (Koran 3:54)
Citiraj svetega očeta Benedikta XVI. in postani "persona rudis"...

Zgodovina sprememb…

  • spremenilo: Bistri007 ()

ZaphodBB ::

@jype: Od nekdaj. IBM, Oracle, Microsoft, Google, Cisco, HP, Apple, Amazon... So vse velike in neverjetno agilne in sposobne firme (sploh relativno na svojo velikost) - samo kar se aktualne industrije tiče.

Širše pa, kje bi bili brez Forda, GM, Lockheed-Martina, Bell (oz. AT&T), General Electric, Siemens, Bosch, Volkswagen, Rolls-Royce, Toyota, Samsung, Honda, itd.

Zdej če se pa tebi naši Hermesi, Srci, S&Tji, Mure, Telekomi, Pivovarne Laško in druga podobna jajca zdijo velike firme je pa čist druga pesem. Sposobne pa vsekakor niso.


Vredno ogleda ...

TemaSporočilaOglediZadnje sporočilo
TemaSporočilaOglediZadnje sporočilo
»

Jedrske nesreče in obveščanje javnosti (strani: 1 2 3 4 5 6 )

Oddelek: Problemi človeštva
25040970 (23119) jype
»

Amazon nepovratno izgubil nekaj podatkov strank pri izpadu oblaka EC2

Oddelek: Novice / Varnost
73746 (3068) pegasus
»

Amazon oddaljeno briše knjige (strani: 1 2 3 4 5 )

Oddelek: Novice / Zasebnost
20417726 (12842) poweroff
»

Kaj je res, da ...

Oddelek: Mobilne tehnologije
424627 (4027) BBB

Več podobnih tem