» »

Okvara podatkov v DDR3 zaradi vpliva sosednjih celic

1
2
»

AndrejO ::

Jst je izjavil:

Da v teoriji, ko vpišeš x bitov, da boš dobil teh x bitov enakih nazaj. Če je pa v Mem kontrolerju napaka, se bo hitro videlo, da so napake prihaja vedno na istem mestu, če je nekaj narobe samo na nekaj linijah.

Funny thing je, da ravno napake, katerih izvor je na vodilu, naredijo bolj razpršene napake, kot pa napake kateri izvor je dejansko RAM. Napake v DRAM imajo statistično pomembno časovno in prostorsko korelacijo, ki jih navidezno naključne napake na vodilu ne kažejo na enak način.

Izzvzemši pokvarjena vodila, kjer itak dobiš ven konsisenten crap z verjetnostjo 1.0, ko npr. ostaneš brez ene linije.

Za tole "potuho", pa si bom mislil svoje. Kakorkoli obračaš stvari, ne vidim smisla zakaj bi nekdo čaral s takšnimi neumnostmi, kot je prikrivanje odkritih napak. Razlogov je več od tehničnih (matična plošča ne more prikriti ali spremeniti MCE, ki ga proži CPE interno), pa do prodajnih. Običajno pa ima laž kratke noge in pogubne posledice za finančne rezultate. ECC pač ni nekaj, kar kupujejo cenovno občutljivi laiki, temveč nekaj, kar kupujemo skrajno tečni in večno zafrustrirani IT-jevci s proračunom in tako dolgim in zamerljivim spominom za slabe izkušnje, da sloni v primerjavi izgledajo kot ljubke zlate ribice z terminalno amnezijo.

Jst ::

Na linijah sem mislil okvara dela MEM kontrolerja. Recimo tisti, ki skrbi za prvih X2 bitov (32 ali 64bit), odvisno od kontorlerja. S tem ne mislim na PC arhitekuro, katera ima sedaj na Intel strani MEM kontroler integriran v CPU. Bolj iz časov, ko je bil MEM kontroler stvar chipseta.

>Napake v DRAM imajo statistično pomembno časovno in prostorsko korelacijo, ki jih navidezno
>naključne napake na vodilu ne kažejo na enak način.

To je pa itak logično, zato sem napisal, da so za to namenjeni drugi mehanizmi, ne sama palčka ECC rama.

Error Detection and Correction mehanizmov je več - le kaj bi SSD pogoni brez.


---

Mislim, da govoriva isti jezik, vendar jaz izhajam iz component by component razmišljanja, ti pa iz AIO sistema, kjer vključiš ves komplet EDAC sistema.

Palčko ECC Rama smo že davno odmislili iz zadnjih postov, se mi zdi...
Islam is not about "I'm right, you're wrong," but "I'm right, you're dead!"
-Wole Soyinka, Literature Nobelist
|-|-|-|-|Proton decay is a tax on existence.|-|-|-|-|

AndrejO ::

Jst je izjavil:


Mislim, da govoriva isti jezik, vendar jaz izhajam iz component by component razmišljanja, ti pa iz AIO sistema, kjer vključiš ves komplet EDAC sistema.

Palčko ECC Rama smo že davno odmislili iz zadnjih postov, se mi zdi...

Ah, no. Jaz sem se še vedno oklepal delovnega pomnilnika in se od njega še nisem odtrgal.

Sem ostal tam, kjer imam znanje in se nisem odselil tam, kjer moje znanje še bolj površinsko in površno. :)

hojnikb ::

> Error Detection and Correction mehanizmov je več - le kaj bi SSD pogoni brez.
Sploh nebi delal.
#brezpodpisa

Jst ::

Jaz se nisem nikoli spuščal v nitty-gritty detajle, sem pa doživel pokvarjen MEM kontroler, ki je na dveh palčkah RAMA, 2x 16 MB, javljal napako vedno na enakem območju (recimo - se natančno ne spomnim več) 64-128, z vsakim RAMom, ki sem jih takrat probal. Drugje so vsi RAMi delali brez napak.

Zato sklepam, da je bila napaka v (delu) MEM kontrolerju. Takrat sem si to tako razlagal, da je v MEM kontrolerju več enot, ki so odgovorne za banke. (Enako, kot če pogledaš shemo današnjih grafičnih kartic, kjer je 256 bit RAM sestavljen iz 4 enot, vsaka široka 64 bitov in priklopljena na svoj memory.) Takrat je bil internet v povojih, dostop dial up, informacije skope, težko najdljive.

Če/Koliko se motim, prosim, razloži.
Islam is not about "I'm right, you're wrong," but "I'm right, you're dead!"
-Wole Soyinka, Literature Nobelist
|-|-|-|-|Proton decay is a tax on existence.|-|-|-|-|

AndrejO ::

Lahko je bila, lahko pa ni bila. Brez več podatkov o temu o kakšni natančno napaki je bilo govora in brez možnosti dodatnih poskusov za eleminacijo možnosti je teh preprosto preveč.

Od slabega fizičnega stika na konektorju modula, prekinjene povezave, skurjenega upora, pa do okvarjenega podpornega čipa in seveda tudi pokvarjenega krmilnika. Pa še krmilnik ti lahko odpove na nekaj različnih načinov. Napačna preslikava iz naslova v lokacijo (zataknjene linije so tukaj prava "lepota"), prekinjena napajalna linija za osveževanje, ...

Če se boš začel v te stvari poglabljati, pazi, da te ne bo zagrabila paranoja, da kako lahko sploh še verjameš kakršnem koli rezultatu, ki ti ga da naprava sestavljena iz toliko in tako nepopolnih komponent. :D

Zgodovina sprememb…

  • spremenil: AndrejO ()
1
2
»


Vredno ogleda ...

TemaSporočilaOglediZadnje sporočilo
TemaSporočilaOglediZadnje sporočilo
»

Napad na pomnilnik Rowhammer omogoča krajo šifrirnih ključev

Oddelek: Novice / Znanost in tehnologija
134437 (2680) MrStein
»

Napad rowhammer deluje tudi androidnih telefonih

Oddelek: Novice / Varnost
75991 (4178) srus
»

Tudi DDR4 in DDR3 z ECC ranljiva na obračanje bitov

Oddelek: Novice / Varnost
147479 (6067) sodnicaN
»

Zloraba spreminjanja bitov v pomnilniku zaradi branja tudi v praksi

Oddelek: Novice / Varnost
810716 (9387) MrStein
»

Makroji v excelu

Oddelek: Programska oprema
62467 (2361) smetko

Več podobnih tem