» »

corrected hardware error has occurred

corrected hardware error has occurred

tomaz1 ::

Živio,

Na Windows 2016 imam v system logu zadnje čase kar nekaj Warning-ov "Source = WHEA-Logger"; "Event ID = 23"; "A corrected hardware error has occurred".
Sistem ima v resnici polne vse 4 DIMM z ECC DDR4 tako da je verjetno res nekaj narobe z RAM-om.

Ali bi znal kdo iz spodnje vsebine ugotoviti kateri DIMM je treba zamenjat, da nebi bilo treba s poskušanjem izločati, ker se strežnik že uporablja za nekaj malega produkcije?


Vsebina Warning-a je pa tole:


General:
A corrected hardware error has occurred.
Component: Memory
Error Source: Generic
Error Type: Single-Bit ECC


Deatils:
ErrorSource = 8
FRUId = {00000000-0000-0000-0000-000000000000}
FRUText = CorrectedErr
ValidBits = 0x4088
ErrorStatus = 0x8fd0b407
PhysicalAddress = 0x8ffb49d0
PhysicalAddressMask = 0xe00000c8
Node = 0x1
Card = 0x0
Module = 0x0
Bank = 0x0
Device = 0x1
Row = 0x101
Column = 0x1
BitPosition = 0x0
RequesterId = 0x49200001010101e3
ResponderId = 0x8ff9e6d8
TargetId = 0x2000000000020000
ErrorType = 2
Length = 273

Miha 333 ::

Če imaš ECC, ima plošča verjetno tudi kakšen logging (IPMI, IML ...), odvisno od modela.

tomaz1 ::

Miha 333 je izjavil:

Če imaš ECC, ima plošča verjetno tudi kakšen logging (IPMI, IML ...), odvisno od modela.


Plošča je ASUS P10S-V/4L. IPMI-ja nima, kakšnega posebnega ASUS programa pa tudi nisem inštaliral (Niti ne vem če so priporočljivi, ponavadi so samo problemi s tem ...).

pegasus ::

Dostojne plate imajo ledico zraven dimm slotov in pri problematičnem ramu se le-ta prižge, kar ti prihrani ogromno časa pri ugibanju. Pobrskaj še po biosu, če imaš kak event log, tam bi moralo bolj natančno pisati, kater dimm te heca.

Sicer pa dokler je correctable error, lahko še ignoriraš. Ko bo multibit incorrectable error, boš zagotovo opazil ;)