» »

Vzrok za BSoD

Vzrok za BSoD

McAjvar ::

Pred casom se mi je racunalnik zacel cudno obnasati - zelo nakljucno je fasal BSoD, nakar bi se resetiral in ponovno "normalno" deloval nakljucno dolg cas (od nekaj minut do nekaj tednov) do naslednjega BSoD. V tem casu sem imel namescene WinXP. Prvi BSoD je padel cca. 2 meseca po vgradnji diska WD1002FAEX. Sistem je takrat vseboval maticno plosco Gigabyte P35C-DS3R, procesor Intel Q6600 (nenavit), 2x2GB kit pomnilnika (Geil), disk WD2500AAKS in nVidiino graficno GeForce 8800 GTS 512.

Ker nisem vedel, kaj bi lahko bilo narobe, sem najprej zamenjal vse kable, nato pa, ker ni bilo sprememb, zacel po vrsti preizkusati komponente - disk (testi pokazali vse OK), nato memtest, ki je pokazal nekaj rdecine, ko je delal cez noc. Zato sem sklenil menjati RAM, ki sem si ga izposodil iz sistema, ki je preverjeno zanesljivo deloval. Ker se tezava ni odpravila, ampak je tudi memtest se vedno kazal napake, sem domneval, da je morda nekaj narobe z maticno plosco, zato sem jo menjal z Asusovo P5Q SE2 in za vsak slucaj tudi z novim RAMom (Kingston 2x2GB kit). Menjal sem tudi napajalnik, poskusil z drugo graficno kartico, na novem sistemu tecejo Win7.

Ker nisem vedel, kaj bi se naredil, sem odklopil vecji disk (nazadnje vgrajeni), nakar je sistem zacel delovati stabilno in je zdrzal vec kot 1 mesec brez tezav. Disk sem zato priklopil na drug sistem, ki pa se ni nad njim nic pritozeval, v svojo kisto pa sem dal drug disk, ki je tudi preverjeno dobro deloval, da vidim, ce je morda disk tisti, ki je motil. Ampak ni sprememb, BSoD se vedno pride vsake toliko pozdravit, vcasih veckrat na dan, vcasih vec dni nic. Edina komponenta, ki je se nisem odstranil ali menjal je, poleg DVD enote, CPU.

Ker sem resnicno brez idej, kaj bi se lahko bilo narobe razen procesorja (verjetno bom kupil kakega rabljenega, da poskusim z njim), me zanima, ce ima kdo kak predlog, ce sem kje naredil neumnost ali kaj spregledal oziroma kaj bi lahko bilo vzrok tezavam. Ali je lahko procesor ali je kaj drugega? Kaksne so sicer tipicne tezave v primeru okvarjenega procesorja? Delovna temperatura jeder sicer ob polni obremenitvi ne preseze 50°C, pri graficni kartici pa 65°C, za oboje berem na spletu, da je v mejah normale.
"[...] the advance of civilization is nothing
but an exercise in the limiting of privacy."
- Isaac Asimov

bluefish ::

BSOD je bolj zgovoren kot si misliš. Že pred vsemi temi menjavami bi ga slikal in objavil tukaj.

McAjvar ::

Ce minidumpi kaj pomagajo, tule je paket dumpov, kar jih je zabelezil Win7. Okoli 1MB velik zip paket.
"[...] the advance of civilization is nothing
but an exercise in the limiting of privacy."
- Isaac Asimov

imagodei ::

Tkole, zlo na brzino... Možna krivca sta winamp.exe in win32k.sys.

Za več zdajle nimam časa. Google it.
- Hoc est qui sumus -

McAjvar ::

Hvala za info. Sem nasel http://www.osronline.com/page.cfm?name=... in bom pogledal vse dumpe in si shranil output.

Zal dumpov WinXP nimam vec, ampak takrat, ko se je to zacelo dogajati z izjemo vgradnje diska nisem namescal nic novega softvera, pa se je tam dogajalo enako, zato sem malo skepticen, da bi ga nek proces nenadoma zacel srat, poprej pa je delal normalno. Konkretno Winamp, kjer ponavadi poslusam net radio, doma in v sluzbi isto postajo, ista verzija Winampa, tako doma na WinXP kot sedaj na Win7 in v sluzbi na WinXP. V sluzbi nobenih tezav. To mi ne gre skupaj.
"[...] the advance of civilization is nothing
but an exercise in the limiting of privacy."
- Isaac Asimov

denial ::

Sicer nisem pregledal vseh dumpov ampak kar sem videl so to čisto random crashi. V teh primerih gre ponavad za hardware issue (RAM, pregrevanje, napajalnik itd). V končni fazi lahko preveriš tudi gonilnike: KLIK.
SELECT finger FROM hand WHERE id=3;

imagodei ::

Jaz sem pogledal zadnjega z WinDbg (v bistvu verjetno isto, kot je na tisti strani, ki si jo zgoraj polinkal). Tam je kot problematičen izpostavljen winamp.exe in pa win32k.sys, ki pa je v bistvu del kernela in lahko nakazuje na težave z memorijo, IRQ-ji, grafiko...

Ostalih dumpov nisem gledal.
- Hoc est qui sumus -

McAjvar ::

Nisem uspel se pregledati cisto vseh dumpov, ampak so omenjeni procesi kar nakljucni. Nekaj kandidatov je System, svchost.exe, Wow.exe (World of Warcraft), winamp.exe, vlc.exe, rundll32.exe, ... Napake so tudi razlicne: SYSTEM_SERVICE_EXCEPTION (3b), NTFS_FILE_SYSTEM (24), IRQL_NOT_LESS_OR_EQUAL (a), SYSTEM_THREAD_EXCEPTION_NOT_HANDLED_M (1000007e), DRIVER_IRQL_NOT_LESS_OR_EQUAL (d1), KMODE_EXCEPTION_NOT_HANDLED (1e) recimo.

Gonilnikov v WinXP nisem krivil, ker je sistem deloval stabilno vec kot 2 leti, od tega priblizno pol leta od zadnje posodobitve gonilnikov, preden se je to zacelo pojavljati. Ostaja tudi sedaj, ko sem presel na Win7 in poiskal in namestil najnovejse gonilnike, kar sem jih nasel. Vsi gonilniki so Win7 certified in Win7 tudi ni jamral, da kak gonilnik ne bi bil podpisan.

Kot receno, menjal sem napajalnik, kable, maticno, RAM, graficno. Edino procesorja se nisem, ker nimam rezervega. Ali je taksno obnasanje lahko znak, da ga procesor serje? Verjetno bom kupil nekaj rabljenega in poskusil s tistim, ampak me skrbi, kaj potem, ce se ne bo stanje izboljsalo? Ker potem bom pa zamenjal ze vse komponente...

Edit: Pregrevanje sem izkljucil, ker mi je SpeedFan kazal, da so temperature OK, tudi po preverjanju na spletu bi naj moje temperature bile v mejah normale in v nicemer izstopale. Do sesutja lahko pride tudi, ko sistem idla vec ur.
"[...] the advance of civilization is nothing
but an exercise in the limiting of privacy."
- Isaac Asimov

Zgodovina sprememb…

  • spremenil: McAjvar ()

denial ::

Poženi še kakšen stress test tool (npr. Prime95). Naj deluje kakšno uro.
SELECT finger FROM hand WHERE id=3;

Zgodovina sprememb…

  • spremenil: denial ()

McAjvar ::

Sem zakurblal, en izmed threadov je ze zakljucil in sporocil naslednje:

[Jan 5 13:50] FATAL ERROR: Rounding was 0.5, expected less than 0.4
[Jan 5 13:50] Hardware failure detected, consult stress.txt file.
[Jan 5 13:50] Torture Test completed 31 tests in 1 hours, 1 minutes - 1 errors, 0 warnings.

Zagnal sem 64-bitno verzijo aplikacije, vendar paket ne vsebuje nobene stress.txt datoteke, grem malo pobrskat po netu.

Ves cas testiranja sem imel zagnan SpeedFan in kadarkoli sem pogledal nanj, temperature posameznih jeder niso dosegle/presegle 50°C, medtem ko je za CPU temperaturo javil najvisjo vrednost 52°C. Gre za nenavit stock Q6600 procesor.
"[...] the advance of civilization is nothing
but an exercise in the limiting of privacy."
- Isaac Asimov

McAjvar ::

Pridem domov, pa je se en thread javil:

[Jan 5 14:46] Possible hardware failure, consult readme.txt file, restarting test.
[Jan 5 14:46] ERROR: ILLEGAL SUMOUT
[SNIP precejsnjega stevila enakih opozoril]
[Jan 5 14:46] Maximum number of warnings exceeded.
[Jan 5 14:46] Torture Test completed 62 tests in 1 hours, 57 minutes - 0 errors, 100 warnings.
[Jan 5 14:46] Worker stopped.

Torej ... cas za nov procesor?

Hvala za tale test. Bo veckrat prisel prav.
"[...] the advance of civilization is nothing
but an exercise in the limiting of privacy."
- Isaac Asimov

Spajky ::

Vzami ven proc in ga daj na novo nazaj not za probo ...
"Bluzim na forumu, torej sem !" (še živ ) ...

McAjvar ::

Hm. Bom poskusil, ceprav sem skepticen - enako se je dogajalo na prejsnji maticni plosci, torej je procesor ze bil "reseated", na tej se dogaja enako. Bom pa izvedel eksperiment.
"[...] the advance of civilization is nothing
but an exercise in the limiting of privacy."
- Isaac Asimov

mr1two ::

Sicer nisem še slišal, da bi bil katera od defektnih komponent CPU, ampak vse je enkrat prvič. Edino lahko poskusiš še s pucanjem pinov na cpuju(če se obnese ne vem, lahko pa da je kje kak slab stik s ploščo). Malo pogooglaj, če je to že kdo počel, da ne boš ponesreči s kakšnim preveč agresivnim topilom to delal.
Če še nisi poskusil, poskusi recimo delat s samo enim ramom hkrati.
Je proc slučajno še v garanciji?
LP

McAjvar ::

Ne, vse skup se je zacelo pojavljat kake 3 mesece po izteku garancije. Zal :) Tudi z RAMom sem se igral in preizkusal kombinacije - samo 1 ploscica v prvi, nato v drugi rezi, nato enako z drugo ploscico.

Sicer sem cez noc ponovno pustil prime95 prizgan, do jutra je delal samo en thread na prvem jedru, na ostalih je prislo do napak. Nato je prislo se pozno novoletno darilo - BSoD :)

Med vikendom bom ponovno odstranil procesor in ga namestil nazaj, poleg tega pa sem bral in z vec koncev slisal tudi za predlog, naj poskusim dvigniti napetost za malenkost. Bom porocal o uspehih.
"[...] the advance of civilization is nothing
but an exercise in the limiting of privacy."
- Isaac Asimov

McAjvar ::

Ni bilo nekih blaznih razlik, se vedno napake pri prime95. Torej, WTB CPU. Vsem skupaj hvala za pomoc in nasvete.
"[...] the advance of civilization is nothing
but an exercise in the limiting of privacy."
- Isaac Asimov


Vredno ogleda ...

TemaSporočilaOglediZadnje sporočilo
TemaSporočilaOglediZadnje sporočilo
»

Računalnik se ne zažene

Oddelek: Pomoč in nasveti
495707 (5168) CyberAD
»

Zmešnjava z gonilniki - W7 in XP - ter dual boot problem

Oddelek: Operacijski sistemi
376215 (5820) solatko
»

Oddaljeni BSOD

Oddelek: Novice / Varnost
355002 (2889) PrimozR
»

Vista SP2 aprila

Oddelek: Novice / Ostala programska oprema
355516 (3976) bluefish
»

ali je že kdo imel take težave

Oddelek: Pomoč in nasveti
111040 (898) Gandalfar

Več podobnih tem