Skocz do zawartości
Amarok19

Rozwiązany: IRQL_NOT_LESS_OR_EQUAL przy dociążonym PCcie

Polecane posty

TL;DR: Prośba o pomoc w diagnostyce BSODów typu IRQL_NOT_LESS_OR_EQUAL.

======================

Cześć! Pierwszy post na forum i od razu mam problem dość gruby (tak mi się przynajmniej wydaje), ale liczę na to, że na forum znajdzie się "jakiś cwaniak" i pomoże ;) Post będzie długi, ale mam nadzieję, że nikt tego nie odbierze jako przynudzanie - chcę temat jak najlepiej opisać, żeby od razu przejść do konkretu i nie wymieniać się postami z propozycjami najprostszych remediów, których już próbowałem.

Problem objawia się tak, że jak dociążę trochę PCta uruchamiając jakąś konkretniejszą pod względem wymagań sprzętowych grę (ostatnio jest to Borderlands 3), to gdzieś na etapie odpalania gierki OS mi się wykłada, mam BSOD (właściwie GSOD, bo jest zielono ;) ) i cały opis błędu to dość typowe pod Windą "IRQL_NOT_LESS_OR_EQUAL". Nie ma żadnego stopcode. Problem zaczął się pojawiać po upgrade sprzętu (nowy GPU, nowy SSD, dołożony RAM), ale nie bezpośrednio - zdążyłem sobie przejść kilka gierek, więc tak w godzinach pracy to spokojnie ponad 100 h działał bez najmniejszego problemu w obecnej konfiguracji.

Oczywiście nie jestem zupełnym łosiem i zacząłem od tego, że pogooglałem, co może taki problem powodować, tylko że odpowiedzi są bardzo ogólne. Na razie lista, co w moim buildzie może być winowajcą (od moim zdaniem najbardziej prawdopodobnych przyczyn do najmniej) a poniżej poszczególne tematy porozwijam:

- Płyta główna;

- Zasilacz;

- RAM;

- GPU;

- CPU;

- system plików / sprzętowy błąd storage'u.

Build

Komp to jest sprzęt, który kupiłem daaawno (2009 z tego co mi się udało ustalić...) jako taką dość kozacką maszynę, potem dobrze służył długie lata, ale jednak czas leci i głównie wolny storage i karta graficzna nie obsługująca DX11 i DX12 mnie przycisnęły do upgrade'u. Postawiłem sobie taki cel/wyzwanie, że chcę jak najwięcej wycisnąć ze sprzętu za jak najmniejsze pieniądze i nie ma, że nie chce mi się kombinować i że wolę zapłacić więcej, żeby mieć spokój. Nie. Zero litości i build ma być tak wyżyłowany w kwestii performance/price, żeby tatuś był dumny. Sorry, że wstęp taki przydługi, ale to jest ważne, żeby wiadomo było o co mi chodzi, czyli jasne, mogę całego nowego kompa kupić i problem z bani, ale chcę tutaj być trochę sprytniejszy. Więc jest tak:

[STARE] Motherboard: ASUS M4A79T Deluxe
[STARE] CPU: AMD Phenom II X4 955
[NOWE] GPU: (AMD) Maxsun Radeon RX 580 2048SP
RAM:
[STARE] - 2 x Kingston 2048 MB DDR3 1333 MHz (https://linux-hardware.org/index.php?id=mem:kingston-9905403-011-a03lf)
[NOWE] - 2 x PLEXHD 4096 DDR3 1333 MHz (CAS latency: CL9; Memory timing sequence: 9-9-9-24)
Storage:
[NOWE] - LVCARDS SSD 256 GB
[STARE] Case: CoolerMaster Elite 331 (+ szyba)
[STARE] PSU: CoolerMaster RS-520-ASAA-A1 520W

[EDIT: Dopisałem powyżej w kwadratowych nawiasach, co było w starym buildzie, a co jest zainstalowane niedawno]

Po kolei co sądzę o podejrzanych na liście

Płyta główna: Nie zdziwiłbym się, gdyby powoli zaczynała padać ze starości. Ma swój wiek, a procek ostatnio był lekko overclockowany przez jakiś czas (mnożnik z domyślnego x16 -> x17) i może coś mi się tutaj lekko usmażyło.

Zasilacz: Też ma swoje lata, a z tego co wiem zasilaczowi może się wiek dawać we znaki. System pada w momencie, kiedy wiele podzespołów jest na raz obciążonych. Samo obciążenie selektywnie poszczególnych podzespołów nie powoduje crasha.

RAM: Dwie kości to chinole i z doświadczenia już wiem, że mogą z nimi być problemy i to czasami subtelniejsze, niż po prostu odpalasz kompa i nie działa. Zdarzyło mi się wcześniej z innymi kośćmi tak, że RAM nie lubił się z dociążoną kartą graficzną. Przeciw winie RAMu przemawia to, że długo jednak setup działał. Raczej gdyby to był RAM, to by od samego początku było coś nie tak.

GPU: Znowu - chinol. Może jest jakaś wada produkcyjna i na początku wszystko było git, a jak się karta wygrzała, to przestało być git.

CPU: Był przez jakiś czas ostatnio overclockowany (patrz wyżej w podpunkcie o płycie głównej) i może się częściowo usmażył...?

system plików / sprzętowy błąd storage'u: To się łapie tak naprawdę na listę tylko dlatego, że cieniutkie artykuły w necie wspominają "Ojej, masz IRQL_NOT_LESS_OR_EQUAL? Sprawdź system plików", natomiast mi to brzmi jak porada na poziomie "Czy próbował Pan już wyłączyć i włączyć komputer?". Oczywiście system plików sprawdzałem już N razy, bo to nie jest problem i również oczywiście żaden błąd nie wyszedł.

Czego ja tak naprawdę od Was chcę :P

Liczę na to, że znajdzie się ktoś znacznie bardziej oblatany w hardware ode mnie. Ktoś, kto ma doświadczenie w diagnostyce serwisowej, zna się na typowych problemach ze sprzętem i tak dalej i podrzuci mi konkretne metody, którymi mogę ustalić, który podzespół mi pada. Rozwiązanie typu "kup całego nowego kompa" nie bardzo mi leży, bo to jest jednoznaczne z poddaniem się i porażką :P Chciałbym raczej porad, jak to profesjonalnie zdiagnozować, jakie stress testy zastosować i tak dalej. Bez wróżenia z fusów i bez wymieniania komponentów na ślepo. W razie czego oczywiście akceptuję porady typu "Stary, w domu tego nie rozkminisz. Zanieś PeCeta do serwisu" (o ile naprawdę ktoś, kto mi tak napisze, wie co mówi), bo cały czas cel jest ten sam - jak najmądrzej do tematu podejść i jeżeli faktycznie nie da się tego w domowych warunkach ogarnąć, to OK, zaniosę maszynę do serwisu.

Czego do tej pory próbowałem

Windows memory diagnostic

Odpaliłem całą diagnostykę i żadnych błędów nie znalazło. To jednak nie świadczy o tym, że wszystko jest na 150% git, bo wcześniej kupiłem inny RAM od Chińczyka i ewidentnie był problematyczny, mimo że test przechodził też pomyślnie. (w tamtym przypadku diagnostyka była łatwa, określiłem, że to na pewno RAM i dostałem zwrot kasy ;) )

Podbicie / obniżenie napięć na płycie głównej

Trochę pokręciłem w górę, trochę w dół i nie ma żadnego wpływu na problem. Co prawda robiłem to trochę na ślepo, bo się na tym nie znam, więc może jest w tym temacie jeszcze coś do wymyślenia dla jakiegoś speca.

Event Viewer

Szukałem jakiegokolwiek ciekawego wpisu w Event Viewer > Windows Logs > System i niestety nie ma. Ewidentnie system się sypie zanim zaczne cokolwiek zalogować. Memory dumpa nie ma w C:\Windows\MEMDUMP.SYS.

Stress test za pomocą benchmarku

Komp na luzie przechodzi od początku do końca przez benchmark Superposition, co by sugerowało, że crashe występują wtedy, kiedy i CPU i RAM i GPU na raz mają co robić - dlatego płyta główna i zasilacz tak wysoko na liście podejrzanych...

Link do komentarza
Udostępnij na innych stronach

CPU jako źródło problemów bym odrzucił, generalnie ciężko je wykończyć + podbicie mnożnika o jeden to nie jest big deal, a gdy pada - to zwykle całe. No chyba, że potraktowałeś je jakimś nieziemsko wysokim napięciem - wtedy to mogło spowodować problemy, zaprzecza temu jednak fakt, że obciążenie samego procesora nie powoduje jak rozumiem BSODa.

Płyta główna - obejrzyj ją dokładnie. Zwróć uwagę na jakiekolwiek ślady stopienia, przygrzania, spalenizny + czy nie wystąpiły gdzieś spuchnięte kondensatory. Jeśli nie natkniesz się na fizyczne ślady awarii, o ten komponent bym odrzucił.

Zasilacz - generalnie ciężko obejrzeć go w środku, ale dotknąć go mogło to co płytę - wszelkie ślady przypalenia czy spuchnięte elementy byłyby jednoznacznym znakiem awarii, ale ich brak niczego też nie wyklucza - to stara konstrukcja, a tyle lat służby mogło zrobić swoje. Definitywnie typowałbym jako jednego z głównych podejrzanych. Zgaduję że nie masz możliwość sprawdzenia innej jednostki?

RAM - zdarzyło mi się i tak, że kostki renomowanej firmy padły mi po latach służby w nader dziwaczny sposób. Najprościej byłoby wykluczyć ten element wkładając inne kości, o ile jakieś masz. Pewnym polem manewru jest też przełożenie pamięci do dotychczas wolnych slotów oraz wykorzystanie naprzemiennie jednej lub drugiej kości - zawsze istnieje szansa, że nie popsuły się obie.

GPU - padają nieraz, zdarza się choć prędzej objawia się to artefaktami obrazu lub crashami sterownika. Skoro przechodzi benchmark to jednak sugerowałoby, że karta jest ok.

Oprócz ww. powodów zastanowiłbym się nad czymś bardziej prozaicznym, typu zwyczajnie spartolona nowa wersja jakiegoś sterownika. Nie aktualizowałeś jakiegoś oprogramowania w ostatnim czasie/Windows nie zrobił tego cichaczem? Być może usunięcie wadliwej wersji oprogramowania/czysta instalacja systemu rozwiązałaby problem. Oprócz tego, czy mówiąc że badałeś sprzętowy błąd storage'u masz na myśli sprawdzałenie S.M.A.R.T dysku w programie pokroju CrystalDisk Info?

Link do komentarza
Udostępnij na innych stronach

Dzięki za odpowiedź!

No z CPU to by się zgadzało - działa, da się je dociążyć (zresztą to jest taki słabiaczek na dzisiejsze standardy, że podczas normalnej pracy systemu jest dość mocno przyciśnięty).

Obejrzałem płytę główną i zasilacz i wyglądają OK, chociaż zasilacza nie otworzyłem.

Ram sprawdziłem na wszystkie strony w ramach tego, co mam (a mam tylko to, co jest zainstalowane w kompie) - zamieniałem miejscami, testowałem tylko stary, tylko nowy itp. Jedyne, czego nie przetestowałem, to tylko jeden kanał / tylko drugi kanał, ale w takiej konfiguracji wydajność by była na tyle słaba (przynajmniej takie mam wrażenie), że to można chyba zostawić na sam koniec w temacie testów...

Stery sprawdziłem w ten sposób, że zainstalowałem wersję stabilną (zbundlowaną z Adrenalin 20.2.2) i nową (zbundlowaną z Adrenalin 2.4.1) i na obu testowałem - to samo.

Dysk jest nowy i w S.M.A.R.T. wszystko na zielono od góry do dołu. Swoją drogą dobrze się sprawuje jak na chinola za piątaka. Nie chciałem go otwierać, ale obstawiam, że ma elegancko DRAMowe cache.

Podsumowując -- chyba wyczerpałem większość opcji diagnostyki w domu i ciężko mi teraz iść dalej, nie mając drugiego zasilacza, drugiej płyty głównej, zapasowych kości RAM i tak dalej, więc ostatecznie stwierdziłem, że szkoda więcej czasu w to ładować i odsyłam złoma do serwisu. Zobaczymy, co z tego wyjdzie i jak będę miał diagnozę od nich, to się chętnie podzielę.

Link do komentarza
Udostępnij na innych stronach

Rozwiązane. Preview Build Windowsa był przyczyną. Nawet tego nie brałem pod uwagę jako kandydata na przyczynę, bo od pierwszych buildów Windowsa udostępnionych plebsowi zawsze byłem na fast ringu i nigdy ani jednego problemu (no, przez ponad 5 pewnie coś się trafiło, ale nie pamiętam, więc jak było, to nie na tyle, poważne, żeby mi jakkolwiek zapadło w pamięć). Ale jednak. Przeinstalowałem się na stabilny build i problem zniknął.

Link do komentarza
Udostępnij na innych stronach

Gość
Temat jest zablokowany i nie można w nim pisać.


  • Kto przegląda   0 użytkowników

    • Brak zalogowanych użytkowników przeglądających tę stronę.
×
×
  • Utwórz nowe...