Likes Likes:  0
Resultaten 1 tot 4 van de 4
Geen
  1. #1
    Machine Check Exception errors.
    Solaris Sys*****
    1.364 Berichten
    Ingeschreven
    04/12/03

    Locatie
    Leiden

    Post Thanks / Like
    Mentioned
    0 Post(s)
    Tagged
    0 Thread(s)
    0 Berichten zijn liked


    Registrar SIDN: Nee
    KvK nummer: 28071088
    Ondernemingsnummer: NVT

    Thread Starter

    Machine Check Exception errors.

    Sinds enige tijd (48 dagen om precies te zijn) krijgen we op 1 van onze machines de volgende kernel messages:

    --
    Aug 17 11:09:44 cheitan MCE: The hardware reports a non fatal, correctable incident occurred on CPU 1.
    Aug 17 11:09:44 cheitan Bank 2: d400400000000813
    Aug 17 11:09:44 cheitan MCE: The hardware reports a non fatal, correctable incident occurred on CPU 0.
    Aug 17 11:09:44 cheitan Bank 1: d400400000000853
    --

    (machine is een Dual AMD MP, 2GB mem, OS is Gentoo 2.6.9 SMP).

    Overigens zijn deze meldingen pas ontstaan NA een fysieke verhuizing waarbij de PSU defect is geraakt. Deze is daarna vervangen voor een tijdelijke PSU waarna deze meldingen elke 15 seconden verschijnen.

    De machine lijkt er verders geen last van te hebben en doet vrolijk zijn werk. Google geeft ook niet echt een goed antwoord wat hier een verklaring voor kan geven.

    Enige verklaring dat ik zelf kan bedenken is dat de nieuw geplaatste PSU net iets andere voltages afgeeft aan het mainboard als de originele.
    Iemand enig idee ? (behalve de PSU weer te vervangen voor een type wat er echt in thuis hoort).

  2. #2
    Machine Check Exception errors.
    geregistreerd gebruiker
    849 Berichten
    Ingeschreven
    26/12/03

    Locatie
    Zwolle

    Post Thanks / Like
    Mentioned
    0 Post(s)
    Tagged
    0 Thread(s)
    0 Berichten zijn liked


    Naam: Daniël
    Registrar SIDN: Nee
    Ondernemingsnummer: nvt

    Is er toevallig niet wat veranderd qua timings o.i.d in de BIOS? Het lijkt me ok niet dat opeens allebij de proc's kapot zijn, dus ALS er iets kapot is zal het je moederbord of geheugen moeten zijn (lijkt mij het meest logische iig).

    Dat is niks gebeurd, of dat je er niksvan merk, komt omdat ze 'correctable' zijn. Als je pech hebt is dit straks een keer niet zo en kan de boel in het ergste geval gaan vastlopen of met corrupte data gaan spelen.

    Wat je hier aan kunt doen... Altijd lastig op een server maar ik zou sowieso memtest een keer draaien als die server eventjes een dag offline kan, verder kan ik je ook niet helpen.



  3. #3
    Machine Check Exception errors.
    geregistreerd gebruiker
    294 Berichten
    Ingeschreven
    05/05/05

    Locatie
    Blaricum

    Post Thanks / Like
    Mentioned
    0 Post(s)
    Tagged
    0 Thread(s)
    0 Berichten zijn liked


    Registrar SIDN: Nee
    KvK nummer: 50527746

    Mijn ervaring is dat onverklaarbare CPU en mem fouten vaak een oorsprong hebben in een PSU die niet helemaal lekker (meer) werkt. Ik zou dus zowieso de PSU vervangen voor een origineel exemplaar en daarna eventueel verder kijken.

    Heb je de voltages al bekeken in de bios?

  4. #4
    Machine Check Exception errors.
    Solaris Sys*****
    1.364 Berichten
    Ingeschreven
    04/12/03

    Locatie
    Leiden

    Post Thanks / Like
    Mentioned
    0 Post(s)
    Tagged
    0 Thread(s)
    0 Berichten zijn liked


    Registrar SIDN: Nee
    KvK nummer: 28071088
    Ondernemingsnummer: NVT

    Thread Starter
    "Fouten" zijn er dusver (nog) niet, of in elk geval niet merkbaar opgetreden (terwijl die bak toch al de laatste 20 uurtjes ofzo flink aan het compilen is).

    Dat er iets echt defect is lijkt me idd ook sterk (dan zou gelijk allebei de cpu's of 2 van de 4 geheugenbankjes betreffen).
    Ook instellingen qua hardware (bios) zijn ongewijzigd. De PSU was de enige wijziging die er was.
    Kan me ook voorstellen dat als het voltage ook maar iets afwijkt dat er daardoor timings verschillen (kunnen) optreden.

    Het bekijken van de voltages via bios, danwel sensoren, heeft op zich weinig zin als je geen referentie heb wat het exact zou moeten zijn.

    Denk dat ik (al is het maar voor de zekerheid) beter op zoek kan gaan naar een nieuwe 2U PSU (uit men hoofd is het een Chenbro kast, maar kan net zo goed een Procase zijn... even uitzoeken).

Webhostingtalk.nl

Contact

  • Rokin 113-115
  • 1012 KP, Amsterdam
  • Nederland
  • Contact
© Copyright 2001-2021 Webhostingtalk.nl.
Web Statistics