PDA

Bekijk Volledige Versie : Server die af en toe slecht reageert !



Toepes
01/12/08, 08:54
Ik heb een windows 2003 (sp2) server met Plesk 8.6. 4GB geheugen, Processor Intel 2CPU 1.862 MHZ.

De belasting van de server is vrij laag, er worden diverse websites op gehost, maar als je naar de taskmanager kijkt zie je CPU uitschieten naar 40% af en toe (Standaard zit dit tussen 5 en 10%) van het Fysiek geheugen is ca 1,8GB vrij, aantal processen gemiddeld 80 en pagefile ca 3,9GB. Netwerk is 100Mbps en komt zelden boven de 25%.

Nu is het af en toe zo dat de server totaal niet reageert. Bij remote desktop kun je dan klikken waarop je wilt en de websites laden dan ook niet. Dit duurt dan een aantal seconden, waarna de server weer vooruit schiet zoals het hoort.
Het enige dat ik mij kan voorstellen is I/O. De raidcontroler is gecontroleerd deze is in orde. (Met dank aan Globalserve die met deze tip kwam waaruit bleek dat de cache van de Controller niet ingeschakeld stond)

Er worden diverse joomla sites gehost en MYSQL wordt dan ook regelmatig opgestart.

ASSP als spamfilter vergt niet veel bronnen, daar zal de oorzaak m.i. niet te vinden zijn.

Zijn er nog zaken waar verder naar gekeken kan worden ?

gjtje
01/12/08, 09:28
Je kan niet via KVM bij die server? Dan zou je iets meer kunnen testen.
Draait er nog teaming software op of andere software dat zich bezighoudt met de netwerk verbinding?

Toepes
01/12/08, 09:34
Er is geen verbinding via KVM. Verder is er (voor zover bekend) geen Teaming software geïnstalleerd. De server is managed gehuurd, maar de partij waar ik deze van gehuurd heb kan niets ontdekken.

gjtje
01/12/08, 10:34
Wat is de frequentie?
Is een andere switch poort al geprobeerd (je weet maar nooit ;))

Toepes
01/12/08, 11:39
dit zal ik doorspelen. De vraag over de frequentie is mij niet helemaal duidelijk. Als je hiermee bedoeld een frequentie in het slecht reageren kan ik alleen melden dat er geen enkele vorm van regelmaat in zit.

gjtje
01/12/08, 14:27
Ja, 1x per week of 50x per dag bijvoorbeeld. ;)

Toepes
01/12/08, 14:32
Meerdere keren per dag. Ik heb al eens in de logfiles proberen te zoeken nadat het weer was gebeurd, maar helaas niets te vinden.

almar
01/12/08, 15:37
Klinkt als een MySQL query die veel data ophaalt. Misschien ff slow query log aanzetten?

Toepes
01/12/08, 15:59
(Y) niet direct aan gedacht, ga ik proberen.

Mikey
01/12/08, 16:03
Ondanks de controller netjes aangeeft kan dit alsnog duiden op een schijf die niet lekker loopt, als de trigger net niet is, dan kan dat wel drukken op je perfomance. Het kan dus zijn dat de schijf op kort termijn wel uit de array gezet wordt en je probleem opgelost is.

GlobalServe
01/12/08, 17:00
Alle 2 de schijven zijn correct.
De info word via 3DM2 uit de raidcontrolle gehaalt.

Is iets heel raar, heb er ook al op zitten zoeken.
Niks in de proces lijst die op iets wijst.

almar
01/12/08, 17:15
Ik denk echt dat je moet zoeken in MySQL, iets met een select * op een grote tabel.

Mikey
01/12/08, 17:20
Alle 2 de schijven zijn correct.
De info word via 3DM2 uit de raidcontrolle gehaalt.

Is iets heel raar, heb er ook al op zitten zoeken.
Niks in de proces lijst die op iets wijst.

Dan nog kan er een schijf zijn die errors heeft maar net niet een trigger geraakt. Wij hebben een tijdje terug soortgelijk geval gehad, om de paar minuten freezde het systeem.

3ware bios tool gaf geen problemen, maar de smart tool zag wel degelijk errors...

Maar goed, zelf weten :)

Phu
01/12/08, 17:21
Kan bijvoorbeeld een rebuild van de schijven zijn 3dm tool geeft dan niets aan
maar hij draait wel op volle load.

Heb dit probleem vorige week gehad.

gjtje
01/12/08, 17:23
De Windows scheduler is misschien niet zo goed maar dan valt niet de hele verbinding weg. ;)
Pingt de machine ook niet meer?

Mikey
01/12/08, 17:26
Kan bijvoorbeeld een rebuild van de schijven zijn 3dm tool geeft dan niets aan
maar hij draait wel op volle load.

Heb dit probleem vorige week gehad.

Zowel de windows versie als de linux versie geven netjes aan dat een array aan het rebuilden is.... Tevens wordt dit nog eens netjes vermeld in het logboek :)

Toepes
01/12/08, 17:32
Slowquerylog staat nu aan, eens kijken of dat iets brengt. Zoals Globalserve al aan gaf staat er niets in de logfiles.

Wel is er een stroomuitval geweest van 30 seconden waarna het euvel eigenlijk pas goed op gang is gekomen. (Leek op een rebuild die dag).
Dus je zou denken dat een HD een klap heeft gehad.

Toepes
03/12/08, 19:38
Het lijkt er steeds meer op dat het aan de HD's ligt. Bij veel I/O is er niets met de server te beginnen.

Slowqueries zijn er wel, maar die zijn niet altijd op de momenten dat de handel weer eens hangt.