PDA

Bekijk Volledige Versie : Extreme Serverload



QIRulez
27/10/04, 23:29
Ineens had mijn P4 3.0HT een rare kuur gekregen.

Server kreeg vermelding dat hij overheating was. En dan blijft die tekst zo scrollen in je putty venster (erg irritant, iemand die weet hoe je dit kan stopzetten trouwens?)

Ik wou dus zien waarom hij aan het overheaten was.

Door het top commando te tippen zag ik door het geflikker van die overheating door dat de serverload 7.05 was :s.

En dat er 4 processen gestart waren onder root met als benaming:
"removing services" met elk 25 % aan serverload.

Ik heb dus maar server volledig laten rebooten, iemand idee wat dit kan zijn.

Ohja: server os is : fedora core 2

Graag was meer info van experten :)

Hier een screenshot:

http://www.cheapgamehost.com/putty.jpg

phreak
28/10/04, 00:03
De server is niet aan het overhitten, maar gewoon wat load aan het cree-eren, ik heb wel eens hogere server load gezien. Afijn,

Heb je al geprobeerd de processen te killen?
- killall -9 removeservice

of de server eens te rebooten?

of heb je gekeken waar het process vandaan komt, welke user dat het opstart (het is geen systeem process)

Misschien dat dit wat helpt...

Rik
28/10/04, 00:12
Origineel geplaatst door phreak
De server is niet aan het overhitten, maar gewoon wat load aan het cree-eren, ik heb wel eens hogere server load gezien. Afijn,

Heb je al geprobeerd de processen te killen?
- killall -9 removeservice

of de server eens te rebooten?

of heb je gekeken waar het process vandaan komt, welke user dat het opstart (het is geen systeem process)

Misschien dat dit wat helpt...

Zo'n hoge load op een Gameserver met 11 tasks running :huh:
Dat heb ik nog nooit gezien...
Load boven de 1,0 geeft al Lag...

Kweet wel dat er iets was met Core 2, zal het morgen eens navragen en hier laten posten...

QIRulez
28/10/04, 00:13
Ja heb het op google gevonden :

I did a google search but found very little. Logwatch churns a lot of logs it
seems, and the process is pretty CPU intensive. Will have to schedule them to run late at night.

Het is iets dat hij logfiles begint onnodige stuff te deleten.

Mmz,

Toch maar eigenaardig 4 tegelijk opstarten en zo hoge load :s

phreak
28/10/04, 00:21
Origineel geplaatst door Rik


Zo'n hoge load op een Gameserver met 11 tasks running :huh:
Dat heb ik nog nooit gezien...
Load boven de 1,0 geeft al Lag...

Kweet wel dat er iets was met Core 2, zal het morgen eens navragen en hier laten posten...

Die processen hadden toch niets met gameservers te maken Rik.

QIRulez
28/10/04, 00:32
Die logwatch staat bij daily in crontabs.

ff deleten.

Die kill -9 helpt niet hij start gewoon een nieuw process....

Nog iemand idee om die serverloadmessages weg te krijgen

Message from syslogd@r1k1s25 at Thu Oct 28 05:38:51 2004 ...
r1k1s25 kernel: CPU#0: Temperature above threshold

Message from syslogd@r1k1s25 at Thu Oct 28 05:38:51 2004 ...
r1k1s25 kernel: CPU#1: Temperature above threshold

Message from syslogd@r1k1s25 at Thu Oct 28 05:38:51 2004 ...
r1k1s25 kernel: CPU#1: Running in modulated clock mode

Message from syslogd@r1k1s25 at Thu Oct 28 05:38:51 2004 ...
r1k1s25 kernel: CPU#0: Running in modulated clock mode

Dit blijft maar over mijn scherm rollen en kan bijna niks anders meer doen.

Misschien daarom dat die log file zo groot worden dan.

Mijn veronderstelling:

Ooit heb ik deze overheating message nog is gehad toen een gameserver crashte en alle load naar zich toe nam. Toen heeft hij in die lmesgd file geschreven. Door die log files te scannen krijgt hij melding overheating waardoor hij die overheating messages in mesgd komen die hij weer gaat scannen etc en zo in een loop terecht komt?

MikeN
28/10/04, 01:19
Origineel geplaatst door Rik

Load boven de 1,0 geeft al Lag...

Load is nogal een relatief begrip, wat afhangt van kernelversie, kernelinstellingen, besturingssysteem en hardwareplatform. Het is dus nogal kort door de bocht om te stellen dat een load boven 1 al lagged.

@QIRulez: waarom strip je je crontabs niet gewoon tot het maximum, log je wat minder en zet je een simpel scriptje in om je logs te rotaten?

Verder moet je die overheating berichten nooit krijgen, een server hoort ook niet te warm te worden met 100% load :)

Cliff
28/10/04, 09:10
Origineel geplaatst door MikeN

Load is nogal een relatief begrip, wat afhangt van kernelversie, kernelinstellingen, besturingssysteem en hardwareplatform. Het is dus nogal kort door de bocht om te stellen dat een load boven 1 al lagged.


Klopt als een bus, zo hebben wij ooit een FTP server gehad, waar 2000 concurrent users opzaten. Samen met zo'n 500 mbit traffic zaten we op een load van 1025. Toch was de FTPserver zelf nog erg responsive (CPU was niet de bottleneck, maar IO). De rest van het systeem daarentegen was logischerwijs niet vooruit te branden.

royen99
28/10/04, 09:26
Om je 'server messages' weg te krijgen :

(bij RH9.. ik schat dat fedora niet anders is)

In je /etc staat een syslog.conf met daarin (o.a.) een regel:


*.emerg *


Even uitcommenten of naar een logfile routeren indien gewenst
(en even je syslog daemon restarten).

Overigens een hoge load zegt *op zich* niets.
Als 1 process in de run-queue staat, en 100% loopt te WACHTEN op cpu tijd (zal de load met exact 1 toenemen). Dit hoeft dus geen cpu load te veroorzaken. De load van een machine is eigenlijk het totaal van ALLE runnable processen die op cpu tijd lopen te wachten. Zelf bij een load van 30 of 40 kan een machine nog gladjes lopen afhankelijk van de cpu usage. (je kan bijvoorbeeld 30 processen hebben die 'hangen' (zombies) en dus elk een load van 1 veroorzaken en geen cpu tijd verbruiken).

PeterT
28/10/04, 10:10
Heeft te maken met de kernel die je gebruikt; 2.6.8 waarschijnlijk.
Je kunt 2 dingen doen:

- recompile kernel zonder p4thermal module
- "acpi=on" toevoegen aan je initrd line in grub/lilo.conf

Hierna even rebooten :)

PeterT
28/10/04, 10:12
Origineel geplaatst door royen99
Om je 'server messages' weg te krijgen :

(bij RH9.. ik schat dat fedora niet anders is)

In je /etc staat een syslog.conf met daarin (o.a.) een regel:


*.emerg *


Even uitcommenten of naar een logfile routeren indien gewenst
(en even je syslog daemon restarten).

En dit is natuurlijk dom... belangrijke messages negeren >_<

royen99
28/10/04, 11:11
Origineel geplaatst door PeterT


En dit is natuurlijk dom... belangrijke messages negeren >_<

Hij wil tijdelijk die messages weg hebben omdat ze om de haverklap op zijn scherm komen. Het is uiteraard niet de bedoeling dit permanent zo te hebben staan :)

sander
28/10/04, 13:16
je cpu word gewoon te warm en gaat in modulated clock draaien hierdoor heb je minder mhz power en komen processen in een langere wait state te staan en hierdoor je weer meer load krijgt, logisch eigelijk ,

in wat voorn kast zit die cpu?

QIRulez
28/10/04, 15:04
Ik geloof 1U.

Het is ook een dedicated server, veel kan ik er niet aan doen.

TimmiT.nl
06/11/04, 16:44
1u p4 3ghz.... waarschijnlijk is de airflow niet goed in die kast. als je ehm naar een 2u kast verplaatst, is dan het probleem niet opgelost, want ik neem aan dat de klant hier ook niet blij van wordt...