PDA

Bekijk Volledige Versie : server klapt er continue uit



anouk
10/03/10, 04:10
hallo allemaal,

Ik heb een server die alleen dient voor wat backups en dns.
Echter klapt hij er de laatste week continue uit.

Ik heb al gekeken wat er fout zou kunnen gaan. Echter heb ik niets gevonden.

Graag jullie suggestie's

groetjes
Anouk

The-BosS
10/03/10, 06:32
En wat verstaan we dan onder "er uit klappen", dat hij niet meer pingt en toegankelijk is of dat hij vanzelf reboot of ...

davinci
10/03/10, 08:06
hallo allemaal,

Ik heb een auto die alleen dient voor wat ritjes naar de supermarkt en familie.
Echter valt hij de laatste week continue uit.

Ik heb al gekeken wat er fout zou kunnen gaan. Echter heb ik niets gevonden.

Graag jullie suggestie's

groetjes
davinci

Bart L
10/03/10, 08:29
Anouk, is het een server of een VPS? Indien server, die is net nieuw geplaatst? Zo nee, heeft het eerst wel goed gedaan... Bedoel je met uitklappen, vastlopen? Oftewel powerswitch reset om hem weer in leven te krijgen?

anouk
10/03/10, 09:35
hij geeft geen ssh en geen ping meer.
betreft een webserver met dns, draait al een tijd dus het betreft geen nieuw.
voorheen geen problemen gehad. Als ik een power reset doe dan blijft
ie wel een paar dagen draaien.

Ik heb de logs en processen na gekeken maar daar staat mijninziens niets vreemds op.

Bart L
10/03/10, 09:58
Cooling, geheugen problemen, hdd problemen.. oftewel hardware probleem.
Weet niet of de server van jezelf is, maar zo niet, dan wordt het tijd om de hoster in te schakelen.

anouk
10/03/10, 10:12
@bart,

ik heb monit en munin draaien.
dus daar zal ik nog eens goed na kijken. (ondanks ik laatst nog deze heb gechecked en niets gevonden.)

Zijn hardware problemen nog ergens af te leiden?

Mikey
10/03/10, 10:33
En wat geeft de output op je scherm ?

t.bloo
10/03/10, 10:55
Wellicht stroomdipjes waar de voeding van de server net geen raad mee weet?

Verder heb ik slechte ervaring met munin die de kernel doet vastlopen. Op twee servers dezelfde problemen gehad als je beschrijft en nadat ik munin had verwijderd geen problemen meer. Maar dat kan ook toeval zijn want er waren in die tijd ook stroomproblemen in het datacenter.

dreamhost_nl
10/03/10, 11:17
Hoeven toch niet persé hardware problemen te zijn? Kan inderdaad ook iets softwarematig zijn. Monitor je ook op server load of dat niet?

Thyx
10/03/10, 11:24
Ik heb een soortgelijk probleem gehad doordat een voeding defect was. Hij viel willekeurig uit door de voeding dus. Dit was met een HP ML350 G5 bak.

Deze melding gaf iLO toendertijd en het was opgelost door de voeding te vervangen:
Informational iLO 2 01/04/2010 23:57 01/04/2010 23:57 1 Server power restored.
Informational iLO 2 01/04/2010 18:50 01/04/2010 18:50 1 Server power removed.

anouk
10/03/10, 11:37
het is idd merkwaardig... nu de afgelopen 2 keer rond 4 uur 's ochtends.

Voor de zekerheid heb ik pptpd en openvpn er maar af gegooid
en het aantal poorten gereduceerd tot 80 en 53

maar ik moet wel zeggen dat de dir. clientmqueue
daar waar munin bestanden weg schrijft snel vool loopt.

ichosting
10/03/10, 12:33
het is idd merkwaardig... nu de afgelopen 2 keer rond 4 uur 's ochtends.


Dit klinkt als een cron die begint te draaien en wat taken uitvoert en mogelijk dan de load te hoog wordt van de server of met het geheugen begint te swappen ?

anouk
11/03/10, 04:13
wat betreft de crons, dat zijn slechts de standaard crons, zoals cups, named en httpd.
dus dat zou theoretisch geen problemen mogen opleveren.

slag om de arm... maar na verwijdering munin, lijkt het beter te gaan.

Ik had openvpn en pptpd er al afgegooid maar ondanks dat klapt ie kort daarop weer.

uptime is nu 6,5 uur. Als ie alsnog begeeft meld ik me wel weer.

davinci
11/03/10, 07:54
wat is jouw definitie van cronjobs? Je hebt het hier m.i. over processen.
en cups hoort m.i. niet thuis op een colo.

ichosting
11/03/10, 08:55
wat betreft de crons, dat zijn slechts de standaard crons, zoals cups, named en httpd.

Dat zijn geen crons.

Met crons bedoel ik dat er bijvoorbeeld backups worden gemaakt, statistieken worden bijgewerkt (directadmin crons bijvoorbeeld) etc. waardoor de server het opeens erg druk krijgt.

Als er dan te weinig geheugen aanwezig is, gaat de server swappen naar de harde schijf. Waardoor die het uiteindelijk weer druk kan krijgen en de server onderuit kan gaan.

Gezien het nagenoeg steeds rond dezelfde tijd schijnt te zijn, lijkt het toch dat er iets zwaars aan het draaien is.

Wat staat er in je /etc/crontab file ? En doe eens een crontab -e
Wat staat daar allemaal in?

datadelft
11/03/10, 12:11
of cat /etc/crontab

anouk
11/03/10, 12:13
klopt, my bad.

ik bedoel Log File Rotation.

wat betreft crons heb ik:

/etc/cron.hourly/00awstats
/etc/cron.daily/tmpwatch
/etc/cron.daily/prelink
/etc/cron.daily/0logwatch
/etc/cron.daily/logrotate
/etc/cron.daily/makewhatis.cron
/etc/cron.daily/rpm
/etc/cron.daily/cups
/etc/cron.daily/0anacron
/etc/cron.daily/mlocate.cron
/etc/cron.weekly/99-raid-check
/etc/cron.weekly/makewhatis.cron
/etc/cron.weekly/0anacron
/etc/cron.monthly/0anacron
/usr/lib/sa/sa1 1 1
/usr/lib/sa/sa2 -A
/etc/webmin/cron/tempdelete.pl

ik vraag me trouwens wel af of /etc/cron.hourly/00awstats
niet overdone is... awstats ieder uur???

ichosting
11/03/10, 13:46
AWSTATS zou ik inderdaad even in een wat ruimere (daily) cron zetten.
Als er niet veel opstaat dan is dat niet zo spannend, maar het hoeft niet zo vaak idd.

Het is zo lastig te zeggen wat het probleem is. Zoals eerder aangegeven kan het zowel hard- als sotwarematig zijn.

Mogelijk dat je even iemand kunt laten kijken naar de servert

Geert-Jan
11/03/10, 15:05
Toch wel leuk, om de commando's te lezen die gegeven worden, terwijl er nog nergens is gesproken welk OS er draait. En ja, het ligt aan de hardware... :lovewht:

@anouk, zou je deze (open) vraag willen beantwoorden:

En wat geeft de output op je scherm ?

anouk
11/03/10, 15:36
het is een centos OS.


En wat geeft de output op je scherm ?

ik neem aan de je bedoelt wat het laat zien als ik er een monitor aan hang?
( na mijn weten de enige manier, hardware bugs te checken )

geen idee, ik heb geen fysieke toegang, al is het alleen al om de afstand.
dan moet ik het vliegtuig in stappen :)
het is een colo machine

Magus
11/03/10, 15:44
probeer dat script dan eens een paar keer achter elkaar handmatig te starten. Klapt ie er dan ook uit?

anouk
12/03/10, 05:05
welke script?

server is er weer uit geklapt.
ziet er niet best uit, ga ervan uit dat het een hardware probleem is.
immers draait er amper iets op de server. :(

DutchTSE
12/03/10, 08:51
ik neem aan de je bedoelt wat het laat zien als ik er een monitor aan hang?
( na mijn weten de enige manier, hardware bugs te checken )

geen idee, ik heb geen fysieke toegang, al is het alleen al om de afstand.
dan moet ik het vliegtuig in stappen :)
het is een colo machine

Je geeft aan dat er ILO op zit.. ILO standaard of ILO Advanced (dat was de moeilijke vraag, makkelijke versie: heb je remote console erbij ja of nee).

Laten we de vraag dan opnieuw formuleren: wat is de output van het scherm dat je via ILO remote console ziet?

No offence, maar ik heb het idee dat je beter even iemand in kunt huren die wel weet wat hij aan het doen is. Mocht het toch een softwarematig probleem zijn dan kun je van de besparing van je vliegticket hem betalen :)

Roconda
12/03/10, 12:55
Syslog al bekeken?