PDA

Bekijk Volledige Versie : CentOS server: Hoger server load eindigd met crash (of iig onbereikbaarheid)



sebvandijk
06/08/11, 13:03
Hallo,

Mijn eerste post hier, ik las al wel langer mee :). Maar ik kom er meteen in met een probleem.

Ik heb een redelijk oude server dedicated bij Leaseweb draaien. Sinds kort crasht hij soms. Zo erg dat ik alleen maar kan restarten via het panel van leaseweb (hardwarematig). Als dan de server weer opkomt krijg ik van Direct Admin mailtjes over serverload die echt veeeeeeel te hoog is. Soms wel 60.

Ik heb al aardig wat research gedaan naar het probleem en het vermoede gaat uit naar de MySQL database die processen laat wachten als de tabel actief gebruikt wordt. Aan de hand van die informatie heb ik voor een aantal zware cronjobs de database uitgeschakeld. informatie wordt nu direct in HTML opgeslagen ipv in database en daarna weer uit de database. Ik dacht dat ik hier redelijk de oplossing gevonden had, maar gister rond 0:00 uur ging hij weer down.

Het probleem is dat ik redelijk de weg weet op mijn server maar absoluut geen Linux specialist ben dus ik ben grotendeels afhankelijk van slimme google query's :)

Ik heb via custombuild alles geüpdatet (php, mysql, apache etc etc). Echter mijn OS loopt wel achter maar met mijn beperkte skills durf ik die niet te updaten. Draai nog CentOS 4.9

Hebben jullie enig idee waar ik naar moet kijken? Ik ben ook bereidt iemand in te huren, als er hier een specialist rondzwerft :)

alvast bedankt voor jullie tijd!

seb

ichosting
06/08/11, 13:14
Rond die tijd begint Directadmin ook met taken uit te voeren. Dus wordt het extra druk op de server.
Is het steeds rond dezelfde tijd dat ie vastloopt? Of is het echt willekeurig.

In eerste instantie zou ik zeggen dat er geheugen te kort is en dat je machine loopt te swappen naar de harddisk. Maar het kan veel zijn natuurlijk.

CentOS 4.9 is wel erg oud moet ik zeggen en niet meer erg veilig te noemen. Daar zou ik toch iets aan (laten) doen.

Kun je nog iets in de logs achterhalen na een herstart van wat de oorzaak is geweest?

sebvandijk
06/08/11, 13:27
Hij crashte net ook weer rond 12 uur. Dat is wel erg toevallig...
Ik weet niet zo goed waarnaar ik moet zoeken in de logs en in welke logs. Het swappen heb ik inderdaad eerder als probleem gelezen.

Dennis
06/08/11, 14:39
Screenshot van top bij hoge load? Kun je daarbij meer informatie geven? Wat zijn de specificaties en hoeveel bezoekers per dag bezoeken de server? Zoveel informatie als mogelijk is welkom.

wijtec
06/08/11, 15:20
Draait de backup toevallig om 12 uur, de compessie en ioload zijn vrij zwaar. Hierdoor zou mysql meschien niet genoeg meer krijgen waardoor alles gaat opstapelen.

sebvandijk
06/08/11, 15:22
Nee, back-up draait 's nachts, heb ik al in de gaten gehouden. Er is dan wel een iets hogere serverload maar voornamelijk door het gzippen van de back-ups.

@Dennis, heb een post geplaatst, maar die moet nog door admin worden gemodereerd omdat er een link in zit... :(

sebvandijk
06/08/11, 16:31
Dankzij Ichosting ben ik al heel wat verder.
blijkt dat er veel request komen naar het domein imgnode.cn wat als je google mallware is. probleem is echter dat ik die requests niet zo makkelijk kan blocken :(

als ik het domainnaam ping dan krijg ik ook niets terug. Misschien ergens ver weg een lokale dns ofzo...
enig idee hoe ik dat kan blocken? iemand dit ook gehad? thanks..

dit soort meuk komt er binnen:

11-0 - 0/0/178 . 0.03 25 20 0.0 0.00 2.60 94.209.116.152 imgnode.cn NULL
12-0 14294 4/35/162 C 0.14 0 20 5.8 0.53 2.34 82.173.180.175 imgnode.cn NULL
13-0 14360 4/12/112 C 0.26 0 0 0.0 0.02 0.44 81.241.166.31 imgnode.cn NULL
14-0 14361 2/27/128 C 0.02 1 151 18.4 0.52 0.84 82.173.180.175 imgnode.cn NULL
15-0 - 0/0/73 . 0.05 22 23 0.0 0.00 0.25 145.7.224.19 imgnode.cn NULL
16-0 - 0/0/51 . 0.00 21 0 0.0 0.00 0.47 82.74.41.87 imgnode.cn NULL
17-0 14366 4/22/67 C 0.44 0 0 0.0 0.70 0.76 81.241.166.31 imgnode.cn NULL
18-0 - 0/0/52 . 0.02 20 0 0.0 0.00 0.52 82.74.41.87 imgnode.cn NULL

dreamhost_nl
06/08/11, 18:06
Staat imgnode.cn op je server of wordt deze elders gehost?

sebvandijk
06/08/11, 18:31
Staat imgnode.cn op je server of wordt deze elders gehost?

Nee, ik heb er nog nooit van gehoord. Kan ik de traffic blocken?

dreamhost_nl
06/08/11, 20:47
Gewoon in je server opnemen en routen naar 127.0.0.1... ;)

Geert-Jan
06/08/11, 22:23
00.10 draait DA zijn data tasks.....
Staat gewoon in de cron. Evt. verzet je die tijd nu naar over 15 minuten en kijk je in top....

sebvandijk
08/08/11, 17:39
Doet DA ook 's middags rond die tijd data tasks? op dat moment heeft de server het ook vaak zwaar!

dreamhost_nl
08/08/11, 17:59
Statistieken zullen hoogstwaarschijnlijk een paar keer per dag worden verwerkt. Dat kan wel voor een hogere server load zorgen.

Alain
08/08/11, 18:03
Als je je server niet up-2-date kan of durft te houden dan ga je vroeg of laat sowieso problemen krijgen. Mogelijk is dit er ook al een gevolg van. Hoe dan ook, met de juiste kennis en stats kun je dit soort problemen vaak goed achterhalen en oplossen doormiddel van strakkere config van bv MySQL. Om te beginnen zou je in ieder geval zeker willen weten dat er niet iets op je systeem draait wat er niet op hoort te draaien. Als je niet veel van Linux weet dan kun je dat eigenlijk zelf niet betrouwbaar controleren.

Verder moet je iets van stats erop installeren, Cacti of Zabbix ofzo. Dan kun je als het goed is straks zien wat het systeem aan het doen was vlak voor een crash en kun je op basis daarvan mogelijk het probleem gaan oplossen.

Maar ik zou hoe dan ook een specialist eens naar je systeem laten kijken en ook laten onderhouden. Een Linux server is heel betrouwbaar als je hem goed opzet en blijft onderhouden. Maar als je dat niet doet dan kan direct of anders uiteindelijk wel iedere scriptkiddie op je server, deze misbruiken en tevens al je data bekijken, verspreiden, verwijderen etc. En daarnaast elke keer je server een harde reset geven is ook vragen om datacorruptie, dus ook dat zal vroeg of laat tot grotere problemen leiden.

sebvandijk
08/08/11, 18:08
Als je je server niet up-2-date kan of durft te houden dan ga je vroeg of laat sowieso problemen krijgen. Mogelijk is dit er ook al een gevolg van. Hoe dan ook, met de juiste kennis en stats kun je dit soort problemen vaak goed achterhalen en oplossen doormiddel van strakkere config van bv MySQL. Om te beginnen zou je in ieder geval zeker willen weten dat er niet iets op je systeem draait wat er niet op hoort te draaien. Als je niet veel van Linux weet dan kun je dat eigenlijk zelf niet betrouwbaar controleren.

Verder moet je iets van stats erop installeren, Cacti of Zabbix ofzo. Dan kun je als het goed is straks zien wat het systeem aan het doen was vlak voor een crash en kun je op basis daarvan mogelijk het probleem gaan oplossen.

Maar ik zou hoe dan ook een specialist eens naar je systeem laten kijken en ook laten onderhouden. Een Linux server is heel betrouwbaar als je hem goed opzet en blijft onderhouden. Maar als je dat niet doet dan kan direct of anders uiteindelijk wel iedere scriptkiddie op je server, deze misbruiken en tevens al je data bekijken, verspreiden, verwijderen etc. En daarnaast elke keer je server een harde reset geven is ook vragen om datacorruptie, dus ook dat zal vroeg of laat tot grotere problemen leiden.

Je hebt gelijk, is ook naïef van me geweest om die server niet te updaten. Ben nu aan het kijken voor server herinstallatie met de laatste versie van centOs. Daarnaast heb ik ondertussen wat contacten ook via dit forum met mensen die erg veel verstand hebben van linux servers. Hopelijk kan ik ondertussen zelf wat ervaring opdoen met de linux systemen :) Tot die tijd slimme mensen inhuren om de beveiliging up to date te houden! Het is nu in ieder geval een puinhoop, en dat is iets wat ik zeker niet wil!