VPS + Directadmin: Hele kleine downtimes [Archief]

Bekijk Volledige Versie : VPS + Directadmin: Hele kleine downtimes

capitala

24/07/13, 15:18

Al een redelijk lange tijd heb ik een VPS draaien waar ik 1 domein aan een hosting pakketje gekoppeld heb.
Hierop werkt altijd alles prima.

Alleen heel soms, is het gekoppelde domein heel even niet bereikbaar. Dit duurt dan vaak maar 20 of 30 seconden.
Meestal log ik dan even in op directadmin, die het dan altijd gewoon doet, en dan is het domein ook weer bereikbaar.
Nu weet ik niet of dit komt door het inloggen of dat het toeval is.

Ik heb even in de apache error log gekeken en vond de volgende regels:

[Wed Jul 24 09:30:23 2013] [emerg] (22)Invalid argument: couldn't release the accept mutex
[Wed Jul 24 09:31:02 2013] [notice] SSL FIPS mode disabled
[Wed Jul 24 09:31:02 2013] [warn] RSA server certificate is a CA certificate (BasicConstraints: CA == TRUE !?)
[Wed Jul 24 09:31:02 2013] [warn] RSA server certificate CommonName (CN) `localhost' does NOT match server name!?
[Wed Jul 24 09:31:02 2013] [warn] RSA server certificate is a CA certificate (BasicConstraints: CA == TRUE !?)
[Wed Jul 24 09:31:02 2013] [warn] Init: Name-based SSL virtual hosts only work for clients with TLS server name indication support (RFC 4366)
[Wed Jul 24 09:31:02 2013] [notice] suEXEC mechanism enabled (wrapper: /usr/sbin/suexec)
[Wed Jul 24 09:31:03 2013] [notice] SSL FIPS mode disabled
[Wed Jul 24 09:31:03 2013] [warn] RSA server certificate is a CA certificate (BasicConstraints: CA == TRUE !?)
[Wed Jul 24 09:31:03 2013] [warn] RSA server certificate CommonName (CN) `localhost' does NOT match server name!?
[Wed Jul 24 09:31:03 2013] [warn] RSA server certificate is a CA certificate (BasicConstraints: CA == TRUE !?)
[Wed Jul 24 09:31:03 2013] [warn] Init: Name-based SSL virtual hosts only work for clients with TLS server name indication support (RFC 4366)
[Wed Jul 24 09:31:03 2013] [notice] mod_ruid2/0.9.7 enabled
[Wed Jul 24 09:31:03 2013] [warn] pid file /var/run/httpd.pid overwritten -- Unclean shutdown of previous Apache run?
[Wed Jul 24 09:31:03 2013] [notice] Apache/2.2.23 (Unix) mod_ssl/2.2.23 OpenSSL/1.0.0-fips DAV/2 PHP/5.3.17 configured -- resuming normal operations

Nou zie ik in die laatste 2 regels een unclean shutdown - zou dat iets met de tijdelijke downtime van het domein te maken kunnen hebben?

systemdeveloper

24/07/13, 16:54

Lijkt erop dat apache teveel processen wilt starten en de httpd daemon dan crashed (unclean shutdown) en bij hernieuwd starten moet wachten op een timeout (ca. 30s) voordat ie weer een lock kan krijgen voor een nieuwe mutex.

Mogelijk te weinig geheugen of filehandles. Ik gok op de eerste. Je kunt voor apache eens het aantal te starten daemons verlagen (in het config deel van de mpm die je gebruikt.). Of het vps meer ram geven.

dicktump

24/07/13, 16:55

Zo te zien crasht Apache en wordt opnieuw opgestart (dit laatste doet DirectAdmin, die controleert Apache elke minuut). De bovenste melding (van 09:30:23) is de foutmelding (heeft ook als level 'emerg' meegekregen, dus is echt ernstig). Als je daar op zoekt met Google kom je vrijwel direct op deze pagina uit:
http://help.directadmin.com/item.php?id=411

Ik zou dat eerst even proberen dus.

Als dat niet helpt, kijk dan even in andere logs, zoals de kernel log, of daar gekke dingen te zien zijn.

capitala

24/07/13, 17:44

bibawa

24/07/13, 22:16

Kijk even in de output van TOP wat de actieve processen zijn en wat het geheugenverbruik i..

Kay van Aarssen

24/07/13, 22:44

Heb je deze vps draaien bij transIp?

t.bloo

24/07/13, 23:25

IOPS problemen buiten de VPS, waardoor een en ander "blijft hangen" en daarna deze symptomen geeft

Active8

24/07/13, 23:51

Je kan ook om mee te beginnen even de nodige update's uitvoeren, ik zie dat je apache+php+mod_ruid2 outdated zijn , als je custombuild 2.0 gebruikt is het een fluitje van een cent :)

dicktump

25/07/13, 08:57

Thanks voor de reacties. Ik had idd ook andere soort gelijke redenen gevonden online.

Mijn VPS heeft 4096MB RAM, zou dat niet voldoende moeten zijn aangezien ik maar 1 domein aan 1 hosting pakket gekoppeld heb vooralsnog?
Maar dat geeft dus niet de oplossing?

Het probleem staat los van hoeveel RAM je hebt. Al zou je 128 GB RAM geheugen hebben, deze foutmelding laat de webserver zichzelf alsnog afsluiten.

capitala

25/07/13, 09:58

Ik heb de optie van @dicktump z'n link uitgevoerd - nu miss. even wachten of het nut heeft.

Hier wat ouputs:

free -m
total used free shared buffers cached
Mem: 3831 1864 1966 0 208 1161
-/+ buffers/cache: 494 3336
Swap: 2015 0 2015

Top:

top

top - 09:48:58 up 145 days, 11:39, 1 user, load average: 0.00, 0.00, 0.00
Tasks: 172 total, 1 running, 166 sleeping, 5 stopped, 0 zombie
Cpu(s): 0.2%us, 0.0%sy, 0.0%ni, 99.8%id, 0.0%wa, 0.0%hi, 0.0%si, 0.0%st
Mem: 3923104k total, 1986364k used, 1936740k free, 213972k buffers
Swap: 2064376k total, 0k used, 2064376k free, 1189480k cached

En daaronder laat hij steeds zo'n 27 processen zien die af en toe veranderen als er wat gebeurd uiteraard.

Het lijkt mij niet dat hij te weinig geheugen o.i.d. heeft?

Het is idd een Blade VPS van Transip. Ik vraag me af of ik zelf naar die custombuild 2.0 zal moeten updaten? Is dat beter?

Herman440

25/07/13, 10:28

Ik heb zelf ook soms enkele malen zo'n korte downtime gemerkt in een tijdspanne van enkele dagen (1x per dag hooguit). Heb ook een VPS @ TransIP.
Ten tijde van zo'n korte downtime is het nog niet opgekomen om in de logs te duiken. Heb het tot nu toe weggeschreven als een kleine netwerk-hickup bij TransIP ofzoiets.
Mocht het weer eens voorkomen dan zal ik de logs erop na lezen.

systemdeveloper

25/07/13, 11:06

Nee, 4GB ram is meer dan genoeg over het algemeen. Net zoals in die link van directadmin staat zou ik even wat spelen met de mutex opties. Dat is meestal een beetje hardware afhankelijk, al heb ik zelf bij transip deze meldingen nooit gehad op een blade-vps.

Kay van Aarssen

25/07/13, 19:58

Heb zelf laatst een leuk contact gehad met transip voor een server van een klant.

Ook downtimes hoge iowaits op de downtimes monitoring die ik heb gebruikt is zabbix en daar kwam uit dat het de iowait is kortom transip duwt haar servers prop vol en hebben geen resources meer vrij.

Als iemand hier nog info over wil mag hij me een PB sturen.