PDA

Bekijk Volledige Versie : server niet bereikbaar



Noordwest
17/10/08, 03:03
Beste leden,

Gister kon ik opeens mijn server niet meer bereiken. Na een powercycle reboot kon ik hem opeens wel weer bereiken. Dit duurde ongeveer 15 min, daarna werd de server weer onbereikbaar. In de apache error log vond ik de onderstaande berichten, zou het hier aan kunnen liggen en heeft iemand enig idee hoe ik het zou kunnen verhelpen?


[Thu Oct 16 16:10:34 2008] [notice] suEXEC mechanism enabled (wrapper: /usr/sbin/suexec)
[Thu Oct 16 16:10:35 2008] [warn] RSA server certificate CommonName (CN) `localhost' does NOT match server name!?
[Thu Oct 16 16:10:35 2008] [warn] RSA server certificate CommonName (CN) `localhost' does NOT match server name!?
[Thu Oct 16 16:10:35 2008] [warn] Init: SSL server IP/port conflict: localhost:443 (/etc/httpd/conf/extra/httpd-vhosts.conf:38) vs. www.******.com:443 (/usr/local/directadmin/data/users/******/httpd.conf:48)
[Thu Oct 16 16:10:35 2008] [warn] Init: You should not use name-based virtual hosts in conjunction with SSL!!
[Thu Oct 16 16:10:35 2008] [notice] Apache/2.2.9 (Unix) mod_ssl/2.2.9 OpenSSL/0.9.8c DAV/2 PHP/5.2.6 configured -- resuming normal operations

Randy
17/10/08, 04:55
Nee, een standaard melding.
Kijk je /tmp en /var/tmp even na op 'gekke' bestanden.

westerp
17/10/08, 11:59
Meteen inloggen en alle services uitzetten, daarna eens rustig kijken wat
je kan vinden en een voor een de boel weer aanzetten terwijl je logfiles tailt.
Een paar logins met top, sensors, netstat enzo aanzetten en opletten.

Noordwest
17/10/08, 12:08
Bedankt voor de reacties.

@randy
In de /tmp dir vind ik een mysql.sock bestand en in de /var/tmp staat niets.

@westerp
hoe zet ik alle services uit? met kill? En welke services kan ik allemaal veilig uitzetten?

westerp
17/10/08, 12:14
Welk os/distro? Hopelijk zijn het web, ftp, database, e.d. servers die ergens
roet in het eten gooien en heb je geen hardware problemen. Monitor je regelmatig
temperaturen aangezien een rot/dood fannetje natuurlijk ook voor deze problemen
kan zorgen. Zolang je zorgt dat je netwerk draait en sshd er is kan je zowat alles
zonder problemen uitzetten natuurlijk.

Noordwest
17/10/08, 12:20
ik draai debian. In top vond ik trouwens wel erg veel dezelfde processen, is dit normaal?

2482 dovecot 17 0 3304 1508 1240 S 0 0.1 0:00.00 pop3-login
2483 dovecot 18 0 3304 1508 1240 S 0 0.1 0:00.00 pop3-login
2484 dovecot 18 0 3308 1508 1240 S 0 0.1 0:00.00 pop3-login
2485 dovecot 18 0 3308 1504 1240 S 0 0.1 0:00.00 pop3-login
2486 dovecot 18 0 3304 1504 1240 S 0 0.1 0:00.00 pop3-login
2487 dovecot 18 0 3304 1504 1240 S 0 0.1 0:00.00 pop3-login
2488 dovecot 18 0 3304 1504 1240 S 0 0.1 0:00.00 pop3-login
2489 dovecot 18 0 3308 1508 1240 S 0 0.1 0:00.00 pop3-login
2490 dovecot 18 0 3304 1508 1240 S 0 0.1 0:00.00 pop3-login
2491 dovecot 18 0 3304 1504 1240 S 0 0.1 0:00.00 pop3-login
2492 dovecot 18 0 3308 1504 1240 S 0 0.1 0:00.00 pop3-login
2493 dovecot 18 0 3304 1504 1240 S 0 0.1 0:00.00 pop3-login
2494 dovecot 18 0 3308 1504 1240 S 0 0.1 0:00.00 pop3-login
2495 dovecot 18 0 3308 1508 1240 S 0 0.1 0:00.00 pop3-login
2496 dovecot 18 0 3308 1504 1240 S 0 0.1 0:00.00 pop3-login
2497 dovecot 18 0 3308 1508 1240 S 0 0.1 0:00.00 pop3-login

westerp
17/10/08, 12:25
Mwah, een stel pop pogingen zijn absoluut niet boeiend. Ik weet niet of je klanten
hebt of het een prive server is maar sommige klanten denken dat om de minuut
poppen een goeie instelling is. Anders zijn het duffe scripjes van kiddies of een
of andere pop check script wat je zelf draait? Kijk eerst eens naar de temperatuur
en kijk goed naar de overgang van vastlopen/onbereikbaar zijn tot de reboot in
messages en secure wat er op dat moment gebeurde.

Noordwest
17/10/08, 12:53
ik heb lm-sensors geinstalleerd en krijg de volgende melding:

VCore: +1.26 V (min = +0.00 V, max = +1.74 V)
in1: +12.14 V (min = +13.46 V, max = +11.35 V) ALARM
AVCC: +3.34 V (min = +3.02 V, max = +4.02 V)
3VCC: +3.34 V (min = +4.05 V, max = +4.08 V) ALARM
in4: +1.46 V (min = +1.91 V, max = +2.04 V) ALARM
in5: +1.71 V (min = +2.01 V, max = +2.04 V) ALARM
in6: +3.40 V (min = +6.53 V, max = +6.53 V) ALARM
VSB: +3.36 V (min = +4.08 V, max = +3.06 V) ALARM
VBAT: +3.26 V (min = +4.06 V, max = +2.00 V) ALARM
in9: +1.84 V (min = +2.04 V, max = +1.53 V) ALARM
Case Fan: 0 RPM (min = 0 RPM, div = 4)
CPU Fan: 3857 RPM (min = 0 RPM, div = 2)
Aux Fan: 0 RPM (min = 3183 RPM, div = 4) ALARM
Sys Temp: +35°C (high = +127°C, hyst = -33°C)
CPU Temp: +40.5°C (high = +80.0°C, hyst = +75.0°C)
AUX Temp: +35.0°C (high = +80.0°C, hyst = +75.0°C)

Lijkt me niet goed met al die alarmen?

westerp
17/10/08, 13:12
Lijkt me niet goed met al die alarmen?

Niet dat lm-sensors altijd de exacte waarheid vertelt ;):
---------
in1: +0.08 V (min = +2.24 V, max = +2.74 V) ALARM
in5: +3.86 V (min = +3.62 V, max = +2.42 V) ALARM
in6: +3.47 V (min = +3.98 V, max = +2.66 V) ALARM
fan1: 5487 RPM (min = 0 RPM, div = 2)
fan2: 3901 RPM (min = 0 RPM, div = 2)
temp2: +61.0°C (high = +95°C, hyst = +85°C) ALARM (beep)
---------
VCore 2: +0.00 V (min = +0.00 V, max = +4.08 V) ALARM
-5V: -13.64 V (min = -13.64 V, max = +4.03 V) ALARM
fan1: 680 RPM (min = 811 RPM, div = 8) ALARM
---------
En zo kan ik nog wel wat sensors output pasten, maar zo te zien
is de cpu temp en de fan speed wel in orde. Je kan beide een tijdje
in de gaten houden met een #screen watch -d sensors en zo nu
en dan die screen oppakken en kijken, maar ik denk dat het toch
iets met een of andere service te maken heeft.

Gewoon ingelogd blijven met meerdere consoles en alles een tijdje
goed in de gaten houden tot je ontdekt wat de boel ophangt

Noordwest
17/10/08, 13:39
aha, overigens draait het geheel nu alweer een tijdje goed. Heb mysql en proftpd uitgezet. Ik laat het geheel zo even een middagje draaien met top netstat en sensors aan en kijken wat er gebeurt. Wanneer het systeem vanmiddag nog draait schakel ik de services weer in. Ik vermoed dat het probleem zit in proftpd omdat ik met mysql nog niks geconfigureerd heb. In ieder geval bedankt voor de hulp tot dusver en ik zal er vanavond op terug komen.

DutchTSE
17/10/08, 14:33
die POP processen zijn normaal. Het gaat volgens mij om een directadmin machine? Draait hier al wat op of niet?
Indien er dns op draait: zet je dns uit (en los dit op een andere manier op;)) en kijk of het opgelost is. Verder even al je logfiles doornemen, of dit door iemand laten doen.

(uitleg wbt dns: mijn oude sec. dns server viel na een reboot na een aantal minuten uit, na de dns naar een andere server te hebben gezet draaide de oude server prima, na een week terug gezet en toen weer hetzelfde probleem..)

t.bloo
17/10/08, 14:43
toevallig een opteron processor of iets anders niet-Intel-32-bit? wil nog wel eens gebeuren dan dat er software op is gekomen (via apt-get install of een rpm) die toch niet goed draait en een illegal instructie geeft.

westerp
17/10/08, 14:45
Indien er dns op draait: zet je dns uit (en los dit op een andere manier op)

Ehrmm? Waarom dns uitzetten als oplossing? Uitzoeken wat er aan
de hand is oke, maar een service uitzetten omdat je niet weet wat
er aan de hand is?

westerp
17/10/08, 14:48
toevallig een opteron processor of iets anders niet-Intel-32-bit?

Tis om te beginnen idd wel handig om eens te weten wat
er precies als os draait, op welke architectuur en of er al
e.e.a. gedaan is met software installs etc.. Als het een
kale net geinstalleerde machine is kunnen we ons daar
iets minder druk om maken.

DutchTSE
17/10/08, 15:04
Ehrmm? Waarom dns uitzetten als oplossing? Uitzoeken wat er aan
de hand is oke, maar een service uitzetten omdat je niet weet wat
er aan de hand is?
TS geeft aan de logfiles doorgenomen te hebben en op het punt is beland waarop hij services uitzet. Omdat DNS zo "lightweighted" is wordt dit snel vergeten ;)

Noordwest
17/10/08, 19:04
Allereerst bedankt voor de reacties:

Het gaat om de volgende server die draait bij leaseweb.

EverCase ECR9130 Server
AMD 1x Sempron 3100+ CPU
512MB DDR2 RAM
1 x 160GB SATA II Harddisk
Debian Operating System

Het is een "verse" configuratie met directadmin geinstalleerd door leaseweb. Het enige dat ik tot nu toe heb gedaan is configureren van de domeinen in directadmin, installeren van webmin, FFMPEG, sensor, sudo, proftpd geupdate (draait nu versie 1.3.0). Ook heb ik wat wijzigingen gedaan. Overigens draait het systeem nu al 6 uur stabiel nadat ik mysql en proftpd heb uitgezet. Wijst dit er op dat het probleem in 1 van die twee services moet zitten? Of kan ik het beste alsnog testen met de DNS server uitgeschakeld? Ik wil zometeen proberen om mysql en proftpd 1 voor 1 in te schakelen. Ik draai dan sensors, top, en netstat. Op watvoor dingen moet ik dan letten denken jullie? En een absolute beginnersvraag: Met welk commando kan ik netstat blijven monitorren?

jeroen2496
17/10/08, 20:56
Draait FFMPEG nog?

westerp
18/10/08, 00:51
Overigens draait het systeem nu al 6 uur stabiel nadat ik mysql en proftpd heb uitgezet. Wijst dit er op dat het probleem in 1 van die twee services moet zitten? Of kan ik het beste alsnog testen met de DNS server uitgeschakeld?

Ik zou beide apart aanzetten en de boel in de gaten houden. Voor nu is
het nog erg onduidelijk wat en wie de boosdoener is/was.

Het kan een brakke site zijn welke mysqld over de zeik helpt, een joomla
drupal dingske met buggy code en ga zo maar door. Je kan proftpd door
vsftpd vervangen als je denkt dat er daar wat mis is. Maar hou vooral
de load en logs in de gaten als je een service weer aan zet dan ga ik
er wel van uit dat je vrij snel ontdekt wat er was.



Op watvoor dingen moet ik dan letten denken jullie? En een absolute beginnersvraag: Met welk commando kan ik netstat blijven monitorren?

Load, temp, aantal connects en gekke zaken in logs. netstat --tcp -c
laat continu zien wat er aan tcp connects langshobbelt.

Kom je er nu wel achter welke service de veroorzaker is maar heb je
nog geen idee hoe het op te lossen en wil je de boel toch aan laten
staan kan je in een cronjob de service herstarten om het uur ofzo
of op het moment dat de load te hoog is.

Noordwest
18/10/08, 03:05
Ik draai momenteel al een half uurtje met alle services aan. Ik wil niet te vroeg juichen, maar tot nu toe zie ik niets vreemds gebeuren en loopt ze als een zonnetje. Ik laat m vannacht monitoren en hopen dat ze de nacht doorkomt ;-) alhoewel dit wel een onbevredigend antwoord is na het gecrash van gister..

westerp
18/10/08, 10:57
Ik draai momenteel al een half uurtje met alle services aan. Ik wil niet te vroeg juichen, maar tot nu toe zie ik niets vreemds gebeuren en loopt ze als een zonnetje. Ik laat m vannacht monitoren en hopen dat ze de nacht doorkomt ;-) alhoewel dit wel een onbevredigend antwoord is na het gecrash van gister..

Mag ik een domeinnaam/ip adres en even e.e.a. van buitenaf besnuffelen
terwijl jij oplet? Geen login maar gewoon even flink aankloppen zeg maar.

Noordwest
18/10/08, 13:12
@jeroen2496
FFMPEG draait niet.

@westerp ik heb je mn het ip gepmd. Overigens zie ik vanochtend een verhoging van activiteiten in netstat. Er is een lading ssh connecties bijgekomen van andere adressen, maar users geeft alleen 4 keer de user waar ik mee ben ingelogd als output. Is dit normaal?

Noordwest
18/10/08, 13:24
In mn auth.log vind ik het volgende:

Oct 18 03:14:58 server sshd[23568]: (pam_unix) authentication failure; logname= uid=0 euid=0 tty=ssh ruser= rhost=59-125-180-178.hinet-ip.hinet.net
Oct 18 03:14:59 server sshd[23565]: Invalid user wwwrun from 81.183.210.151
Oct 18 03:14:59 server sshd[23565]: (pam_unix) check pass; user unknown
Oct 18 03:14:59 server sshd[23565]: (pam_unix) authentication failure; logname= uid=0 euid=0 tty=ssh ruser= rhost=dsl51b7d297.fixip.t-online.hu
Oct 18 03:15:00 server sshd[23568]: Failed password for invalid user sean from 59.125.180.178 port 35850 ssh2
Oct 18 03:15:01 server CRON[23576]: (pam_unix) session opened for user root by (uid=0)
Oct 18 03:15:01 server CRON[23576]: (pam_unix) session closed for user root
Oct 18 03:15:01 server sshd[23565]: Failed password for invalid user wwwrun from 81.183.210.151 port 63089 ssh2
Oct 18 03:15:03 server sshd[23575]: Invalid user sean from 59.125.180.178
Oct 18 03:15:03 server sshd[23575]: (pam_unix) check pass; user unknown
Oct 18 03:15:03 server sshd[23575]: (pam_unix) authentication failure; logname= uid=0 euid=0 tty=ssh ruser= rhost=59-125-180-178.hinet-ip.hinet.net
Oct 18 03:15:04 server sshd[23575]: Failed password for invalid user sean from 59.125.180.178 port 35966 ssh2
Oct 18 03:15:06 server sshd[23579]: Invalid user wwwrun from 81.183.210.151
Oct 18 03:15:06 server sshd[23579]: (pam_unix) check pass; user unknown
Oct 18 03:15:06 server sshd[23579]: (pam_unix) authentication failure; logname= uid=0 euid=0 tty=ssh ruser= rhost=dsl51b7d297.fixip.t-online.hu
Oct 18 03:15:07 server sshd[23581]: Invalid user sean from 59.125.180.178
Oct 18 03:15:07 server sshd[23581]: (pam_unix) check pass; user unknown
Oct 18 03:15:07 server sshd[23581]: (pam_unix) authentication failure; logname= uid=0 euid=0 tty=ssh ruser= rhost=59-125-180-178.hinet-ip.hinet.net
Oct 18 03:15:09 server sshd[23579]: Failed password for invalid user wwwrun from 81.183.210.151 port 62453 ssh2
Oct 18 03:15:09 server sshd[23581]: Failed password for invalid user sean from 59.125.180.178 port 36142 ssh2

duidt dit op hackpogingen?

westerp
18/10/08, 13:27
Dat is standaard, zodra een machine in de lucht is kan je er op
rekenen dat er binnen een dag kiddies langskomen met duffe
scriptjes welke proberen met user www pass www enzo een
ssh verbinding te openen. Die kan je gewoon negeren dus.

Ik kijk later vandaag even maar moet nu weg :)

dreamhost_nl
18/10/08, 19:04
Heb je nu niet zoiets als BFD/APF of CSF/LFD draaien? Scheelt je al een hoeveelheid valse inlog pogingen doordat de volhouders na een x aantal keer worden geblokkeerd in je firewall...

westerp
18/10/08, 19:57
Ik ben even aan het snuffelen :) Zie trouwens dat je 1300 meter van mij
vandaan woont :)

Noordwest
18/10/08, 20:15
Heb je nu niet zoiets als BFD/APF of CSF/LFD draaien? Scheelt je al een hoeveelheid valse inlog pogingen doordat de volhouders na een x aantal keer worden geblokkeerd in je firewall...

Heb inmiddels denyhosts geinstalleerd, draait nu prima.

@westerp

ik zie je inderdaad bij mn webmin paneel rondsnuffelen ;-) Ik zag inderdaad ook al de je in Amsterdam woont, tis toch een kleine wereld.

Noordwest
19/10/08, 13:06
Heel vreemd. Gisteravond deed zich het probleem het probleem weer voor na een reboot. Systeem draait en na een paar minuten kun je met geen mogelijkheid meer connecten (ook geen ping). Vanochtend besloot ik om directadmin en alle services die DA controleert uit te schakelen (behalve ssh) en langzaam in te schakelen om te kijken wat er gebeurt. Ik heb nu alles ingeschakeld en het systeem draait weer als een trein. Iedere keer als ik probeer te troubleshooten doet het probleem zich niet meer voor. Het lijkt wel alsof wanneer ik services in directadmin manueel reboot het probleem is opgelost. Ik begrijp er niks van?

Noordwest
19/10/08, 13:21
als ik in de syslog kijk heb ik ook niet het idee dat het systeem crashed. De logs dateren namelijk gewoon tot vlak voor de reboot. Kan het zijn dat iets ervoor zorgt dat het systeem niet meer kan connecten?

westerp
19/10/08, 13:44
Een hoge load zou ik al eerste verdenken. Als het weer zover is gewoon
wachten tot je een prompt krijgt.

Noordwest
19/10/08, 13:56
hm ja aan zoiets denk ik ook. Misschien een domme vraag, maar wat is een prompt en waar zie ik dat?

westerp
19/10/08, 14:03
ssh naam@machine en dan maar wachten :) Ik heb het een jaar of 7 geleden eens
gehad dat een bekende Nederlandse website een paar scripts had die apache aardig
over de zeik hielpen terwijl ik op vakantie in Tsjechie was. In een internet cafe putty
aangeslingerd, connect, kopje koffie gehaald aan de bar, password intiken, nog een
kopje koffie en een peukje verder, prompt, apache restart, peukje en koffie drinken
en ja hoor daar was hij weer :) De load was rond de 90 op een PII 450...

Noordwest
19/10/08, 14:52
Haha valt me mee dat ze daar toen al internetcafé's hadden ;-)

Ik heb mn server eens gereboot en daarna gaan luisteren, maar het probleem doet zich opeens niet meer voor. Ik keek net in mn logs en vond nog iets vreemds:


008-10-19 09:08:19 1KrLvx-0007Hw-Un User 0 set for local_delivery transport is on the never_users list
2008-10-19 09:08:19 1KrLvx-0007Hw-Un == root@******.am R=localuser T=local_delivery defer (-29): User 0 set for local_delivery transport is on the never_users list
2008-10-19 11:16:52 exim 4.67 daemon started: pid=2523, -q15m, listening for SMTP on port 25 (IPv4) port 587 (IPv4)
2008-10-19 11:39:58 exim 4.67 daemon started: pid=3554, -q15m, listening for SMTP on port 25 (IPv4) port 587 (IPv4)
2008-10-19 12:32:45 H=118-168-100-248.dynamic.hinet.net (85.17.92.135) [118.168.100.248] F=<ttc585ttc585@yahoo.com.tw> rejected RCPT <dcu846eg@yahoo.com.tw>: authentication required
2008-10-19 12:32:46 H=118-168-100-248.dynamic.hinet.net (85.17.92.135) [118.168.100.248] incomplete transaction (connection lost) from <ttc585ttc585@yahoo.com.tw>
2008-10-19 12:32:46 unexpected disconnection while reading SMTP command from 118-168-100-248.dynamic.hinet.net (85.17.92.135) [118.168.100.248]
2008-10-19 12:32:49 H=118-168-100-248.dynamic.hinet.net (85.17.92.212) [118.168.100.248] F=<ttc585ttc585@yahoo.com.tw> rejected RCPT <dcu846eg@yahoo.com.tw>: authentication required
2008-10-19 12:32:49 H=118-168-100-248.dynamic.hinet.net (85.17.92.212) [118.168.100.248] incomplete transaction (connection lost) from <ttc585ttc585@yahoo.com.tw>
2008-10-19 12:32:49 unexpected disconnection while reading SMTP command from 118-168-100-248.dynamic.hinet.net (85.17.92.212) [118.168.100.248]
2008-10-19 13:29:01 exim 4.67 daemon started: pid=2180, -q15m, listening for SMTP on port 25 (IPv4) port 587 (IPv4)


Kan dit er op duiden dat er spam verstuurd wordt via mn server en dat zou de overload wordt veroorzaakt? Ik heb zelf geen enkele mailapplicatie draaien en ik ben de enige gebruiker van de server.

westerp
19/10/08, 15:00
Nee hoor, alleen maar boefjes die het proberen. Ze houden zich niet aan de http://www.ietf.org/rfc/rfc2821.txt standaard en geven het op zonder dat
braaf te melden.

westerp
19/10/08, 15:06
Jouw machine is dicht, zie mijn poging:

# telnet 85.**.**.** 25
Trying 85.**.**.**...
Connected to ********.com.
Escape character is '^]'.
220 server.****.** ESMTP Exim 4.67 Sun, 19 Oct 2008 14:02:07 -0700
helo ikbeneenboefje
250 server.****.** Hello *****.net [83.**.**.**]
mail from:stoutespammer@spam.la
250 OK
rcpt to:billieboygates@mickeysoft.com
550 authentication required
data
503-All RCPT commands were rejected with this error:
503-authentication required
503 valid RCPT command must precede DATA
quit
221 server.****.** closing connection
Connection closed by foreign host.

p.s. Ik neem aan dat je in kan loggen bij de hosting provider en daar
de reverse dns voor jouw machine kan aanpassen, tis wel netjes
als je die even aanpast :)

p.p.s. Je kan het zelf ook laten testen op http://www.abuse.net/relay.html

Noordwest
19/10/08, 15:35
thx voor je test, dat is dan goed nieuws. Ik laat een terminal open staan totdat het probleem zich voordoet, als ik dan een prompt zie als ik weer thuis ben moet het dus een hoge load zijn die zich voordeed.

ps. Staat westerp trouwens voor westerpark?

DutchTSE
19/10/08, 16:24
thx voor je test, dat is dan goed nieuws. Ik laat een terminal open staan totdat het probleem zich voordoet, als ik dan een prompt zie als ik weer thuis ben moet het dus een hoge load zijn die zich voordeed.

ps. Staat westerp trouwens voor westerpark?
In plaats van op deze manier moeilijk doen kun je ook een bedrijf zoeken welke jou kan voorzien in monitoring van de server, op die manier krijg je een email/sms wanneer een service uitvalt of de load te hoog wordt, mocht je meer informatie nodig hebben dan moet je maar even PM-en.

westerp
19/10/08, 17:05
ps. Staat westerp trouwens voor westerpark?

Tzeggik, 1300 meter bij jou vandaan :)

westerp
19/10/08, 17:14
In plaats van op deze manier moeilijk doen kun je ook een bedrijf zoeken welke jou kan voorzien in monitoring van de server

Ik zou eerder aanbevelen zelf te onderzoeken en te leren wat er
onder de motorkap van een controlpanel zit. Alles uitbesteden maakt
het er niet leuker, leerzamer en interessanter op.

Op den duur uitvinden hoe je zelf een monitoring script in elkaar zet
of gek doen en met nagios gaan spelen, dan deze een sms laten sturen
via de mail2sms dienst van zijn gsm provider en je hebt weer een hoop
zelf gedaan en geleerd.

Hoe dan ook heeft hij in eerste instantie niets aan monitoring als hij
niet weet wat er speelt. Een sms dat er een machine down is heeft
weinig zin als dat elke keer weer plaatsvind.

Voor goedkope monitoring is er bijvoorbeeld hyperspin (http://www.hyperspin.com/nl), een trail
account met twee gratis sms'jes heb je in een paar klikken bij elkaar.

Geert-Jan
19/10/08, 17:22
klopt, maar wat in de tussentijd?

westerp
19/10/08, 17:28
klopt, maar wat in de tussentijd?

Rebooten mocht het misgaan. Hoe dan ook draait de boel alweer
een tijd en lijkt het er op dat het een vage tijdelijke glitch was.

DutchTSE
19/10/08, 18:02
Hoe dan ook heeft hij in eerste instantie niets aan monitoring als hij
niet weet wat er speelt. Een sms dat er een machine down is heeft
weinig zin als dat elke keer weer plaatsvind.

Voor goedkope monitoring is er bijvoorbeeld hyperspin (http://www.hyperspin.com/nl), een trail
account met twee gratis sms'jes heb je in een paar klikken bij elkaar.
Het doel van monitoring is op de hoogte worden gebracht van zaken die zich normaal niet voordoen, en eventuele downtime zoveel mogelijk te beperken.

Je kunt inderdaad je SSH scherm open laten staan en wachten tot er een hoge load verschijnt, je kunt hier ook gewoon een monitoring dienst voor inschakelen, dat is mijn boodschap :)

westerp
19/10/08, 18:08
Verkoopt u soms monitoring diensten? ;)

DutchTSE
19/10/08, 18:27
Verkoopt u soms monitoring diensten? ;)
Klopt, net als: http://www.google.nl/search?hl=nl&q=free+server+monitoring+&btnG=Zoeken&meta=

Wat is het doel van je opmerking?

westerp
19/10/08, 18:46
De smiley op het eind vertelt een hoop over mijn doel.

We zijn hier bezig een beginner op weg te helpen en
ik probeer hem iig niet iets te verkopen maar een beetje
de goede kant op te wijzen. Als iemand vragen en problemen
heeft is het imho aardig hem te helpen zonder gelijk aan
de afdeling sales te denken.

t.bloo
19/10/08, 18:52
Dit is niet de afdeling "vragen voor beginners" (http://www.webhostingtalk.nl/technische-vragen-van-beginners) dus mag er best het zinnige advies gegeven worden om monitoring te gebruiken.

DutchTSE
19/10/08, 18:58
De smiley op het eind vertelt een hoop over mijn doel.

We zijn hier bezig een beginner op weg te helpen en
ik probeer hem iig niet iets te verkopen maar een beetje
de goede kant op te wijzen. Als iemand vragen en problemen
heeft is het imho aardig hem te helpen zonder gelijk aan
de afdeling sales te denken.
Als ik van de afdeling sales was geweest dan had ik hem wel een aanbieding per PM gestuurd, of had ik wel elke week een aanbieding op het forum geplemd (:sorcerer:).

Gelet op het feit dat van de 2010 posts op dit forum max. 5 posts een aanbieding bevatten bevestigen mijn 2 bovenstaande regels.
Daarnaast slaat je opmerking nergens op, want dan mag er in geen enkel topic waar advies wordt gevraagd meer het woord "dedicated server, colocatie, monitoring, vps of webhosting" genoemd worden..

:chinese:

westerp
19/10/08, 19:42
Volgens mij mist u de smiley zoals ik al eerder vermelde.
Een smiley met een knipoog betekent dan ook 'knipoog'

Nu duidelijk?

Noordwest
20/10/08, 02:24
Ik vrees dat ik te vroeg gejuicht heb. Wanneer ik ingelogd blijf in een shell en processen blijf uitvoeren, gebeurt er niks. Wanneer ik uitlog en de server verder even helemaal met rust laat doet het probleem zich na een tijdje voor. Ik krijg de volgende error als ik probeer in te loggen via ssh

$ ssh user@url.com
ssh: connect to host url.com port 22: Operation timed out

DutchTSE
20/10/08, 10:20
Ik vrees dat ik te vroeg gejuicht heb. Wanneer ik ingelogd blijf in een shell en processen blijf uitvoeren, gebeurt er niks. Wanneer ik uitlog en de server verder even helemaal met rust laat doet het probleem zich na een tijdje voor. Ik krijg de volgende error als ik probeer in te loggen via ssh
Doet het probleem zich een tijdje na het uitloggen voor, of zodra je bent uitgelogd kun je niet meer inloggen? En werken alle services die erop draaien wel nog als je niet meer kan inloggen?

westerp
20/10/08, 10:35
het begint nu wel spannend en uitdagend te worden. Uitloggen en de doos
hangt zichzelf op, ingelogd blijven en hij doet braaf.

DutchTSE
20/10/08, 10:47
het begint nu wel spannend en uitdagend te worden. Uitloggen en de doos
hangt zichzelf op, ingelogd blijven en hij doet braaf.
Of inloggen, en het valt niet op dat je SSH uitvalt omdat je al een sessie hebt ;)

westerp
20/10/08, 10:50
True, maar dan is er iets met sshd aan de hand. Als het een te hoge load is
o.i.d. waardoor hij onbereikbaar is dan zou je dat in de open sessie moeten merken.

Misschien tijd voor een rootkit checker ;)

Noordwest
20/10/08, 12:09
Doet het probleem zich een tijdje na het uitloggen voor, of zodra je bent uitgelogd kun je niet meer inloggen? En werken alle services die erop draaien wel nog als je niet meer kan inloggen?

Het duurt eventjes voordat het probleem zich voor doet en geen enkele service werkt meer. Pingen geeft ook geen response.

Zou het ook een foute dns instelling kunnen zijn?

westerp
20/10/08, 12:48
dns doet het of doet het niet, als hij het ene moment resolved en het andere
niet dat zou hij je hoe dan ook toegang moeten verlenen. Duurt dan wel
even wat langer i.v.m. een niet werkende reverse lookup maar verder moet
dat niets uitmaken.

Noordwest
21/10/08, 01:01
True, maar dan is er iets met sshd aan de hand. Als het een te hoge load is
o.i.d. waardoor hij onbereikbaar is dan zou je dat in de open sessie moeten merken.

Misschien tijd voor een rootkit checker ;)

rkhunter en chkrootkit geven allebei geen zorgwekkende output. Iemand nog ideeen verder:huh:

westerp
21/10/08, 01:02
Tjah, geef me dan maar een shell met sudo zou ik bijna zeggen :)

Noordwest
26/10/08, 11:58
Kon het probleem niet vinden dus heb nu opnieuw debian eroverheen laten knallen. draait nu weer als een zonnetje ;-)