Bekijk Volledige Versie : Monitoren servers
JMDHosting
19/01/09, 11:35
Beste leden,
Ik was wel eens benieuwd hoe jullie eigenlijk de servers monitoren. Zelf hebben wij een eigen systeem gemaakt waarbij o.a. serverload, geheugen en gebruikers te zien zijn. Daarnaast slaan wij alle statistieken op en zijn ze opvraagbaar als grafiek. Bij bijvoorbeeld hoge load krijgt de beheerder een SMS en e-mail.
Hoe doen jullie dit?
Met vriendelijke groeten,
Joep Dohmen
http://www.nagios.org/ :)
Zelf gemaakt en in samenwerking met Mollie (Afhandeling SMSjes)
Hang vanaf wat je wilt monitoren natuurlijk.
Voor servers met webservices die extern bereikbaar zijn (http, ftp e.d.) is HyperSpin zeer handig, stabiel en gunstig geprijsd.
Voor interne applicaties die niet via het web te bereiken zijn of niet hoster gericht zijn (AD), is ManageEngine Applications Manager zeer handig. Goede ervaringen hiermee.
Voor netwerk bandbreedte (en tegenwoordig ook bijvoorbeeld netwerk hardware) is PRTG Network Monitor een aanrader.
Uiteraard kun je ook kiezen voor een Nagios oplossing e.d. Maar dan moet je het zelf gaan implenteren.
JMDHosting
19/01/09, 11:55
Oke. Ik begrijp dat veel hosters dus toch kiezen voor bestaande software, en niet zelf software schrijven. Wij hebben hier bewust voor gekozen, omdat je zo precies kan tonen wat je wilt, en niet een hoop overbodige gegevens krijgt.
Hier ook Nagios in combinatie met 2 eigen panels waarvan er 1 checked vanaf 2 netwerken. Pas wanneer een check 3 x down geeft op beide netwerken komt de sms en email
eXtreme Service
19/01/09, 12:24
Wij maken gebruik van groundwork voor alles te monitoren. Daarnaast hebben wij nog een eigen systeem voor het melden van storingen via SMS en Email.
Zabbix in combinatie met Mollie voor SMS.
JMDHosting
19/01/09, 13:31
Nagios is zo te zien niet beschikbaar voor CentOS?
Nagios :)
Nagios is leuk, makkelijk te installeren.
Maar dan komt het configureren, dit is niet zomaar 1,2,3 gedaan!
Maar zeker wel een aanrader!
eXtreme Service
19/01/09, 13:58
Nagios is zo te zien niet beschikbaar voor CentOS?
Waarom niet ? Wij gebruiken GroundWork (met Nagios inbegrepen) en wij hebben deze gewoon draaien op een CentOS server.
Nagios draait prima op CentOS, van het weekend nog geinstalleerd.
Verder gebruiken we bij ons Nagios voor monitoring en Cacti voor performance/bandbreedte grafieken. Cacti exporteert zijn bandbreedte grafieken elke 5 minuten via FTP naar ons klantenpaneel waar de klanten hun dataverkeer stats kunnen bekijken.
JMDHosting
19/01/09, 15:19
Nagios krijg ik vreemd genoeg niet geïnstalleerd. Dat hele install.sh lijkt niet te werken. Zal wel aan mij liggen dan. Poging 2 proberen.
Nagios krijg ik vreemd genoeg niet geïnstalleerd. Dat hele install.sh lijkt niet te werken. Zal wel aan mij liggen dan. Poging 2 proberen.
./configure --help
Nagios krijg ik vreemd genoeg niet geïnstalleerd. Dat hele install.sh lijkt niet te werken. Zal wel aan mij liggen dan. Poging 2 proberen.
configure met wat opties, make en make install :)
Foutmelding even posten kan ook helpen ;)
JMDHosting
19/01/09, 16:18
Hij zegt dat hij /usr/local/nagios zou moeten hebben aangemaakt. Dit is echter dus niet het geval.
Hij zegt dat hij /usr/local/nagios zou moeten hebben aangemaakt. Dit is echter dus niet het geval.
Dan klopt er blijkbaar iets niet in het install.sh scriptje :) Je kunt het install script ook eens openen en kijken welke acties het uitvoert, en deze desnoods handmatig uitvoeren, heb je er wat meer controle over.
Maar als ik eerlijk ben: als je de installatie al niet voor elkaar krijgt dan gaat de configuratie zeker een hel voor je worden.. kies voor een bestaande oplossing of stop er helemaal mee is mijn advies ;)
Wij hebben een eigenbouw custom panel
Hier staan alle debiteuren die een colo en dedi hebben ook in,
hier word in gemonitord op vrijwel alle bereikbare poorten.
+ alle server informatie, en randinformatie (notities, sla, welk rack, welke toegewezen ips etc)
Indat zelfde panel lezen we ook stroom verbruik en traffic uit en kan de colo/dedi klant ook inloggen om dit zelf ook in te zien.
Wij krijgen email, + sms als er iets fout gaat
Klant kan dit in zijn inlog ook instellen dat hij ook op de hoogte gesteld wilt worden via email / sms (dat laatste kopen ze dan via ideal credits voor in)
Wij werken dan weer met targetpay ipv mollie als partner hierin.
Nagios, cacti, en Mollie.
(@M, stap nu in de auto)
Zabbix draait al jaren prima hier.
'k Ben ook aan het testen met System Center Operations Manager maar dat is nog niet zo eenvoudig. ;)
JMDHosting
19/01/09, 18:51
Wij zijn zelf bezig om ook het panel uit te breiden. Zou er interesse zijn in een (Nederlands) monitor-systeem? Wellicht kan ik deze, samen met een andere partij, verder ontwikkelen en op licensiebasis uitgeven.
pingdom.com (http://www.pingdom.com) is ook de moeite waard om eens te bekijken.
Uiteraard is een eigen systeem, vooral bij meerdere servers, een stuk goedkoper.
Wij zijn zelf bezig om ook het panel uit te breiden. Zou er interesse zijn in een (Nederlands) monitor-systeem? Wellicht kan ik deze, samen met een andere partij, verder ontwikkelen en op licensiebasis uitgeven.
wij hebben een dergelijk programma online staan in beta
diview.net
Ramon Fincken
19/01/09, 19:37
Wij gebruiken het panel van Deziweb ( 2 geografisch gescheiden servers, double check, failback upstelling, etc ... )
<knip>
Apoc edit: Dit is geen advertentieforum.
JMDHosting
20/01/09, 12:04
Ik wil het wel eens uitproberen op een server. Pingdom ziet er best goed uit, alleen ga ik niet voor een systeem betalen als ik mijn eigen software gratis kan gebruiken.
Wij gebruiken het panel van Deziweb ( 2 geografisch gescheiden servers, double check, failback upstelling, etc ... )
Had deze vraag ook al aan Marcel gevraagd:
Hoe controleert jullie monitoring systeem? Door middel van poort verbinding? Houd jullie systeem er rekening mee dat wanneer Apache wel draait maar verkeerd geconfigureerd is het alsnog niet werkt? (zoals Nagios doet, controleren of er een HTTP 200 of HTTP 500 wordt terug gegeven).
Ramon Fincken
20/01/09, 12:10
Wij gebruiken curl, en vinden een ip+poort combi "online" als we een 200 301 of 302 terugkrijgen.
die 500 is opzich wel aardig, maar dat treedt bij mijn weten op als je htaccess verkeerd qua syntax is, en om dan te zeggen dat je site 'online' is ??
Wij gebruiken curl, en vinden een ip+poort combi "online" als we een 200 301 of 302 terugkrijgen.
die 500 is opzich wel aardig, maar dat treedt bij mijn weten op als je htaccess verkeerd qua syntax is, en om dan te zeggen dat je site 'online' is ??
Ja sorry, was iets te kort door de bocht natuurlijk. 500 was een voorbeeld maar houd wel in dat het echt niet werkt (500 ontstaat ook wanneer modsecurity iets blokkeert enz). Wanneer je enkel een port check doet zal hij aangeven dat de website online is, terwijl Nagios zou zeggen dat hij critical is (want site is niet online).
Nagios voor monitoring hier. Daarnaast cacti voor graphs en monit voor dingen die durven crashen en dan gewoon herstart moeten worden, of voor processen die mem lekken.
JMDHosting
21/01/09, 10:58
Ik neem aan dat jullie (sowieso Nagios-gebruikers), ook alle services checken? Daarnaast zitten wij hier enigsinds in een twijfel: is het verstandig om bij een service die niet (meer) werkt, deze automatisch te laten herstarten? Dit heeft immers zo zijn voordelen, maar het kan natuurlijk ook negatief uitpakken.
Ik neem aan dat jullie (sowieso Nagios-gebruikers), ook alle services checken? Daarnaast zitten wij hier enigsinds in een twijfel: is het verstandig om bij een service die niet (meer) werkt, deze automatisch te laten herstarten? Dit heeft immers zo zijn voordelen, maar het kan natuurlijk ook negatief uitpakken.
Ik heb hier onderzoek naar gedaan voor het monitoring systeem van een grote ICT dienstverlener.. bij hun leverde het absoluut voordelen (besparing van tijd) op mits goed geimplementeerd.
Sowieso kun je services als snmp, cron, ntp (tijdsynchronisatie), noem maar op makkelijk vanzelf laten herstarten via event-handlers.. het automatisch legen van een bepaalde harde schijf partitie heeft wat meer aandacht nodig (voorbeeld: logging partitie, event handler laat scriptje draaien dat alle logfiles ouder dan 3 dagen zipt en wegschrijft in een bepaalde map).
Als je minder dan 50 servers in beheer hebt dan kun je er wel voor kiezen om het gewoon zelf te starten, bedrijf waar ik onderzoek voor heb gedaan telde 3500 servers.
Edit:
Het automatisch laten starten houd in:
Controleer service, indien 2x kritiek: start hem opnieuw
Is hij de keer erna (1 minuut later) nog kritiek, stuur dan alsnog een melding (dan is er ook echt wat aan de hand).
Nadelen hiervan zijn de verminderde controle en het risico dat de service elke 5 minuten uitvalt en maar herstart blijft worden zonder dat er een melding verschijnt.
JMDHosting
21/01/09, 12:11
Wat je als laatste noemde is precies waar ik dus bang voor ben. Ik kan niet het risico lopen dat blijkt dat er een service om de 5 minuten uit ligt, en door het herstarten je nooit een melding krijgt van het probleem. Maar als ik je goed begrijp kan het, mits goed geconfigureerd, wel veel voordelen opleveren.
Ik ga het anders maar eens testen op een paar servers.