PDA

Bekijk Volledige Versie : Monitoring UNIX servers



ju5t
31/03/06, 16:32
In hoeverre monitoren jullie behalve uptime andere punten van jullie servers? Punten waar ik aan denk zijn gebruik van schijfruimte, geheugen en andere zaken.

Het gaat hier om een 30-tal Oracle servers, de databases zelf worden al gemonitored maar we willen meer informatie over het resource gebruik van de servers. De tool die dit mogelijk moet maken zal extern op een centrale locatie draaien en alle machines monitoren.

Het zal in de toekomst om meer machines gaan, dus enige schaalbaarheid is wel gewenst. De doorloop snelheid van een monitor run moet redelijk haalbaar zijn en geen lange tijd duren, dit natuurlijk in verband met de accuraatheid van de tool.

WebBizz
31/03/06, 16:52
Misschien is Zabbix iets voor je?
http://www.zabbix.org/

ju5t
31/03/06, 17:43
Het gaat me meer om de manieren waarop de data uitgelezen kan worden, aangezien het de bedoeling is dit inhouse te gaan ontwikkelen.

Windows gebruikt WMI, wat is een vergelijkbare oplossing voor UNIX omgevingen? Liefst standaard aanwezig natuurlijk.

ErikM
31/03/06, 18:25
snmp?

dee2005
31/03/06, 18:51
In hoeverre monitoren jullie behalve uptime andere punten van jullie servers? Punten waar ik aan denk zijn gebruik van schijfruimte, geheugen en andere zaken.

Met Oracle Enterprise Manager / Grid Control is het ook mogelijk om info over het systeem zelf te monitoren. Maar dat terzijde.

Nagios is een mooie tool voor Linux en maakt gebruik van SNMP.

Als je toevallig Dell servers hebt: Dell heeft zelf de Openmanage software, die ook weer gebruik maakt van SNMP.

Waarom heb je ervoor gekozen om zo'n tool zelf te ontwikkelen?


Misschien is Zabbix iets voor je?
http://www.zabbix.org/

goede link, ziet er goed uit. thx! als je nagios kent: in hoeverre is dit anders dan nagios?

wonko
31/03/06, 19:06
snmp en nagios. Meer moet je niet hebben. wij monitoren ongeveer alles wat kan gemonitord worden (diskspace, load, geheugen, beschikbaarheid van services...) met waarschuwing via SMS en/of mail in geval van problemen (afhankelijk van de ernst van het probleem/machine)...

Wido
31/03/06, 19:16
Sinds een weekje ook Zabbix voor http://noc.pcextreme.nl/

Ideaal, kan je perfecte triggers mee maken. icm de Agent kan je echt álles monitoren.

Ook kan je zelfs bekijken of je bandbreedte gebruik op een bepaalde switchpoort niet ineens met 50% toeneemt.

Icheb
31/03/06, 19:16
Nagios, NRPE en SNMP voor hardware waar geen NRPE op kan :D

GlobalServe
31/03/06, 19:44
HP Openview gebruiken wij...

ju5t
02/04/06, 11:57
Met Oracle Enterprise Manager / Grid Control is het ook mogelijk om info over het systeem zelf te monitoren. Maar dat terzijde.

Nagios is een mooie tool voor Linux en maakt gebruik van SNMP.

Als je toevallig Dell servers hebt: Dell heeft zelf de Openmanage software, die ook weer gebruik maakt van SNMP.

Waarom heb je ervoor gekozen om zo'n tool zelf te ontwikkelen?


Ik ben zelf totaal niet bekend met Oracle, maar het is ook iets wat we in samenspraak met de DBA's gaan ontwikkelen, meteen even vragen hoe of wat met Oracle Enterprise Manager dan.

We willen monitoring zelf in de hand hebben, zonder afhankelijk te zijn van third-party tools. Vandaar dat we zelf gaan ontwikkelen.

Waarschijnlijk dan toch maar gebruik maken van SNMP.

wonko
02/04/06, 13:16
Waarom het wiel heruitvinden/herimplementeren. Neem voor het monitoren van de machines/hardware de zaken die bestaan (snmpd op OS installeren en uitlezen, snmp uitlezen op switches, indien Dell Openmanage installeren en gebruiken via snmp...). Oracle zelf zal wel agents hebben die via de snmp server kunnen gelink worden, en dan heb je een mooie uniforme oplossing.

Gebruik dan iets als cacti om grafieken te maken, en nagios om monitoring te doen. Het voordeel is dat nagios en cacti grondig gebruikt en getest zijn, en dus normaal vrij foutloos zullen werken. Eigen gemaakte tools, die enkel op uw systemen getest worden, kunnen misschien wel eens meer fouten bevatten, of zaken waar geen rekening mee gehouden werd...

ju5t
02/04/06, 15:17
Waarom het wiel heruitvinden/herimplementeren. Neem voor het monitoren van de machines/hardware de zaken die bestaan (snmpd op OS installeren en uitlezen, snmp uitlezen op switches, indien Dell Openmanage installeren en gebruiken via snmp...). Oracle zelf zal wel agents hebben die via de snmp server kunnen gelink worden, en dan heb je een mooie uniforme oplossing.

Gebruik dan iets als cacti om grafieken te maken, en nagios om monitoring te doen. Het voordeel is dat nagios en cacti grondig gebruikt en getest zijn, en dus normaal vrij foutloos zullen werken. Eigen gemaakte tools, die enkel op uw systemen getest worden, kunnen misschien wel eens meer fouten bevatten, of zaken waar geen rekening mee gehouden werd...

We zijn niet op zoek naar bestaande oplossingen, slechts manieren om het uit te lezen. Het is natuurlijk prachtig dat er een tool bestaat als Nagios, maar hier zijn wij niet naar op zoek. Uiteindelijk zullen we waarschijnlijk over gaan op een complete tool die zowel onze servers als desktops van het personeel kan monitoren. Laatst genoemde is reeds ontwikkeld maar is niet in te zetten op UNIX omgevingen. Daarnaast is de tool voor desktops niet realtime, dit was voor ons niet mogelijk zonder agents op de desktops vanwege het aantal machines dat gemonitored wordt.

Waar het om gaat is de manier van uitlezen. In hoeverre zal het uitlezen van data het resource gebruik beinvloeden? Natuurlijk is dit van veel punten afhankelijk, maar hoe is dit in de hand te houden? Is monitoren door middel van ssh een optie indien snmp niet beschikbaar is? Zal dit het resource gebruik ernstig verstoren indien dit vaker dan een x aantal keer per minuut gebeurd? Dit laatste geld voor beide.

Nogmaals, we zijn niet op zoek naar bestaande tools.

dee2005
02/04/06, 16:15
desktops niet realtime, dit was voor ons niet mogelijk zonder agents op de desktops vanwege het aantal machines dat gemonitored wordt.


SNMP kan je ook op windows clients draaien. Altiris biedt ook een scala aan producten voor monitoring van desktops.

wonko
02/04/06, 17:59
Waar het om gaat is de manier van uitlezen. In hoeverre zal het uitlezen van data het resource gebruik beinvloeden? Natuurlijk is dit van veel punten afhankelijk, maar hoe is dit in de hand te houden? Is monitoren door middel van ssh een optie indien snmp niet beschikbaar is? Zal dit het resource gebruik ernstig verstoren indien dit vaker dan een x aantal keer per minuut gebeurd? Dit laatste geld voor beide.

Hangt af van wat er moet gebeuren om een bepaalde check te doen. Als het nu via snmp, ssh, of iets anders gebeurt, de load die het zal genereren is enkel afhankelijk van wat er juist gemonitord moet worden. Als het gewoon de timestamp van een bepaalde file controleren is, dan zal dit snel gaan. Moet echter een ongelooflijk ingewikkelde query uitgevoerd worden op een extreem grote databank, dan zal dit traag zijn en load veroorzaken, op welke manier je het ook doet.

In een intern netwerk zou ik hoe dan ook altijd gaan voor snmp, aangezien het meestal door elke monitoring tool ondersteund wordt, en je uiteindelijk met een uniforme oplossing komt te zitten, wat handig is. SSH accounts opzetten schaalt niet echt goed, en door de handshake en encryptie zal je nog wat load toevoegen aan je systeem...

Hoe je het in de hand houdt, is volledig aan jou... Ofwel monitor je minder, ofwel zorg je dat de monitoring minder belastend is voor de machine zelf...

ju5t
02/04/06, 20:14
SNMP kan je ook op windows clients draaien. Altiris biedt ook een scala aan producten voor monitoring van desktops.

Het gaat hier om ruim 900 machines, WMI wordt default ondersteund door onze mainbuild. Zou SNMP extra voordeel opleveren? WMI is namelijk niet altijd even snel. Daarentegen zijn desktops niet zo kritiek, dus maakt dat verder ook niet bijzonder veel uit.


In een intern netwerk zou ik hoe dan ook altijd gaan voor snmp, aangezien het meestal door elke monitoring tool ondersteund wordt, en je uiteindelijk met een uniforme oplossing komt te zitten, wat handig is. SSH accounts opzetten schaalt niet echt goed, en door de handshake en encryptie zal je nog wat load toevoegen aan je systeem...

Intern is nogal breed hier. Verder zal het voor nu echt gaan om basic informatie als harddisk gebruik en dergelijke. Ik neem aan dat SNMP geinstalleerd is op de servers, maar ik heb verder nog niet gesproken met de persoon die hiervoor verantwoordelijk is.

In ieder geval bedankt voor de input zover.

rayden
02/04/06, 20:19
Op dit moment gebruiken we nagios+cacti, cacti is dmv van Plugins e.d. weer aan onze nagios en switch gekoppelt. Nagios remote data uitlezen doen we via nagios-statd of NPRE of SNMP.

Het werkt helemaal geweldig, Nagios is by far dé tool om je netwerk te monitoren IMHO.

dee2005
02/04/06, 20:37
Het gaat hier om ruim 900 machines, WMI wordt default ondersteund door onze mainbuild. Zou SNMP extra voordeel opleveren? WMI is namelijk niet altijd even snel. Daarentegen zijn desktops niet zo kritiek, dus maakt dat verder ook niet bijzonder veel uit.


Ik heb geen ervaring met WMI dus kan daar weinig over zeggen helaas.