PDA

Bekijk Volledige Versie : Vastlopen server !!!!?



Judokes
01/05/06, 07:32
Ik heb een dedicated server bij Flexservers. Zeer regelmatig loopt deze server vast (2x per week). Ik krijg dan een SMS van hyperspin en dien de server te resetten met APC.

Bij Flexservers hebben ze hier geen oplossing voor. Ze bieden aan om de hardware te controleren of de boel opnieuw te installeren. Beiden zijn op mijn kosten aangezien het een rootserver is.

Zijn er geen andere tools/mogelijkheden om na te gaan wat er op het moment van vastlopen op de server gebeurde? Hij kan toch niet uit zichzelf vastlopen?

Het is echt waardeloos zo, ik kan niet even weg of de server loopt weer vast. Het vertrouwen in deze server is weg en bij Flexservers geen hulp.

Wat kan doen????

smurf
01/05/06, 07:33
Het kan ook zijn dat er een probleem is met een programma die je draaien heft of dat de server gewoon niet meer reageert door een te hoge load. Bekijk je logs eens en kijk wat die zeggen.

Judokes
01/05/06, 07:36
Welk log is dat dan waar ik kan zien wat de load van de server is en welk programma er draait. IK ben niet zo erg thuis op Linux helaas.

Waar kan ik bijv. zien welke programma's er allemaal op de achtergrond draaien zodat ik deze uit kan zetten.

bami82
01/05/06, 07:52
Om log te bekijken, log in via ssh en dan:

#cat /var/messages

Om je load te bekijken kan je w gebruiken:

moon# w
7:51AM up 251 days, 2:37, 1 user, load averages: 0.41, 0.22, 0.11
USER TTY FROM LOGIN@ IDLE WHAT
sander p0 203.222.201.5 6:56AM - w


Om te kijken wat er allemaal draait:

#ps -aux

Om processen af te sluiten kijk naar het PID in ps -aux en dan:

#kill -9 <PID> dus bv #kill -9 8372

Als je verder hulp nodig hebt, kan je me een pm sturen, wellicht dat ik je via msn kan helpen.

gjtje
01/05/06, 08:29
Als zij een dedicated server aanbieden is iets gerelateerd aan de hardware hun probleem. Dat jij de software vernaggelt en dat ze daarom de kosten van herinstallatie doorberekenen is logisch maar ze kunnen je moeilijk kwalijk nemen dat de hardware stuk gaat.

Je zou ook de temperatuur in de gaten kunnen houden, pakketten als lm_sensors kunnen deze prima uitlezen uit de bios.

Judokes
01/05/06, 09:34
We weten dus nog niet of het de hardware is. Ze willen de server offline halen en een hardware test gaan doen. Vinden ze niets krijg ik de rekening.
Op een andere forum een soortgelijk verhaal wat het geheugen bleek te zijn. De vraag is of een geheugen probleem met een test naar voren komt. En preventief vervangen zullen ze zeker niet doen.

MediaServe
01/05/06, 10:12
Bij Flexservers hebben ze hier geen oplossing voor. Ze bieden aan om de hardware te controleren of de boel opnieuw te installeren. Beiden zijn op mijn kosten aangezien het een rootserver is.Dat is natuurlijk belachelijk. Jij hebt gewoon recht op een goedlopend systeem, zolang ze dat niet leveren zijn ze in gebreke. Ik zou ook absoluut niet akkoord gaan met zo'n reactie.

wonko
01/05/06, 10:25
Hardware problemen moeten bij een dedicated server (managed of unmanaged) altijd door de leverancier opgelost worden, zonder meerkost. Wanneer het echter niet zeker is dat het de hardware is, kan het zijn dat een "onderzoekskost" gerekend wordt... Als dan blijkt dat de hardware tip-top in orde is, dan is het hardware onderzoek voor niets geweest, en moet het aan de software liggen. Bij het vinden van hardwarefouten kan de onderzoekskost dan wel vervallen...

Wees er dus zeker van dat het geen softwareprobleem is voor je hen vraagt de hardware te onderzoeken.

Zelf geef je ook aan weinig kennis te hebben van linux. Waarom neem je dan een unmanaged server?

crazycoder
01/05/06, 10:34
Dat is natuurlijk belachelijk. Jij hebt gewoon recht op een goedlopend systeem, zolang ze dat niet leveren zijn ze in gebreke. Ik zou ook absoluut niet akkoord gaan met zo'n reactie.
Als blijkt dat er niets mis is met de hardware dan is het een software aangelegenheid. In dat geval is het m.i. niet onredelijk dat TS de kosten van een eventueel onderzoek moet betalen.

Zie niet helemaal in wat daar voor belachelijks aan is. Mocht het een software aangelegenheid zijn dan kan het heel goed zijn dat de kosten van herinstallatie lager liggen dan de kosten van het opsporen van om het even welk probleem.

MediaServe
01/05/06, 10:49
Zie niet helemaal in wat daar voor belachelijks aan is. Mocht het een software aangelegenheid zijn dan kan het heel goed zijn dat de kosten van herinstallatie lager liggen dan de kosten van het opsporen van om het even welk probleem.Daar heb je inderdaad gelijk aan. Ik ging er vanuit dat dit probleem vanaf het begin al was. Als het een softwarefout is, dan is het inderdaad logisch dat een de leverancier hier niet verantwoordelijk voor is en een onderzoek geld kan kosten.

Judokes
01/05/06, 11:07
Het probleem is dat het bijna niet uit te sluiten is dat het om een software probleem gaat. Geen enkel log laat zien dat er iets de server vast laat lopen.
Dus zou de conclusie zijn dat het om de hardware gaat.

Het is een unmanaged server omdat alles via het Plesk console gedaan kan worden. Overige aanpassingen kan ik wel met Linux doen. Dit probleem gaat echter mijn pet te boven.

MediaServe
01/05/06, 11:24
Is het probleem altijd al geweest, of had je er ineens last van?

wonko
01/05/06, 11:27
Als de server vastgelopen is, heb je al eens gevraagd een console aan te sluiten om te zien wat de laatste melding juist is? Wat staat er in de logs voor de crash (messages, syslog, dmesg, ...)? Heb je monitoring van bvb de load, memgebruik,...

En een controlepaneel is een hulpmiddel, die "managed" uw server niet, het maakt bepaalde taken gemakkellijker...

dreamhost_nl
01/05/06, 11:43
Is er geen SIM of PRM op de server geïnstalleerd?
Dit zou een goede basis kunnen zijn om het probleem te vinden...

Judokes
01/05/06, 12:55
Het probleem is er niet altijd geweest, sinds een half jaar speelt dit nu.

En ja ik weet het, een console maakt bepaalde dingen alleen eenvoudiger.
Meer dan een console heb ik echter niet nodig. Updates en dergelijke kunnen via dit console gedaan worden. Overigens heeft Flexservers helemaal geen maneged meer dus kan ik niet anders.

Overigens geen SIM of PRM geinstalleerd.
In Messages geen vreemde meldingen tot het moment van vastlopen.

Hoe kan ik de load en memorygebruik monitoren eigenlijk?

rvessem
01/05/06, 13:18
was toch al aangegeven?

of gewoon #top

wonko
01/05/06, 14:08
ofwel remote door bvb snmp op de server te installeren, en dan op een (andere) machine deze waarden uit te lezen met bvb cacti, ofwel op het moment zelf met cli tools als top, ps, free, ... allemaal basiskennis bij een linux server...

En als het fout gaat, moet je wel terugvallen op de console, want dan zal een controlepaneel je geen moer helpen. Logfiles doorzoeken, processen in de gaten houden, gedrag van systeem bekijken... allemaal cli zaken...

Judokes
01/05/06, 14:42
was toch al aangegeven?

of gewoon #top

Is de load op dit moment, het gaat om history.

rvessem
02/05/06, 06:31
Maar als je niets kan vinden in de logfiles ect, misschien kun je top gewoon een tijdje open laten staan je zegt dat het meer maal per week voorkomt, mits je putty niet automatisch verbreekt na een x tijd. dan heb je toch het laatst aktuele scherm met de laats aktuele waardes en processen op je scherm staan als je server er mee stopt...

DiedX
02/05/06, 22:55
Het probleem is er niet altijd geweest, sinds een half jaar

Judokes,

Het is al eerder gemeld: we gaan uit van softwareproblemen, tenzij anders aangegeven. Blijkt het hardware te zijn, dan vervangen we dat kosteloos, ook eventuele kosten voor controle hiervoor vervallen dan uiteraard.

Alle servers welke +- 12 maanden opgehangen zijn zijn gecheckt met tools om o.a. geheugen en moederborden te testen. Is je server jonger, dan denk ik dat je het moet zoeken in software.

HET commando om problemen te achterhalen is dmesg. Daarin vind je veel problemen met harde-schijven.

De vragen:

- als je server plat gaat, is hij dan nog wel te pingen? (kernel panic / softwareprobleem?)
- hoe oud is je server? (zie boven, tevens memoryproblemen?)
- gaat de server plat op bepaalde momenten, of volledig at random? (load?)

Verder is alles al gezegd. Ik raad je sterk aan om Zabbix te installeren, zodat je de load op dat moment kan bekijken. Je hebt wat tools (waar ik nu natuurlijk weer niet op kom :/) om op geregelde momenten te checken en te loggen...

Succes!

Judokes
03/05/06, 14:29
Ook na de geheugen vervanging hetzelfde probleem helaas, Diederik.
Zojuist weer een hangup gehad en moeten rebooten!

Nu zijn er voor mij nog maar 2 opties: of door flexservers naar de software laten kijken of switchen naar een partij waar ik een managed server ga nemen. Kijk, updaten via Plesk en wat eenvoudige Linux wijzigingen geen probleem maar dit is gaat voor mij te ver. Ook de experts hebben tot nu toe geen oplossing kunnen vinden, dus het zal mij zeker niet gaan lukken.
Een managed server is voor mij de beste oplossing. Met terugkomende problemen ben ik dan het beste geholpen.
Bedankt voor jullie hulp in ieder geval.

DeHostingMan
03/05/06, 15:34
Beter een andere hoster zoeken,



Ik heb een dedicated server bij Flexservers. Zeer regelmatig loopt deze server vast (2x per week). Ik krijg dan een SMS van hyperspin en dien de server te resetten met APC.

Bij Flexservers hebben ze hier geen oplossing voor. Ze bieden aan om de hardware te controleren of de boel opnieuw te installeren. Beiden zijn op mijn kosten aangezien het een rootserver is.

Zijn er geen andere tools/mogelijkheden om na te gaan wat er op het moment van vastlopen op de server gebeurde? Hij kan toch niet uit zichzelf vastlopen?

Het is echt waardeloos zo, ik kan niet even weg of de server loopt weer vast. Het vertrouwen in deze server is weg en bij Flexservers geen hulp.

Wat kan doen????

tripple
03/05/06, 16:59
Ooit had ik ook plots onverwachte vastlopers. Er zat geen systeem in wanneer en er was weinig terug te vinden in de logbestanden. Wie weet is het probleem hetzelfde.

De oorzaak was een flash intro pagina. Op het einde van de intro moest de homepage geladen worden. Er zat echter een foutje in de action script.

onEnterFrame = function(){
getURL("http://www.mysite.com/home.html");
}

De flash film had een framerate van 12 fps. Trage internetverbindingen konden home.html niet vlug genoeg laden waardoor home.html 12 maal per seconde werd opgevraagd. Dit soms minuten aan 1 stuk.

Het juiste script moest zijn:
getURL("http://www.mysite.com/home.html");

Te simpel om waar te zijn. Toch kostte het me aardig wat moeite om de oorzaak te vinden.

Judokes
05/05/06, 11:17
Ik krijg nu de volgende meldingen dagelijk: hda: dma_intr: error

Zou op een dying hd kunnen wijzen volgens Flexservers.
Wat is de gangbare procedure in zo'n geval.
IK betaal voor een backup. Ze kunnen toch gewoon de schijf vervangen
en de boel terugzetten zoals het was?

gasemans
05/05/06, 12:28
Het is een dedicated server dus die moet de HD vervangen
En ik ga er vanuit dat ze dan eerst een exacte copy maken van je HD en die op de nieuwe zet

Judokes
05/05/06, 14:06
Dat doen ze dus niet!
Ik moet zelf voor een backup zorgen en die zelf restoren.

wonko
05/05/06, 19:04
Lees de volgende maal je contract voor je het tekent, en overweeg om iets meer geld uit te geven voor kwaliteit en support... Het kan ietwat kort door de bocht zijn, maar het is een feit...

Judokes
06/05/06, 08:18
Wonko, helemaal mee eens.
Zelfs met een schijfprobleem tot nu toe geen hulp.
Het lijkt echt alsof ze het belang niet zien dat die server blijft draaien.
Als een server langere tijd down is zou voor mij als klein bedrijf funest zijn!

Aangezien ik wil uitbreiden en er 2 servers bij ga nemen een andere partij gevonden. Inderdaad iets duurder maar een goed gevoel en
duidelijke afspraken over support.

Bedankt voor het meedenken allen.