PDA

Bekijk Volledige Versie : Noodplan bij harware failture.



Mr.Alien
17/01/06, 18:34
Ik ben van plan om mijn eigen server laten coloceren in het Telecity datacenter te Amsterdam maar vraag mij af welke voorzorgs maatregen ik moet nemen (of jullie nemen) indien er iets mis gaat met de hardware. Een bijkomstig probleem is dat Amsterdam ong. 2,5 rijden is van hier en dat ik niet altijd beschikbaar ben (andere verplichtingen). Ik kan dus niet op iedermoment deze problemen even zelf gaan oplossen. Doorom ben ik ook op zoek naar bedrijven waarop ik in deze gevallen kan rekenen( zie thread http://www.webhostingtalk.nl/showthread.php?s=&threadid=85134).

Mijn vraag is dus welke andere maatregelen jullie nog nemen. Hebben jullie altijd reserver onderdelen liggen en van welke? Wat heeft het meeste kans om kapot te gaan? Wat doe je als de server bijvooreel juist voor het weekend stuk gaat? Waar haal je dan nog de nodige vervangstukken?

TiMMiEJ
17/01/06, 18:49
Hardware problemen je voorkomen. Hoe dan? Voordat je ze in het DC zet, test je de hardeschijf en het geheugen. En zet je je machine in duurtest.

De hardeschijf heeft de meeste kans om kapot te gaan (ivm draaiende onderdelen). Maar tis aan te raden om 2 hd's in je machinen te plaatsen en die dan in een RAID-1 opstelling te laten draaien. Als dan een hd crached, loopt je machine gewoon door. Voor een RAID-1 opstelling zou ik wel SATA of SCSI gebruiken, want met IDE heb je grote kans dat je IDE bus blijft hangen als een schijf crashed. Waardoor je alsnog naar Amsterdam moet!

webster
17/01/06, 19:21
Als blijkt dat het gaat om een echte defecte server, dan hebben wij altijd een spare server beschikbaar. Daarop kunnen we binnen ongeveer een half uur tot een uur een complete restore van het gecrashte systeem laten terugplaatsen. We schakelen de defecte server uit en reizen dan, als het ons uitkomt af naar het DC.
Pas daar kun je de diagnose stellen. De meest gevoelige onderdelen (de HHD´s) staan in RAID 1 of 5 en hebben we altijd op voorraad om deze op dat moment te vervangen. Is het bijvoorbeeld de RAID controler dan hebben we die meestal ook nog wel een liggen. Al is het voor een tijdelijke spare server op te zetten.

lifeforms
17/01/06, 20:02
Gebruik maken van software of hardware RAID om problemen met een enkele disk te omzeilen.

Nachtelijke netwerkbackup om eventuele problemen met de RAID of software te omzeilen. Oefen niet alleen een backup, maar ook een restore zodat je snel kunt restoren mocht het nodig zijn.

Een server extra plaatsen, en de harde schijven van een kapotte server daarin laten plaatsen wanneer de hardware faalt. Je bent dan binnen een half uur weer up.

Capaciteit inbouwen in je organisatie zodat er ruimte is om snel te reageren als bovenstaande opties niet helpen. Want er kan altijd een dag zijn waarop verschillende ongelukken samenkomen. Als je dit niet zelf kunt doen, dan ben je eigenlijk aan je klanten verplicht om hier iets anders op te bedenken (bijv. iemand inhuren op uurbasis).

Frangkje
18/01/06, 00:52
Misschien een rare vraag, maar waarom zou je een server waar je sterk afhankelijk van bent (neem ik aan door je andere post) op 2,5 uur rijden vanaf je vestigingsplaats neerhangen?

crazycoder
18/01/06, 12:33
Origineel geplaatst door Frangkje
Misschien een rare vraag, maar waarom zou je een server waar je sterk afhankelijk van bent (neem ik aan door je andere post) op 2,5 uur rijden vanaf je vestigingsplaats neerhangen?
Omdat er dichterbij geen geschikte locatie te vinden is? Of omdat de geschikte locaties die wel dichterbij zijn onacceptabele prijzen berekenen.

Frangkje
18/01/06, 12:46
Het eerste argument lijkt me onzin, er zijn vrijwel overal in Nederland binnen een half uur rijden datacenters te vinden.

Het 2e argument zou inderdaad een reden kunnen zijn, maar er kunnen nog tientallen andere argumenten te bedenken zijn, vandaar dat ik het me afvroeg :)

Randy
18/01/06, 13:17
Binnen 1/2 uur niet, maar binnen een uur zeker.

Hoe gaan wij te werk:
De hardware van onze dedicated servers is bekend en we hebben dus altijd spareparts op voorraad liggen in het DC. Daarnaast ligt er een barebone die (nadat de disks omgezet zijn) binnen een uur na melding weer online kan. Tussentijds wordt de huidige server (tijdens kantooruren) gerepareerd, backups worden teruggezet, opnieuw een duurproef (24 uur de oven in) en kan deze weer online geplaatst worden.

Voor colocatie geldt dat klanten zelf verantwoordelijk zijn voor backups. Wij bieden hen hier wel ruimte voor aan. Hardware wordt enkel in opdracht van de klant vervangen en ook aan hen gefactureerd. Tijdens kantooruren worden hier geen uurlonen voor gerekend. Remote-hands zijn bij de prijs in begrepen.
Daarnaast kunnen ook zij gebruik maken van een barebone indien het bijvoorbeeld een defect is waar geen vervangende hardware voor is. Immers, wij weten niet wat de klanten plaatsen, alhoewel vragen we hier wel altijd naar.

Het gaat er altijd om om juist en tijdig met een oplossing te komen, die financieel aantrekkelijk is voor de klant. Tijdens kantooruren bieden we hiervoor - gratis - remote hands aan. Dit deels ter compensatie daar we geen accescards verstrekken bij minder dan 1/1 rack.
Om dit te realiseren is er dus altijd hardware op voorraad volgens een voorraadlijst.

Mr.Alien
18/01/06, 14:19
Alvast heel erg bedankt voor jullie reacties.

De rede waarom ik mijn servers in Amsterdam ga plaatsen is vooral omwille van de prijs per Tb trafiek. Een van onze server heeft momenteel 6 TB per maand nodig en dit is bij vele onbetaalbaar.

Probleem is dat wij momenteel nog meer 2 servers nodig hebben en deze zijn dan nog verschillende setups. Een reserver barebone hebben klaarliggen zou de kostprijs bijna verdubbelen. RAID systeem en redundate voeding zijn wel al voorzien voor de belangrijkste server.

Kunnen jullie ook eens vertellen wat jullie doen als duurproef. Laten jullie dan betaalde scrips voor een tijdje de server zwaar belasten?

Graag zou ik ook wel een jullie mening weten over welke merk hd's het betrouwbaarste zijn. Ik heb de keuze tusse n een maxtor met 16mb cache en een western digital met 8mb cache. Welke is de beste? Of is het nuttig om ergens anders een ander merk te bestellen?

luser
18/01/06, 14:36
WD's, zoek maar even wat over maxtor in het forum hier.

offtopic: waar woon je soms?

EDIT: Neem zeker raid1, zoals hier in de topic al werd verteld.

Randy
18/01/06, 14:50
Zeker een Western Digital schrijf nemen als het op betrouwbaarheid aankomt! Zie zoekfunctie.

bakkerl
20/01/06, 18:05
Origineel geplaatst door Mr.Alien Mijn vraag is dus welke andere maatregelen jullie nog nemen. Hebben jullie altijd reserver onderdelen liggen en van welke? Wat heeft het meeste kans om kapot te gaan? Wat doe je als de server bijvooreel juist voor het weekend stuk gaat? Waar haal je dan nog de nodige vervangstukken?

Afhankelijk van de klant waarvoor de machines hangen :)

Sommige klanten hebben alles redunant intern in de machine, als dubbele uitvoering van de machines. Bij uitval van een machines is er dan nog meteen haast.

Voor de de klanten met een minder groot budget hebben we van bijna alles wel reserve onderdelen liggen.

Voor onze eigen systemen is het grootste deel allemaal in een cluster vorm opgenomen. Een node die uitvalt hoeft dus ook niet direct vervangen te worden.

En daarbij nog een goede backup voor de data zodat we die ook nog veilig hebben mocht er wat anders mis gaan dan alleen hardware problemen.

Maar dit alles zijn dus alleen iets grotere omgevingen waar het meer dan maar 1 machine is.