PDA

Bekijk Volledige Versie : Koeling harddisks



snaaps
24/01/07, 17:01
In de afgelopen 2 maanden zijn er bij ons 4 servers gecrashed.
Nu kan dit toeval zijn maar mischien dat het ook een warmte probleem kan zijn.

Onze Huidige Situatie:

1 Rack met op elkaar gestapelde SuperMicro 811i/t behuizingen.
Rack telt circa 30 van deze servers.
Temparatuur op de datavloer is naar mijn mening kritiek.
Gebruik diverse disks, WD, Maxtor en Hitachi.

Nu zitten er in de Supermicro behuizingen lucht gaatjes boven de harddiks en luchtgaatjes boven achter op de achterkant.
Deze lucht gaatjes worden momenteel geblokeerd door bovenhangende servers.

Wij hebben de servers zo gestabeld met het idee dat er geen vasle lucht door het rack mogelijk is.
De lucht zou dus via de onderkant van de fans moeten worden afgezogen en door de kast moeten worden geblazen.

Graag verneem ik jullie ervasring hiermee en of reacties.

(begin een beetje moe te worden van al die reinstalls)

Magus
24/01/07, 17:12
Is er wel een airflow langs de disks mogelijk? En wat is de huidige temperatuur op de vloer?

snaaps
24/01/07, 17:28
Temparatuur is +/- 21 a 22 graden.
Hier wordt binnen kort wel verbetering aan gebracht.

lucht zou door de voorkant naar binnen moeten worden gezogen.
Temp van de harddisk weet ik niet, kanik niet uitmeten helaas.

Ik zit nu te zwijfelen om overal 1 gaat tussen te houden.

gjtje
24/01/07, 17:33
Ruimte openlaten tussen je servers is niet goed voor de airflow in het rack, dan moet je er weer blindplaten tussen zetten.

Als je de temperatuur van de disks niet weet is het nog al gokken. Die kasten zouden prima moeten werken als de lucht er recht doorheen gaat.

Thafusion
24/01/07, 18:16
Wat je zou kunnen doen is een programma installeren om de HDD temperatuur uit te lezen. Als deze erg hoog is kan het zijn dat het daar aan ligt, of gewoon puur pech dat ze allemaal uitvallen.

Mastje
24/01/07, 19:01
Ey Marcel.. Danny hier :)

Hoe oud zijn de harde schijven? zijn dit meer nieuwe schijven of oudere? De tempoeratuur vind ik nog wel meevallen als ik bijv. naar Easynet kijkt ->

http://www.ispam.nl/wp-content/uploads/2006/12/systemp-month.png
(alleen het begin, einde is van het uitvallen van de airco.)

snaaps
24/01/07, 22:17
Het zal wel toeval zijn geweest.

De disken zijn kaduuk gegaan na een apc reboot.
disken waren 1 12 12 en 18 maanden oud.

Mastje
24/01/07, 23:03
Ik heb hier verder geen ervaringen mee. Misschien dat je toch beter even kan kijken hoe warm de harde schijven zijn. http://www.lm-sensors.org ken ik toevallig, maar ik heb er nog nooit gebruik van gemaakt. Misschien kan je het een keer proberen.

VinceSTM
24/01/07, 23:04
je kan proberen hddtemp te gebruiken, kan je de temperatuur zien

Phu
25/01/07, 00:48
Het zal wel toeval zijn geweest.

De disken zijn kaduuk gegaan na een apc reboot.
disken waren 1 12 12 en 18 maanden oud.

Hoi,

Ik denk persoonlijk dat het niet aan de temperatuur ligt maar aan de Reboot
wij hebben in april toen door een grap van iemand 4 schijven gehad die kaduuk waren omdat ie onze een paar van onze servers uit heb gezet en direct weer aan (gamma powerblokken met aan uit knop :))

schijven kunnen niet zo goed tegen poweroutages

Sphere
25/01/07, 02:50
Ey Marcel.. Danny hier :)

Hoe oud zijn de harde schijven? zijn dit meer nieuwe schijven of oudere? De tempoeratuur vind ik nog wel meevallen als ik bijv. naar Easynet kijkt ->

http://www.ispam.nl/wp-content/uploads/2006/12/systemp-month.png
(alleen het begin, einde is van het uitvallen van de airco.)

Leuk plaatje, echter is dit de systeem temperatuur in de kast en niet de temp op de vloer zelf. Verder moet je niet al te veel waarde hechten aan een meting gezien deze kan afwijken van de werkelijke temp.

wonko
25/01/07, 09:02
Harddisk status en meters kan je uitlezen met smarttools of lm-sensors.

Voel even met je hand als er genoeg lucht gezogen wordt aan de voorzijde van de kasten. Normaal zijn die 811T chassis' zeer goed. We hebben er zelf verschillende draaien, ook gewoon gestapeld, en nog nooit echt veel problemen en uitval gehad (occassioneel eens een harddisk, maar dat is normaal)...

snaaps
25/01/07, 09:52
Hoelang wachten jullie met de server weer aan te zetten?
meestal wacht ik altijd ff 5 a 10 seconden, maar zal dit voortaan verlengen naar een minuut ofzo.

tevens zal ik de power bottom instellingen eens gaan aanpassen in de bios, zodat waneer je deze indrukt de server netjes afsluit.
Is nu niet het geval, knop werkt niet, kan alleen aan zetten.

wonko
25/01/07, 10:04
toch minstens een halve minuut of zo... Meeste reboots doen we wel via IPMI of gewoon reboot vanaf command-line. Systeem blijft dus ten alle tijde onder stroom. Als je echt helemaal de stroom eraf haalt, moet je de disks tijd geven om helemaal te stoppen en zo.

Persoonlijk ben ik er niet voor dat een eenvoudige druk op een knop de server kan afleggen, even inloggen (remote) en een shutdown geven is even moeilijk...

snaaps
25/01/07, 10:29
Ja ok, maar ik had van de week dus de volgende error:

# shutdown now -h
Not al vilad command

# reboot
not a vilad command

Dus bleef een apc reboot over, ICMPI hebben we niet.

wonko
25/01/07, 11:18
wel, als je dan APC reboot doet, doe dan eerder een off - 30 sec wachten - on zelf ipv die reboot van APC te gebruiken.

Al zou ik je wel aanraden om even te zoeken waarom het niet werk met een commando (en het is normaal "shutdown -h now", en als je een reboot wil, best geen "-h", want dat is "halt", eerder "shutdown -r now", met een -r van reboot)