PDA

Bekijk Volledige Versie : Raid schijf kapot



WH-Tim
07/12/09, 20:19
Hoe kan ik binnen mijn RAID1 configuratie herkennen welke van de 2 spiegelende schijven de problemen veroorzaakt (defect is)?

Piwi-Web
07/12/09, 20:20
Dat geeft je RAID controller normaal aan :)

Wat voor RAID controller heb je erin zitten? (of is het onboard -,-?)

WH-Tim
07/12/09, 20:22
SAS 5iR internal RAID controller, PCI-e 1

Geeft hij dat aan bij het opstarten van de server of ook in de linux terminal? Want ik heb hem al een jaar niet meer gereboot, en momenteel de server niet meer gestart krijgen zou heel slecht uitkomen. Vandaar dat ik nog niets herstart heb..

Piwi-Web
07/12/09, 20:24
Zie je als het goed is ook in de linux terminal...
Check /var/log/messages o.i.d. Meestal staat daar iets in

t.bloo
07/12/09, 20:27
als je geen backups hebt, niet herstarten maar eerst backup maken!

(nu weer on-topic)

je kunt met een tooltje tegen je controller praten en vragen hoe het er mee staat

marsipulami
07/12/09, 20:28
Heb je geen webinterface ofzo die jou dit vermeld, heb ik bij mijn Dell server wel. Staat ook bij welke hdd 0 of 1 gecrashed is.

Hoe weet je trouwens dat hij gecrashed is terwijl je niet weet welke?

vDong
07/12/09, 20:31
Zie je als het goed is ook in de linux terminal...
Check /var/log/messages o.i.d. Meestal staat daar iets in

Lijkt me niet, hardware raid is transparant voor het OS.
Ik denk dat de TS moet gaan zoeken naar linux cli tooltjes, ik weet dat adaptec,areca en 3ware die iirc hebben.

De kaart die je noemt lijkt nepraid te zijn: in the SAS 5/iR it is
basically software RAID but moved onto the card.

Veel success.

Piwi-Web
07/12/09, 20:44
Lijkt me niet, hardware raid is transparant voor het OS.
Ik denk dat de TS moet gaan zoeken naar linux cli tooltjes, ik weet dat adaptec,areca en 3ware die iirc hebben.

Hier toch servers waar het OS zelf de activiteiten van de kaart logt (3ware kaart)

wonko
07/12/09, 21:27
het zijn de drivers die in de kernel zitten die dan meestal een basis-status uitlezen, of reageren op meldingen van de kaart. Hangt wat af van de bereidwilligheid van de vendor om zijn specs beschikbaar te maken.

WH-Tim
08/12/09, 00:01
Even een nadere toelichting nog. Het begon ermee dat de schijf volliep terwijl er niets opstond. Hackers!, denk je dan direct. Maar dat was niet zo. Een korte check liet blijken dat er bergen met errors naar voren kwamen (met e2fsck). Dus toen hebben we de /var/ maar even in de /home/var/ geplaatst (aparte partitie is de /var/ officieel bij mij op de server). Dat is een noodoplossing omdat er geen mail meer verstuurd/ontvangen kon worden en de database natuurlijk ook niet blij ervan werd. Tevens is de logging dan ook onmogelijk waardoor services vastliepen.

@marsipulami: ik heb geen dell software erop geinstalleerd. Ik heb zelf een clean install gedaan. Maakt dat iets uit?

Het gaat om een projecten server. Daardoor niet minder belangrijk, maar ik heb er niet standaard dure SLA overeenkomsten op draaien. Op dit soort momenten merk je erg goed het verschil tussen programmeur en systeembeheerder :(

marsipulami
08/12/09, 00:06
Wanneer je een dell server hebt met een "ik vermoed alleen door hun geleverde" raidkaart kan je bijvoorbeeld OMSA(Dell OpenManage Server Administrator ) installeren. Misschien werkt het ook wel met andere raid kaarten, maar dat weet ik niet. Het is iig een tool om een Dell server uit te lezen

Dit gebruik ik ook, en dan kan je via een webinterface je systeem beheren/bekijken. Dus ook hoeveel schijven je hebt en wat de status van een specifieke schijf is.

Piwi-Web
08/12/09, 00:09
Met een beetje googlen komen we ver: http://pocitace.tomasek.cz/SAS5iRperf/index.html
En dit (http://www-947.ibm.com/systems/support/supportsite.wss/docdisplay?lndocid=MIGR-63501&brandind=5000008)progje zou moeten werken :)

Bhai
08/12/09, 00:14
Als je OMSA hebt geinstalleerd kun je me omreport informatie naar boven toveren...

WH-Tim
08/12/09, 00:21
Dell maakt het er ook niet makkelijker op met allemaal die javascript download beveiligingen.

De mtp-status zegt dit:


server:/var/log# mpt-status
open /dev/mptctl: No such file or directory
Try: mknod /dev/mptctl c 10 220
Also make sure mptctl is loaded into the kernel
server:/var/log# mknod /dev/mptctl c 10 220
server:/var/log# mpt-status
open /dev/mptctl: No such device
Are you sure your controller is supported by mptlinux?
Also make sure mptctl is loaded into the kernel
server:/var/log#


Zou recompilen worden. Is dat met alle tools? :P

wonko
08/12/09, 08:40
nee, je moet je driver in je kernel laden (en dat kan idd opnieuw compilen/linken worden). lsmod en aanverwanten zijn je vriend in dit geval.

DutchTSE
08/12/09, 12:12
De schijven ondersteunen geen smart? Anders zou je de schijven via de controller kunnen uitlezen (althans dat werkt via 3ware sowieso). Anders server rebooten en in de "bios" van de raid controller kijken (zie je tijdens het opstarten vaak al)

Serveo
08/12/09, 12:17
Staat er niks in de logs vermeld welke drive dood is?

/var/log/messages

Tommi
08/12/09, 16:03
Opstarten is dus geen optie volgens hem, aangezien er nog te belangrijk spul op staat.
Maar idd check de /var/log/messages eens goed, probeer met smart het eens uit te lezen en het wil ook wel eens voorkomen dat je als root mail erover krijgt op het linux systeem.

Serveo
08/12/09, 19:13
Opstarten is dus geen optie volgens hem, aangezien er nog te belangrijk spul op staat.
Maar idd check de /var/log/messages eens goed, probeer met smart het eens uit te lezen en het wil ook wel eens voorkomen dat je als root mail erover krijgt op het linux systeem.

SMART zal niet veel uithalen, omdat de drives niet direct op het moederbord zijn aangesloten. Wat betreft het niet opnieuw op willen starten. Nu heb je meer kans dat je bestanden beschadigd, dan dat je hem aansluit op een console en een reboot doet. Ik neem namelijk aan dat je controller bij de reboot aangeeft op welke poort de defecte disk zit.

DutchTSE
08/12/09, 19:14
SMART zal niet veel uithalen, omdat de drives niet direct op het moederbord zijn aangesloten.

Het is bij 3ware mogelijk via de controller de schijven uit te lezen, dus wie weet nu ook?:)

Serveo
08/12/09, 19:18
Het is bij 3ware mogelijk via de controller de schijven uit te lezen, dus wie weet nu ook?:)

Dan heb ik niks gezegd :X

Het is mij overigens niet gelukt bij de 8xxx series? Zal zo eens kijken bij een 9xxx series of je gelijk hebt.

Yourwebhoster
08/12/09, 19:35
Dan heb ik niks gezegd :X

Het is mij overigens niet gelukt bij de 8xxx series? Zal zo eens kijken bij een 9xxx series of je gelijk hebt.
9650
Ik krijg via de management interface netjes de SMART.

WH-Tim
08/12/09, 20:56
Ik krijg het niet gefixed (geen messages, geen log vermeldingen, geen tools die iets zeggen). Zal wel eens een expert ervoor inhuren deze week, misschien dat die me dat zo kan zeggen..

Savvas
08/12/09, 22:02
Die controllers zijn rebrands van LSI geloof ik, LSI heeft verscheidene tools om via de CLI te werken. Ik zou daar eens naar kijken, vind je ongetwijfeld wat.