Bekijk Volledige Versie : Raid schijf kapot
Hoe kan ik binnen mijn RAID1 configuratie herkennen welke van de 2 spiegelende schijven de problemen veroorzaakt (defect is)?
Dat geeft je RAID controller normaal aan :)
Wat voor RAID controller heb je erin zitten? (of is het onboard -,-?)
SAS 5iR internal RAID controller, PCI-e 1
Geeft hij dat aan bij het opstarten van de server of ook in de linux terminal? Want ik heb hem al een jaar niet meer gereboot, en momenteel de server niet meer gestart krijgen zou heel slecht uitkomen. Vandaar dat ik nog niets herstart heb..
Zie je als het goed is ook in de linux terminal...
Check /var/log/messages o.i.d. Meestal staat daar iets in
als je geen backups hebt, niet herstarten maar eerst backup maken!
(nu weer on-topic)
je kunt met een tooltje tegen je controller praten en vragen hoe het er mee staat
marsipulami
07/12/09, 19:28
Heb je geen webinterface ofzo die jou dit vermeld, heb ik bij mijn Dell server wel. Staat ook bij welke hdd 0 of 1 gecrashed is.
Hoe weet je trouwens dat hij gecrashed is terwijl je niet weet welke?
Zie je als het goed is ook in de linux terminal...
Check /var/log/messages o.i.d. Meestal staat daar iets in
Lijkt me niet, hardware raid is transparant voor het OS.
Ik denk dat de TS moet gaan zoeken naar linux cli tooltjes, ik weet dat adaptec,areca en 3ware die iirc hebben.
De kaart die je noemt lijkt nepraid te zijn: in the SAS 5/iR it is
basically software RAID but moved onto the card.
Veel success.
Lijkt me niet, hardware raid is transparant voor het OS.
Ik denk dat de TS moet gaan zoeken naar linux cli tooltjes, ik weet dat adaptec,areca en 3ware die iirc hebben.
Hier toch servers waar het OS zelf de activiteiten van de kaart logt (3ware kaart)
het zijn de drivers die in de kernel zitten die dan meestal een basis-status uitlezen, of reageren op meldingen van de kaart. Hangt wat af van de bereidwilligheid van de vendor om zijn specs beschikbaar te maken.
Even een nadere toelichting nog. Het begon ermee dat de schijf volliep terwijl er niets opstond. Hackers!, denk je dan direct. Maar dat was niet zo. Een korte check liet blijken dat er bergen met errors naar voren kwamen (met e2fsck). Dus toen hebben we de /var/ maar even in de /home/var/ geplaatst (aparte partitie is de /var/ officieel bij mij op de server). Dat is een noodoplossing omdat er geen mail meer verstuurd/ontvangen kon worden en de database natuurlijk ook niet blij ervan werd. Tevens is de logging dan ook onmogelijk waardoor services vastliepen.
@marsipulami: ik heb geen dell software erop geinstalleerd. Ik heb zelf een clean install gedaan. Maakt dat iets uit?
Het gaat om een projecten server. Daardoor niet minder belangrijk, maar ik heb er niet standaard dure SLA overeenkomsten op draaien. Op dit soort momenten merk je erg goed het verschil tussen programmeur en systeembeheerder :(
marsipulami
07/12/09, 23:06
Wanneer je een dell server hebt met een "ik vermoed alleen door hun geleverde" raidkaart kan je bijvoorbeeld OMSA(Dell OpenManage Server Administrator ) installeren. Misschien werkt het ook wel met andere raid kaarten, maar dat weet ik niet. Het is iig een tool om een Dell server uit te lezen
Dit gebruik ik ook, en dan kan je via een webinterface je systeem beheren/bekijken. Dus ook hoeveel schijven je hebt en wat de status van een specifieke schijf is.
Met een beetje googlen komen we ver: http://pocitace.tomasek.cz/SAS5iRperf/index.html
En dit (http://www-947.ibm.com/systems/support/supportsite.wss/docdisplay?lndocid=MIGR-63501&brandind=5000008)progje zou moeten werken :)
Als je OMSA hebt geinstalleerd kun je me omreport informatie naar boven toveren...
Dell maakt het er ook niet makkelijker op met allemaal die javascript download beveiligingen.
De mtp-status zegt dit:
server:/var/log# mpt-status
open /dev/mptctl: No such file or directory
Try: mknod /dev/mptctl c 10 220
Also make sure mptctl is loaded into the kernel
server:/var/log# mknod /dev/mptctl c 10 220
server:/var/log# mpt-status
open /dev/mptctl: No such device
Are you sure your controller is supported by mptlinux?
Also make sure mptctl is loaded into the kernel
server:/var/log#
Zou recompilen worden. Is dat met alle tools? :P
nee, je moet je driver in je kernel laden (en dat kan idd opnieuw compilen/linken worden). lsmod en aanverwanten zijn je vriend in dit geval.
De schijven ondersteunen geen smart? Anders zou je de schijven via de controller kunnen uitlezen (althans dat werkt via 3ware sowieso). Anders server rebooten en in de "bios" van de raid controller kijken (zie je tijdens het opstarten vaak al)
Staat er niks in de logs vermeld welke drive dood is?
/var/log/messages
Opstarten is dus geen optie volgens hem, aangezien er nog te belangrijk spul op staat.
Maar idd check de /var/log/messages eens goed, probeer met smart het eens uit te lezen en het wil ook wel eens voorkomen dat je als root mail erover krijgt op het linux systeem.
Opstarten is dus geen optie volgens hem, aangezien er nog te belangrijk spul op staat.
Maar idd check de /var/log/messages eens goed, probeer met smart het eens uit te lezen en het wil ook wel eens voorkomen dat je als root mail erover krijgt op het linux systeem.
SMART zal niet veel uithalen, omdat de drives niet direct op het moederbord zijn aangesloten. Wat betreft het niet opnieuw op willen starten. Nu heb je meer kans dat je bestanden beschadigd, dan dat je hem aansluit op een console en een reboot doet. Ik neem namelijk aan dat je controller bij de reboot aangeeft op welke poort de defecte disk zit.
SMART zal niet veel uithalen, omdat de drives niet direct op het moederbord zijn aangesloten.
Het is bij 3ware mogelijk via de controller de schijven uit te lezen, dus wie weet nu ook?:)
Het is bij 3ware mogelijk via de controller de schijven uit te lezen, dus wie weet nu ook?:)
Dan heb ik niks gezegd :X
Het is mij overigens niet gelukt bij de 8xxx series? Zal zo eens kijken bij een 9xxx series of je gelijk hebt.
Yourwebhoster
08/12/09, 18:35
Dan heb ik niks gezegd :X
Het is mij overigens niet gelukt bij de 8xxx series? Zal zo eens kijken bij een 9xxx series of je gelijk hebt.
9650
Ik krijg via de management interface netjes de SMART.
Ik krijg het niet gefixed (geen messages, geen log vermeldingen, geen tools die iets zeggen). Zal wel eens een expert ervoor inhuren deze week, misschien dat die me dat zo kan zeggen..
Die controllers zijn rebrands van LSI geloof ik, LSI heeft verscheidene tools om via de CLI te werken. Ik zou daar eens naar kijken, vind je ongetwijfeld wat.