Wij zijn op zoek naar iemand die ons kan helpen met een klant waar 2 Windows Server 2008 VM's gevirtualiseerd zijn vanaf een fysieke HP server installatie.
Voor deze klant hebben we de virtualisatie uitgevoerd en dat zag er goed uit op de test/tijdelijke server. We hebben bij de klant vervolgens hun eigen server geherinstalleerd, uitgebreid en de 2 fysieke servers virtueel naar 1 fysieke server geplaatst.
Na ongeveer een week zagen we een spontane reboot van 1 van de 2 servers (een SBS 2008). We kwamen er sinds die tijd achter dat de virtuele servers met enige regelmaat spontaan crashen. Soms 3x op een dag, soms 1x per week. De SBS server vaker dan de andere server (Applicatie server).
De momenten van uitvallen zijn willekeurig en er gaat niets aan vooraf, het gebeurd ook terwijl de server "idle" is of diep in de nacht bijvoorbeeld. We hebben hardware al uitgesloten door onze tijdelijke/test server weer in te schakelen en hun eigen HP server in een langdurige memtest/cpuburn/disk test (SMART test) te zetten. Op de tijdelijke/test server kwamen de problemen ook naar voren.
Er staat niets in de logboeken van Windows voorafgaand naar de crash. De volgende zaken zijn al geprobeerd:
sfc /scannow
chkdsk /f
memtest
CPU burn
Disk stresstest
Andere controller/disk/netwerk driver (Virtio/IDE/e1000/LSI)
cpu=host aangezet
memory ballooning uit gezet
Qcow2 naar raw omgezet, om qcow2 uit te sluiten
Verschillende driver versies
Verwijderen van alle non-Microsoft software (tevens alle HP software eraf natuurlijk)
Anti-virus scan
Driver verifier
Proxmox virtualisatie in verschillende versies geprobeerd (lijkt niets te maken met de host of virtualisatie software)
De bluescreens geven weinig informatie, de dumps verwijzen naar zaken die bij Windows zelfs horen en als je daar op Googled kom je 9 van de 10 keer uit op geheugen/driver problemen.
De laatste BSOD ging over:
KMODE_EXCEPTION_NOT_HANDLED 0x0000001e ntoskrnl.exe
Maar er staat iedere keer weer iets anders, dus dat zal weinig uit maken.
Wij zijn door onze opties heen en de klant heeft al meerdere keren overdag last gehad van een crash. We willen dat iemand er nog naar kijkt voordat we over gaan op rigoureuze maatregelen die veel tijd/geld gaan kosten.
Laat even een bericht achter als je tijd hebt, dan stuur ik een PM.