Oorspronkelijk geplaatst door
tvdh
Zover ik kan zien is dit niet het geval.
We hebben met een paar mensen de hele omgeving doorgelopen en niks geks gezien.
Daarnaast heb ik alles een keer uitgebreid getekend in Visio zodat we een goed beeld hebben. Hierbij ben ik ook niets raars tegen gekomen.
Ik zal wat achtergrond informatie geven, misschien gaat er bij iemand een lampje branden.
- We zijn gestart met een Proxmox 3 cluster. Hierbij een SAN met omnios en napp-it. Bij het migreren van drukkere VM's kon heel het cluster gaan hangen zoals in dit topic beschreven.
We hadden destijds nog een TP-Link 1GBIT storage switch. Dit destijds vervangen door een Cisco omdat we dachten dat het dat misschien was. Maakte geen verschil helaas.
- Hierna een extra cluster opgezet, Proxmox 4 met een nieuwe Omnios napp-it san, over 10GBIT.
Enkele belangrijke VM's zoals drukke webservers hier naar toe over gezet.
In eerste instantie probeerden we dit te doen door het maken van een backup van de VM binnen proxmox en deze terug zetten in de nieuwe omgeving naar de SAN.
Naar lokale storage kunnen we backups zonder problemen terug zetten.
Als we echter een backup terug zetten naar de SAN kakt ook alles in, zelfde probleem als bij een migratie. Is dit misschien een aanwijzing voor wat er mis kan zijn?
We hebben het nu opgelost door nieuwe VM's te maken en het VHD bestand van de oude VM direct op de SAN te kopiëren.
Het komt met name bij deze VM's voor dat het migreren mis gaat (drukke webservers).
Zouden misschien meerdere nodes hetzelfde bestand proberen te benaderen via NFS dat hier iets mis gaat?