PDA

Bekijk Volledige Versie : Defecte taakverdeling legt servers Cito plat



Domenico
03/02/11, 13:57
Defecte taakverdeling legt servers Cito plat

Het Cito heeft de oorzaak van de storing van 1 februari 2011 gevonden. De storing werd veroorzaakt door problemen met de verdeling van de werklast over de virtuele servers. Tijdens het piekmoment waarop maandagochtend per seconde ongeveer twee- tot drieduizend leerlingen inlogden, weigerde de 'load balancing'-applicatie de taken tussen de verschillende servers te verdelen. De problemen zijn inmiddels verholpen.

Dat zegt Hans Goedhart, cio bij het Centraal instituut voor toetsontwikkeling (Cito). Hij zegt dat er een server is bijgeplaatst waardoor de workload (taken, red.) wel goed worden verdeeld. Hij legt uit dat er problemen waren met load balancing (het verdelen van processen over verschillende servers, red.)

'De portal voor het inloggen van leerlingen die de toets digitaal maken is uitgebreid getest, maar op het moment dat bijna vierduizend leerlingen wilden inloggen, liep het systeem vast doordat in die piek de verdeling van de werklast niet werkte. Alle werklast kwam op één server terecht waarop de processor de opdrachten niet meer kon verwerken', aldus Goedhart.

VMware
Cito huist sinds begin januari 2011 in een nieuw pand. Daar heeft het de beschikking over een nieuwe infrastructuur op basis van virtuele machines van VMware. Het serverpark is redundant uitgevoerd. Maar doordat de verdeling niet werkte, werden geen taken overgeheveld naar de verschillende servers.bron: computable



De portal voor het inloggen van leerlingen die de toets digitaal maken is uitgebreid getest, maar op het moment dat bijna vierduizend leerlingen wilden inloggen, liep het systeem vast doordat in die piek de verdeling van de werklast niet werkte.


Het serverpark is redundant uitgevoerd. Maar doordat de verdeling niet werkte, werden geen taken overgeheveld naar de verschillende servers.

Wat klopt er hier niet?

pierce
03/02/11, 14:07
Is dit een prijsvraag?

tja vmware staat los van je load balancing op OS niveau he... en redundant uitgevoerd is niet per definitie load balancing.

Heb ik nu een WHT mok gewonnen? Of wordt het de troostprijs?

xaban
03/02/11, 14:32
Wat er niet klopt? Simpel toch

De portal voor het inloggen van leerlingen die de toets digitaal maken is uitgebreid getest, maar op het moment dat bijna vierduizend leerlingen wilden inloggen, liep het systeem vast doordat in die piek de verdeling van de werklast niet werkte.
Wel getest, maar schijnbaar niet met 4000 leerlingen.


Het serverpark is redundant uitgevoerd. Maar doordat de verdeling niet werkte, werden geen taken overgeheveld naar de verschillende servers.
Redundantie staat los van je applicatie.

Domenico
03/02/11, 14:35
Correct! Maar het is meer hoe het gezegd word. Volgens mij hebben 'leken' het over 100% bereikbaarheid als ze het over redundancy hebben. Ik vind dat techneuten dat ook zo moeten opvatten als daar naar gevraagd word of het moet tenminste goed uitgelegd worden.

In dit geval weet je vantevoren hoeveel gebruikers er gaan inloggen en dat maakt de blunder ook zo groot en onnodig. Arme kindertjes die niet kunnen inloggen en al zo gestressed waren.

WHT mok? Je bent bijna bij de 5000. :)
Zie ik daar gewoon nog een paar pakketjes in de hoek staan die nog naar het postkantoor (of wat daar van over is) moeten.

xaban
03/02/11, 15:02
Pierce bijna ja, ik moet er nog zo een 4000+ =)

Spyder01
03/02/11, 15:19
Eén verschil, ze bekennen hier gewoon dat het niet goed is gegaan en ze hebben actie ondernomen. Dat verdient wel een pluim, toch aardig wat beter dan de SIDN.

En de WHT mok zit ik helaas ook nog niet aan ;)