PDA

Bekijk Volledige Versie : Amazon RDS



magentohosting
17/04/12, 14:48
Ik weet niet zeker of dat het topic hier goed staat, maar kon zo even niet een andere (juiste) plek vinden hiervoor.

Sinds +- een half jaar bieden wij hosting aan op het Amazon platform (EC2 i.c.m. RDS (databases)).
Dit draait allemaal erg lekker, tot vorige week.

Eind vorige week was onze RDS (Relational Database Service) plots offline. Na een herstart van de instance werkte het weer. Downtime: +- 10 minuten. Zoiets kan gebeuren, maar blijft beetje vreemd.
Een dag na bovenstaand voorval gebeurde het nogmaals. Werderom na een herstart deed alles het weerk. Downtime again 10 minuten ongeveer.
Vandaag merkte een collega op dat de een bepaalde database niet bereikbaar was. Al gauw kwamen we er weer achter dat de instance offline was. We hebben hem toen geüpgrade naar een 'hogere' instance met meer RAM en CPU, etc. Na 10 minuten was dit klaar maar konden we niet connecten: het IP-adres was veranderd (grmbl..).
Van alle sites die wij hosten hebben we dan ook direct de connectie naar de DB aangepast. Dit zijn er gelukkig niet heel veel, om en nabij de 40.
Logs van de RDS hebben wij niet. Dit is een (bijzonder) groot nadeel, maar is an sich wel goed mee te werken. Grafieken over CPU, freeable memory, etc. etc. kunnen we allemaal wel netjes bekijken.

Voordat ik met technische aanvullingen kom, heb ik de volgende vraag:
Zijn hier hosters die ervaring hebben met het Amazon platform i.c.m. RDS?
Zo ja, wat zijn de ervaringen hiermee? Hoe is of was de omgeving ingericht?

davinci
17/04/12, 14:54
Begrijp ik het goed dat je db op RDS staat? (dus niet zelf mysql op een ec2 draaien). In dat geval zou ik contact opnemen via de supportfora. RDS is immers een 'managed oplossing'.
Wij hebben zelf nog nooit meegemaakt dat RDS instances (buiten regulier onderhoud of 'storingen') zomaar offline gaan.
Geven je grafieken nog iets bijzonders weer?

magentohosting
17/04/12, 15:05
De databases staan inderdaad op RDS zelf en dus niet op een EC2.
Ik ben ondertussen al bezig om op het forum van AWS een topic te openen, maar denk gooi het ook even hier neer.. wie weet wat er uit komt ;).

De grafieken geven verder weinig weer. De eerste keer hadden wij het idee dat het probleem bij het max. aantal connecties lag, maar de 2e keer lag dit aantal lager en kon het dus ook niet zijn. Ook de andere grafieken zeggen bijzonder weinig. Zo nu en dan een piekje, maar juist weer niet op de momenten dat de boel onderuit gaat.

Wanneer ik op het forum van AWS kijk, schijnen er al meerdere mensen wat problemen mee te hebben dat het zo nu en dan plots gebeurd.

Op wat voor RDS instance(s) draaien jullie?

davinci
17/04/12, 15:14
wij draaien voor klanten op dit moment meerdere m1.small en m1.medium in eu-west
Sommige zelfs gekoppeld aan ec2.micro, maar ook aan large instances.
Een rds instance moet natuurlijk niet echt down gaan door een een teveel aantal connecties. Weet je zeker dat je voldoende storage hebt?

magentohosting
17/04/12, 15:54
Ah oké. Wij hadden een m1.small maar sinds vandaag dan een m1.large (medium bestaat niet?). Beide in de eu-west zone.
Nadat de instance de eerste keer problemen gaf, hebben we de storage vergroot naar 100GB, we zitten hier ruim onder voorlopig.
Misschien heb ik het verkeerd verwoord dat de instance down ging.. Hij accepteerde geen connecties meer --> we konden ook op geen andere manier verbinding krijgen met de instances.
In het controlpanel stond hij wel als 'available'.

davinci
17/04/12, 21:50
er bestaat idd geen medium. (was in de war met de reserved instances medium usage)
Anyhow, je zou uit je grafieken (of evt je slowlog als je die aan hebt gezet) misschien nog wat meer info kunnen halen.
Check ook je maintenance window, wellicht heb je dat per abuis ingesteld tijdens piekuren ipv dal en was het regulier onderhoud.
Mijn ervaring is dat de aws medewerkers in de support fora (ik ga er vanuit dat je geen premium support hebt aangeschaft) vaak goed kunnen helpen en zeker als je aan kan geven wanneer eea precies speelde.

magentohosting
17/04/12, 22:19
Wat betreft de grafieken: zowel ik als mijn collega hebben naar de grafieken gekeken, maar er verschilt gewoon teveel.. daar kunnen we bijzonder weinig mee..
Slowlog ga ik morgen eens mee aan de slag.
Het maintenance window staat 's nachts gepland, dus dat kan het ook zijn.

Inmiddels een topic op het forum geopend. Even wachten op een reactie. Gezien het (grote) aantal topics en de reacties van o.a. AWS medewerkers, komt dat vast wel goed.
En we hebben inderdaad geen premium support.

In ieder geval bedankt voor je reacties hierzo.

davinci
18/04/12, 08:33
toeval? maar vannacht is een van onze instances ook 'offline' gegaan. Vanmorgen geen enkele mogelijkheid tot verbinding vanwege too many connections. De grafieken geven echter weer dat er vannach twee uur lang een enorme explosie aan verbindingen waren, welke daarna weer zijn ingezakt. De instance gaf echter nog steeds aan 'too many connections'.

Klinkt aardig hetzelfde, betrof een small instance in de eu-west-1c (helaas zonder multi az)
Een reboot deed ook hier wonderen.

Ik zag je topic op het aws forum, ik zal het aanvullen.

magentohosting
18/04/12, 09:49
Lekker begin van de dag ;).

Vind het maar een apart iets. Je kreeg echt de melding dat er 'too many connections' waren?
2 uur 's nachts is een vreemde tijd voor een explosie aan verbindingen, tenminste, als ik van de doorsnee klant uit ga (of hebben jullie veel 'aparte' klanten)?
Staat je in ieder geval niet blind op pieken in de grafieken. Dat heb ik de eerste keer ook gedaan en had een vermoeden. Vervolgens waren de pieken tijdens de 2e failure weer anders.

Het schijnt een vaker voorkomend iets te zijn als ik de topics op AWS moet geloven. We wachten af...