Amazon-medewerker veroorzaakte cloudstoring

De grootschalige storing in een van de clouddiensten van Amazon vorige week was te wijten aan een menselijke fout. Amazon heeft dit zelf recentelijk bekendgemaakt. Gedurende de storing was de Amazon Simple Storage Service (S3) ongeveer vier uur lang niet beschikbaar.

Deze dienst wordt gebruikt voor online opslagruimte van websites en webdiensten. Het incident vond plaats toen een geautoriseerde medewerker een aantal servers wilde verwijderen voor een van de S3-subsystemen van het S3-facturatieproces.

S3-subsystemen

“Helaas werd een van de waardes van het commando verkeerd ingevoerd en werd een groter aantal servers dan bedoeld verwijderd,” schrijft Amazon in een verklaring. De per ongeluk verwijderde servers ondersteunen twee andere S3-subsystemen. Een daarvan, het index-subsysteem, beheert metadata en locatiegegevens van alle S3-objecten in het betreffende Amerikaanse gebied. Het tweede systeem regelt de toekenning van nieuwe cloudopslag.

Invoerfout
Door een invoerfout werden beide subsystemen opnieuw opgestart. Als gevolg daarvan kon S3 geen verzoeken meer afhandelen, wat consequenties had voor andere Amazon-diensten. Amazon heeft gezegd wijzigingen door te voeren waardoor S3-subsystemen sneller zijn te herstellen. Personeelsleden krijgen voortaan niet meer de mogelijkheid om in een keer een groot aantal servers te verwijderen.

Aanmelden voor onze nieuwsbrief