Alles
was es brauchte, war ein sogenannter Fat-Finger-Typo – jemanden, der die
falsche Taste auf der Tastatur drückte – und schon war die Amazon-Cloud für
viele User keine Cloud mehr,
sondern eine Nebelwand. Die Ereignisse der letzten Woche scheinen darauf hinzuweisen, dass digitale
Provider auch zu gross werden können, vor allem wenn andere Branchenriesen mit
am Tropf hängen: Too big to fail, sozusagen.
Solange alles läuft, interessiert es uns nicht besonders, was in der Wolke passiert. Bild PfW |
Über 40
Prozent Marktanteil hat sich Amazon im Public-Cloud-Markt mit den Amazon
Web Services (AWS) in den letzten Jahren gesichert, 14 Milliarden Dollar Umsatz
will Amazon mit seinen Servern dieses Jahr einnehmen. Nicht schlecht für ein
Geschäft, das Amazon erst vor gut zehn Jahren gestartet hat, um die eigenen
Server besser auszulasten. Natürlich will Amazon auch im Cloud-Business seine
Domination weiter ausbauen. Umso mehr muss die Panne vom 28. Februar den
Verantwortlichen zu denken geben: So ein kleiner Fehler, derartig riesige
Auswirkungen. Was ist genau passiert?
Die
Ereignisse begannen, als ein Techniker ein System warten wollte, dass für die
Rechnungen an die Cloud-Kunden zuständig ist. Weil er aber einen Tippfehler
machte, schaltet er ein paar Server zu viel ab, und das Unheil nahm seinen Lauf.
Zitat aus der Welt:
“Daraus
resultierte ein Domino-Effekt: Ohne Zugriff auf das Abrechnungssystem
funktionierte plötzlich auch das Programm nicht mehr, welches das
Inhaltsverzeichnis und die Speicherverwaltung – den sogenannten Indexdienst –
für sämtliche Speicher-Server des S3-Angebots parat hielt. Beide Dienste
mussten neu gestartet werden, was mehrere Stunden dauerte. Genauso lange fiel
S3 aus. Dass der Ausfall des Dienstes solche Probleme verursachte, überraschte
auch die Amazon-Techniker: “AWS ist in den vergangenen Jahren stark gewachsen,
der Neustart dauerte deutlich länger als erwartet.“ Nun will Amazon das System
umbauen, sodass ein einziger Tippfehler eines Technikers nicht länger ein
komplettes Rechenzentrum lahmlegen kann…“
Gute
Idee!
Denn die
Auswirkungen der Amazon-Panne waren massiv: Millionen
Websites waren stundenlang nicht oder nur schwer erreichbar, darunter ganz grosse
wie Expedia, Airbnb, Soundcloud, Netflix, Snapchat und Business Insider. Sogar Apple
war betroffen; Teile des App Stores, der iCloud und von Apple Music funktionierten
nicht mehr. Gemäss Schätzungen
amerikanischer Analysten entstanden durch den Ausfall Schäden von mehr als 150
Millionen Dollar.
Cloud-Spezialisten
weisen darauf hin, dass die absolut sichere Cloud schlicht und einfach nicht
existiert. Amazon wird aber dafür kritisiert, dass alle Server in der North-Virginia-Anlage
gleichzeitig ausfallen konnten – man hätte die Rechner besser unterteilen
sollen, schreibt die MIT
Technology Review.
Aber
nicht nur Amazon muss sich zur Konstruktion der Cloud Gedanken machen: Wer die
Cloud benutzt, sollte ebenfalls zum Thema Datensicherheit und Ausfallsicherheit planen. Damit
im Falle einer Panne die Daten nicht einfach im Nebel verschwinden.
No comments:
Post a Comment