Monday, March 6, 2017

Die Amazon-Cloud: Too big to fail?

Alles was es brauchte, war ein sogenannter Fat-Finger-Typo – jemanden, der die falsche Taste auf der Tastatur drückte – und schon war die Amazon-Cloud für viele User keine Cloud mehr, sondern eine Nebelwand. Die Ereignisse der letzten Woche scheinen darauf hinzuweisen, dass digitale Provider auch zu gross werden können, vor allem wenn andere Branchenriesen mit am Tropf hängen: Too big to fail, sozusagen.

Solange alles läuft, interessiert es uns nicht besonders, was in der Wolke
passiert.                                                                                                      Bild PfW
Über 40 Prozent Marktanteil hat sich Amazon im Public-Cloud-Markt mit den Amazon Web Services (AWS) in den letzten Jahren gesichert, 14 Milliarden Dollar Umsatz will Amazon mit seinen Servern dieses Jahr einnehmen. Nicht schlecht für ein Geschäft, das Amazon erst vor gut zehn Jahren gestartet hat, um die eigenen Server besser auszulasten. Natürlich will Amazon auch im Cloud-Business seine Domination weiter ausbauen. Umso mehr muss die Panne vom 28. Februar den Verantwortlichen zu denken geben: So ein kleiner Fehler, derartig riesige Auswirkungen. Was ist genau passiert?  
Die Ereignisse begannen, als ein Techniker ein System warten wollte, dass für die Rechnungen an die Cloud-Kunden zuständig ist. Weil er aber einen Tippfehler machte, schaltet er ein paar Server zu viel ab, und das Unheil nahm seinen Lauf. Zitat aus der Welt:
“Daraus resultierte ein Domino-Effekt: Ohne Zugriff auf das Abrechnungssystem funktionierte plötzlich auch das Programm nicht mehr, welches das Inhaltsverzeichnis und die Speicherverwaltung – den sogenannten Indexdienst – für sämtliche Speicher-Server des S3-Angebots parat hielt. Beide Dienste mussten neu gestartet werden, was mehrere Stunden dauerte. Genauso lange fiel S3 aus. Dass der Ausfall des Dienstes solche Probleme verursachte, überraschte auch die Amazon-Techniker: “AWS ist in den vergangenen Jahren stark gewachsen, der Neustart dauerte deutlich länger als erwartet.“ Nun will Amazon das System umbauen, sodass ein einziger Tippfehler eines Technikers nicht länger ein komplettes Rechenzentrum lahmlegen kann…“
Gute Idee!
Denn die Auswirkungen der Amazon-Panne waren massiv: Millionen Websites waren stundenlang nicht oder nur schwer erreichbar, darunter ganz grosse wie Expedia, Airbnb, Soundcloud, Netflix, Snapchat und Business Insider. Sogar Apple war betroffen; Teile des App Stores, der iCloud und von Apple Music funktionierten nicht mehr. Gemäss Schätzungen amerikanischer Analysten entstanden durch den Ausfall Schäden von mehr als 150 Millionen Dollar.
Cloud-Spezialisten weisen darauf hin, dass die absolut sichere Cloud schlicht und einfach nicht existiert. Amazon wird aber dafür kritisiert, dass alle Server in der North-Virginia-Anlage gleichzeitig ausfallen konnten – man hätte die Rechner besser unterteilen sollen, schreibt die MIT Technology Review.  

Aber nicht nur Amazon muss sich zur Konstruktion der Cloud Gedanken machen: Wer die Cloud benutzt, sollte ebenfalls zum Thema  Datensicherheit und Ausfallsicherheit planen. Damit im Falle einer Panne die Daten nicht einfach im Nebel verschwinden.

No comments:

Post a Comment