Schlagwortarchiv für: Ausfallzeit

Was Eichhörnchen uns über Georedundanz verraten

Eichhörnchen müssen jeden Herbst aufs Neue überlebenswichtige Entscheidungen treffen: Wohin mit den Vorräten für Winter und Frühjahr? Die kleinen Kerlchen würden sich jede Menge Rennerei ersparen, wenn sie alles an einem Ort verbuddelten oder wenigstens innerhalb eines überschaubaren Gebiets. Aber nein, die Nager flitzen und huschen im Herbst zu den unterschiedlichsten Stellen, um ihre Schätze zu verstecken. Diese Hektik hat einen Grund: Eichhörnchen sind (wohl eher unwissentlich) Experten für Georedundanz.

Georedundanz sichert das Überleben

Allzu oft gibt es für Eichhörnchen ein böses Erwachen: Sie laufen hungrig zu einem Vorrat und müssen feststellen, dass die Schneeschmelze alles unter Wasser gesetzt hat und die Nahrung längst verdorben ist. Dann ist es lebensrettend, noch zusätzliche Lager weiter entfernt angelegt zu haben. Der ein oder andere Standort wird noch brauchbares Futter beherbergen.

Bei Daten verhält es sich ähnlich: Auch sie sind überlebenswichtig für das Unternehmen. Deswegen sollten sie ebenfalls nicht nur an einem Ort gespeichert werden. Die Rechnerwolke kann da Abhilfe schaffen – aber Cloud ist nicht gleich Cloud. Darum sollte ein Unternehmen wissen, wo sein Cloud-Dienstleister die Daten speichert, und wie oft und wohin er diese Daten redundant spiegelt. Wenn der Ausweich-Server nur einen Schrank entfernt im selben Rechenzentrum steht, dann hilft die Redundanz bei einem akuten Serverausfall oder Wartungsarbeiten, nicht aber bei Ereignissen, die das gesamte Rechenzentrum betreffen. Auch den redundanten Server in einem anderen Gebäude einen Straßenzug weiter zu betreiben, bietet nur einen bedingt erhöhten Schutz vor Serverausfällen.

 

Genaue Vorgaben für Georedundanz vom BSI

Das Bundesamt für Sicherheit in der Informationstechnik (BSI) hat 2019 in seinen „Kriterien für die Standortwahl höchstverfügbarer und georedundanter Rechenzentren“ festgelegt, dass diese mindestens 200 Kilometer entfernt voneinander stehen müssen. Als Begründung führte es konkret den „Schutz vor Naturgewalten“ an. Zu oft kam es in den vergangenen Jahren zu Großschadensereignissen, die gleich ganze Regionen betroffen haben: das Jahrhunderthochwasser von Elbe und Donau, die Schneekatastrophe im Münsterland oder die Flut im Ahrtal. So stellt das BSI auch die Anforderung, dass sich innerhalb eines Flusssystems nur jeweils ein Rechenzentrum der Georedundanzgruppe befinden darf. Was die Stromversorgung betrifft, darf pro Netzsegment nur ein Rechenzentrum betrieben werden. Weitere Vorgabe macht das BSI zu Erdbebenzonen, Windschutz und sogar zur Verpflegung der Mitarbeiter der Rechenzentren. So dürfen keine zwei Rechenzentren derselben Redundanzgruppe von einem Caterer beliefert werden.

Klimawandel macht Großschadensereignisse wahrscheinlicher

Zwar treten Großschadensereignisse immer häufiger auf, sie sind nach wie vor aber sehr unwahrscheinlich, was sich durch den Klimawandel aber ändern kann. Die Microsoft-Cloud Azure bietet darum unterschiedliche Abstufungen bei der Redundanz, die sich ganz auf den Kundenbedarf zuschneiden lassen. So erreicht die Basis-Option mit lokal redundantem Speicher eine Verfügbarkeit von 99,95 Prozent durch Redundanz innerhalb eines Rechenzentrums. Hierbei liegt die tolerable Ausfallzeit bei ungefähr einem halben Arbeitstag pro Jahr. Wer sich darüber hinaus gegen regionale Großschadensereignisse absichern will, ist auf der sicheren Seite, wenn der IT-Dienstleister das Unternehmen zu passenden georedundanten Lösungen beraten kann. Auch für solche Anforderungen bietet Microsoft Azure Cloud entsprechende Lösungen. Bei der Entscheidung sollten Sie berücksichtigen, welche Redundanzoption für Ihr Szenario am besten geeignet ist: Neben dem lokalredundanten Speicher gibt es beispielsweise noch den zonenredundanten Speicher. Dabei wird Ihr Speicherkonto synchron über drei Azure-Verfügbarkeitszonen hinweg in der primären Region repliziert. Jede Verfügbarkeitszone verfügt über unabhängige Stromversorgungs-, Kühlungs- und Netzwerkgeräte und ermöglicht eine Verfügbarkeit von mindestens 99,999999999999 Prozent. Damit müssen Sie dann keine harten Nüsse knacken, um im Falle eines Falles Ihre Daten in Sicherheit zu wissen.

Hochverfügbarkeit: Was Raubkatzen, IT und Evolution verbindet

 

Hier spinnt ein Dienstrechner mal wieder, dort muckt ein Server im Unternehmen und benötigt Admin-Zuwendung – und meist dann, wenn man es am wenigsten gebrauchen kann. Nichts als Ärger mit der IT! Immer ist irgendwas! Haben Sie das auch schon einmal gedacht? Dann habe ich zwei Zauberworte für Sie: selektive Wahrnehmung und Hochverfügbarkeit. 

Beginnen wir zunächst mit der selektiven Wahrnehmung: Ist wirklich immer irgendwas mit der IT? Oder nehmen sie das in den betreffenden Momenten nur wie durch ein Brennglas wahr? Tatsächlich blenden wir aus, wie viele Dinge gut funktionieren, weil das für uns sozusagen der Modus Operandi ist. Weicht etwas davon ab, gehen bei uns alle Alarmglocken los – diese Ereignisse prägen sich besonders ein. Diese selektive Wahrnehmung hat einen evolutionären Hintergrund, der uns zu denen gemacht hat, die wir heute sind. Stellen wir uns dazu unsere Urahnen aus längst vergangenen Zeiten vor. Hochverfügbar war für sie gar nichts, weder Nahrung noch Wärme noch eine sichere Unterkunft. Sie waren darauf angewiesen, ihre Umgebung genau zu beobachten und Schlussfolgerungen zu ziehen. Wer dabei zugeschaut hat, wie sein Stammeskollege vom Blitz getroffen oder von einem Tiger gefressen wurde, erinnert sich lange daran. Evolutionär bedingt war es also entscheidend, dass wir uns eher an die schlechten Momente erinnern, um aus Fehlern zu lernen. Und dieses Erbe unserer Vorväter tragen wir noch heute in uns. 

 

Die vielen Gesichter der Hochverfügbarkeit 

„Schön und gut“, mögen Sie denken, „und wie hilft Ihnen das jetzt bei Ärger mit Ihrer IT?“ Nun, die gute Nachricht vorweg: Sie werden von einem streikenden Laptop nicht gefressen und von einem ausgefallenen Server nicht erschlagen – außer Sie stehen im falschen Moment sehr, sehr ungünstig. Nehmen Sie diese selektive Wahrnehmung aber dennoch durchaus ernst und nutzen Sie die nächste Ausfallzeit um zu überlegen, wie wichtig es Ihnen ist, derlei Ereignisse zu minieren. Wie viel Ausfallzeit im Laufe eines Jahres wäre für Sie und Ihr Geschäft akzeptabel, bevor vielleicht nicht Ihr Laptop, aber der Kunde Sie frisst? Ein paar Tage, Stunden oder Minuten? Bei der Antwort darauf hilft Ihnen vielleicht die Überlegung, was Hochverfügbarkeit eigentlich ist und worauf sie sich bezieht. 

 

Nehmen wir einmal an, dass Sie einen Webshop betreiben, der auf einem Server gehostet ist. Die Verfügbarkeit des Servers ist sensationell, darum wiegen Sie sich in Sicherheit. Aber dann kommt es beim Shop immer wieder zu Ausfällen und Ihre Kunden sind verärgert. Wie kann das sein? Die Verfügbarkeit bezieht sich in diesem Beispiel auf die Hardwareseite. Die Server sind nämlich auch dann verfügbar, wenn etwas mit dem Shop nicht stimmt, weil er vielleicht durch einen weiteren Dienstleister betreut wird, der womöglich einen Fehler beim letzten Update gemacht hat. Hoppala. Als Webshop-Betreiber ärgern Sie sich natürlich, weil Sie eine andere Art von Verfügbarkeit erwartet hatten. Umso wichtiger ist es also, sich im Vorfeld klar zu machen, welche Verfügbarkeit tatsächlich benötigt wird. Hier hilft ein IT-Dienstleister, der Sie gewissenhaft berät und auf solche Aspekte hinweist, an die Sie im Vorfeld vielleicht nicht unbedingt gedacht hätten. 

 

Auf die Nachkommastellen kommt es an 

Wenn Sie online nach Hochverfügbarkeiten suchen, werden Sie kein einziges Angebot unter 99 Prozent finden. Und das klingt doch schon sensationell! Wer wird denn da so kleinkariert auf etwaige Nachkommastellen achten? Doch genau da liegt der kleine, aber sehr feine Unterschied. Ein System mit einer prozentualen Verfügbarkeit von 99 Prozent bedeutet eine jährlich erlaubte Ausfallzeit von über 80 Stunden, das entspricht mehr als zehn Arbeitstagen. Bei 99,7 Prozent schrumpft diese Zeit schon deutlich auf etwas mehr als einen Tag im Jahr zusammen. Und mit 99,99 Prozent, wie die Microsoft Azure Cloud sie bietet, bewegen wir uns bei Ausfällen von weniger als einer Stunde pro Jahr. Dazu kommt allerdings stets die Verfügbarkeit des Netzes. Wenn beispielsweise bei Bauarbeiten in Frankfurt versehentlich eine Internetleitung gekappt wird, kann ein dort beheimateter Kunde nicht mehr auf seine virtuellen Dienste zugreifen – es sei denn, er wappnet sich mit einer Backup-Lösung via 4G oder 5G, die in einem solchen Fall einspringt und ein Weiterarbeiten ermöglicht.

Eine Verfügbarkeit von 99,99 Prozent lässt sich mit der eigenen IT eines mittelständischen Unternehmens nicht wirtschaftlich abbilden. Dazu müssten die IT-Experten eine 24/7-Notrufbereitschaft haben, die Server redundant an mehreren Standorten bereitstehen und so einige andere teure Checkboxen in der Technik-Wunschliste angeklickt sein. Dabei reden wir noch gar nicht von der Sicherheit gegen Angriffe von außen. Der Cloudservice bietet hier eine wesentlich erschwinglichere Lösung – und Sie müssen Ihren Kunden nie mehr erklären, warum Sie ausgerechnet jetzt ein wichtiges Angebot nicht rüberschicken können, weil die Hardware gerade streikt. Und das wiederum lässt dann bei Ihren Kunden erst gar keine selektive Wahrnehmung irgendeiner Art aufkommen.