Connect with Kyndryl

Follow Kyndryl

RTO (Recovery Time Objective) erklärt

Was ist RTO (Recovery Time Objective)?

RTOs stellen die Zeitspanne dar, in der eine Anwendung ausfallen kann, ohne dass ein signifikanter Schaden für ein Unternehmen entsteht, sowie die Zeit, die das System vom Ausfall bis zur Wiederherstellung benötigt. Dieser Wiederherstellungsprozess umfasst die Schritte, die die IT-Abteilung unternehmen muss, um die Anwendung und ihre Daten wieder in den Zustand vor dem Ausfall zu versetzen. Für Anwendungen mit hoher Priorität kann ein RTO sicher in Sekunden ausgedrückt werden, sofern die IT-Abteilung in Failover-Services investiert hat. RTOs erfordern, dass Ihre IT-Abteilung Anwendungen zunächst nach ihrer Priorität und dem Risiko eines Geschäftsverlusts sortiert. Die IT-Abteilung teilt diesen Anwendungen dann den entsprechenden Anteil der Unternehmensressourcen zu, nämlich Zeit, Geld und IT-Infrastruktur.

Festlegen eines RTO

RTOs werden verwendet, um zu messen, wie viel Zeit die IT-Abteilung nach der Störung für die Wiederherstellung der Daten benötigt. Als Bemessungsgrundlage stellen die RTOs den Gesamtbedarf Ihres Unternehmens dar und bestimmen, wie lange Ihr Unternehmen ohne IT-Infrastruktur und -Services überleben kann. Die RTOs müssen zunächst mit den Möglichkeiten Ihrer IT-Abteilung abgeglichen werden. IT-Administratoren müssen die verschiedenen Arten von Wiederherstellungsgeschwindigkeiten genau kennen, um einen RTO zu berechnen, der den Anforderungen des Unternehmens entspricht. So kann beispielsweise ein RTO von einer Stunde nicht eingehalten werden, wenn die minimal mögliche Wiederherstellungszeit zwei Stunden beträgt.

Da der Prozess die Wiederherstellung des gesamten IT-Betriebs beinhaltet, sind RTOs oft kompliziert. Ihre IT-Abteilung kann einen Teil des Wiederherstellungsprozesses rationalisieren, indem sie so viel wie möglich automatisiert. Der RTO kann höhere Kosten verursachen als ein granularer RPO, und ein anspruchsvoller RTO betrifft Ihre gesamte Unternehmensinfrastruktur und nicht nur Daten. Die Kosten für das Erreichen eines RTO oder RPO richten sich nach der Priorisierung von Anwendungen und Daten durch Ihre IT-Abteilung. Die IT-Abteilung priorisiert Anwendungen und Daten auf der Grundlage von Einnahmen und Risiko. Wenn die Daten einer Anwendung reguliert sind, kann ein Datenverlust dieser App zu hohen Geldstrafen führen, unabhängig davon, wie oft diese App verwendet wird.

Erreichen eines RTO oder RPO nahe Null

Während RTOs und RPOs in Bezug auf die Anwendungs- und Datenpriorität variieren, ist es für jedes Unternehmen unglaublich kostspielig, einen RTO oder RPO nahe Null für alle seine Anwendungen zu erreichen. Eine 100-prozentige Verfügbarkeitszeit für RTO und null Datenverluste für RPO können nur durch Investitionen in kontinuierliche Datenreplikation und virtuelle Umgebungen erreicht werden.

Beispiel für einen RTO

Die granulare Elementwiederherstellung ist ein Beispiel für einen RTO. In diesem Beispiel löscht ein Benutzer in einem großen Unternehmen eine wichtige E-Mail und leert den Papierkorb. Dieses Unternehmen verwendet Microsoft Exchange als geschäftskritische Anwendung und seine IT-Abteilung sichert ständig Änderungen auf Delta-Ebene in Exchange zusammen mit einer Backup-App, die eine granulare Sicherung und Wiederherstellung bietet. Diese Funktion ermöglicht es der IT-Abteilung, die wichtige E-Mail in etwa fünf Minuten wiederherzustellen, anstatt eine komplette virtuelle Maschine für nur eine E-Mail wiederherzustellen.

Was ist ein Recovery Time Objective (RTO) und wie wirkt es sich auf die Disaster-Recovery in Ihrem Unternehmen aus?

Disaster-Recovery und ein RTO

Stromausfälle. Diebstahl. Beschädigte Server und Festplatten. Cyberattacken und Ransomware. Tornados, Erdbeben und Wirbelstürme. Es gibt viele verschiedene Arten von Katastrophen, die Ihr Unternehmen in Mitleidenschaft ziehen können, wenn Sie nicht auf sie vorbereitet sind. Da diese Katastrophen oft unvermeidbar sind, sind eine starke IT-Infrastruktur und die Festlegung regelmäßiger Wiederherstellungszeiten und -punkte für die Unterstützung Ihrer Wiederherstellung unerlässlich. Es ist möglich, dass Ihre IT-Abteilung ein Failover einer Anwendung und eine Replikation Ihrer Daten durchführt, um den Verlust nahezu auszuschließen, allerdings erfordert dies erhebliche Ressourcen. Ihre IT-Abteilung muss einen RTO festlegen, der auf der Anwendungspriorität und dem zugewiesenen Budget und den Ressourcen basiert.

Was ist ein RPO und wie unterscheiden sich RTOs?

Die RTOs decken sich mit den Recovery Point Objectives (RPOs), einer Messung der Zeit ab einem Ausfall, einer Katastrophe oder einem ähnlichen verlustverursachenden Ereignis. RPOs berechnen die Zeit zurück bis zu dem Zeitpunkt, an dem Ihre Daten zum letzten Mal nutzbar waren, vermutlich das letzte Backup. RPOs und RTOs sind wichtige Konzepte für die Geschäftskontinuität und sind notwendige Geschäftsmetriken, um zu bestimmen, wie oft Ihr Unternehmen seine Datensicherungen planen sollte.

Orchestrierung für Ausfallsicherheit und Disaster Recovery

Es gibt viele Herausforderungen für eine Disaster-Recovery-Strategie, insbesondere für eine Disaster-Recovery in einer hybriden IT-Umgebung. Zu diesen Herausforderungen gehören unter anderem die folgenden:

  • In verschiedenen Umgebungen implementierte Workloads
  • Interdependenzen zwischen IT-Infrastruktur und Anwendungen
  • Wiederherstellung aller Geräte, Komponenten und Anwendungen bis zum RPO und Wiederherstellung des vollen Geschäftsbetriebs
  • Die Systemwiederherstellung kann weiter verzögert werden, wenn Systeme und Anwendungen in der falschen Reihenfolge wiederhergestellt werden.

Was kann man tun, um trotz aller Hindernisse eine erfolgreiche Disaster-Recovery-Strategie zu entwickeln und umzusetzen? Die Wiederherstellung einiger kritischer Anwendungen innerhalb weniger Stunden ist mit dem richtigen IT-Team grundsätzlich möglich, erfordert aber eine Menge wertvoller Ressourcen. Die heutigen Anforderungen sind gute RTOs und RPOs und eine Systemwiederherstellung, bei der mehrere geschäftskritische Anwendungen schnell wiederhergestellt werden. Es ist jetzt möglich, die Auswirkungen der Unterbrechung zu minimieren und eine Wiederherstellung innerhalb von Minuten nach einem Ausfall durchzuführen. Automatisierung ist von entscheidender Bedeutung und ermöglicht die Skalierung von Disaster-Recovery-Programmen, indem Workflows zwischen verschiedenen Anwendungen schnell und zuverlässig beim Übergang zu hybriden Umgebungen automatisiert werden.

Die heutige Resiliency-Orchestration-Technologie hilft Ihnen, Ihre Disaster-Recovery-Strategie erfolgreich zu implementieren und die Anforderungen an Produktionsausfälle und die Gefährdung des Unternehmens durch Ausfälle zu reduzieren. In Bezug auf die Vorbereitung hilft die Orchestrierung für Ausfallsicherheit Unternehmen, Disaster-Recovery-Tests mit weniger Personal erfolgreich durchzuführen. Die Orchestrierung für Ausfallsicherheit hilft diesen Unternehmen auch, die Vorbereitung und Validierung von Disaster-Recovery-Drills zu reduzieren. Einer der Hauptvorteile der Resiliency-Orchestration-Technologie ist ihre Fähigkeit, über physische, virtuelle und Cloud-Umgebungen hinweg zu funktionieren und dabei die Anwendungserkennung aufrechtzuerhalten. Da Self-Service und niedrige Service-Level-Agreement-Parameter immer mehr zu den Erwartungen der Endanwender an Cloud-Services werden, werden orchestrierungsbasierte Ausfallsicherheitsstrategien für moderne Unternehmen, die Cloud-Umgebungen einführen wollen, immer wichtiger.