2.6. Datenredundanz verstehen

Acronis Cyber Infrastructure schützt alle Daten, indem diese redundant gespeichert werden. Datenredundanz bedeutet, dass alle entsprechenden Daten in Teilstücke zerlegt werden und dann als Kopien über verschiedene Storage-Knoten verteilt gespeichert werden. So wird sichergestellt, dass die Daten auch dann verfügbar sind, wenn einige Storage-Knoten nicht mehr verfügbar sein sollten.

Acronis Cyber Infrastructure verwaltet eine erforderliche Anzahl der Kopien innerhalb des Clusters automatisch und gewährleistet, dass alle Kopien aktuell sind. Sollte der Zugriff auf einen Storage-Knoten verloren gehen, werden dessen Kopien durch neue ersetzt, die verteilt auf den intakten Storage-Knoten weiter vorliegen. Ist ein Storage Node nach einem solchen Ausfall wieder verfügbar, werden alle auf diesem vorliegenden veralteten Kopien aktualisiert.

Diese Redundanz wird durch eine von zwei Methoden erreicht: Replikation oder Lösch-Codierung (Englisch: Erasure Coding). Beide Methoden werden im nächsten Abschnitt genauer erläutert. Die jeweils ausgewählte Methode beeinflusst die Größe der Daten-Teilstücke und wie viele Kopien von diesen im Cluster verwaltet werden müssen. Generell erreicht man mit Replikation eine bessere Performance, während mit Lösch-Codierung mehr Speicherplatz zur Verfügung steht (siehe Tabelle).

Für jede Redundanzmethode unterstützt Acronis Cyber Infrastructure eine Reihe von Redundanzmodi. Die folgende Tabelle verdeutlicht den Daten-Overhead für die verschiedenen Redundanzmodi. Die ersten drei Zeilen gelten für Replikationen und die anderen für Lösch-Codierungen.

Tab. 2.6.1 Vergleich der Redundanzmodi
Redundanzmodus Erforderliche Mindestanzahl der Knoten Wie viele Knoten können ohne Datenverlust ausfallen Storage-Overhead (%) Erforderlicher Raw-Speicherplatz für 100 GB Daten
1 Replikat (keine Redundanz) 1 0 0 100GB
2 Replikate 2 1 100 200GB
3 Replikate 3 2 200 300GB
Codierung 1+0 (keine Redundanz) 1 0 0 100GB
Codierung 1+1 2 1 100 200GB
Codierung 1+2 3 2 200 300GB
Codierung 3+1 4 1 33 133 GB
Codierung 3+2 5 2 67 167GB
Codierung 5+2 7 2 40 140GB
Codierung 7+2 9 2 29 129GB
Codierung 17+3 20 3 18 118GB

Bemerkung

Die Codierungsmodi 1+0, 1+1, 1+2 und 3+1 sind für kleine Cluster gedacht, die anfänglich nicht genügend Knoten für andere Lösch-Codierungsmodi haben, aber zukünftig noch wachsen werden. Da der Redundanztyp nach der ersten Festlegung nicht mehr geändert werden kann (also von Replikation zu Lösch-Codierung bzw. umgekehrt), ermöglicht dieser Modus die Verwendung von Lösch-Codierung, auch wenn der betreffende Cluster kleiner als empfohlen ist. Sobald der Cluster wächst, kann ein vorteilhafterer Redundanzmodus gewählt werden.

Sie wählen eine Redundanzmodus, wenn Sie Storage-Services konfigurieren und Storage-Volumes für virtuelle Maschinen erstellen. Egal, welchen Redundanzmodus Sie wählen: wir empfehlen dringend, den Cluster vor einem gleichzeitigen Ausfall von zwei Knoten zu schützen, da ein solcher Ausfall im praktischen Einsatz häufiger vorkommt.

Alle Redundanzmodi erlauben Schreiboperationen, wenn ein (1) Storage-Knoten nicht erreichbar ist. Wenn zwei Storage-Knoten nicht erreichbar sind, können Schreiboperationen eingefroren werden, bis sich der Cluster wieder selbst geheilt hat.

2.6.1. Redundanz durch Replikation

Beim Replikationsverfahren zerteilt Acronis Cyber Infrastructure die eingehenden Datenströme in Chunks (Datenblöcke) von 256 MB. Jeder Chunk wird repliziert und die Replikate werden auf den verschiedenen Storage-Knoten gespeichert, sodass jeder Knoten nur je über ein Replikat eines bestimmten Chunks verfügt.

Das nachfolgende Diagramm illustriert den 2-Replikate-Redundanzmodus.

../_images/stor_image8.png

Die Replikation bei Acronis Cyber Infrastructure gleicht dem Neuaufbau-Prozess bei einem RAID, weist allerdings zwei wesentliche Unterschiede auf:

  • Die Replikation bei Acronis Cyber Infrastructure ist viel schneller als bei einem typischen RAID 1/5/10-Neuaufbau. Das ist darin begründet, dass Acronis Cyber Infrastructure alle Chunks parallel zu den mehrfachen Storage-Knoten repliziert.
  • Je mehr Storage-Knoten in einem Cluster vorliegen, desto schneller erholt sich der Cluster, wenn eine Festplatte oder ein Knoten ausfallen sollte.

Die hohe Replikations-Performance minimiert die Zeiten, in denen der Cluster mit verringerter Redundanz läuft. Folgende Faktoren beeinflussen die Replikations-Performance:

  • Die Anzahl der verfügbaren Storage-Knoten. Da die Replikation parallel abläuft, ist diese umso schneller, je mehr verfügbare Replikationsquellen/-ziele es gibt.
  • Die Performance der Storage-Knoten-Laufwerke.
  • Die Netzwerk-Performance. Alle Replikate werden über das Netzwerk zu den verschiedenen Storage-Knoten verteilt. Der Durchsatz eines 1 Gbit/s-Netzwerkes kann bespielsweise als Flaschenhals wirken (vergl. ‚Anforderungen und Empfehlungen für das Netzwerk pro Knoten‘).
  • Die Verteilung der Daten im Cluster. Einige Storage-Knoten haben möglicherweise weit mehr Daten zu replizieren als andere und könnten daher während der Replikation überlastet werden.
  • I/O-Aktivität im Cluster während der Replikation.

2.6.2. Redundanz durch Lösch-Codierung

Beim Lösch-Codierungsverfahren zerlegt Acronis Cyber Infrastructure die eingehenden Datenströme in Fragmente einer bestimmten Größe. Anschließend wird jedes Fragment in eine bestimmte Anzahl (M) von 1-Megabyte-Stücken zerteilt und eine bestimmte Anzahl (N) von Paritätsstücken für die Redundanz erstellt. Alle Teilstücke werden auf M+N Storage-Knoten verteilt, d.h. je ein Teilstück pro Knoten. Auf den Storage-Knoten werden die Teilstücke als gleichmäßige Chunks von 256 MB gespeichert. Diese Chunks werden aber nicht mehr repliziert, da bereits Redundanz erreicht ist. Der Cluster kann den Ausfall von beliebigen N Speicherknoten überstehen, ohne dass es zu Datenverlusten kommt.

Die Werte von M und N werden im Namen des jeweiligen Lösch-Codierungs-Redundanzmodus angegeben. Beim 5+2-Modus beispielsweise werden die einkommenden Daten zuerst in Fragmente von je 5 MB aufgebrochen, jedes Fragment wird dann in fünf Teilstücke von je 1 MB zerteilt und dann werden – aus Redundanzgründen – zwei weitere 1-MB-Paritätsstücke hinzugefügt. Wenn N den Wert 2 hat, werden die Daten nach dem RAID-6-Schema kodiert – und wenn N größer als 2 ist, werden Lösch-Codes verwendet.

Das untere Diagramm illustriert dden 5+2-Modus.

../_images/stor_image9.png

2.6.3. Ohne Redundanz

Warnung

Datenverlustsgefahr!

Ohne Redundanz werden die Chunks einzeln auf den Storage-Knoten gespeichert, also ein Chunk pro Knoten. Wenn der Knoten ausfällt, können die Daten verloren gehen. Wir raten dringend davon ab, ohne Redundanz zu arbeiten, egal in welchem Szenario – außer Sie wollen Acronis Cyber Infrastructure auf einem einzigen Server evaluieren.