Die Daten-Flushing-Fähigkeiten von Laufwerken überprüfen

Sie sollten unbedingt alle Storage-Geräte, die Sie in Ihren Cluster aufnehmen wollen, daraufhin überprüfen, ob diese im Cache zwischengespeicherte Daten auf das Laufwerk übertragen können, wenn die Stromversorgung des Servers unerwartet unterbrochen werden sollte. Auf diese Weise ermitteln Sie Geräte, die bei einem Stromausfall möglicherweise Daten verlieren.

Acronis Cyber Infrastructure wird mit dem Tool vstorage-hwflush-check ausgeliefert, mit dem Sie ein Storage-Gerät darauf überprüfen können, wie dieses Daten bei einem Notfall aus dem Cache auf das Laufwerk speichert. Das Tool ist als Client-/Server-Utility implementiert:

  • Der Client schreibt kontinuierlich Datenblöcke auf das Storage-Gerät. Wenn ein Datenblock geschrieben wurde, erhöht der Client einen speziellen Zähler und sendet diesen an den Server, der ihn aufbewahrt.
  • Der Server verfolgt die eingehenden Zähler des Clients, sodass der Server immer weiß, welche Zählernummer der Client als nächstes senden wird. Wenn der Server einen Zähler erhält, der kleiner als derjenige ist, der bereits auf dem Server gespeichert wurde (z.B. weil die Stromversorgung ausgefallen ist und das Storage-Gerät die Daten im Cache nicht auf den permanenten Datenträger geschrieben hat), meldet der Server einen Fehler.

Gehen Sie folgendermaßen vor, um zu überprüfen, ob ein Storage-Gerät bei einem Stromausfall im Cache befindliche Daten erfolgreich auf das Laufwerk schreiben kann:

  1. Führen Sie auf einem Knoten den Server aus:
  2. # vstorage-hwflush-check -l
  3. Führen Sie auf einem anderen Knoten, der das zu testende Storage-Gerät hostet, den Client aus. Beispiel:

    # vstorage-hwflush-check -s vstorage1.example.com -d /vstorage/stor1-ssd/test -t 50

    wobei gilt:

    • vstorage1.example.com ist der Host-Name des Servers.
    • /vstorage/stor1-ssd/test ist das Verzeichnis, das zum Testen des Daten-Flushing verwendet werden soll. Während der Ausführung erstellt das Client-Tool eine Datei in diesem Verzeichnis und schreibt Datenblöcke in diese.
    • 50 ist die Anzahl der Threads, die das Client-Tool zum Schreiben von Daten auf das Laufwerk verwenden soll. Zu jedem Thread gehört eine eigene Datei und ein eigener Zähler. Sie können die Anzahl der Threads erhöhen (auf maximal 200), um Ihr System mit einer höheren Belastung zu testen. Sie können auch noch andere Optionen für die Ausführung des Client-Tools spezifizieren. Weitere Informationen zu den verfügbaren Informationen finden Sie in der Dokumentation (Manpage) zu vstorage-hwflush-check.
  4. Warten Sie mindestens 10-15 Sekunden, trennen Sie die Stromversorgung vom Client-Knoten (drücken Sie entweder die Power-Taste oder ziehen das Netzkabel heraus) und schalten Sie ihn dann wieder ein.

  5. Starten Sie das Client-Tool neu:
# vstorage-hwflush-check -s vstorage1.example.com -d /vstorlage/stor1-ssd/test -t 50

Nach dem Start liest das Client-Tool alle zuvor geschriebenen Daten, bestimmt die Version der Daten auf dem Laufwerk und startet den Test dann vom letzten gültigen Zähler ausgehend neu. Anschließend sendet es diesen gültigen Zähler an das Server-Tool, und dieses vergleicht den Zähler mit dem letzten, den es selbst hat. Sie sehen eine Ausgabe wie diese:

id<N>:<Zähler_auf_dem_Laufwerk> -> <Zähler_auf_dem_Server>

was Folgendes bedeuten kann:

  • Wenn der Zähler auf dem Laufwerk niedriger ist als der Zähler auf dem Server, bedeutet dies, dass das Storage-Gerät keine Daten aus dem Cache auf den Datenträger schreiben konnte. Dieses Storage-Gerät sollten Sie möglichst nicht im Produktiveinsatz verwenden (insbesondere nicht für CS und Journals), da hier das Risiko von Datenverlusten besteht.
  • Wenn der Zähler auf dem Laufwerk höher ist als der Zähler auf dem Server-Tool, bedeutet dies, dass das Storage-Gerät die Daten zwar aus dem Cache auf den permanenten Datenträger geschrieben hat, das Client-Tool dies aber nicht mehr an das Server-Tool melden konnte. Möglicherweise ist das Netzwerk zu langsam oder das Storage-Gerät ist für die vorgegebene Thread-Anzahl zu schnell, sodass Sie deren Erhöhung in Betracht ziehen sollten. Ein solches Storage-Gerät kann für den Produktiveinsatz verwendet werden.
  • Wenn beide Zähler gleich sind, bedeutet dies, dass das Storage-Gerät die Daten aus dem Cache auf den Datenträger geschrieben hat und dass das Client-Tool dies dem Server-Tool gemeldet hat. Ein solches Storage-Gerät kann für den Produktiveinsatz verwendet werden.

Wenn Sie auf der sicheren Seite sein wollen, sollten Sie den Vorgang mehrmals wiederholen. Fahren Sie nach dem ersten Storage-Gerät mit der Überprüfung der übrigen Geräte fort, die Sie im Cluster verwenden wollen. Sie müssen alle Geräte testen, die Sie im Cluster verwenden wollen: SSD-Laufwerke für CS-Journaling, Laufwerke für MDS-Journale und Chunk-Server.