2.6. Knoten-Wartung durchführen

Jedes Mal, wenn Sie Service-Operationen auf einem Cluster-Knoten durchführen müssen, müssen Sie diesen in den Wartungsmodus versetzen. Wenn Sie dies tun, hört der Knoten damit auf, neue Storage-Daten-Chunks zuzuweisen, führt aber weiterhin I/O-Operationen für die Kern-Storage-Services (wie MDS, CS und Cache) aus. Andere Services des Knotens (Compute, Backup Gateway, iSCSI, S3 und NFS) können entweder verlagert werden oder während der Wartung unverändert bleiben. Sobald sich der Knoten im Wartungsmodus befindet, können Sie ihn herunterfahren und Service-Aktionen mit diesem durchführen. Schalten Sie den Knoten wieder ein, sobald Sie fertig sind, und nehmen ihn über das Admin-Panel wieder in Betrieb.

Wichtig

Wir empfehlen, fünf Metadaten-Services (MDS) im Storage-Cluster zu haben. Wenn dann ein Knoten, auf dem der MDS läuft, während der Wartung heruntergefahren wird, kann der Cluster den Ausfall eines anderen Knotens überleben.

Bevor Sie einen Knoten in den Wartungsmodus versetzen, sollten Sie Folgendes tun:

  • Wenn der Knoten virtuelle Maschinen hostet, werden diese verlagert (verschoben). Stellen Sie sicher, dass andere Compute-Knoten über genügend Ressourcen verfügen, um diese VMs aufnehmen zu können.
  • Wenn der Knoten iSCSI-Ziele hostet, müssen Sie sicherstellen, dass die iSCSI-Initiatoren so konfiguriert sind, dass sie mehrere IP-Adressen aus derselben Zielgruppe verwenden.
  • Wenn auf dem Knoten ein S3-Gateway läuft, müssen Sie dessen IP-Adressen aus den DNS-Einträgen der S3-Zugriffspunkte entfernen. Anderenfalls kann es bei einigen der S3-Clients zu Verbindungstimeouts kommen.

Gehen Sie folgendermaßen vor, wenn Sie einen Knoten in den Wartungsmodus versetzen wollen:

  1. Klicken Sie in der Anzeige INFRASTRUKTUR –> Knoten auf den gewünschten Knoten.

  2. Klicken Sie in der Knoten-Übersichtsanzeige auf Wartung aktivieren.

  3. Bestimmen Sie im Fenster Wartung aktivieren, ob die folgenden Workloads während der Wartung evakuiert oder ignoriert werden sollen:

    • Block-Storage. iSCSI-Zielgruppen sind hochverfügbar, wobei mehrere Ziele auf verschiedenen Knoten laufen. Wenn der Knoten in den Wartungsmodus wechselt, wird das von ihm gehostete Ziel gestoppt und der bevorzugte Pfad innerhalb von 60 Sekunden zu einem anderen Knoten in der Zielgruppe verschoben. So wird der Service während der Wartung nicht unterbrochen.
    • Block-Storage (Version 2.4 oder niedriger). Ältere iSCSI-Ziele, die mit Version 2.4 oder früher erstellt wurden, werden aus dem Knoten evakuiert und nach Abschluss der Wartung wieder zurück migriert. Um dies zu vermeiden, sollten Sie alte Ziele in neue Ziele konvertieren (wie im Abschnitt ‚iSCSI-Ziele älterer Versionen verwalten‘ beschrieben).
    • Compute. Mit dem Evakuieren von virtuellen Maschinen aus einem Knoten ist gemeint, dass diese nacheinander und live (im aktiven Betrieb) zu anderen Compute-Knoten migriert werden. Sollten Sie diese ignorieren, dann werden sie so lange weiter ausgeführt, bis Sie den Knoten neu gestartet oder heruntergefahren haben. In diesem Fall werden sie gestoppt und abgelegt, was eine Ausfallzeit bewirkt. Sie werden auch nicht automatisch gestartet, wenn der Knoten wieder hochgefahren wurde.

      Wichtig

      Angehaltene VMs können nicht aus einem Knoten evakuiert werden und werden ignoriert.

    • S3. Sie können S3-Services aus diesem Knoten evakuieren und zu andere Knoten im S3-Cluster migrieren oder die Services ignorieren. Im letzteren Fall werden sie weiter ausgeführt, bis Sie den Knoten neu starten oder herunterfahren, was eine Ausfallzeit bewirkt. Sie werden automatisch wieder gestartet, sobald der Knoten hochgefahren wurde.

    • NFS: Sie können NFS-Services aus diesem Knoten evakuieren und zu andere Knoten im NFS-Cluster migrieren oder die Services ignorieren. Im letzteren Fall werden sie weiter ausgeführt, bis Sie den Knoten neu starten oder herunterfahren, was eine Ausfallzeit bewirkt. Sie werden automatisch wieder gestartet, sobald der Knoten hochgefahren wurde.

    • ABGW. Der Service ist hochverfügbar, mit mehreren Instanzen, die über verschiedene Knoten verteilt sind. Wenn Sie für diesen Knoten den Wartungsmodus aktivieren, wird eine der Instanzen gestoppt, während die anderen jedoch weiterarbeiten, damit der Service nicht unterbrochen wird.

    Mit Cluster-Selbstreparatur ist die automatische Wiederherstellung von Storage-Cluster-Daten gemeint, die nicht mehr verfügbar sind, wenn ein Storage-Knoten (oder ein Laufwerk) offline geht. Wenn dies während einer Wartung passiert, wird die Selbstreparatur des Clusters verzögert (standardmäßig um 30 Minuten), um Cluster-Ressourcen zu sparen. Wenn der Knoten vor Ablauf dieser Verzögerung wieder online geht, ist keine Selbstreparatur erforderlich.

    Sie können die Zeitüberschreitung für die Replikation manuell anpassen, indem Sie den Parameter mds.wd.offline_tout_mnt (in Millisekunden) festlegen – und zwar über den Befehl vstorage -c <cluster_name> set-config.

    Zusätzlich werden alle nicht redundanten Daten-Chunks auf dem Knoten nicht mehr verfügbar sein, wenn der Knoten offline geht. Sie werden jedoch zu anderen Storage-Knoten verschoben, wenn Sie das Kontrollkästchen Nicht redundante Daten verschieben aktivieren. Sie können auch temporär zu einer anderen Storage-Ebene verschoben werden, wenn die derzeitige Ebene voll ist.

    Grundsätzlich werden alle Chunck-Services (CSs) auf dem Knoten auch im Wartungsmodus weiterhin Daten liefern – außer, der Knoten geht offline. Sie werden jedoch nicht für die Zuweisung neuer Daten verwendet. Wenn ein Knoten daher in den Wartungsmodus versetzt wird, kann dies den freien Speicherplatz im Storage-Cluster verringern.

    ../_images/stor_image192_ac.png
  4. Klicken Sie auf Eingeben.

Wenn ein Serivce aus irgendeinem Grund nicht aus dem Knoten evakuiert werden kann, wird das Wechseln in den Wartungsmodus angehalten. Sie müssen dann entscheiden, wie fortgefahren werden soll: ‚Wartung beenden‘, sodass alle Services auf dem Knoten zu ihrem normalen Stadium zurückgehen – oder ‚Wartung erzwingen‘, so dass die Services, die nicht evakuiert werden konnten, beim Neustart oder Herunterfahren des Knotens angehalten werden. Klicken Sie in der Knoten-Übersichtsanzeige auf Wartung aktivieren, wählen Sie die gewünschte Aktion und klicken Sie auf Weiter.

../_images/stor_image193_ac.png

Knoten im Wartungsmodus können wieder in Betrieb genommen oder freigegeben werden.

Wenn Sie einen Knoten wieder in Betrieb nehmen wollen, müssen Sie in dessen Übersichtsanzeige auf den Befehl Wartung beenden klicken.

../_images/stor_image194_ac.png