Backup Storage überwachen

Wenn Sie den Backup Storage erstellt haben, können Sie diesen mithilfe der Anzeige Storage-Services –> Backup Storage –> Überblick überwachen. In den Diagrammen werden folgende Informationen angezeigt:

  • Knoten. Das Diagramm zeigt die Anzahl und Verfügbarkeit der Knoten im Backup Storage-Cluster an.
  • Performance. Das Diagramm zeigt die Lese- und Schreibaktivität der Backup Storage-Services über einen bestimmten Zeitraum an.
  • Georeplikation. Das Diagramm zeigt die Geschwindigkeit der Georeplikation sowie deren Rückstand an (also die Daten, die noch auf ihre Replikation warten) Wenn sich der Rückstand der Georeplikation mit der Zeit nicht verringert, bedeutet dies, dass die Daten nicht schnell genug repliziert werden können. Dies kann an einer unzureichenden Netzwerkübertragungsgeschwindigkeit liegen, sodass Sie möglicherweise Ihr Netzwerk überprüfen oder aktualisieren müssen.
  • Anhänglatenz. Das Diagramm zeigt an, wie viel Zeit benötigt wird, um Anfragen der Backup-Agenten an den Storage zu verarbeiten.
  • Anhängdrosselung. Wenn das Diagramm nicht leer ist, bedeutet dies, dass der zugrunde liegenden Storage zu wenig freien Speicherplatz hat und der Backup Storage Benutzeranforderungen drosselt, um den Datenflusses zu verlangsamen.
  • Objekt-Storage. Das Diagramm zeigt die Geschwindigkeit des Objekt-Storages sowie dessen Rückstand an (also die Daten, die auf das Hochladen in die Public Cloud warten) Wenn sich der Rückstand des Objekt-Storages mit der Zeit nicht verringert, bedeutet dies, dass die Daten nicht schnell genug hochgeladen werden können. Dies kann an einer unzureichenden Netzwerkübertragungsgeschwindigkeit liegen, sodass Sie möglicherweise Ihr Netzwerk überprüfen oder aktualisieren müssen.

Sie können auch Backup Storage-Knoten überwachen. Gehen Sie dafür zu Storage-Services –> Backup Storage –> Knoten und klicken Sie auf den gewünschten Knoten. Im rechten Fensterbereich werden in der Registerkarte Überblick die Performance-Statistiken angezeigt:

  • CPU/RAM: CPU-Nutzung (in Prozent) über einen bestimmten Zeitraum und RAM-Nutzung (in GiB) über einen bestimmten Zeitraum
  • Anforderungsrate 'Erfolgreich/Fehlgeschlagen': die Anzahl der erfolgreichen sowie fehlgeschlagenen Anforderungen vom Typ 'Anhängen' pro Sekunde
  • Anforderungensrate 'Ausgehend/Eingehend': die Anzahl der Lese- und Schreibanforderungen pro Sekunde
  • Durchsatz: die Datenmenge, die pro Sekunde aus dem Backup Storage gelesen bzw. zu diesem geschrieben wird
  • Anfragelatenz: die Zeit, die zur Verarbeitung von Anfragen benötigt wird

Erweitertes Monitoring des Backup Gateways über Grafana

Gehen Sie für eine erweiterte Überwachung des Backup Gateway-Clusters zur Anzeige Monitoring –> Dashboard und klicken Sie dann auf Grafana Dashboard. Es wird eine separate Browser-Registerkarte mit vorkonfigurierten Grafana Dashboards geöffnet, von denen zwei für das Acronis Backup Gateway bestimmt sind. Sie können für jedes Diagramm eine detaillierte Beschreibung erhalten, wenn Sie in der linken Ecke auf das i-Symbol klicken.

Sie müssen auf dem Acronis Backup Gateway-Dashboard die folgenden Diagramme beachten:

  • Verfügbarkeit. Jeder Zeitraum, in dem die Gateways nicht verfügbar waren, wird rot hervorgehoben. In diesem Fall müssen Sie sich die Protokolle auf den Knoten mit dem ausgefallenen Service ansehen und ein Problem melden. Verwenden Sie den folgenden Befehl, um das Backup Gateway-Protokoll (Log) einzusehen:

    # zstdcat /var/log/vstorage/abgw.log.zst
    
  • Migration/Replikationsdurchsatz. Das Migrationsdiagramm sollte während der Migration angezeigt werden – oder wenn der Cluster als Master in einer Georeplikationskonfiguration dient. Das Replikationsdiagramm sollte das Eingangsbandbreitendiagramm widerspiegeln.

  • Migration/Replikationsdatenrückstand. Das Migrationsdiagramm sollte mit der Zeit einen abnehmenden Verlauf zeigen. Das Replikationsdiagramm sollte nahe Null liegen; hohe Werte weisen auf Netzwerkprobleme hin.

  • Ratenbegrenzung/Eingangsdrosselung. Wenn das Diagramm nicht leer ist, bedeutet dies, dass der zugrunde liegenden Storage zu wenig freien Speicherplatz hat und das Backup Gateway Benutzeranforderungen drosselt, um den Datenflusses zu verlangsamen. Fügen Sie dem Cluster mehr Speicherplatz hinzu, um das Problem zu lösen. Weitere Informationen dazu finden Sie unter: https://kb.acronis.com/content/62823.

  • Neue Client-Verbindungen. Eine hohe Rate von fehlgeschlagenen Verbindungen aufgrund von SSL-Zertifikat-Verifizierungsproblemen im Diagramm bedeutet, dass Clients eine ungültige Zertifikatskette hochgeladen haben.

  • IO-Watchdog-Zeitüberschreitung. Wenn das Diagramm nicht leer ist, bedeutet dies, dass der zugrunde liegenden Storage nicht fehlerfrei ist und nicht die erforderliche Performance liefern kann.

Um die Diagramme für eine bestimmte Client-Anforderung, Datei- und I/O-Operation einzusehen, müssen Sie diese aus den oberen Dropdown-Menüs auswählen. Eine hohe Rate von fehlgeschlagenen Anforderungen oder Operationen und hohe Latenzen in diesen Diagrammen deuten darauf hin, dass das Backup Gateway Probleme hat, die gemeldet werden sollten. So können Sie beispielsweise die Diagramme für die Anforderung 'Anhängen' überprüfen:

  • Das Diagramm Anhängrate zeigt den Backup-Datenfluss von den Backup Agenten zum Storage in 'Operationen pro Sekunde' an (eine Operation entspricht einem großen Block von Backup-Daten, wobei die Blöcke unterschiedlich groß sein können).
  • Das Diagramm Anhänglatenz zeigt die zur Bearbeitung von Anforderungen aufgewendete Zeit an und sollte mehrere zehn Millisekunden betragen (wobei die Spitzenwerte unter einer Sekunde liegen sollten).

Das Dashboard Acronis Backup Gateway-Details ist zur Fehlersuche auf niedriger Ebene durch das Support-Team vorgesehen. Um einen bestimmten Knoten, Client-Anforderung, Datei- und I/O-Operation zu überwachen, müssen Sie diese aus den oberen Dropdown-Menüs auswählen. Sie können auf dem Dashobard überprüfen, dass das Diagramm Inaktität der Ereignisschleife leer ist. Denn anderenfalls ist das Backup Gateway auf diesem Knoten nicht fehlerfrei und das Problem muss gemeldet werden.