6.10. Backup Gatewayの監視

Backup Gatewayを作成したら、[ストレージサービス] > [バックアップストレージ] > [概要] 画面で監視できます。各チャートに以下の情報が表示されます。

  • Backup Gatewayサービスのパフォーマンス
  • ジオレプリケーションの速度とバックログ(レプリケーションを待っているデータの量)
  • オブジェクトストレージの速度とバックログ(パブリッククラウドへのアップロードを待っているデータの量)
  • マイグレーションの速度とバックログ(移行を待っているデータの量)
  • マイグレーションのキューに残っているファイルの数

Acronis Storage 1.5または1.7からバックアップを移行する場合は、ソースストレージにあるデータの量よりも移行バックログの方が大きくなります。2.xより前のバージョンのAcronis Storageでは、ネットワークで送信するデータ量の多い古いバックアップ(FES)プロトコルを使用しているからです。ソースデータのサイズとバックログの量の差は、バックアップソリューションで使用している保持ポリシーにも大きく左右されます。それでも、ターゲットに移行した後のデータが使用する領域は、ソースの領域とほぼ同じです。

時間が経過してもバックログの量が減らない場合は、データのレプリケーションや移行やアップロードの速度が十分でないということです。ネットワークの転送速度に問題がある可能性があります。その場合は、ネットワークをチェックしたりアップグレードしたりしてください。

../_images/backup_monitoring_ac.png

6.10.1. GrafanaによるBackup Gatewayの高度な監視

Backup Gatewayクラスターの高度な監視を実行するには、[監視] > [ダッシュボード] 画面に進み、[Grafanaダッシュボード] をクリックします。別のブラウザタブに事前設定済みのGrafanaダッシュボードが表示されます。そのうちの2つがAcronis Backup Gatewayの専用ダッシュボードです。チャートの詳しい説明を見るには、チャートの左隅にある [i] アイコンをクリックします。

[Acronis Backup Gateway] ダッシュボードで、以下のチャートに注目してください。

  • [アベイラビリティー]。ゲートウェイが使用不可になっていた時間帯があれば、赤で強調表示されます。その場合は、サービスの障害が発生したノードのログを調べて、問題を報告する必要があります。Backup Gatewayのログを見るには、以下のコマンドを使用します。

    # zstdcat /var/log/vstorage/abgw.log.zst
    
  • [移行/レプリケーションスループット]。移行チャートが表示されるのは、移行中の場合か、ジオレプリケーション設定でそのクラスターがマスターになっている場合です。レプリケーションチャートは、イングレス帯域幅チャートのミラーになります。

  • [移行/レプリケーションバックログ]。移行チャートは、時間がたつにつれて減っていきます。At thatレプリケーションチャートは、ゼロに近くなります。値が高い場合は、ネットワークに問題があります。

  • [速度制限/イングレス調整]。チャートが空でない場合は、基礎になっているストレージの空き領域が不足していて、Backup Gatewayがユーザー要求を調整してデータフローを遅らせています。この問題を解決するには、クラスターの記憶域スペースを増やします。詳細については、https://kb.acronis.co.jp/content/62823を参照してください。

  • [新しいクライアント接続]。このチャートで、SSL証明書の検証の問題が原因で接続の失敗率が高くなっている場合は、クライアントで無効な証明書チェーンがアップロードされています。

  • [入出力ウォッチドッグタイムアウト]。チャートが空でない場合は、基礎になっているストレージが正常でなく、必要なパフォーマンスを実現できていません。

../_images/abgw-grafana1_1.png

それぞれのクライアント要求、ファイル、および入出力操作のチャートを確認するには、上記のドロップダウンメニューから対象の項目を選択します。これらのチャートで要求や操作の失敗率が高くなっている場合や待機時間が長くなっている場合は、報告の必要な問題がBackup Gatewayで発生しています。たとえば、追加に関する要求のチャートをチェックできます。

  • [追加速度] チャートには、操作で1秒あたりに発生するバックアップエージェントからストレージへのバックアップデータフローが表示されます(1つの操作がバックアップデータの1つの大きなブロックに相当します。各ブロックのサイズは一定ではありません)。
  • [追加待機時間] チャートには、要求の処理にかかった時間が表示されます。1秒未満のピーク値もありますが、平均すると数十ミリ秒になります。
../_images/abgw-grafana1_2.png

[Acronis Backup Gatewayの詳細] ダッシュボードは、サポートチームが低レベルのトラブルシューティングのために使用できるダッシュボードです。それぞれのノード、クライアント要求、ファイル、および入出力操作を監視するには、上記のドロップダウンメニューから対象の項目を選択します。ダッシュボードで、[イベントループ非アクティブ状態] チャートが空になっていることを確認できます。そうでない場合は、このノードでBackup Gatewayが正常に稼働していないので、問題を報告する必要があります。

../_images/abgw-grafana2.png