3.8. ノードのメンテナンスの実行

クラスターノードでサービス操作を実行する必要がある場合は常に、クラスターノードをメンテナンスモードにします。メンテナンスモードにすると、ノードはストレージデータの新しいチャンクの割り当てを停止しますが、MDS、CS、キャッシュなどの主要なストレージサービスのI/O操作は実行し続けます。他のサービス(計算、Backup Gateway、iSCSI、S3、およびNFS)は、メンテナンス中に再配置するか、そのままにすることができます。ノードがメンテナンスモードになったら、ノードをシャットダウンしてノードでサービス操作を実行できます。完了したら、ノードの電源を入れ、管理者パネルでノードを稼働中に戻します。

重要

ストレージクラスターに5つのMDSサービスを用意することをお勧めします。こうすることで、MDSサービスを実行しているノードがメンテナンス中にシャットダウンされても、クラスターは別のノードの障害に耐えることができます。

ノードをメンテナンスモードにする前に、以下の点を確認してください。

  • ノードが仮想マシンをホストしている場合、仮想マシンは再配置されます。その他の計算ノードにこのVMを配置するだけの十分なリソースがあることを確認してください。
  • ノードがiSCSIターゲットをホストしている場合、iSCSIイニシエータが同一のターゲットグループの複数のIPアドレスを使用するように構成されていることを確認してください。
  • ノードがS3ゲートウェイを実行している場合、そのIPアドレスをS3アクセスポイントのDNSレコードから削除してください。削除しなかった場合、一部のS3クライアントで接続タイムアウトが発生する可能性があります。

ノードをメンテナンスモードにするには、以下の手順を実行します。

  1. [インフラストラクチャ] > [ノード] 画面で、目的のノードの行をクリックします。

  2. ノードの右側のペインで、[メンテナンスに入る] をクリックします。

  3. [メンテナンスに入る] ウィンドウで、メンテナンス中に以下のワークロードを退避または無視することを選択します。

    • ブロックストレージ。iSCSIターゲットグループは可用性が高く、複数のターゲットが異なるノードで実行されています。ノードがメンテナンスに入ると、そのノードでホストされているターゲットは停止され、優先パスは60秒以内にターゲットグループ内の別のノードに移動します。このため、サービスはメンテナンス中に中断されません。
    • ブロックストレージ(バージョン2.4以前)。バージョン2.4以前に作成された古いiSCSIターゲットはノードから退避され、メンテナンス後に戻されます。これを回避するために、レガシーiSCSIターゲットの管理の説明に従って古いターゲットを新しいターゲットグループに変換することをお勧めします。
    • 計算。ノードから仮想マシンを退避させると、仮想マシンは1つずつ別の計算ノードにライブで移行されます。仮想マシンを無視することを選択した場合、仮想マシンはノードを再起動またはシャットダウンするまで動作し続けます。再起動やシャットダウンが実行されるとサービスは停止し、ダウンタイムが発生します。また、それらの仮想マシンは、ノードが再起動されても自動的に開始されません。

      重要

      一時停止中のVMをノードから退避させることはできず、無視されます。

    • S3。S3サービスはこのノードからS3クラスター内の別のノードに退避するか、無視できます。無視する場合、S3サービスはノードが再起動またはシャットダウンするまで動作し続けるため、ダウンタイムが発生します。ノードが再起動されると、自動的に開始されます。

    • NFS。NFSサービスはこのノードからNFSクラスター内の別のノードに退避するか、無視できます。無視する場合、S3サービスはノードが再起動またはシャットダウンするまで動作し続けるため、ダウンタイムが発生します。ノードが再起動されると、自動的に開始されます。

    • ABGW。このサービスは可用性が高く、複数のインスタンスが異なるノードに分散しています。このノードをメンテナンスモードにすると、インスタンスの1つは停止しますが、他のインスタンスの稼働は継続されるため、サービスは中断されません。

    クラスターの自己回復では、ストレージノード(またはディスク)がオフラインになったときに利用できなくなるストレージクラスターデータを自動的に復元します。これがメンテナンス中に発生した場合、自己回復はクラスターのリソースを節約するために繰り延べられます(デフォルトでは、30分間)。遅延期間の終了前にノードがオンラインに復帰した場合、自己修復は不要になります。

    vstorage -c <cluster_name> set-configコマンドを使用してmds.wd.offline_tout_mntパラメータをミリ秒単位で設定することで、レプリケーションタイムアウトを手動で設定できます。

    また、ノードがオフラインになると、ノード上のデータの冗長性のないチャンクは使用できなくなります。ただし、[非冗長データを再配置] チェックボックスをオンにしている場合、別のストレージノードに移動します。現在のティアに空きがない場合、別のティアに一時的に移動することもあります。

    通常、ノード上のすべてのCSは、ノードがオフラインにならない限り、メンテナンスモードでもデータを処理し続けます。ただし、新しいデータを割り当てるためにCSは使用されないため、ノードをメンテナンスモードにすると、ストレージクラスターの空き領域が減る可能性があります。

    ../_images/node_maintenance1_ac.png
  4. [入る] をクリックします。

何らかの理由でサービスをノードから退避できない場合、メンテナンスモードへの移行は中止されます。その場合、続行する方法を指定する必要があります。メンテナンスを終了すると、ノード上のすべてのサービスは通常の状態に戻ります。強制的にメンテナンスモードにすると、退避できなかったサービスはノードの再起動またはシャットダウン中に停止します。ノードの右側のペインで [メンテナンスに入る] をクリックし、希望する操作を選択して [続行] をクリックします。

../_images/node_maintenance2_ac.png

メンテナンス中のノードは稼働中に戻すか、リリースすることができます。

ノードを稼働中に戻すには、右側のペインで [メンテナンスを終了] をクリックします。