2.6. Executar a manutenção de nó

Sempre que você precisar executar operações de serviço em um nó de cluster, coloque-o no modo de manutenção. Ao fazer isso, o nó interromperá a alocação de novos fragmentos de dados de armazenamento, mas continua a manipular operações de E/S para os principais serviços de armazenamento, como MDS, CS e cache. Os serviços de outros nós (de computação, Backup Gateway, iSCSI, S3 e NFS) podem ser realocados ou deixados como estão durante a manutenção. Quando o nó estiver no modo de manutenção, você poderá desligar e executar operações de serviço nele. Quando terminar, ligue o nó e retorne à operação no painel de administração.

Importante

É recomendável ter cinco serviços MDS no cluster de armazenamento. Nesse caso, quando um nó executando o serviço MDS for desligado durante a manutenção, o cluster poderá sobreviver à falha de outro nó.

Antes de colocar um nó no modo de manutenção, faça o seguinte:

  • Se o nó hospedar máquinas virtuais, elas serão realocadas. Verifique se outros nós de computação têm recursos suficientes para acomodar essas VMs.
  • Se o nó hospedar destinos iSCSI, verifique se os iniciadores iSCSI estão configurados para usar vários endereços IP do mesmo grupo de destino.
  • Se o nó executar um gateway S3, remova seus endereços IP dos registros DNS dos pontos de acesso S3. Caso contrário, alguns dos clientes do S3 poderão experimentar tempos limite de conexão.

Para colocar um nó no modo de manutenção, faça o seguinte:

  1. Na tela INFRAESTRUTURA > Nós, clique no nó desejado.

  2. Na tela de visão geral do nó, clique em Entrar em manutenção.

  3. Na janela Entrar na manutenção, escolha Evacuar ou Ignorar as seguintes cargas de trabalho durante a manutenção:

    • Armazenamento em bloco. Os grupos de destino iSCSI têm alta disponibilidade, com vários destinos em execução em nós diferentes. Quando o nó entra em manutenção, o destino que ele hospeda é interrompido e o caminho preferido é movido para outro nó no grupo de destino em 60 segundos. Assim, o serviço não é interrompido durante a manutenção.
    • Bloco de armazenamento (versão 2.4 ou anterior). Os destinos de iSCSI antigos criados na versão 2.4 ou anterior serão evacuados do nó e migrados de volta após a manutenção. Para evitar isso, é recomendável converter destinos antigos em novos grupos de destinos, conforme descrito em Gerenciamento de destinos iSCSI herdados.
    • Computar. Evacuar máquinas virtuais do nó significa migrá-las individualmente em tempo real para outros nós de computação. Se você optar por ignorar, eles continuarão em execução até você reiniciar ou desligar os nós. Nesse caso, serão interrompidos e armazenados, resultando em tempo de inatividade. Eles também não serão iniciados automaticamente assim que o nó estiver funcionando novamente.

      Importante

      VMs suspensas não podem ser evacuadas do nó e serão ignoradas.

    • S3. Você pode evacuar os serviços S3 desse nó para outros nós no cluster S3 ou ignorá-los. No último caso, eles continuarão em execução até você reiniciar ou desligar o nó, resultando em tempo de inatividade. Eles serão iniciados automaticamente assim que o nó estiver funcionando novamente.

    • NFS. Você pode evacuar os serviços NFS desse nó para outros nós no cluster NFS ou ignorá-los. No último caso, eles continuarão em execução até você reiniciar ou desligar o nó, resultando em tempo de inatividade. Eles serão iniciados automaticamente assim que o nó estiver funcionando novamente.

    • ABGW. Esse serviço está altamente disponível, com várias instâncias espalhadas por diferentes nós. Colocar esse nó no modo de manutenção interromperá uma das instâncias, mas as outras continuarão funcionando, para que o serviço não seja interrompido.

    A autocorreção de cluster é a restauração automática dos dados do cluster de armazenamento que fica indisponível quando um nó de armazenamento (ou um disco) fica offline. Se isso ocorrer durante a manutenção, a recuperação automática será atrasada (por 30 minutos, por padrão) para economizar recursos do cluster. Se o nó voltar a ficar online antes que o atraso termine, a autocorreção não será necessária.

    Você pode configurar manualmente o tempo limite da replicação configurando o parâmetro mds.wd.offline_tout_mnt em milissegundos, com o comando vstorage -c <cluster_name> set-config.

    Além disso, quaisquer fragmentos de dados não redundantes no nó ficarão indisponíveis se o nó ficar offline. No entanto, eles serão movidos para outros nós de armazenamento se você marcar a caixa Realocar dados não redundantes. Eles também poderão ser movidos temporariamente para outra camada, se a atual estiver cheia.

    Em geral, todos os CSes no nó continuarão preparando aos dados, mesmo no modo de manutenção, a menos que o nó fique offline. No entanto, eles não serão usados para alocar novos dados. Portanto, colocar o nó em manutenção poderá reduzir o espaço livre no cluster de armazenamento.

    ../_images/stor_image192_ac.png
  4. Clique em Entrar.

Se, por algum motivo, um serviço não puder ser evacuado do nó, a entrada na manutenção será interrompida. Você precisará decidir como proceder: sair da manutenção para que todos os serviços no nó retornem ao seu estado normal; ou forçar a manutenção para que os serviços que não puderam ser evacuados sejam interrompidos durante a reinicialização ou desligamento do nó. Na tela de visão geral do nó, clique em Entrar na manutenção, escolha a ação desejada e clique em Continuar.

../_images/stor_image193_ac.png

Os nós em manutenção podem retornar à operação ou ser liberados.

Para retornar um nó para operação, clique em Sair da manutenção na tela de visão geral.

../_images/stor_image194_ac.png