3.1. Monitoramento de todo o cluster

As estatísticas gerais do cluster de armazenamento encontram-se disponíveis na tela MONITORAMENTO > Painel. Tenha atenção ao status do cluster de armazenamento. O status pode ser um dos seguintes:

ÍNTEGRO

Todos os componentes estão ativos e funcionando normalmente.

INDISPONÍVEL

Não há informações suficientes sobre o estado do cluster (por exemplo, porque o cluster está inacessível).

DEGRADADO

Alguns dos componentes do cluster estão inativos ou inacessíveis. O cluster está tentando corrigir a si mesmo, a replicação dos dados está agendada ou em andamento.

ERRO

Há um número excessivo de serviços inativos no cluster, a replicação automática está desativada. Se o cluster entrar neste estado, solucione os problemas dos nós ou entre em contato com a equipe de suporte.

Para ver as estatísticas do cluster de armazenamento em tela cheia, clique em Modo de tela cheia. Para sair do modo de tela cheia, pressione Esc ou Sair do modo de tela cheia.

Para monitoramento avançado, clique em Painel do Grafna. Será aberta uma guia do navegador com painéis pré-configurados do Grafna onde você poderá gerenciar os painéis existentes, criar novos, compartilhá-los com usuários, configurar alertas, etc. Para mais informações, consulte a documentação do Grafna.

../_images/stor_image137.png

O intervalo de tempo padrão dos gráficos é de 12 horas. Para ampliar um intervalo de tempo específico, selecione o intervalo com o mouse; para redefinir a ampliação, clique duas vezes sobre qualquer gráfico.

3.1.1. Gráficos de atividade de E/S

Os gráficos Leitura e Gravação apresentam o histórico de atividade de E/S do cluster, como a velocidade de leitura e de gravação em megabytes por segundo, e o número de operações de E/S de leitura e de gravação por segundo (IOPS). Por exemplo:

../_images/stor_image28_ac.png

3.1.2. Gráfico Serviços

No gráfico Serviços, você pode monitorar dois tipos de serviços:

  • Serviços de metadados (MDS): O número de todos os discos com a função de metadados. Assegure-se de que há no mínimo três MDSes em execução, sempre.

  • Serviços de fragmento (CS). O número de todos os discos com função de armazenamento.

As estatísticas típicas têm a seguinte aparência:

../_images/stor_image27_ac.png

Se alguns dos serviços não ficaram no estado íntegro por algum tempo, esses períodos serão destacados em vermelho no gráfico.

3.1.3. Gráfico Fragmentos

Você pode monitorar o estado de todos os fragmentos do cluster no gráfico Fragmentos. Os fragmentos podem estar nos seguintes estados:

Íntegro

Número e porcentagem de fragmentos que têm réplicas ativas suficientes. O estado normal dos fragmentos.

Offline

Número e porcentagem de fragmentos que têm todas as suas réplicas offline. Tais fragmentos ficam completamente inacessíveis para o cluster e não podem ser replicados, lidas nem podem receber gravações. Todas as solicitações de um fragmento offline são congeladas até que um CS que recupere a réplica fique online.

Faça com que os servidores de fragmentos que estiverem offline tornem a ficar online o mais rápido possível para evitar perdas de dados.

Bloqueado

Número e porcentagem de fragmentos que têm menos réplicas ativas do que o número mínimo definido. As solicitações de gravação em um fragmento bloqueado são congeladas até que tenha pelo menos a quantidade mínima definida de réplicas. As solicitações de leitura em fragmentos bloqueados são permitidas já que ainda têm algumas réplicas ativas restantes. Fragmentos bloqueados têm prioridade de replicação mais alta do que fragmentos degradados.

Ter fragmentos bloqueados no cluster aumenta o risco de perda de dados, então adie qualquer manutenção em nós de clusters em funcionamento e reconecte os servidores de fragmentos que estiverem offline o mais rápido possível.

Degradado

Número e porcentagem de blocos cujas réplicas ativas são poucas, mas não abaixo do mínimo definido. Tais fragmentos podem ser lidos e pode-se gravar nos mesmos. Contudo, no segundo caso um fragmento degradado torna-se urgente.

Os fragmentos íntegros são destacados na escala em verde, os offline em vermelho, os bloqueados em amarelo e os degradados em cinza. Por exemplo:

../_images/stor_image27_1.png

A seção Replicação apresenta as informações sobre a atividade de replicação no cluster.

3.1.4. Gráfico Espaço físico

O gráfico Espaço físico apresenta a utilização atual do espaço físico em todo o cluster de armazenamento e em cada camada específica. O espaço utilizado inclui o espaço ocupado por todos os fragmentos de dados e suas réplicas, mais o espaço ocupado por todos os demais dados.

../_images/stor_image27_2.png

3.1.4.1. O que é o espaço físico

O espaço físico total em disco é o total de todos os espaços em disco, em todos os discos de armazenamento na mesma camada. O espaço físico utilizado é o total de todos os dados de usuário nos discos de armazenamento da mesma camada, considerando o modo de redundância. O espaço livre em disco é o espaço físico total menos o espaço físico utilizado.

Para entender melhor como o espaço físico em disco é calculado, considere o exemplo a seguir:

Tabela 3.1.4.1.1 Exemplo de espaço físico

                                                       Utilizado/Total (Livre), GiB

Camada 0, codificação 3+2

(67% sobrecarga)

Camada 1, 2 réplicas

(100% sobrecarga)

Camada 2, sem redundância

Nó 1

334/1024 (690)

134/512 (378)

50/256 (206)

Nó 2

334/1024 (690)

133/512 (379)

50/256 (206)

Nó 3

334/1024 (690)

133/512 (379)

Nó 4

334/1024 (690)

Nó 5

334/1024 (690)

Resumo informado

1670/5120 (3450)

400/1536 (1136)

100/512 (412)

O cluster contém dez discos com a função de armazenamento: cinco discos de 1024 GiB são atribuídos à camada 0, três discos de 512 GiB à 1 e dois discos de 256 GiB à camada 2. Não há outros dados nos discos (como arquivos de sistema, por exemplo). A camada 0 armazena 1000 GiB de dados de usuário no modo de codificação 3+2. A camada 1 armazena 200 GiB de dados de usuários nos dois modos de réplica. A camada 2 armazena 100 GB de dados de usuários sem redundância.

Independentemente do modo de redundância utilizado, o cluster tenta espalhar os fragmentos de dados de forma homogênea entre os discos da mesma camada.

Neste exemplo, o espaço físico em disco em cada camada é informado da seguinte maneira:

  • Na camada 0, o espaço em disco total é de 5120 GiB, o espaço em disco utilizado é de 1670 GiB e o espaço livre em disco é de 3450 GiB;

  • Na camada 1, o espaço em disco total é de 1536 GiB, o espaço em disco utilizado é de 400 GiB e o espaço livre em disco é de 1136 GiB;

  • Na camada 2, o espaço em disco total é de 512 GiB, o espaço em disco utilizado é de 100 GiB e o espaço livre em disco é de 456 GiB;

3.1.5. Gráfico Espaço lógico

O gráfico Espaço lógico representa todo o espaço alocado em diversos serviços para armazenar dados do usuário. Isso inclui o espaço ocupado exclusivamente por dados do usuário. Réplicas e metadados do código de correção de erros não são considerados.

../_images/stor_image27_3.png

3.1.5.1. O que é o espaço lógico

Ao monitorar as informações de espaço em disco no cluster, lembre-se de que o espaço lógico é a quantidade de espaço livre em disco que pode ser usada para armazenar dados do usuário na forma de fragmentos de dados e todas as suas réplicas. Quando esse espaço acabar, nenhum dado poderá ser gravado no cluster.

Para entender melhor como o espaço em disco lógico é calculado, considere o exemplo a seguir:

  • O cluster tem três discos com a função de armazenamento. O primeiro disco tem 200 GB de espaço, o segundo tem 5009 GB e o terceiro tem 1 TB.

  • Se o modo de redundância estiver definido com três réplicas, cada fragmento de dados deverá ser armazenado como três réplicas em três discos diferentes com a função de armazenamento.

Neste exemplo, o espaço em disco lógico disponível será de 200 GB, ou seja, igual à capacidade do menor disco com a função de armazenamento. O motivo é que cada réplica deve ser armazenada em um disco diferente. Então, uma vez que o espaço no disco menor (ou seja, 200 GB) se esgotar, não poderão ser criadas novas réplicas de fragmentos, a menos que um novo disco com a função de armazenamento seja adicionado ou que o modo de redundância seja alterado para duas réplicas.

Com o modo de redundância de duas réplicas, o espaço em disco lógico disponível seria de 700 GB porque os dois discos menores combinados podem armazenar 700 GB de dados.