3.1. Supervisión de todo el clúster

Las estadísticas generales del clúster de almacenamiento están disponibles en la pantalla SUPERVISIÓN > Panel de control. Preste atención al estado del clúster de almacenamiento, que puede ser uno de los siguientes:

EN BUEN ESTADO
Todos los componentes del clúster están activos y operan con normalidad.
NO DISPONIBLE
No hay información suficiente disponible sobre el estado del clúster (por ejemplo, porque no se puede acceder a él).
DEGRADADO
Algunos de los componentes del clúster están inactivos o son inaccesibles. El clúster intenta repararse por sí mismo; se ha planificado una replicación de datos o se está realizando.
ERROR
El clúster tiene demasiados servicios inactivos; se ha deshabilitado la replicación automática. Si el clúster entra en este estado, resuelva los problemas del nodo o póngase en contacto con el equipo de soporte técnico.

Para ver las estadísticas del clúster de almacenamiento en pantalla completa, haga clic en Modo de pantalla completa. Para salir del modo de pantalla completa, pulse Esc o Salir del modo de pantalla completa.

Para obtener una supervisión avanzada, haga clic en Panel de control de Grafana. Se abrirá una pestaña del navegador independiente con los paneles de control de Grafana preconfigurados, donde podrá gestionar los paneles de control existentes, crear otros nuevos, compartirlos entre usuarios, configurar alertas, etc. El panel de control el origen de datos de Prometheus. Sus parámetros se conservan durante 7 días. Si quiere ampliar el período de retención, configúrelo manualmente como se describe en Configuring Retention Policy for Prometheus Metrics. Para obtener más información, consulte la Documentación de Grafana.

../_images/stor_image137.png

El intervalo de tiempo predeterminado para los gráficos es de 12 horas. Para ampliar un intervalo de tiempo en concreto, seleccione el interno con el ratón; para restablecer el zoom, haga doble clic en cualquier gráfico.

3.1.1. Gráficos de actividad E/S

Los gráficos de Lectura y Escritura muestran el historial de actividad de E/S del clúster como la velocidad de lectura y escritura de las operaciones de E/S y el número de operaciones de lectura y escritura E/S por segundo (IOPS). Por ejemplo:

../_images/stor_image28_ac.png

3.1.2. Gráfico de servicios

En el gráfico Servicios, puede supervisar dos tipos de servicios:

  • Servicios de metadatos (MDS). El número total de discos con el rol de metadatos. Asegúrese de que hay al menos tres MDS funcionando en todo momento.
  • Servicios de bloques (CS). El número total de discos con el rol de almacenamiento.

Las estadísticas típicas tienen un aspecto como este:

../_images/stor_image27_ac.png

Si algunos de los servicios no estaban en buen estado durante un periodo de tiempo determinado, estos periodos de tiempo se destacarán en rojo en el gráfico.

3.1.3. Gráfico de bloques

Puede supervisar el estado de todos los bloques del clúster en el gráfico Bloques. Los bloques pueden tener los estados siguientes:

En buen estado
El número y porcentaje de bloques que tienen suficientes réplicas activas. Es el estado normal de los bloques.
Fuera de línea

El número y porcentaje de bloques de los cuales todas las réplicas están fuera de línea. Estos bloques son completamente inaccesibles para el clúster y no se pueden replicar, leer ni escribir. Todas las solicitudes a un bloque fuera de línea se congelan hasta que esté en línea un CS que almacene réplicas de ese bloque.

Haga que los servidores de bloques fuera de línea vuelvan a estar en línea lo antes posible para evitar la pérdida de datos.

Bloqueado

El número y porcentaje de bloques que tienen menos réplicas activas que la cantidad mínima establecida. Las solicitudes de escritura a un bloque bloqueado se congelan hasta que tenga al menos la cantidad mínima establecida de réplicas. Sin embargo, se permite la lectura de los bloques bloqueados ya que todavía tienen algunas réplicas activas. Los bloques bloqueados tienen una mayor prioridad de replicación que los bloques degradados.

Si se tienen bloques bloqueados en el clúster, aumenta el riesgo de perder datos, por lo que se recomienda que posponga cualquier tarea de mantenimiento en los nodos de clúster en funcionamiento y haga que los servidores de bloques fuera de línea vuelvan a estar en línea lo antes posible.

Degradado
El número y porcentaje de bloques con una cantidad escasa de réplicas activas pero no inferior al mínimo establecido. Es posible leer y escribir en estos bloques. Sin embargo, en el caso de la escritura, un bloque degradado pasa a ser urgente.

Los bloques en buen estado se destacan en la escala con el color verde, los bloques fuera de línea en rojo, los bloqueados en amarillo y los degradados en gris. Por ejemplo:

../_images/stor_image27_1.png

La sección Replicación muestra la información sobre la actividad de replicación del clúster.

3.1.4. Gráfico del espacio físico

El gráfico del Espacio físico muestra el uso actual del espacio físico en el clúster de almacenamiento al completo y en cada nivel en particular. El espacio utilizado incluye el espacio ocupado por todos los bloques de datos y sus réplicas, además del espacio ocupado por cualquier otro dato.

../_images/stor_image27_2.png

3.1.4.1. Descripción del espacio físico

El espacio en disco físico total es la cantidad total de todo el espacio en disco de todos los discos de almacenamiento del mismo nivel. El espacio físico utilizado es la cantidad total de todos los datos del usuario en los discos de almacenamiento del mismo nivel, teniendo en cuenta el modo de redundancia. El espacio libre en disco es el espacio físico total menos el espacio físico utilizado.

Para comprender mejor cómo se calcula el espacio en disco físico, observe el ejemplo siguiente:

Tabla 3.1.4.1.1 Ejemplo de espacio físico
                                                         Utilizado/total (libre), GiB

Nivel 0, codificación 3+2

(67 % de sobrecarga)

Nivel 1, 2 réplicas

(100 % de sobrecarga)

Nivel 2, sin redundancia
Nodo 1 334/1024 (690) 134/512 (378) 50/256 (206)
Nodo 2 334/1024 (690) 133/512 (379) 50/256 (206)
Nodo 3 334/1024 (690) 133/512 (379)  
Nodo 4 334/1024 (690)    
Nodo 5 334/1024 (690)    
Resumen informado 1670/5120 (3450) 400/1536 (1136) 100/512 (412)

El clúster cuenta con diez discos con el rol de almacenamiento: cinco discos de 1024 GiB asignados al nivel 0, tres discos de 512 GiB asignados al nivel 1 y dos discos de 256 GiB asignados al nivel 2. No hay más datos en los discos (como archivos del sistema, por ejemplo). El nivel 0 almacena 1000 GiB de datos del usuario en el modo de codificación 3+2. El nivel 1 almacena 200 GiB de datos del usuario en el modo de 2 réplicas. El nivel 2 almacena 100 GiB de datos del usuario sin redundancia.

Independientemente del modo de redundancia que se utilice, el clúster intenta repartir los bloques de datos de forma uniforme entre los discos del mismo nivel.

En este ejemplo, el espacio en disco físico en cada nivel se informa de la forma siguiente:

  • En el nivel 0, el espacio en disco total es de 5120 GiB, el espacio en disco utilizado es de 1670 GiB y el espacio en disco libre es de 3450 GiB;
  • En el nivel 1, el espacio en disco total es de 1536 GiB, el espacio en disco utilizado es de 400 GiB y el espacio en disco libre es de 1136 GiB;
  • En el nivel 2, el espacio en disco total es de 512 GiB, el espacio en disco utilizado es de 100 GiB y el espacio en disco libre es de 456 GiB.

3.1.5. Gráfico del espacio lógico

El gráfico del Espacio lógico representa todo el espacio asignado a los distintos servicios para el almacenamiento de datos del usuario. Esto incluye el espacio ocupado exclusivamente por los datos del usuario. No se tienen en cuenta las réplicas ni los metadatos de codificación de borrado.

../_images/stor_image27_3.png

3.1.5.1. Descripción del espacio lógico

Cuando se supervisa la información del espacio en disco en el clúster, tenga en cuenta que el espacio lógico es la cantidad de espacio libre en el disco que se puede utilizar para el almacenamiento de datos del usuario en forma de bloques de datos y todas sus réplicas. Una vez que se acaba el espacio, no se pueden escribir datos en el clúster.

Para comprender mejor cómo se calcula el espacio en disco lógico, observe el ejemplo siguiente:

  • El clúster cuenta con tres discos con el rol de almacenamiento. El primer disco tiene 200 GB de espacio, el segundo tiene 500 GB y el tercero tiene 1 TB.
  • Si se establece el modo de redundancia en tres réplicas, cada bloque de datos debe almacenarse como tres réplicas en tres discos distintos con el rol de almacenamiento.

En este ejemplo, el espacio en disco lógico disponible será de 200 GB, es decir, igual a la capacidad del disco de menor tamaño con el rol de almacenamiento. El motivo es que cada réplica se debe almacenar en un disco distinto. De modo que, una vez que se agota el espacio en el disco de menor tamaño (por ejemplo, 200 GB), no se pueden crear nuevas réplicas de bloques, a menos que se añada un nuevo disco con el rol de almacenamiento o se cambie al modo de redundancia a dos réplicas.

Con el modo de redundancia de dos réplicas, el espacio en disco lógico disponible sería de 700 GB, ya que los dos discos de menor tamaño en su conjunto pueden alojar 700 GB de datos.