2.7. Información sobre dominios para casos de fallo

La idea que hay detrás de los dominios para casos de fallos es definir un ámbito (por ejemplo, un bastidor) que pueda fallar, pero cuyos datos sigan estando disponibles. Si elegimos el dominio para casos de fallo de bastidores, los datos del clúster aceptarán el fallo de un bastidor, pero el resto de los bastidores se proporcionarán para que los datos estén disponibles. Si elegimos un dominio para casos de fallo de host, la pérdida de un servidor entero no provocaría que los datos dejasen de estar disponibles.

Para proporcionar una alta disponibilidad, Acronis Cyber Infrastructure extiende las réplicas de datos de forma equitativa entre dominios para casos de fallo, de acuerdo con una política de ubicación de réplicas. Están disponibles las siguientes políticas:

  • Disco, el dominio de fallos más pequeño posible. En virtud de esta política, Acronis Cyber Infrastructure nunca coloca más de una réplica de datos por disco. Aunque protege contra los fallos del disco, esta opción puede resultar en la pérdida de datos si las réplicas de datos están en distintos discos del mismo host y este falla. Esta política se debe usar con clústeres de un nodo.
  • Host como dominio para casos de fallo. En virtud de esta política, Acronis Cyber Infrastructure nunca coloca más de una réplica de datos por host. Por lo tanto, si un nodo de almacenamiento falla (un sistema operativo falla) y todos sus discos dejan de estar disponibles, se puede acceder a los datos a través de los nodos en buen estado.
  • Bastidor como dominio para casos de fallo. En virtud de esta política, Acronis Cyber Infrastructure nunca coloca más de una réplica de datos por bastidor. Por lo tanto, si un solo bastidor falla (fallo de un switch para la parte superior del rack) y todos los nodos dejan de estar disponibles, se puede seguir accediendo a los datos a través de los otros bastidores.
  • Fila como dominio para casos de fallo. En virtud de esta política, Acronis Cyber Infrastructure nunca coloca más de una réplica de datos por fila. Por lo tanto, si una sola fila falla (fallo de una sola fuente de alimentación) y todos los bastidores dejan de estar disponibles, se puede seguir accediendo a los datos a través de las otras filas.
  • Sala como dominio para casos de fallo. En virtud de esta política, Acronis Cyber Infrastructure nunca coloca más de una réplica de datos por sala. Por lo tanto, si una sola sala (fallo de alimentación) y todas las filas dejan de estar disponibles, se puede seguir accediendo a los datos a través de las otras salas.

Al seleccionar un dominio para casos de fallo, tenga en cuenta las siguientes recomendaciones:

  • Asegúrese de que los servicios de metadatos estén distribuidos entre las ubicaciones. Por ejemplo, si elige una sala como dominio para casos de fallo y distribuye los datos entre varias salas de manera uniforme, debe distribuir también servicios de metadatos. Si pone todos los servicios de metadatos en una sola sala y esta falla por un problema de alimentación, el clúster no funcionará correctamente.
  • Para seleccionar una ubicación como el dominio para casos de fallo, debe tener varias ubicaciones de ese tipo para que un servicio o los datos se puedan mover de un dominio para casos de fallo a otro, por ejemplo, de un bastidor a otro. Por ejemplo, si quiere elegir el dominio para casos de fallo de bastidores con la redundancia 2 réplicas o Codificación 1+1, asegúrese de tener al menos dos bastidores con nodos en buen estado asignados al clúster.
  • El espacio de disco se debe distribuir de manera uniforme entre los dominios para casos de fallo. Por ejemplo, si selecciona el dominio para casos de fallo de bastidores, debe haber disponible el mismo espacio de disco en cada bastidor. El espacio de disco que se pueda asignar de cada bastidor se establece como el espacio de disco del bastidor más pequeño. El motivo es que cada bastidor debe almacenar una réplica para un fragmento de datos. Por lo tanto, una vez que el espacio de disco del bastidor más pequeño se acabe, no se podrá crear ningún fragmento en el clúster hasta que se añada un nuevo bastidor o el factor de replicación disminuya. Los dominios para casos de fallo de gran tamaño son más sensibles a un desequilibro de espacio de disco total. Por ejemplo, si un dominio tiene 5 bastidores con 10 TB, 20 TB, 30 TB, 100 TB y 100 TB de espacio de disto total, no se podrán asignar (10+20+30+100+100)/3 = 86 TB de datos en 3 réplicas. Solo se podrán asignar 60 TB porque los bastidores de menor capacidad se agotarán antes. Además, los bastidores de mayor tamaño (los de 100 TB) seguirán teniendo espacio libre sin asignar.