2.3. Planificación de las configuraciones de hardware de nodo¶
Acronis Cyber Infrastructure funciona con hardware básico, por lo que puede crear un clúster para servidores, discos y tarjetas de red convencionales. Aun así, para obtener un rendimiento óptimo, deben cumplirse una serie de requisitos y seguirse varias recomendaciones.
Nota
Si no sabe con seguridad qué hardware elegir, consulte a su representante de ventas. También puede utilizar la calculadora de hardware en línea.
2.3.1. Límites de hardware¶
La siguiente tabla muestra los límites de hardware actuales para los servidores de Acronis Cyber Infrastructure:
Hardware |
Teórico |
Con certificación |
---|---|---|
RAM |
64 TB |
1 TB |
CPU |
5120 CPU lógicas |
384 CPU lógicas |
Una CPU lógica es un procesador de un núcleo (hilo) o de múltiples núcleos (varios hilos).
2.3.2. Requisitos de hardware¶
Acronis Cyber Infrastructure implementado consiste en un único nodo de gestión y varios nodos de procesamiento y almacenamiento. Las siguientes subsecciones muestran los requisitos del hardware de nodo en función del escenario de uso.
2.3.2.1. Requisitos del nodo de gestión con procesamiento y almacenamiento¶
La siguiente tabla muestra los requisitos de hardware mínimos y recomendados para un nodo de gestión que también ejecuta los servicios de procesamiento y almacenamiento.
Si decide habilitar la alta disponibilidad para el nodo de gestión (recomendado), todos los servidores que añadirá al clúster de alta disponibilidad deben cumplir los requisitos que se enumeran en esta tabla.
Tipo |
Mínimo |
Recomendados |
---|---|---|
CPU |
Procesadores Intel x86-64 con “invitados ilimitados” y VT-x con Tablas de página extendida (EPT) habilitada en BIOS 16 CPU lógicas en total* |
Procesadores Intel x86-64 con “invitados ilimitados” y VT-x con Tablas de página extendida (EPT) habilitada en BIOS Más de 32 CPU lógicas en total* |
RAM |
32 GB** |
Más de 64 GB** |
Almacenamiento |
1 disco: sistema + metadatos, disco duro SATA de más de 100 GB 1 disco: almacenamiento, disco duro SATA, tamaño según sea necesario |
2 discos: sistema + metadatos + caché, SSD de nivel de gran empresa de más de 100 GB en un volumen RAID1, con protección contra pérdida de energía y rendimiento de escritura secuencial de 75 MB/s por disco duro al que se proporciona servicio (por ejemplo, un total de más de 750 MB/s para un nodo de 10 discos) Más de 4 discos: Disco duro o SSD, resistencia mínima de 1 DWPD, 10 DWPD recomendado |
Red |
1 GbE para tráfico de almacenamiento 1 GbE (etiquetado para VLAN) para otro tráfico |
2 x 10 GbE (acoplado) para tráfico de almacenamiento 2 x 1 GbE o 2 x 10 GbE (acoplado, etiquetado para VLAN) para otro tráfico |
* Una CPU lógica es un procesador de un núcleo (hilo) o de múltiples núcleos (varios hilos).
** Cada servidor de bloques (CS), por ejemplo, un disco de almacenamiento, requiere 1 GB de RAM (0,5 GB de memoria anónima + 0,5 Gb de caché de página). El límite total de caché de página es de 12 GB. Además, cada servidor de metadatos (MDS) requiere 0,2 GB de RAM + 0,1 GB por cada 100 TB de espacio de almacenamiento físico.
2.3.2.2. Requisitos de almacenamiento y procesamiento¶
La siguiente tabla enumera los requisitos de hardware mínimos y recomendados para un nodo que ejecuta los servicios de procesamiento y almacenamiento.
Tipo |
Mínimo |
Recomendados |
---|---|---|
CPU |
Procesadores x86-64 con extensiones de virtualización de hardware Intel VT habilitadas. 8 CPU lógicas* |
Procesadores x86-64 con extensiones de virtualización de hardware Intel VT habilitadas. Más de 32 CPU lógicas* |
RAM |
8 GB** |
Más de 64 GB** |
Almacenamiento |
1 disco: sistema, disco duro SATA de 100 GB 1 disco: metadatos, disco duro SATA de 100 GB (solo en los tres primeros nodos del clúster) 1 disco: almacenamiento, disco duro SATA, tamaño según sea necesario |
Más de 2 discos: sistema, discos duros SATA de más de 100 GB en un volumen RAID1 Más de 1 disco: metadatos + caché, SSD de nivel de gran empresa de más de 100 GB con protección contra pérdida de energía y rendimiento de escritura secuencial de 75 MB/s por disco duro al que se proporciona servicio (por ejemplo, más de 750 MB/s en total para un nodo de 10 discos) Más de 4 discos: Disco duro o SSD, resistencia mínima de 1 DWPD, 10 DWPD recomendado |
Red |
1 GbE para tráfico de almacenamiento 1 GbE (etiquetado para VLAN) para otro tráfico |
2 x 10 GbE (acoplado) para tráfico de almacenamiento 2 x 1 GbE o 2 x 10 GbE (acoplado) para otro tráfico |
* Una CPU lógica es un procesador de un núcleo (hilo) o de múltiples núcleos (varios hilos).
** Cada servidor de bloques (CS), por ejemplo, un disco de almacenamiento, requiere 1 GB de RAM (0,5 GB de memoria anónima + 0,5 Gb de caché de página). El límite total de caché de página es de 12 GB. Además, cada servidor de metadatos (MDS) requiere 0,2 GB de RAM + 0,1 GB por cada 100 TB de espacio de almacenamiento físico.
2.3.2.3. Requisitos de hardware para Backup Gateway¶
La siguiente tabla enumera los requisitos de hardware mínimos y recomendados para un nodo de gestión que también ejecuta los servicios de ABGW y almacenamiento.
Tipo |
Mínimo |
Recomendados |
---|---|---|
CPU |
Procesadores x86-64 con extensiones de virtualización de hardware AMD-V o Intel VT habilitadas. 4 CPU lógicas* |
Procesadores x86-64 con extensiones de virtualización de hardware AMD-V o Intel VT habilitadas. Más de 4 CPU lógicas*, al menos una CPU por cada 8 discos duros |
RAM |
4 GB** |
Más de 16 GB** |
Almacenamiento |
1 disco: sistema + metadatos, disco duro SATA 120 GB 1 disco: almacenamiento, disco duro SATA, tamaño según sea necesario |
1 disco: sistema + metadatos + caché, SSD de nivel de gran empresa de más de 120 GB con protección contra pérdida de energía y rendimiento de escritura secuencial de 75 MB/s por disco duro al que se proporciona servicio. 1 disco: almacenamiento, disco duro SATA, resistencia mínima de 1 DWPD, se recomiendan 10 DWPD, tamaño según sea necesario |
Red |
1 GbE |
2 x 10 GbE (acoplado) |
* Una CPU lógica es un procesador de un núcleo (hilo) o de múltiples núcleos (varios hilos).
** Cada servidor de bloques (CS), por ejemplo, un disco de almacenamiento, requiere 1 GB de RAM (0,5 GB de memoria anónima + 0,5 Gb de caché de página). El límite total de caché de página es de 12 GB. Además, cada servidor de metadatos (MDS) requiere 0,2 GB de RAM + 0,1 GB por cada 100 TB de espacio de almacenamiento físico.
2.3.3. Recomendaciones de hardware¶
En general, Acronis Cyber Infrastructure funciona en el mismo hardware que se recomienda para Red Hat Enterprise Linux 7: servidores, componentes.
Las siguientes recomendaciones detallan de forma pormenorizada los beneficios añadidos por hardware específico en la tabla de requisitos de hardware. Siga las recomendaciones para configurar el hardware del clúster de forma óptima.
2.3.3.1. Recomendaciones de composición del clúster de almacenamiento¶
Designar un clúster de almacenamiento eficiente implica encontrar un compromiso entre el rendimiento y el coste que se adapte a sus propósitos. En la planificación, tenga en cuenta que un clúster con muchos nodos y pocos discos por nodo ofrece un mayor rendimiento, mientras que un clúster con el número mínimo de nodos (3) y muchos discos por nodo es más barato. Consulte la siguiente tabla para obtener más información.
Consideraciones de diseño |
Mínimo de nodos (3), muchos discos por nodo |
Muchos nodos, pocos discos por nodo (configuración all-flash) |
---|---|---|
Optimización |
Menor coste. |
Mayor rendimiento. |
Espacio de disco libre para reservar |
Más espacio para reservar para la reconstrucción de clústeres, ya que menos nodos en buen estado tendrán que almacenar datos de un nodo con errores. |
Menos espacio para reservar para la reconstrucción de clústeres, ya que más nodos en buen estado tendrán que almacenar datos de un nodo con errores. |
Redundancia |
Menos opciones de codificación de borrado. |
Más opciones de codificación de borrado. |
Equilibrio de clúster y rendimiento de reconstrucción |
Peor equilibrio y reconstrucción más lenta. |
Mejor equilibrio y reconstrucción más rápida. |
Capacidad de red |
Más ancho de banda de red necesario para mantener el rendimiento de clúster durante la reconstrucción. |
Menos ancho de banda de red necesario para mantener el rendimiento de clúster durante la reconstrucción. |
Tipo de datos favorable |
Datos estáticos (por ejemplo, copias de seguridad). |
Datos dinámicos (por ejemplo, entornos virtuales). |
Ejemplo de configuración del servidor |
Supermicro SSG-6047R-E1R36L (CPU Intel Xeon E5-2620 v1/v2, 32 GB de RAM, 36 discos duros de 12 TB, un disco del sistema de 500 GB). |
Supermicro SYS-2028TP-HC0R-SIOM (4 CPU Intel E5-2620 v4, 4 RAM de 16 GB, 24 SSD Samsung PM1643 de 1,9 TB). |
Tenga en cuenta lo siguiente:
Estas consideraciones solo se aplican si el dominio de fallos es el host.
La velocidad de reconstrucción en el modo de replicación no depende del número de nodos en el clúster.
Acronis Cyber Infrastructure es compatible con cientos de discos por nodo. Si tiene pensado usar más de 36 discos por nodo, póngase en contacto con los ingenieros de venta que le ayudarán a diseñar un clúster más eficaz.
2.3.3.2. Recomendaciones de hardware generales¶
Se necesitan al menos cinco nodos para un entorno de producción. Esto garantiza que el clúster se reponga de errores en dos nodos sin sufrir pérdidas de datos.
Una de las características más destacadas de Acronis Cyber Infrastructure es la escalabilidad. Cuanto mayor sea el clúster, mejor será el rendimiento de Acronis Cyber Infrastructure. Se recomienda crear clústeres de producción de al menos diez nodos para mejorar la resiliencia, el rendimiento y la tolerancia a errores en los escenarios de producción.
Aunque un clúster puede crearse sobre varias configuraciones de hardware, el uso de nodos con hardware similar en cada nodo ofrecerá un mejor rendimiento, capacidad y equilibrio general del clúster.
Cualquier infraestructura de clúster debe probarse de forma amplia antes de implementarla para producción. Siempre deben comprobarse de forma minuciosa puntos de error comunes, como las unidades SSD y los acoplamientos de adaptador de red.
No se recomienda que la producción ejecute Acronis Cyber Infrastructure sobre hardware SAN/NAS, ya que tiene sus propios mecanismos de redundancia. Hacerlo puede afectar de forma negativa al rendimiento y a la disponibilidad de datos.
Para obtener el mejor rendimiento, mantenga al menos el 20 % de la capacidad del clúster libre.
Durante la recuperación ante desastres, Acronis Cyber Infrastructure puede necesitar espacio de disco adicional para la replicación. Asegúrese de reservar al menos tanto espacio como tenga cualquier nodo de almacenamiento único.
Se recomienda tener los mismos modelos de CPU en cada nodo para evitar problemas de migración directa de equipo virtual. Para obtener más información, consulte la Guía de línea de comando del administrador.
Si tiene pensado usar Backup Gateway para almacenar copias de seguridad en el cloud, asegúrese de que el clúster de almacenamiento local tiene espacio lógico de sobra para el almacenamiento provisional (mantener las copias de seguridad en el espacio local antes de enviarlas al cloud). Por ejemplo, si realiza copias de seguridad a diario, proporcione suficiente espacio para realizar copias de seguridad durante un día y medio como mínimo. Para obtener más información, consulte la Guía del administrador.
2.3.3.3. Recomendaciones de hardware de almacenamiento¶
Es posible usar discos de diferente tamaño en el mismo clúster. Sin embargo, tenga en cuenta que, con las mismas IOPS, los discos de menor capacidad ofrecerán un mayor rendimiento por terabyte de datos comparados con los discos de mayor capacidad. Se recomienda agrupar los discos con las mismas IOPS por terabyte en el mismo nivel.
Usar los modelos de SSD recomendados puede ayudarle a evitar la pérdida de datos. No todas las unidades SSD pueden soportar las cargas de trabajo empresariales y pueden deteriorarse en los primeros meses de funcionamiento, lo que tiene como resultado picos de TCO.
Las células de memoria SSD pueden soportar un número limitado de reescrituras. Una unidad SSD debe verse como un consumible que deberá reemplazar después de un periodo determinado de tiempo. Las unidades SSD de consumo pueden soportar un número muy bajo de reescrituras (de hecho, es tan bajo que estos números no se muestran en sus especificaciones técnicas). Las unidades SSD destinadas a clústeres de almacenamiento deben ofrecer al menos una resistencia de 1 DWPD (se recomienda 10 DWPD). Cuanto mayor sea la resistencia, menor será la frecuencia con la que deberán reemplazarse los SSD, lo que mejorará el TCO.
Muchas unidades SSD dirigidas a consumidores pueden ignorar los vaciados de disco e informar incorrectamente al sistema operativo que se escribieron datos cuando, en realidad, no fue así. Ejemplos de unidades como estas incluyen OCZ Vertex 3, Intel 520, Intel X25-E e Intel X-25-M G2. Estas unidades son conocidas por ser poco seguras en términos de confirmaciones de datos, no deberían usarse con bases de datos y pueden dañar fácilmente el sistema de archivos en caso de un fallo en el suministro eléctrico. Por estos motivos, debe usar unidades SSD para la gran empresa que cumplan con las normativas de vaciado (para obtener más información, consulte http://www.postgresql.org/docs/current/static/wal-reliability.html). Las unidades SSD para la gran empresa que funcionan correctamente suelen tener la propiedad de protección contra pérdida de energía en sus especificaciones técnicas. Algunos de los nombres de mercado para esta tecnología son Enhanced Power Loss Data Protection (Intel), Cache Power Protection (Samsung), Power-Failure Support (Kingston), Complete Power Fail Protection (OCZ).
Se recomienda encarecidamente que compruebe las capacidades de vaciado de dados de los discos como se explica en Comprobación de las capacidades de vaciado de datos del disco.
Las unidades SSD dirigidas a consumidores tienen un rendimiento inestable y no son adecuadas para soportar cargas de trabajo empresariales sostenibles. Por este motivo, debe prestar atención a las pruebas de carga sostenible en el momento de elegir unidades SSD. Recomendamos las siguientes unidades SSD de nivel empresarial, que son las mejores en términos de rendimiento, resistencia e inversiones: Intel S3710, Intel P3700, Huawei ES3000 V2, Samsung SM1635 y Sandisk Lightning.
El rendimiento de los discos SSD puede variar en función de su tamaño. Las unidades de menor capacidad (de 100 a 400 GB) pueden tener un rendimiento mucho más lento (a veces, hasta diez veces más lento) que las de mayor capacidad (de 1,9 a 3,8 TB). Consulte las especificaciones de rendimiento y resistencia de la unidad antes de comprar el hardware.
El uso de NVMe o SSD de SAS para la escritura mejora el rendimiento de E/S aleatorio y se recomienda encarecidamente para todas las cargas de trabajo con acceso aleatorio interno (por ejemplo, volúmenes de iSCSI). A su vez, los discos SATA se adaptan mejor a las configuraciones que son exclusivas de las unidades SSD, pero no al almacenamiento en caché de escritura.
Se desaconseja encarecidamente el uso de discos duros de grabación magnética (SMR), incluso en escenarios de copia de seguridad. Este tipo discos tienen una latencia impredecible que puede llevar a cortes de servicio temporales y degradaciones de rendimiento repentinas.
La ejecución de servicios de metadatos en SSD mejora el rendimiento del clúster. Para minimizar también los costes de capital, pueden usarse los mismos SSD para el almacenamiento en caché de escritura.
Si la capacidad es el objetivo principal y necesita almacenar datos a los que no se acceden con frecuencia, seleccione discos SATA en lugar de discos SAS. Si el rendimiento es el objetivo principal, seleccione discos NVMe o SAS en lugar de discos SATA.
Cuantos más discos tenga por nodo, menor serán los costes de capital. Por ejemplo, un clúster creado a partir de diez nodos con dos discos cada uno costará menos que un clúster creado a partir de veinte nodos con un disco en cada uno.
El uso de discos duros SATA con un SSD para caché es más económico que usar solo discos duros SAS sin dicho SSD.
Cree volúmenes de hardware o software RAID1 para los discos del sistema con controladores RAID o HBA, respectivamente, para garantizar su alto rendimiento y disponibilidad.
Use controladores HBA, ya que son más económicos y fáciles de gestionar que los controladores RAID.
Deshabilite todas las cachés de controlador RAID para unidades SSD. Los SSD modernos tienen un buen rendimiento que puede verse reducido por la caché de lectura y escritura de un controlador RAID. Se recomienda desactivar el almacenamiento en caché para unidades SSD y dejarla habilitada solo para unidades de disco duro.
Si usa controladores RAID, no cree volúmenes RAID a partir de discos duros destinados a almacenamiento. Acronis Cyber Infrastructure debe reconocer cada disco duro de almacenamiento como un dispositivo independiente.
Si usa controladores RAID con almacenamiento en caché, equípelos con unidades de batería de respaldo (BBU) para protegerlos contra la pérdida de caché durante los cortes de energía.
El tamaño de bloque de disco (por ejemplo, 512 b o 4 K), no es importante y no afecta al rendimiento.
2.3.3.4. Recomendaciones de hardware de red¶
Use redes independientes (e, idealmente, aunque opcional, adaptadores de red independientes) para tráfico público e interno. De esta manera, evitará que el tráfico público afecte al rendimiento de E/S de clúster, y también impedirá posibles ataques de denegación de servicio desde el exterior.
La latencia de red reduce drásticamente el rendimiento del clúster. Use equipos de red de calidad con vínculos de latencia bajos. No use conmutadores de red destinados a consumidores.
No use adaptadores de red de escritorio como Intel EXPI9301CTBLK o Realtek 8129, ya que no están diseñados para una carga pesada y es posible que no soporten vínculos dúplex completos. También debería usar conmutadores de Ethernet sin bloqueo.
Para evitar las intrusiones, Acronis Cyber Infrastructure debería estar en una red interna dedicada a la que no se pueda acceder desde el exterior.
Use un vínculo de 1 Gbit/s por cada dos discos duros en el nodo (redondeado al alza). Para uno o dos discos duros en un nodo, se recomiendan dos interfaces de red enlazadas para obtener una alta disponibilidad de red. El motivo de esta recomendación es que las redes Ethernet de 1 Gbit/s pueden ofrecer de 110 a 120 MB/s de rendimiento, lo que está cerca del rendimiento de E/S secuencial de un único disco. Dado que varios discos en un servidor pueden ofrecer un mayor rendimiento que un único vínculo de Ethernet de 1 Gbit/s, la red puede convertirse en un cuello de botella.
Para un rendimiento de E/S secuencial máximo, use un vínculo de 1 Gbit/s por cada disco duro, o un vínculo de 10 Gbit/s por nodo. Aunque las operaciones de E/S suelen ser aleatorias con más frecuencia en escenarios de la vida real, la E/S secuencial es importante en escenarios de copia de seguridad.
Para obtener un rendimiento general máximo, use un vínculo de 10 Gbit/s por nodo (o dos acoplados para una alta disponibilidad de red).
No se recomienda configurar adaptadores de red de 1 Gbit/s para usar MTU no predeterminadas (por ejemplo, tramas gigantes de 9000 bytes). Este tipo de configuraciones requieren la configuración adicional de conmutadores y, a menudo, llevan a errores humanos. Por otra parte, los adaptadores de red de más de 10 Gbit/s deben configurarse para usar tramas gigantes para lograr el máximo rendimiento.
Los adaptadores de bus de host (HBA) de canal de fibra compatibles actualmente son QLogic QLE2562-CK y QLogic ISP2532.
Se recomienda usar adaptadores Mellanox ConnectX-4 y ConnectX-5 InfiniBand. Las tarjetas Mellanox ConnectX-2 y ConnectX-3 no son compatibles.
2.3.4. Limitaciones de hardware y software¶
Limitaciones de hardware:
Cada nodo de gestión debe tener al menos dos discos (uno para el sistema y metadatos y otro para el almacenamiento).
Cada nodo de almacenamiento y procesamiento debe tener al menos tres discos (uno para el sistema, otro para los metadatos y otro para el almacenamiento).
Se necesitan tres servidores para probar todas las características del producto.
Cada servidor debe tener al menos 4 GB de RAM y dos núcleos lógicos.
El disco del sistema debe tener al menos 100 GB de espacio.
El panel de administración requiere una pantalla Full HD para que se muestre correctamente.
El tamaño de partición física compatible máximo es de 254 TiB.
Limitaciones de software:
El modo de mantenimiento no es compatible. Use SSH para apagar o reiniciar un nodo.
Un nodo solo puede ser parte de un clúster.
Solo puede crearse un clúster S3 sobre un clúster de almacenamiento.
Solo están disponibles los modos de redundancia predefinidos en el panel de administración.
El aprovisionamiento fino siembre está habilitado para todos los datos y no puede configurarse de otra forma.
Se ha probado que el panel de administración funciona con resoluciones de 1280x720 y superiores en los siguientes navegadores: últimas versiones de Firefox, Chrome y Safari.
Para limitaciones de red, consulte Limitaciones de red.
2.3.5. Configuración de almacenamiento mínima¶
La configuración mínima descrita en la tabla le permitirá evaluar las características del clúster de almacenamiento. No está destinada a producción.
Número de nodos |
Rol del primer disco |
Rol del segundo disco |
Roles del tercer disco y posteriores |
Puntos de acceso |
---|---|---|---|---|
1 |
Sistema |
Metadatos |
Almacenamiento |
iSCSI, S3 privado, S3 público, NFS, ABGW |
2 |
Sistema |
Metadatos |
Almacenamiento |
iSCSI, S3 privado, S3 público, NFS, ABGW |
3 |
Sistema |
Metadatos |
Almacenamiento |
iSCSI, S3 privado, S3 público, NFS, ABGW |
3 nodos en total |
|
3 MDS en total |
Más de 3 CS en total |
Los servicios de punto de acceso se ejecutan en tres nodos en total. |
Nota
A los discos SSD se les pueden asignar roles de Sistema, Metadatos y Caché al mismo tiempo, lo que deja más discos libres para el rol de almacenamiento.
Aunque se recomienda el uso de tres nodos incluso para la configuración mínima, puede comenzar a evaluar Acronis Cyber Infrastructure con un solo nodo y añadir más posteriormente. Como mínimo, un clúster de almacenamiento debe tener un servicio de metadatos y un servicio de bloques en ejecución. Una instalación de un solo nodo le permitirá evaluar servicios como iSCSI, ABGW, etc. Sin embargo, esa configuración tiene dos limitaciones clave:
Solo contará con un MDS como único punto de error. Si falla, el clúster al completo dejará de funcionar.
Solo habrá un CS, que solo podrá almacenar una réplica de bloque. Si falla, los datos se perderán.
Importante
Si implementa Acronis Cyber Infrastructure en un único nodo, debe asegurarse de que cuenta con un almacenamiento persistente y redundante para evitar pérdidas de datos. Si el nodo es físico, debe contar con múltiples discos para que pueda replicar los datos que contienen. Si el nodo es un equipo virtual, asegúrese de que la solución en la que se ejecuta le otorga una alta disponibilidad.
Nota
Backup Gateway funciona con el almacenamiento de objetos local en modo de almacenamiento provisional. Esto quiere decir que los datos que se van a replicar, migrar o cargar a un cloud público primero se almacenan localmente, y solo después de eso se envían a su destino. Resulta de vital importancia que el almacenamiento de objetos sea persistente y redundante para que los datos locales no se pierdan. Hay varias formas de garantizar la persistencia y la redundancia del almacenamiento local. Puede implementar Backup Gateway en varios nodos y seleccionar un buen modo de redundancia. Si se implementa la puerta de enlace en un único nodo en Acronis Cyber Infrastructure, puede hacer que el almacenamiento local sea redundante replicándolo en múltiples discos locales. Si la instalación completa de Acronis Cyber Infrastructure se implementa en un solo equipo virtual con el único objetivo de crear una puerta de enlace, asegúrese de que la solución que ejecuta dicho equipo virtual le otorga una alta disponibilidad.
2.3.6. Configuración de almacenamiento recomendada¶
Se recomienda tener al menos cinco servicios de metadatos para garantizar que el clúster pueda hacer frente a errores simultáneos en dos nodos sin que se pierdan datos. La siguiente configuración le ayudará a crear clústeres para entornos de producción:
Número de nodos |
Rol del primer disco |
Rol del segundo disco |
Roles del tercer disco y posteriores |
Puntos de acceso |
---|---|---|---|---|
De 1 a 5 nodos |
Sistema |
SSD; metadatos, caché |
Almacenamiento |
iSCSI, S3 privado, S3 público, ABGW |
Más de 6 nodos |
Sistema |
SSD; caché |
Almacenamiento |
iSCSI, S3 privado, ABGW |
Más de 5 nodos en total |
|
5 MDS en total |
Más de 5 CS en total |
Todos los nodos ejecutan puntos de acceso requeridos. |
Es posible crear un clúster listo para la producción a partir de cinco nodos con el hardware recomendado. Sin embargo, es preferible comenzar la producción con al menos diez nodos si desea obtener grandes ventajas de rendimiento en almacenamiento directo conectado (DAS) u optimizar el tiempo de recuperación.
A continuación se citan varios ejemplos de configuraciones más específicas que se pueden usar para la producción. Cada configuración puede ampliarse al añadir nodos y servidores de bloques.
2.3.6.1. Solo disco duro¶
Esta configuración básica requiere un disco dedicado para cada servidor de metadatos.
De 1 a 5 nodos (base) |
Más de 6 nodos (extensión) |
||||
---|---|---|---|---|---|
N° de disco: |
Tipo de disco |
Roles de disco |
N° de disco: |
Tipo de disco |
Roles de disco |
1 |
HDD |
Sistema |
1 |
HDD |
Sistema |
2 |
HDD |
MDS |
2 |
HDD |
CS |
3 |
HDD |
CS |
3 |
HDD |
CS |
… |
… |
… |
… |
… |
… |
N |
HDD |
CS |
N |
HDD |
CS |
2.3.6.2. Disco duro y disco SSD del sistema (sin caché)¶
Esta configuración es adecuada para crear clústeres centrados en la capacidad.
De 1 a 5 nodos (base) |
Más de 6 nodos (extensión) |
||||
---|---|---|---|---|---|
N° de disco: |
Tipo de disco |
Roles de disco |
N° de disco: |
Tipo de disco |
Roles de disco |
1 |
SSD |
Sistema, MDS |
1 |
SSD |
Sistema |
2 |
HDD |
CS |
2 |
HDD |
CS |
3 |
HDD |
CS |
3 |
HDD |
CS |
… |
… |
… |
… |
… |
… |
N |
HDD |
CS |
N |
HDD |
CS |
2.3.6.3. Disco duro y disco SSD¶
Esta configuración es adecuada para crear clústeres centrados en el rendimiento.
De 1 a 5 nodos (base) |
Más de 6 nodos (extensión) |
||||
---|---|---|---|---|---|
N° de disco: |
Tipo de disco |
Roles de disco |
N° de disco: |
Tipo de disco |
Roles de disco |
1 |
HDD |
Sistema |
1 |
HDD |
Sistema |
2 |
SSD |
MDS, caché |
2 |
SSD |
Caché |
3 |
HDD |
CS |
3 |
HDD |
CS |
… |
… |
… |
… |
… |
… |
N |
HDD |
CS |
N |
HDD |
CS |
2.3.6.4. Solo disco SSD¶
Esta configuración no requiere discos SSD para la caché.
Al escoger el hardware para esta configuración, tenga en cuenta lo siguiente:
Cada cliente de Acronis Cyber Infrastructure podrá obtener hasta 40 000 IOPS sostenibles (lectura y escritura) del clúster.
Si usa el esquema de redundancia de codificación de borrado, cada archivo de codificación de borrado, como por ejemplo un único disco duro para equipo virtual, obtendrá hasta 2000 IOPS sostenibles. Es decir, un usuario que trabaje en un equipo virtual tendrá hasta 2000 IOPS sostenibles por cada disco duro virtual a su disposición. Con varios equipos virtuales en un nodo se pueden utilizar más IOPS, hasta alcanzar el límite del cliente.
En esta configuración, la latencia de red define más de la mitad del rendimiento general, así que debe asegurarse de que la latencia de red sea mínima. Se recomienda tener un conmutador a 10 Gbps entre cada par de nodos en el clúster.
De 1 a 5 nodos (base) |
Más de 6 nodos (extensión) |
||||
---|---|---|---|---|---|
N° de disco: |
Tipo de disco |
Roles de disco |
N° de disco: |
Tipo de disco |
Roles de disco |
1 |
SSD |
Sistema, MDS |
1 |
SSD |
Sistema |
2 |
SSD |
CS |
2 |
SSD |
CS |
3 |
SSD |
CS |
3 |
SSD |
CS |
… |
… |
… |
… |
… |
… |
N |
SSD |
CS |
N |
SSD |
CS |
2.3.6.5. Disco duro y disco SSD (sin caché) de 2 niveles¶
En este ejemplo de configuración, el nivel 1 es para discos duros sin caché y el nivel 2 es para discos SSD. El nivel 1 puede almacenar datos estáticos (como copias de seguridad) y el nivel 2 puede almacenar datos dinámicos (como equipos virtuales de alto rendimiento).
De 1 a 5 nodos (base) |
Más de 6 nodos (extensión) |
||||||
---|---|---|---|---|---|---|---|
N° de disco: |
Tipo de disco |
Roles de disco |
Nivel |
N° de disco: |
Tipo de disco |
Roles de disco |
Nivel |
1 |
SSD |
Sistema, MDS |
1 |
SSD |
Sistema |
||
2 |
SSD |
CS |
2 |
2 |
SSD |
CS |
2 |
3 |
HDD |
CS |
1 |
3 |
HDD |
CS |
1 |
… |
… |
… |
… |
… |
… |
… |
… |
N |
Disco duro/SSD |
CS |
1/2 |
N |
Disco duro/SSD |
CS |
1/2 |
2.3.6.6. Disco duro y disco SSD de 3 niveles¶
En este ejemplo de configuración, el nivel 1 es para discos duros sin caché, el nivel 2 es para discos duros con caché y el nivel 3 es para discos SSD. El nivel 1 puede almacenar datos estáticos (como copias de seguridad), el nivel 2 puede almacenar equipos virtuales comunes y el nivel 3 puede almacenar equipos virtuales de alto rendimiento.
De 1 a 5 nodos (base) |
Más de 6 nodos (extensión) |
||||||
---|---|---|---|---|---|---|---|
N° de disco: |
Tipo de disco |
Roles de disco |
Nivel |
N° de disco: |
Tipo de disco |
Roles de disco |
Nivel |
1 |
Disco duro/SSD |
Sistema |
1 |
Disco duro/SSD |
Sistema |
||
2 |
SSD |
MDS, caché de 2 niveles |
2 |
SSD |
Caché de 2 niveles |
||
3 |
HDD |
CS |
1 |
3 |
HDD |
CS |
1 |
4 |
HDD |
CS |
2 |
4 |
HDD |
CS |
2 |
5 |
SSD |
CS |
3 |
5 |
SSD |
CS |
3 |
… |
… |
… |
… |
… |
… |
… |
… |
N |
Disco duro/SSD |
CS |
1/2/3 |
N |
Disco duro/SSD |
CS |
1/2/3 |
2.3.7. Apectos que se deben tener en cuenta respecto al espacio en el disco sin procesar¶
Al planificar la infraestructura, tenga en cuenta lo siguiente para evitar confusiones:
La capacidad de los discos duros y los discos SSD se mide y especifica con decimales y no con prefijos binarios, por lo que “TB”, en el contexto de las especificaciones de disco, suele significar “terabyte”. Sin embargo, el sistema operativo muestra la capacidad de la unidad con prefijos binarios, lo que quiere decir que “TB”, en ese caso, significa “tebibyte”, que es una cantidad mucho mayor. Como resultado, es posible que los discos presenten una capacidad menor que la comercializada por el proveedor. Por ejemplo, un disco en cuyas especificaciones se indica que tiene 6 TB puede tener un espacio real de 5,45 TB en Acronis Cyber Infrastructure.
El 5 % del espacio del disco está reservado para emergencias.
Por lo tanto, si añade un disco de 6 TB a un clúster, el espacio físico disponible debería aumentar aproximadamente en 5,2 TB.
2.3.8. Comprobación de las capacidades de vaciado de datos del disco¶
Es muy recomendable asegurarse de que todos los dispositivos de almacenamiento que vaya a incluir en el clúster puedan transferir datos de la caché al disco si el suministro eléctrico del servidor se interrumpe de forma inesperada. Esto se debe a la posibilidad de que algunos dispositivos pierdan datos en caso de corte del suministro eléctrico.
Acronis Cyber Infrastructure incluye la herramienta vstorage-hwflush-check
, que comprueba cómo vacía datos un dispositivo de almacenamiento a un disco durante emergencias. La herramienta se implementa como una utilidad de cliente/servicio:
El cliente escribe constantemente bloques de datos en el dispositivo de almacenamiento. Cuando se escribe un bloque de datos, el cliente aumenta un contador especial y lo envía al servidor que lo mantiene.
El servidor realiza un seguimiento de los contadores que entran desde el cliente y siempre conoce el siguiente número de contador. Si el servidor recibe un contador menor que el que tiene (por ejemplo, porque se ha interrumpido el suministro eléctrico y el dispositivo de almacenamiento no ha vaciado los datos en caché en el disco), el servidor envía un informe de error.
Para comprobar que un dispositivo de almacenamiento puede vaciar datos en el disco correctamente cuando se interrumpe el suministro eléctrico, siga el siguiente procedimiento:
Instale la herramienta del paquete
vstorage-ctl
disponible en el repositorio oficial. Por ejemplo:# wget http://repo.virtuozzo.com/hci/releases/3.0/x86_64/os/Packages/v/\ vstorage-ctl-7.9.198-1.vl7.x86_64.rpm # yum install vstorage-ctl-7.9.198-1.vl7.x86_64.rpm
Repita el proceso en todos los nodos en los que quiera llevar a cabo las pruebas.
En un nodo, ejecute el servidor:
# vstorage-hwflush-check -l
En otro nodo que hospede el dispositivo de almacenamiento que desea probar, ejecute el cliente, por ejemplo:
# vstorage-hwflush-check -s vstorage1.example.com -d /vstorage/stor1-ssd/test -t 50
donde
vstorage1.example.com
es el nombre del host del servidor./vstorage/stor1-ssd/test
es el directorio que se usa para las pruebas de vaciado de datos. Durante la ejecución, el cliente crea un archivo en este directorio y escribe bloques de datos en él.El número de hilos de datos que el cliente debe escribir en el disco es
50
. Cada hilo tiene su propio archivo y contador. Puede aumentar el número de hilos (hasta un máximo de 200) para probar el sistema en condiciones más extremas. También puede especificar otras opciones al ejecutar el cliente. Para obtener más información sobre las opciones disponibles, consulte la página de gestiónvstorage-hwflush-check
.
Espere al menos entre 10 y 15 segundos, interrumpa el suministro eléctrico del nodo del cliente (pulsando el botón de Encendido y apagado o desenchufando el cable de alimentación) y vuelva a conectarlo.
Reinicie el cliente:
# vstorage-hwflush-check -s vstorage1.example.com -d /vstorlage/stor1-ssd/test -t 50
Una vez iniciado, el cliente leerá los datos previamente escritos, determinará la versión de los datos en el disco y reiniciará la prueba desde el último contador válido. A continuación, enviará dicho contador válido al servidor, que lo comparará con el último contador que tiene. Puede ver resultados como:
id<N>:<counter_on_disk> -> <counter_on_server>
lo que implica una de las siguientes posibilidades:
Si el contador en el disco es menor que el del servidor, el dispositivo de almacenamiento no ha vaciado correctamente los datos en el disco. Evite usar este dispositivo de almacenamiento para la producción, especialmente para CS o registros, ya que se arriesgará a perder datos.
Si el contador en el disco es mayor que el del servidor, el dispositivo de almacenamiento ha vaciado los datos en el disco, pero el cliente no ha enviado el informe al servidor. Puede que la red sea demasiado lenta o que el dispositivo de almacenamiento sea demasiado rápido para el número de hilos de carga establecidos, por lo que tal vez debería aumentarlo. Este dispositivo de almacenamiento se puede usar para producción.
Si ambos contadores son iguales, el dispositivo de almacenamiento ha vaciado los datos en el disco y el cliente ha enviado el informe al servidor. Este dispositivo de almacenamiento se puede usar para producción.
Por seguridad, repita el procedimiento varias veces. En cuanto haya comprobado el primer dispositivo de almacenamiento, continúe con el resto de los dispositivos que desee usar en el clúster. Debe probar todos los dispositivos que desee usar en el clúster: Discos SSD usados para registro en diario de CS, discos usados para registros de MDS y servidores de bloques.