10.9. 启用高可用性

即使 Acronis Cyber Infrastructure 服务所在的节点发生故障,高可用性也可以使这些服务保持运行。在这种情况下,来自发生故障节点的服务将根据筏共识算法重定位至运行正常的节点。通过以下方式确保高可用性:

  • 元数据冗余。为了使存储群集正常运行,并非所有 MDS 服务器都必须启动,只需大多数 MDS 服务器启动即可。通过在群集中设置多个 MDS 服务器,将确保如果一个 MDS 服务器发生故障,其他 MDS 服务器将继续控制该群集。

  • 数据冗余。每条数据的副本将存储在不同的存储节点上,以确保即使某些存储节点不可访问,数据也可用。

  • 监控节点运行状况。

为了实现存储群集及其服务的完全高可用性,建议您执行以下操作:

  1. 部署三个或更多元数据服务器。将根据推荐的硬件配置自动部署所需数量的元数据服务器。

  2. 启用管理节点 HA。必须手动启用管理节点 HA。

  3. 为特定服务启用 HA。通过向服务的群集添加所需最少数量的节点,来为该服务启用高可用性。

基于高度可用的元数据服务和启用的管理节点 HA,Acronis Cyber Infrastructure 将为以下服务提供其他高可用性:

  • 管理面板。如果管理节点发生故障或无法通过网络访问,则另一个节点上的管理面板实例将接管该面板的服务,以便它仍可以通过相同的专用 IP 地址进行访问。服务的重新定位可能需要几分钟时间。手动启用管理面板 HA 以及管理节点 HA(请参阅 启用管理节点高可用性)。

  • 虚拟机。如果某个计算节点发生故障或无法通过网络访问,则托管在其上的虚拟机将根据其他正常运行的计算节点的可用资源撤离至该计算节点。计算群集只能承受一个节点发生故障。默认情况下,在创建计算群集后会自动为虚拟机启用高可用性,也可以根据需要手动禁用。(请参阅 配置虚拟机高可用性)。

  • iSCSI 服务。如果指向通过 iSCSI 导出的卷的活动路径发生故障(例如,具有活动 iSCSI 目标的存储节点发生故障或无法通过网络访问),则会通过正常运行节点上的目标重新路由该活动路径。只要有至少一条指向通过 iSCSI 导出的卷的路径,则仍可访问这些导出的卷。

  • S3 服务。如果 S3 节点发生故障或无法通过网络访问,则托管在其上的名称服务器和对象服务器组件将自动进行平衡并在其他 S3 节点之间迁移。S3 网关不会自动进行迁移;它们的高可用性基于 DNS 记录。添加或删除 S3 网关时,您需要手动维护 DNS 记录。在启用管理节点 HA 并基于三个或更多节点创建 S3 群集之后,将自动为 S3 服务启用高可用性。由三个节点组成的 S3 群集可能会丢失一个节点并保持继续运行。

  • 备份网关服务。如果某个备份网关节点发生故障或无法通过网络访问,则备份网关群集中的其他节点将继续提供对所选存储后端的访问。备份网关不会自动进行迁移;它们的高可用性基于 DNS 记录。添加或删除备份网关时,需要手动维护 DNS 记录。基于两个或更多节点创建备份网关群集后,将自动为备份网关启用高可用性。将继续对存储后端提供访问,直到备份网关群集中至少一个节点运行状况良好为止。

  • NFS 共享。如果存储节点发生故障或无法通过网络访问,则位于其上的 NFS 卷将在其他 NFS 节点之间迁移。创建 NFS 群集后,将自动为存储节点上的 NFS 卷启用高可用性。

10.9.1. 启用管理节点高可用性

为了使基础架构更弹性和更冗余,可以创建由三个节点构成的高可用性配置。

管理节点高可用性和计算群集紧密耦合,因此更改双方之一中的节点通常会影响另一方。注意以下内容:

  1. HA 配置中的每个节点都必须满足 Hardware requirements 中列出的管理节点的要求。如果要创建计算群集,还必须添加其硬件要求。

  2. 如果 HA 配置是在计算群集之前创建的,则其中的所有节点都将添加至该计算群集中。

  3. 如果计算群集是在 HA 配置之前创建的,则只能将计算群集中的节点添加至 HA 配置中。因此,要将某个节点添加至 HA 配置,请先将该节点添加至计算群集。

  4. 如果 HA 配置和计算群集中都包括相同的三个节点,则无法从计算群集中删除其中的任何一个节点。在此情况下,可以完全毁坏计算群集,但 HA 配置将保留。反之亦然,可以删除 HA 配置,但计算群集将继续工作。

注解

计算群集中必须具有至少三个节点,以允许自助服务用户为 Kubernetes 主节点启用高可用性。

要为管理节点和管理面板启用高可用性,请执行以下操作:

  1. 确保将每个节点都连接至具有管理面板内部管理流量类型的网络。

  2. 设置 > 管理节点屏幕上,打开管理高可用性选项卡。

    ../_images/enabling_ha1_ac.png
  3. 选择三个节点,然后单击创建 HA。将自动选择管理节点。

  4. 配置网络上,验证是否在每个节点上都选择了正确的网络接口。否则,请单击节点的齿轮图标,然后将具有内部管理管理面板流量类型的网络分配给其网络接口。单击继续

    ../_images/enabling_ha2_ac.png
  5. 配置网络上,为高度可用管理面板、计算 API 端点和服务间消息传递提供一个或多个唯一的静态 IP 地址。单击完成

    ../_images/enabling_ha3_ac.png

在为管理节点启用高可用性后,可以使用指定的静态 IP 地址(在同一端口 8888 上)登录至管理面板。

由于管理节点 HA 必须始终恰好包括三个节点,因此无法在不同时添加另一节点的情况下从 HA 配置中删除一个节点。例如,要从 HA 配置中删除发生故障的节点,可以将它替换为运行状况良好的节点。请执行以下操作:

  1. 设置 > 管理节点 > 管理高可用性选项卡上,选择一个或两个要从 HA 配置中删除的节点以及一个或两个将添加至该 HA 配置中的可用节点,然后单击替换

    ../_images/enabling_ha4_ac.png
  2. 配置网络上,验证是否在要添加的每个节点上都选择了正确的网络接口。否则,请单击节点的齿轮图标,然后将具有内部管理管理面板流量类型的网络分配给其网络接口。单击继续

要从 HA 配置中删除节点,请单击销毁 HA