ActiveCluster VMware vMSC
search cancel

ActiveCluster VMware vMSC

book

Article ID: 301151

calendar_today

Updated On:

Products

VMware vCenter Server

Issue/Introduction

本文提供了有关 ActiveCluster VMware vMSC 的信息

Symptoms:
免责声明: 本文是 ActiveCluster VMware vMSC (51656) 的翻译版本。 尽管我们会不断努力为本文提供最佳翻译版本,但本地化的内容可能会过时。 有关最新内容,请参见英文版本。

Resolution

什么是 vMSC?

vSphere Metro Storage Cluster (vMSC) 是一种合作伙伴支持的高可用性解决方案,它整合了基于阵列的同步复制和 vSphere 功能,例如 VMware HA 群集。有关 vMSC 的详细信息,请参见 VMware Partner Verified and Supported Products page

什么是 ActiveCluster?

Pure Storage® ActiveCluster 是一种全对称主动/主动双向复制解决方案,它通过提供同步复制实现零 RPO,以及提供透明故障切换实现零 RTO。ActiveCluster 跨越多个站点,从而能够使用群集阵列和群集 ESXi 主机来部署灵活的主动/主动数据中心配置。



同步复制:在阵列之间同步写入,并通过两个阵列上的非易失性 RAM (NVRAM) 对其提供保护,然后再向主机确认。

对称主动/主动:在镜像的任一侧读取和写入到同一个卷,并感知可选的主机到阵列站点。

透明故障切换:使用自动重新同步和恢复功能在各次阵列和站点同步复制之间自动进行无中断故障切换。

异步复制集成:为基准副本和重新同步使用异步方法。无需重新发送数据即可将异步关系转换为同步。

无需附加项和许可证:不需要任何其他硬件,也不需要成本高昂的软件许可证,只需升级 Purity Operating Environment 并转为主动/主动即可!

简化管理:从镜像的任一侧执行数据管理操作,置备存储,连接主机,创建快照,创建克隆。

集成了 Pure1® Cloud Mediator:自动配置了被动中介,以允许透明故障切换并防止发生裂脑,且无需部署和管理另一个组件。

核心组件

Purity ActiveCluster 由以下三个核心组件组成:Pure1 Mediator、主动/主动群集阵列对和延伸存储容器。


Pure1 Cloud Mediator:  该解决方案的一个必要组件,用于确定环境中发生故障时哪个阵列将继续提供数据服务。也可以使用内部部署中介虚拟机。

主动/主动群集 FlashArray:利用同步复制在每个阵列上维护一份数据,并将它们作为一个统一的副本提供给连接到任意一个或同时连接到两个阵列的主机。

延伸存储对象:名为 pod 的管理容器,用于将存储对象(例如卷)收集到在两个阵列之间延伸的组。

要求

解决方案组件要求

两个 Pure Storage FlashArray

Pure1 Cloud Mediator 或安装在第三个站点(位于不同于两个阵列站点的单独故障域)中的内部部署中介。

如果使用内部部署中介,还需要为中介提供 VMware HA ESXi 主机保护。

复制网络要求

复制网络用于数据的初始异步传输,以便延伸 pod,在阵列之间同步传输数据和配置信息以及重新同步 pod。
  • ​ 群集 FlashArray 之间的最大往返延迟为 5 毫秒。
  •  每个阵列 4 个 10 GbE 复制端口(每个控制器两个)。要求每个控制器两个复制端口,以确保从主控制器到另一个阵列的冗余访问。
  •  每个阵列 4 个专用复制 IP 地址。
  •  一个冗余切换的复制网络。不能直接连接 FlashArray 进行复制。
  •  在阵列之间具有足够的带宽,以支持双向同步写入,并具有足够的带宽用于重新同步。这取决于两个站点上的主机的写入速度。
管理网络要求

需要使用管理网络来连接阵列和连接到中介。  管理网络独自临时中断不会导致出现故障。
  • 每个阵列 4 个 1 GbE 管理端口(每个控制器两个)。要求每个控制器两个管理端口,以确保从主控制器到中介的冗余访问。
  • 每个阵列 5 个管理 IP 地址。其中,1 个 IP 地址用于 vir0(虚拟管理接口),4 个物理端口 IP 地址,FlashArray 上的每个物理管理端口一个。 
  • 从两个阵列站点到中介具有独立管理网络访问权限,以便任何一次网络中断都不会阻止这两个阵列访问中介。
注意:在称为回程 Internet 的设计中,有些站点通过相邻站点连接到 Internet。对于这些站点,应使用内部部署中介,将其安装在第三个站点(位于不同于两个阵列站点的单独故障域)中。

环境连接选项

以下部分描述了阵列到主机连接的基本连接示例。Purity ActiveCluster 既支持统一存储访问,也支持非统一存储访问。

统一存储连接

在统一存储访问配置中,ESXi 主机可以通过延伸 FC SAN 或 iSCSI 网络访问两个存储阵列。典型的统一存储访问配置由两个站点组成,每个站点上的 ESXi 主机连接到延伸 SAN 以实现主机到阵列连接。下例显示了一个具有在架构和站点之间实现冗余所需最小阵列端口数的简单双延伸架构配置:每个架构两个端口,每个控制器上一个。有两个架构:A 和 B(FC 或 iSCSI),使用长距离交换机间链路 (ISL)、长距离光纤、暗光纤、DWDM 或其他提供站点到站点连接的长距离连接选件。



根据 ALUA 优先级和 Pure Storage FlashArray 软件中的首选阵列连接设置,在两个阵列均处于联机状态时,存储设备的主机 I/O 将保持在每个站点内。对于本地主机来说,FlashArray 上的所有前端端口均处于活动状态。



如果任一站点中的阵列脱机,例如阵列 A,站点 A 中的 ESXi 主机将继续通过阵列 B 的非最优路径访问存储。如果站点 A 中的阵列脱机,此机制同样适用于站点 B 中的 ESXi 主机。



非统一存储连接

在非统一存储访问配置中,ESXi 主机仅可以访问一个存储阵列。典型的非统一存储访问配置由两个站点组成,通过每个站点中的单或双架构连接 ESXi 主机以实现主机到阵列的连接。下例显示了一个具有在架构之间实现冗余所需最小阵列端口数的简单双架构配置:每个架构两个端口,每个控制器上一个。每个站点中有两个架构,站点 A 中为 A 和 B(FC 或 iSCSI),站点 B 中为架构 C 和 D。



仅在每个阵列的本地路径上发生主机 I/O,并且本地主机将每个阵列上的所有路径都用作主动/优化路径。如果一个阵列脱机,那么必须在在另一个站点上重新启动虚拟机,可以由 VMware HA 自动完成。

故障切换情形

环境在发生某些故障事件期间的行为随主机访问配置(即,统一还是非统一)而异。在统一存储访问配置中,主机可能只是遇到了某些存储路径丢失问题;不会出现任何存储故障切换过程。在非统一存储访问配置中,同样不会出现存储故障切换过程,但是 VMware HA 将在其他 ESXi 主机上重新启动连接到脱机阵列的 ESXi 主机上运行的虚拟机。

注意:ActiveCluster 使用名为 pod 的存储对象定义要在存储阵列之间同步复制的卷。这称为延伸 pod。不在延伸 pod 中的卷将通过阵列保持联机的故障情形来保持联机。

如何故障切换

故障切换自动执行,无需存储管理员干预即可通过 ActiveCluster 执行故障切换。

自动故障切换至少需要有一个阵列有权访问中介,且在以下任一情况下可能会触发:
  • 阵列故障。
  • 两个阵列之间的复制链路故障。
  • 整个阵列站点发生故障,即站点范围的灾难。
一个站点中的整个存储网络发生故障可以说成是故障切换,而不是存储故障切换。在这种情况下,两个阵列都能够提供 I/O,但仅供站点中存储网络仍处于联机状态的 ESXi 主机访问。

如何重新同步和恢复

重新同步和恢复自动执行,无需存储管理员干预即可使用 ActiveCluster 重新同步和恢复复制。

系统会定期创建内部检查点,这些内部检查点提供了一个已知的同步状态,阵列可以从该状态自动执行重新同步。当阵列之间的连接还原时,使延伸 pod 保持联机状态的阵列上自中断以来所做的任何更改都将异步传输到另一个阵列。阵列将通过越来越短的定期异步后台传输来达到同步。在阵列几乎同步后,它们将平稳过渡到同步复制模式,并且 pod 脱机端的数据路径将自动还原,从而允许 ESXi 主机再次通过两个阵列执行 I/O。

通过故障访问存储

下表描述了在发生组件故障时,ActiveCluster 是否能够在一个阵列或另一个阵列上为针对同步复制配置的卷提供 I/O。请注意,3 个主要组件(阵列 A、阵列 B、中介)中,必须有 2 个联机且可访问才能在正常运行的阵列上继续提供 IO 服务。在中介不可用时,复制链接故障或阵列故障将导致停止两个阵列上同步复制卷的 I/O,以防止裂脑。中介是该解决方案的必要组件。