HP3PAR Peer Persistence是3PAR基于Remote Copy实现的“双活”扩展集群,可以在数据中心内部或者之间提供透明的故障切换,实现业务连续性。HP的主要应用场景是与VMware结合,与VPLEX类似,提供VMware HA和vMotion解决方案,与HDS HAM一样,也通过了vMSC认证。在功能上,与VPLEX Metro类似,凭借有吸引力的价位,成为市场上关于存储容灾的“足够好的解决方案”之一。
可以注意到:HDS的HAM、NetApp的Metro Cluster、HP的PeerPersistence、IBM的SVC、EMC的VPLEX都通过了vMSC的认证。
那么什么是VMware vSphere Metro Storage Cluster(vMSC)?
在vMSC里,服务器和存储都可以部署不同地理位置上,而不仅仅是传统的两台存储之间的同步镜像。同一个集群里面的虚拟主机和存储可以延伸为两个数据中心,在vMotion和Storage vMotion的帮助下,你可以将虚拟机从一个数据中心移动到另一个数据中心,而不需要中止应用。当灾难发生时,借助VMware HA可以帮助减小服务中断时间。
在部署vMSC时,需要:
1.存储连接使用FC、FCoE、NFS或iSCSI;
2.ESXi管理网络的最大往返时延(RTT)在10ms以内(超过10ms时,需要使用vSphere Enterprise Plus-Metro vMotion);
3.存储间复制链路最大往返时延在5ms以内;
4.每个vMotion动作必须保证有250Mbps的专属带宽;
但vMSC对存储的要求,并不是最大往返时延,而是存储必须能被两个数据中心都访问到,也就是A地的主机可以访问到B地的存储,反之亦然。
vMSC有两种主机访问存储的模式:
一致访问(Uniform)
上图是“一致访问”的典型配置,在这种模式下,两边的存储都可以被所有的主机访问到,两边存储系统上的LUN均映射到主机上,光纤网络横跨两个站点。
这种连接方式目前是最主流的。
非一致访问(Non-Uniform)
上图是“非一致访问”的典型配置,在这种模式下,A站点的主机只能访问本地的存储系统。如果A站点存储故障,A站点的ESXi主机会丢失与存储的连接而失效,此时B站点的ESXi主机在VMware HA的控制下,启动接管A站点主机。
还有一种“非一致访问”的配置模式,如下图所示:两个存储系统上通过镜像建立一个虚拟LUN,光纤网络横跨两个站点,这个LUN可以被两个站点同时访问。
HP3PAR Peer Persistence是基于同步远程复制,利用非对称逻辑单元访问ALUA功能实现了所有主机对存储的访问。典型的Uniform vMSC配置中,HP 3PARStorserv阵列会创建双向的远程复制组,如下图所示:
它的工作方式比较简单,当在远程复制组中添加源卷时,目标卷会在第二台存储上同时自动创建,并使用相同的WWN,然后源卷和目标卷都会被映射到主机上,他们会使用相同的LUN号。在ESX主机上,我们可以看到源卷的路径是标记为活动的,而目标卷的路径是备用,当然可以切换复制的方向,将源卷与目标卷的角色互换,而且对主机端的VM没有影响。
第三个是额外的Quorum Witness(缩写QW),一个部署在第三方站点、基于RHELLinux的VM,当远程复制链路或者存储系统故障时,可以起到仲裁作用。QW允许Peer Persistence在不影响上层主机VM的情况下,处理不同的故障场景,QW必须能和两个阵列时时通讯,而且最大往返时延不能超过150ms。
在不同故障场景下,Peer Persistence的处理方式如下:
从HP的白皮书中可以看到,Peer Persistence部署vMSC时,有如下要求:
1.StoreServ的FW版本需要在3.1.2MU2或更新,推荐3.1.3;
2.建立一对一的同步远程复制;
3.最大往返时延小于2.6ms;
4.QW仲裁运行在第三方站点,并可与两个存储通讯;
5.iSCSI或FCoE目前还不支持Peer Persistence;
6.两个StorServ阵列必须购买远程复制许可,推荐购买复制套件;
vMSC作为延伸的服务器和存储集群,实现虚拟机、工作负载的跨站点移动,同时可以避免由于存储故障造成的宕机。利用3PAR的远程复制、Peer Persistence、QW仲裁功能,基于两台3PAR存储阵列,可以构建vMSC,实现了虚拟机/工作负载跨站点的移动,以及在存储故障时的透明切换。
好,铺垫完毕。
上次http://www.thestoragechap.co.uk的博主,分享了VPLEX Metro和HDS HAM的区别,这一次,他又对比了VPLEX Metro和HP 3PAR Peer Persistence的区别。
PeerPersistence与VPLEX的区别点主要在于:
仅支持HP 3PAR阵列,而VPLEX则是真正异构的,当然,对于大多数中端存储用户来说,他们只会在两台3PAR或者两台VNX之间进行容灾。但的确,不支持异构存储,会存在厂商锁定的风险;
PeerPersistence只能应用两台HP的阵列间,但VPLEX则是基于两个数据中心的多个阵列间,同上条;
从架构上看,在LUN层面,显然HP是一个主/备模式,这一点上,HP是和IBM SVC、HDS HAM、NetApp Metro Cluster类似的,并不是像VPLEX一样真正的Active/Active双活。当你想部署一个连续高可用或者完全自动故障切换的方案时,这会成为一个问题,因为有时必须要手动介入切换;
由于远程复制组的存在,相比VPLEX,HP需要更大的带宽用于跨站点的数据传输;
HPPeer Persistence仅支持FC,而VPLEX也可以支持IP,从而性价比更好;
HPPeer Persistence需要光纤网络横跨两个站点,而VPLEX则不需要;
HPPeer Persistence需要每个主机都要连接到每个存储阵列上,而VPLEX则只需要主机连接本地的VPLEX即可,这样就减少了站点间的链路需求;
HPPeer Persistence可以接受的最大往返时延是2.6ms,而VPLEX Metro是5ms(vMotion的场景下可达10ms),从而允许两个站点间的距离更大;
VPLEX部署时,天然就支持存储虚拟化,而HP Peer Persistence不支持存储虚拟化(这一条得加粗、加黑,:));
有意思的是,博主在发表这篇文章后,有来自HP的员工参与了讨论(最愿意看两个厂商的专家辩论了):
1.仅支持3PAR阵列:HP说我们这个设计是为了更好的集成、易于部署、兼容性和节省成本,再说,你VPLEX支持Tier分层、Thin精简配置、Snaoshot快照吗?(注:VPLEX的确不支持这些功能,实际部署时,是利用存储本身的高级功能,SVC等经常拿这一点攻击VPLEX);
2.是的,你VPLEX可以横跨数据中心,但是增加了VPLEX虚拟化网关,是不是也增加了一个故障点呢?而我们3PAR只用到了两台独立的、高可用的阵列;
3.负载均衡:在正常的操作时,每个阵列只服务本地的主机,本地主机对本地存储访问时,仍然是Active/Active的,ALUA只有在跨站点时才起作用;而且故障切换也是全自动的,根本不需要手动介入;同时,在正常运行时,只有写操作是发送到两个站点的,读操作都是访问本地;
4.现在是VMware仅支持FC,我们HP实际上可以支持FC和IP,尤其是3PAR还内置了IP复制端口;
5.至于QW最大往返时延小于150ms,这意味着15000公里了(光纤中光速为20万公里/秒),如果这还不够用,是不是得考虑下需求的合理性了?
HP的选手发表完观点后,EMC的选手回复:
1.在我看来,Peer Persistence就是个增强版的Active/Passive复制方案,增加了智能化功能,允许主机端多路径驱动在主路径失效后可以自动切换;唯一的技术创新就是在凉台3PAR阵列上可以提供相同的卷WWN;
2.PeerPersistence并不是真正的虚拟化方案,因为存在两大限制:只能3PAR阵列,而且最大只能2台阵列;当要设备更换或者方案升级时,意味着需要完全宕机进行迁移(注:的确对于VPLEX和SVC来说,由于增加了一层虚拟化网关,升级迁移会容易些,尤其是前者);
3.PeerPersistence仅支持VMware(最近也支持Windows)是个最大的限制,尤其是还不支持HP-UX,而VPLEX支持绝大多数OS平台,包括HP-UX;
4.设想一个场景:你怎么跨站点移动虚拟机?虚拟机被移动到B站点,但数据访问仍然通过A站点进行,大量的跨站点数据传输,当然此时你可以在ESX中切换主备路径,但这意味会影响到所有的VM和远程复制组;
5.而VPLEX则是一个真正的Active/Active双活虚拟化方案,虚拟机可以跨站点移动,并实现本地存储访问,不需要手动介入。当发生故障切换时,如果要Failback,Peer Persistence需要在命令行手动操作,而VPLEX则是全自动的;
6.卷扩展时,在部署Peer Persistence时,如果需要进行卷扩展,意味着停止远程同步复制,扩展卷的容量,然后恢复复制(不确定是否还需要对整个卷进行resync),不可避免的会影响到主机应用;而VPLEX在做这些操作时,可以保持在线状态;
7.针对HP提到的VPLEX单点故障问题,实际上VPLEX部署时,支持多引擎横向扩展,实际上,增加了可用性;
8.最后,3PAR的确具有很多存储特性,但如何避免厂商锁定的问题呢?如果客户需要两地三中心,PeerPersistence又如何实现呢?
另外一个网友,提到:
1.这两个产品的确存在较多的不同点,但更重要的是,客户的需求和期望是什么?
2.的确,Peer Persistence不支持存储虚拟化,不支持双活,但很多时候,也足以提供客户需要的高可用性;
3.需要思考的是:为什么客户会选择VPLEX,而不是Peer Persistence、SVC、Metro Cluster、HAM?客户存在哪些需求时,应该提供什么哪些产品或方案?
坦率的说,我们在这里摘录一些产品的对比和网友的评论,是为了更好的理解不同厂商在设计方案时的考虑和产品的细节,而不是争论到底谁好谁坏?因为没有完美的、领先的产品,只有最契合客户需求(功能、性能、成本)的方案。
小宇的自我介绍
姓名:单晓宇。企业级营销存储Team,负责中高端存储和解决方案,喜欢研究市场、技术、产品。好读书,不求甚解,每有会意,便欣然忘食……
扫以下微信号并关注我哟~
长按图片,选择“识别图中二微码”并关注我~