vmwaresrm容灾方案建议书内容摘要:

通信网络上的数据完全恢复时间作为一项设计指标。 大部分业务系统都是数据库应用结构, 但 业务系统容灾 并不等于 是数据库容灾 ,还包括访问数据库的应用程序和相关配置信息。 实现数据库容灾 是容灾的基础,在保数据库数据一致的前提下,还要实现应用程序和配置信息的一致性;实现应用系统的高可用性、应用程序在容灾中心与生产中心接管和切回的过程,因此,还要考虑应用的模式是 C/S、 B/S,两层、三层、多层次的应用结构等等。 界定灾备系统的总体架构 根据实际需求、现有技术、所在地域、计划防范的灾难种类和预算投入的资金量等实际情况,确定灾备系统预期达到的级别,并以此来确定灾备系统与生产运行系统在地理位置上的距离(同城还是异地或两者兼备 -堡垒节点 ),备份数据存储所在的介质(磁盘还是磁带或两者兼备),备份数据在生产中心与备份中心传输的方式(这就涉及到了具体的计算机存储与网络技术),以及备份中心计算机系统的处理能力和网络接管所需的具体架构(是否与生产中心采用完全同等数量、容量和性能的计算机、存储设备和网络体系结构)。 XXX 企业容灾方案 现状分 析 在国内,很多企业都不具备灾难恢复能力,甚至是一些金融相关的公司都没有真正意义的灾难演练过。 主要是设备成本、技术复杂度已经人员 IT 技能等多方面因素造成的。 XXX 公司的采用传统灾备解决方案,并 有了多年的积累和发展 ,但是传统的解决方案还是存在如下诸多问题的。 首先,传统的可用性解决方案是利用特定于应用的解决方案(如: Oracle RAC、MS SQL 集群、 Exchange Database Access Groups (DAG)等)在应用级别实施业务可用性。 虽然这种方法通常可以提供不错的可用性,但是由于每一组应用都有自己的解决方案,因此这种方法有如下弊端: 11  复杂且昂贵  对管理员的技术要求较高  出错的风险大  许可证较贵 (如 RAC)  专用的备份架构 其次,虽然有一些基础架构层的解决方案可以比应用级解决方案更加经济高效,但是这些解决方案往往在正常运行时间和 RTO(恢复时间目标)方面表现得比较差。 除此之外,传统的 灾难恢复 解决方案很 难在 现有 的物理 X86 环境中实现 ,这是因为 : 传统的灾难恢复计划依赖于一套非常复杂的流程和基础架构:复制数据中心、复制服务器基础架构、将数据转移到恢复站点的流程、重启服务器的流程、重新安装操作系统的流程等等。 由于灾难恢复可能非常复杂,因此各 个 企业常常发现他们只能为少数几个重要 的 生产工作负载提供良好的保护,而其他 的 工作负载(如文件 /打印服务器、内部 Web 服务器、部门级应用) 则 得不到保护或 者 保护 的 不充分。 因为灾难恢复计划和基础架构非常复杂,所以各 个 企业 都 极为依赖大量的人员培训、 准确且完整的 恢复 纪录 ,以及发生停机时恢复流程的准确执行。 除此之外,由于恢复计划 的 测试过程会造成中断,而且成本 非常 高昂,所以各 个 企业无法确保所有培训、文档和执行过程都切实可行并 且 能够成功恢复 IT 服务。 图 : 传统的灾难恢复解决方案所面临的挑战 上图描述了传统的灾难恢复解决方案所面临的挑战, 由于存在 这些 挑战, 该方案往往会产生如下的后果:  恢复计划的测试往往会失败  关键工作负载的基本恢复(如能成功)通常要花费数天或数周的时间  管理和维护恢复计划要耗费 IT 人员大量 的 时间和资源 12 简言之, 当前的灾备解决方案 还 无法满足其企业所设定的 业务可用性 要求。 由此,XXX 公司提出重新设计和实施中心总部应用到北京 IDC 的异地远程灾备的需求。 XXX 总部应用虚拟化改造完毕后,目前服务器虚拟化比例已经达到大约 XX%,XX%的应用已经由虚拟化承载,其中包括 XX%的关键应用。 需结合应用系统架构给出中心总部应用到北京 IDC 的异地远程灾备方案及实施日程表,按照日程表完成异地远程灾备。 13 2 灾难恢复 解决方案 VMware 提出的 基于虚拟化环境的软件定义的可用性解决方案,该方案 不仅可 以提供与应用级别可用性 方案 相 类 似的 RTO 与 RPO(恢复点目标) , 同时,它 还可 以提供 基础架构层解决方案所具备 的 简易性和成本效益。 同时,由于该方案充分利用了虚拟化环境的优势,因此它可以达到传统的非软件定义解决方案无法达到的效果。 VMware 灾难恢复解决方案 包括 vCenter Site Recovery Manager 和全新的vSphere Replication。 vCenter Site Recovery Manager 如今,企业发现越来越难以提供符合要求的灾难恢复解决方案。 而 Site Recovery Manager 可以帮助企业应对传统灾难恢复方法的各种挑战 , 满足他们的恢复时间目标( RTO) 、恢复点目标 ( RPO) 以及法规遵从性要求。 利用 Site Recovery Manager,企业可以管理从生产数据中心到灾难恢复站点的故障切换 , 同时 , 还可以管理两个互为恢复站点且具有活动工作负载的站点之间的故障切换。 概述 VMware 的灾难恢复解决方案分为三个大的模块,如下图不同颜色模块所示:其中灾难恢复编排属于自动化解决方案;复制、备份和恢复属于数据保护解决方案;计算存储属于基础架构解决方案。 图: VMware 灾难恢复解决方案 Site Recovery Manager 可以自动执行及简化故障切换至新数据中心的过程,从而让所计划的数据中心故障切换(如数据中心迁移)变得更加顺畅。 它是一款领先的灾难恢复管理和自动化解决方案,它通过自动执行恢复过程来加快恢复的速度,并将灾难恢复作为 VMware 虚拟基础架构管理的集成要素,从而简化灾难恢复计划的管理工作。 SRM省去了复杂的手动恢复步骤,支持无中断的恢复计划测试,确保恢复过程的安全可靠。 它 密切集成 vSphere 及其他领先存储供应商提供的存储复制软件,使故障 14 切换和恢复变得快捷、可靠、经济,而且便于管理。 因此,企业不仅无需担心灾难恢复的风险,还可将所有重要的系统和应用程序纳入到保护范围。 自从 2020 年 面世 以来, SRM已得到长足发展。 到目前为止, VMware 已向 一万五千多家客户售出 万个许可证,并且该产品还在以每年 50%~ 60%的速度继续增长。 SRM为 vSphere 平台上的灾难恢复计划增加的巨大价值推动了这种增长,而所增加的成本却相对较低。 VMware 的许多客户已利用 SRM从实际灾难(例如最近在日本发生的海啸和在美国发生的飓风)中快速恢复。 下图是一些主要 的客户以及 SRM的相关市场数据。 图 : Site Recovery Manager 的发展趋势与部分客户 SRM需要若干个组件。 首先 , 受保护的站点和故障切换站点都需要一个 SRM实例。 SRM实例可通过与 vSphere 和 vCenter 紧密集成来提供管理和自动化功能。 15 SRM还需要底层复制产品来将虚拟机复制到故障切换站点。 借助 SRM, 客户可以选择使用 vSphere Replication 或者使用基于存储的复制。 因为 vSphere Replication与 SRM捆绑在一起 , 所以无需支付额外费用。 基于存储的复制由第 三 方存储供应商提供 , 并通过 Storage Replication Adapater (SRA)与 SRM紧密集成 , 以使 SRM能够利用该存储层协调复制和恢复活动。 最后, SRM在这两个站点上都需要配置 vSphere 集群和单独的 vCenter 实例。 图 : SRM 的主要功能组件 Site Recovery Manager 的主要功能特性 VMware vCenter Site Recovery Manager 可提供先进的复制、灾难恢复管理、无中断测试、自动故障切换和故障恢复以及计划内迁移功能。 它 可以管理从生产数据中心到灾难恢复站点的故障切换,以及两个具有活动 工作负载的站点之间的故障切换 ,甚至还可以将多个站点恢复为一个共享的恢复站点。 Site Recovery Manager 经常用于计划内迁移和预防性故障切换以避免发生灾难 ,它的主要功能特性如下: 集中式恢复计划  直接从 vCenter Server 中 创 建并管理恢复 计 划。  
 自动发现并显示由 vSphere Replication 或基于阵列的复制保 护的虚拟机。  将虚拟机映射到故障切换站点上的相应资源 (资源池、虚拟 交换机和虚拟机文件夹 )。  指定虚拟机引导顺序。  自定义虚拟机 IP 地址。  自定义故障切换站点上的低优先级虚拟机的关机。  利用自定义脚本扩展恢复计划。  利用基于角色的访问控制来控制对恢复计划的访问。  将多个站点恢复至一个共享的恢复站点。 16 自服务,基于策略的调配  可以为 Site Recovery Manager 安装了 VMware vCenter Orchestrator插件  多租户可以根据需求通过 vRealize Automation Center中的蓝图( blueprints)预定义的各自的灾难恢复策略 自动执行故障切换  接收关于可能的站点故障的自动警报。  只需单击一次鼠标 , 即可在 vCenter Server 中开始执行恢复计划。  自动停止用于恢复的复制数据存储的复制和升级。  关闭故障切换站点上的低优先级虚拟机。  按照预先指定的引导顺序自动启动受保护的虚拟机。  在恢复过程中执行用户定义的脚本和暂停。  在故障切换站点上自动重新配置虚拟机 IP 地址。  从 vCenter Server 中管理和监控恢复计划的执行。 自动故障恢复  自动故障恢复到原始生产站点。  通过自动反向复制到原始站点来重新保护虚拟机。  反向执行原始恢复计划。  利用 vSphere Replication 中的自动故障恢复功能。 计划内迁移  使用计划内迁移工作流确保数据零损失和应用一致性迁移。  在原始站点正常关闭受保护的虚拟机。  执行数据同步以强制将关闭的虚拟机完整复制到故障切换 站点。  执行利用应用一致性虚拟机的恢复计划。 无中断测试  自动执行恢复测试。  利用存储快照功能执行恢复测试 ,而不会中断复制。  在隔离网络中恢复虚拟机 ,以免对生产应用程序造成任何 影响。  针对测试方案自定义恢复计划的执行。  完成测试后自动清理测试环境。  在 vCenter Server 中存储、查看和导出测试结果及故障切换 执行情况。 支持 vSphere Replication  利用专为 vSphere 和 vCenter Site Recovery Manager 设计的唯一真正基于虚拟化管理程序的复制产品。  通过 vCenter 以精细灵活的虚拟机级别直接管理复制。  使用与存储无关的复制支持使用低端存储 ,包括直 连存储。  执行具备灵活 RPO(介于 15 分钟到 24 小时之间 )的异步 复制。  仅复制发生变更的数据块以提高网络效率。 17  扩展到数百个虚拟机。  利用对文件和应用一致性的支持。  使用多时间点 (MPIT) 恢复来回到以前的已知状态。 支持第三方基于阵列的复制  可在主要供应商提供的大量兼容性存储阵列和复制产品中进 行选择。  使用基于 iSCSI、光纤通道或 NFS 存储的基于阵列的复制解 决方案。  通过 SRA 确保与 vCenter Site Recovery Manager 紧密集成。  自动执行复制和数据同步操作 ,以实现协调一致的灾难恢复 
 故障切换和计划内迁移。 SRM 支持灵活的拓扑 Site Recovery Manager 可用于多种不同的故障切换情形 , 尤其是 SRM能帮助客户 更好地利用 对辅助站点的投资,即,当客户 没有处于灾难恢复情形中时,可将辅助站点用于其他工作负载而不是使其处于闲置状态 , SRM可用于 如下四种 不同的故障切换情形:  主动 被动 : Site Recovery Manager 完全支持传统的主动 被动型灾难恢复情形,即运行应用的生产站点将在故障切换之前一直处于闲置状态的辅助站点中恢复。 尽管这是最常见的配置,但此情形也意味着您需要为大部分时间都处于闲置状态的灾难恢复站点投入大量资金。  主动 主动 :为了更好地利用恢复站点, Site Recovery Manager 还可以使用户 在不使用该恢复站点进行灾难恢复时将其用于其他工作负载。 用户 可以将Site Recovery Manager 配置为在故障切换过程中自动关闭或挂起位于恢复站点的虚拟机,这样就可以方便地释放计算容量。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。