应用级容灾方案样本(vvrgco)内容摘要:

工作过程 为方便论述,本节模拟地点 A 和 B,两地各有一套建立在 VCS 双节点集群上的业务系统,以 B地点的系统作为 A地点的备份。 切换示意图见图六。 一、 正常情况下: 1) 业务系统运行在地点 A,包括数据库实例、 有关的文件、数据库数据、应用软件。 A节点对外提供服务。 2) A节点所有的有关的数据通过 VVR实时复制到 B 节点。 3) 两地的 VCS 对的各自节点内的两台服务器的主机情况、数据库服务、应用软件进行实时监控和管理,其中, VCS 还对 VVR 数据复制服务进行监控。 4) GCO 监控两地 Cluster 系统的运行。 二、 当 A地点的主服务器发生硬件或软件故障,导致主服务器无法提供正常服务: 1) VCS 进行本地切换,将主服务器的数据库服务、应用软件、 VVR 数据复制服务切换到本地后备节点。 2) 整个系统运行在本地后备节点,包括 VVR 数据复制服务,由后备 服务器提供对外服务和数据复制服务。 3) GCO 将监控到该切换事件的发生。 图六 VERI TA S 整体容灾方案 第 15 页 4) 如果仅仅是主服务器数据复制服务发生故障,可以不进行切换,只需将复制服务修复并正常运行。 三、 如果 A 地点的主服务器恢复正常,整个系统将重新运行在正常情况下。 四、 如果在情况二的状态下, A 地点的后备服务器也发生硬件或软件故障,整个 A地点无法正常提供服务: 1) GCO 将监控到该严重灾难的发生,将对接收到的 Site A down 事件进行处理:发出严重告警,并在管理界面上弹出服务灾难性切换(及服务切换到远程地点)等待确认画面。 2) 在有关人员确认后,在 GCO 切换等待确认画面上按确认按钮,将进行地点间的容灾切换。 注意:这里也可以配置成自动远程切换,指只要发生这里描述的灾难, GCO 不需要确认,直接将远程集群中有关服务组激活。 3) A地点的业务将在 B地点正常提供服务。 4) 数据复制暂停。 5) Site B 的 VVR 将从 Secondary 变成 New Primary,使用 DCM 记录所有变化的数据块。 五、 如果 A、 B地点间网络发生故障: 1) VVR 心跳检测将发现该故障, A 地点 VVR 将根据事先的配置进行处理。 我们的建议是 VVR 将网络故障期间所有数据的更改记录在 SRL。 2) 如果在一段较长时间内,网 络故障无法恢复。 当 VVR 的 SRL 卷接近满时,VVR 将使用 DCM,记录变化的数据块位图。 3) 在网络故障发生后, GCO 将探测到,并对 Network Down 事件进行处理:向有关管理员发出告警。 六、 如果 A、 B地点间网络在短时间内恢复正常。 1) VVR 将把 A的 SRL 中积累的数据传送到 B。 2) VVR 处于正常工作状态。 3) GCO 处于正常工作状态。 VERI TA S 整体容灾方案 第 16 页 七、 如果 A、 B地点间网络在很长时间内仍无法恢复正常: 1) VVR 停止远程数据复制。 2) GCO 无法对两地间的 Cluster 运行进行监控。 八、灾难复原。 当 A 地点的系统恢复正常后,需要进行整个系 统的回迁。 数据反向复制时只复制灾难期间变化的数据而不是所有的数据,这是本方案优势之一。 1) 在灾难期间, B 地点是 VVR的 New Primary, B的 DCM记录所有变化的数据块。 2) A 系统正常后, VVR 重新建立与 B 节点的 RLINK 连接,并自动变成 Pseudo Secondary(伪后备节点)。 3) GCO 发现 A、 B 地点 Cluster 恢复正常,对它们进行正常管理。 以下过程将在脚本中自动完成。 4) 进行反向同步的第一步是将 A 节点的 Pseudo Secondary 状态转成Secondary 状态。 5) 第二步将进行 A 的 SRL 和 DCM 的重置 (Replay),修改 B 的 DCM。 因为在 A 节点发生灾难时,有可能 A 的 SRL 中有没来得及进行传送得数据,甚至 DCM 中标记的数据块没来得及进行传送。 也就是说, A 中有一些本地已经修改,而 B 还未修改的数据。 所以,要保持 A、 B 数据的一致性,一定要首先对这些数据进行处理。 处理方法成为重置 (Replay)。 重置将把 A 节点 SRL 中数据或 DCM 中标记的数据位图信息传送到 B 节点。 B 节点将进行判断,根据数据块是否有新的修改,对 DCM进行置位。 6) 重置完成后,将进行数据的反向同步,将灾难期间 B 节点变化的数据(和需要 A节点重 置的数据)传送到 A。 7) 以上的过程中, B的数据库和应用都处于正常运行状态。 8) 当反向同步完成后,数据库和应用将停止运行。 9) GCO 控制进行整个系统的反向切换。 10) A节点重新成为 VVR 的 Primary,进行正常复制。 11) A节点整个业务系统恢复正常运行。 VERI TA S 整体容灾方案 第 17 页 方案分析 本章将就 xxx 需求书中提出的要求分析方案。 通过分析,说明方案符合需求,并进一步讲解方案的细节。 有关数据的量化分析及结果 涉及数据库的系统业务,除了对数据库内容的更改进行实时数据复制外,还要复制有关的系统文件,例如环境配置信息、数据库 环境配置信息。 在带宽允许的情况下,我们将对整个数据库有关的内容,包括数据库安装软件、数据库数据等等都实时复制到灾备节点。 当发生灾难时,恢复的时间会很短。 对于 VVR 对数据库内容的复制,就 oracle 为例,有两种方法: 1)仅复制 Archive Log 和 Online Redo Log。 该方法的优点是复制数据量小,对带宽要求小,而且比数据库本身的复制功能更能保持数据一致性,因为数据库本身的复制仅复制 Archive Log。 缺点是后备节点要进行Log 中的交易重提交,当发生灾难后,后备节点可能需要较长时间才能提供正常服务。 2) 数据库的内容和 Log 都进行复制。 该方法的优点是更好地保持数据的一致性,而且发生灾难时,后备系统恢复正常服务的时间较短。 缺点是复制的数据量较大,对带宽的要求较高。 根据计算,由于带宽允许,所以,将进行数据库 内容和 Log 的复制。 以下是根据《 xxx 需求书》中的业务数据进行计算后得到的所需带宽和 SRL 的尺寸。 一、带宽计算: 1. 平均带宽需求 VERI TA S 整体容灾方案 第 18 页 每秒操作涉及到的更新的数据: xxxx Bytes 冗余系数: (指数据库表操作引起的索引文件,控制文件, LOG 文件等的修改) 加冗余后每秒操作涉及到的更新的数据: xxxx * =yyyy Bytes 加冗余后每小时操作涉及到的更新的数据: yyyy * 3600=zzzz Bytes 加冗余后每天操作涉及到的更新的数 据: zzzz * 24 = pppp Bytes 平均带宽需求: yyyy*8/1000=qqqq Kbit/s 2. VVR 带宽需求 VVR 控制信息: 约占总带宽的 35% IP 打包数据占每次 I/O 的百分比 约 510% 总带宽需求: qqqq*=aaaa bit/s 二、 SRL 容量计算 SRL(即数据复制的日志区)的容量计算,将视实际情况(如磁盘实际容量、网络平均故障修复时间、变化数据量等)定。 例如一般情况下,网络故障在 8 小时内修复,则将 SRL的容量定为 8小时内数据变化量再加上一定的冗余。 三、结论 如果带宽充裕,可以使用同步 /异步自适应的工作方式;如果带宽不是很充裕(例如 14Mbits/s),为了保证业务系统的性能,建议 VVR 工作在异步方式下。 VERI TA S 整体容灾方案 第 19 页 方案小结 本方案的特点: 是一个完整的容本地容灾、数据远程复制和远程容灾切换于一体的方案。 本方案完全符合《 xxx 需求书》的技术指标,完全实现 xxx 业务的全面容灾需求。 以下说明本方案的特点及优势。 一、 本方案能够支持手动 /自动信令容灾方案,用户可以根据实际需要进行 自由选择。 但在实际情况中,由于发生重大灾难时业务异地切换属于非常严重的事故,所以我们建议该过程前用户进行电话确认,然后在 GCO 界面中按下切换确认按钮进行切换。 二、 当本地主系统恢复正常后,需要进行反向数据同步、应用切换等工作,该工作需要由操作人员在系统较空闲时进行。 工作过程很简单。 三、 通过 SRL、 DCM、严格的按写顺序传送、双收条确认、反向切换时的重置等技术的使用,本方案可以最大限度地保证主、备节点的数据一致性。 四、 本方案支持 1+ N+1和节点互备方式,满足用户的不同需求。 五、 本方案如果不考虑带宽,节点间没有距离 的限制。 由于 VVR 的数据传递是基于卷,所以每次传送的数据量基本就是每次系统 I/O 的数据大小。 这样可以得到最大的带宽利用率。 六、 基线建立,需要主备节点的数据完全同步。 完全同步在应用运行期间也可以完成。 可以采用自动同步方式或使用备份和检查点 (Check Point)结合的方法。 七、 至于基线建立过程、日常复制过程、故障切换过程和故障恢复过程对主机性能的影响,由于对不同的配置、不同的情况将有很大的区别,所以,很难给出VERI TA S 整体容灾方案 第 20 页 具体的数值。 以我们在以往实施中的经验,如果采用异步复制方式,对整个系统的影响,在 5%左右。 VERI TA S 整体容灾方案 第 21 页 附 录 一、 VERITAS 公司简介 作为企业级应用存储管理软件的领先提供商, VERITAS Software (Nasdaq:VRTS)公司专门提供集成的跨平台存储管理软件解决方案,用来保证关键业务信息的连续可靠性。 VERITAS 公司于 1982 年成立于加利福尼亚的 Mountain View,现拥有员工 3500余名,在全球多个国家设立分公司或办事处。 公司 2020 财年的收入为 12 亿美元,市值 700 亿美元,稳座全球五大软件厂商之一的宝座。 在过去的十年中, VERITAS Software 己成为发展最快、规模最大的存储管理软件公司,它连续四年被《商业周刊》杂志评为“发展最强劲的公司”,在《财富》从杂志的“发展最快的 100 家公司”排名 (1999 年 9 月 6日 )中名列第八,并于。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。