应用级容灾方案样本(vvrgco)

应用级容灾方案样本(vvrgco)内容摘要：

工作过程为方便论述，本节模拟地点 A 和 B，两地各有一套建立在 VCS 双节点集群上的业务系统，以 B地点的系统作为 A地点的备份。切换示意图见图六。一、正常情况下： 1）业务系统运行在地点 A，包括数据库实例、有关的文件、数据库数据、应用软件。 A节点对外提供服务。 2） A节点所有的有关的数据通过 VVR实时复制到 B 节点。 3）两地的 VCS 对的各自节点内的两台服务器的主机情况、数据库服务、应用软件进行实时监控和管理，其中， VCS 还对 VVR 数据复制服务进行监控。 4） GCO 监控两地 Cluster 系统的运行。二、当 A地点的主服务器发生硬件或软件故障，导致主服务器无法提供正常服务： 1） VCS 进行本地切换，将主服务器的数据库服务、应用软件、 VVR 数据复制服务切换到本地后备节点。 2）整个系统运行在本地后备节点，包括 VVR 数据复制服务，由后备服务器提供对外服务和数据复制服务。 3） GCO 将监控到该切换事件的发生。图六 VERI TA S 整体容灾方案第 15 页 4）如果仅仅是主服务器数据复制服务发生故障，可以不进行切换，只需将复制服务修复并正常运行。三、如果 A 地点的主服务器恢复正常，整个系统将重新运行在正常情况下。四、如果在情况二的状态下， A 地点的后备服务器也发生硬件或软件故障，整个 A地点无法正常提供服务： 1） GCO 将监控到该严重灾难的发生，将对接收到的 Site A down 事件进行处理：发出严重告警，并在管理界面上弹出服务灾难性切换（及服务切换到远程地点）等待确认画面。 2）在有关人员确认后，在 GCO 切换等待确认画面上按确认按钮，将进行地点间的容灾切换。注意：这里也可以配置成自动远程切换，指只要发生这里描述的灾难， GCO 不需要确认，直接将远程集群中有关服务组激活。 3） A地点的业务将在 B地点正常提供服务。 4）数据复制暂停。 5） Site B 的 VVR 将从 Secondary 变成 New Primary，使用 DCM 记录所有变化的数据块。五、如果 A、 B地点间网络发生故障： 1） VVR 心跳检测将发现该故障， A 地点 VVR 将根据事先的配置进行处理。我们的建议是 VVR 将网络故障期间所有数据的更改记录在 SRL。 2）如果在一段较长时间内，网络故障无法恢复。当 VVR 的 SRL 卷接近满时，VVR 将使用 DCM，记录变化的数据块位图。 3）在网络故障发生后， GCO 将探测到，并对 Network Down 事件进行处理：向有关管理员发出告警。六、如果 A、 B地点间网络在短时间内恢复正常。 1） VVR 将把 A的 SRL 中积累的数据传送到 B。 2） VVR 处于正常工作状态。 3） GCO 处于正常工作状态。 VERI TA S 整体容灾方案第 16 页七、如果 A、 B地点间网络在很长时间内仍无法恢复正常： 1） VVR 停止远程数据复制。 2） GCO 无法对两地间的 Cluster 运行进行监控。八、灾难复原。当 A 地点的系统恢复正常后，需要进行整个系统的回迁。数据反向复制时只复制灾难期间变化的数据而不是所有的数据，这是本方案优势之一。 1）在灾难期间， B 地点是 VVR的 New Primary， B的 DCM记录所有变化的数据块。 2） A 系统正常后， VVR 重新建立与 B 节点的 RLINK 连接，并自动变成 Pseudo Secondary（伪后备节点）。 3） GCO 发现 A、 B 地点 Cluster 恢复正常，对它们进行正常管理。以下过程将在脚本中自动完成。 4）进行反向同步的第一步是将 A 节点的 Pseudo Secondary 状态转成Secondary 状态。 5）第二步将进行 A 的 SRL 和 DCM 的重置 (Replay)，修改 B 的 DCM。因为在 A 节点发生灾难时，有可能 A 的 SRL 中有没来得及进行传送得数据，甚至 DCM 中标记的数据块没来得及进行传送。也就是说， A 中有一些本地已经修改，而 B 还未修改的数据。所以，要保持 A、 B 数据的一致性，一定要首先对这些数据进行处理。处理方法成为重置 (Replay)。重置将把 A 节点 SRL 中数据或 DCM 中标记的数据位图信息传送到 B 节点。 B 节点将进行判断，根据数据块是否有新的修改，对 DCM进行置位。 6）重置完成后，将进行数据的反向同步，将灾难期间 B 节点变化的数据（和需要 A节点重置的数据）传送到 A。 7）以上的过程中， B的数据库和应用都处于正常运行状态。 8）当反向同步完成后，数据库和应用将停止运行。 9） GCO 控制进行整个系统的反向切换。 10） A节点重新成为 VVR 的 Primary，进行正常复制。 11） A节点整个业务系统恢复正常运行。 VERI TA S 整体容灾方案第 17 页方案分析本章将就 xxx 需求书中提出的要求分析方案。通过分析，说明方案符合需求，并进一步讲解方案的细节。有关数据的量化分析及结果涉及数据库的系统业务，除了对数据库内容的更改进行实时数据复制外，还要复制有关的系统文件，例如环境配置信息、数据库环境配置信息。在带宽允许的情况下，我们将对整个数据库有关的内容，包括数据库安装软件、数据库数据等等都实时复制到灾备节点。当发生灾难时，恢复的时间会很短。对于 VVR 对数据库内容的复制，就 oracle 为例，有两种方法： 1）仅复制 Archive Log 和 Online Redo Log。该方法的优点是复制数据量小，对带宽要求小，而且比数据库本身的复制功能更能保持数据一致性，因为数据库本身的复制仅复制 Archive Log。缺点是后备节点要进行Log 中的交易重提交，当发生灾难后，后备节点可能需要较长时间才能提供正常服务。 2）数据库的内容和 Log 都进行复制。该方法的优点是更好地保持数据的一致性，而且发生灾难时，后备系统恢复正常服务的时间较短。缺点是复制的数据量较大，对带宽的要求较高。根据计算，由于带宽允许，所以，将进行数据库内容和 Log 的复制。以下是根据《 xxx 需求书》中的业务数据进行计算后得到的所需带宽和 SRL 的尺寸。一、带宽计算： 1. 平均带宽需求 VERI TA S 整体容灾方案第 18 页每秒操作涉及到的更新的数据： xxxx Bytes 冗余系数：（指数据库表操作引起的索引文件，控制文件， LOG 文件等的修改）加冗余后每秒操作涉及到的更新的数据： xxxx * =yyyy Bytes 加冗余后每小时操作涉及到的更新的数据： yyyy * 3600=zzzz Bytes 加冗余后每天操作涉及到的更新的数据： zzzz * 24 = pppp Bytes 平均带宽需求： yyyy*8/1000=qqqq Kbit/s 2. VVR 带宽需求 VVR 控制信息：约占总带宽的 35% IP 打包数据占每次 I/O 的百分比约 510% 总带宽需求： qqqq*=aaaa bit/s 二、 SRL 容量计算 SRL（即数据复制的日志区）的容量计算，将视实际情况（如磁盘实际容量、网络平均故障修复时间、变化数据量等）定。例如一般情况下，网络故障在 8 小时内修复，则将 SRL的容量定为 8小时内数据变化量再加上一定的冗余。三、结论如果带宽充裕，可以使用同步 /异步自适应的工作方式；如果带宽不是很充裕（例如 14Mbits/s），为了保证业务系统的性能，建议 VVR 工作在异步方式下。 VERI TA S 整体容灾方案第 19 页方案小结本方案的特点：是一个完整的容本地容灾、数据远程复制和远程容灾切换于一体的方案。本方案完全符合《 xxx 需求书》的技术指标，完全实现 xxx 业务的全面容灾需求。以下说明本方案的特点及优势。一、本方案能够支持手动 /自动信令容灾方案，用户可以根据实际需要进行自由选择。但在实际情况中，由于发生重大灾难时业务异地切换属于非常严重的事故，所以我们建议该过程前用户进行电话确认，然后在 GCO 界面中按下切换确认按钮进行切换。二、当本地主系统恢复正常后，需要进行反向数据同步、应用切换等工作，该工作需要由操作人员在系统较空闲时进行。工作过程很简单。三、通过 SRL、 DCM、严格的按写顺序传送、双收条确认、反向切换时的重置等技术的使用，本方案可以最大限度地保证主、备节点的数据一致性。四、本方案支持 1+ N+1和节点互备方式，满足用户的不同需求。五、本方案如果不考虑带宽，节点间没有距离的限制。由于 VVR 的数据传递是基于卷，所以每次传送的数据量基本就是每次系统 I/O 的数据大小。这样可以得到最大的带宽利用率。六、基线建立，需要主备节点的数据完全同步。完全同步在应用运行期间也可以完成。可以采用自动同步方式或使用备份和检查点 (Check Point)结合的方法。七、至于基线建立过程、日常复制过程、故障切换过程和故障恢复过程对主机性能的影响，由于对不同的配置、不同的情况将有很大的区别，所以，很难给出VERI TA S 整体容灾方案第 20 页具体的数值。以我们在以往实施中的经验，如果采用异步复制方式，对整个系统的影响，在 5%左右。 VERI TA S 整体容灾方案第 21 页附录一、 VERITAS 公司简介作为企业级应用存储管理软件的领先提供商， VERITAS Software (Nasdaq:VRTS)公司专门提供集成的跨平台存储管理软件解决方案，用来保证关键业务信息的连续可靠性。 VERITAS 公司于 1982 年成立于加利福尼亚的 Mountain View，现拥有员工 3500余名，在全球多个国家设立分公司或办事处。公司 2020 财年的收入为 12 亿美元，市值 700 亿美元，稳座全球五大软件厂商之一的宝座。在过去的十年中， VERITAS Software 己成为发展最快、规模最大的存储管理软件公司，它连续四年被《商业周刊》杂志评为“发展最强劲的公司”，在《财富》从杂志的“发展最快的 100 家公司”排名 (1999 年 9 月 6日 )中名列第八，并于。

阅读剩余 0%

本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体)，仅供学习参考。用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权，请联系我们反馈本站将在三个工作日内改正。

标签：级容灾应用方案

应用级容灾方案样本(vvrgco)

相关推荐

密码登录

账号注册