容灾中心方案建议书内容摘要:

6  备份 /恢复 /归档  数据中心迁移、整合  测试 、容灾演习 „ 计划外  系 统处理能力下降  人为操作故障:错误删除文件数据,造成不可恢复;错误执行程序或命令,造成系统死机 …  系统软硬件故障,主要包括电源及 UPS 故障、硬盘故障、通讯控制器故障、系统总线、内存、 CPU 故障等  安全体系被攻破  生产地点的灾难:水灾、火灾、地震及其他机房事故等  其它:包括灾难的潜在影响,如水灾、地震等, 常 伴随着电力的供应问题。 2. 容灾方案概述 . 容灾整体模型 XX 省 XX 公司 容灾系统的建设,可以按照需求分析、方案设计、方案实施、测试 /演习 /维护的科学流程进行。 特别应该提到,容灾系统的建设不仅仅是考虑技术实现手段,技术应该只是整个系统中的一个环节。 要想真正达到容灾的目的,必须充分考虑人员、流程等因素,参考以下模型: XX 省 XX 公司 BOSS 容灾系统技术建议书 YY 公司 科技 (中国) 有限公司 7 业务运营支撑网业务连续性系统建设模型 人员、流程和技术是保证容灾系统成功实施、有效运行的三个重要方面:  技术,是手段、是载体;  流程,是技术的补充和完善。 包括恢复、测试、演习和维护等;  人员,是 技术和流程的制定者和执行者。 人员、流程和技术通过管理机制有效结合。 管理机制包括计划、映射、驱动、调控等手段。 . 容灾地点选择 确定生产中心与异地中心之间的距离是容灾系统建设方案选择的受限需要考虑的问题。 两个中心的距离越远,两个中心之间共同依存的因素就越少,可预防灾难的种类就越多,但当距离超过一定量时,容灾系统所采用的技术、项目的实施难度以及系统建成后的管理和维护难度将发生质的变化,归结到一点,即项目成本将发生重大的变化。 因此,在地点选择过程中,应仔细权衡系统目标和方案成本之间的关系。 XX 省 XX 公司 BOSS 容灾系统技术建议书 YY 公司 科技 (中国) 有限公司 8 当然,从现实情况出发, 地点的选择首先要有满足要求的异地机房。 异地中心应符合数据中心需求。  机房环境符合要求。  局域网( LAN)基础设施和广域网( WAN)出口完备  本地伺服电力设备和配线基础设施满足要求  设备安全和通道控制满足要求  灾难切换后,人员工作条件满足基本要求  交通设施(例如停车场和通道)和个人支持服务满足要求  备用地点的技术支持的可用  管理支持服务的可用 另外 在选择异地中心时, 应该避免如下因素:  邻近机场  邻近化工厂  邻近天然气  邻近铁路 /运输公路  邻近电磁、电波干扰源  地势很低的地区  邻近大海  高层建筑物  交通拥挤的 地区  邻近军事演习区域  火源(临近餐厅、高压电等)  地质状况 (地震、地裂、火山等等 )  工业企业  配套环境恶略(交通、 通信、服务等)  与生产中心位于同一性质的地域(如,同为目标显眼的区域 政治中心、金融中心、商业中心等) 生产中心和灾备中心距离的远近直接影响到数据的复制效率、复制方式和复制成本。 对于不同的灾难所要求的距离也是不一样的。 举例说明如下: XX 省 XX 公司 BOSS 容灾系统技术建议书 YY 公司 科技 (中国) 有限公司 9  火灾:同城异址,通常距离超过 5公里就足够  地震(地裂、火山等等):不同的城市,距离越远影响越小  战争:不同的城市,距离越远影响越小  水灾:不同地理特点的城市  断 电:不同的城市  计划内停机:对距离没有要求  人为操作故障:对距离没有要求  系统处理能力下降:对距离没有要求  系统软硬件故障:对距离没有要求  安全体系被攻破:对距离没有要求 . 容灾方案指标 RPO 数据容灾需要重点考虑的一个参数是 RPO。 RPO 参数的不同,直接影响到数据同步所采集的技术手段及相应成本的高低。 恢复数据目标( Recovery Point Objective RPO)是灾难发生后业务能够容忍的数据丢失量;或者说灾难发生造成的数据丢失量。 一般来说,恢复数据目标( RPO)越高(即,丢失的数据越少) ,方案的成本越高,但是由于灾难造成的业务损失就越小;反之,恢复数据目标( RPO)越低(即,丢失的数据较多),方案的成本较低,但灾难造成的业务损失也较大。 不同类型的数据所需要的 RPO 也是不一样的。 比方说和钱的数量发生直接关系的数据就要求非常高的 RPO,甚至是 0 数据丢失。 而对于如统计类数据则可以要求低一些。 同时,可以通过某种途径让数据重生的数据所要求的 RPO 可以低一些,而不可重生的数据则要求就高一些,比如说某些数据的采集可以通过重采手 XX 省 XX 公司 BOSS 容灾系统技术建议书 YY 公司 科技 (中国) 有限公司 10 段获得,有比如说,客户的业务受理数据可以通过营业厅保存的受理纸介质进行数据恢 复。 数据保护主要目的有两个:第一是在生产数据发生逻辑故障(如人为误操作、病毒破坏等)或后台业务处理(如磁带备份、新软件测试、报表生成、统计分析等)而影响业务系统的运作之前,生成定点拷贝;第二是在生产运行过程中,连续不断地将生产数据复制到异地,应对生产中心的灾难对生产数据的整体或局部物理性损坏。 RTO 对于 应用 级容灾 RTO 是一个非常重要的参数,决定的因素也非常多。 恢复时间目标( Recovery Time Objective RTO)是灾难发生后业务能够容忍的停顿时间;或者说灾难发生后,恢复业务运行所 需要的时间。 一般来说,恢复时间( RTO)越短,那么灾难恢复方案的成本就越高,但是由于灾难造成的业务损失就越小;反之,恢复时间( RTO)越长,灾难恢复方案的成本较低,但是由于灾难造成的业务损失就较大; . 容灾技术 容灾系统建设中主要涉及的技术问题包括以下几个方面:  数据复制技术  数据恢复技术  系统切换技术  资源复用技术 下面就这些技术问题分别论述。 XX 省 XX 公司 BOSS 容灾系统技术建议书 YY 公司 科技 (中国) 有限公司 11 数据复制技术 数据复制分类 容灾的主要技术难点在数据复制实现,就是说如何保持主备节点的数据同步,包括应用软件、数据库、业务数据等方面。 数据复制设计需完整考虑以下方 面: 完整性 :对维持业务正常运行的所有生产数据进行保护。 可以采取两种策略:分而治之或统一解决。 分而治之即对生产数据的不同组成部分采用不同的方法,如对操作系统软件和数据库数据分别采用不同的方法;统一解决即用一种方法保护所有的生产数据。 虽然两种方法都能实现完整性,但统一解决方法独立性强、易于扩展、维护,而且易于实现以下的一致性、管理性等指标。 一致性 :保证被保护的生产数据的各部分的业务逻辑上的一致。 可以采取事后一致性检验和事前同一时间点生产数据冻结技术。 事后一致性检验技术主要针对分而治之的完整性实现方法,在保护 生成后验证各部分数据的逻辑一致性;事前同一时间点生产数据冻结技术对生产数据各部分在同一时间的映像进行保护,主要针对统一解决的完整性实现方法,从数据各部分之间时间上的同步性实现业务逻辑一致性。 可验证性 :针对备份或复制的数据,具有事先验证手段。 可验证性保证在需要利用保护介质恢复业务状态时,可顺利读出生产数据、恢复业务状态。 时效性 :生成完整的生产数据的保护工作进行频率。 频率越高,时效性越强,在业务终止时,不能恢复或需要人工恢复的数据就越少,业务就越易于准确的恢复,业务的停顿时间和相关的损失就越少。 可扩展性 :生产数据保护机制随着 IT 基础结构和业务的变化而不断扩展、适应的能力。 可扩展性的优劣将决定保护机制的可持续发展能力和投资保护能力。 可操作性 :在保证完整性、一致性、可验证性、时效性、可扩展性的前提下,所选择的技术手段的技术复杂度、可实施能力。 可重用性 :所生成的生产数据的保护的多重利用能力。 生成生产数据的保护 XX 省 XX 公司 BOSS 容灾系统技术建议书 YY 公司 科技 (中国) 有限公司 12 会占用 IT 的一部分资源,在利用其恢复业务状态之前,利用其进行其他任务,如磁带备份、软件测试、报表生成、统计分析将充分发挥这部分 IT 资源的价值。 可管理性 :监控业务状态的保护机制的运行状态、运行性能、故障 处理的能力,保证其按照设定的保护要求运行。 集成性 :业务状态的保护机制与业务的运行和恢复机制的整合性。 整合性高地决定保护机制是否可顺利和业务当前运行体系良好配合,以及当业务中断时,如何和业务处理能力恢复系统一起顺利恢复业务的运行。 从一个应用系统的构建基础看有以下各层次,数据在不同层次上均有相应复制技术实现。 在存储系统一级包括磁盘阵列和逻辑卷管理系统称作基于存储系统的复制;BOSS系统一般都是基于数据库的应用,所有主要的数据都是存放在数据库中的,通过数据库技术复制的方式称为基于数据库的复制;除了以上 2 种方式外,复制还可以在应用系统上作,称为基于应用的数据复制。 基于存储的复制技术 磁盘系统利用自身的处理能力,通过磁盘系统之间的通道连接复制磁盘系统内的数据更新,从而在异地中心保存生产数据的记录。 磁盘系统是信息的真正所在地,利用磁盘复制可以独立于服务器、操作系统、 XX 省 XX 公司 BOSS 容灾系统技术建议书 YY 公司 科技 (中国) 有限公司 13 卷管理系统、数据库、文件系统、中间件、应用程序。 磁盘系统数据的物理构成单位为扇区( Sector)、簇( Cluster)、磁道( Track)、柱面( Cylindar)、卷( Volume)。 一般基于卷建立磁盘复制的对应关系,复制过程 中的数据传输单位可能为簇、磁道或柱面。 一个典型的存储方案可以总结为以下结构: 数据复制可以通过网络连接、存储交换机连接、磁盘阵列连接三种方式实现备份。 支持磁盘阵列连接复制的磁盘阵列主要有 IBM Shark 系列、 EMC Symmtrix 8000、 DMX 系列、 Hitachi 9900( HP XP/Sun StorEdge9900)系列。 连接主要以直接光纤连接或走 SDH 网络。 直接光纤连接距离大约支持 30KM。 支持存储交换机连接复制的交换机主要有 McData、 Brocade 的交换机系列。 连接方式与盘阵连 接类似。 基于存储的复制技术均支持同步复制与异步复制。  同步复制流程 1. 工作主机向主工作盘阵发出 I/O 写请求,主盘阵将更改的数据记入 cache 当中。 XX 省 XX 公司 BOSS 容灾系统技术建议书 YY 公司 科技 (中国) 有限公司 14 2. 主工作盘阵通过光纤向备份盘阵发出 I/O 写请求操作。 3. 备份盘阵做完记录更改后,向主盘阵发送写操作结束请求。 4. 主盘阵收到备份盘阵发回的写结束响应后,向主机发送写操作结束的响应。 5. 至此写操作完成。  异步复制流程 1.。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。