中端存储容灾解决方案内容摘要:

,以及灾难恢复环境的完备程度,将灾难备份系统从低到高划分为如下七个等级:  等级零:无异地备份 等级零没有在异地保存备份数据,未制定 灾难恢复计划,不具备灾难恢复能力。  等级一:备份介质异地存放 等级一是对关键数据进行备份并存放至异地,没有可用的备份中心及备份数据处理系统、备份网络通信系统,未制定灾难恢复计划。  等级二:备份介质异地存放及备用场地 等级二是对关键数据进行备份并存放至异地,并制定相应的灾难恢复计划。 具备备用的办公及计算机场地,一旦灾难发生,需要重新调配数据处理系统及网络通信系统资源,利用异地备份数据恢复关键业务系统运行。  等级三:备份介质异地存放及备份中心 等级三是对关键数据进行备份并存放至异地,并制定相应的灾难恢复计划。 具 备可用的备份中心并配备部分数据处理系统及网络通信系统。 一旦灾难发生,利用备份中心已有资源及异地备份数据恢复关键业务系统运行。 XXX 基金数据容灾技术方案 本文档由提供 10  等级四:定时数据备份及备份中心 等级四是在备份介质异地存放的基础上,利用通信网络将部分关键数据定时批量传送至异地,并制定相应的灾难恢复计划。 具备可用的备份中心并配备部分数据处理系统及网络通信系统。 一旦灾难发生,利用备份中心已有资源及备份数据恢复关键业务系统运行。  等级五:实时数据备份及备份中心 等级五是利用通信网络将关键数据实时备份至备份中心,并制定相应的灾难恢复计划。 具备连续运行的 备份中心和就绪的备份数据处理系统及网络通信系统。 一旦灾难发生,可在备份中心利用实时备份数据恢复关键业务系统运行。  等级六:零数据丢失 等级六是利用通信网络将关键数据同步镜像至备份中心,实现零数据丢失,并制定相应的灾难恢复计划。 具备连续运行的备份中心和就绪的备份数据处理系统及网络通信系统,且具备完全的网络切换能力。 一旦灾难发生,可在零数据丢失的基础上恢复关键业务系统运行 不同等级的灾难备份系统,其投资差异非常巨大,企业需要根据实际情况,主要是遭受严重灾难后的损失情况,以及发生灾难的几率,建立满足企业需求的灾难 备份系统。 灾难备份中心 所谓灾难备份中心,也称为灾难恢复中心或容灾中心,就是指企业除了拥有一套完整的计算机网络系统 (称为生产中心 )之外,另外建立一套计算机网络系统。 这套系统能在突发性灾难发生,造成生产中心停止工作时,迅速并及时地接管原来运行在生产中心的所有或部分业务,达到减少或避免灾难事件发生时所造成的损失,为企业用户提供完善、优质服务的目的。 依照上述灾难备份系统的七个层次,灾难备份中心可以大致分为非实时和实时两种模式。  非实时模式 就是利用磁带备份技术,计算机中心人员每天定时备份生产机中心数据,并及时 送往灾难恢复中心,尽量保证灾难恢复中心拥有生产中心的最新数据,一旦灾难发生,灾难恢复中心可将业务在较短的时间内恢复运作。 这模式的特点是在数据备份问题上技术难度不大,但很难保证生产中心与备份中心间数据的实时性一致。  实时模式 就是在生产中心和灾难恢复中心之间通过通信线路,利用数据实时备份,将生产中心主机的数据实时送往灾难恢复中心,保证生产中心与备份中心间数据一致或近似一致。 当灾难发生,生XXX 基金数据容灾技术方案 本文档由提供 11 产中心陷于瘫痪时,灾难恢复中心在最短的时间内,接管所有或部分业务,恢复系统正常运作。 对于以上所定义的各种故障及灾难,灾难恢 复中心建设的设计目标是:灾难或其他不可抗拒的事件发生时,最大程度地保护所有系统数据的安全,几十分钟至几小时内恢复所有外界与系统主机的连接并正常运作。 上述目标的实现以以下两个主要方面为前提条件: 第一,实现灾难恢复的主要步骤及操作模式。 包括:由灾难中心主管确认灾难的确发生;在灾难中心主机作断点分析,查明交易情况;完成网络物理切换(手工或自动);启动灾难中心主机应用系统(手工或自动);主机系统重新与分行连线,完成灾难中心切换任务(自动)。 第二,灾难恢复有关制度及运作模式的建立。 包括灾难恢复的运作完全采用实时 自动方式,及灾难恢复的运作采用人工干预与部分自动相结合的方式。 RPO 与 RTO 在建立灾难恢复系统是,人们往往会问: “ 建立这样一个系统需要多少投资。 ” 要想阐述清楚此问题,首先要明白两个指标: RTO 和 RPO。 RTO, Recover Time Object,恢复时间指标,是指当灾难发生后,生产系统需要多长时间能够恢复生产,它是衡量企业在灾难发生后多长时间能重新开始运转的指标。 不同的高可用性系统会产生不同的恢复时间指标,以某一数据中心被毁导致系统中断为例,如果企业部署了远程高可用性系统,数据中心业务可能在数 十秒钟或数分钟左右恢复;如果企业没有部署远程高可用性系统,但是具备了比较完备的灾难恢复环境,可能需要数十分钟至数小时才能恢复业务;如果企业仅仅使用异地的磁带备份来进行恢复,则往往需要几天甚至几周的时间。 虽然恢复时间指标是灾难恢复系统的关键指标,但另一个指标可能更重要。 在发生灾难时没有保存到异地的数据很可能将永久性的丢失,这种数据丢失多数情况下是无法挽回的。 RPO, Recover Point Object,恢复点指标,是指灾难发生后,容灾系统能把数据恢复到灾难发生前的哪一个时间点的数据,它是衡量企业在灾难 发生后会丢失多少生产数据的指标。 秒 分 小时 日 周 秒 分 小时 日 周 数据丢失 恢复时间 系统运行 灾难恢复 系统运行 XXX 基金数据容灾技术方案 本文档由提供 12 理想状态下,我们希望 RTO=0, RPO=0,即灾难发生对企业生产毫无影响,既不会导致生产停顿,也不会导致生产数据丢失。 从当前计算机技术水平来说,我们可以为用户建设这种类型的容灾系统,其中最著名的例子当属 VISA 和 Master 的结算系统,由于这两个银行结算组织占据了全球银行结算业务的重要地位,他们的结算系统不允许发生任何停顿和数据丢失的情况,即使在“911” 这种极端情况下。 但实现这样的容灾系统的投资巨大,它结合了存储数据复制技术、服务器操作系统镜像 技术、集群技术、数据库高可用性设计、应用系统高可用性设计、同步容灾技术、异步容灾技术、同城容灾方案、异地容灾方案,以及相应的管理流程和意外事件反映处理流程等详细的规章制度,和人员配备、行政保障手段(通信、交通等),综合在一起完成一个完整的容灾方案(实际是双生产中心或多生产中心方案,并没有单纯的容灾中心)。 但是这种方案的投资过于巨大,目前中国可能除了个别特殊性质的企业外,不会有太多的企业会去实现这个系统。 一般来说,只要根据公司所能够承受的数据丢失量就能够确定你所在机构的 RPO。 公司一般都以数据时间的形式来表 示这种尺度。 例如,很多基于磁带的 DR 系统有至少 24 小时的 RPO。 尽管我们可以保证丢失更少的数据,但是最差的情况会是没有人及时进行每天的备份。 所以如果企业在一天结束的时候碰到了灾难,而系统管理人员还没有完成磁带备份(这是一个很不幸、但也不常见的情况),企业就会丢失一个工作日的数据。 企业需要确切地确定它能够承担在一次灾难中丢失多少数据,这一点是至关重要的。 一个机构要如何确定这个数量则是艺术和科学的结合,其方式就和确定 RTO 数量一样。 首先,到所要考察的数据系统的用户以及这些领域的管理层去,询问在灾难发生的 时候他们能够承受的数据丢失量。 得到的答案几乎总是不切实际的;典型的回答更有可能是 “ 零数据丢失 ”。 尽管实现这个 RPO 是有可能的,就像上面的例子一样,但是所需要的巨大的基础结构、带宽和软件成本使它只能够用于极度昂贵数据,而不能用于所有的情况。 如果确实需要 “ 零数据丢失 ” ,那就要用心了 —— 有多种灾难恢复计划可以选用,但是要记住的是:大多数都需要大规模、基于硬件的复制系统,而且需要光纤连接。 如果能够通过协商获得一个更加灵活的 RPO,那么在不同价位就有多种选择。 基于软件的复制系统、基于硬件的镜像、 Business Continuance Volume( BCV)和其他记录工具,以及无数基于磁带的系统都是可选的。 混合使用或者匹配使用这些类型的系统,企业可以创建能够满足从几分钟到多个小时 RPO的要求。 企业还可以将其中的许多方案应用到单个的数据系统上,这样就能够获得不同的能力,XXX 基金数据容灾技术方案 本文档由提供 13 以处理有不同 RPO 要求的不同系统。 RPO 是需要正确定义和量化的、但是比较难以处理的尺度之一。 然而,对 RPO的估计将会决定企业能够使用的灾难恢复解决方案的类型,以及企业的灾难恢复解决方案最终将花费的资金。 容灾系统 数据复制 数据的远程复制技术是容灾 系统的核心技术,它对于数据系统的一致性和可靠性以及系统的应变能力具有举足轻重的作用,通过有效的数据复制,远程的业务数据中心与本地的业务数据实现同步或近似同步,确保一旦本地系统故障,远程的容灾中心迅速进行完整的接管。 考虑容灾系统的数据复制技术时,以下几点必须重点考虑:  远程数据中心应具有与本地系统完全同步的能力,确保灾难发生时恢复数据的一致性。  实时复制系统具有广域线路故障时的重新同步机制(即一旦传输网络故障恢复时传输重新同步)。  实时复制系统具有对复制数据进行验证的能力。  实时复制系统对于正常的数据系统 I/O 访问不应产生效率上的不利影响,在线路无法出现同步时不应影响本地数据访问。  实时复制系统应在任何情况下确保数据包的原有顺序,以保证数据的一致性。 数据复制方式选择 目前,业界具有容灾功能的常用解决方案主要包括以下几类:磁盘阵列复制技术,主要由一些磁盘阵列厂商提供,如 EMC SRDF、 IBM PPRC 、 HP BusinessCopy、 HDS TrueCopy 等;存储卷复制技术,由一些卷管理软件厂商提供,如 VERITAS VVR;数据库复制技术,由数据库厂商以及一些第三方厂商提供,如 DSG RealSync, Quest SharePlex 等;应用层复制技术,由各系统的应用厂商自己提供。 另外还有一类,基于第三方磁盘阵列实现数据复制,典型的有 EMC RecoverPoint,基于磁盘阵列来实现数据复制 ,同时提供数据复制管理功能。 磁盘阵列复制技术 : 主要适用于数据中心级的海量数据复制,此技术用户必需采用支持该功能的磁盘阵列型号,而这些阵列大都为高端阵列,投资非常昂贵。 并且,由于证券行业用户的带XXX 基金数据容灾技术方案 本文档由提供 14 宽有限,而磁盘阵列复制技术对带宽的要求又相对很高,动辄需要上 GB 的带宽。 此外,采用磁盘阵列复制技术,其目标端无法提供实时 数据查询,由于目标端数据库在复制过程中不能被打开,难于实现交易与查询的分离,同时也造成大量投资浪费。 存储卷复制技术 : 主要适用于工作组级的数据复制,它对 CPU 资源占用高。 同样由于目标端数据无法提供实时数据查询和对带宽的要求高。 应用层复制技术 : 只适合那些在应用中提供了该技术的应用,由于它的非标准化、开发和维护工作量大,使得其应用不成熟也不普遍。 数据库数据复制 : 属于逻辑数据复制。 典型的逻辑数据复制是通过数据库日志实现的。 数据库日志是以逻辑的方式记录了数据库的物理操作。 数据容灾是通过对数据库日志中的记录的复制完成数据库复制的技术。 当主用系统发生操作时,数据库自动记录日志,并将日志进行归档。 容灾系统中,日志被传送到备用系统,备用系统根据主用系统的日志本系统中进行对应的操作,保证备用系统和主用系统的一致性。 第三方软件实现:目前典型的是 EMC 的 RecoverPoint 软件, 简单而经济高效地在 各个品牌阵列上保护或复制数据 ,支持光纤或 IP 链路的数据同步、异步复制 ,无需购买“光纤通道 IP”转换器 ,并支持 将本地和远程站点上的数据恢复到任意时间点 ,实现数据持续保护。 缺点是需要在服务器上添加相应的数据分离程序。 磁盘阵列复制 技术 优势 存储阵列复制技术 适合对象: 优点: 缺点: XXX 基金数据容灾技术方案 本文档由提供 15  主要适 用于 数据 中心级的海量数据复制。  用户必 需采 用支 持该 功 能 的 磁 盘 阵 列 型号。  支持阵列上的所有数据类型复制。  可支持同步 、异步 方式复制  不 占 用 主 机 CPU资源   目标端数据不可用: 目标 端数 据库 在复 制过程中不能被打开;  必需同构:源和目标必 需要 求相 同的 磁盘 阵列、 相同 的操 作系 统、 相同的数据库版本;  带宽高: 最好提供独占的光纤网络, 需 要 GB级 的带宽。 从上面存储阵列复制技术的特点来看,选用磁盘阵列复制技术更为简单,不需要在服务器上部署软件,可提供同步复 制方式,达到 RPO=0 的技术要求。 这正好可以达到我们要求的在深圳数据中心与证券通讯数据中心的数据同步复制,实现数据零丢失的保护。 第三方软件复制技术。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。