suresaveidp异地容灾方案内容摘要:

.................................49 技术业务咨询与培训 ...........................................................................................................................49 网站服务 ...............................................................................................................................................49 客户服务中心 .......................................................................................................................................50 维护响应计划 ...........................................................................................................................................50 故障级别 ...............................................................................................................................................50 响应时间 ...............................................................................................................................................50 第一章 概述 随着企业信息 化建设的不断完善,人们对信息的依赖性也就越来越强,目前企业数据 都向着集中存储、集中管理方向发展,而 大集中 带来优化管理的同时也 意味着 数据的 风险 在 集中,又让我们无法回避另一个话题 —— 灾难备份。 追述 2020 年震惊世界的“ ”事件,随着纽约世贸大厦的轰然倒塌,使 1000多家公司蒙受毁灭性打击,造成的直接经济损失超过 1000 亿美元。 在 1000 多家公司中,凡是做了异地备份的,当天就在其他地方恢复办公,没有做备份的,有的当时就消失了,有的逐渐倒闭和消亡。 统计表明,至少有一半以上的没做备份的公司经过这场灾难后完全跨 掉了。 与此同时,世界金融界也创造了两个奇迹,这就是位于世贸大厦第 25 层的摩根 — 斯坦利( Man Stanley)银行,尽管其一层楼面都被花为灰烬,但它却在第二天神话般地宣布全线营业,追其原因是因为该银行在离纽约数英里的新泽西州的蒂内克建立了一个完善的“灾难备份中心”,凭借着该中心的完整无缺的数据挽救了摩根 — 斯坦利银行的生命。 作为灾难备份系统的另一成功案例是德意志银行,尽管 恐怖袭击摧毁了德意志银行设在纽约世贸大厦的办公中心,这家德国银行业巨擎顿时失去了与世界金融市场的业务联系,不过几乎与此同时,它 远在爱尔兰的备份系统立即启用,德意志银行就在当天继续完成了超过 3000 亿美元的巨额交易。 上述两个案例都雄辩地说明了“灾难备份系统”所发挥的巨大威力。 人类无法避免天灾人祸,而当信息系统日益成为国家的重要基础设施时,任何天灾人祸对信息系统的破坏都有可能影响到国家安全、人民利益、社会稳定,关系到每一个老百姓的切实生活。 第二章 企业灾备系统建设面临的问题 企业 容灾 系统建设 现状 由于 容灾 体系建设是一个复杂的系统工程,涉及到网络、主机、存储、数据库、数据备份、应用系统、运维管理、灾难恢复和业务连续性等诸多业务和技术的方方面面。 特别是与核心业务应用系统的架构设计、数据库系统的结构设计、应用结构设计以及 业务系统 容灾 系统维护管理人员的技术素质有极大的相关性。 目前,各 企业及 政府部门在 容灾 系统建设方面均刚刚起步,缺乏建设和维护经验,特别是在 容灾 系统运行管理和灾难恢复方面的经验更加欠缺, 业务系统 更是如此。 另外, 业务系统 的 容灾 体系建设又有其特殊性。 第一,由于 业务 核心业务处理均集中在 公司总部的 数据中心。 所以,数据中心将面对 公司总部 和 各地分公司 数据中心的多个系统进行灾备,形成“一备多(多点、多系统)”的格局, 容灾 的复杂度高,难度大。 第二 ,硬件平台的非统一性。 由于目前 各省 主机、存储设备的异构性,特别是今后主机、存储平台进行招标采购的不确定性,难以保证主机、存储平台的同构。 这大大增加了容灾技术方案制定、实施以及运维管理的难度和复杂度。 第三, A 公司 核心业务应用系统的 业务整合程度、系统整体架构、数据库设计、子系统数量等均不可知。 因而, 容灾 系统设计的不确定因素诸多。 第四,由于 容灾 系统建设尚处开始阶段,系统内严重缺乏有较深造诣的数据库管理、数据备份技术、远程数据备份管理软件和主机、存储方面的技术力量,这将使得容灾 系统的建设、系统实施、运维管理和灾 难恢复等诸方面工作难度加大。 几类导致数据失效的原因以及现有 容灾 方式的不足 ( 1) 计算机系统的故障分类以及故障发生的概率分析 A 类:计算机软硬件故障 • 发生概率:对于 企业 ,发生可能性最大,也最频繁,是经常发生的一类故障; • 预防方法:本地双机热备,实现系统冗余,增强业务系统的高可用性。 B 类:人为操作故障 • 发生概率:对管理较严、人员素质较高,偶尔发生;对管理较松、人员培训不足,会经常发生; • 预防方法:提高系统自动化运行管理水平,做好本地数据冷备份,减少人的操作与干预,或制定严格的管 理规范,避免误操作。 C 类:资源不足引起的计划性停机 • 发生概率:对于 企业 ,随着业务的快速增长,平均每年均会发生如软、硬件升级、系统资源扩充等事件,业务增长越快的企业,发生亦越频繁; • 预防方法:本地双机,系统冗余。 D 类:客户端的灾难 • 发生概率:对于 企业 ,发生概率较大; • 预防方法:灾难恢复中心。 E 类:病毒的入侵 • 发生概率:对于中、大型企事业单位,没有统一的杀毒软件和病毒服务器,发生概率较大; • 预防方法:安装网络版防病毒软件,定时升级,加强管理 ( 2)现有备份方式的不 足 几年前我们主要采用主机内置或外置的磁带机对数据进行冷备份或者没有备份 系统,这种方式在数据量不大,操作系统种类单一,服务器数量有限的情况下,不失为一种既经济又简明的备份手段。 但随着计算机规模的扩大,数据量几何级的增长以及分布式网络环境的兴起,企业将越来越多的业务分布在不同的机器、不同的操作平台上,这种单机的人工冷备份甚至是无备份的方式越来越不适应当今分布式网络环境,存在以下种种弊端: ,数据丢失现象难以避免; 、不同的应用上,管理分散,安全性得不 到保障; ; ,业务人员工作效率下降; ,如今,用来存储数据的介质越来越多,各种不同系统下存储产生的软盘、磁带、光盘将给管理带来很大的困难; ; ,如火灾、地震等灾难后的系统重建和业务数据运作。 设计灾难复制系统面临的问题 用户在选取远程数据保护系统时,主要需要面对的问题有:  是否支持异构存储系统,保护投资,大大降低其成本  是否受距离的限制  是否受带宽 限制,节约带宽的方案显然非常受欢迎  是否需要对原有系统进行比较大的改动  恢复时间如何  管理是否方便  是否与当前存储网络的体系方便集成 由于对网络安全的考虑是随着数据的重要性和数据量而不断发展的,因此用户可能保留有多种品牌、多种档次的磁盘存储介质,因此能够在容灾系统中能够使用它们,对企业在构造容灾系统时节约成本非常有帮助;而且,由于 容灾 数据中心的使用率非常低,因此如果能够在容灾数据中心采用较低档次的 存储备份 系统,也能够大大降低其成本。 容灾方案如果能够克服距离的限制,就能够比较好地帮助很多企业选择分支机构作为 容灾数据中心,减少建设新的容灾中心的成本; 主数据中心和容灾数据中心之间的数据传输带宽,往往占整个方案中一个非常大的比例,因此,节约带宽的方案显然非常受欢迎; 当原始数据中心的数据出现一些问题时,从容灾数据中心恢复数据的速度,是考量容灾方案中一个非常重要的部分; 管理容灾方案的可操作性和简便性,是容灾方案成功的一个关键,因为真正出现灾害情形时,复杂和难于执行的方案,会大大增加系统恢复的所需时间; 新的容灾方案是否能够与现存的网络体系非常吻合,非常容易地进行集成而不影响现有系统的工作,是用户需要仔细考量的一个 重要环节,很多重要的系统具有连续运行的高可靠性,系统维护时间非常少。 第三章 容灾方案设计分析 容灾 系统策略类型 说明 根据容灾系统的原始数据中心和容灾数据中心复制的数据之间时间长短的差异,我们可以将容灾系统分成以下几种: 同步系统 准同步系统 异步系统 时间点系统 同步系统 :将每一个写盘指令同时发送到主从存储系统,并在得到两个存储系统 的应答后,才进行下一次的写盘操作;所以同步系统的优点就是主从存储系统的数据在灾难发生的时刻,是完全一样的。 为了保证整个存储系统的高效率,因此一般来说,要求主节点和从节点采用相同档次的 高速磁盘系统,并且是高速连接,从而距离会有严格的限制; 准同步系统: 将每一个写盘指令同时发送到主从存储系统,只需要主节点的应答后,就进行下一次的写盘操作,但是间隔一定次数写操作后,需要从存储系统的应答;准同步系统由于加大了从存储系统的应答间隔,所以从技术上可以使容灾数据中心与主数据中心的距离能够进一步扩大,减少大型灾难发生时整个系统数据完全失效的可能性,同时增大了建立容灾数据中心可以选择的范围; 异步系统: 将每一个写盘指令同时发送到主从存储系统,只需要主存储系统的应答后,就进行下一次的写盘操作,从存储系统不 需要应答;异步系统与同步系统相比较,由于不需要从存储系统的应答,因此技术上可以使容灾数据中心与主数据中心的距离能够大大增加;其带来的问题是,灾难发生时可能造成的数据丢失的时间间隔也更大,丢失的事务数也更多; 总之,不管是同步系统还是异步系统,由于是将写磁盘的数据完全发送到从存储系统,所以需要传送的数据量仍然非常大,对传输的带宽要求很高。 时间点系统 :是定期将主存储 或备份 系统的映像 复制到各地市分公司 存储 (备份)系统,根据实际的情况,时间点之间的间隔可以从数秒钟到数小时不等。 由于时间点的间隔选择可以调整,因此, 传输的数据量也可以随着间隔的变化而变化,以适应不同的带宽条件。 同样,时间点系统支持的传输距离也因此能够大大增加。 比较起来它是四种系统中,灾难发生时可能丢失的事务数是最大的。 一般会丢失 12 个小时的数据。 所以,这四个不同的容灾系统,以同步系统数据最精确和全面,以时间点系统的数据差异为最大。 但是,同步系统支持的主从存储系统间的距离最小,带宽要求最高;时间点系统支持的主从存储系统间的距离最大,带宽要求最灵活。 通常,用户需要根据自己的情况,选择某一种系统。 不能在一个系统中,同时拥有多种系统的技术特点。 几种数据 容 灾 技术方案比较 为防范由于自然、人为等因素所引发的灾难而导致信息系统严重故障或系统瘫痪的风险,将建设核心生产业务应用系统的 容灾 体系,以保证灾难发生时,核心生产业务应用系统能够不间断运行。 容灾 体系建设的成功与否首先取决于 容灾 系统建设关键技术路线的选择。 因此,一条正确的 容灾 系统建设关键技术路线是 容灾 体系建设的基础。 关键技术路线的确定涉及多方面的因素,既要考虑备份技术本身的科学性、成熟性和先进性,同时又要结合 业务系统 的实际情况考虑它的可行性、可靠性和实用性,二者不可偏废。 只有这样才能确保 容灾 体系建设的成功。 远 程 容灾 技术介绍 远程数据库复制技术 远程数据库复制技术是由数据库重做日志( RedoLogs)来实现数据库的远程复制和同步。 即: 将生产数据库产生的归档日志实时传输到灾备端,利用日志向备份数据库追加数据,保持备份数据与生产数据同步。 在复制过程中,使用自动冲突检测和解决的手段保证数据一致性不受破坏。 基于数据库的复制方式可分为实时复制、定时复 制和存储转发复制。 主流产品有 DataGuard、 GoldenGate、 SharePlex 等,其中DataGuard 是传输日志到灾备端,然后在灾备端通过数据库前滚进行恢复,网络上 传输的是归档日志,而以 GoldenGate、 SharePlex 为代表的备份软件是在生产端解析日志,通过网络把解析出的 SQL 语句传输到灾备端执行,相比之下备份软件更加节省带宽,操作更为灵活。 :当生产中心的数据库内容被修改时, 容灾 中心的数据库内容实时地被修改,此种复制方式对网络可靠性要求高。 :当生产中心的数据库内容被修改时, 容。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。