电子政务外网云计算数据中心可行性研究报告(编辑修改稿)内容摘要:

,数据应该如何整合,如何能够构建统一、全面的安全管理业务数据。 数据整合、灾难备份作为电子政务信息安全的最后一道防线,已经得到电子政务信息部门的高度重视,统一建设数据 中心 的模式无论从投资、管理、应急方面论证都是电子政务数据 集中、数据 整合的理想模式。 目前的情况,每一个政府机构已经开发了自己的信息系统而不是处于孤立的状态。 每一个产品和服务需要独立的信息系统来提供。 每个信 息系统通常是单独打包。 没有通用的架构能够让前台和后台、后台和组织外部的系统的应用连接起来进行通讯,识别和授权的功能能够在每个信息系统中找得到,但不会一个组织内部重新使用,更谈不上在组织之间重新使用。 数据中心主要是 G2G、 G2C、 G2B 等业务的集中处理中心,建设的重心与政府机构的业务紧密结合,是后电子政务时代数据大集中的体现,实现对集中数据的统一管理与备份。 建设目标与任务 数据中心的建设是为了解决政府部门间信息共享,实现业务部门之间的数据交换与数据共享,促进 XX 市电子政务的发展。 具体目标如下:建立数据中心的系统平台。 完成相应的应用软件和数据管理系统建设,实现数据的交换、保存、更新、共享、备份、分发和存证等功能,并扩展容灾、备份、挖掘、分析等功能。 (一 )建立数据中心的系统平台。 完成相应的应用软件和数据管理系统建设,实现社会保障数据的交换、保存、更新、共享、备份、分发和存证等功能,并扩展容灾、备份、挖掘、分析等功能。 第 3页 (二 )建立全市自然人、法人、公共信息库等共享数据库,为宏观决策提供数据支持。 对基础数据进行集中管理,保证基础数据的一致性、准确性和完整性,为各业务部门提供基础数据支持; (三 )建立数据交换共享和 更新维护机制。 实现各业务部门之间的数据交换与共享,以及基础数据的标准化、一致化,保证相关数据的及时更新和安全管理,方便业务部门开展工作; (四 )建立数据共享和交换技术标准和相关管理规范,实现各部门业务应用系统的规范建设和业务协同; (五)为公共服务中心提供数据服务支持,实现面向社会公众的一站式服务; (六)根据统计数据标准汇集各业务部门的原始个案或统计数据,根据决策支持的需要,整理相关数据,并提供统计分析功能,为领导决策提供数据支持; (七)为监督部门提供必要的数据通道,方便实现对业务部门以及业务对象的监管 ,逐步实现有效的业务监管支持; (八)为业务数据库的备份提供存储和备份手段支持,提高业务应用系统的可靠性。 第 4页 第 2章、 需求分析 用户需求 从与数据中心交互的组织机构、人员方面进行说明。 与数据中心交互的单位机构 各业务部门 通过接口系统向数据中心提供数据或使用数据中心提供的数据;业务部门之间可直接交换数据。 各业务系统单位 遵循标准规范进行业务系统建设和改造,实现业务系统与数据中心的对接。 与数据中心交互的人员 数据中心系统管理员 负责数据中心系统管理、监控、系统维护 数据中心数据管理员 负责数据的整理、 比对、数据一致性的保证,并且与区县级数据中心、省数据中心数据管理员协同工作,执行数据标准。 业务部门数据管理员 一般与同级数据中心数据管理员协同工作 数据需求 XX 市电子政务外网数据中心必须满足电子政务平台进行数据交换的需要,同时还必须满足在平台上建立的各业务系统进行综合业务处理的要求。 为门户系统提供各种静态和动态的数据、信息。 所谓静态信息是指对电子政务的运行中不经常变化,供各个业务系统查询、处理的数据或信息:政策、法规、元数据、资料库、各种多媒体数据等,它们会随着时间而逐步增大。 所谓动态数据是指随着运 行而增加、修改的数据:并联审批中文件流转状态数据,反映企业、个人所处状态的数据,国民经济运行状态的数据等。 动态数据同各个局委办的信息密切相 第 5页 关,但又是面向主题的,如 XX 市社会保险这个主题,实际上同保险、工资、税务和银行密切相关;个人信用使用主题,它的数据与银行、税务、个人消费、个人收入密切相关。 而数据仓库显然也有面向主题的定义,但这些主题是较长时间的,具有战略定义的主题。 因此,数据中心的建设,首先要解决数据库异构信息类型的分类存储和检索体系以及针对不同类型数据模型的设计这一基本问题。 另一方面,数据中心管理着 大量的结构化和非结构化信息。 所谓非结构化信息,是相对于那些有清晰的结构和类型定义以及有数据相关性的明确描述的信息类型而言的。 比如,在财税分析系统中,财政收支情况的月度数据,可以理解为一种有清晰结构的信息;而一份综合性包含了文字、报表、分析图形的财政收支分析报告则是一种非结构化的信息。 网站上发布的信息,如新闻动态、政务公开等等,一般也是非结构化的信息。 此外,非结构化信息中还包括了一类对象数据信息。 所谓对象数据信息,是指一个包含了内敛结构的专门数据块,这个数据块单独无法建立与别的数据项的关联关系,并且需要工作 在特定的工作模块下。 比如: GIS 空间定义信息数据、多媒体的声像数据等,均为对象类型的数据。 在政府决策应用中,非结构化信息将占到相当的比例。 所有的政府文件均属于非结构化信息,政策法规属于非结构化信息,一些决策分析的综合性资料也是非结构化信息。 与结构化信息相比,非结构化信息的管理利用存在一些难点,就是: ( 1)定义管理的难度 “非结构”化表明了没有一种象关系数据库规范那样的定义模型来对非结构化信息进行定义管理。 虽然你可以强制对一个非结构化的信息块进行解构,将其分成类似头、中、尾这样的半结构。 但是这种解构只有 在制定了具有普遍含义的结构描述定义后才有真正的意义。 对非结构化信息进行定义管理的另一个难点在于数据元类型无法穷举。 不象关系型数据系统中,对数据元类型有完整清晰的定义。 在非结构化信息中,包含了错综复杂的数据元类型。 比如,仅文档类型就包括 Text、 Word、 PDF、 Excel、 第 6页 Word Pro 等等,还有各种图片文件格式、多媒体压缩信息格式等等。 此外,在象网页这样的非结构化信息中,所有的信息都是文字类型,设定时间、数字等类型的信息元并不具有运算上的意义。 ( 2)存储管理的难度 对信息进行存储管理的前提是能够建立 有效的数据定义,然后才能进行非结构化信息的组织存放。 而前面已经提到了在非结构化信息的数据定义方面存在的难度,因此也就造成了在非结构化信息存储管理方面的困难。 当然,对非结构化信息最简单的存储方式是直接存放在文件系统中。 这样做避免了依据主题等分类因素对非结构化信息进行管理的问题,但也是最最低效的一种存储管理方式。 在非结构化信息的存储管理中还涉及到一个问题,由于这些信息元(如果对非结构化信息进行一定的半结构化处理后)的数据可能来自关系型数据系统(比如 Oracle)、对象数据系统(多媒体数据或空间数据)乃至文档 数据系统(比如Notes),所以一个非结构化信息的存储管理系统将充当一个数据的汇整者,需要具备联合各个外部数据系统的功能。 缺乏对非结构化信息的有效管理造成的直接结果就是无法对非结构化信息进行有效检索。 ( 3)信息检索的难度 由于不能像关系数据库那样建立起清晰定义的数据主题,非结构化信息的检索依照的只能是机械的全文内容检索。 这是对信息检索非常不利的一点。 虽然对信息内容的全文检索可以做到资料检索的遍历,但其检索的效率和命中率是很低的。 由于不象关系数据库那样有一种象 SQL(结构化查询语言)那样强大的关联检索工具 ,并且在定义数据时也没有建立数据项之间的关联关系,要具有针对性地查询非结构化信息的内容,必须要依靠应用程序中设置对特定非结构化信息类型进行专门处理的功能内容,才可能提高信息检索的强度和效率。 但另一方面讲,一种专用于理解特定非结构化信息类型的处理模块,无论在运行效率还是在可维护性上,都是非常不现实的。 非结构化信息检索的另一个难度也是与数据元类型的多样性有关的。 比如,不同的 第 7页 文档类型结构需要不同的全文索引工作模块。 这也无形中加大了对非结构化信息进行检索的难度。 因此,数据中心的建设,还必须从技术体系上解决如何对非 结构化信息进行有效定义、有效管理和有效利用的基本问题。 系统及应用需求分析 数据中心的主要业务包括:  从基层或业务部门采集数据,包括基础数据和部分共享业务数据,支持基础和共享数据的更新维护模式;  对采集到的数据进行校验和比对,发现冲突时按照共同制订的数据处理规范进行处理,保证数据的一致性和准确性;  受理业务部门或基层单位的基础数据使用申请;  将整理后的基础数据分发或按需提供给有关部门或单位使用;  以中介的方式处理共享业务数据使用申请,并进行备案;  对共享业务数据在征得业务部门同意的情况,通过数据中心进行存储 转发;  将共享元数据的信息发布给各业务部门,提供浏览与订阅申请,方便其共享必要信息;  提供数据交换平台和接口系统,使数据中心与各部门的数据管理员可以对共享和交换过程进行管理;  通过数据交换平台存储和管理公共服务数据,并与外网同步,提供一站式服务;  存储和管理统计数据,根据决策支持的需要,整理相关数据,并提供统计分析功能,对数据进行统计和分析,方便领导及时掌握有关情况。  定期对业务数据库进行容灾备份; 第 8页  与此相对应,业务部门与数据中心发生的相关业务包括:  提供数据或共享元数据给数据中心;  申请使用数据中心的基础 数据,校准本单位的基础数据;  通过数据中心提供的共享元数据信息获取其他单位的数据;  审批其他单位的业务数据使用申请,并将数据提供出去;  与数据中心交换公共服务数据;  提供监督部门直接访问业务数据库的通道;  提供统计分析数据或原始个案给数据中心,方便主管领导查询;  定期将业务数据库备份到数据中心; 根据数据中心与各业务部门的主要业务,数据中心应提供如下功能: 节点管理 实现与数据中心相连的各个节点的信息管理、配置管理,包括业务部门、区县数据中心等。 主题管理 数据采集、数据发布、数据共享、数据交换、公共服务以 及决策支持均以主题的方式进行,因此必须实现对主题的管理。 主题是元数据的集合。 元数据管理 元数据是关于数据的数据。 元数据描述了数据的结构和意义,同时也可以描述应用程序和流程的结构和意义。 构造数据中心数据库的重要步骤之一,就是定义和创建元数据 (Metadata)。 元数据提供一个目录,列出数据中心有什么数据。 所有进入数据中心的数据,必须在元数据中有所表述。 数据中心的数据管理系统 第 9页 必须提供储存和管理元数据的方法。 以元数据管理为核心,建立数据中心的数据资源目录体系,提供给业务部门参考使用。 数据中心的元数据包括基础数 据元和共享数据元,由数据中心统一管理。 基础数据元由数据中心定义,共享数据元由业务部门定义并注册到数据中心。 业务部门进入数据中心的元数据管理中心好比进了一个“超市”,可以方便地知道可以获取和使用哪些数据,并进行数据使用申请的定制。 公共代码管理 对公共代码需要有统一的标准规范,数据中心必须提供公共代码的管理。 基于数据中心的公共代码规范,各部门和区县数据中心可以通过数据转换将各种不同含义的编码和标准规范的编码之间进行双向的转换。 数据采集 与各业务部门形成数据采集机制,通过数据共享交换平台从各业务部门汇总数据, 对原始数据进行缓存、存储。 数据整理比对 从各业务部门采集共享数据后,进行数据转换,对全市自然人和法人基本数据进行数据比对、冲突检测处理并入库。 数据交换 实现业务部门与数据中心之间以及业务部门之间的数据交换业务,形成高效、安全、可靠、稳定的数据交换网络。 提供定时批量、实时按需的数据交换,提供点对点、一对多的数据交换支持,对数据交换进行管理和监控。 第 10页 数据访问 在统一的权限管理系统之上,实现对自然人和法人的建档、调档、阅档等业务。 对社保卡系统、公共服务中心系统、业务系统提供数据访问。 对决策支持系统、业务监管提 供数据支持。 数据备份与恢复 恢复管理是对数据进行备份、导入导出以及数据库恢复等。 数据是数据中心核心的资源。 全面的容灾方式应该是 数据 备份 +数据复制 +远程容灾。 对系统中的数据要定期进行系统备份。 采用本地备份与异地备份相结合的方式。 标准管理 进行数据中心的标准规范尤其是数据标准的审核制定、升级维护与发布实施等管理功能。 在数据中心的建立之初,由于标准规范处于不断完善的过程,应建立标准的版本管理机制,方便业务部门的查询和使用。 应用支持 对相关业务应用系统、公共服务系统、业务监管系统和决策支持系统提供提供数据、通 道和平台等支持。 运行管理 为方便对数据中心的管理和维护,需要一套功能完整的运行管理与监控维护系统。 运行管理系统主要提供给数据中心的系统管理人员使用,用于保证数据中心的安全可靠和高效运行。 其功能主要包括面向安全性的用户管理、权限管理、密码管理和日志管理等;面向性能优化的性能监控等。 面向可用性的节点管理、交换规则管理和状态监控;其中节点管理包括对业务部门的信息管理。 第 11页 性能需求分析 业务处理量分析 数据中心的主要业务包括:。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。