最最终版本奉贤海洋信息数据库系统技术报告内容摘要:

7 4 建设技术路线 奉贤海洋信息数据库管理系统建设的技术路线如图 41 所示。 数 据 源 分 析数 据 库 系 统 建 设数 据 库 管 理 系 统数 据 库 模 式 设 计 数 据 预 处 理数 据 质 量 控 制 、入 库 操 作数 据 访 问接 口信 息 共 享 运 行 管 理 图 41 奉贤海洋信息数据库管理系统 建设技术路线图 1)统一规划、整体布局、分步实施、先进实用、共建共享; 2)建立标准、规范体系,保证 系统的统一性、可靠性和高效性; 3)通过业务系统调查,明确系统需求和功能,构建系统业务流和数据流; 4)采用模块化的设计方法,确保系统建设和服务的灵活性与适应性; 5)建立包括数据查询、更新维护和数据管理平台操作权限控制等信息安全保障体系。 8 5 数据依赖识别和数据规范化技术 奉贤 海洋 信息 数据库 管理系统 的数据来源基本为调查数据,一般为仪器监测记录数据和采样化验数据,比如气象、水文 、地形 等。 针对奉贤海洋信息数据之间因缺乏业务逻辑无法确立依赖关系的现状,本 系统 提出了根据现有数据模式识别数据依赖的方法,并应 用于数据库模式的规范化设计,通过理论分析和实际应用证明海洋 信息 数据库模式设计达到 3NF 范式。 奉贤 海洋 信息 数据库 系统 中数据表的组成结构包括: 1)基础调查数据,来源于调查中的数字化仪表的自动记录文件格式; 2)根据海洋管理职能以及海洋信息的公众需求,抽取内容 不同的调查数据并组合为专题信息,对应的表称为组合表。 下图为海洋 环境质量监测的规范化数据模式。 氮 氮 氮I D氮 氮 氮 氮氮 氮氮 氮 氮 氮氮 氮 氮氮 氮 氮 氮氮 氮氮 氮. . . . . .氮 氮 氮 氮I D氮 氮 氮 氮氮 氮 氮 氮 氮 氮氮 氮 氮 氮 氮 氮氮 氮 氮 氮 氮 氮氮 氮 氮 氮 氮 氮氮 氮氮 氮 氮. . . . . .氮 氮 氮氮 氮 氮氮 氮 氮 氮氮 氮 氮 氮氮 氮 氮氮 氮氮 氮 氮 氮氮 氮 氮I D氮 氮 氮 氮氮 氮氮 氮 氮 氮氮氮氮. . . . . .氮 氮 氮 氮I D氮 氮 氮 氮氮 氮氮 氮 氮 氮氮 氮氮 氮氮 氮 氮. . . . . . 图 51 海洋环境数据库中基表和组合表 数据模式 9 重金属、氮磷硅等观测数据和水环境质量监测站位信息为基表, 水环境质量监测站位航次信息嵌入到不同的质量监测数据中,形成组合表,即在上图中,组合表中定义外键 “ 站位 编号 ” 和监测站位 信息表的主键 “ ID” 实现信息关联。 基表的数据冗余和数据依赖分析 基表即调查数据为仪器监测或分析数据,相互之间无业务逻辑 从 而缺乏明确的数据依赖关系,为了满足 1NF 范式要求,现有基表的主键为数据库管理系统自动生成的 ID 号。 缺乏业务逻辑上的数据依赖,导致基表之间不存在传递函数依赖,基表中的函数依赖可以归结为:部分函数依赖导致的数据冗余。 比如潮位观测数据如下表所示。 表 51 潮 位 观测数据记 录 潮 位观测数据 站位代码 , 观测年 , 观测月 , 观测日 , 潮时 , 潮高 潮 位观 测站 位数据 站位编号 , 站位名称 , 站位经度 , 站位纬度 , 邮编 , 联系电话 , 联系地址 , 建站时间 , 站址 联系人 , 备注 来自于仪器自动记录的单次记录中都包含有 : 潮 位 观测数据、观测站位信息和验潮仪的状况信息。 根据常识可知:观测站位信息和验潮仪的状况信息是客观存在且较固定的,与 固定时间的潮位 记录没有依赖关系,在原始记录中导致这样的信息大量冗余。 按 数据库模式规范化设计理论中 消除部分函数依 赖规范化方法,定义嵌入的实体为一个基表,则可归结为以下组合表规范化的第一种情形:一个实体信息完全嵌套在基表中,规范化处理如下 节 所示。 组合表的数据冗余和数据依赖分析 组合表和单表之间因为嵌套关系 —— 完全嵌套和部分嵌套而呈现的数据依赖归结为部分依赖和传递依赖。 定义 ( 组合表的嵌入字段 ) 将组合表 A 中具有的来自于基表 B 的字段统称为 10 A 嵌入 B 字段。 第一种情形:组合表 A 嵌入基表 B 的字段集合 C 非空, C 中包含 B 的任意关键字,即 B 完全被嵌套在表 A 中。 消除部分函数依赖实现数据模式规范化可采取以下方法:组合表 A 嵌入基 表B 字段集 C 只保留 B 表的关键字 P 作为外键, C 中其他字段则从 A 表的数据模式中消除。 在表 1 中, 潮 位 观测站位数据是一个不依赖于 潮 位 观测数据的数据实体但却被其完全嵌套,按部分函数依赖的规范化处理达到 2NF 范式, 潮 位 观测站位数据为一个独立的基表,由于该表的字段之间不存在数据依赖关系,按 已有 文献可知它的所有字段组合为一个关 键字,为了引用表中元组的方便,通常为该表定义一个系统自动增值的 标 识码 ID,即为该表的关键字并作为 潮 位 观测数据表中的外键,从而消除了部分函数依赖并实现了信息的引用。 第二种情形:组合表 A 嵌入基表 B 的字 段集合 C 非空, C 不包含 B 的任意关键字,即 B 部分嵌套在表 A 中。 因为 C 未包含 B 的任意关键字,设 A 的所有字段集合为 C′,此时 A 表中 {C′C}的值和 C 的值为 1:n 的关系。 按 1NF 范式要求,解决办法有: ( 1)嵌入字段集 C 完全嵌套在 A 的数据模式中,此时表 A 中相同的 {CC}值与 n 组对应的 C 值组合在一起。 即基本字段 {C′C}在 n 个元组中具有相同的值,存在一定的数据冗余,若修改或插入 {C′C}中某个字段的值就必须维护 n 个元组,以便保持数据的一致性。 ( 2)嵌入字段集 C 并不嵌套在 A 的数据模式中,而是根据 A 表的数据模式中出现 {C′C}的值和 C 的值出现 1:n的关系重新定义一个基本表 P 和一个关联表 M表。 基本表 P 的数据模式组成为:系统自动增值的 标 识码 ID 和字段集 C;基表 B的模式基于基表 P 进行改造,增加一个字段为对应基表 P 的 标 识码 ID 的外键 ID_P,并从基表 B 中去掉已定义在基表 P 中的字段集 C。 上述规范化处理,缘于 B 表原来的数据模式中数据依赖 PID_B→C ,即 B 中所有字段集 C′′具有属性: { C′′C}的值和 C 的值出现 1:1 的关系。 由于字段集 C 已经从表 B 的数据模式中消除,并定义到表 P 的数据模式中, 11 按数据库规范化定理可知 B 表已经消除了传递函数依赖带来的数据冗余和更新、插入异常。 相反地,表 A 中没有包括 B 的关键字,根据上述描述, A 的数据模式中存在{C′C}的值和 C 的值为 1:n 的关系。 A 表的规范化方法如下。 关联表 M 的数据模式定义为:系统自动增值的 标 识码 ID_M、对应表 A 的 标识码的外键 PID_A、对应基表 P 的 标 识码的外键 PID_P,并从基表 A 中去掉已定义在基表 P 中的字段集 C。 由于 A 表中不包含 B 表和 P 表中任意字段,故 A 表中不存在函数决定字段集C 的数据依赖,也就不存在导致数据冗余和更新、插入异常的部分函数依赖和传递函数依赖。 由 于关联表 M 的数据模式中未包含表 A 的数据模式中字段集 C′,表 P 的数据模式中字段集 C,故根据规范化理论,表 A,表 P 和关联表 M 的数据模式不受上述传递函数依赖。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。