dss-6-基于决策支持系统的数据仓库(编辑修改稿)内容摘要:
数据仓库 是一个 面向主题的 、 集成的 、 稳定的 、 不同时间的数据集合 ,用来支持管理人员的决策制定过程。 数据仓库反映的是对信息的历史需求 , 而操作型环境是体现对信息目前的需求。 数据仓库着眼于企业的信息化需求 , 而操作型环境则着眼于精确到秒的企业日常事务需求。 三 .数据仓库的结构 (P175) 四 .数据集市 概念 :是一种更小 ,更集中的数据仓库 . 特性 : P177 类型 :从属 ,独立 与数据仓库的区别 : 数据仓库 面向企业 数据集市 面向部门 第二节 基于 DSS的数据仓库的重要构成元素 粒度 粒度是指数据仓库数据单位中保存数据的细化或综合程度的级别。 细化程度越高,粒度级越小;相反,细化程度越低,粒度级就越大。 在数据仓库环境中粒度级别的设计在很大程度上影响存放在数据仓库中的数据量的大小,同时影响数据仓库所能回答的查询类型。 例如, DSS数据库中,一个顾客一个月内的每个电话的细节被记录下来,到月底,每个顾客平均有 200条记录,对于这样的数据我们称之为高细节 —— 低粒度级数据。 而对于一个顾客一个月内的电话的综合,到月底,每个顾客只有一条记录,我们称之为低细节 —— 高粒度级数据。 一个记录:打电话的日期、打电话的时间、 电话号码、通话时间、接线员帮助。 每月一个记录:月份、市内电话数量、长途电话数、电话的平均长度、接线员帮助呼叫数、未接通电话数。 J JoneS 4月 12日下午 6: 01- 6: IZ 415. 566- 9982接线员帮助 4月 12日下午 6: 15- 6: 16 415. 33 8847长途 4月 12日下午 6: 23- 9: 38 408. 223- 7745 4月 13日上午 9: 12- 9: 23 408- 223- 7745 4h 13日上午 10: 15- 10: 21 408. 223. 7745接线员帮助 4月 15日上午 11: 01- 11: 21 415- 964- 4738 4月 15日上午 11: 39- 12: 01 703. 570. 5770未接通 4月 15日下午 12: 10- 12: 46 703. 8415770号码错误 4月 16日下午 12: 34- 12: 56 415. 964- 3130 四月份 J JoneS 电话数量一 40个 电话的平均长度 ——14分钟 长途电话数 ——18个 接线员帮助呼叫数 ——2个 未接通电话数 ——l个 存储 1个记录所需的字节数 —— 225 例如一个顾客一个月的电话综合 粒度:高细节级 “ Cass Squire上星期是否给他在波士顿的女友打了电话。 ” 能回答 , 尽管需要一定数量的检索。 粒度:低细节级 根本就不能回答 , 细节已经消失。 但寻找单个记录是个非常不常见的事件。 可回答: “ 上个月 , 人们从华盛顿打出的长途电话 平均有多少个。 ” 针对问题: “ Cass Squire上星期是否给他在波士顿的女友打了电话。 ” 在低粒度级上 , 这个问题是可以回答的 , 虽然这种回答将花费大量资源去查阅大量的记 录,但是 Cass上周是否给他在波士顿的女友打了电话最终总是可以确定的。 然而,在高粒度级上就无法明确地回答这个问题。 假如在数据仓库中存放的只是 CassSquire打的电话总数,那么就不能确定其中是否有一个电话是打往波士顿的。 但是,在进行 DSS处理时(这在数据仓库环境中是常见的),很少对单个事件进行检查。 通常是针对某种数据集合进行处理的,这意味着要查阅大量记录。 例如 , 假设提出下面的集合性查询问题: “ 上个月人们从华盛顿打出的长途电话平均多少个。 ” 在一个 DSS环境中这种查询类型是非常常见的。 当然,它既可以在高粒度级上也可以在低粒度级上得到回答。 但在回答这个问题时,在不同的粒度级上所使用的资源具有相当大的差粒度的双重级。 显然 , 用高粒度级表示的数据将比用低粒度级表示的数据效率要高。 为了满足大多数机构的需要, DSS设计者通过在数据仓库的细节级上创建两种粒度级来实现。 如在一个电话公司的决策支持系统中,进行“双重” 粒度级的设计,在操作层是大量的细节,是为了满足结帐的需求多达 30天的细节存放在这种操作层中,当数据从操作层环境(存储 30天后),它就被综合成可能用于 SS分析的数据域,我们称为轻度综合数据级, 这样一来 , 某人的数据记录就成为他每个月打电话的次数 、 每个电话的平均长度 、 长途电话的次数 、 接线员帮助呼叫的次数等等。 在轻度综合数据库中 , 其数据量比细节数据库的数据量少得多 ,当然 , 在轻度综合数据库中 , 对能访问的细节级存在一定的限制。 鉴于费用 、 效率 、 访问便利和能够回答任何可以回答的查询的能力 , 数据双重粒度级是大多数机构建造数据仓库细节级的最好选择。dss-6-基于决策支持系统的数据仓库(编辑修改稿)
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。
用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。