联通经营分析系统的dw模型(编辑修改稿)内容摘要:

离网用户数、出帐用户数、通话用户数等。 这在抢占市场时期是特别关注。  业务收入 即使用户数得到迅速发展,但是收入 并不一定同比增长,特别是项 CDMA 业务的发展趋势,起初用户的增长特别迅猛,但是因为采取很多优惠政策,收入却增长缓慢。 业务收入中主要也是围绕应收、实收和欠费来分析,目前成本这一块数据难以获取,大大限制了经营分析的作用。  业务量 这里关注的是用户使用业务的情况,例如移动业务中,通话时长、通话次数、计费时长是比较重要的指标。 对于 CDMA1x业务,流量是重要的指标。 针对上面的指标,经营分析对于它们在用户套餐、用户的入网渠道上的分布还特别关心,前者为套餐(产品)的制定提供决策依据,后者为优化 渠道建设提供依据。 四、统一 DW模型结构 通过了解上面的业务介绍,我们现在可以看看统一 DW 模型的设计思路。 前面提到,现阶段我们的分析主要围绕用户主题展开。 因此,在 DW 层,就必须围绕用户设计出一系列的核心数据结构。 为了说明 DW层的作用,我们设想一些典型的分析: 20xx年 4月 1日,爪哇市的 C网新增用户数,离网用户数; 20xx年 4月 6日,爪哇市 C网的当日话费收入和当月累计话费收入; 20xx年 2月爪哇市的 C网应收,和 3月的应收同期比较,增长率为多少; 20xx 年 3 月份爪哇市 C 网应收费用中 ,月租费、本地通话费、长途费、漫游费、短信费等各占多少比例。 在套餐上细分的比例是多少。 截止到 20xx 年 2 月底,爪哇市 C网的累计欠费是多少。 有多少用户欠费。 哪种套餐发生的欠费较多。 哪个代理商所发展用户欠费较多。 截止到 20xx年 3月 1日,爪哇市 C网的实收上期( 1月份)费用是多少。 回收欠费多少。 20xx年 4 月 4日,爪哇市 C网主叫国内漫游本地通话次数是多少。 计费时长是多少。 在套餐上的分布如何。 用户级数据沉淀 为了满足数据沉淀稳定性的要求, DW设计不能简单的根据需求将数据预先在可能的维度上汇总 若干度量,因为需求是不断变化的,此时提出的需求很可能并不是真正有用的需求,当这个分析需求需要加入一个新的分析维度时,那这个汇总数据将被无情废掉,要不你就将尽可能多的维度放在一起汇总,但那样恐怕是不现实的,因为汇总性能和空间都不会允许。 因此,我们需要还一个思路来沉淀数据。 很自然的,刚才那种汇总数据的沉淀方式是去除用户 id的,那么如果我们保留用户 id呢。 那样沉淀数据是可以一定程度保证稳定性的,至少沉淀下来的数据不会白费。 但是要注意,对于一个用户对应多条记录的数据源,可以将它们想象成一个窄表,例如月帐单表,它通过 费用类型区分不同费用,在 DW 层,我们就需要形成一个宽表,每个用户每月一条记录,根据费用类型形成若干字段,如通话费、月租费等。 我们这里将它们称作用户信息表(一系列)。 这样的数据沉淀能够很大程度上保证数据的稳定性,如果有新的需求需要在新的维度上分析,可以扩展这些用户信息表。 经营分析系统围绕用户,主要关注用户的服务情况、消费情况、业务使用情况、缴费行为、欠费行为等。 因此,我们可以针对这些用户主题,建立不同的用户信息表,请注意各个用户信息表的用户集合并不是一样的。 假设有如下的符号描述:  U(W):表示整个用户集合,所有有记录的用户;  U(N):表示在网用户的集合,表示截止到某一时刻,所有未离网的用户;  U(B):表示某月出帐的用户集合,即出现在该月帐单表中的用户集合;  U(C):表示某月(日)产生通话行为的用户集合,即出现在该月(日)通话详单中的用户集合;  U(M):表示某月(日)使用短信的用户集合,即出现在该月(日)短信详单中的用户集合;  U(X):表示某月(日)使用 ,即出现在该月(日) 详单中的用户集合;  U(A):表示截止到某时间点,发生欠费的用户集合,一般指出现在欠费表中的用户; 统一 DW 层有一系列的表存放用户的各种信息,我们这里所指的用户信息是一种广义上的含义,和营帐系统的用户信息表不同,广义的用户信息具有一个特征,用户和它是一对一关系的,例如用户的手机号,一个用户只有一个手机号,再如用户的应收费用分档,一个用户一个月也只有一个分档。 对于类似费用类型、呼叫类型,用户和它们都是一对多关系,不能称之为用户信 息。 用户信息可以分成两类,一种是固有的信息,一种是统计出来的信息,前者一般在分析中作为维度,例如用户套餐、用户欠费时长;后者即可以衍生为维度,也可以作为度量,例如用户的应收话费,既可以作为费用分档维度,也可以作为出帐应收度量。 用户有两个最基本的信息就是归属城市和业务类型,这两个信息作为维度几乎出现所有的分析主题,而且下面的用户信息表都包含了这两个信息,这个冗余可以便于统计主题数据。 用户信息表在命名上具有相似性,一般都以 FW_UserInfo 作为前缀,后面跟上 12 个字符表示信息类型。 下面按照用户信息的分 类分别介绍这一系列用户信息表。  服务信息 用户是一种客户订购某种业务的合约关系,我们在 ODS 中一般都保存了一份全部的用户表,到了 DW层,我们还要进一步综合。 用户静态表( FW_UserInfoS),用户静态表存放着用户的基本信息,用户 ID作为主键,每个用户一条记录。 前面在业务介绍中提到,客户、帐户与用户是一对多关系的,所以客户和帐户的信息都能唯一映射到一个用户上,在静态表中,我们就是集成了 ODS 层中的用户表、客户表和帐户表,一般来说,我们在客户表中要取的信息包括:  客户类型:例如个人客户、单位客户、集团客户等;  客户级别:例如普通客户、大客户等;  客户年龄:一般可以从身份证 ID计算,但是数据不是非常整洁;  客户性别:一般可以从身份证 ID计算,但是数据不是非常整洁;  客户职业:例如教师、学生、公务员等;数据不整洁; 从 ODS帐户表中,我们一般要取的信息包括帐户缴费方式,用户在入网时,可以预先设定一种缴费方式,例如选择银行代扣,要指定银行帐号和银行代码等;从分析的角 度,这个维其实很少用到,所以在实际项目中,可以适当取舍这个表的关联; 从 ODS用户表中,我们要将大部分的用户信息直接搬过来,主要的信息包括用户所属地市、用户状态、用户套餐、用户入网渠道、用户入网月份(在网时长)等。 另外有几个特别的信息需要强调: 。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。