数据挖掘
客户类型划分”可以分解为以下一些 Use Case:“客户价值判断”、“客户类型划分”及“销售策略建议”。 客服经理通过 CRM 系统分析由进存货管理系统和呼叫中心积累的大量的客户资料,此时, Use Case“客户价值判断”就开始运行,它先判断客户是否值得我们去维护保持,即客户收益是否大于维持客户所需成本。 如不值得,则 Use Case“客户价值判断”停止,并显示相关信息;如值得去维持
这都是要首先探索的内容。 进行数据特征的探索、分析,最好是能进行可视化的操作。 SAS 有:SAS/INSIGHT和 SAS/SPECTRAVIEW两个产品给你提供了可视化数据操作的最强有力的工具、方法和图形。 它们不仅能做各种不同类型统计分析显示,而且可做多维、动态、甚至旋转的显示。 这里的数据探索,就 是我们通常所进行的深入调查的过程。 你最终要达到的目的可能是要搞清多因素相互影响的
ion rules) 聚类 (clustering) 神经网络 (Artificial Neural Networks, 简记作 ANN) 粗糙集 (rough set) 概念格 (concept lattice) 遗传算法 (geic algorithms) 序列模式 (sequence pattern) 贝叶斯 (Bayes) 支持向量机 (support
e s fro m de s t i na t i on t o s our c e c ont i nuo us …… hot num be r of ``h ot 39。 39。 i ndi c a t ors c ont i nuo us num _fa i l e d_l o g i ns num be r of fa i l e d l o gi n a t t e m p t s c
图 1a 图 1b 移动通讯用户消费概率分布与综合属性评价分布比较 2020/9/15 图 2 移动通讯用户消费综合属性评价排序 2020/9/15 2020/9/15 通过分析我们可以挖掘出以下知识: i).以此排序结果看,该地区移动手机用户平均消费最大的综合评价指标值是 ,即本地话费在 3档上 (100300元 ),长途话费和漫游费的消费在 2档上 (0100元 ).从总体上
Rough集理论是波兰华沙理工大学 Zdzislaw Pawlak教授于1982年首先提出, Pawlak教授在所提出的 Rough集理论中, 将那些无法确定的个体都归属于边界线区域,而这种边界线区域被定义为上近似集与下近似集之差集 .由于上近似集和下近似集都可以通过等价关系给出确定的数学公式描述,所以 含糊元素数目可以被计算出来,即含糊程度可以辨析 . 如果我们描述一个图形的形态
y or accuracy ( also known as rule reliability , rule strength, rule quality, certainty factor, discriminating weight )等 . 有用性 (utility) 如: support (association),s(A=B)=n(A nd B)/n(all), noise
[support = 2%, confidence = 72%] 酸奶占 奶制品 25% 我们称第一个规则是第二个规则的祖先 参考规则的祖先,如果他的支持度与我们“预期”的支持度近似的话,我们就说这条规则是冗余的。 2020/9/15 数据挖掘:概念和技术 33 数据挖掘查询的逐步精化 为什么要逐步精化 挖掘操作的代价可能高或低,结果可能过细致或粗糙 在速度和质量之间折衷
ration, Data Warehouses Data Sources Paper, Files, Web documents, Scientific experiments, Database Systems 数据库管理员 OLAP 商务智能通常被理解为将企业中现有的数据转化为知识,帮助企业做出明智的业务经营决策的工具。 一般由数据仓库、联机分析处理、数据挖掘、数据备份和恢复等部分组成。
......................... 20 随机森林算法 ........................................................................... 20 贝叶斯网络算法 ............................................................................