数据挖掘在客户关系管理中的应用—免费毕业设计论文内容摘要:

r Relationship Management,简称 CRM )是选择和管理最有价值客户关系的一种商业策略。 CRM 要求以客户为中心的商业哲学和企业文化来支持有效的营销、销售以及客户服务。 如果企业拥有正确的领导、策学院理学学士论文 第一章 可行性研究报告 5 略和企业文化, CRM 应用将为企业实现有效的客户关系管理。 客户关系管理首先是一种商业策略,它贯穿于企业的各个部 门和经营环节,其目的在于理解、预测和管理企业现有的或潜在的顾客。 客户关系管理涉及到战略、过程、组织和技术等各方面的变革,以使企业更好地围绕客户来有效地管理自己的经营。 我们为什么需要客户关系管理呢。 因为大家都知道: (1)获得一个新客户比留住一个老客户要花更多的钱; (2)客户离开后再把他们吸引回来所花的钱要比他们一开始就满意所花的钱多得多; (3)将新的商品卖给老客户要比卖给新客户容易得多; (4)有些客户比其他客户更有利可图。 有些客户现在是无利可图的,还有一些客户现在和将来都是无利可图的。 所以我们要运 用新的技术,来改变单一的销售模式,寻求最有利可图的途径建立和维持稳定的客户关系。 客户对企业的好感和忠诚不仅来自于企业提供的商品,更来自于服务和经验等非实体因素。 企业要了解客户的喜好 不仅包括产品,还包括样式和服务的外观。 他们要管理每一个客户的关系,从每一个客户身上获取最大利润,降低市场营销费用,减少由于客户离去和无效的营销策略产生的浪费。 以上都希望用客户关系管理的方法来实现。 数据挖掘在 CRM 中的应用 [6] 在客户关系管理生命周期的各个阶段都有可能会用到数据挖掘技术。 例如,在如何更好地为 现有的客户提供服务方面,通过数据挖掘,能够帮助企业确定现有的客户的特点,从而为客户提供有针对性的服务;如何开拓企业新市场,获取新客户方面,通过数据挖掘,可以发现购买每一商品的客户的特征,从而可以向那些具有这些特征却没有购买的客户推销这个商品;如何挖掘现有客户群的潜力,为企业提供更多价值方面,通过数据挖掘,可以分析各个客户对企业带来的赢利能力,找到那些“金牌客户”后提供更加有针对性的服务,同时也可以分析现有客户的兴趣,向他们推荐提供新的产品和服务;在如何保持现有客户群方面,通过数据挖掘,可以找到流失客户的特征 ,以抢在那些具有相似特征的客户还未学院理学学士论文 第一章 可行性研究报告 6 流失之前,就可以采取针对性的措施防止他们的流失;在预测公司未来发展方面,通过数据挖掘,可以预测客户赢利能力的变化,帮助企业提前采取各种对应的措施。 项目可行性评估 [7] 技术可行性评估 根据现有的技术,采用 Visual C ++、 SQL Sever 等技术和工具完全可以快速、高效地实现该系统模型。 经济可行性评估 由于采用 Visual C ++ 开发,用 VC+ODBC 连接数据库的开发方式尽可能地缩短开发周期、节约系统的开发费用,适合大、中 型企业,适合远程网络,特别适合小型企业,操作简单、明朗,将会给它们带来丰厚的利润。 操作可行性评估 可以参照其他的软件应用系统,特别适合管理级人员的使用,界面上能实现对客户资料的管理,为用户做出合理的决策,提供了很好的帮助,并尽可能地减少让用户难以操作的方式。 项目可行性研究报告 纵上所述,从开发的语言、所要运用的工具,到数据挖掘在客户关系管理中应用的价值,都具备了可以开发本系统的要求。 而且无论从技术、经济还是操作上,本系统的实现应该没有什么问题的,可以进行对系统的需求分析工作。 学院理学学士论文 第二章 系统的需求分析 7 第二章 系统需求分析 要实现一个软件系统,首先应该进行需求分析,这样才能设计出的软件满足用户的各项功能。 下面就对客户管理系统的设计进行需求分析。 系统需要解决的主要问题 首先,该系统主要是面向管理级人员而开发的,并且系统里的资料是企业客户的重要信息,所以用户者必须验证身份才能登入。 用户根据不同的级别进入不同的模块,调用各自所需要的信息。 本系统由二大模块组成 —— 客户资料管理和客户信息分析,其中客户信息分析里引用了数据挖掘中的四个算法 —— 粗糙集、关联规则、决策树、遗传算法。 我所要实现的就是把这几个模块有效地结 合起来,组成一个完整的模块,应用到客户关系管理系统中去。 在这里,我来介绍以下的几种算法的需求分析。 粗糙集 面对信息化数据的飞速发展,客户资料数据也从数以几十甚至上百 GB 的容量。 这些数据是企业的财富,它如实地记录着企业运作的本质状况。 但当客户数量达到一定数量时,企业已无能力对数量以外的人进行同样的销售努力,这就迫切需要一种分析高价值的客户的方法 粗糙集算法。 它把数据集看作决策表,由用户指定数据库中某一个或多个属性作为分类的类别,并对决策表进行属性约简,根据这些属性的不同取值,将数据库中数据 分为不同的类别,并对决策表进行属性约简和值约简,删除冗余的属性和属性值,在决策表中导出决策规则,从而从少量的客户属性资料数据判断谁是高价值客户,谁是低价值客户,在决策过程中应给予不同重视,那将给企业带来了无限商机。 关联规则 公司与其客户之间的商业关系是一种持续的不断发展的关系。 这就需要我们学院理学学士论文 第二章 系统的需求分析 8 要用关联规则算法,来实现“交叉销售”。 交叉销售分析就是从分析现有客户的购买行为数据开始, 它 是指同时向一位顾客销售多种相关的服务或产品 , 这是一种发现顾客多种需求 , 并满足其多种需求的一对一营销方式。 交叉销售是建立在“双赢 ”原则的基础之上的 , 客户因得到更多、更好符合个性需求的服务而满足 ,企业也因销售 的 增长而获益。 决策树 随着行业中竞争愈来愈激烈和获得一个新客户的开支愈来愈大,保持原有客户的工作也愈来愈有价值。 比如说,在移动电话行业中,吸引并使一个新客户签约的开支估计为 300 美元或更多,这其中包括了硬件折旧和销售费用。 然而保留一个旧客户的开支可能只是打一个电话或将他们的手机更新到使用最新的技术的那种型号。 虽然这也很贵,但比起和一个全新的客户签约还是便宜了许多。 如同在这个案例中看到的一样,我们看到可以用决策树来 判断客户的流失,这在保留客户的活动中起着重要作用。 遗传算法 自然界的生物体在遗传、变异和选择的相互作用下,优胜劣汰,不断地由低级 向高级进化和发展。 这种“物竞天择,适者生存”地进化规律实际上表示了一种优化的思想。 在客户关系管理系统中,我们所实现的对客户优化的问题,也正是运用了这种思想。 遗传算法用于 CRM 系统中模拟自然界的生物进化过程。 它通过数据对客户群分析,运用适者生存的原则,对客户群进行分类,将没有效益的客户群或低效益客户群转化为高效益客户群,同时奖励和发展有效益的客户群。 系统应该具备 的基本功能 (1)用户权限的管理:用户可以根据不同的级别进行不同的管理,管理员可以看到整个系统,而部门管理员只能进行该部门的管理。 (2)客户基本资料管理:可以对客户进行增加、修改、删除、还可以进行多种查询功能。 学院理学学士论文 第二章 系统的需求分析 9 (3)判断客户属性资料:可以对客户属性资料进行管理,对粗糙集算法中的表的数据而进行增加或删除的功能。 (4)发掘潜在客户资料:可以对客户与商品之间的关系进行管理,对关联规则算法中的表的数据而进行增加或删除的功能。 (5)分析客户流失资料:可以对客户流失资料进行管理,对决策树算法中的表的数据而进行增 加或删除的功能。 (6)判断客户价值:实现粗糙集算法的应用,对一个客户进行价值判断。 (7)发掘潜在客户:实现关联规则算法的应用,用关联规则推出哪些商品是关联的,然后导出哪些是潜在客户。 (8)客户流失分析:实现决策树算法的应用,用决策树来判断客户的流失,分析流失的原因。 (9)客户价值优化:实现遗传算法的应用,进行客户的优化。 除了实现上述功能以外,客户管理系统还应该具有友好、简洁的界面,安全性要高,稳定性要强。 数据收集及预处理 [4] 对于数据挖掘,我们当然需要收集大量的数据,收集了销售业和零售 业的数据,还有网上的电线公司的数据 ,为了操作把这些数据集成于数据仓库中。 对于数据挖掘中的算法对其处理的数据集合一般都有一定的要求,比如数据完整性好、数据的冗余性少、属性之间的相关性小。 然而,实际系统中的数据一般都具有不完全性、冗余性和模糊性,很少能直接满足数据挖掘算法的要求。 另外,海量的实际数据中无意义的数据很多,严重影响了数据挖掘算法的执行效率,而且由于其中的噪声干扰还会造成无效的归纳,所以这就要求我们必须进行数据预处理这一步。 数据挖掘中的预处理主要是接受并理解用户的发现要求,确定发现任务,抽取与发 现任务相关的知识源,根据背景知识中的约束性规则对数据进行检查,通过清理和归纳等操作,生成供挖掘核心算法使用的目标数据。 数据预处理应该包括以下几个方面的功能: (Data Integration) 学院理学学士论文 第二章 系统的需求分析 10 数据集成主要是将多文件或多数据库运行环境中的异构数据进行合并处理,解决语义的模型性。 该部分主要涉及数据的选择、数据的冲突问题以及不一致数据的处理问题。 (Data Cleaning) 数据清洗要去除原数据集中的噪声数据和无关数据,处理遗漏数据和清洗脏数据,去除空白数据域和知识背景上的白噪声 ,考虑时间顺序和数据变化等。 主要包括重复数据处理和缺省值数据处理,并完成一些数据类型的转换。 (Data Transformation) 数据变换主要是找到数据的特征表示,用维变换或转换方式减少有效变量的数目或找到数据的不变式,包括规格化、归纳、切换、旋转和投影等操作。 (Data Reduction) 数据简化是在对发现任务和数据本身内容理解的基础上,寻找依赖于发现目标的表达数据的有用特征,以缩减数据规模,从而在尽可能保持数据原貌的前提下最大限度地精简数据量。 它主要有两个途径:属 性选择和数据抽样,分别针对数据库中的属性和记录。 (1)属性选择包括针对属性进行剪枝、并枝、找方程和找相关属性等操作。 (2)数据抽样就是进行数据记录之间的相关性分析,用少量的记录的线性组合来表示大量的记录。 对各算法中的数据进行预处理 (1)对粗糙集数据的进行预处理。 首先, Excel 表的数据转换到 SOL Sever 中要考虑到数据类型的选择问题,应尽量选择占物理空间较小的数据类型,如在区域范围内用 varchar 替代 CString 类型,因为 varchar 可以灵活的分配所要的空间,对于大规模数 据集来说将会大大减少系统开销。 对年龄、收入属性的不同取值 (区间 )数小于对应的属性概化阀值,则应对它们进行概化。 如年龄,它的概化阀值设为 20,所以小于 30 岁的,我们设为young,30~50 的为 middle,大于 50 的为 senior。 同理,把收入小于 2020 的设为 low,大于、等于 2020 为 high。 由于婚否属性只有两个不同值,所以该属性保留,并且不对其进行概化。 同学院理学学士论文 第二章 系统的需求分析 11 理,性别、是否全职与单位属性也被保留,也不需要进行概化。 数据处理前:如 21 所示。 表 21 原始数据 Chart 21 the Origin Data 数据在 SQL Sever 中进行处理以后:如表 22 所示 表 22 处理后的数据 Chart 22 the Final Data 学院理学学士论文 第二章 系统的需求分析 12 (2)对关联规则数据的进行预处理。 同上,我们在 SQL Sever 里用的数据类型还是 varchar,但为了方便对关联规则算法实行,还要对所需要的商品进行符号替换。 用 I1 代表随身听,同理:I2 耳机, I3 电池, I4 笔筒, I5 充电器, I6 笔记本, I7 钢笔, I8 手表, I9MP3,I10 耳麦, I11CD 机, I12 音响, I13 电脑, I14 手机, I15 键盘, I16 鼠 标, I17摄像头, I18CD 包, I19 钱包, I20 背包等。 数据处理前:如表 23 所示 表 23 原始数据 Chart 23 the Origin Data 数据在 SQL Sever 中进行处理以后:如表 24 所示 表 24 处理后的数据 C。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。