spss聚类和判别分析(编辑修改稿)内容摘要:

,原先的 6个变量就变成了 4类。 以此类推,经过 5步聚类,最后将所有变量聚成了一个大类。 SPSS 19(中文版 )统计分析实用教程 电子工业出版社 32 系统 聚类 第 4步 主要结果及分析: 系统聚类的树状图 第 1步将“ cu(铜)”和“ mn(锰)”聚成一类,第 2步将“ hemogl(血红蛋白)”聚到“ cu(铜)”和“ mn(锰)”类中,第 3步将“ ca(钙)”和“ mg(镁)”聚成一类。 以此类推,最后聚成一个大类。 这与聚类顺序表和聚类冰柱图的分析结果是一致的。 SPSS 19(中文版 )统计分析实用教程 电子工业出版社 33 主要内容 聚类与判别分析概述 二阶聚类 K均值聚类 系统 聚类 判别分析 SPSS 19(中文版 )统计分析实用教程 电子工业出版社 34 判别分析 基本概念与统计原理 基本概念 判别分析( Discriminant Analysis)是多元统计分析中用于判别样本所属类型的一种统计方法。 它要解决的问题是在一些已知研究对象用某种方法已分成若干类的情况下,确定新的观察数据属于已知类别中的哪一类。 判别分析是应用很强的一种多元统计分析方法。 (2) 统计原理 判别分析按判别组数来分,有两组判别分析和多组判别分析,按区分不同总体所用的数学模型来分,有线性差别和非线性判别。 判别分析可以从不同的角度提出问题,因此有不同的判别准则,如费歇尔( Fisher)准则和贝叶斯( Bayes)准则。 1 1 2 2 nny a x a x a x   判别函数的一般形式是 SPSS 19(中文版 )统计分析实用教程 电子工业出版社 35 判别分析 分析步骤 第 1步 计算特征值: 计算需要用到的一些反映样本的特征值,比如均值、协方差矩阵等。 第 2步 建立判别函数: 判别函数的一般形式如式 函数就是要确定这些系数。 第 3步 确定判别准则: 如费歇尔( Fisher)准则和贝叶斯(Bayes)准则。 第 4步 检验判别效果: 验证判别函数用来进行判别时的准确度。 第 5步 分类: 根据所建立的判别函数对待判样本进行分类。 SPSS 19(中文版 )统计分析实用教程 电子工业出版社 36 判别分析 SPSS实例分析 【 例 94】 下表是健康人( c = 1)、硬化症患者( c = 2)和冠心病患者( c = 3)三种人群的心电图的 5个指标( x1~ x5)数据,其中有 19个样本是确定的分类,另又测出 4个人的相关指标,试根据确定分类的样本对这未确定的样本进行分类。 order x1 x2 x3 x4 x5 c order x1 x2 x3 x4 x5 c 1 1 13 2 2 1 14 2 3 1 15 2 4 1 16 3 5 1 17 11 3 6 1 18 3 7 1 19 3 8 1 20 待定 9 1 21 待定 10 2 22 待定 11 2 23 待定 12 2 SPSS 19(中文版 )统计分析实用教程 电子工业出版社 37 判别分析 第 1步 分析: 由于部分样本已经有分类标记,还有几个待分类样本。 这显然属于根据已知分类样本的信息对未分类样本进行分类的情况,用判别分析进行处理。 第 2步 数据组织: 建立 7个变量。 分别是“序号”、“ x1”、“ x2”、“ x3”、“ x4”、“ x5”和“ c”,均为数值型变量。 输入数据,对第 20条~ 23条的类别“ c”变量,不填数据,作为缺失值处理,存盘并保存。 第 3步 进行按变量聚类的设置: 按如下图示进行设置 SPSS 19(中文版 )统计分析实用教程 电子工业出版社 38 判别分析 SPSS 19(中文版 )统计分析实用教程 电子工业出版社 39 判别分析 第 4步 主要结果及分析: 分析案例处理摘要表 表明共 23条记录,已分好类的 19条,有 4条需进行分类。 汇聚的变量之间相关矩阵表 x1 x2 x3 x4 x5 Correlation x1 .059 x2 .059 .835 .762 x3 .835 .688 x4 x5 .762 .688 给出了这五个自变量之间的相关系数,如变量“ x1”与变量“ x2”之间的相关系数为。 未加权案例 N 百分比 有效 19 排除的 缺失或越界组代码 4 至少一个缺失判别变量 0 .0 缺失或越界组代码还有至少一个缺失判别变量 0 .0 合计 4 合计 23 SPSS 19(中文版 )统计分析实用教程 电子工业出版社 40 判别分析 特征值表 由于本例中预测变量为 5个,类别数为 3,因此判别函数的个数为 2(即 min(31,5)=2)。 判别函数的特征值越大,表明该函数越具有区别力。 第一个判别函数的特征值为 ,第二个为。 判别函数的显著性检验结果表 其中“ 1到 2”表示两个判别函数的平均数在 3个级别间的差异情况。 “ 2”表示在排除第一个判别函数后,第二个函数在 3个级别间的差异情况。 从最后的显著性概率 ,其两个判别函数的效果并不十分显著 函数 特征值 方差的 % 累积 % 正则相关性 1 .762 2 .408a .538 a. 分析中使用了前 2 个典型判别式函数。 函 数检验 Wilks 的 Lambda 卡方 df Sig. 1 到 2 .298 10 .075 2 .710 4 .310 SPSS 19(中文版 )统计分析实用教程 电子工业出版社 41 判别分析 判别系数表 1 26 1 88 2 64 3 74 4 34 5F x x x x x    2 34 1 08 2 98 3 16 4 36 5F x x x x x    函数 1 2 x1 .626 .234 x2 .988 x3 .664 x4 .974 .416 x5 SPSS 19(中文版 )统计分析实用教程 电子工业出版社 42 判别分析 分类结果概述表 从表中可以看出,有 23条个案被成功分类。 已处理的 23 已排除的 缺失或越界组代码 0 至少一个缺失判别变量 0 用于输出中 23 SPSS 19(中文版 )统计分析实用教程 电子工业出版社 43 判别分析  分类函数系数表 c 健康 硬化病 冠心病 x1 x2 .222 .160 .211 x3    x4 x5 (常量)    Fisher 的线性判别式函数 1 1 2 3 4 x x x x x     2 1 2 3 4 x x x x x     3 1 2 3 4 x x x x x     SPSS 19(中文版 )统计分析实用教程 电子工业出版社 44 判别分析 各类区域图及分类标记情况图 这是以根据每个个案计算出的判别分数为坐标,以典则判别函数 1为横轴,以典则判别函数 2为纵轴,所绘出的散点图。 可以看出,在图中分出了 1, 2, 3三个区域,在图中也标出了各类的中心(其中心用“ *”表示)。 SPSS 19(中文版 )统计分析实用教程 电子工业出版社 45 判别分析 分类结果矩阵 对角线显示的为准确预测的个数,其余为错误预测的个数。 从该表可以看出,已经分的 19个个案正确分类 17个,错误分类 2个。 正确率还是比较高的。 根据这 19个个案为先验数据,将待分类的 4个个案分别分入 1, 2, 3类的分别有 1, 1,2个。 c 预测组成员 合计 健康 硬化病 冠心病 初始 计数 健康 9 0 0 9 硬化病 0 5 1 6 冠心病 1 0 3 4 未分组的案例 1 1 2 4 % 健康 .0 .0 硬化病 .0 冠心病 .0 未分组的案例 a. 已对初始分组案例中的 % 个进行了正确分类。 SPSS 19(中文版 )统计分析实用教程 电子工业出版社 46 判别分析。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。