spss回归分析(编辑修改稿)内容摘要:

围小于 .001,所以估计在迭代次数 12 处终止。 SPSS 19(中文版 )统计分析实用教程 电子工业出版社 32 模型分类预测值表 二元 Logistic回归分析 此时模型的预测准确率已达到97%。 表格从左到右依次表示变量及常数项的系数值( B)、标准误差( .)、 Wald卡方值、自由度( df)、相伴概率( Sig.)、 Exp( B)。 由于各回归系数均为正数,取相应的指数后会大于 1,表示 X1, X2和 X3的取值越大,“两年后具有偿付能力”的可能性比“两年后破产”的可能性就越大, 已观测 已预测 Y 百分比校正 两年后破 产 两年后仍有偿付 能力 步骤 1 Y 两年后破产 32 1 两年后仍有偿付能力 1 32 总计百分比 a. 切割值为 .500。 Logistic模型的参数拟合表 B , Wals df Sig. Exp (B) EXP(B)的 95% . 下限 上限 步骤 1a X1 .331 .301 1 .271 .772 X2 .181 .107 1 .091 .972 X3 1 .317 .008 常量 .877 1 .349 .000 a. 在步骤 1 中输入的变量 : X1, X2, X3. SPSS 19(中文版 )统计分析实用教程 电子工业出版社 33 Logistic回归模型 二元 Logistic回归分析 1 2 3l n 0 .3 3 1 0 .1 8 1 5 .0 8 7 1 0 .1 5 31p X X Xp    1 2 31 2 3( 0 .3 3 1 0 .1 8 1 5 .0 8 7 1 0 .1 5 3 )( 0 .3 3 1 0 .1 8 1 5 .0 8 7 1 0 .1 5 3 )e1eX X XX X Xp     SPSS 19(中文版 )统计分析实用教程 电子工业出版社 34 The End SPSS 19(中文版 )统计分析实用教程 电子工业出版社 35 第九章 聚类和判别分析 SPSS 19(中文版 )统计分析实用教程 电子工业出版社 36 主要内容 聚类与判别分析概述 二阶聚类 K均值聚类 系统 聚类 判别分析 SPSS 19(中文版 )统计分析实用教程 电子工业出版社 37 聚类与判别分析概述 基本概念 (1) 聚类分析 聚类分析的基本思想是找出一些能够度量样本或指标之间相似程度的统计量 , 以这些统计量为划分类型的依据 , 把一些相似程度较大的样本 ( 或指标 ) 聚合为一类 , 把另外一些彼此之间相似程度较大的样本又聚合为一类。 根据分类对象的不同, 聚类分析可分为对 样本的聚类 和对 变量的聚类 两种。 (2) 判别分析 判别分析是判别样本所属类型的一种统计方法。 SPSS 19(中文版 )统计分析实用教程 电子工业出版社 38 聚类与判别分析概述 样本间亲疏关系的度量 (1)连续变量的样本间距离常用度量 主要方法有欧氏距离 ( Euclidean Distance) 、 欧氏平方距离 ( Squared Euclidean Distance) 、 切比雪夫距离 (Chebychev Distance) 、 明可斯基距离 ( Minkowski Distance) 、 用户自定义距离 ( Customize Distance) 、 Pearson相关系数 、 夹角余弦 ( Cosine) 等。 ( 公式见教材表 ) (2)顺序变量的样本间距离常用度量 常用的有 统计量 ( Chisquare measure) 和 统计量 (Phisquare measure)。 ( 公式见教材表 ) 22SPSS 19(中文版 )统计分析实用教程 电子工业出版社 39 聚类与判别分析概述 基本概念 (3) 二者区别 不同之处在于 , 判别分析是在已知研究对象分为若干类型 ( 或组别 ) 并已取得各种类型的一批已知样本的观测量数据的基础上 , 根据某些准则建立判别式 , 然后对未知类型的样本进行差别分析。 SPSS 19(中文版 )统计分析实用教程 电子工业出版社 40 聚类与判别分析概述 说明:  聚类分析的目的是找到样本中数据的特点,因此应注意所选择的变量是否已经能够反应所要聚类样本的主要特点。  聚类分析时应注意所选择的变量是否存在数量级上的差别。 如果一个样本包含不同数量的变量,则应先对变量进行标准化处理,而后再进行聚类。  变量间的关系度量模型与样本间相类似,只不过一个用矩阵的行进行计算,另一个用矩阵的列进行计算。 SPSS 19(中文版 )统计分析实用教程 电子工业出版社 41 主要内容 聚类与判别分析概述 二阶聚类 K均值聚类 系统 聚类 判别分析 SPSS 19(中文版 )统计分析实用教程 电子工业出版社 42 二阶聚类 基本概念及统计原理 ( 1)基本概念 二阶聚类( TwoStep Cluster)(也称为两步聚类)是一个探索性的分析工具(),为揭示自然的分类或分组而设计,是数据集内部的而不是外观上的分类。 它是一种新型的分层聚类算法( Hierarchical Algorithms) ,目前主要应用到数据挖掘( Data Mining)和多元数据统计的交叉领域 ——模式分类中。 该过程主要有以下几个特点:  分类变量和连续变量均可以参与二阶聚类分析;  该过程可以自动确定分类数;  可以高效率地分析大数据集;  用户可以自己定制用于运算的内存容量。 SPSS 19(中文版 )统计分析实用教程 电子工业出版社 43 二阶聚类 基本概念及统计原理 ( 2) 统计原理 两步法的功能非常强大,而原理又较为复杂。 他在聚类过程中除了使用传统的欧氏距离外,为了处理分类变量和连续变量,它用似然距离测度,它要求模型中的变量是独立的,分类变量是多项式分布,连续变量是正态分布的。 分类变量和连续变量均可以参与两步聚类分析。 SPSS 19(中文版 )统计分析实用教程 电子工业出版社 44 二阶聚类 基本概念及统计原理 ( 3)分析步骤 第 1步 预聚类: 对每个观测变量考察一遍,确定类中心。 根据相近者为同一类的原则,计算距离并把与类中心距离最小的观测量分到相应的各类中去。 这个过程称为构建一个分类的特征树( CF)。 第 2步 正式聚类: 使用凝聚算法对特征树的叶节点分组,凝聚算法可用来产生一个结果范围。 SPSS 19(中文版 )统计分析实用教程 电子工业出版社 45 二阶聚类 SPSS实例分析 【 例 91】 某机构为了调查学生性别和所学专业与毕业后初始工资的情况,调查抽取了 60个学生的数据,如表 (其中“性别” 1代表男性, 0代表女性;“学科” 1代表农学, 2代表建筑, 3代表地质, 4代表商务, 5代表林学, 6代表教育, 7代表工程, 8代表艺术),试根据样本指标进行聚类分析。 ( 数据参见教材 P206) 第 1步 分析: 由于自变量中不仅有连续属性,也有分类变量,故采用二阶聚类进行分析。 第 2步 数据组织: 按表所示定义变量,输入数据并保存。 SPSS 19(中文版 )统计分析实用教程 电子工业出版社 46 二阶聚类 第 3步 二阶聚类设置: 按“分析 → 分类 → 两步聚类”顺序打开“二阶聚类分析”对话框,并按下图进行设置。 SPSS 19(中文版 )统计分析实用教程 电子工业出版社 47 二阶聚类 第 4步 主要结果及分析: 二阶聚类的模型概要和聚类质量情况 聚类个案情况图 从中可以看出,此算法采用的是两步(二阶)聚类,共输入 3个变量,将所有个案聚成 3类。 聚类的平均轮廓值为(其范围值为 ~ ,值越大越好),说明聚类质量较好。 可以看出各类所占的比例情况 SPSS 19(中文版 )统计分析实用教程 电子工业出版社 48 二阶聚类 第 4步 主要结果及分析: 各个案所属的分类号情况 SPSS 19(中文版 )统计分析实用教程 电子工业出版社 49 主要内容 聚类与判别分析概述 二阶聚类 K均值聚类 系统 聚类 判别分析 SPSS 19(中文版 )统计分析实用教程 电子工业出版社 50 K均值聚类 基本概念及统计原理 ( 1)基本概念 K均值聚(也称快速聚类)是由用户指定类别数的大样本资料的逐步聚类分析。 它先对数据进行初始分类,然后逐步调整,得到最终分类数。 分类变量和连续变量均可以参与两步聚类分析。 ( 2)统计原理 如果选择了 n个数值型变量参与聚类分析,最后要求聚类数为 k。 由系统首先选择 k个观测量 (也可以是用户指定 )作为聚类的目标, n个变量组成 n维空间。 每个观测量在 n维空间中是一个点。 K个事。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。