spss聚类分析与判别分析(编辑修改稿)内容摘要:

fine”对话框 图 826 “Discriminant Analysis: Stepwise Method”对话框 图 827 “Discriminant Analysis: Statistics”对话框 图 828 “Discriminant Analysis: Classification”对话框 图 829 “Discriminant Analysis: Save”对话框 ( 1) SPSS输出结果文件中的第一部分如下表所示。 结果和讨论 ( 2)输出的结果文件中第二部分如下表所示。 ( 3)输出的结果文件中第三部分如下表所示。 ( 4)输出的结果文件中第四部分如下表所示。 ( 5)输出的结果文件中第五个部分为组间的协方差矩阵,如下表所示。 ( 6)输出的结果文件中第六个部分如下两个表格所示。 ( 7)输出的结果文件中第七个部分如下表所示。 ( 8)输出的结果文件中第八个部分如下表所示。 ( 9)输出的结果文件中第九个部分如下表所示。 ( 10)输出的结果文件中第十个部分如下表所示。 ( 11)输出的结果文件中第十一个部分如下表所示。 ( 12)输出的结果文件中第十二个部分包括 3个分类统计信息表格 ( 13)输出的结果文件中第十三个部分为每一个个案的实际分组摘要表。 如下表所示。 ( 14)输出的结果文件中第十四个部分如图 830所示。 ( 15)输出的结果文件中第十五个部分如下: ( 16)在实现过程中曾指定了将判别分析的结果作为样本的变量保存到 SPSS的数据编辑窗口中。 SPSS运行后,数据编辑窗口如图 831所示。 小 结 聚类分析的实质是建立一种分类方法,将一批样本数据按照他们在性质上的密切程度在没有先验知识的情况下自动进行分类。 聚类方法主要分为层析聚类分析方法和快速聚类分析方法,其中层次聚类分析方法又有两种形式:一种是对样本进行分类,称为 Q型聚类;一种是对研究变量进行分类,称为 R型聚类。 小 结 判别分析是指先根据已知类别的事物的性质,建立函数式,然后对未知类别的新事物进行判断以将之归入已知的类别中。 判别分析的模型按照判别的不同准则可以分为典型判别分析、贝叶斯判别分析、非参数判别分析等不同模型。 小 结 SPSS中 “ Analyze”/“Classify”菜单专门用于聚类分析和判别分析。 其中, “ KMeans Cluster”适用于快速聚类分析方法,“ Hierarchical Cluster”适用于层次聚类分析方法, “ Discriminant”主要用于判别分析。 SPSS与问卷分析 刘文平 提 纲 • 编码与数据录入 编码 •注意变量类型与尺度 数据录入 • 统计分析 • 统计制图 编码与录入 • 单选题 例 1 当前贵组织机构是否设有面向组织的职 业生涯规划系统。 A有 B 正在开创 C没有 D曾经有过但已中断 编码 :只定义一个变量, Value值 4 分别代表 A、 B、 C、 D 四个选项。 录入 :录入选项对应值,如选 C则录入 3 编码与录入(续) • 多项选择题 (选项数固定和不固定 ) 例 2 贵处的职业生涯规划系统工作涵盖哪些组群。 画钩时请把 所有提示考虑在内。 A月薪员工 B日薪员工 C钟点工 编码 :把每一个相应选项定义为一个变量,每一个变量 Value值 均如下定义:“ 0” 未选,“ 1” 选。 录入 :被调查者选了的选项录入 没选录入 0,如选择被调查 者选 AC,则三个变量分别录入为 0、1。 编码与录入(续) • 多项选择题 例 3 你认为开展保持党员先进性教育活动的最重要的目标是哪三项: 1( ) 2 ( ) 3( ) A、提高党员素质 B、加强基层组织 C、坚持发扬民主 D、激发创业热情 E、服务人民群众 F、促进各项工作 编码 :定义三个变量分别代表题目中的 3三个括号,三个变量 Value值均同样的以对应的选项定义,即:“ 1” A,“ 2” B,“ 3” C,“ 4” D,“ 5” E,“ 6” F 录入 :录入的数值 6分别代表选项 ABCDEF,相应录入到每个括号对应的变量下。 如被调查者三个括号分别选 ACF,则在三个变量下分别录入 6。 编码与录入(续) • 排序题 例 4 您购买商品时在 ①品牌 ②流行 ③质量 ④实用 ⑤价格 中对它们的关注程度先后顺序是(请填代号重新排列) 第一位 第二位 第三位 第四位 第五位 编码:定义五个变量,分别可以代表第一位 第五位,每个变量的 Value都做如下定义:“ 1” 品牌,“ 2” 流行,“ 3” 质量,“ 4” 实用,“ 5” 价格 录入:录入的数字 5分别代表五个选项,如被调查者把质量排在第一位则在代表第一位的变量下输入“ 3“。 编码与录入(续) • 选择排序题 例 5你认为开展保持党员先进性教育活动的最重要的目标是哪三项 ,按从高到低顺序排列。 A、提高党员素质 B、加强基层组织 C、坚持发扬民主 D、激发创业热情 E、服务人民群众 F、促进各项工作 编码 :以 ABCDEF6个选项分别对应定义 6个变量,每个变量的Value都做同样的如下定义:“ 1” 未选,“ 2” 排第一,“ 3” 排第二,“ 4” 排第三。 录入 :以变量的 Value值录入。 比如三个括号里分别选的是 ECF,则该题的 6个变量的值应该分别录入: 1(代表 A选项未选)、 3(代表 C选项排在第二)、 4。 关于选择排序题的注 该方法是对多选题和排序题相结合的一种方法,对一般排序题(例 4)也同样适用,只是两者用的分析方法不同(例 4用频数分析、例 5用描述分析),输出结果从不同的侧面反映问题的重要性(前一种方法从位次看排序,后一种方法从变量的频数看排序)。 编码与录入(续) • 开放性数值题和量表题 这类题目要求被调查者自己填入数值,或者打分 例 6 你的年龄(实岁): ______ 编码 :一个变量,不定义 Value值 录入 :即录入被调查者实际填入的数值。 编码与录入(续) • 开放性文字题 如果可能的话可以按照含义相似的答案进行编码, 转换成为封闭式选项进行分析。 如果答案内容较为丰 富、不容易归类的,应对这类问题直接做定性分析。 统计分析 • 频数分析: Frequencies过程 可以做单变量的频数分布表;显示数据文件中由用户指定的变量的特定值发生的频数;获得某些描述统计量和描述数值范围的统计量。 适用范围:单选题(例 1),排序题(例 4),多选题的方法二(例 3) 频数分析也是问卷分析中最常用的方法。 实现: Descriptive statistics……Frequencies 统计分析(续) • 描述分析: Descriptives过程 可以计算单变量的描述统计量。 这些述统计量有平均值、算术和、标准差,最大值、最小值、方差、范围和平均数标准误等。 适用范围:选择并排序题(例 5)、开放性数值题(例 6)。 实现: Descriptive statistics……Descriptives ,需要的统计量点击按钮 Statistics… 中选择 . 统计分析(续) • 多重反应下的频次分析 适用范围:多选题的二分法(例 2) 实现:第一步在 Multiple Response……Define Sets 把一道多选问题中定义了的所有变量集合在一起,给新的集合变量取名,在Dichotomies Counted value中输入 1。 第二步在 Multiple Response……Frequencies 中做频数分析。 统计分析(续) • 交叉频数分析: Crosstabs过程 解决对多变量的各水平组合的频数分析的问题 适用范围:,适用于由两个或两个以上变量进行交叉分类形成的列联表,对变量之间的关联性进行分析。 比如要知道不同工作性质的人上班使用交通工具的情况,可以通过交叉分析得到一个二维频数表 ,则一目了然。 实现:第一步根据分析的目的来确定交叉分析的选项,确定控制变量和解释变量(如上例中不同工作性质的人是控制变量,使用交通工具是解释变量)。 第二步选择 Descriptive statistics……Crosstabs . 统计分析(续) • 均值的比较与检验 Means过程 对指定变量综合描述分析,分组计算计算均值再比较。 比如可以按性别变量分为男和女来研究二者收入是否存在差距。 T 检验 •独立样本 t检验用于不相关的样本是否开来自具有相同均值的总体的检验。 比如,研究购买该产品的顾客和不购买的顾客的收入是否有明显差异。 •如果样本不独立则要用配对 t检验。 比如研究参加职业培训后 工作效率是否提高。 统计分析(续) • 聚类分析 • 相关分析 • 回归分析 统计制图 • 饼图 (pie chart) • 直方图 (histogram) • 条形图 (bar chart) • 曲线图 (curve) • 面积图 (area) 202。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。