spss的非参数检验(编辑修改稿)内容摘要:
项组中,用户需要选择待检验的理论分布。 系统提供了四种统计中常见的分布。 • Step04: 选择计算精确概率 【 Exact】 按钮用于选择计算概率 P值的方法,它的功能和卡方检验中相关按钮是相同的。 • Step05: 其他选项选择 【 Options】 按钮用于指定输出内容和关于缺失值的处理方法。 • Step06: 单击 【 OK】 按钮,结束操作, SPSS软件自动输出结果。 实例分析:商品销售收益的分布 • 1 .实例内容 零售商希望了解某商品销售收益( Revenue)的大致分布情况。 依据其他销售商已有的资料,他认为其销售收益可能服从正态分布。 为了检验其假设,考虑是否与其他零售商一样,销售收益服从正态分布,收集到相关的销售收益数据,请使用 SPSS软件分析样本数据是否服从正态分布。 2 .实例操作 本案例的目的就是要检验文件 “ revenue”变量是否服从正态部分,因此可以采用非参数 KS检验来判断。 首先,通过描述性统计功能绘制了 “ revenue”变量的直方图及其拟合的正态曲线,具体见图 619。 从图形特征看到, “ revenue”变量的分布非常接近正态分布,但需要采用 KS检验来诊断。 Step01:打开对话框 打开数据文件 ,选择菜单栏中的 【 Analyze(分析 )】 → 【 Nonparametric Tests(非参数检验 )】 → 【 Legacy Dialogs(旧对话框 )】 → 【 1samples KS(1样本 KS(1))】 命令,弹出如下图所示的对话框。 Step02:选择检验变量 在候选变量列表框中选择 “ revenue”变量作为检验变量,将其添加至 【 Test Variable List(检验变量列表 )】 列表框中。 提示:可以在 【 Test Distribution(检验分布 )】 选项组中选择检验分布类型;系统默认为正态分布。 Step03:确定断点 单击 【 Options】 按钮,在弹出的对话框的 【 Statistics(统计量 )】选项组中勾选 【 Descriptive(描述性 )】 和 【 Quartiles(四分位数 )】 复选框,表示输出基本统计量。 单击 【 Continue】 按钮返回主对话框。 Step04:完成操作 最后,单击 【 OK(确定 )】 按钮,操作完成。 3. 实例结果及分析 ( 1)描述性统计量输出 SPSS首先给出了 “ revenue”变量的基本统计量。 样本总数 N等于 1488,收益均值等于 $2,,收益标准差等于 $,收益最小值和最大值分别是 $13和 $6,213,收益 25%、 50%和 75%的分位数是 $1,、 $2, $3,。 N Mean Std. Deviation Minimum Maximum Percentiles 25th 50th (Median) 75th Revenue 1488 $2, $ $13 $6,213 $1, $2, $3, ( 2) KS检验结果表 给出了原假设:销售收益服从均值为 、标准差为 正态分布。 给出了 KS检验关键结果:实际分布和检验分布之间的正向最大频数差为 ,负向最大频数差为 ,因此用于计算统计量的绝对值最大频数差为。 随后的 KS统计量 Z值等于 ,相应的概率 P值为 ,大于显著性水平。 所以接受零假设,认为该厂商的销售收益服从正态分布。 Revenue N 1488 Normal Parametersa Mean $2, Std. Deviation $ Most Extreme Differences Absolute Positive Negative KolmogorovSmirnov Z Asymp. Sig. (2tailed) PP图 除了采用上述非参数 KS检验来判断单样本的分布外,还可以利用 PP图和 图直观判别样本的分布。 选择菜单栏中的 【 Analyze(分析 )】 → 【 Descriptive Statistics(描述统计 )】 → 【 PP Plots(PP图 )】 命令,即可生成 PP图。 1 . 00 . 80 . 60 . 40 . 20 . 0O b s e r v e d C u m P r o b1 . 00 . 80 . 60 . 40 . 20 . 0Expected Cum ProbN o r m a l P P P l o t o f R e v e n u e SPSS在两独立样本非参数检验中的应用 两独立样本非参数检验的方法原理 两独立样本的非参数检验是在对总体分布不甚了解的情况下,通过分析样本数据,推断样本来自的两个独立总体的分布是否存在显著差异。 这种检验方法一般通过独立总体的均值或中位数是否存在显著差异来推断。 关于样本之间是否独立,主要看在一个总体中抽取样本对在另一个总体中抽取样本有无影响。 如果没有影响,则可以认为这两个总体是独立的。 SPSS提供了四种相关的非参数检验方法: 曼 惠特尼 U检验、 KS检验、极端反应检验、游程检验。 两独立样本非参数检 验的 SPSS操作详解 • Step01: 打开主菜单 选择菜单栏中的 【 Analyze(分析 )】 → 【 Nonparametric Tests(非参数检验 )】 → 【 Legacy Dialogs(旧对话框 )】 → 【 2 Independent Samples(2个独立样本 )】 命令,弹出 【 TwoIndependentSamples Tests(两个独立样本检验 )】 对话框。 • Step02: 选择检验变量 在 【 TwoIndependentSamples Tests(两个独立样本检验 )】 对话框左侧的候选变量列表框中选择一个或几个变量,将其添加至 【 Test Variable List(检验变量列表 )】 列表框中,这里表示需要进行两独立样本检验的变量。 • Step03: 选择分组变量 在 【 TwoIndependentSamples Tests(两个独立样本检验 )】 对话框左侧的候选变量中选择分组变量,将其添加至 【 Grouping Variable(s)(分组变量 )】 文本框中,目的是要区分检验变量的不同组别。 单击 【 Grouping Variables】 按钮,在弹出的对话框的 【 Group1(组 1)】 和【 Group2(组 2)】 文本框中分别输入整数值,这两个值确定的分组将选择的检验变量的观测值分为两组或者分成两个样本,并将检验变量的其他数值排除在检验分析之外。 设置完成后,单击 【 Continue】 按钮,返回主对话框。 • Step04: 选择检验方法 在 【 Test Type(检验类型 )】 选项组中,用户需要选择两独立样本检验的方法。 系统提供了四种常用方法: MannWhitney U(曼 惠特尼 U检验 )、 KolmogorovSmirnov Z(KS检验 )、 Moses Extreme Reactions(极端反应检验 )和WaldWolfwitz Runs(游程检验 )。 • Step05: 选择计算精确概率 【 Exact】 按钮用于选择计算概率 P值的方法。 • Step06: 其他选项选择 【 Options】 按钮用于指定输出内容和关于缺失值的处理方法。 • Step07:单击 【 OK】 按钮,结束操作, SPSS软件自动输出结果。 实例图文分析:日本和 美国公司的市盈率 • 1. 实例内容 一个公司的市盈率是指这家公司股票的当前价格除以最近 12个月的每股收益。 下 表 列出了 10家日本公司和 12家美国公司的市盈率,这两个国家公司的市盈率之间是否存在显著差异。 日本 美国 公司 市盈率 公司 市盈率 Sumitomo Corp. Kinden Heiwa NCP Japan Suzuki Motor Fuji Bank Sumitomo Chemical Seibu Railway Shiseido Todo Gas 153 21 18 125 31 213 64 666 33 68 Gan Motorola Schlumberger Oracle Systems Gap WinnDixie IngersollRand American Electric Power Hercules Times Mirror WellPoint Health Northern States Power 19 24 24 43 22 14 21 14 21 38 15 14 2. 实例操作 本案例的目的就是要检验日本和美国公司的市盈率是否有显著差异。 由于这里样本量较少,难以确定这两个总体的分布,因此可以引入非参数的检验方法。 由于讨论的两个样本相互独立,故引入两独立样本非参数检验方法。 于是建立如下假设检验。 H0 : 日本公司和美国公司的市盈率没有显著差异。 H1 : 日本公司和美国公司的市盈率存在显著差异。 主要是比较日本和美国公司的平均市盈率是否相同,所以采用曼 惠特尼 U检验方法。 • Step01: 打开对话框 打开数据文件 ,选择菜单栏中的 【 Analyze(分析 )】 → 【 Nonparametric Tests(非参数检验 )】 → 【 Legacy Dialogs(旧对话框 )】 → 【 2 Independent Samples(2个独立样本 )】 命令,弹出如下图所示的对话框。 • Step02: 选择检验变量 在左侧的候选变量列表框中选择 “ PE”变量作为检验变量,将其添加至 【 Test Variable List(检验变量列表 )】 列表框中。 • Step03: 选择分组变量 选择分组变量 x, 将其添加至 【 Grouping Variable(s)(分组变量 )】 文本框中。 • Step04: 确定分组标号 单击 【 Grouping Variables】 按钮,弹出相应对话框,在 【 Group1(组 1)】 文本框中输入 “ 1”,在 【 Group2(组 2)】文本框中输入 “ 2”,分别表示分组的标号。 输入完成后,单击 【 Continue】 按钮返回主对话框。 • Step05: 完成操作 最后,单击 【 OK(确定 )】 按钮,操作完成。 3. 实例结果及分析 ( 1)描述性统计量 N Mean Std. Deviation Minimum Maximum Percentiles 25th 50th (Median) 75th 市盈率 22 国家 22 .50965 3. 实例结果及分析 ( 2) 曼 惠特尼 U检验的秩统计表 国家 N Mean Rank Sum of Ranks 市盈率 日本 10 美国 12 Total 22 3. 实例结果及分析 ( 3) 曼 惠特尼 U检验结果表 市盈率 MannWhitney U Wilcoxon W Z Asymp. Sig. (2tailed) Exact Sig. [2*(1tailed Sig.)] SPSS在多独立样本 非参数检验中的应用 多独立样本非参数检验的基本原理 多独立样本的非参数检验是通过分析多组独立样本数据,推断样本来自的多个总体的分布是否存在显著差异。 这里样本间的独立是指在一个总体中抽取样本对在其他总体中抽取样本无影响。 SPSS提供的多独立样本非参数检验的方法主要包括:KruskalWallis H检验、中位数检验( Median检验、 JoneckheereTerpstra检验。 多独立样本非参数检验 的 SPSS操作详解 • Step01: 打开对话框 选择菜单栏中的 【 Analyze(分析 )】 → 【 Nonparametric Tests(非参数检验 )】 → 【 Legacy Dialogs(旧对话框 )】 → 【 K Independ。spss的非参数检验(编辑修改稿)
相关推荐
不等于)、 =、 =。 ( nl35) ( 2)复合条件表达式 又称逻辑表达式,是由逻辑运算符号、圆括号和简单条件表达式等组成的式子。 其中,逻辑运算符号包括 amp。 或 AND(并且)、 |或 OR(或者)、~或 NOT(非)。 NOT的运算优先级最高,其次是 AND,最低是 OR。 可以通过圆括号改变运算的优先级。 ( nl=35) and not ( zc3) 2020/9/15 66
的表格输出时的外观样式 调整要点表列宽栏 列宽调整为标签列宽 列宽调整为标签列宽 和数据值列宽中较大的一个。 默认编辑模式栏 Edit all tables in viewer:控制在观察窗口中的要点表或一个单独窗口的激活 Edit only small tables in viewer:在观察窗口仅能编辑小的要点表 Edit small and medium tables in viewer
的合并:一是横向合并,从外部文件中增加变量到当前数据文件中;二是纵向合并,指从外部数据文件中增加观测量到当前数据文件中。 V1 V2 V3 V4 + V1 V2 V3 V4 V1 V2 V1 V2 + V1 V2 横向合并 纵向合并 SPSS 19统计分析使用教程 电子工业出版社 28 SPSS数据文件的 编辑 数据文件的合并 ( 1)横向合并 单击“浏览”按钮选择要合并的
方差分析就是从观测变量的方差入手,研究诸多控制变量中哪些变量是对观测变量有显著影响的变量以及对观测变量有显著影响的各个控制变量其不同水平以及各水平的交互搭配是如何影响观测变量的一种分析方法。 2020/9/15 39 三、方差分析的原理 方差分析认为,如果控制变量的不同水平对观测变量产生了显著影响,那么它和随机变量共同作用必然使得观测变量值显著变动;反之
小 结 因子分析是由 Charles Spearman在 1904年首次提出,其在某种程度上可以被看成是主成分分析的推广和扩展。 因子分析就是用少量几个因子来描述许多指标或因素之间的联系,以较少的几个因子反应原资料的大部分信息的统计方法。 小 结 因子分析有两个核心问题:一是如何构造变量,二是如何对因子变量命名解释。 因子分析的基本步骤有四步:( 1)确定带分析的原有若干变量是否适于因子分析;(
前数据编辑窗口的右边,然后将合并后的数据文件显示在数据编辑窗口中。 横向合并实质是将两个数据文件,按照个案对应进行左右对接。 横向合并数据文件 • 如果两个文件 个案个数 不同,那么个案少的文件的合并后会在新文件中相应的个案处出现系统 缺失值 ; • 注意,必须要有一个相同名称的变量名,为合并的 关键变量 ,事先按照关键变量升序排序,含义不同的变量项,不要用相同的变量名。 操作步骤: