spss方差分析(编辑修改稿)内容摘要:
有时候还需要比较各个分组的方差是否相同,这就要进行方差齐次性检验。 例如,在进行独立右边的 T检验之前,就需要事先确定两个数据的方差是否相同。 如果通过分析发现各个方差不同,还需要对数据进行方差分析,那么就需要对数据进行转换使得方差尽可能相同。 在探索分析中可以使用 Levene检验。 Levene检验对数据进行方差齐次性检验时,不强求数据必须服从正态分布,它先计算出各个观测值减去组内均值的差,然后再通过这些差值的绝对值进行单因素方差分析。 如果得到显著性水平小于 ,那么就可以拒绝方差相同的假设。 SPSS中实现过程 研究问题 20名 10岁少儿的身高( cm)资料,数据如表 39所示,试作探索性分析。 表 39 身高数据 Id 男孩身高( cm) 女孩身高( cm) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 实现步骤 图 325 在菜单中选择“ Explore”命令 图 326 “Explore”对话框 图 327 “Explore: Statistics”对话框 图 328 “Explore: Plots”对话框 图 329 “Explore: Options”对话框 结果和讨论 在结果输出窗口中将看到如下统计数据。 ( 1)首先输出如下个案观察量摘要表,如下表所示。 ( 2)然后输出如下表格。 ( 3)接着输出如下 4个不同权重下作中心趋势的粗略最大似然确定数, ( 4)再接着输出百分位数,也是分组后的百分位数,如下表所示。 ( 5)分别输出两个组中的最大 5个数和最小 5个数,并且包括这些值对应的 ID,如下表所示。 ( 6)输出方差齐次性检验结果。 ( 7)系统还进行数据的茎叶情形描述。 图 330 男孩身高的茎叶图 图 331 女孩身高的茎叶图 ( 8)系统输出箱图,如图 332所示。 图 332 箱图 ( 9)输出 Spread vs. Level图,如图 333所示。 图 333 Spread vs. Level图 ( 10)输出身高正态概率图( Normal Plot of身高),如图 334所示。 图 334 男孩身高变量的正态概率图 图 335 女孩身高变量的正态概率图 ( 11)输出离散正态概率图( Detrended Normal Plot of身高),男孩身高如图336所示,女孩身高如图 337所示。 横坐标是身高,纵坐标是和正态分布的偏离。 图 336 男孩身高离散正态概率图 图 337 女孩身高离散正态概率图 交叉列联表分析 统计学上的定义和计算公式 定义:前面的分析都是对单个变量的数据分布情况进行分析。 但在实际分析中,还需要掌握多个变量在不同取值情况下的数据分布情况,从而进一步深入分析变量之间的相互影响和关系,这种分析就称为交叉列联表分析。 列联表的例子: 文化程度 Total 本科 专科 高中 初中 职称 高级工程师 1 1 1 3 工程师 1 3 4 助理工程师 2 1 3 6 无技术职称 3 3 Total 4 4 5 3 16 交叉列联表分析除了列出交叉分组下的频数分布外,还需要分析两个变量之间是否具有独立性或一定的相关性。 要获得变量之间的相关性,仅仅靠频数分布的数据是不够的,还需要借助一些变量间相关程度的统计量和一些非参数检验的方法。 常用的衡量变量间相关程度的统计量是简单相关系数(参见本书有关章节),但在交叉列联表分析中,由于行列变量往往不是连续变量,不符合计算简单相关系数的前提条件。 因此需要根据变量的性质,选择其他的相关系数,如Kendall等级相关系数、 Eta值等。 SPSS提供了多种适用于不同相关系数的相关关系,这些检验的零假设是:行和列变量之间彼此独立,不存在显著的相关关系。 SPSS将自动给出检验的相伴概率,如果相伴概率小于显著性水平 ,那么应拒绝零假设,认为行列变量之间彼此相关。 计算公式如下。 ( 1)卡方统计量检验是常用的检验行列变量之间是否相关的方法。 交叉列联表的卡方检验零假设是:行列变量之间独立,计算公式为 卡方统计量服从(行数 −1) (列数 −1)个自由度的卡方统计, SPSS在自动计算卡方统计量后,还会给出相应的相关概率。 ( 2) Contingency coefficient:列联系数。 用于名义变量之间的相关系数计算。 计算公式由卡方统计量修改而得,公式为 其中, N为样本系数 ( 3) Phi and Cramer‘s V: ψ 系数。 用于名义变量之间的相关系数计算。 计算公式由卡方统计量修改而得,公式为 数值界于 0~ 1之间,其中 K为行数和列数较小的实际数。 SPSS中实现过程 研究问题 用两个班级学生进行两个感冒疫苗的试验,两个班级学生患感冒结果如表 310所示,问两个班级学生的患病比例有无差别。 表 310 两班级学生的患病情况 班 级 患 病 不 患 病 1 53 20 2 40 4 实现步骤 图 338 “Weight Cases”对话框 图 339 在菜单中选择“ Crosstabs”命令 图 340 “Crosstabs”对话框 图 341 “Crosstabs: Statistics”对话框 图 342 “Crosstabs: Cell Display”对话框 图 343 “Crosstabs: Table Format”对话框 结果和讨论 ( 1)先输出如下个案处理摘要表。 ( 2)下面所示表格是 “ 班级 ” 变量和 “ 患病 ” 变量的交叉列联表结果表格。 ( 3)交叉分组下频数分布图形,如图 344所示。 ( 4)输出卡方统计结果表。 ( 5)输出相对危险度表格如下所示。 多选项分析 统计学上的定义和计算公式 定义:多选项分析是对多选项问题的分析方法。 所谓多选项问题,就是一个问题的答案都是顺序变量或名义变量,并且允许选择的答案可以有多种组合。 对于多选项问题,分解(编码方案)的方法有两种。 1.多选项二分法( Multiple Dichotomies Method) 这种方法将每个可能的答案设置为一个SPSS变量,变量的取值有两个,分别表示选中或没选中。 这种方法的缺点是需要的变量数比较多。 比如一道题目有 6个选项,则一道多选题目就需要用 6个变量来表示。 好处是比较简单。 2.多选项分类法( Multiple Category Method) 多选项分类法首先估计多选项问题可能出现的答案个数。 比如一个多选题,如果最多有3个答案,那么就设置 3个 SPSS变量,分别用来存放 3个可能的答案。 如果某个案的答案只有两个,那么第 3个 SPSS变量取值为缺失值。 采用多选项分类法,进行普通的频数分析或交叉列联表分析有时候不能达到我们的要求。 比如,我们要了解某选项的选中次数,就需要将 3个变量中该选项的次数都累加起来,而不仅仅是一个变量中该选项的累加。 针对这种情况, SPSS提供了多选项分析方法,专门针对多选项问题。 SPSS在处理的过程中会自动地将 3个变量中相同答案的频率累加起来。 SPSS中实现过程 研究问题 1 某商场对 6种品牌的电视机进行消费者满意度调查,随机调查了 20位消费者,让他们选出最满意的 3个电视机品牌,收集到相应的数据,如表 311所示。 试用多选项二分法利用SPSS对该问题进行分析,包括频数分析和交叉列联表分析。 表 311 20名消费者调查情况 ID 康 佳 长 虹 西 湖 TCL 东 芝 创 维 性 别 1 1 0 1 0 1 0 1 2 1 0 1 1 0 0 0 3 0 0 0 1 1 1 0 4 1 0 1 1 0 0 0 5 1 0 0 1 0 1 0 6 0 0 1 1 1 0 1 7 0 1 1 1 0 0 1 8 1 0 0 0 1 1 1 9 0 0 1 1 1 0 0 10 0 1 1 1 0 0 0 11 1 1 1 0 0 0 0 12 1 0 1 0 0 1 1 13 0 1 1 1 0 0 1 14 1 0 1 1 0 0 0 15 0 0 1 1 0 1 0 16 1 1 1 0 0 0 0 17 1 1 1 0 0 0 0 18 0 1 1 0 0 1 1 19 0 1 1 1 0 0 1 20 1 1 0 1 0 0 1 实现步骤 图 345 在菜单中选择“ Define Variable Sets”命令 图 346 “Define Multiple Response Sets”对话框(一) 图 347 在菜单中选择“ Frequencies”命令 图 348 “Multiple Response Frequencies”对话框(一) 图 349 “Multiple Response Crosstabs”对话框(一) 图 350 “Multiple Response Crosstabs: Define Variable”对话框 图 351 “Multiple Response Crosstabs: Options”对话框(一) 第十一章 绘制统计图 • 统计图是用点的位置、线段的升降、直条的长短或面积的大小等来表达资料的内容。 它可以把资料所反映的变化趋势、数量多少、分布状态和相互关系等形象直观地表现出来,以便于读者的阅读、比较和分析。 • 本章将介绍 SPSS在绘制常用统计图方面的功能。 由于计算机绘图具有快速、清晰、规范、可修正以保证准确无误等特点,故在论文、报告等写作中有着十分重要的应用价值。 条图 散点图 线图 直方图 饼图 面积图 箱式图 正态 图 正态 PP图 质量控制图 Pareto图 自回归曲线图 高低图 交互相关图 序列图 频谱图 误差线图 朴素的美 削尖脑袋的模样 墙上长满了爬山虎 太阳照在红墙内外 反客为主的蓝飘带 我没有放倒。 直条图 • 主要功能 • 调用 Graphs菜单的 Bar过程,可绘制直条图。 直条图用直条的长短来表示非连续性资料(该资料可以是绝对数,也可以是相对数)的数量大小。 研究血压状态与冠心病各临床型发生情况的关系,分析资料如下所示,试绘制统计图。 血压状态 年龄标化发生率( 1/10万) 冠状动脉机能不全 猝死 心绞痛 心肌梗塞 正常 临界 异常 • ,定义变量名:年龄标化发生率为 RATE,冠心病临床型为 DISEASE,血压状态为 BP。 RATE按原数据输入, DISEASE按冠状动脉机能不全 =猝死 =心绞痛 =心肌梗塞 =4输入, BP按正常 =临界 =异常=3输入。 • 选 Graphs菜单的 Bar...过程,弹出 Bar Chart定义选项框。 在定义选项框的下方有一数据类型栏,系统提供 3种数据类型: • Summaries for groups of cases:以组为单位体现数据; • Summaries of separate variables:以变量为单位体现数据; • Values of individual cases:以观察样例为单位体现数据。 • 大多数情形下,统计图都是以组为单位的形式来体现数据的。 在定义选项框的上方有 3种直条图可选: Simple为单一直条图、 Clustered为复式直条图、 Stacked为堆积式直条图,本例选复式直条图。 • 点击 Define钮,弹出 Define Clustered Bar:Summaries for Groups of Cases对话框,在左侧的。spss方差分析(编辑修改稿)
相关推荐
临时召开质量分析会,进行工程质量,进度等,情况检查,并做好记录,会后及时地把会议纪要分 发给有关人员。 验收制度 由业主、有关专家组成验收小组,由验收组长把验收结果填入工程报验单并签字,其他验收人员在此报验单上签名。 项目组工作制度 必须按时上下班,有事必须向项目副经理请假,如果项目经理有事不在时,可向项目副经理请假。 遇到原则性问题必须及时向上一级领导汇报,并写出相关的书面材料
随机设计 • 用三种药物杀灭钉螺,每批用 200只活钉螺,用药后清点每批钉螺的死亡数、再计算死亡率( %)。 问三种药物杀灭钉螺的效果有无差别。 例题-完全随机设计(等级) • 四种疾病患者痰液内嗜酸性白细胞的检查结果。 问四种疾病患者痰液内的嗜酸性白细胞有无差别。 随机区组设计资料的非参数检验 • 这一部分的内容相当于参数检验中的方差分析,依据的方法是 Friedman秩和检验
体重对表面积可能有影响,在某地测量了男女各 15名初生至 3 周岁儿童的身高、体重 和体表面积, 得到 测量 数据 如表 所示。 表 3 周岁男女儿童的身高、体重和体表面积 男( male) 女( female) 身高( x1) 体重( x2) 表面积( y) 身高( x1) 体重( x2) 表面积( y) The SAS System Dependent Variable: Y
现状 LED 是具有二极管特性的发光管 [3], 它只能单方向通电。 额定工作点附近,通常 LED 亮度输出与通过 LED 电流成正比 , 但在大电流下会出现饱和现象 , 发光效率大幅度降低 , 甚至失效 , 因此 LED 使用电流不能超过其规格额定值。 另外 ,LED 亮度输出与温度成反比 , 所以使用中应尽量减少电源发热和设计良好的散热系统。 LED 驱动电源的 分类 LED
种: FORWARD(或 F),按照规定的 P值 SLE从无到有依次选一个变量进入模型; BACKWARD,按照规定的 P值 SLS从含有全部变量的模型开始,依次剔除一个变量; STEPWISE,按照 SLE的标准依次选入变量,同时对模型中现有的变量按 SLS的标准剔除不显著的变量; SCORE,采用最优子集选择法。 其中, SLE选择项用于指定协变量进入模型的显著水平,
雨天,美伢抱着小白,拖着一双漂亮的拖鞋,正要横穿泥泞不堪的马路。 忽然,一辆出租汽车匆匆而来。 “等一下。 ”美伢朝司机挥手道。 “去哪儿啊。 ”司机殷勤地问道。 “去对面。 ” “啊„„”(感谢冰雪玫瑰的推荐)有点后悔 儿子问妈妈:“妈妈,你和爸爸是怎么认识的。 ” “有一回我掉再水里差点儿淹死了, 幸而有一位年轻的男子急忙跳进水中救了我。 那个年轻的男子年轻的男子就是爸爸。 过了两个月