spss统计分析数据文件的建立和管理(编辑修改稿)内容摘要:
不等于)、 =、 =。 ( nl35) ( 2)复合条件表达式 又称逻辑表达式,是由逻辑运算符号、圆括号和简单条件表达式等组成的式子。 其中,逻辑运算符号包括 amp。 或 AND(并且)、 |或 OR(或者)、~或 NOT(非)。 NOT的运算优先级最高,其次是 AND,最低是 OR。 可以通过圆括号改变运算的优先级。 ( nl=35) and not ( zc3) 2020/9/15 66 SPSS函数 是事先编好并存储在 SPSS软件中,能够实现某些特定计算任务的一段计算机程序。 这些程序都有各自的名字称为函数名。 执行这些程序段得到的计算结果称为 函数值。 函数书写的具体形式为: 函数名(参数) 2020/9/15 67 其中,函数名是 SPSS已经规定好的,参数可以是常量(字符型常量应用引号括起来),也可以是变量或算术表达式。 参数可能是一个,也可能是多个 ,各参数之间用 逗号 分隔。 SPSS函数大致可以分成八大类: 算术函数、统计函数、分布函数、逻辑函数、字符串函数、缺失值函数、日期函数和其他函数。 2020/9/15 68 ( 1)选择菜单 Transform- Compute,弹出Compute Variable对话框如下: 2020/9/15 69 ( 2)在 Target框中输入存放计算结果的变量名。 该变量可以是一个新变量,也可以是已经存在的变量。 如果指定存放计算结果的变量为新变量, SPSS会自动创建它;如果指定产生的变量已经存在, SPSS会提问是否以计算结果覆盖原有值。 新的变量默认为数值型,用户可以根据需要单击 Typeamp。 Label按钮修改,还可以对新变量加变量名标签。 ( 3)在 Numeric Expression框给出 SPSS算术表达式。 可以手工输入,也可以按窗口的按钮以及函数下拉菜单输入。 2020/9/15 70 ( 4)如果希望对符合一定条件的个案进行变量计算,则单击 If按钮,出现下面的窗口,选择 Include if case satisfies condition选项,然后输入条件表达式。 对不满足条件的个案,将不进行变量值计算,对新变量取值为系统缺失值。 2020/9/15 71 利用职工基本情况数据,依据职称级别计算实发工资,再按职称 1至 4将实发工资分别上调 50%, 30%, 20%, 10%。 032 变量计算的应用举例 2020/9/15 72 第三节 数据选取 数据选取就是根据分析的需要,从已收集到的大批量数据(总体)中按照一定的规则抽取部分数据(样本)参与分析的过程,通常也称为 抽样。 SPSS可根据指定的抽样方法从数据编辑窗口中选出部分样本以实现数据选取,这样 后面的分析操作就只针对选出的数据 ,直到用户取消这种选取为止。 2020/9/15 73 ( 1)选取全部数据 ( All cases) ( 2)按指定条件选取 ( If condition is satisfied ) SPSS要求用户以条件表达式给出数据选取的条件, SPSS将自动对数据编辑窗口中的所有个案进行条件判断。 那些满足条件的个案,即条件判断为真的个案将被自动选取出来,而那些条件判断为假的个案则不被选中。 1. 数据选取的基本方式 2020/9/15 74 ( 3)随机抽样 ( Random sample of cases ),即对数据编辑窗口中的所有个案进行随机筛选,包括如下两种方式: 第一,近似抽样 ( Approximately) 近似抽样要求用户给出一个百分比数值, SPSS将按照这个比例自动从数据编辑窗口中随机抽取相应百分比数目的个案。 注:由于 SPSS在样本抽样方面的技术特点,抽取出的个案总数不一定恰好精确地等于用户指定的百分比数目,会有小的偏差,因而称为近似抽样。 2020/9/15 75 第二,精确抽样 ( Exactly) 精确抽样要求用户给出两个参数。 第一个参数是希望选取的个案数,第二个参数是指定在前几个个案中选取。 SPSS自动在数据编辑窗口的前若干个个案中随机精确地抽出相应个数的个案来。 2020/9/15 76 ( 4)选取某一区域内的样本 ( Based on time or case range ),即选取数据编辑窗口中样本号在指定范围内的所有个案,要求给出这个范围的上、下界个案号码。 这种抽样方法适用于时间序列数据。 ( 5)通过过滤变量选取样本 ( Use filter variable ),即依据过滤变量的取值进行样本选取。 要求指定一个变量作为过滤变量,变量值为非 0或非系统缺失值的个案将被选中。 这种方法通常用于排除包含系统缺失值的个案。 2020/9/15 77 说明: ( 1)完成数据选取后, SPSS以后的分析操作仅针对那些被选中的个案,直到用户再次改变数据的选取为止。 ( 2)采用指定条件选取和随机抽样方法进行数据选取后, SPSS将在数据编辑窗口中自动生成一个名为 filter_$的新变量,取值为 1或 0。 1表示本个案被选中, 0表示未被选中。 该变量是 SPSS产生的中间变量,如果删除它则自动取消样本抽样。 2020/9/15 78 ( 1)选择菜单 Data— Select cases ( 2)根据分析需要选择数据选取方法 ( 3) Unselected cases are指定对未选中个案的处理方式 • Filtered表示在未被选中的个案号码上打一个 “ /”标记; • Deleted表示将未被选中的个案从数据编辑窗口中删除。 2. 数据选取的基本操作 2020/9/15 79 Select Cases对话框 2020/9/15 80 利用 [02- 1]居民储蓄调查数据 ,根据不同的分析要求采用不同的数据选取方法抽样: ( 1)如果只希望分析城镇储户的情况,可以通过数据选择功能采用指定条件的抽样方法进行抽样; ( 2)如果只希望对其中的 70%的数据进行分析,可通过数据选择功能采用随机抽样中的近似抽样方法进行抽样。 数据选取的应用举例 2020/9/15 81 第四节 计数 1. 计数目的 SPSS实现的计数是对所有个案或满足某条件的部分个案, 计算若干变量中有几个变量的值落在指定的区间内 ,并将计数结果存入一个新变量中的过程。 例如对大学毕业班学生的成绩进行综合测评时,可以依次计算每个学生的若干门课程中有几门课程得了优,有几门课程得了良,有几门课程不及格。 SPSS实现计数的关键步骤是: • 指定哪些变量参与计数,计数的结果存入哪个新变量中 • 指定计数区间(尤为关键) 2020/9/15 82 SPSS中的计数区间可以有以下几种描述形式: 单个变量值( Value) 系统缺失值( Systemmissing) 系统缺失值或用户缺失值( System or usermissing) 给定最大值和最小值的区间( n through m) 小于等于某指定值的区间( Lowest through n) 大于等于某指定值的区间( n through highest) 2. 计数区间 2020/9/15 83 上述后三个计数区间很容易理解。 例如 评价学生成绩,成绩为优的计数区间可以指定为90 through highest,成绩为良的计数区间指定为 80 through 89,不及格的计数区间指定为Lowest through 59。 前三个计数区间实际上是一些离散的数据点,严格讲并不是区间,但 SPSS仍将其归在广义区间的范畴内,目的是方便一些其他的应用。 2020/9/15 84 ( 1)选择菜单 Transform- Count,出现如下窗口: 3. 计数的基本操作 2020/9/15 85 ( 2)将参与计数的变量选到 Variables框中 ( 3)在 Target Variable框中输入存放计数结果的变量名,并在 Target Label框中输入相应的变量名标签 ( 4)单击 Define Values按钮定义计数区间,出现如下图窗口: 2020/9/15 86 通过单击 Add、 Change、 Remove按钮完成计数区间的增加、修改和删除。 2020/9/15 87 ( 5)如果仅希望对满足某条件的个案进行计数,则单击 If按钮并输入相应的 SPSS条件表达式。 否则,本步可略去。 2020/9/15 88 利用 [021]居民储蓄调查数据 分析储户收入的总体状况。 我们认为如果储户收入今年比去年增加了,且认为今后收入仍会增加,则认为收入状况较好。 试分析有多少个储户的收入状况较好。 计数的应用举例 2020/9/15 89 第五节 分类汇总 1. 分类汇总的目的 分类汇总 是按照某分类变量进行分类汇总计算。 例如:某企业希望了解本企业不同学历职工的基本工资上是否存在较大差距。 最简单的做法就是分类汇总,即将职工按学历进行分类,分别计算不同学历职工的平均工资,然后可对平均工资进行比较。 2020/9/15 90 再例如,某商厦希望分析假日周内不同职业和不同年龄段的顾客对某商品的 “ 打折促销 ” 反应是否存在较大差异,用以分析不同消费群体的消费心理。 最初步的分析可以是分别计算不同职业中不同年龄段顾客的平均消费金额和平均消费金额差异程度(标准差),并对它们进行比较。 这个过程也可以通过分类汇总过程完成。 2020/9/15 91 SPSS实现分类汇总涉及两个主要方面: 按照哪个变量(如上例中的学历、职业和年龄段)进行分类 对哪个变量(如上例中的基本工资、消费金额)进行汇总,并指定对汇总变量计算哪些统计量(如上例中的平均工资、平均消费金额和标准差) 2020/9/15 92 ( 1)选择菜单 Data- Aggregate,出现如下所示的窗口: 2. 分类汇总的基本操作 2020/9/15 93 ( 2)将分类变量选到 Break Variable(s)框中 ( 3)将汇总变量选到 Summaries of Variable(s)框中 ( 4)单击 Function按钮, 指定对汇总变量计算哪些统计量。 SPSS默认计算均值。 2020/9/15 94 ( 5)指定将分类汇总结果保存到何处。 有三种选择: 第一, Add Aggregated Variables to working data file, 表示将结果存放到当前数据编辑窗口中。 第二, Create new data file,表示将结果存放到一个新建立的 SPSS数据文件中,可以单击File按钮,重新指定文件名; 第三, Replace working data file,表示用分类汇总结果覆盖数据编辑窗口中的数据。 一般选择第二种方式,结果比较清晰。 2020/9/15 95 ( 6)单击 Nameamp。 Label按钮,重新指定结果文件中的变量名或添加变量名标签。 SPSS默认的变量名为原变量名后加 _统计量名称(如 a_mean)。 ( 7)如果希望在结果文件中保存各分类组的个案数,则选择 Number of case选项。 于是, SPSS会在结果文件中自动生成一个默认名为 N_Break的变量,可以修改该变量名。 2020/9/15 96 说明: 分类汇总中的分类变量可以是多个,此时的分类汇总称为 多重分类汇总。 如上述不同职业和不同年龄段顾客消费的例子即是多重分类汇总的应用。 类似于数据的排序,在多重分类汇总中,指定多个分类变量的前后次序是很关键的。 第一个指定的分类变量为 主分类变量 (如职业),其他的依次为第二(如年龄段)、第三分类变量等,它们决定了分类汇总的先后次序。 2020/9/15 97 例:利用 021居民储蓄调查数据 ,分析城镇储户和农村储户的一次平均存(取)款金额是否有显著的差异。 可进行的最初步的分析是按照户口类型对存(取)款金额进行分类汇总。 其中分类变量是户口,汇总变量是存(取)款金额,且计算其均值。 分类汇总的应用举例 2020/9/15 98 第六节 数据分组 1. 数据分组的方法 数据分组就是根据统计研究的需要,将数据按照某种标准重新划分为不同的组别。 在数据分组的基础上进行的频数分析更能够概括和体现数据的分布特征。spss统计分析数据文件的建立和管理(编辑修改稿)
相关推荐
的表格输出时的外观样式 调整要点表列宽栏 列宽调整为标签列宽 列宽调整为标签列宽 和数据值列宽中较大的一个。 默认编辑模式栏 Edit all tables in viewer:控制在观察窗口中的要点表或一个单独窗口的激活 Edit only small tables in viewer:在观察窗口仅能编辑小的要点表 Edit small and medium tables in viewer
的合并:一是横向合并,从外部文件中增加变量到当前数据文件中;二是纵向合并,指从外部数据文件中增加观测量到当前数据文件中。 V1 V2 V3 V4 + V1 V2 V3 V4 V1 V2 V1 V2 + V1 V2 横向合并 纵向合并 SPSS 19统计分析使用教程 电子工业出版社 28 SPSS数据文件的 编辑 数据文件的合并 ( 1)横向合并 单击“浏览”按钮选择要合并的
,科学出 版社, 2020年版, 28元。 推荐的参考书: 卢纹岱: 《 SPSS FOR WINDOWS 统计分析 》 (第 2版),电子工业出版社, 2020年版,49元。 推荐的参考书: 张文彤: 《 SPSS11统计分析教程(高级篇) 》 , 北京希望电子出版社,2020年版, 40元。 SPSS 16实用教程 第 1章 SPSS简介 SPSS的发展 SPSS的版本 SPSS的运行方式
项组中,用户需要选择待检验的理论分布。 系统提供了四种统计中常见的分布。 • Step04: 选择计算精确概率 【 Exact】 按钮用于选择计算概率 P值的方法,它的功能和卡方检验中相关按钮是相同的。 • Step05: 其他选项选择 【 Options】 按钮用于指定输出内容和关于缺失值的处理方法。 • Step06: 单击 【 OK】 按钮,结束操作, SPSS软件自动输出结果。 实例分析
方差分析就是从观测变量的方差入手,研究诸多控制变量中哪些变量是对观测变量有显著影响的变量以及对观测变量有显著影响的各个控制变量其不同水平以及各水平的交互搭配是如何影响观测变量的一种分析方法。 2020/9/15 39 三、方差分析的原理 方差分析认为,如果控制变量的不同水平对观测变量产生了显著影响,那么它和随机变量共同作用必然使得观测变量值显著变动;反之
小 结 因子分析是由 Charles Spearman在 1904年首次提出,其在某种程度上可以被看成是主成分分析的推广和扩展。 因子分析就是用少量几个因子来描述许多指标或因素之间的联系,以较少的几个因子反应原资料的大部分信息的统计方法。 小 结 因子分析有两个核心问题:一是如何构造变量,二是如何对因子变量命名解释。 因子分析的基本步骤有四步:( 1)确定带分析的原有若干变量是否适于因子分析;(