spss统计分析数据特征的描述统计分析(编辑修改稿)内容摘要:

4 5 6 女 5 Grand Total 表分为 3部分: ,按各年级算出均值; ,按各年级算出均值;。 两个分组变量的列形式报告 表 48 2020/9/16 41 第二节 描述性统计分析( Descriptive Statistics) • Frequencies 频数分析表 • Descriptive 描述性统计分析过程 • Explore 探索分析过程 • Crosstabs 列联表分析过程 2020/9/16 42 频数分析表 Ⅰ 、主要功能 可对数据按组进行归类整理,形成变量不同水平的频数分布表和图形,对数据的分布趋势进行初步分析。 Ⅱ 、频数分析 按 Analyze— Descriptive Statistic— Frequencies顺序,打开 Frequencies对话框。 2020/9/16 43 选择一个或多个变量右移入Variable(s)框。 按 Statistics按钮,打开 Statistics对话框 显示频数分布表 按 Chart按钮,打开 Chart 对话框 按 Format按钮,打开 Format 对话框 Frequences主对话框 2020/9/16 44 输出百分位数: 输出四分位数,显示25%、 50%、 75%的百分位数; 将数据平均分为所设定的相等等份,可输入 2—100 的整数,如键入 4则输出第 2 50、 75百分位数 自定义百分位数,可输入 0— 100 的整数。 输入值后: 按 Add:输入值后按此键,可反复操作键入多个百分位数; 按 Remove:删除已键入的数值 按 Change:重新输入新数 离散趋势栏 分布形状栏 在计算百分位数值和中位数时,假设数据已分组,且用各组的组中值代替各组数据 集中趋势栏 输出统计量对话框 2020/9/16 45 Chart 对话框 不输出任何图形,为默认 输出条形图,各条高度代表变量各分类的频数 输出圆图,圆图中各块的数值表示各分类变量的频数 输出直方图,此图仅适用于区间型数值变量。 选择此项后,还可选择 With normal curve,画出的直方图带有正态曲线 只有选择了条形图和圆图项才有效,决定纵轴表示的统计量 纵轴表示频数 纵轴表示百分比 2020/9/16 46 Format 对话框 控制频数表输出的分类数量。 默认为 10 多变量框中可设定多变量表格输出的格式 设置频数表输出的格式 选择频数表中排列顺序 按变量升序排列,此为默认 按变量降序排列 按变量各种取值发生的频数的升序排列 按变量各种取值发生的频数的降序排列 2020/9/16 47 表 4— 9 100名大学生血清蛋白含量( %) Ⅲ 、例题分析 042对某高校 100名大学生血清蛋白含量( g%)做频数分析,数据如表 4— 9 2020/9/16 48 ( 1)具体步骤 打开数据文件“ 大学生血清 .sav”,按 Analyze—Descriptive Statistic— Frequencies 顺序,打开Frequencies对话框。 挑 xdh变量进入 Variable(s)框,选中 Display frequency tables复选框,要求输出频数分布表。 单击 Statistics按钮,选择要输出的统计量。 单击 Chart 按钮,选择 Histogram项,输出直方图,并选择 With normal curve复选框,输出正态曲线。 单击 Format 按钮,选 Ascending项。 单击“ OK”完成。 2020/9/16 49 S t a t i s t i c sX D H1 0 007 . 3 6 5 23 . 9 4 0 E 0 27 . 3 5 0 07 . 3 5. 3 9 4 0. 1 5 5 2. 0 6 6. 2 4 1. 0 3 6. 4 7 82 . 0 06 . 4 38 . 4 37 3 6 . 5 27 . 1 2 0 07 . 3 5 0 07 . 5 8 0 0V a l i dM i s s i n gNM e a nS t d . E r r o r o f M e a nM e d i a nM o d eS t d . D e v i a t i o nV a r i a n c eS k e w n e s sS t d . E r r o r o f S k e w n e s sK u r t o s i sS t d . E r r o r o f K u r t o s i sR a n g eM i n i m u mM a x i m u mS u m255075P e r c e n t i l e sXDHXDHFrequency3020100Std. Dev = .39 Mean = N = 血清蛋白含量的直方图 血清蛋白含量的统计表 ( 2)输出结果及分析 2020/9/16 50 X D H1 1 . 0 1 . 0 1 . 02 2 . 0 2 . 0 3 . 01 1 . 0 1 . 0 4 . 04 4 . 0 4 . 0 8 . 02 2 . 0 2 . 0 1 0 . 03 3 . 0 3 . 0 1 3 . 03 3 . 0 3 . 0 1 6 . 01 1 . 0 1 . 0 1 7 . 07 7 . 0 7 . 0 2 4 . 04 4 . 0 4 . 0 2 8 . 07 7 . 0 7 . 0 3 5 . 07 7 . 0 7 . 0 4 2 . 012 1 2 . 0 1 2 . 0 5 4 . 07 7 . 0 7 . 0 6 1 . 01 1 . 0 1 . 0 6 2 . 07 7 . 0 7 . 0 6 9 . 01 1 . 0 1 . 0 7 0 . 01 1 . 0 1 . 0 7 1 . 05 5 . 0 5 . 0 7 6 . 07 7 . 0 7 . 0 8 3 . 02 2 . 0 2 . 0 8 5 . 01 1 . 0 1 . 0 8 6 . 01 1 . 0 1 . 0 8 7 . 03 3 . 0 3 . 0 9 0 . 03 3 . 0 3 . 0 9 3 . 01 1 . 0 1 . 0 9 4 . 02 2 . 0 2 . 0 9 6 . 01 1 . 0 1 . 0 9 7 . 02 2 . 0 2 . 0 9 9 . 01 1 . 0 1 . 0 1 0 0 . 01 0 0 1 0 0 . 0 1 0 0 . 06 . 4 3 0 06 . 5 0 0 06 . 7 2 0 06 . 7 3 0 06 . 8 0 0 06 . 8 8 0 06 . 9 7 0 07 . 0 3 0 07 . 0 4 0 07 . 1 2 0 07 . 2 0 0 07 . 2 7 0 07 . 3 5 0 07 . 4 3 0 07 . 4 7 0 07 . 5 0 0 07 . 5 4 0 07 . 5 6 0 07 . 5 8 0 07 . 6 5 0 07 . 7 2 0 07 . 7 6 0 07 . 8 0 0 07 . 8 8 0 07 . 9 5 0 08 . 0 3 0 08 . 0 5 0 08 . 1 2 0 08 . 1 6 0 08 . 4 3 0 0T o t a lV a l i dF r e q u e n c y P e r c e n t V a l i d P e r c e n tC u m u l a t i v eP e r c e n t血清蛋白含量的频数分布表 2020/9/16 51 Ⅰ 、主要功能 调用此过程对变量进行描述性统计分析,计算均值、标准差、全距和标准误差等,并可将原始数据转换成 Z分数。 Ⅱ 、描述统计量分析 按 Analyze / Descriptive Statistics / Descriptives顺序单击,打开 Descriptives主对话框。 如图 在左边框中选一个或多个变量移入 如选中此框,将对Variables框中选择的变量进行标准化 , 产生相应的 Z分数,并作为新变量保存到数据窗口,其变量名在原变量名前加 z。 Descriptives 对话框 描述性统计分析过程 2020/9/16 52 Options 对话框 基本统计量 当 Variables框中有多个变量时,此框确定其输出顺序: 按 Variables框中的排列顺序输出 按各变量的字母顺序输出 按均值的升序排列 按均值的降序排列 分布 Ⅲ 、例题分析 043已知 20个初生婴儿的体重数据如下表,对其进行描述统计分析。 2020/9/16 53 2770 2915 2795 2995 2860 2970 3087 3126 3125 4654 2272 3503 4218 3418 3921 2669 3707 2310 2573 3881 20个初生婴儿的体重( g) ( 1)操作步骤: 打开数据文件“婴儿体重 .sav”。 打开 Descriptives主对话框,选定变量 t进入 Variable(s)栏中。 选中 Save standardized values as variables 复选框,要求计算变量的 z值,并保存结果到当前数据集中。 单击 Options 按钮,选中 Mean、 、Minimum、 Maximum 、 Variance 项。 ( 2)输出结果及分析 2020/9/16 54 D e s c r i p t i v e S t a t i s t i c s20 2 2 7 2 . 0 0 4 6 5 4 . 0 0 3 2 3 3 . 4 5 0 0 6 5 3 . 2 3 3 520婴儿体重V a l i d N ( l i s t w i s e )N M i n i m u m M a x i m u m M e a nS t d .D e v i a t i o n婴儿体重的描述统计量 这时打开原数据集,可看到多了一列 zt, 这是 t 的 z 分数,如下图所示: 保存了 z 分数的数据集 2020/9/16 55 Ⅰ 、主要功能 调用此过程可检查数据是否有错误、考察样本分布特征及对样本分布规律作初步考察。 剔除奇异值和错误数据。 探索分析过程将提供在分组和不分组的情况下常用的统计量与图形。 Ⅱ 、探索分析 按 AnalyzeDescriptive StatisticsExplore 顺序单击,打开 Explore 主对话框,如下图: 探索分析过程 2020/9/16 56 选择一个或多个变量进入 Dependent框作为因变量,单击 OK可获得因变量的一系列基本统计量和图形。 此作为分组变量,可以是字符变量,对因变量的分析将按该变量的观测值进行分组分析。 可有多个分组变量,这时会按多个变量的交叉组合进行分组。 该框中的变量作为标识符 , 在输出诸如异常值时 ,用该变量进行标识,只允许有一个标识符。 可同时输出基本统计量和图形 只输出基本统计量 只输出图形 Explore 主对话框 2020/9/16 57 输出基本统计量 均值的置信区间,可键入 1— 99%的任意值,根据该值算出置信区间的上下限。 给出中心趋势的最大似然比的稳健估计量,当数据分布均匀,且两尾较长,或当数据中存在极端值时,可给出比均值或中位数更合理的估计。 输出最大和最小的 5个数,且在输出窗口中加以标明。 输出 5%、 10%、 25%、 50%、75%、 90%和 95%的百分位数。 Statistics对话框 2020/9/16 58 只有指定分组变量才有效,可输。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。