spss变量数据文件系统参数应用(编辑修改稿)内容摘要:

合并实质是将两个数据文件,按照个案对应进行左右对接。 横向合并数据文件 • 如果两个文件 个案个数 不同,那么个案少的文件的合并后会在新文件中相应的个案处出现系统 缺失值 ; • 注意,必须要有一个相同名称的变量名,为合并的 关键变量 ,事先按照关键变量升序排序,含义不同的变量项,不要用相同的变量名。 操作步骤: Data菜单 选择参数 Add Variable 菜单 打开要合并 的文件 Merge File 菜单 打开原文件 关于参数选择: • New Working Data File 中显示两个文件中全部变量,可以剔出到 Excluded Variable; • 检查个案是不是按顺序一一对应的; • 选择用来合并的 关键变量 ; Match cases on key variables in sorted files 选项 ; • 指定合并数据方式:三种供选择; • 可以将来源保存为一个变量: Indicate case source as variable。 实现数据文件的横向连接,必须有一个相同的公共变量,这个变量是两个数据文件横向对应连接的依据。 在合并的两个数据文件中,数据含义不同的变量,变量名不应取相同的名称。 图 242 数据文件横向合并窗口 数据文件的分组( Split) 在统计中,经常需要先按某个变量进行分组,然后再求各个组的统计分析。 例如,想分别了解男生和女生的成绩情况。 这时就需要按照性别变量,进行数据文件的分组(这种分组是系统内定义的,在数据管理器中并不一定明确体现,故亦可称之为分割)。 用户一旦设置了分组,那么此后的所有分析都将按这种分组进行,除非取消数据分组的命令。 图 243 “ Split File” (分组设置)对话框 图 244 分组统计结果 读入其他格式文件数据 在前面的数据保存中,已经讲到 SPSS数据文件可以保存成其他格式的文件,如文本文件、dbf文件等。 反过来, SPSS是否可以直接读取其他格式数据文件呢。 答案是肯定的。 SPSS可以读取文本文件、数据库文件等内容。 读取固定格式的文本文件 文本文件是计算机各种软件中最通用的一种格式文件。 文本文件没有保存格式,因此,其文件很小,其中的数据均以 ASCII码存储。 各种软件,包括数据库软件、表格操作软件、字处理软件都可以将自己的格式数据转换成文本文件。 因此,如果 SPSS能够方便读取文本文件,那么就提高了读取其他软件数据的能力。 根据文本文件中数据的排列方式,可将文本件分成固定格式的文本文件和自由格式的文本文件两种。 固定格式( Fixed Columns)的文本文件,要求每个个案数据的变量数目、排列顺序、变量取值长度固定不变,一个个案数据可以占若干行,数据项之间可以有分隔符,也可以没有。 分隔符一般为逗号、空格等。 图 245 在菜单中选择“ Read Text Data” 命令 图 246 “ 文本文件导入向导 1” 对话框(一) 图 247 “ 文本文件导入向导 2” 对话框(一) 图 248 “ 文本文件导入向导 3” 对话框(一) 图 249 “ 文本文件导入向导 4” 对话框(一) 图 250 “ 文本文件导入向导 5” 对话框(一) 图 251 “ 文本文件导入向导 6” 对话框 读取自由格式的文本文件 自由格式的文本文件( Free Field)每个个案的变量数目、排列顺序固定,一个案数据可以占据若干行,和固定格式文本文件不同的是,自由格式文本文件的数据项之间必须有分隔符(分隔符可以是逗号、空格、 Tab键等),但数据项的长度可以变化。 图 252 “ 文本文件导入向导 1” 对话框(二) 图 253 “ 文本文件导入向导 2” 对话框(二) 图 254 “ 文本文件导入向导 3” 对话框(二) 图 255 “ 文本文件导入向导 4” 对话框(二) 图 256 “ 文本文件导入向导 5” 对话框(二) 读取 dBASE软件文件( .dbf) dBASE数据库软件的文件以 .dbf为扩展名保存。 该文件除了保存纯数据信息外,还保存了一些数据结构、属性方面的信息。 SPSS提供了与 DBASE文件的接口,可以方便地将 dBASE文件读入数据编辑窗口。 具体的操作过程如下。 图 257 打开 dBASE数据文件 读取 Excel软件文件( .xls) Excel软件可能是 Windows系列操作系统中使用最多的数据表格软件。 Excel文件以 .xls为扩展名保存。 该文件除了保存纯数据信息外,还保存了另外一些数据信息。 SPSS提供了与 Excel文件的接口,可以方便地将 Excel文件读入数据编辑窗口。 具体的操作过程如下。 图 258 读取 Excel文件 图 259 “ Opening Excel Data Source” 对话框 SPSS默认将某个 sheet中所有数据都读入到数据编辑窗口中。 在 “ Range” 框中输入要读取数据的范围,也允许指定读取一部分区域的数据,如要读入前 50行数据,则在该框中输入 A1:F50,表示读取的区域是以 A1单元为左上角, F50为右下角的矩形区域。 Excel表格中每一行为 SPSS的一个个案。 单击 “ Continue” 按钮,即可完成数据导入。 读取数据库文件 SPSS还提供了读取 Access及 FoxPro等数据库文件的功能。 图 260 在菜单中选择“ New Query” 命令 图 261 “ Database Wizard” 向导对话框 1 图 262 文本文件选择对话框 图 263 “ Database Wizard” 向导对话框 2 图 264 “ Database Wizard” 向导对话框 3 图 265 关系指定 图 266 “ Database Wizard” 向导对话框 4 图 267 “ Database Wizard” 向导对话框 5 图 268 “ Database Wizard” 向导对话框 6 SPSS运行环境设置 SPSS状态栏的显示和隐藏 数据编辑窗口最下面的状态栏用来显示SPSS当前的运行状态。 当 SPSS等待用户操作时,会显示 “ SPSS Processor is ready” 的提示信息,如图 269所示。 图 269 状态栏 状态栏 状态栏 子菜单 状态栏的显示或隐藏可以通过 “ View” 菜单下面的 “ Status Bar” 子菜单项来控制,当选中 “ Status Bar” 子菜单项时(前面有选中符号 √ ), SPSS将显示状态栏。 SPSS网格线的显示和隐藏 数据编辑窗口默认的显示是有网格线的,这样可以分隔一个个变量和个案,如图 270所示。 图 270 网格线 网格线 网格线 子菜单 SPSS菜单的增加和删除 菜单栏中列出了 SPSS的命令菜单,每个菜单对应一个相应的功能, SPSS提供了一个菜单编辑器。 通过该编辑器,可以增加或删除 SPSS操作界面中的菜单。 菜单栏中列出了 SPSS的命令菜单,每个菜单对应一个相应的功能, SPSS提供了一个菜单编辑器。 通过该编辑器,可以增加或删除 SPSS操作界面中的菜单。 图 271 选择“ View” 菜单的“ Menu Editor” 命令 菜单编辑 图 272 “ Menu Editor” 对话框 SPSS字体的设置 SPSS字体的设置是通过 “ View” 菜单中的“ Fonts” 命令来设置的,如图 273所示。 图 273 选择“ View” 菜单的“ Font” 字体菜单 图 274 “ Font” (字体设置)对话框 小 结 利用 SPSS进行统计分析,变量和数据是必不可少的。 本章主要介绍数据的输入、编辑以及针对变量的各种操作。 将数据输入 SPSS中有多种方法,用户可以逐行录入也可以读入其他格式文件数据。 数据输入后通常需要对数据进行进一步的处理,如排序、分类汇总或缺失值的替代等。 SPSS中的分析都是针对某一特定变量进行的。 熟练掌握变量的操作技巧十分有助于提升工作的效率。 第十一章 绘制统计图 • 统计图是用点的位置、线段的升降、直条的长短或面积的大小等来表达资料的内容。 它可以把资料所反映的变化趋势、数量多少、分布状态和相互关系等形象直观地表现出来,以便于读者的阅读、比较和分析。 • 本章将介绍 SPSS在绘制常用统计图方面的功能。 由于计算机绘图具有快速、清晰、规范、可修正以保证准确无误等特点,故在论文、报告等写作中有着十分重要的应用价值。 条图 散点图 线图 直方图 饼图 面积图 箱式图 正态 图 正态 PP图 质量控制图 Pareto图 自回归曲线图 高低图 交互相关图 序列图 频谱图 误差线图 朴素的美 削尖脑袋的模样 墙上长满了爬山虎 太阳照在红墙内外 反客为主的蓝飘带 我没有放倒。 直条图 • 主要功能 • 调用 Graphs菜单的 Bar过程,可绘制直条图。 直条图用直条的长短来表示非连续性资料(该资料可以是绝对数,也可以是相对数)的数量大小。 研究血压状态与冠心病各临床型发生情况的关系,分析资料如下所示,试绘制统计图。 血压状态 年龄标化发生率( 1/10万) 冠状动脉机能不全 猝死 心绞痛 心肌梗塞 正常 临界 异常 • ,定义变量名:年龄标化发生率为 RATE,冠心病临床型为 DISEASE,血压状态为 BP。 RATE按原数据输入, DISEASE按冠状动脉机能不全 =猝死 =心绞痛 =心肌梗塞 =4输入, BP按正常 =临界 =异常=3输入。 • 选 Graphs菜单的 Bar...过程,弹出 Bar Chart定义选项框。 在定义选项框的下方有一数据类型栏,系统提供 3种数据类型: • Summaries for groups of cases:以组为单位体现数据; • Summaries of separate variables:以变量为单位体现数据; • Values of individual cases:以观察样例为单位体现数据。 • 大多数情形下,统计图都是以组为单位的形式来体现数据的。 在定义选项框的上方有 3种直条图可选: Simple为单一直条图、 Clustered为复式直条图、 Stacked为堆积式直条图,本例选复式直条图。 • 点击 Define钮,弹出 Define Clustered Bar:Summaries for Groups of Cases对话框,在左侧的变量列表中选 rate点击 钮使之进入 Bars Represent栏的Other snmmary function选项的 Variable框,选 disease点击 钮使之进入 Category Axis框,选 bp点击 钮使之进入 Define Clusters by框。 • 点击 Titles...钮,弹出 Titles对话框,在 Title栏内输入“血压状态与冠心病各临床型年龄标化发生率的关系”,点击Continue钮返回 Define Clustered Chart:Summaries for Groups of Cases对话框,再点击 OK钮即完成。 • 系统在统计图编辑窗口中输出直条图。 由于在原始数据库中,为了输入的方便,分组采用简单的 3……等数字表示,故体现在统计图中的分组条目会让读者感到不理解。 为此,用户可点击窗口上端工具栏中的 Edit钮,对统计图进行编辑。 用户欲在图中的哪一部位(如:标题、纵横轴的尺度与标目、统计图的色彩或花纹,等等)进行编辑,只须将鼠标箭头指向这一部位并双击鼠标左键,系统即弹出相应的编辑对话框。 编辑过程简便易行,用户不妨一试。 本章对此内容的介绍从略。 线图 • 调用 Graphs菜单的 Line过程,可绘制线图。 线图是用线条的上下波动形式,反映连续性的相对数资料的变化趋势。 非连续性的。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。