sas基础知识课件(编辑修改稿)内容摘要:

d2。 infile 39。 d:\test\39。 missover。 input age 2. sex $1. height birthday yymmdd8.。 run。 • data d3。 infile 39。 d:\test\39。 input age sex $ height birthday yymmdd8.。 run。 46 三种不同原始数据排列方式的特性 有空格式(非格式化输入法) 查看原始数据方便,清晰;读取数值方便,不必查看变量所占的列域,只需了解变量的排列顺序和类型。 自由式(非格式化输入法): 当变量少,样本多时,用此法可缩短数据区域;读取数值方便,不必查看变量所占的列域,只需了解变量的排列顺序和类型。 47 无空格式(格式化输入法): 读取数据可以按任意顺序进行;数值或其中的一部分可以被重复读取;字符型数据中间可含空格;字符型数据宽度可扩大到 200个字符;空格被解释为缺省值;可以读取一个样本的全部观察值要占用两行或两行以上的数据。 01135177100 0224516074 第一行的变量是 id, sex, age, height, weight,字符长度分别是 2, 1, 2, 3, 3;第二行的变量是 id, temp, blood1, blood2,字符长度分别是 1,4, 3, 3。 48 • input 1 id 12 sex 3 age 45 height 68 weight 911 2 id 12 temp 36 blood1 79 blood2 1012。 • input 1 @1 (id sex age height weight ) ( 2. 1. 2. 3. 3. ) 2 @1 (id temp blood1 blood2 ) ( 2. 3. 3. )。 49 SAS数据的保存 临时数据集 数据集名( data set name),如, abc1 永久数据集 文件名由两部分组成:数据库逻辑名( libname) + 数据集名( data set name),如,。 50 数据库逻辑名的创建 用 SAS 语句创建数据库逻辑名 libname 数据库逻辑名 ‘主目录 :\子目录’; libname test 39。 d:\test 39。 data test..abc1。 input age sex $ height birthday yymmdd8.。 cards。 数据区 ; run; 51 在 SAS 的 Libraries 窗口上创建数据库逻辑名 view explorer libraries new 52 把其它格式数据转变成 SAS数据 • Excel 数据, dBASE 数据, Lotus 数据等  启动 SAS系统,进入 SAS 主窗口;  File 中选择 Import,进入 Import Wizard Select import type 窗口;  在 Import Wizard Select import type 窗口的文件格式选择框中选择‚ Execl5 or 7 Spreatsheet ( *.xls)‛,然后点击‚ Next‛ ,进入 Import Wizard Select file 窗口;  在 Import Wizard Select file 窗口上点击‚ Browse‛ ,进入‚打开‛窗口;  在‚打开‛窗口的‚搜寻‛框中选择文件 所在的目录 D: 和 D: 中的文件包 test,然后在 test 文件包中选择文件,当 出现在‚文件名‛框中时,点击‚打开‛,返回到 Import Wizard Select file 窗口;  在 Import Wizard Select file 窗口上点击‚ Next‛ ,进入Import Wizard Select library and member 窗口;  在 library选择框中选择 SAS数据的 libname: test,然后在 member 选择框中输入 SAS数据的第一级名字: abc, 然后点击‚ Finish‛。 53 把其它格式数据转变成 SAS数据 • SAS程序方式 文本文件转换成 SAS数据集 Data prg2_8。 infile ‘c: \SAS\’。 input no sex$ age @@。 run。 将 *.XLS转换成 SAS数据集 PROC IMPORT  DATAFILE = ‚C: \SAS\‛  OUT =  DBMS = EXCEL REPLACE。  SHEET = ‚SHEET1$‛。 RUN。 54 SAS数据集的整理 使用 SAS中 TOOL菜单下的 TABLE EDITOR 55 把 SAS数据转变成其它格式数据 • Excel 数据, dBASE 数据, Lotus 数据等 启动 SAS系统,进入 SAS 主窗口;  File 中选择 Export,进入 Export Wizard Select library and member窗口; Select export type窗口 Select file窗口 56 卡方检验 SAS应用 学习目标 • 掌握四格表普通卡方检验和配对卡方检验方法以及相应的SAS程序; • 了解 FREQ过程语句格式; • 熟悉 R C表资料的分类类型以及相应的统计检验方法; • 掌握双向无序 R C表资料检验以及 SAS程序; • 掌握单向有序 R C表资料检验以及 SAS程序; • 掌握趋势卡方检验方法以及 SAS程序; • 掌握分层 R C表的分析以及 SAS程序; 概述 • 前面已介绍了两个率比较的检验,在观察例数不够大或拟对多个率进行比较时,检验就不适宜了,因为直接对多个样本率作两两间的检验有可能增加第一类误差。 2检验可解决此类问题。 • 卡方检验是用途很广的一种假设检验方法,这里我们主要学习它在分类资料统计推断中的应用,包括:两个率或两个构成比比较的卡方检验;多个率或多个构成比比较的卡方检验以及分类资料的相关分析等。 四格表资料 • 定性指标分为有序的(如:疗效分为‚治愈、显效、好转、无效、死亡‛)和名义的(如:血型分为‚ O、 A、 B、AB‛ 型)2类,对于每1个受试者来说,有序指标的观测结果只能是该有序指标若干等级中的1级(如某人的疗效为‚显效‛);名义指标的观测结果只能是该名义指标若干标志中的1个(如某人的血型为B型),显然,无法像处理定量指标那样去直接分析定性指标,故这类资料常被整理成列联表的形式后再进行分析。 • 当表中只有2个定性指标时,称为2维列联表;有3个或3个以上定性指标时,称为多维列联表。 常用 R、 C表示2维列联表的行数和列数,并称为 R C表;当 R=C=2时,称为2 2表(或四格表)。 2 2表看起来很简单,但根据资料所具备的条件有许多不同的处理方法。 四格表卡方检验的 SAS程序 • 在 SAS/STAT模块中 FREQ、 TABULATE和 SUMMARY等过程可用于分类资料的统计描述,其中 FREQ过程兼具统计描述和统计推断的功能,对分类变量计算频数分布,产生从一维到 n维的频数表和列联表;对于二维表,可进行 2检验,对于三维表,可作 MentelHanszel分层分析。 FREQ过程是 SAS用于分析分类资料的一个常用过程。 本节将先向大家介绍 FREQ过程的语句及其格式。 • FREQ过程的语句基本格式如下: Proc freq data= order=。 Table 分类变量 *分类变量 / Ooptions。 Weight 变量。 Run。 四格表卡方检验的 SAS程序 • DATA=数据集:规定 PROC FREQ语句使用的数据集; • ORDER= FREQ,按频数递减顺序排列; ORDER=DATA,按数据集中出现的顺序排列; ORDER=INTERNAL,按内部值排列 (缺省 ); ORDER=FORMATTED,按外部格式值排列; • Table语句指定构成表格的变量和表格结构。 表格的结构由变量个数和变量排列顺序决定,一个 table语句允许列出多个表格结构。 PROC FREQ过程中可有多条 TABLES语句, TABLES语句后可接多个表格请求式,每个请求式。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。