sas应用讲义-中高级教材(编辑修改稿)内容摘要:

被删除,未出现的变量的观测值仍保留在新的数据集中。 2.8 KEEP语句 KEEP语句的作用是指定要写到数据集中的变量。 KEEP语句的格式为: KEEP 变量名表; 如果在DATA步中有KEEP语句,那么KEEP语句中未出现的变量的观测值被删除,已出现的变量的观测值被保留在新的数据集中。 2.9 IF语句 IF语句的作用是使SAS继续处理符合IF条件规定的观测值,因而所得到的数据集是原数据集的子集。 IF语句的格式为: IF 条件表达式; 如果表达式的值是真,SAS处理当前的观测值,执行DATA步中的语句。 如果表达式的值是假,SAS马上返回到DATA步的开始,不处理当前的观测值,不执行 8 DATA步中的语句。 〖 上机练习2.3 〗进入SAS的显示管理系统,在编辑窗口输入程式: data ex; input group$ age @@; cards; x 23 y 10 x 7 y 22 x 8 y 4 x 21 y 12 x 9 y 22 x 6 y 2 ; data ex1; set ex; if group=39。 x39。 ; proc print; data ex2; set ex; if age20; proc print; run; 本程式运行的结果如下: OBS GROUP AGE 1 x 23 2 x 7 3 x 8 4 x 21 5 x 9 6 x 6 OBS GROUP AGE 1 y 10 2 x 7 3 x 8 4 y 4 5 y 12 6 x 9 7 x 6 8 y 2 2.10 PROC语句 PROC语句的作用是指定需要调用的过程以及该过程的若干选择项。 PROC语句的格式为: PROC SAS的过程名; 例如,调用PRINT过程,打印数据集EX的内容: PROC PRINT DATA=EX; 这里的DATA=数据集名,用来指定本过程所要处理的数据集名,如缺省则处理 9 最新建立的数据集。 在PROC步中,还必须确认一些最基本的信息,包括: (1)处理的数据集名,格式为DATA=数据集名; (2)所涉及的变量名,格式为VAR 变量名; (3)分组处理的标志,格式为BY 组变量名。 2.11 CLASS语句 CLASS语句的作用是在分析的过程中定义分类变量,再按分类变量的值分组进行数据分析。 CLASS语句的格式为: CLASS 变量名; CLASS语句对数据分析所起的作用类似于BY语句,但是它们打印输出的格式不相同,并且BY语句要求先对变量排序后才能使用。 2.12 FREQ语句 FREQ语句的作用是规定一个变量,以它的值作为数据集中观测值出现的频数。 FR EQ语句的格式为: FREQ 变量; 假定某观测值的FREQ变量的值为n,在分析时,该数据集中这个观测值出现的频数便是n。 若n<1,则观测值不参加分析。 若n不是整数,则自动取整。 观测值的总数等于FREQ变量的和。 〖 上机练习2.4 〗进入SAS的显示管理系统,在编辑窗口输入程式: data ex; input group$ sex$ age number @@; cards; x f 23 10 y f 22 8 x m 21 12 y m 22 6 ; proc means maxdec=3; class group; var age; proc means maxdec=3; class group; freq number; var age; run; 程式中的 maxdec=3用来确定输出的数值只保留三位小数。 本程式运行的结果如下: Analysis Variable : AGE GROUP N Obs N Minimum Maximum Mean Std Dev x 2 2 y 2 2 10 Analysis Variable : AGE GROUP N Obs N Minimum Maximum Mean Std Dev x 22 22 y 14 14 第三讲 SAS服务过程 SAS服务过程不能直接给出统计值,专门用来准备或整理统计资料。 使频次最多的SAS语服务过程有: 3.1 PRINT过程 PRINT过程可以打印一个SAS数据集中的全体或部分观测值,还可以打印数值变量的总和或部分和。 在PRINT过程中经常使用的语句有: PROC PRINT[选择项]; VAR 变量表; BY 变量表; SUM 变量表; 在PROC PRINT语句中可 能出现的选择项有DATA=数据集名,如果省略这一选择,则打印最新建立的数据集中的数据。 SUM语句被用来求变量表中诸变量的总和。 3.2 SORT过程 SORT过程将SAS数据集中的观测值按一个或多个变量的值进行排序,以便其他的SAS过程利用BY语句对这些观测值进行分组处理,排序后的观测值存放在一个新的SAS数据集中或者代替原来的数据集。 在SORT过程中经常使用的语句有:PROC SORT[选择项]; BY 变量表; 在PROC SORT语句中可能出现的选 择项有DATA=数据集名,用来说明要排序的数据集名,如果省略这一选择,则指定最新建立的数据集。 还有OUT=数据集名,用来说明要输出的数据集名,如果省略这一选择,则原来的数据集被输出的数据集替换。 〖 上机练习3.1。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。