sas系统和数据分析建立sas系统的数据集datastep(编辑修改稿)内容摘要:
print data=testd4。 Run。 在 OUTPUT 窗口中显示的运行结果 如 图 所示。 图 用列指针控制读入外部文件后的 SAS 数据集 c7505695adb36f18f7e25cf5d2462a90 SAS 系统和数据分析 电子商务系列 上海财经大学经济信息管理系 IS/SHUFE Created by Page 7 of 18 变量表 (输入格式表 )是一种分组格式表,适用于当输入的数据都以同一格式排列时 , 是INPUT 语 句的必选项。 用分组格式表可以缩短 INPUT 语句的书写长度,因为输入格式表是被循环使用的,所以相同的格式只要在输入格式表写一遍;另外 , 如果变量名是“相同字符 +序号”组成的,还可以在变量表中用简单的形式列出来。 例如, INPUT (test15) ($4.)。 如果输入的数据的格式不是全部相同,而是部分相同可以在输入格式表中采用“重复次数 *输入格式 ”。 例如 , INPUT (test15) (3*,2*)。 3. list 模式 list 模式也称自由格式输入,是使用最方便的输入方式。 当外部文件中的输入值 之间至少有一个空格隔开,且丢失值用小数点表示,字符型数值长度不超过 8 个字节(否则需用LENGTH, ATTRIB 或 INFORMAT 语句规定长度)时,只需在 INPUT 语句中列出要被赋值的变量名即可,而没有必要知道数据占据哪几列。 变量的顺序和它们的数据值在数据行中的顺序应该是一致的。 由于 SAS 系统在读取数据时是扫描整个数据输入行,因此不能有选择地读取其中的一些数据值,但是可以不再读某个点以后的值。 在 INPUT 语句中它有以下 两 种格式: 格式一: Input 指针控制 变量 1 $amp。 @|@@……。 格式二: Input 指针控制 变量 1 :|amp。 |~ 输入格式 @|@@…。 “ amp。 ”、“ : ”和“ ~”是自由格式输入方式中的三个格式修饰符。 作用如下: “amp。 ”——指明字符型输入值可能嵌有一个空格。 因为在正常情况下空格为分隔符。 因此不同的数据之间最好用较多的空格隔开,这样字符型输入值中也就能嵌有较多的空格。 图 用行和列指针控制读入外部文件后的 SAS 数据集 c7505695adb36f18f7e25cf5d2462a90 SAS 系统和数据分析 电子商务系列 上海财经大学经济信息管理系 IS/SHUFE Created by Page 8 of 18 “ : ”——指明变量的值是从以下非空格列中读取,直到第一次遇到空格或数据行末尾或读满输入格式指定的列数而结束。 “ ~” ——指明当读字符值时,且 INFILE语句中采 用 DSD 选项, INPUT语句用一种特殊方法处理单引号和双引号及分隔符。 若 INPUT语句中使用此格式修饰符,则引号被保留作为这个值的一部分,若 INPUT语句中没有使用此格式修饰符,则引号被去掉。 例如 , 我们在 NOTEPAD 记事本程序中输入 如 图 所示内容,并以 文件名存入到 D:\sasdata\mydir 目录下,作为第二个我们用来实验的外部文件。 将图 8- 7所示的用逗号作为分隔符、字段数据中有空格和引号中有逗号的数据记录读入到 SAS 数据集,相应的数据步程序如下: Data testd5。 Infile „d:\sasdata\mydir\‟ dsd。 Input name amp。 $15. age address ~ $40. pc。 Proc print data=testd5。 Run。 在 OUTPUT 窗口中显示的运行结果 如 图 所示。 图 数据带引号和空格且以分隔符隔开的外部文件 c7505695adb36f18f7e25cf5d2462a90 SAS 系统和数据分析 电子商务系列 上海财经大学经济信息管理系 IS/SHUFE Created by Page 9 of 18 第九课 建立 SAS 系统的数据集( ACCESS) SAS/ACCESS 是一个 SAS 系统的与外部数据库的 接口模块 ,它为用户提供了 透明地访问其他数据库文件的能力。 所谓透明访问是指用户不必知道各种外部数据库的物理访问结构,只要知道数据库的逻辑结构,这样对各种不同物理结构的外部数据库访问就变成一样了。 SAS/ACCESS 可以访问所有流行的数据库管理系统的文件。 我们在这里主要介绍 dBASE 的*.DBF 数据库文件与 SAS 数据集的转换。 一、 用 SAS/ACCESS 建立描述符和数据视窗 为了使 SAS/ACCESS 系统能访问外部数据库,首先 SAS/ACCESS 系统要建立外部数 据库文件的描述性。sas系统和数据分析建立sas系统的数据集datastep(编辑修改稿)
相关推荐
之后不起作用, lstknm的长度为 6,所以显示的值分别为’深发展’和’大秦铁’。 Obs lstknm 1 深发展 2 大秦铁 上段程序的正确写法: data a。 lstknm=’深发展’。 data b。 lstknm=’大秦铁路’。 data c。 length lstknm $12。 /*length语句放在 set语句之前 */ set a b。 proc print。
PHYS1 PHYS2 PHYS3 WEIGHT WAIST PULSE Correlations Between the Exercises and Their Canonical Variables EXER1 EXER2 EXER3 CHINS SITUPS JUMPS Correlations Between the Physiological Measurements and the
l preplot rotate=promax reorder plot outstat=fact_all。 run。 proc factor data=socecon method=ml heywood nfacotors=1。 run。 proc factor data=socecon method=ml heywood nfactors=2。 run。 proc factor
商务数据分析 电子商务系列 上海财经大学经济信息管理系 IS/SHUFE Page 10 of 30 3. 结果分析 表 (a)包括基本统计数,即每一变量的平均数、标准差。 表 中输出结果( b)为简单相关系数矩阵。 表 ( c)为输出相关矩阵的特征值。 表 输出结果( d)为特征向量。 我们从相关矩阵出发进行主成分分析。 从表 中输出结果 (c)可以看出,在最后一列累计贡献率中
Data class4。 Set class2。 0e3194151c8f36e3d5fa7075bfdf439d SAS 系统和数据分析 电子商务系列 上海财经大学经济信息管理系 IS/SHUFE Created by Page 5 of 12 if total lt 450 then delete。 Proc print data=class4。 Run。 程序三: Data class4。
那么 SAS 系统自动地创建一些 SAS 数据集,并命名为 DATA DATA„这些数据集被存在 WORK 库中。 五、 SAS 数据集的索引 SAS 数据集可以用一个或几个被称为关键字变量的变量来索引。 SAS 索引根据用它们的值组成索引的关键字的个数多少而分为 : 简单索引 复合索引 1. 简单索引 简单索引是用一个关键变量的值来对观测定位指针。 这个关键变量可以是数值变量或字符变量