sas系统和数据分析sas数据集的编辑(编辑修改稿)内容摘要:
Data class4。 Set class2。 0e3194151c8f36e3d5fa7075bfdf439d SAS 系统和数据分析 电子商务系列 上海财经大学经济信息管理系 IS/SHUFE Created by Page 5 of 12 if total lt 450 then delete。 Proc print data=class4。 Run。 程序三: Data class4。 Set class2。 if average=80 and 100 in (test1,test2,test3,test4,test5)。 Proc print data=class4。 Run。 运行结果如 图 所示。 第十二课 程序三中的 IF 语句条件表达式等价于 IF average=80 and (100=test1 or 100=test2 or 100=test3 or 100=test4 or 100=test5),由于 AND 的优先级比 OR 的高,与条件表达式 IF average=80 and 100=test1 or 100=test2 or 100=test3 or 100=test4 or 100=test5 是有区别的。 拼接和合并数据集 图 用 IF 条件语句选择数据 集中的观测 0e3194151c8f36e3d5fa7075bfdf439d SAS 系统和数据分析 电子商务系列 上海财经大学经济信息管理系 IS/SHUFE Created by Page 6 of 12 数据集的连接是把两个或两个以上的数据集的观测连接成一个新的数据集。 连接的方式有两种:拼接和合并。 在 SAS 数据步中用 SET 语句可以拼接数据集 ,而用 MERGE 语句可以合并数据集。 例如,我们有两个数据集 A 和 B,要拼接和合并成新的数据集 C,两种不同方法的程序和结果见示意图 所示。 一、 数据集的拼接 数据集的拼接可分成三种主要的拼接情况: 1. 相同变量的数据集拼接 这是最简单的情况,在这种情况下,新生成的数据集就含有这些相同的变量,观测的数目是所有这些数据集的观测总和。 例如,数据集 A和 B 都含有两个相同的变量 COMMOM和X,且都有三条观测,如图 所示。 A BS A S 数据集的连接D A T A C。 S E T A B。 R U N。 D A T A C。 M E R G E A B。 R U N。 ABA B 图 数据集的两种连接方式:拼接和合并 0e3194151c8f36e3d5fa7075bfdf439d SAS 系统和数据分析 电子商务系列 上海财经大学经济信息管理系 IS/SHUFE Created by Page 7 of 12 用下面程序生成新数据集 C 有两个相同的变量 COMMOM 和 X, 6 条观测。 Data A。 Input mon x。 Cards。 9801 1 9802 2 9803 3 Data B。 Input mon x。 Cards。 9801 4 9。sas系统和数据分析sas数据集的编辑(编辑修改稿)
相关推荐
商务数据分析 电子商务系列 上海财经大学经济信息管理系 IS/SHUFE Page 10 of 30 3. 结果分析 表 (a)包括基本统计数,即每一变量的平均数、标准差。 表 中输出结果( b)为简单相关系数矩阵。 表 ( c)为输出相关矩阵的特征值。 表 输出结果( d)为特征向量。 我们从相关矩阵出发进行主成分分析。 从表 中输出结果 (c)可以看出,在最后一列累计贡献率中
print data=testd4。 Run。 在 OUTPUT 窗口中显示的运行结果 如 图 所示。 图 用列指针控制读入外部文件后的 SAS 数据集 c7505695adb36f18f7e25cf5d2462a90 SAS 系统和数据分析 电子商务系列 上海财经大学经济信息管理系 IS/SHUFE Created by Page 7 of 18 变量表 (输入格式表 )是一种分组格式表
之后不起作用, lstknm的长度为 6,所以显示的值分别为’深发展’和’大秦铁’。 Obs lstknm 1 深发展 2 大秦铁 上段程序的正确写法: data a。 lstknm=’深发展’。 data b。 lstknm=’大秦铁路’。 data c。 length lstknm $12。 /*length语句放在 set语句之前 */ set a b。 proc print。
那么 SAS 系统自动地创建一些 SAS 数据集,并命名为 DATA DATA„这些数据集被存在 WORK 库中。 五、 SAS 数据集的索引 SAS 数据集可以用一个或几个被称为关键字变量的变量来索引。 SAS 索引根据用它们的值组成索引的关键字的个数多少而分为 : 简单索引 复合索引 1. 简单索引 简单索引是用一个关键变量的值来对观测定位指针。 这个关键变量可以是数值变量或字符变量
电子商务系列 上海财经大学经济信息管理系 IS/SHUFE Created by Page 4 of 7 %宏名字(参数值)。 例如,我们定义了一个简单通用的宏程序 INVOKE,它有两个参数宏变量 proame 和dsname,用以传递给宏程序所需的过程名和数据集名。 在调用这个宏程序时要将具体的 参数宏变量值给出,其值分别为 Print 和。 程序如下: %MACRO INVOKE(
和产生用户化的行标题和列标题。 2. PROC TABULATE 语句格式 在 PROC TABULATE过程中, 常常使用一些控制汇总报表产生的语句,一般过程形式如下: PROC TABULATE 选项列表。 CLASS 分类变量列表。 VAR 分析变量列表。 TABLE 页表达式, 行表达式, 列表达式 /表选项。 LABEL 变量 1=“标签 *内容 ” 变量 2=“标签 *内容 ”……。