sas系统和数据分析拼接和合并数据集(编辑修改稿)内容摘要:

拼接生成的新数据集 C 的结果 如图 所示。 无论哪一种拼接形式,用 SET 语句拼接生成的新数据集的观测总数为原各输入数据集观测数之和。 二、 数据集的合并 数据集的合并是通过使用 MERGE 语句把两个或两个以上数据集中的两条观测或两条以上 的观测合并为新生数据集中的一条观测。 数据集的合并可分成 两 种主要的合并情况:  一对一合并(不带 BY语句)  匹配合并(带有 BY语句) 图 按关键字排序后拼接的数据集结果 c72cc4be0bbf221015743448a2d35f94 SAS 系统和数据分析 电子商务系列 上海财经大学经济信息管理系 IS/SHUFE Created by Page 5 of 9 1. 一对一合并(不带 BY 语句) 把一个数据集中的第一条观测同另外一个数据集中第一条观测合并,第二条观测同另外一个数据集中第二条观测合并,以此类推。 新生成的数据集中的观测总数为这些数据集中观测个数的最大值。 如果相对应的某个数据集已没有观测,则相应的变量值为缺省值。 如果在几个数据集中有共同的变量,则在合并后新生成的数据集中只有一个变量,其值为列在MERGE语句中最后一个含有该变量的数据 集中的观测值。 例如 , 我们有 两 个数据集 A和 B,如图 所示。 生成新数据集 C 的程序如下: Data C。 Merge A B。 Proc print data=C。 Run。 合并的新数据集 C 的结果 如图 所示。 图 一对一合并(不带 BY 语句)后的结果 O B S C O M M O N X O B S C O M M O N Y1 9801 1 1 9801 42 9802 2 2 9803 63 9803 3D A T A A D A T A B 图 含有不相同的变量和相同变量不同值的两个数据集 c72cc4be0bbf221015743448a2d35f94 SAS 系统和数据分析 电子商务系列 上海财经大学经济信息管理系 IS/SHUFE Created by Page 6 of 9 2. 匹配合并(带有 BY 语句) 如果想把两个或两个以上的数据集按照相同的关键字值合并,则在 MERGE 语句后面要用 BY 跟 关键字语句。 且每一个数据集必须预先按关键字排序好。 如果两个数据集中观测的关键字值不匹配,输出所有这些观测,相应的新增变量的值为缺省值。 如果两个数据集中观测的关键字值是多对多匹配,要注意新生成的数据集中相同关键字。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。