sas编程技术sql从单个表中检索数据(编辑修改稿)内容摘要:
这一部分属于动态计量经济学的范畴。 通常是运用时间序列的过去值 、 当期值及滞后扰动项的加权和建立模型 , 来 “ 解释 ” 时间序列的变化规律。 在时间序列模型的发展过程中,一个重要的特征是对统计均衡关系做某种形式的假设,其中一种非常特殊的假设就是平稳性的假设。 通常一个平稳时间序列能够有效地用其均值、方差和自相关函数加以描述。 本章首先通过讨论回归方程扰动项通常会存在的序列相关性问题,介绍如何应用时间序列数据的建模方法,修正扰动项序列的自相关性。 进一步讨论时间序列的自回归移动平均模型( ARMA模型),并且讨论它们的具体形式、估计及识别方法。 由于传统的时间序列模型只能描述平稳时间序列的变化规律,而大多数经济时间序列都是非平稳的,因此,由 20世纪 80年代初 Granger提出的协整概念,引发了非平稳时间序列建模从理论到实践的飞速发展。 本章还介绍了非平稳时间序列的单位根检验方法、 ARIMA模型的建模方法、协整理论的基本思想及误差修正模型。 167。 序列相关及其检验 第 3章在对扰动项 ut的一系列假设下 , 讨论了古典线性回归模型的估计 、 检验及预测问题。 如果线性回归方程的扰动项 ut 满足古典回归假设 , 使用 OLS所得到的估计量是线性无偏最优的。 但是如果扰动项 ut不满足古典回归假设 , 回归方程的估计结果会发生怎样的变化呢。 理论与实践均证明 , 扰动项 ut关于任何一条古典回归假设的违背 , 都将导致回归方程的估计结果不再具有上述的良好性质。 因此 , 必须建立相关的理论 , 解决扰动项不满足古典回归假设所带来的模型估计问题。 167。 序列相关及其产生的后果 对于线性回归模型 () 随机扰动项之间不相关 , 即无序列相关的基本假设为 () 如果扰动项序列 ut表现为: () 即对于不同的样本点 , 随机扰动项之间不再是完全相互独立的 ,而是存在某种相关性 , 则认为出现了序列相关性 (serial correlation)。 tktkttt uxxxy 22110Ttsuu stt ,2,1,00),c o v ( Ttsuu stt ,2,1,00),c o v ( 由于通常假设随机扰动项都服从均值为 0, 同方差的正态分布 , 则序列相关性也可以表示为: () 特别的 , 如果仅存在 () 称为 一阶序列相关 , 这是一种最为常见的序列相关问题。 TtsuuE stt ,2,1,00)( TtuuE tt ,2,10)( 1 如果回归方程的扰动项存在序列相关 , 那么应用最小二乘法得到的参数估计量的方差将被高估或者低估。 因此 , 检验参数显著性水平的 t统计量将不再可信。 可以将序列相关可能引起的后果归纳为: ② 使用 OLS公式计算出的标准差不正确 , 相应的显著性水平的检验不再可信 ; ③ 回归得到的参数估计量的显著性水平的检验不再可信。 ① 在线性估计中 OLS估计量不再是有效的; EViews提供了检测序列相关和估计方法的工具。 但首先必须排除虚假序列相关。 虚假序列相关是指模型的序列相关是由于省略了显著的解释变量而引起的。 例如 ,在生产函数模型中 , 如果省略了资本这个重要的解释变量 , 资本对产出的影响就被归入随机误差项。 由于资本在时间上的连续性 , 以及对产出影响的连续性 , 必然导致随机误差项的序列相关。 所以在这种情况下 , 要把显著的变量引入到解释变量中。 167。 序列相关的检验方法 EViews提供了以下 3种检测序列相关的方法。 1. D_W统计量检验 DurbinWatson 统计量 ( 简称 D_W统计量 ) 用于检验一阶序列相关 , 还可估算回归模型邻近残差的线性联系。 对于扰动项 ut建立一阶自回归方程: () D_W统计量检验的 原假设: = 0, 备选假设是 0。 ttt uu 1 如果序列不相关 , 2附近。 如果存在正序列相关 , 2。 如果存在负序列相关 , 2~ 4之间。 正序列相关最为普遍 , 根据经验 , 对于有大于 50个观测值和较少解释变量的方程 , , 说明残差序列存在强的正一阶序列相关。 )ˆ1(2ˆ)ˆˆ(..12221TttTtttuuuWD DubinWaston统计量检验序列相关有三个主要不足: 1. DW统计量的扰动项在原假设下依赖于数据矩阵 X。 2. 回归方程右边如果存在滞后因变量 , DW检验不再有效。 3. 仅仅检验是否存在一阶序列相关。 其他两种检验序列相关方法: Q统计量和 BreushGodfrey LM检验克服了上述不足,应用于大多数场合。 2 . 相关图和 Q 统计量 1. 自相关系数 我们还可以应用所估计回归方程残差序列的自相关系数和偏自相关系数来检验序列相关。 时间序列 ut滞后 k阶的自相关系数由下式估计 ( ) 其中 是序列的样本均值 , 这是相距 k期值的相关系数。 称rk为时间序列 ut的自相关系数 , 自相关系数可以部分的刻画一个随机过程的性质。 它告诉我们在序列 ut的邻近数据之间存在多大程度的相关性。 Tt tTkt kttkuuuuuur121u 2. 偏自相关系数 偏自相关系数是指在给定 ut1, ut2, … , utk1的条件下 ,ut与 utk之间的条件相关性。 其相关程度用偏自相关系数 k,k度量。 在 k阶滞后下估计偏相关系数的计算公式如下 ( ) 其中: rk 是在 k阶滞后时的自相关系数估计值。 ( ) 这是偏相关系数的一致估计。 11111 ,111 ,11,krrrkrkj jkjkkj jkjkkkkjkkkkjkjk ,1,1, 要得到 k,k的更确切的估计 , 需要进行回归 t = 1, 2, , T ( ) 因此,滞后 k阶的偏相关系数是当 ut 对 ut1, … , utk 作回归时 utk 的系数。 称之为偏相关是因为它度量了 k期间距的相关而不考虑 k 1期的相关。 tktkkktktt uuuu ,11110 我们还可以应用所估计回归方程残差序列的自相关和偏自相关系数 ( 在本章 ) , 以及 LjungBox Q统计量来检验序列相关。 Q统计量的表达式为: pjjLB jTrTTQ122 () 其中: rj是残差序列的 j 阶自相关系数, T是观测值的个数, p是设定的滞后阶数。 p阶滞后的 Q统计量的 原假设是:序列不存在 p阶自相关;备选假设为:序列存在 p阶自相关。 如果 Q统计量在某一滞后阶数显著不为零 , 则说明序列存在某种程度上的序列相关。 在实际的检验中 ,通常会计算出不同滞后阶数的 Q统计量 、 自相关系数和偏自相关系数。 如果 , 各阶 Q统计量都没有超过由设定的显著性水平决定的临界值 , 则接受原假设 , 即不存在序列相关 , 并且此时 , 各阶的自相关和偏自相关系数都接近于 0。 反之 , 如果 , 在某一滞后阶数 p, Q统计量超过设定的显著性水平的临界值 , 则拒绝原假。sas编程技术sql从单个表中检索数据(编辑修改稿)
相关推荐
设,其中一种非常特殊的假设就是平稳性的假设。 通常一个平稳时间序列能够有效地用其均值、方差和自相关函数加以描述。 本章首先通过讨论回归方程扰动项通常会存在的序列相关性问题,介绍如何应用时间序列数据的建模方法,修正扰动项序列的自相关性。 进一步讨论时间序列的自回归移动平均模型( ARMA模型),并且讨论它们的具体形式、估计及识别方法。 由于传统的时间序列模型只能描述平稳时间序列的变化规律
由度 N 1W E I G H T | W G T 规定除数使用权数和N 规定除数使用观测个数 NW D F 规定除数使用权数总和减 1其它语句 VAR语句 VAR variablelist。 规定将要计算描述统计量的数值变量及次序。 缺省时,为BY, CLASS, ID,FREQ和 WEIGHT语句中列出的变量之外所有数值变量。 BY语句 BY variablelist。 对 BY变量定义
a=nobs。 set nobs=nobs。 if _n_=a。 run。 如何找数据集的最后一个观测值: data a。 set nobs=nobs。 if _N_=NOBS。 run。 找数据集最后一个观测值更简单的方法: data a。 set end=obs_last。 if obs_last=1。 run。 输出数据集的最后一个观测值: data a。 set End=lastobs。
范围内的观测 Where x between 1 and 5。 where 1=x=5。 例 不能用 WHERE语句的情况 data a。 set。 where _n_100。 /*错误语句,必须用 if */ run。 data a。 set。 if _n_100。 run。 例中,不能用 WHERE语句控制 SAS的自动变量。 OUTPUT语句
select * from B。 quit。 A UNION B x y 1 one 2 two 3 three 4 four 产生只属于第一个查询的观测 (EXCEPT算符 ) proc sql。 title 39。 A EXCEPT B39。 select * from A except select * from B。 quit。 A EXCEPT B x y 3 three
性。 为了便于比较,我们将原始时间序列和消除增幅后的时间序列按 12 个时间单位的间隔绘制在一张图表上。 程序如下: data arimad02。 set arimad01。 xlog=log(x)。 proc print data=arimad02。 run。 proc gplot data=arimad02。 plot xlog*date / vaxis=axis1 haxis=axis2