sas系统和数据分析平稳时间序列分析(编辑修改稿)内容摘要:
式 ()两边取期望 E ,根据平稳时间序列均值为常数的性质,有 tEx ,且因为 t 为零均值的白噪声,有 0,0,0,0 21 qtttt EEEE ,所以: )( 2211 qtqtttt EEx () 如果把非中心化的 )(qMA 序列减去上式 ()中的 ,则转化为中心化 )(qMA 序列。 特别地,对于中心化 )(qMA 序列,有 0tEx。 引进延迟算子,设 qq BBBB 2211)( ,又称为 q 阶自移动平均系数多项式,则中心化 )(qMA 模型可以简记为: tt Bx )( () ( 2) )(qMA 模型的方差 平稳 )(qMA 模型的方差为: 2222212211)1()()(qqtqtttt V a rxV a r () ( 3) )(qMA 模型的自协方差 平稳 )(qMA 模 型的自协方差 只与滞后阶数 k 相 关,且 q 阶截尾。 当 0k 时,222221 )1()()0( qtxV a r ;当 qk 时, 0)( k ;当 qk1 时,有 : 1ba694132f173c3031b404de55e1b101 商务数据分析 电子商务系列 上海财经大学经济信息管理系 IS/SHUFE Page 14 of 54 2111111)()])([()()(kkqiikqktqktktqtqttkttExxEk () ( 4) )(qMA 模型的自相关系数 平稳 )(qMA 模型的自相 关系数为 : qkkqkkqkqikikk,01,10,1)0()(22111 () ( 5) )(qMA 模型的偏自相关系数 在中心化的平稳 )(qMA 模型场合,滞后 k 阶偏自相关系数为: ),|( ),|( 11 11 kttkt kttkttkk xxxV ar xxxxE () 容易证明 , 平稳 )(qMA 模型的偏自相关系数拖尾性。 图 和图 的 是 一个平稳 )1(MA模型的样本自相关图和样本偏自相关图。 M A ( 1 ) 模型的自相关函数A C F ( k )0 1 2 3 4 5 6 7 8 9 10 11 12延迟k自相关系数 tttx 1ba694132f173c3031b404de55e1b101 商务数据分析 电子商务系列 上海财经大学经济信息管理系 IS/SHUFE Page 15 of 54 图 一个 MA(1)模型 n=101 样本自相关函数截尾图 图 一个 MA(1)模型 n=101 样本偏自相关函数拖尾图 ( 6) )(qMA 模型的可逆性 容易验证当两个 )1(MA 模型具有如下结构时: 11111:2:1ttttttxx模型模型 () 根据公式 ()计算, )1/( 2111 ,它们的自相关系数正好相等。 即不同的模型却拥有完全相同的自相关系数。 这种自相关系数的不 唯 一性将会导致拟合模型和随机时间序列之间不会是一一对应关系。 为了保证一个给定的自相关函数能够对应 唯 一的 )(qMA 模型,我们需要给模型增加约束条件。 这个约束条件称为 )(qMA 的可逆性条件。 把 式 ()中两个 )1(MA 模型表示成两个自相关 AR模型形式: ttttBxBx1111:21:1模型模型 () 注意 , 表 示 成 自 相 关 AR 模 型 时 运 用 公 式 321 1)1( aaaa ,其中M A ( 1 ) 模 型 的 偏 自 相 关 函 数 P A C F ( k )0 1 2 3 4 5 6 7 8 9 10 11 12延迟k偏自相关系数 tttx 1ba694132f173c3031b404de55e1b101 商务数据分析 电子商务系列 上海财经大学经济信息管理系 IS/SHUFE Page 16 of 54 11 / BaBa 或。 显然,当 11 时,模型 1 收敛,而模型 2 不收敛;当 11 时,则模型 2收敛,而模型 1 不收敛。 若一个 )(qMA 模型能够表示成收敛的 AR 模型形式,那么该 )(qMA 模型称为可逆模型。 一个自相关系数 唯 一对应一个可逆 )(qMA 模型。 3. ),( qpARMA 模型 具有如下结构的模型称为自回归移动平均模型,简记为 ),( qpARMA : qtqtttptptttt xxxx 221122110 () 若 00 ,该模型称为中心化 ),( qpARMA 模型。 模型的限制条件与 )(pAR 模型、 )(qMA 模型相同。 引进延迟算子,中心化 ),( qpARMA 模型简记为: ttxB )( () 式 中 : Pp BBBB 2211)( ,称为 p 阶 自 回 归 系 数 多 项 式 ,qq BBBB 2211)( ,称为 q 阶自移动平均系数多项式。 显然,当 0q 时, ),( qpARMA 模型就退化成 )(pAR 模型;当 0p 时, ),( qpARMA 模型就退化成 )(qMA 模型。 所以, )(pAR 模型和 )(qMA 模型实际上是 ),( qpARMA 的特例,它们统称为ARMA 模型。 而 ),( qpARMA 模型的统计性质也正是 )(pAR 模型和 )(qMA 模型统计性质的有机组合。 由于 ),( qpARMA 模型可以转化为无穷阶移动平均模型, 因此, ),( qpARMA 模型的自相关系数不截尾。 同理,由于 ),( qpARMA 模型也可以转化为无穷阶自回归模型, 因此, ),( qpARMA 模型的偏自相关系数也不截尾。 总结 )(pAR 模型、 )(qMA 模型和 ),( qpARMA 模型的自相关系数和偏自相关系数的规律, 如 表 所示。 表 拖尾性和截尾性 模型 自相关系数 k 偏自相关系数 kk )(pAR 拖尾 p 阶截尾 )(qMA q 阶截尾 拖尾 ),( qpARMA 拖尾 拖尾 1ba694132f173c3031b404de55e1b101 商务数据分析 电子商务系列 上海财经大学经济信息管理系 IS/SHUFE Page 17 of 54 假如某个时间序列观察值可以判定为平稳非白噪声序列,计算出样本自相关系数( ACF)和样本偏自相关系数( PACF)之后,就要根据它们表现出来的性质,选择阶数适当的 ARMA 模型拟合 观察值序列。 即根据样本的自相关系数和样本偏自相关系数性质估计自相关阶数 pˆ 和移动平均阶数 qˆ。 因此,这个过程也称为模型定阶过程或模型识别过程。 由于样本的随机性,样本的自相关系数和偏自相关系数不会呈现出理论截尾的完美情况,本应截尾处仍会呈现出小值震荡的情况。 同时,由于平稳时间序列通常都具有短期相关性,随着延迟阶数变大,自相关系数和偏自相关系数都会衰减至零值附近作小值波动。 那么,如何判断自相关系数和偏自相关系数是截尾还是拖尾呢。 以及如果为截尾那么相应的阶数为多少。 通常分析人员是依据样本的自相关系数和偏自相关系数近似分布来作出尽可能合理的判断。 Jankins 和 Watts 已经证明样本自相关系数是总体自相关系数的有偏估计: kk nkE 1)ˆ( () 式中 , k 为延迟阶数, n 为样本容量。 根据 Bartlett 公式计算样本自相关系数的方差近似等于: jknnV ar jm mj jm mk ),ˆ1(1ˆ1)ˆ( 1 22 () 当延迟阶数 k 足够大时, 0)ˆ( kE ;当样本容量 n 充分大时, nVar k /1)ˆ( 。 所以 , 样本自相关系数近似服从正态分布: )1,0(~ˆ nNk () Quenouille 证明,样本偏自相关系数也同样近似服从 正态分布: )1,0(~ˆ nNkk () 设显著水平取 %5。 如果样本自相关系数和样本偏自相关系数在最初的 k 阶明显大于 2 倍标准差,而后几乎 95%的系数都落在 2 倍标准差的范围内,且非零系数衰减为小值波动的过程非常突然,通常视为 k 阶截尾;如果有超过 5%的样本相关系数大于 2 倍标准差,或者非零系数衰减为小值波动的过程比较缓慢或连续,通常视为拖尾。 五、 参数估计和检验 对于一个非中心化 ),( qpARMA ,有 : tpqt BBx )( )( () 通过样本的自相关系数和偏自相关系数的性质,估计出自相关阶数 pˆ 和移动平均阶数 qˆ。 为模型定阶后,该模型共含有 2qp 个未知参数: 211 ,, qp 。 参数 用样本均值来估计总体均值(矩估计法)。 对原序列中心化后,待估参数减少一个。 对 1qp 个未知参数的估计 方法1ba694132f173c3031b404de55e1b101 商务数据分析 电子商务系列 上海财经大学经济信息管理系 IS/SHUFE Page 18 of 54 有三种:矩估计、极大似然估计和最小二乘估计。 1. 参数的矩估计 用时间序列样本数据计算出延迟 1 阶到 qp 阶的样本自相关系数 kˆ ,延迟 k 阶的总体自相关系数为 ),( 11 qkk ,公式中包含 qp 个未知参数变量 qp , 11。 如果用计算出的样本自相关系数来估计总体自相系数,那么有 qp 个联立方程组: qpqpqpkqpkqpˆ),(ˆ),(ˆ),(11111111 () 从中解出 qp 个未知参数变量的值作为模型的参数估计值 qp ˆ,ˆ,ˆ,ˆ 11 。 这种方法称为参数的矩估计。 白噪声序列的方差 2 的矩估计,是用时间序列样本数据计算出样本方差 2ˆx 来估计总体方差 2x求得。 ),( qpARMA 模型的两边同时求方差,并把相应参数变量的估计值代入,可得白噪声序列的方差估计为: 22212212 ˆˆˆ1ˆˆ1xqp () 2. 参数的极大似然估计 当总体分布类型已知时,极大似然估计 ML( maximumlikelihood)是常用的估计方法。 极大似然估计的基本思想,是认为样本来自使该样本出现概率最大的总体。 因此,未知参数的极大似然估计,就是使得似然函数(即联合密度函数)达到最大值的参数值。 即: ),。 ,(m a x),。 ˆ,ˆ,ˆ,ˆ( 111111 qPnnqP xxpxxL () 在时间序列分析中,序列的总体分布通常是未知的。 为了便于分析和计算,通常假设序列服从多元正态分布,它的联合密度。sas系统和数据分析平稳时间序列分析(编辑修改稿)
相关推荐
() 也就是 , ut 遵循以 0为均值 , (0+1u2t1 )为方差的正态分布。 tu )(,0 2 110 tuN 由于 ()中 ut 的方差依赖于前期的平方扰动项,我们称它为 ARCH(1)过程: 通常用极大似然估计得到参数 0, 1, 2, , k, 0, 1的有效估计。 容易加以推广 , ARCH (p)过程可以写为: () 这时方差方程中的
S语句代替 INFILE语句。 所对应的一般程序结构如下: Data 所要创建的数据集名。 图 调用 VIEWTABLE 窗口浏览数据集 cc381fe59fe483e9d188433804805395 SAS 系统和数据分析 电子商务系列 上海财经大学经济信息管理系 IS/SHUFE Page 7 of 14 Infile „读取的外部文件名 ’ FIRSTOBS=开始读入的行 OBS=结束行
Model 1 Error 198 C Total 199 Root MSE Rsquare Dep Mean Adj Rsq . Parameter Estimates Parameter Standard T for H0: Variable DF Estimate Error Parameter=0 Prob |T| INTERCEP 1 WEIGHT 1 上海财经大学经济信息管理系
密度估计的输出 SAS数据集。 testout=数据集名 —— 生成一个输出 SAS数据集。 包含来自 testdata指定数据集的所有数据,后验概率和每个观测被分 入 的类。 当 canonical选项指定时,该数据集还包括典型变量得分的新变量。 testoutd=数据集名 —— 生成一个包含 testdata 指定数据集的所有数据和对每一观测的组 密度估计的输出 SAS数据集。 2.
单后,选择 REPORT WRITING(编写报表)。 7. 选择 LISTING(列表显示) 在 Report Writing Menu 菜单中选择第一个 LISTING 子菜单。 如 图 所示,在SAS/ASSIST: List a Data Set 对话界面让用户做以下几方面的选择: 给出生成报表的那个 SAS数据集的名字。 单击 Active data set按钮,在
A的语句比分母为 A*B的语句求出的百分数要大。 我们已经知道,在 TABLE 语句中分类变量都要事先在 CLASS 语句中定义过,但是有一个特殊的分类变量叫 ALL,也称全类变量。 全类变量 ALL 可以直接用在 TABLE 语句中,它仅有一个值,表示所有的子集和及总和,这是一个非常有用的类,常放在表格的最后一行和最后一列计算总和的统计量。 例如下面的语句: