167第6章多重共线性内容摘要:

[命令方式 ]COR 各个解释变量名 ,得两两简单相关系数矩阵如下 注意: 1 1 1 2 1 3 12 1 2 2 2 3 23 1 3 2 3 3 31 2 3 kkkk k k k kr r r rr r r rr r r rr r r r123 kXXXX1 2 3 kX X X X R2 、 F检验、 t检验的结果判断 经验表明 , 多重共线性存在的一个标志是模型结果具有较大的标准误差和较小的 t统计量。 如果模型的可决系数 很大 , 检验高度显著 , 但是偏回归系数的 t检验几乎都不显著 ( t检验值较小 ) ,则模型很可能存在多重共线性。 因为通过检验 , 虽然各解释变量对的联合线性影响高度显著 , 但每个解释变量的单独影响却都不显著 , 就无法辨别哪个解释变量对被解释变量的影响更大。 这种矛盾结果可能是由于 较大引起的 , 这时很有可能存在严重的多重共线性。 2R F)ˆ(ˆ jES  判定系数检验法 如果存在多重共线性 , 需进一步确定究竟由哪些变量引起。 使模型中每一个解释变量分别以其余解释变量为解释变量进行回归 , 并计算相应的拟合优度。 如果某一种回归 Xji=1X1i+2X2i+kXki 的 判定系数 较大 , 说明 Xj与其他 X间存在 共线性。 ( 其中 称为 复相关系数 ) 2iRjR具体可进一步对上述回归方程作 F检验: 式中: Rj•2为第 j个解释变量对其他解释变量的回 归方程的决定系数, 若存在较强的共线性,则 Rj•2较大且接近于 1,这时( 1 Rj•2 )较小,从而 Fj的值较大。 因此,给定显著性水平 ,计算 F值,并与相应的临界值比较,来判定是否存在相关性。 构造如下 F统计量 22/( 1 ) , 2 , ,( 1 ) /( )iiiRkF i kR n k        1   在模型中排除某一个解释变量 Xj,估计模型 ; 如果拟合优度与包含 Xj时十分接近,则说明 Xj与其它解释变量之间存在共线性。 另一等价的检验 是 : 方差扩大(膨胀)因子法 统计上可以证明,解释变量 的参数估计式 的方差可表示为 其中的 是变量 (Variance Inflation Factor),即 的方差扩大因子 其中 是第 j个解释变量辅助回归的可决系数  21V I F =1j jR222 2 21ˆV a r ( ) = = V I F1 jj j j jσ σβx R xVIFj jXjX ˆjβ2jR经验规则 方差膨胀因子越大,表明解释变量之间的多重共性越严重。 反过来,方差膨胀因子越接近于 1,多重共线性越弱,因此,可以用作为衡量多重共线性的一个指标。 经验表明,方差膨胀因子 VIF ≥10时,说明解释变量与其余解释变量之间有严重的多重共线性,且这种多重共线性可能会过度地影响最小二乘估计。 与 等价的指标是“容许度”( Tolerance),其定义为: 另一等价的检验 是 : jVIFjjj R V I F1)1(T O L 2 显然 , 0≤TOLj≤1;当 Xj与其他解释变量高度相关时 , TOLj→ 0。 因此 , 一般当 TOLj , 认为模型存在较严重的多重共线性。 (1)特征值 : XknnnkkXXX XXXXXX212221212111111考察解释变量的样本数据矩阵 0XX0XX121 , k XX 1k当模型存在完全多重共线性时 ,rank(X)k+1, , 而当模型存在严重的多重共线性时 , 根据矩阵代数知识, 为矩阵 的 个 若 1 2 1kXX     ≈0 特征值,则有: (特征值 ) 0 cXcX  0 XcXc 0Xc00 110  kkccc XXX X022110  kikii XcXcXcc , , 这表明特征值中至少有一个近似地等于 0。 若 c是对应于特征值 的单位特征向量,则 , , , 更具体地 这说明矩阵 列向量之间存在多重共线性,并且这些多重共线性关系的系数向量就等于接近于 0的那个特征根对应的特征向量。 因此,可以利用的特征值来检验模型的多重共线性 ( 2) 条件指数 ( Condition Index) 将 矩阵的每一列 用其模 相除以实现标准化,然后再求 矩阵的特征值,取其中最大的除以最小的后再求平方根,得到该矩阵的“ 条件数 ”,记为: 通常当 大于 10或 20时,认为存在较明显的多重共线性。 X kX kk XXX m inm a xCI XXCI附:回归系数方差分解 : 如果 V是对角化 的 (K+1) (K+1)对角矩阵:即 其中 是 的特征值构成的对角矩阵。 从而 两种理解:如果特征值之和反映对被解释变量解释程度,倒数之和反映引起估计量方差的比重。   ΛVVXX Λ XX  KkvvvbV arKkKkkk ,1,0,21210202       1212   VVXXB V a rXX   1Λ VVXX  首先明确建立模型的目的:经济预测、结构分析或政策评价。 如果建立模型的目的是进行预测,就可以忽略多重共线性。 直接剔除次要或可替代的变量 剔除时 需注意产生新的问题 : ① 当模型存在共线性,若将某个共线性变量去掉,模型的经济意义不合理; ②可能使模型产生异方差性或自相关性; ③若剔除不当 ,可能会产生模型设定误差,造成参数估计严重有偏 四、多重共线性的解决方法 减小参数估计量的方差 多重共线性 的主要 后果 是参数估计量具有较大的方差 , 所以 , 采取适当。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。