167第6章多重共线性内容摘要:
[命令方式 ]COR 各个解释变量名 ,得两两简单相关系数矩阵如下 注意: 1 1 1 2 1 3 12 1 2 2 2 3 23 1 3 2 3 3 31 2 3 kkkk k k k kr r r rr r r rr r r rr r r r123 kXXXX1 2 3 kX X X X R2 、 F检验、 t检验的结果判断 经验表明 , 多重共线性存在的一个标志是模型结果具有较大的标准误差和较小的 t统计量。 如果模型的可决系数 很大 , 检验高度显著 , 但是偏回归系数的 t检验几乎都不显著 ( t检验值较小 ) ,则模型很可能存在多重共线性。 因为通过检验 , 虽然各解释变量对的联合线性影响高度显著 , 但每个解释变量的单独影响却都不显著 , 就无法辨别哪个解释变量对被解释变量的影响更大。 这种矛盾结果可能是由于 较大引起的 , 这时很有可能存在严重的多重共线性。 2R F)ˆ(ˆ jES 判定系数检验法 如果存在多重共线性 , 需进一步确定究竟由哪些变量引起。 使模型中每一个解释变量分别以其余解释变量为解释变量进行回归 , 并计算相应的拟合优度。 如果某一种回归 Xji=1X1i+2X2i+kXki 的 判定系数 较大 , 说明 Xj与其他 X间存在 共线性。 ( 其中 称为 复相关系数 ) 2iRjR具体可进一步对上述回归方程作 F检验: 式中: Rj•2为第 j个解释变量对其他解释变量的回 归方程的决定系数, 若存在较强的共线性,则 Rj•2较大且接近于 1,这时( 1 Rj•2 )较小,从而 Fj的值较大。 因此,给定显著性水平 ,计算 F值,并与相应的临界值比较,来判定是否存在相关性。 构造如下 F统计量 22/( 1 ) , 2 , ,( 1 ) /( )iiiRkF i kR n k 1 在模型中排除某一个解释变量 Xj,估计模型 ; 如果拟合优度与包含 Xj时十分接近,则说明 Xj与其它解释变量之间存在共线性。 另一等价的检验 是 : 方差扩大(膨胀)因子法 统计上可以证明,解释变量 的参数估计式 的方差可表示为 其中的 是变量 (Variance Inflation Factor),即 的方差扩大因子 其中 是第 j个解释变量辅助回归的可决系数 21V I F =1j jR222 2 21ˆV a r ( ) = = V I F1 jj j j jσ σβx R xVIFj jXjX ˆjβ2jR经验规则 方差膨胀因子越大,表明解释变量之间的多重共性越严重。 反过来,方差膨胀因子越接近于 1,多重共线性越弱,因此,可以用作为衡量多重共线性的一个指标。 经验表明,方差膨胀因子 VIF ≥10时,说明解释变量与其余解释变量之间有严重的多重共线性,且这种多重共线性可能会过度地影响最小二乘估计。 与 等价的指标是“容许度”( Tolerance),其定义为: 另一等价的检验 是 : jVIFjjj R V I F1)1(T O L 2 显然 , 0≤TOLj≤1;当 Xj与其他解释变量高度相关时 , TOLj→ 0。 因此 , 一般当 TOLj , 认为模型存在较严重的多重共线性。 (1)特征值 : XknnnkkXXX XXXXXX212221212111111考察解释变量的样本数据矩阵 0XX0XX121 , k XX 1k当模型存在完全多重共线性时 ,rank(X)k+1, , 而当模型存在严重的多重共线性时 , 根据矩阵代数知识, 为矩阵 的 个 若 1 2 1kXX ≈0 特征值,则有: (特征值 ) 0 cXcX 0 XcXc 0Xc00 110 kkccc XXX X022110 kikii XcXcXcc , , 这表明特征值中至少有一个近似地等于 0。 若 c是对应于特征值 的单位特征向量,则 , , , 更具体地 这说明矩阵 列向量之间存在多重共线性,并且这些多重共线性关系的系数向量就等于接近于 0的那个特征根对应的特征向量。 因此,可以利用的特征值来检验模型的多重共线性 ( 2) 条件指数 ( Condition Index) 将 矩阵的每一列 用其模 相除以实现标准化,然后再求 矩阵的特征值,取其中最大的除以最小的后再求平方根,得到该矩阵的“ 条件数 ”,记为: 通常当 大于 10或 20时,认为存在较明显的多重共线性。 X kX kk XXX m inm a xCI XXCI附:回归系数方差分解 : 如果 V是对角化 的 (K+1) (K+1)对角矩阵:即 其中 是 的特征值构成的对角矩阵。 从而 两种理解:如果特征值之和反映对被解释变量解释程度,倒数之和反映引起估计量方差的比重。 ΛVVXX Λ XX KkvvvbV arKkKkkk ,1,0,21210202 1212 VVXXB V a rXX 1Λ VVXX 首先明确建立模型的目的:经济预测、结构分析或政策评价。 如果建立模型的目的是进行预测,就可以忽略多重共线性。 直接剔除次要或可替代的变量 剔除时 需注意产生新的问题 : ① 当模型存在共线性,若将某个共线性变量去掉,模型的经济意义不合理; ②可能使模型产生异方差性或自相关性; ③若剔除不当 ,可能会产生模型设定误差,造成参数估计严重有偏 四、多重共线性的解决方法 减小参数估计量的方差 多重共线性 的主要 后果 是参数估计量具有较大的方差 , 所以 , 采取适当。167第6章多重共线性
相关推荐
得机械作业收入150000元。 计算该建筑公司应交营业税及应代扣代缴营业税并作出会计处理 • 代扣代交营业税 =100000*3%=30000 • 应交营业税 =( 2020000100000+150000) *3%=61500 • 借:银行存款 2150000 • 贷:主营业务收入 2050000 • 应付账款 100000 • 借:营业税金及附加(工程结算税金及附加) 61500 • 贷
210100222210tttttt uWWWWY 221100 由于 γs, 可以认为原模型存在的自由度不足和多重共线性问题已得到改善。 在实际估计中,阿尔蒙多项式的阶数 γ一般取 2或 3,不超过 4,否则达不到减少变量个数的目的。 Almon法虽然克服了分布滞后模型的多重共线性的影响,适用于多种形式的分布滞后模型,但仍有两个问题需要解决:一是滞后期的长度
某卷烟厂 6月份外购烟丝价款 200 000元,月初库存外购已税烟丝 50 000元,月末库存外购已税烟丝 66 000元。 本月用外购烟丝生产卷烟 20标准箱,取得不含税销售额为 280 000元,款项已收。 烟丝消费税税率 30%,卷烟消费税比例税率为45%和定额税率为每标准箱 150元。 该卷烟厂应纳消费税税额为多少。 例 自产自用 是指纳税人生产应税消费品后,不是用于直接对外销售
401K 455K 412K H G D Pb Sn Bi T T T e3 e Pb Sn Bi T T T e1 e Pb Sn Bi T T T e2 e 二次结晶 面 :二元共晶线到三元共晶线间的线 段,从一个组元温度轴,通过二次结晶线向另 一个组元温度轴滑动,在空间所留下的轨迹 面。 Pb Sn Bi T T T e1 e2 e3 e 液相 (单相 )区 :液相面以上的空间 区域 ;
2121zHGzGzGzGz例: 设闭环离散系统结构如图 ,试求其输出采样信号的 z变换函数 )(1)()(zGHzRGzC第 8章 采样控制系统 第 8章 采样控制系统 第 8章 采样控制系统 Tjez 可见, S平面上的虚轴映射到 Z平面上,为以原点为圆心的单位圆。 当 s位于 S平面虚轴的左边时, σ为负数, 小于 1。 反之,当 s位于 s平面虚轴的右半平面时,为正数,