违背基本假设的回归分析(编辑修改稿)内容摘要:

扩大因子法 目录 上页 下页 返回 结束 2020/9/16 中国人民大学六西格玛质量管理研究中心 86 167。 关于多重共线性问题 目录 上页 下页 返回 结束 2020/9/16 中国人民大学六西格玛质量管理研究中心 87 167。 关于多重共线性问题 目录 上页 下页 返回 结束 2020/9/16 中国人民大学六西格玛质量管理研究中心 88 167。 关于多重共线性问题 目录 上页 下页 返回 结束 2020/9/16 中国人民大学六西格玛质量管理研究中心 89 167。 关于多重共线性问题 目录 上页 下页 返回 结束 2020/9/16 中国人民大学六西格玛质量管理研究中心 90 167。 关于多重共线性问题 以下用 SPSS软件诊断例 线性问题。 在线性回归对话框的 Statitics选项框中点选Collinearity diagnostic共线性诊断选项,然后做回归。 输出以下结果: 目录 上页 下页 返回 结束 2020/9/16 中国人民大学六西格玛质量管理研究中心 91 167。 关于多重共线性问题 一般情况下 ,当一个回归方程存在严重的多重共线性时 ,有若干个自变量所对应的方差扩大因子大于 10,这个回归方程多重共线性的存在就是方差扩大因子超过 10的这几个变量引起的 ,说明这几个自变量间有一定的多重共线性的关系存在。 目录 上页 下页 返回 结束 2020/9/16 中国人民大学六西格玛质量管理研究中心 92 167。 关于多重共线性问题 (2)特征根判定法 特征根分析 条件数 目录 上页 下页 返回 结束 2020/9/16 中国人民大学六西格玛质量管理研究中心 93 167。 关于多重共线性问题 目录 上页 下页 返回 结束 2020/9/16 中国人民大学六西格玛质量管理研究中心 94 167。 关于多重共线性问题 对例 ,用 SPSS软件计算出特征根与条件数如下: 目录 上页 下页 返回 结束 2020/9/16 中国人民大学六西格玛质量管理研究中心 95 167。 关于多重共线性问题 目录 上页 下页 返回 结束 2020/9/16 中国人民大学六西格玛质量管理研究中心 96 167。 关于多重共线性问题 (3)直观判定法 上述方法是为了诊断共线性是否存在的专门方法 ,相对这几种方法,还有一些在建模过程中顺便直观判断的非正规方法。 目录 上页 下页 返回 结束 2020/9/16 中国人民大学六西格玛质量管理研究中心 97 167。 关于多重共线性问题 ,或者改变一个观测值时 ,回归系数的估计值发生较大变化 ,我们就认为回归方程存在严重的 ,一些重要的自变量在回归方程中没有通过显著性检验时 ,可初步判断存在着严重的多重共线性。 ,我们认为存在多重共线性问题。 ,自变量间的相关系数较大时 ,我们认为可能会出现多重共线性问题。 ,我们认为可能存在多重共线性。 目录 上页 下页 返回 结束 2020/9/16 中国人民大学六西格玛质量管理研究中心 98 167。 关于多重共线性问题 四、消除多重共线性的方法 当通过某种检验 ,发现解释变量中存在严重的多重共线性时 ,我们就要设法消除这种共线性。 消除多重共线性的方法很多 ,常用的有下面几种。 ( 1)剔除一些不重要的解释变量 通常在经济问题的建模中 ,由于我们认识水平的局限 ,容易考虑过多的自变量。 当涉及自变量较多时 ,大多数回归方程都受到多重共线性的影响。 这时 ,最常用的办法是首先用第五章的方法做自变量的选元 , 舍去一些自变量。 目录 上页 下页 返回 结束 2020/9/16 中国人民大学六西格玛质量管理研究中心 99 167。 关于多重共线性问题 当回归方程中的全部自变量都通过显著性检验后 , 回归方程中仍然存在严重的多重共线性 ,有几个变量的方差扩大因子大于 10,我们可把方差扩大因子最大者所对应的自变量首先剔除 , 再重新建立回归方程 , 如果仍然存在严重的多重共线性 , 则再继续剔除方差扩大因子最大者所对应的自变量 , 直到回归方程中不再存在严重的多重共线性为止。 有时 , 根据所研究的问题的需要 , 当回归方程中仍然存在严重的多重共线性时 , 也可以首先剔除方差扩大因子最大者所对应的自变量 , 依次剔除 , 直到消除了多重共线性为止 , 然后再做自变量的选元。 或者根据所研究问题的经济意义 , 决定保留或剔除某自变量。 目录 上页 下页 返回 结束 2020/9/16 中国人民大学六西格玛质量管理研究中心 100 167。 关于多重共线性问题 在选择回归模型时 ,可以将回归系数的显著性检验、方差扩大因子 VIF的多重共线性检验与自变量的经济含义结合起来考虑,以引进或剔除变量。 目录 上页 下页 返回 结束 2020/9/16 中国人民大学六西格玛质量管理研究中心 101 167。 关于多重共线性问题 目录 上页 下页 返回 结束 2020/9/16 中国人民大学六西格玛质量管理研究中心 102 167。 关于多重共线性问题 目录 上页 下页 返回 结束 2020/9/16 中国人民大学六西格玛质量管理研究中心 103 167。 关于多重共线性问题 ( 2)增大样本容量 建立一个实际经济问题的回归模型 ,如果所收集的样本数据太少 ,也容易产生多重共线性。 增大样本容量也是消除多重共线性的一个途径。 目录 上页 下页 返回 结束 2020/9/16 中国人民大学六西格玛质量管理研究中心 104 167。 关于多重共线性问题 在实践中 ,当我们所选的变量个数接近样本容量 n时 ,自变量间就容易产生共线性。 所以我们在运用回归分析研究经济问题时 ,要尽可能使样本容量 n远大于自变量个数 p。 增大样本容量的方法在有些经济问题中是不现实的 ,因为在经济问题中 ,许多自变量是不受控制的 ,或由于种种原因不可能再得到一些新的样本数据。 在有些情况下 ,虽然可以增大一些样本数据 ,但自变量个数较多时 ,我们往往难以确定增加什么样的数据 ,才能克服多重共线性。 有时 ,增加了样本数据 ,但可能新数据距离原来样本数据的平均值较大 ,会产生一些新的问题 ,使模型拟合变差 ,没有收到增加样本数据期望的效果。 目录 上页 下页 返回 结束 2020/9/16 中国人民大学六西格玛质量管理研究中心 105 167。 关于多重共线性问题 ( 3)回归系数的有偏估计 消除多重共线性对回归模型的影响是近 40年来统计学家们关注的热点课题之一 ,除以上方法被人们应用外 ,统计学家还致力于改进古典的最小二乘法 ,提出以采用有偏估计为代价来提高估计量稳定性的方法 ,如岭回归法 ,主成分法 ,偏最小二乘法等 ,这些方法已有不少应用效果很好的经济例子 ,而且在计算机如此发达的今天 ,具体计算也不难实现。 目录 上页 下页 返回 结束 2020/9/16 中国人民大学六西格玛质量管理研究中心 106 167。 异常值与强影响值 在回归分析的应用中,数据时常包含着一些异常的或极端的观察值,这些观察值与其他数据远远分开,可能引起较大的残差,极大地影响回归拟合的效果。 在一元回归的情况下,用散点图或残差图就可以方便地识别出异常值,而在多元回归的情况下,用简单画图法识别异常值就很困难,需要更有效的方法。 异常值分为两种情况,一种是关于因变量 y异常,另一种是关于自变量 x异常。 以下分别讨论着两种情况。 目录 上页 下页 返回 结束 2020/9/16 中国人民大学六西格玛质量管理研究中心 107 167。 异常值与强影响值 一、关于因变量 y的异常值 目录 上页 下页 返回 结束 2020/9/16 中国人民大学六西格玛质量管理研究中心 108 167。 异常值与强影响值 目录 上页 下页 返回 结束 2020/9/16 中国人民大学六西格玛质量管理研究中心 109 167。 异常值与强影响值 目录 上页 下页 返回 结束 2020/9/16 中国人民大学六西格玛质量管理研究中心 110 167。 异常值与强影响值 目录 上页 下页 返回 结束 2020/9/16 中国人民大学六西格玛质量管理研究中心 111 167。 异常值与强影响值 二、关于自变量 x的异常值 目录 上页 下页 返回 结束 2020/9/16 中国人民大学六西格玛质量管理研究中心 112 167。 异常值与强影响值 强影响点并不一定是 y值的异常值点,因而强影响点并不总会对回归方程造成不良影响。 但是强影响点是 y的异常值点的可能性要远大于普通的样本点,这是由于以下两个原因: 第一,在实际问题中,因变量与自变量的线性关系只是在一定的范围内成立,强影响点远离样本中心,因变量与自变量之间已不再是线性函数关系,强影响点的 y值远离线性回归方程,自然成为异常值; 第二,即使强影响点并不是 y的异常值,但是强影响点远离样本中心,能够把回归方程拉向自己,使回归方程产生偏移。 对强影响点应该有足够的重视。 由于强影响点并不总是 y的异常值点,因而不能单纯根据杠杆值的大小判断强影响点是否异常。 目录 上页 下页 返回 结束 2020/9/16 中国人民大学六西格玛质量管理研究中心 113 167。 异常值与强影响值 为此,我们引入库克距离,用来判断强影响点是否为 y的异常值点。 目录 上页 下页 返回 结束 2020/9/16 中国人民大学六西格玛质量管理研究中心 114 167。 异常值与强影响值 目录 上页 下页 返回 结束 2020/9/16 中国人民大学六西格玛质量管理研究中心 115 167。 异常值与强影响值 目录 上页 下页 返回 结束 2020/9/16 中国人民大学六西格玛质量管理研究中心 116 167。 异常值与强影响值 三、异常值实例分析 目录 上页 下页 返回 结束 2020/9/16 中国人民大学六西格玛质量管理研究中心 117 167。 异常值与强影响值 目录 上页 下页 返回 结束 2020/9/16 中国人民大学六西格玛质量管理研究中心 118 167。 异常值与强影响值 诊断出异常值后,进一步要判断引起异常值的原因。 引起异常值的原因有以下几条: 对引起异常值的不同原因,需要采取不同的处理方法。 对本例的数据,通过核实认为不存在登记误差和测量误差。 目录 上页 下页 返回 结束 2020/9/16 中国人民大学六西格玛质量管理研究中心 119 167。 异常值与强影响值 目录 上页 下页 返回 结束 2020/9/16 中国人民大学六西格玛质量管理研究中心 120 167。 异常值与强影响值 目录 上页 下页 返回 结束 2020/9/16 中国人民大学六西格玛质量管理研究中心 121 167。 异常值与强影响值 目录 上页 下页 返回 结束 2020/9/16 中国人民大学六西格玛质量管理研究中心 122 2020/9/16 中国人民大学六西格玛质量管理研究中心 123 第 7章 • 167。 自变量选择对估计和预测的影响 • 167。 所有子集回归 • 167。 逐步回归 • 167。 实例与评注 目录 上页 下页 返回 结束 2020/9/16 中国人民大学六西格玛质量管理研究中心 124 第 7章 • 在建立一个实际问题的回归模型时。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。