双变量线性回归模型-简单线性回归模型(ppt91)-经营管理(编辑修改稿)内容摘要:

  2)( YYt YYt 37 (海量营销管理培训资料下载 ) 38 (海量营销管理培训资料下载 ) 对于第 t个观测值 , 有: = 对于全部 N项观测值平方求和 , 有: ( 7) 由于  )ˆ()ˆ( tttt YYYYYY tt eYY  )ˆ(     ttttt eYYeYYYY )ˆ(2)ˆ()( 222tt XY  ˆˆˆ XY  ˆˆ )(ˆˆ XXYY tt  39 (海量营销管理培训资料下载 ) ( 7)式中最后一项变为: 由 (1)式、 (2)式(书 P41 和 )和残差的定义,显然有: 和 因此,( 7)式中最后一项为 0,我们得到如下结果: ( 8) 即 总变差 = 由 X解释的变差 + 未解释变差   )(ˆ2 ttt eXeX0 te 0 tteX   222 )ˆ()( ttt eYYYYtttt eXXeYY )ˆ(ˆ2)ˆ(2   40 (海量营销管理培训资料下载 ) 三 . 拟合优度的测度 1. 决定系数 不难看出 , 总变差中由 X解释的变差比例越大 , 则 就越小 , 各观测值聚集在回归直线周围的紧密程度就越大 ,说明直线与观测值的拟合越好。 我们将 ( 8) 式两端都除以总变差 , 得: 并定义决定系数 为: = = =  2te  2)( YYt1)()()ˆ(2222YYeYYYYtttt2R总变差解释变差2R22)()ˆ(YYYYtt22)(1 YYett2R41 (海量营销管理培训资料下载 ) 用符号表示为: 其中 , ESS—— Explained Sum of Squares RSS—— Residual Sum of Squares TSS—— Total Sum of Squares 决定系数 R2 计量了 Y的总变差中可以归因于 X和Y之间关系的比例 , 或者说 Y的变动中可以由 X的变动来解释的比例。 它是回归线对各观测点拟合紧密程度的测度。 2R =T S SE S S =T S SR S S142 (海量营销管理培训资料下载 ) 我们有: R2 =1:完全拟合 , R2 =0: X与 Y完全不存在线性关系 , = R2的值越高 , 拟合得越好。 但什么是高。 回归中使用时间序列数据 还是横截面数据有不同的标准。 对时间序列数据来说 , R2 的值在 、 以上是很常见的事 , 而在横截面数据的情况下 , 、 R2 值也不能算低。 10 2  R  02te 2te   2)( YY t43 (海量营销管理培训资料下载 ) 2. 相关系数 r 由 R2 很容易联想到我们在统计中学过的相关系数。 相关系数 r与决定系数的关系为: R2 =( r2) , 相关系数的计算公式为: 相关系数 r也是拟合优度的测度 , 其符号取决于 的符号 ( 即 的符号 ) 我们有: 1 ≤ r ≤ 1 r = 1:完全正相关 r = 1:完全负相关 r = 0: 无线性关系 22ttttyxyxr tt yxˆ44 (海量营销管理培训资料下载 ) 相关系数和决定系数的计算很简单 , 事实上 , 我们只要在原列表计算 的表格中加上一个计算 的栏目就行了。 对于 我们前面的例子 , 列表计算得: = 154, 因此: r = R2 =( ) 2 = 它表明 , 在我们的例子中 , X与 Y存在着很强的线性关系 ,拟合甚佳 , 但由于观测点很少 ( 5个 ) , 因而对此结论应持谨慎态度。 2ty 2ty9 9 3 5 41 0 0 03 9 0 45 (海量营销管理培训资料下载 ) 第四节 双变量回归中的区间估计和假设检验 一 、 β的置信区间 我们在上一节中已得出 , 在 5条假设条件成立的情况下 , 有 ∽ 与估计量相联系的概率分布的标准差 (standard deviation), 通常称为标准误差 (standard error), 用 Se或 SE表示。 的标准误差为: Se( ) = ),( 22 txN 2txˆˆˆ46 (海量营销管理培训资料下载 ) 如果 σ为已知 , 则我们可以立即给出总体参数 β的95%的置信区间为: 177。 或 177。 Se( ) 但实际上 , 我们一般无法知道扰动项分布的方差 2 ,而必须根据样本数据估计出 2 , 然后再来考虑 β的置信区间的计算问题。 ˆˆˆ 2tx47 (海量营销管理培训资料下载 ) 2 的估计 我们可以用残差来估计扰动项 ut 的方差 2 : 可以证明 , 是 2的无偏估计量 . 上式中的 , 我们可以直接从残差的定义式 计算得到 , 也可以通过下面的公式求出: 2ˆ22ne t2ˆttt XYe  ˆˆ    tttt yxye ˆ22 2te48 (海量营销管理培训资料下载 ) 推导如下: 由 et的定义及 ˆ 的计算公式,有: XYeXYtttˆˆˆˆ 因而 ttttttttxyXXYYeeXXYYˆ)(ˆ)()(ˆ49 (海量营销管理培训资料下载 ) )2ˆ(ˆˆˆ2)ˆ(2222222tttttttttttyxxyxyxyxye 将 代入栝号中 , 得: 因此我们有: 2ˆtttxyxtttttttttttyxyyxxxyxye ˆ)2(ˆ222222ˆˆ22  nyxy ttt 50 (海量营销管理培训资料下载 ) β的置信区间 我们重新定义 的标准误差为: Se( ) = 则检验统计量 t = = ∽ t(n2) 故 β的置信区间为: 即 ˆ 2ˆtxˆ)ˆ()ˆ(ˆSeE2/ˆˆtx)ˆ(ˆ 2/   Set 22/ /ˆˆ txt  51 (海量营销管理培训资料下载 ) 即为。 也就是说,我们有 95%的把握说 β在 至。 例 设回归方程为: ttXY ˆ且 2x = 64 ,  xy = 37 , 2y = 44 , n= 10求 β 的 95% 置信区间解:2ˆ22net =2ˆ2 nyxyttt=21037*= 2. 82 S e ( ˆ)=2ˆtx=64= 0. 21β 的 95% 置信区间为:)ˆ()8(ˆ Set= 0. 58 177。 2. 30 6* 0 . 2152 (海量营销管理培训资料下载 ) 二 、 假设检验 假设检验的方法 有了上一段的重要结果 t = ∽ t(n2) 我们进行有关总体参数 β的假设检验就很容易了。 假设检验的步骤: ( 1) 建立关于总体的原假设和备择假设。 ( 2) 计算检验统计量 , 检验原假设 ( 是否出现小概率事件 )。 ( 3) 得出关于原假设是否合理的结论 . )ˆ()ˆ(ˆSeE53 (海量营销管理培训资料下载 ) 例 1:仍用上一段例中的数据 , 我们要检验的是: 原假设: H0: β= 备择假设: H1: β< 这是一个单侧检验的问题。 我们有: t = = = 用 =n2=102=8查 t表 , 截断左侧 5%面积的 t 临界值 tc = ∵ t = › 故接受原假设 H0, 即 β= )ˆ(ˆSe54 (海量营销管理培训资料下载 ) 图 55 (海量营销管理培训资料下载 ) 系数的显著性检验 在假。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。