新人教b版高中数学选修2-332回归分析之一内容摘要:

和随机误差的组合效应为。 用这种方法可以对所有预报变量计算组合效应。 数学上,把每个效应(观测值减去总的平均值)的平方加起来,即用 21()n iiyy表示总的效应,称为 总偏差平方和。 在例 1中,总偏差平方和为 354。 2020/12/24 59 43 61 64 54 50 57 48 体重 /kg 170 155 165 175 170 157 165 165 身高 /cm 8 7 6 5 4 3 2 1 编号 那么,在这个总的效应(总偏差平方和)中,有多少来自于解析变量(身高)。 有多少来自于随机误差。 假设随机误差对体重没有影响,也就是说,体重仅受身高的影响,那么散点图 中所有的点将完全落在回归直线上。 但是,在图中,数据点并没有完全落在回归 直线上。 这些点散布在回归直线附近,所以一定是随机误差把这些点从回归直线上 “推”开了。 在例 1中,残差平方和约为。 因此,数据点和它在回归直线上相应位置的差异 是随机误差的效应, 称 为 残差。 )i iyy(i i ie y y=例如,编号为 6的女大学生,计算随机误差的效应(残差)为: 61 ( 165 )    对每名女大学生计算这个差异,然后分别将所得的值平方后加起来,用数学符号 21()n i iiyy称为 残差平方和 , 它代表了随机误差的效应。 表示为: 即, ˆˆ( , )Q a b类比样本方差估计总体方差的思想,可以用 作为 的估计量, 越小,预报精度越高。 22111 ˆˆ ˆ ˆ( , ) ( 2 )22nie Q a b nnn  222020/12/24 由于解析变量和随机误差的总效应(总偏差平方和)为 354,而随机误差的效应为 ,所以解析变量的效应为 解析变量和随机误差的总效应(总偏差平方和) =解析变量的效应(回归平方和) +随机误差的效应(残差平方和) = 这个值称为 回归平方和。 我们可以用 相关指数 R2来刻画回归的效果,其计算公式是 22 121()11()ni iiniiyyRyy   残 差 平 方 和。 总 偏 差 平 方 和222 1121( ) ( )()nnii iiiniiy y y yRyy    总 偏 差 平 方 和 残 差 平 方 和 回 归 平 方 和总 偏 差 平 方 和 总 偏 差 平 方 和2020/12/24 离差平方和的分解 (三个平方和的意义) 1. 总偏差平方和 (SST) – 反映因变量的 n 个观察值与其均值的总离差 2. 回归平方和 (SSR) – 反映自变量 x 的变化对因变量 y 取值变化的影响 , 或者说 , 是由于 x 与 y 之间的线性关系引起的 y 的取值变化 , 也称为可解释的平方和 3. 残差平方和 (SSE) – 反映除 x 以外的其他因素对 y 取值的影响 , 也称为不可解释的平方和或剩余平方和 2020/12/24 样本决定系数 (判定系数 R2 ) 2. 反映回归直线的拟合程度 3. 取值范围在 [ 0 , 1 ] 之间 4. R2 。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。