新人教b版高中数学选修2-332回归分析之一内容摘要:
和随机误差的组合效应为。 用这种方法可以对所有预报变量计算组合效应。 数学上,把每个效应(观测值减去总的平均值)的平方加起来,即用 21()n iiyy表示总的效应,称为 总偏差平方和。 在例 1中,总偏差平方和为 354。 2020/12/24 59 43 61 64 54 50 57 48 体重 /kg 170 155 165 175 170 157 165 165 身高 /cm 8 7 6 5 4 3 2 1 编号 那么,在这个总的效应(总偏差平方和)中,有多少来自于解析变量(身高)。 有多少来自于随机误差。 假设随机误差对体重没有影响,也就是说,体重仅受身高的影响,那么散点图 中所有的点将完全落在回归直线上。 但是,在图中,数据点并没有完全落在回归 直线上。 这些点散布在回归直线附近,所以一定是随机误差把这些点从回归直线上 “推”开了。 在例 1中,残差平方和约为。 因此,数据点和它在回归直线上相应位置的差异 是随机误差的效应, 称 为 残差。 )i iyy(i i ie y y=例如,编号为 6的女大学生,计算随机误差的效应(残差)为: 61 ( 165 ) 对每名女大学生计算这个差异,然后分别将所得的值平方后加起来,用数学符号 21()n i iiyy称为 残差平方和 , 它代表了随机误差的效应。 表示为: 即, ˆˆ( , )Q a b类比样本方差估计总体方差的思想,可以用 作为 的估计量, 越小,预报精度越高。 22111 ˆˆ ˆ ˆ( , ) ( 2 )22nie Q a b nnn 222020/12/24 由于解析变量和随机误差的总效应(总偏差平方和)为 354,而随机误差的效应为 ,所以解析变量的效应为 解析变量和随机误差的总效应(总偏差平方和) =解析变量的效应(回归平方和) +随机误差的效应(残差平方和) = 这个值称为 回归平方和。 我们可以用 相关指数 R2来刻画回归的效果,其计算公式是 22 121()11()ni iiniiyyRyy 残 差 平 方 和。 总 偏 差 平 方 和222 1121( ) ( )()nnii iiiniiy y y yRyy 总 偏 差 平 方 和 残 差 平 方 和 回 归 平 方 和总 偏 差 平 方 和 总 偏 差 平 方 和2020/12/24 离差平方和的分解 (三个平方和的意义) 1. 总偏差平方和 (SST) – 反映因变量的 n 个观察值与其均值的总离差 2. 回归平方和 (SSR) – 反映自变量 x 的变化对因变量 y 取值变化的影响 , 或者说 , 是由于 x 与 y 之间的线性关系引起的 y 的取值变化 , 也称为可解释的平方和 3. 残差平方和 (SSE) – 反映除 x 以外的其他因素对 y 取值的影响 , 也称为不可解释的平方和或剩余平方和 2020/12/24 样本决定系数 (判定系数 R2 ) 2. 反映回归直线的拟合程度 3. 取值范围在 [ 0 , 1 ] 之间 4. R2 。新人教b版高中数学选修2-332回归分析之一
相关推荐
度解 释了 %的产卵数变化。 产卵数y / 个0501001502002503003500 150 300 450 600 750 900 1050 1200 1350t 问题2 变换 y=bx+a 非线性关系 线性关系 21cxy c e问题1 如何选取指数函数的底 ? 5005010015020025030035040045010 5 0 5 10 15 20 25 30 35 40产卵数
,这个 V形架上共120层铅笔,各层的铅笔数自下上成等差数列 ,记为 {an}, a1=1,an=120,n=120,d=1.代入等差数列前 n项和公式可求得结果 应用提升 解:依题知,各层铅笔数自下而上成等差数列,设为{an} 则 a1=1,an=120,n=120,d=1代入公式得 Sn= =7260 21 2 011 2 0 )( 答:这个 V形架上共放了 7260支铅笔 某
注 意 到 ,11( ) [ ( ) ]nniiiiy x y x n y x ( ) [ ( ) ] 0 ,y x n y n x n y x 221( , ) [ ( ) ] ( )niiiQ y x y x n y x
,X) S(X,)= S(,X) 正态曲线下的面积规律 • 对称区域面积相等。 S(x1, x2) x1 x2 x2 x1 S(x1,x2)=S(x2,x1) 特殊区间的概率 : a +a x=μ 若 X~N ,则对于任何实数 a0,概率 为如图中的阴影部分的面积,对于固定的 和 而言,该面积随着 的减少而变大。 这说明 越小 , 落在区间 的概率越大,即 X集中在 周围概率越大