人教b版选修2-3高中数学32回归分析1内容摘要:
随机误差的组合效应为。 用这种方法可以对所有预报变量计算组合效应。 数学上,把每个效应(观测值减去总的平均值)的平方加起来,即用 21()n iiyy表示总的效应,称为 总偏差平方和。 在例 1中,总偏差平方和为 354。 2020/12/25 14 59 43 61 64 54 50 57 48 体重 /kg 170 155 165 175 170 157 165 165 身高 /cm 8 7 6 5 4 3 2 1 编号 那么,在这个总的效应(总偏差平方和)中,有多少来自于解析变量(身高)。 有多少来自于随机误差。 假设随机误差对体重没有影响,也就是说,体重仅受身高的影响,那么散点图 中所有的点将完全落在回归直线上。 但是,在图中,数据点并没有完全落在回归 直线上。 这些点散布在回归直线附近,所以一定是随机误差把这些点从回归直线上 “推”开了。 在例 1中,残差平方和约为。 因此,数据点和它在回归直线上相应位置的差异 是随机误差的效应, 称 为 残差。 )i iyy(i i ie y y=例如,编号为 6的女大学生,计算随机误差的效应(残差)为: 61 ( 165 ) 对每名女大学生计算这个差异,然后分别将所得的值平方后加起来,用数学符号 21()n i iiyy称为 残差平方和 , 它代表了随机误差的效应。 表示为: 即, ˆˆ( , )Q a b类比样本方差估计总体方差的思想,可以用 作为 的估计量, 越小,预报精度越高。 22111 ˆˆ ˆ ˆ( , ) ( 2 )22nie Q a b nnn 222020/12/25 15 由于解析变量和随机误差的总效应(总偏差平方和)为 354,而随机误差的效应为 ,所以解析变量的效应为 解析变量和随机误差的总效应(总偏差平方和) =解析变量的效应(回归平方和) +随机误差的效应(残差平方和) = 这个值称为 回归平方和。 我们可以用 相关指数 R2来刻画回归的效果,其计算公式是 22 121()11()ni iiniiyyRyy 残 差 平 方 和。 总 偏 差 平 方 和222 1121( ) ( )()nnii iiiniiy y y yRyy 总 偏 差 平 方 和 残 差 平 方 和 回 归 平 方 和总 偏 差 平 方 和 总 偏 差 平 方 和2020/12/25 16 离差平方和的分解 (三个平方和的意义) 1. 总偏差平方和 (SST) – 反映因变量的 n 个观察值与其均值的总离差 2. 回归平方和 (SSR) – 反映自变量 x 的变化对因变量 y 取值变化的影响 , 或者说 , 是由于 x 与 y 之间的线性关系引起的 y 的取值变化 , 也称为可解释的平方和 3. 残差平方和 (SSE) – 反映除 x 以外的其他因素对 y 取值的影响 , 也称为不可解释的平方和或剩余平方和 2020/12/25 17 样本决定系数 (判定系数 R2 ) 2. 反映回归直线的拟合程度 3. 取值范围在 [ 0 , 1 ] 之间 4. R2 1,说。人教b版选修2-3高中数学32回归分析1
相关推荐
1 0 0 0 v2- 1 6 0 0 0 v v - 8 2. 令 y ′ = 0 得 v = 16 或 v = 0( 舍去 ) . 所以函数 v = 16 时取得极值,并且是极小值. 当 v0≥ 16 时, v = 16 使 y 最小. 即全程燃料费最省. 当 v0 1 6 时,可得 y =1 0 0 0 v2v - 8在 (8 , v0] 上递减, 即当 v = v0时, ym
, y应该满足的条件 ,从而可以从实数的角度利用待定系数法和方程思想来处理复数问题 . 复数问题实数化的思想 已知 x , y 为共轭复数,且 ( x + y ) 2 - 3 xy i = 4 - 6i ,求 x , y . [ 解析 ] 设 x = a + b i( a , b ∈ R ) ,则 y = a - b i. 又 ( x + y )2- 3 xy i = 4 - 6i , ∴ 4
“ 虚 ” 为“ 实 ” ,实现化归和转化,从而利用列方程 (组 )的方法解决复数问题. 若 (x+ y- 2)+ (x- y- 4)i= 0(x、 y∈ R),则 x= ________, y= ________. [答案 ] 3 - 1 [ 解析 ] 根据复数相等的充要条件有 x + y - 2 = 0x - y - 4 = 0, ∴ x = 3y =- 1. 四
第一步: H0: 吸烟 和 患病 之间没有关系 通过数据和图表分析,得到结论是: 吸烟与患病有关 结论的可靠程度如何。 患病 不患病 总计 吸烟 a b a+b 不吸烟 c d c+d 总计 a+c b+d a+b+c+d 第二步:列出 2 2列联表 用 χ 2统计量研究这类问题的方法 步骤 第三步:引入一个随机变量: 卡方统计量 第四步:查对临界值表,作出判断。 dcban 其中
+…+2)( xxn ] 叫做这组数据的方差 二、离散型随机变量的方差与标准差 对于离散型随机变量 X的概率分布如下表, (其中 pi≥0, i= 1,2,…, n; p1+ p2+ … + pn= 1) X x1 x2 … xn P p1 p2 … pn 设 μ= E(X),则 (xi- μ)2描述了 xi(i=1,2,...,n)相对于均值 μ的偏离程度,故 (x1- μ)2 p1+
2)( xx +…+2)( xxn ] 叫做这组数据的方差 二、离散型随机变量的方差与标准差 对于离散型随机变量 X的概率分布如下表, (其中 pi≥0, i= 1,2,…, n; p1+ p2+ … + pn= 1) X x1 x2 … xn P p1 p2 … pn 设 μ= E(X),则 (xi- μ)2描述了 xi(i=1,2,...,n)相对于均值 μ的偏离程度,故 (x1-