人教a版(选修2-3)回归分析的基本思想及其初步应用内容摘要:

abxy 回归模型: eabxy 如何描述两个变量之间线性相关关系的强弱。 在 《 数学 3》 中,我们学习了用相关系数 r来衡量两个变量 之间线性相关关系的方法。 相关系数 r 12211( ) ( ).( ) ( )niiinniiiix x y yx x y y[ 5 1 ] ,[ 1 , 5 ] ,[ 0 25 , 5 ] ,rrr  当 , 表 明 两 个 变 量 正 相 关 很 强 ;当 表 明 两 个 变 量 负 相 关 很 强 ;当 . 表 明 两 个 变 量 相 关 性 较 弱。 相关关系的测度 (相关系数取值及其意义) + 0 + 完全负相关 无线性相关 完全正相关 负相关程度增加 r 正相关程度增加 对回归模型进行统计检验 思考 P6: 如何刻画预报变量(体重)的变化。 这个变化在多大程度上 与解析变量(身高)有关。 在多大程度上与随机误差有关。 假设身高和随机误差的不同不会对体重产生任何影响,那么所有人的体重将相 同。 在体重不受任何变量影响的假设下,设 8名女大学生的体重都是她们的平均值, 即 8个人的体重都为。 体重 /kg 170 155 165 175 170 157 165 165 身高 /cm 8 7 6 5 4 3 2 1 编号 在散点图中,所有的点应该落在同一条 水平直线上,但是观测到的数据并非如 此。 这就意味着 预报变量(体重)的值 受解析变量(身高)或随机误差的影响。 59 43 61 64 54 50 57 48 体重 /kg 170 155 165 175 170 157 165 165 身高 /cm 8 7 6 5 4 3 2 1 编号 例如,编号为 6的女大学生的体重并没有落在水平直线上,她的体重为 61kg。 解析 变量(身高)和随机误差共同把这名学生的体重从 “推”到了 61kg,相差 , 所以 组合效应。 编号为 3的女大学生的体重并也没有落在水平直线上,她的体重为 50kg。 解析 变量(身高)和随机误差共同把这名学生的体重从 50kg“推”到了 ,相差 , 这时解析变量和随机误差的组合效应为。 用这种方法可以对所有预报变量计算组合效应。 数学上,把每个效应(观测值减去总的平均值)的平方加起来,即用 21()n iiyy表示总的效应,称为 总偏差平方和。 在例 1中,总偏差平方和为 354。 59 43 61 64 54 50 57 48 体重 /kg 170 155 165 175 170 157 165 165 身高 /cm 8 7 6 5 4 3 2 1 编号 那么,在这个总的效应(总偏差平方和)中,有多少来自于解析变量(身高)。 有多少来自于随机误差。 假设随机误差对体重没有影响,也就是说,体重仅受身高的影响,那么散点图 中所有的点将完全落在回归直线上。 但是,在图中,数据点并没有完全落在回归 直线上。 这些点散布在回归直线附近,所以一定是随机误差把这些点从回归直线上 “推”开了。 在例 1中,残差平方和约为。 因此,数据点和它在回归直线上相应位置的差异 是随机误差的效应, 称 为 残差。 )i iyy(i i ie y y=例如,编号为 6的女大学生,计算随机误差的效应(残差)为: 61 ( 165 )    对每名女大学生计算这个差异,然后分别将所得的值平方后加起来,用数学符号。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。