(人教A版)选修2-3数学 3.1《回归分析的基本思想及其初步应用》ppt课件内容摘要:

1、3 1 回归分析的基本思想及其初步应用 自 主 预 习 学习目标 法及其初步应用2会求回归直线方程,并进行预报 点是了解线性回归模型与函数模型的区别以及回归模型拟合好坏的刻画2难点是残差变量的解释 线性回归模型 (1) 线性回归模型 y ,其中 a 和 b 是模型的未知参数, e 称为 自变量 x 又称为解释变量,因变量y 又称为 a ) 在线性回归方程 y bx a中 bi 1n x yi 1n x2 , a . 其中 x , y , ( x, y) 称为样本点的中心 i 1nx i y i n x yi 1 n b x 1n i 1nx i 1n i 1ny i 问题思考 1 : 随机误差 2、 e 产生的主要原因有哪些。 提示: (1) 所用的确定性函数不恰当引起的误差; (2) 忽略了某些因素的影响; (3) 存在观测误差 2 刻画回归效果的方式 残差 数据点和它在回归直线上相应位置的差异 ( yi) 是随机误差的效应,称 ei y残差图 作图时纵坐标为 ,横坐标可以选为 ,或 ,或 等,这样作出的图形称为残差图 残差 图法 残差点比较均匀地落在水平的带状区域内,说明选用的模型比较适合,这样的带状区域的宽度越窄,说明模型拟合精度越高 残差样本编号 身高数据 体重估计值残差平 方和 残差平方和为 ,残差平方和 ,模型拟合效果越好 相关 指数 1 , 变量对 变量变化的贡献率, ,表 3、示回归的效果越好 i 1n( y i y i ) 2 越小i 1n y i y i2i 1n y i y 2解释预报问题思考 2 :在回归分析中,相关指数 R 2 的值越大,则残差平方和越大还是越小。 提示: 相关指数 R 2 的值越大,说明回归模型拟合的效果越好,残差平方和越小,反之,相关指数 R 2 的值越小,残差平方和越大 . 要 点 导 学 要点一 求线性回归方程1. 利用公式 bi 1n xyi 1n x2时,先求出 x1n( , y1n( , i 1 i 1 由 a y bx求出 a的值,最后写出线性回归方程 2 线性回归方程中的回归截距 a和回 归系数 b都是通过样本估计得来的, 4、存在着误差,这种误差可能导致预测结果的偏差 3 线性回归方程 y a bx 中的 b表示 x 增加 1 个单位时,y的平均变化量为 b,而 a表示 y不随 x 的变化而变化的部分 4 可以利用线性回归方程 y a bx 预测在 x 取某一个值时 y 的估计值 某地区 2007 年至 2013 年农村居民家庭人均纯收入 y ( 单位:千元 ) 的数据如下表: 年份 2007 2008 2009 2010 201 1 2012 2013 年份代号 t 1 2 3 4 5 6 7 人均纯收入 y (1) 求 y 关于 t 的线性回归方程; (2) 利用 (1) 中的回归方程,分析 2007 年至 2 5、 013 年该地区农村居民家庭人均纯收入的变化情况,并预测该地区 2015 年农村居民家庭人均纯收入 附:回归直线的斜率和截距的最小二乘估计公式分别为: bi 1n t y i 1n t 2, a y bt . 【思路启迪】 (1) 由公式求出 a , b ,写出回归直线方程 (2)利用回归方程分析 【解】 (1) 由所给数据计算得 t17(1 2 3 4 5 6 7) 4 , y17( i 17( t)2 9 4 1 0 1 4 9 28 , i 17( t)( y) ( 3) ( ( 2) ( 1) ( 1) ( 0 1 2 3 14 , bi 17 t yi 17 t21428 a y 6、bt 4 所求回归方程为 y 0.5 t (2) 由 (1) 知, b ,故 2007 年至 2013 年该地区农村居民家庭人均纯收入逐年增加,平均每年增加 元 将 2015 年的年份代号 t 9 代入 (1) 中的回归方程,得 y 9 故预测该地区 2015 年农村居民家庭人均纯收入为 元 进行线性回归分析的关键是画出样本点的散点图,确定出变量具有线性相关关系,再求出回归直线方程如果 x , y 的线性相关关系具有统计意义,就可以用线性回归方 程来作预测和控制 某工厂 1 8 月份某种产品的产量与成本的统计数据见下表: 月份 1 2 3 4 5 6 7 8 产量 ( 吨 ) 成本 ( 万元 7、) 130 136 143 149 157 172 183 188 以产量为 x ,成本为 y . (1) 画出散点图; (2) y 与 x 是否具有线性相关关系。 若有,求出其回归方程 解: (1) 由表画出散点图,如图所示 (2) 从上图可看出,这些点基本上散布在一条直线附近,可以认为 x 和 y 线性相关关系显著,下面求其回归方程,首先列出下表 . 序号 xi yi x y 30 6 900 36 8 496 43 0 449 49 2 201 57 4 649 1 72 9 584 1 83 3 489 1 88 5 344 1 258 01 112 8 y bi 188 xyi 188 8、 x28 8 8 a y bx 故线性回归方程为 y x 要点二 线性回归分析线性回归问题应先通过散点图来分析两变量间的关系 是否线性相关,然后再利用求回归方程的公式求解回归方程,并利用残差图或相关指数 此基础上,借助回归方程对实际问题进行分析 为研究重量 x ( 单位:克 ) 对弹簧长度 y ( 单位:厘米 ) 的影响,对不同重量的 6 个物体进行测量,数据如下表所示: x 5 10 15 20 25 30 y 1 (1) 作出散点图并求线性回归方程; (2) 求出 (3) 进行残差分析 【思路启迪】 作残差分析时,一般从以下几个方面予以说明: (1) 散点图; (2 ) 相关系数; (3) 9、 相关指数; (4) 残差图中的异常点和样本点的带状分布区域的宽窄 【解】 (1) 散点图如图 x16(5 10 15 20 25 30) y16( 1 i 162 275 , i 161 计算得, b a 所求回归直线方程为 y x . (2) 列表如下: y y 所以 i 16( yi)2 8 , i 16( y)2 . 所以, 1 , 回归模型的拟合效果较好 (3) 由残差表中的数值可以看出第 3 个样本点的残差比较大,需要确认在采集这个数据的时候是否有人为的错误,如果有的话,需要纠正数据,重新建立回归模型;由表中数据可以看出残差点比较均匀地落在不超过 狭窄的水平带状区域中,说明选用的线 10、性回归模型的精度较高,由以上分析可知,弹簧长度与拉力成线性关系 利用残差分析研究两个变量间的关系时,首先要根据散点图来粗略判断它们是否线性相关,是否可以用线性回归模型来拟合数据然后通过残差 e 1 , e 2 , , e n 来判断模型拟合的效果,判断原始数据中是否存在可疑数据 在一段时间内,某种商品的价格 x ( 元 ) 和需求量 y ( 件 ) 之间的几组数据如下表: 价格 x / 元 14 16 18 20 22 需求量 y / 件 12 10 7 5 3 求出 y 与 x 的回归直线方程,并说明拟合效果的好坏 解: 由题意得 x15(14 16 22) 18 , y15(12 10 3) i 15142 162 222 1 660 , i 15122 102 32 327 , i 15。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。