统计学第四版一元线性回归(编辑修改稿)内容摘要:

2. 一元线性 回归模型可表示为 y =  + 1 x +   y 是 x 的线性函数 (部分 )加上误差项  线性部分反映了由于 x 的变化而引起的 y 的变化  误差项  是随机变量  反映了除 x 和 y 之间的线性关系之外的随机因素对 y 的影响  是不能由 x 和 y 之间的线性关系所解释的变异性  0 和 1 称为模型的参数 9 31 统计学STATISTICS (第四版 ) 2020915 一元线性回归模型 (基本假定 ) 1. 因变量 x与自变量 y之间具有线性关系 2. 在重复抽样中,自变量 x的取值是固定的,即假定 x是非随机的 3. 误差项  满足  正态性。 是 一个服从正态分布的随机变量,且期望值为 0,即  ~N(0 , 2 )。 对于一个给定的 x 值, y 的期望值为 E(y)=0+ 1x  方差齐性。 对于所有的 x 值, 的方差一个特定的值,的方差也都等于 2 都相同。 同样,一个特定的 x 值, y 的方差也都等于 2  独立性。 独立性意味着对于一个特定的 x 值,它所对应的 ε与其他 x 值所对应的 ε不相关;对于一个特定的 x 值,它所对应的 y 值与其他 x 所对应的 y 值也不相关 9 32 统计学STATISTICS (第四版 ) 2020915 估计的回归方程 (estimated regression equation) 0ˆ 1ˆ0 11. 总体 回归参数 和 是未知的 , 必须利用样本数据去估计 2. 用样本统计量 和 代替回归方程中的未知参数 和 , 就得到了 估计的回归方程 3. 一元线性回归中估计的回归方程为 0 1xy 10 ˆˆˆ  +其中: 是估计的回归直线在 y 轴上的截距 , 是直线的斜率 , 它表示对于一个给定的 x 的值 , 是 y 的估计值 , 也表示 x 每变动一个单位时 , y 的平均变动值 0ˆ 1ˆyˆ 参数的最小二乘估计 一元线性回归的估计和检验 9 34 统计学STATISTICS (第四版 ) 2020915 参数的最小二乘估计 (method of least squares ) 最小 niiinii xyyy121012 )ˆˆ()ˆ( 1. 德国科学家 Karl Gauss(1777— 1855)提出用最小化图中垂直方向的误差平方和来估计参数 2. 使因变量的观察值与估计值之间的误差平方和达到最小来求得 和 的方法。 即 3. 用最小二乘法拟合的直线来代表 x与 y之间 的关系与实际数据的误差比其他任何直线都小 0ˆ 1ˆ9 35 统计学STATISTICS (第四版 ) 2020915 Karl Gauss的最小化图 x y (xn , yn) (x1 , y1)          (x2 , y2) (xi , yi) ei = yiyi ^ xy 10 ˆˆˆ  +9 36 统计学STATISTICS (第四版 ) 2020915 参数的最小二乘估计 ( 和 的计算公式 )  根据最小二乘法 , 可得求解 和 的公式如下 1ˆ0ˆ0ˆ 1ˆ9 37 统计学STATISTICS (第四版 ) 2020915 参数的最小二乘估计 (例题分析 ) 【 例 94】 根据例 91的数据 , 求销售收入与广告费用的估计的回归方程 第 1步: 选择 【 工具 】 下拉菜单 , 并选择 【 数据分析 】 选项 第 2步: 在分析工具中选择 【 回归 】 , 选择 【 确定 】 第 2步: 当对话框出现时 在 【 Y值输入区域 】 设置框内键入 Y的数据区域 在 【 X值输入区域 】 设置框内键入 X的数据区域 在 【 置信度 】 选项中给出所需的数值 在 【 输出选项 】 中选择输出区域 在 【 残差 】 分析选项中选择所需的选项 回归分析 9 38 统计学STATISTICS (第四版 ) 2020915 参数的最小二乘估计 (Excel输出结果 ) 【 例 】 求销售收入与广告费用的估计回归方程 , 并解释回归系数的含义 9 39 统计学STATISTICS (第四版 ) 2020915 用 SPSS进行回归 第 1步: 选择 【 Analyze】 下拉菜单,并选择 【 Regression linear】 选项,进入主对话框 第 2步: 在主对话框中将因变量 (本例为销售收入 )选入 【 Dependent】 ,将自变量 (本例为广告费用 )选入 【 Independent(s)】 第 3步: 点击 【 Save】 在 【 Predicted Values】 下选中 【 Unstandardized】 (输出点预测值 ) 在 【 Prediction interval】 下选中 【 Mean】 和 【 Individual】 (输出置信区间和预测区间 ) 在 【 Confidence Interval】 中选择所要求的置信水平 (隐含值 95%,一般不用改变 ) 在 【 Residuals】 下选中 【 Unstandardized】 和 【 standardized】 (输出残差和标准化残差 ) 点击 【 Continue】 回到主对话框。 点击 【 OK】 进行回归 9 40 统计学STATISTICS (第四版 ) 2020915 参数的最小二乘估计 (SPSS输出结果 ) 9 41 统计学STATISTICS (第四版 ) 2020915 参数的最小二乘估计 (例题分析 ) xy + 回归直线的拟合优度 一元线性回归的估计和检验 9 43 统计学STATISTICS (第四版 ) 2020915 变差 1. 因变量 y 的取值是不同的 , y 取值的这种波动称为 变差。 变差来源于两个方面  由于自变量 x 的取值不同造成的  除 x 以外的其他因素 (如 x对 y的非线性影响 、测量误差等 )的影响 2. 对一个 具体的观测值来说 , 变差的大小可以通过该实际观测值与其均。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。