语文版中职数学基础模块下册109一元线性回归3内容摘要:

( 预测 Y )包含残差的散点图 真实值与预测值的差就是回归直线在每个给定点上的误差,我们称之为残差( residual)。 从几何上讲,残差是回归直线到样本数据点之间的垂直距离,确定斜率和截距的方程使回归直线位于样本点之间。 这样,从回归直线到样本点之间的垂直距离相互抵消,使总和为 0。 引例分析 引例分析 X Variable Residual Plot15105051015200 10 20 30 40 50X 投入残差投入与产出例子中沿轴的残差分布 残差也用来确定异常点( outliers),异常点就是与其他点偏离,与总体趋势不符的数据点。 异常点往往使残差幅度加大,在散点图中很容易识别。 回归直线方程会受到计算中每个点的影响,因此,异常点的存在可能会使回归直线向异常点偏离。 回归方程的显著性检验(总体显著性检验) 总平方和分解 YYYYYY iiii  ˆˆ   niininiiii YYYYYY121 122 )ˆ()ˆ()(niiii YYYY10)ˆ)(ˆ( 总平方和分解 图 95 总平 和分解图 总平方和分解 总离差平方和 21()niiS S T Y Y它表示没有 X的影响, 单纯考察数据中 Y的变动情况。 总平方和分解 回归平方和 nii YYSSR12)ˆ(表示各 的变动程度,该变动是由于回归直线 中各 Xi 的变动所引起的,并且通过 X对 Y 的线性影响表现出来。 iYˆ 总平方和分解 误差平方和 niii YYSSE12)ˆ(表示各 Yi围绕所拟合的回归直线的变动程度 SST=SSR+SSE 总平方和分解 SSE=SSTSSR 22 11()niniiiYSST Yn])([121221 niniii nXXbS S R 自由度的分解 SST ni iYY10)(自由度 ƒ T为 n1 SSE β 0和 β 1用了 两个正规方程 自由度 ƒ E为 n2 SSR nii YY10)ˆ(自由度 ƒ R为 1 自由度的分解 自由度的分解可以表示为 n1=1+( n2) ƒT=ƒR+ƒE 回归均方与误差均方 1SSRM SR  2 nSSEM SE(910) (911) 回归均方 误差均方 样本确定系数与样本相关系数 样本确定系数 2 1S S R S S T S S E S S ErS S T S S T S S T   (912) 注 :Y的总变差中能被 X解释的那部分所占的比率 样本确定系数 r2的取值范围 10 2  r样本的全部观察值都落在 所拟和的回归直线上 SSE=0, r2=1 当 X与 Y无关, Y。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。