垃圾减量分类活动中社会及个体因素的量化分析_毕业论文(编辑修改稿)内容摘要:

nni i iiiQ e y y  为残差平方和,即 ()Q。 (3) 统计分析 不加证明地给出以下结果: ①  是  的线性无偏最小方差估计。 指的是  是 Y 的线性函数:  的期望等于  ;在  的线性无偏估计中 ,  的方差最小。 ②  服从正态分布 21( , ( , ) )TN X X    1( , )TXX =()ij nnc  ③ 对残差平方和 Q , EQ = 2( 1)nm ,且 222 ( 1)Q nm  由此得到的 2 的无偏估计 22 1Qs nm  ④ 对总平方和 21 ()niiSST y y进行分解,有  / ~1/ ( 1 )j jjjct t n mQ n m  , 21 ()niiU y y 其中 Q 是由 上式 定义的残差平方和,反映随机误差对 y 的影响, U 称为回归平方和,反映自变量对 y 的影响。 上面的分解中利用了正规方程组。 10 (4)回归模型的假设检验 因变量 y 与自变量 1,mxx之间是否存在如模型( 20)所示的线性关系就不明显,显然,如果所有的 ( 1, , )j jm  都很小, y 与 1,mxx的线性关系就不明显,所以可令原假设为 0 : 0 ( 1, , )jH j m  当 0H 成立时由分解式定义的 ,UQ满足 / ( , 1 )/ ( 1 )UmF F m n mQ n m   在显著性水平  下有上  分位数 ( , 1)F m m n ,若 ( , 1)F F m m n  ,接受 0H ;否则,拒绝。 注意 接受 0H 只能说明 y 与 1,mxx的线性关系不明显,可能存在非线性关系,如平 方关系。 还有一些衡量 y 与 1,mxx的线性关系不明显,如用回归平方和在总平方和中的比值定义复判定系数 2 UR S 2RR 称为负相关系数, R 越大, y 与 1,mxx相关关系越密切,通 常 R 大于 (或 )才认为相关关系成立 (5) 回归系数的假设检验和区间估计 当上面的 0H 被拒绝时, j 不全为零,但是不排除其中若干个等于零。 所以应进一步作如下 m 个检验:  0,1,..., :jm  0 :0j jH   由于  2~,j j jjNc   , jjc 是  1TXX 中的第  ,jj 元素,用 2s 代替 2 , 当 0jH 成立时  / ~1/ ( 1 )j jjj ct t n mQ n m   11 对给定的  ,若  2 1jt t n m  ,接受 0jH ;否则,拒绝。 上式也可用于对 j 作区间估计  0,1,...,jm ,在置信水平 1 下, j 的 置信区间为    221 , 1j jj j jjt n m s c t n m s c      其中1Qs nm  (6) 利用回归模型进行预测 当回归模型和系数通过检验后,可由给定的  0 01 0,..., mx x x 预测 0y , 0y 是随机的,显然其预测值(点估计)为 0 0 1 01 0mmy x x         给定  可以算出 0y 的预测区间(区间估计),结果较 复杂,但当 n 较大且 0ix接近平均值 ix 时, 0y 的预测区间可简化为 0022,y z s y z s 其中2z是标准正态分布的上 2 分位数。 对 0y 的区间估计方法可用于给出已知数据残差  1, ,i i ie y y i n   的置信区间, ie 服从均值为零的正态分布,所以若某个 ie 的置信区间不包含零点,则认为这个数据是异常的,可予以剔除。 具体以流程图的形式表现如下: 12 模型的确定参数估计统计分析假设检验回归系数的假设检验和区间估计回归模型进行预测 二、模型的建立与求解 通过查询深圳统计年鉴得到以下数据 : 表五:各量化指标数据 年份 政府教育支出 深圳市发展水平( GDP) 人均GDP 值 人口总数 户籍人口 / 非户籍人口 每户人口数 生活垃圾清运量(万吨) 2020 223601 2482 34822 219 2020 278160 2969 40369 221 2020 346031 3585 47029 325 2020 430462 4282 54236 347 2020 535495 4951 60801 333 2020 666156 5814 68441 360 2020 828698 6802 76273 407 2020 1030900 7787 83431 441 2020 1366266 8201 84147 476 2020 1595355 9582 94296 479 2020 1967928 11506 110421 458 画出生活垃圾清运量与政府教育支出、深圳市发展水平、人均 GDP 值、人口总数、户籍人口与非户籍人口比、每户人口的 趋势 图 (其它数据见附录 ): 13 通过 趋势 图,观察各曲线大致呈线性关系。 可以用多元 线性 回归模型,首先建立生活垃圾清运量分别与各因素的 线性回归方程,然后根据上述分析,建立减量分类模型的形式如下: 1 1 1 1 1 1 1( 1 ) ( 2) ( 3 ) ( 4) ( 5 ) ( 6) ( 7 )T C C E C B C N C M C D C G             其中 1T 、 1E 、 1B 、 1N 、 1M 、 1D 、 1G 分别表示生活垃圾清运总量、政府教育支出、深圳市发展水平、人均 GDP 值、人口总数、户籍人口与非户籍人口比、每户人口。 (1)C 、(2)C 、 (3)C 、 (4)C 、 (5)C 、 (6)C 、 (7)C 表示待估计的参数。 利用 MATBLE编程可得 : 置信区间 bint = Stats 残差图 如下: 14 从残差图中可以看出,残差的置信区间均包含零点,说明回归模型能较好符合原始数据,无异常点。 多元回归线性交互式画面 可知本模型的剩余标准差和残差为: rmse = residuals= 15 b,bint 为回归系数估计值和置信区间, r,rint 为残差(向量)及其置信区间, stats 是用于检验回归模型的统 计量,有四个数值,第一个是 相关系数 2R ,第二个是 F 值 ,第三个是与 F 对应的概率 P , p 拒绝 0H ,回归模型成立,第四个是残差的方差 2s 由所得结果可知, R2=,拟合结果较好,且 F值所对应的概率 p=,小于显著性水平,拒绝 H0,说明因变量与自变量之间存在显著线性关系,原模型假设成立。 根据题设回归模型 0 1 1 2 22( 0 , ) nny x x xN         可得 1 1 1 1 1 1 12 9 8 1 .8 3 1 8 0 .0 0 0 5 0 .5 9 9 5 0 .0 6 1 4 1 .3 4 1 3 4 6 0 1 .8 4 3 8 7 7 8 .6 8 3 2T E B N M D G              结论: 由检验结果可知 生活垃圾清运总量每增加一万吨,政府教育支出降低 ,深圳市发展水平增加 ,人均 GDP下降 ,人口总数增长 ,户口与非户口比例降低 ,每户人口数增加。 问题二的模型的建立与求解 基于主成分综合模型的相关性分析 根据附件中《天景花园垃圾收集统计表》 ,绘制出各个垃圾组分数量随时间变化图像: 16 根据上图曲线的变化趋势,四条曲 线大致在某一水平上来回波动,但在第 37天到第 45 天时,曲线明显有大幅下落的迹象,因此该段数据剔除,重新整理数据,绘制图像: 从上表中明显可以看出已经基本处于平稳状态。 可以对数。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。