深圳杯数学建模论文a题内容摘要:

777772271107227722221102117712211101xxxyxxxyxxxy ( 2) 其中 0 , 1 ,„, 7 是 7 个待估计参数, 1x , 2x , 3x ,„ 7x 是 7 个可以精确测量的一般变量, ,1 ,2 „ 7 是 7 个相互独立且服从同一正态分布 ),0( N 的随机变量,这就是多元线性回归的数学模型。 令 721yyyY  , 777271272221171211111xxxxxxxxxX, 11 710  , 721  , 那么多元线性回归的数学模型( 2)可以写成矩阵形式 .XY ( 3) 其中  是 7维随机向量,它的分量是相互独立的。 参数  的最小二乘估计 为了估计参数  ,我们采用最小二乘估计法。 设 01 8, , ,b b b 分别是参数 0 , 1 ,„,7 的最小二乘估计,则回归方程为 7722110 xbxbxbby   ( 4) 由最小二乘法知道, 710 , bbb  应使得全部观察值 y 与回归值 yˆ 的偏差平方和Q 达到最小,即使 ^ 2()Q y y   最 小 (5) 所以Q是 710 , bbb  的非负二次式,最小值一定存在。 根据微积分学中的极值原理, 710 , bbb  应是下列正规方程组的解: ^0^2 ( ) 0 ,2 ( ) 0 ,jjQ y ybQ y y xb            (6) 显然,正规方程组的系数矩阵是对称矩阵,用 A 来表示,则 XXA  ,且其右端常数项矩阵 B 亦可采用矩阵 X 和 Y 来表示: YXB 。 所以可以得到回归方程的回归系数: YXX)X(BAb 11  (7) 由于利用偏回归平方和 iQ 可以衡量每个变量在回归中所起的作 用大小(即影响程度),设 回S 是 p 个变量所引起的回归平方和,1回S是 p1 个变量所引起的回归平方和(即除去 ix ),则偏回归平方和 iQ 为: 12 iQ = 回S 1回S =1pjjj bB *0pjjj bB=iiicb2 ( 8) 就是去掉变量 ix 后,回归平方和所减少的量。 模型的求解 食品安全涉及的总类过多,我们着重考虑蔬菜,肉类,水产品这三种类别的数据分析销售地区对食品安全的影响。 由于深圳市有 7个区,因此,将所有的销售地点以区来划分从而分析食品安全与销售地点之间的关系。 2020 年第一季度与第二季度蔬菜,肉类,水产品因得知属于哪个区而无 数据。 从搜集到蔬菜类的数据(附录表 1)中,由于食品检测受季节因素影响,蔬菜在 2020年第一季度, 2020 年第二季度, 2020 年第四季度, 2020 年第三季度,2020 年第三季度未受检测,无法获取相关数据。 则将以上这些不纳入考虑对象中,又由于 2020年第一季度与 2020年第四季度中有些地区的数据缺失,为减少误差,也剔除 2020 年第一季度与 2020 年第四季度数据,且不考虑地区 74,xx 得到新的数据表(附录表 2)。 通过 MATLAB(程序见附录 1)作图如下: 13 此时可见第 五 个点是异常点,于是删除原始数据中第 五 行数据。 回归方程的求解 由附表 1和所得的公式( 7),运用 MATLAB 进行编程(程序见附录 2) 则得到: 9 1 8 ,1 0 9 ,0,2 7 7 ,0 4 2 ,1 2 4 653210  bbbbbb P=0 回归方程 6521 xxxxy  成立。 14 偏回归平方和 iQ 的比较 各因素的 偏回归平方和: ix 1x 2x 3x 5x 6x iQ ( 310 ) 0 根据 iQ 的大小可判断各 地区 对 蔬菜类食品安全 的影响程度: 31526 xxxxx  判断各地区蔬菜合格率的趋势通过如下折线图: 肉类 从搜集到肉类的数据(附录表 3)中,由于食品检测受季节,销售的地址不够具体等因素影响,肉类在 2020 年第一季度, 2020 年第二季度, 2020 年第四季度, 2020 年第三季度, 2020 年第三季度无法获取相关数据。 则将以上这些不纳入考虑对象中,又由于 2020 年第三季度光明新区的数据缺失,为减少误差,也剔除该区数据,即不考虑地区 7x 得到新的数据表(附录表 4)。 通过 MATLAB(程序见附录 3)作图如下: 15 回归系数 回归系数估计值 回归系数置信区间 b0 [ ] b1 [ ] b2 0 [0 0] b3 [ ] b4 0 [0 0] b5 [ ] b6 [ ] R2= F= p= S2= 16 由于 P=,则 回归方程 y=+++ 不成立。 水产品 水产品的数据不完整度高,无法使用多元线性回归的方法来求回归方程。 则使用折线图来表示 2020 年第三季度, 2020 年第一季度, 2020年第三季度, 2020年第二季度, 2020 年第四季度都合格率分布和走势。 模型的 分析 食品安全 通 常和很多因素有关,但它们之间并不是确定性关 系,所以我们用回归分析来处理,并建立了多元线性回归模型。 用最小二乘的方法给出了变量间相关关系的回归方程,针对各因素对食品安全的影响我们与偏回归平方和联系起来,并将各因素的影响程度进行了排序。 在讨论蔬菜类中,由于 不考虑地区 74,xx ,仅考虑其他五个地区对食品安全的影响,得出 食品安全指标( y )与所属地区福田区 ( 1x ),罗湖区( 2x ),南山区( 3x ),宝安区( 5x ),龙岗区( 6x )有关。 且对食品安全的影响程度由深至浅的排列为龙岗区( 6x ),罗湖区( 2x ),宝安区( 5x ),福田区 ( 1x ),南山区( 3x )。 而在肉类的讨论中, 不考虑地区 7x 仅考虑其他 6个地区对食品安全的影响,无法得出 食品安全指标( y )与所属地区福田区 ( 1x ),罗湖区( 2x ),南山区( 3x ),宝安区( 5x ),龙岗区( 6x )有关,从而无法确定是否该地区与食品安全状况存在线性关系。 在水产品的讨论中,数据的局限性导致模型无法建立,无法判断水产品的安全问题与销售地区之间的线性关系。 因此,初步得出食品安全与销售地区之间无明显关系。 再观察其他类别的食品的安全状况与销售地区之间的关系, 只有部分类别的食品与地区之间存在线性关系,大部分类别的食品与地区之间并无多大关系。 因此,可 以说,食品安全的情况与销售地区无关。 但是,观察食品合格率的走势能很好得起到提高检测效率和监督的作用。 因此,通过对折线图的分析,来预测蔬菜,肉类,水产的未来趋势。 此为蔬菜这三年的合格率折线图: 17 %%%%%%%X1 X2 X3 X4 X5 X6 X7蔬菜合格率折线图2020 三2020 一2020 二2020 三2020 四 从图可知,折线图中蔬菜的合格率出现逐年增加的趋势,每个地区的合格率都出现上升的现象,这说明食品检测对蔬菜的合格率控制起到很大的作用。 预测未来蔬菜的合格率应该会持续在较高的水平。 此为肉类这三年的合格率折线图: %%%%%%%X1 X2 X3 X4 X5 X6 X7肉类合格率折线图2020 一2020 二2020 四2020 一2020 二2020 四 预测对于肉类食品中罗湖区( 2x ),宝安区( 5x ),光明新区 ( 7x ) 有明显的合格率下降趋势,因此,在未来的食品安全检测中,应着重这些地区肉制品的检测,从而提高整体的合格率。 此为水产品这三年的合格率折线图: 18 %%%%%%%X1 X2 X3 X4 X5 X6 X7水产品合格率折线图2020 三2020 一2020 三2020 二2020 四 剔除反常的点,水产品 的合格维持在 %%之间,但对于坐落于海边的深圳来说,水产品是必不可少的,因此,仍须增强对水产品的检测,防止不合格水产品大范围流入市场。 季节因素 对于季节因素,我们 对多年的不同月份进行采集数据整理一年数据来反映季节因素对食品质量的影响 ,并通过数据处理用散点图表示。 根据图形可以用三次方程进行拟合,图形如下所示 : (拟合程序 见附录 ) 19 运用 Matlab 软件可以得到拟合直线方程 y=++ 此方程用于检验 2020 年的原始数 据,误差在合理范围内。 从所建立的模型明显看到 7,8,9,10 月份合格率较低,符合深圳市的气候。 深圳在 8,9, 10 月份气温极高微生物生长快,各种细菌疯狂增长,食品腐烂快,保质期短。 (三)问题三的分析与解答 生产基地 的合格率如下表: 由于数据有限,我们无法获取 2020 年有关生产基地的相关数据,但从我们已知的这些数据中,我们很容易得到:对于生产基地的产品检测抽样中,水产品和禽畜产品这两大类的产品合格率都高达 100%,而蔬菜的平均合格率也有%。 另一方面,我们从蔬菜的合格率 分布情况可以看出:蔬菜的不合格都集中在每年的第四季度和次年的第一季度。 因此,我们大胆猜测,蔬菜是由于气候的原因而导致的不合格。 在春冬季节里,气温低,蔬菜不易种植,导致蔬菜生产欠缺,因此很多农民会选择搭棚进行栽培蔬菜。 而这个季节里,雨水十分泛滥,使得很大一部分蔬菜直接烂在泥土里,同时害虫活动频繁,农民们不得不选择喷洒农药来消灭害虫,因而导致这两季度蔬菜的农药残余大大增加。 对于上述分析结果,我们可以通过减少抽检水产品和禽畜产品的次数与频率,从而减少抽检费用。 另外,我们可以抽取部分减少的费用来增加蔬菜的抽检次数, 更好的反映蔬菜的质量安全状况,提高蔬菜的质量水平。 对于问题一,我们得出的结论是:食品添加剂这一因素对食品安全的影响占领着绝大一部分的比例,而重金属和微生物这两因素对食品安全的影响相对于食品添加剂这个因素来较小。 假设除了蔬菜及其制品,水产品,肉制品三类产品以外,其余的产品质量安全都趋于稳定且抽检频率为最优。 由于我们所考虑的食品中大部分产品属于加工性的产品,而非初级产品,因此在食品保鲜上许多食品都加入了大量的添加剂使之保质期延长。 通过问题二的数据整理与分析,以及模型建立,我们可以得到:销地和季节因素都会影响到 食品质量安全,而季节因素是影响食品质量安全的最主要的因素,但销地对食品的影响只是对于部分产品。 由问题二,我们得到了夏季食品的合格率偏低,由于夏季食品的保质期较短,气温偏高,导致绝大一部分食品由于高温产生变质,从而许多加工商为了增长食品的 蔬菜 水产品 禽畜产品 2020第一季度 100% 100% 100% 2020第二季度 100% 100% 100% 2020第三季度 100% 100% 100% 2020第四季度 % 100% 100% 2020第一季度 % 100% 100% 2。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。