20xx年全国数学建模a题一等奖论文内容摘要:

隶属度为 ,对于二级标准的归一化的综合隶属度为 ,对于三、四级标准的归一化的综合隶属度为 0、 0,故认为区域 1为一级标准区。 表 4 各类区域污染程度表 区域类别 一级 二级 三级 四级 生活区 % % % % 工业区 % % % % 山区 % % 0% 0% 主干道路区 % % % % 公园绿地区 % % % % 重金属污染的原因分析 8 种主要的重金属污染物在 5 类区域的分布统计 根据问题分析我们可知,我们的主要工作转向 分析 8种主要的重金属在 5类区域的分布,对问题一的结果进行统计分析,做出 如下 8个柱状图(为是结果具有可比性,我们取 5类区域中各种重金属的平均含量作为评判标准): 012345678生活区 工业区 山区 主干道 公园区域类型每类子区域种砷的平均含量050100150200250300350400450生活区 工业区 山区 主干道 公园区域类型每类子区域中镉的平均含量 9 图 9 砷在各类型区域中的含量分布图 图 10镉在各类型区域中的含量分布图 图 11 铬在各类型区域中的含量分布图 图 12铜在各类型区域中的含量分布图 图 13 汞在各类型区域中的含量分布图 图 14镍在各类型区域中的含量分布图 图 15 铅在各类型区域中的含量分 布图 图 16锌在各类型区域中的含量分布图 这样我们就得到了 8种主要的重金属污染物在 5 类区域中的分布情况: 铜元素与汞元素在工业区富集,含量远远超过与其他区域;除镍元素外,山地的重金属含量最低;工业区每种元素含量都普遍较高,主干道区其次,然后是 生活区与公园区,含量最低的区域是山区。 对 8 种主要的重金属污染物的因子分析 由于一般这些污染物之间具有一定的相关性,我们可以利用因子分析法将这些具有复杂关系的变量通过降维得到几个综合指标(综合指标是原来多个变量的线性相关组合) ,将原问题进行简化。 步骤如下: 确定待分析的原有若干变量是否适合进行因子分析 01020304050607080生活区 工业区 山区 主干道 公园区域类型每类子区域中铬的平均含量020406080100120140生活区 工业区 山区 主干道 公园区域类型每类子区域中铜的含量的平均值0100200300400500600700生活区 工业区 山区 主干道 公园区域类型每类子区域中汞含量的平均值0510152025生活区 工业区 山区 主干道 公园区域类型每类子区域中镍含量的平均值0102030405060708090100生活区 工业区 山区 主干道 公园区域类型每类子区域中铅含量的平均值050100150200250300生活区 工业区 山区 主干道 公园区域类型每类子区域中锌含量的平均值 10 因子分析是从众多的原始变量中重构少数几个具有代表意义的因子变量的过程,其潜在的要求是:原有变量之间具有较强的相关性,因此,因子分析要先进行相关分析,计算原始变量之间的相关系数矩阵。 如果相关系数矩阵在进行统计检验时,大部分相关系数均小于 且未通过检验,则这些原始变量就不太适合进行因子分析。 SPSS 在因子分析中还提供了几种判定是否适合因子分析的检验方法,主要有: 1)、 巴特利特球度检验 (Bartlett test of sphericity) 该 检验以相关系数矩阵作为出发点,它的零假设 H0 为相关系数矩阵,是一个单位矩阵,即相关系数矩阵对角线上的所有元素都为 1,而所有非对角线上的元素都为 0,也即原始变量两两之间不相关。 此检验的统计量是根据相关系数矩阵的行列式得到的。 如果该 统计量较大且概率小于显著性水平, 则应该 拒绝 零假设 H0 , 即相关系数矩阵不可能是单位阵,也即原始变量之间具有相关性, 适合作因子分析。 一般认为巴特利特球度检验值大于 100 适合做因子分析。 2)、 反映象相关矩阵 (Antiimage correlation matrix)检验 这种检验方法 以变量的偏相关系数矩阵为出发点,将偏相关系数矩阵的每个元素取反,得到反映象相关阵。 其中偏相关系数是在控制了其他变量影响的条件下计算出来的相关系数。 如果反映象相关矩阵中的很多元素的绝对值比较大,则说明这些变量可能不适合作因子分析。 3)、 KMO检验 该检验的统计量用于比较变量之间的简单相关和偏相关系数。 KMO 的定义如下: KMO=所有变量间 简单 相关系数平方和 /(所有变量间 简单 相关系数平方和 +所有变量间偏相关系数平方和 ) 显然 KMO 的值介于 0 和 1,越接近于 1,表明所有变量之间简单相关系数平方和越远大于 偏相关系数 平方和 ,越适合做因子分析。 一般 认为 KMO 值在 子分析。 利用 SPSS软件, 可自动完成对已知数据的上面几种方法的检验。 本文 分别采用KMO 和 巴特利特球度两种方法对所给出的 8种主要重金属污染物做相关性检验,结果如下图 17所示: 图 17 8 种主要重金属污染物之间相关性的 KMO 和 Bartlett 检验结果图 从上图中容易看出,对这 8种主要的重金属污染物的相关性检验结果为: 对于 KMO检验,其 KMO=, 认为这 8种主要的重金属污染物可以做因子分析; 对于 Bartlett 检验,其检验统计量为 ,远大于 100,其相伴概率为 ,小于默认的显著性水平 , 故 Bartlett 检验的结果认为这 8种主要的重金属污染物可以做因子分析。 11 这样我们就完成了因子分析法的第一步,接下来继续做因子分析法的第二步,即构造因子变量。 构造因子变量 因子分析中有很多确定因子变量的方法,如基于主成分模型的主成分分析和基于因子分析模型的主轴因子法,极大似然法、最小二乘法等,本文采用的是应用最广泛的主成分分析法。 该方法通过坐标变换,将原有变量作线性变换,转换为另一组不相关 的变量吗,即主成分,也称公共因子。 公共因子的个数 的确定准则有很多,本文仅选取其中常用的两个: 根据特征值的大小来确定,取大于 1的特征值对应的几个公共因子 (主成分 ); 通过直接观察碎石图的方法来判断。 利用 SPSS 软件 根据特征值来 确定因子变量的结果如下图 18: 图 18 特征值法确定 主成分因子变量 个数 的结果 从上图可以看出,只有两个特征值大于 1,故取这两个特征值对应的因子作为 公共因子也即主成分。 利用 SPS 软件做出碎石图,如下图 19所示: 从下图可以看出,汞( Hg)自成一类,其他 7种重金属元素分为 一类,共同构成另外一种主成分。 且可以看出第二类中, Pb、 Cd、 Cu、 Zn 和 As、 Cr、 Ni分别表现出明显的聚类效应,我们不妨将它们分成三类来讨论。 12 图 19 确定因子变量个数的碎石图 因子变量的命名解释 构造因子的载荷矩阵,在理想状态下,让某些变量在某个因子上的载荷趋于 1,而在其他因子上的载荷趋于 0,一般通过对因子载荷矩阵进行旋转来实现。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。