秦皇岛农业发展状况统计分析毕业论文(编辑修改稿)内容摘要:
素的投入水平并不是和产出成正比的,要素投入水平符合边际递减规律,边际递减规律 是指其他条件时,连续地增加生产要素的投入,所新增的产出或收益反而会逐渐减少。 也就是说, 生产要素应该投入的量有一个水准 , 如果超过了这个水准 ,继续增加要素的投入不仅不会带来 总体 产量的增加,反应 会使总体 产量下降。 所以 , 要素的投入不是越多越好,和生产力相适应才是正确的。 (3) 支持保障水平。 政府对农业发展的支 持和保障水平对农业发展状况起着一定 的影响作用。 近年来,政府从 种 粮免税到 种 粮补贴 ,农机补贴等一系列举措使更多的农民参与到来农业生产,促进着农业发展。 (4) 可持续发展水平。 这个因素要求我们合理使用资源 , 使用资源要从长远角度考虑 , 保证资源的长期利用。 所以我们应该从社会 、 资源 、 经济、和环境保护 等方面全面考虑问题。 这是一套系统理论 , 保证我们既要着眼于现在的发展 , 又不能提前透支后代人的资源 , 兼顾环境的 保护。 这个观念是一种立足现在和未来的思想。 如今人们越发感觉到资源的过度利用和环境的破坏带来的灾难,环保和合理利用资源 的理念已经植根于人们的 脑海。 可持续 发展水平 的高低, 很大程度上影响了农业未来发展趋势 [13]。 四个 因素之间均相互独立,从不同的侧面和角度影响和制约着 农业发展状况的 水平。 相关统计学 基础知识综述 主成分分析基本知识 ( 1)主成分分析的基本思想 前面说到了如何从众多指标中找出最关键的几个,主成分分析法就是一种非常常用和实用的方法。 通过主成分分析法,可以从众多指标中提取出其中的“精华”,这些“精华”的几个指标能解释所有指标之间大部分的方差,也就代表这些“精华”包含了所有指标中大部分的信息,并 且提取出的“精第 2 章 基础知识 9 华”之间是没有相关性的,从而做到了对指标的简化。 所以这种对众多指标进行降维,提取出几个能代表整体信息的、互相之间不相关的指标的方法叫做主成分分析方法。 一般来说,处理降维这种问题的做法是用所有的变量做一个线性组合,把这几个线性组合作为一个新的变量,用新的数量较少的几个变量去解释所有方差,这样,也能达到同样的效果。 但是这种方法存在一个问题,就是一组变量可以组成很多种新的变量组合。 如果没有其他限制条件,这种组合就会有很多,该如何从中选择呢。 现在假设所有指标组成的第一个新变量 记为1F , 我们尽可能的让他 能代表原变量更多的信息 , 这里所说的变量的“信息”也就是变量之间的方差 , 所以 1Var( )F 越大 越是有利 , 说明 1F 能代表更多的原变量的信息。 也这是这个原因,所以在第一个线性组合的选取时,应该从多个线性组合中挑选能代表最多信息的为 1F ,把 1F 叫做 第一主成分。 此时,这一个主成分可能不能代表原来 p 个变量的 方差 , 就需要 再选取第二个线性组合 ,记为 2F ,使新的变量能更多的解释更多的原来的方差。 我们的目的是对原众多变量进行降维,所以希望 2F 中不包含 1F 中能够解释的方差,避免发生冗余。 也就是要求 12Cov( , )FF 尽可能的小 , 此时把 2F 叫做 第二主成分,同样用这种方法,就可以提取出 第三、四„„第 p 个主成分。 ( 2)主成分分析的数学模型 假设有一个 p 个变量 pxxx , 21 的样本资料。 观测这些样本的所有变量 , n 个样品的数据资料阵 为 : npnnppxxxxxxxxxX212222111211 pxxx , 21 ( 21) 其中: pjxxxxnjjjj ,2,1,21 燕山大学本科生毕业论文 10 主成分分析 的做法就是将这 p 个变量 ,提取出其中的“精华”,变成一个新的数量少 , 而且互不相关的新的变量 ,即 ppppppppppxaxaxaFxaxaxaFxaxaxaF22112222121212121111 ( 22) 简写为: pjpjjj xxxF 2211 ( 23) pj ,2,1 模型应该满足这些条件 : ① ji FF, 互不相关( ji , pji ,2,1, ) ② 1F , 2F , 3F 的方差 依次减小 ③ .,2,1122221 pkaaa kpkk 所以 , 这里把 1F 叫 第一主成分, 2F 叫做第二主成分,按照这个顺序 ,会出现第 p 个主成分。 我们把系数 ija 叫做主 成分系数。 这个模型用矩阵表示如下 : AXF ,其中 pFFFF 21 pxxxX 21 pppppppaaaaaaaaaaaaA 21212222111211 A 称为主成分系数矩阵。 第 2 章 基础知识 11 主成分 这一 概念 产生于 19 世纪初 , 是由 Karl parson 引用, 开始时 未了解决 非随机变量 的 问题。 然而在 1933 年的时候 Hotelling 将这一方法或者说概念应用于随机变量,从此以后主成分的应用越来越广泛,对处理数据,分析问 题起着越来越重要的作用,尤其在最近 20 年间 , 计算机数学软件的大量使用,使得主成分 分析 操作变得简单,应用也越来越多。 主成分分析可以应用于许多领域,其中一个领域就是系统评估。 系统评估 是检查一个 理论 系统是否处于正常的 运营 状态很重要的一个环节,然后系统评估需要很多的指标, 有些 指标组成的变量数目巨大,难以处理。 假如对一家企业的经济效益进行系统评估,很多指标都在影响着企业的经济效益,所以指标变量也就很多 , 这些指标选取的标准就很难制定。 所以解决系统评估问题的重点在于找到一种方法,能够将大量的指标变量浓缩成很少或者说几个 变量 , 这样,才能使系统评估有进行下去的先决条件 在经济研究领域,主成分依然有着很广泛的应用 ,除了 农业发展经济效益的研究外 , 区域经济发展水平的统计分析 , 区域发展竞争力的评估 , 人们的生活条件,生活质量的测评 , 等等很多问题都可以应用主成分分析进行研究。 另外,主成分分析除了用于系统评估研究领域外, 还在很多领域有极其重要的应用。 本文主要是利用主成分分析的方法对影响农业发展的两组指标进行一个浓缩,把多个变量变成少数变量。 使新变量能体现原始数据包含的信息,从而简化计算,使问题清晰明朗。 这样,将这些处理数据后得到的主 成分就可以作为数据包络分析得决策和投入单元,从而减少因决策单元过多导致的计算误差 [14]。 主成分几何解释 要在二维空间中阐述主成分分析的几何意义,需要假设 有 n 个样本,每个样本 有二个 指标变量。 假设这 n 个样本在二维坐标轴中的分布是一个椭圆的形状 ,如下图所示: 燕山大学本科生毕业论文 12 图 21 主成分几何解释图 现在 对 坐标轴进行一个角度为 的 正交旋转 , 旋转 的 数学 公式为 c o s)s in( s inc o s212211jjjjjj xxy xxy nj 2,1 写成矩阵形式为: nnyyyyyyY2222111211 XUxxx xxxnn 2222111211c o ss i n s i nc o s 其中 U 为坐标旋转变换矩阵,它是正交矩阵,即有 IUUUU ,1 ,即满足 1c ossin 22 。 这个椭圆在正交 旋转变换 之 后, 就 有 了 下图 所示 的新坐标: 图 22 主成分几何解释图 第 2 章 基础知识 13 新坐标 21 yy 有如下性质: (1)n 个点的坐标 1y 和 2y 的相关几乎为零。 (2) n 个 点 在 坐标平面上的方差 主要 都集中在 1y 轴上, 只有小部分的方差落在了 2y 轴上。 1y 和 2y 作为 由 原始的指标变量 1x 和 2x 表示的新变量。 并且这 n 个点 的方差是集中在 1y 轴上的, 所以 原二维 坐标轴上的点用 1y 轴上的 一个 新 的 一维 的 坐标来表示 , 这样就能保持原始点大部分的信息 , 所以把 1y 轴叫做 第一主成分, 2y 轴与 1y 轴正交,他们之间的方差是最小的 , 所以把它叫做 第二主成分。 主成分的导出与计算步骤 由上面建立的模型,我们可以了解主成分分析 的内在含义和原理。 要运用主成分分析,首先要有原始数据,并且满足主成分分析数学模型的三个基本要求。 如何利用主成分分析去解决问题,关键在于得出主成分系数,进而表示出主成分模型。 由前面分析的主成分模型可知,主成分之间应该没有相关性,这是主成分模型的第一个条件。 对于主成分, AXF 其协差阵应为, AXAXAXAXAXV arFV ar )()()()( =p21 将原始数据的 协方差阵 表示 为 V , 再对原始数据做标准化处理,此时 协方差阵等于相关矩阵 , 即有: XXRV 我们通过分析主成分的数学模型中的条件 ③ 以及分析 正交矩阵的性燕山大学本科生毕业论文 14 质, 可得到,在满足 条件③ 的前提下, A 最好是一个 正交矩阵,即满足 IAA 于是,将原始数据的协方差代入主成分的协差阵公式得 到下面的计算结果: AARAXAXFV a r )( AARAAR 展开上式得 我们可以得到以下结果,这样我们可以进行以后的分析找到了理论上的依据。 pppppppppppppppppppaaaaaaaaaaaaaaaaaarrrrrrrrr21212221212111212221212111212222111211 对等号两边做一个展开的变换 , 变换之后矩阵仍然是相等的 , 我们可以从第一列中得出的方程 : 0)(0)(0111221111212122112111121211111pppppppppararararararararar 这是一个齐次方程,为了能够顺利得出解, 他的系数矩阵的行列式必须是 0,即 第 2 章 基础知识 15 0121212221112111pppppprrrrrrrrr 01 IR 此时,我们就求出了 相关系数矩阵的特征值 1 , 他对应的特征向量为 paaaa 112111 , 。 用同样的方法对矩阵的 第二列、第三列等 进行展开、计算 , 就能得到 i的 方程 : 0 IR 的 p 个根, 特征方程 的特征根。秦皇岛农业发展状况统计分析毕业论文(编辑修改稿)
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。
用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。