生物统计与田间试验参数估计方法(编辑修改稿)内容摘要:

/2 AaBB r(1- r)/4 AaBb r2/4 aaBB r2/4 aaBb r(1- r)/4 ab (1- r)/2 AaBa (1- r)2/4 Aabb r(1- r)/4 aaBb r(1- r)/4 Aabb (1- r)2/4 表 F2群体的基因型及其概率 按多项式分布,可以根据概率函数得到似然函数为:         fedc rrrrfedcnrL    41411411412 2222!!!!!)((815) 若以 代入上式,则似然函数和对数似然函数分别为: 21 )( rfedcfedcnrL   4414142 !!!!!)(]4l n []41l n [)(]42l n [)(ln  fedckL (k是常数项 ) (816) (817) 对上式求导数,并令导数为 0,可得方程: 012   fedc上式化解为一元二次方程 02222  ffed  )(nfnfedcfedc282222ˆ 2  )()( (818) 在 的两个解中取一个符合遗传规律的解,那么,重组率的解为:。 ˆˆ1ˆ r重组率方差估计量为: )(1))(()(ˆ22ˆ2ˆ1ˆnrD(819) 对于本例,有 4202420768)76292262289()76292262289(ˆ 2θ取正根, =, ˆ7 3 6 601ˆ .r 01 90)73 66021(42 02 )73 6602)(73 6601()ˆ()ˆ( ....rDrs  由此, =。 三、关于三种估计方法的讨论 上述 3种参数估计方法对比: (1)对于总体平均数的估计量, 3种估计方法都具有无偏性、有效性和相合性; (2)对于总体方差的估计量,由离均差平方和期望值所得的是无偏的,但由矩法和极大似然法所得两种估计量是有偏的,但都是相合的;最小二乘法无直接的总体方差估计量。 3种常用方法的不同要求 : (1)极大似然法要求已知总体的分布,才能获得估计量。 (2)另外两种方法对分布没有严格的要求。 3种常用方法的应用范围: (1)极大似然法估计结果大多具有无偏性、有效性和相合性等优良的估计量性质。 (2)最小二乘法在估计线性回归模型参数时具有灵活方便的特点。 (3)矩估计方法由于不需要知道总体分布也是经常采用的方法,但该方法估计结果有时不具备优良的估计量性质,而且局限在与矩有关的估计量。 第九章 直线回归和相关 • 第一节 回归和相关的概念 • 第二节 直线回归 • 第三节 直线相关 • 第四节 直线回归与相关的内在关系 和应用要点 • 第五节 协方差分析 • 引言 这一章研究的对象: • 由 一个变数 两个或多个变数 ,因为在实际生产实践和科学实验中所要研究的变数往往不止一个,例如: • 研究温度高低和作物发育进度快慢的关系,就有温度和发育进度两个变数; • 研究每亩穗数、每穗粒数和每亩产量的关系,就有穗数、粒数和产量三个变数。 第一节 回归和相关的概念 • 1. 函数关系与统计关系 • 2. 自变数与依变数 • 3. 回归分析和相关分析 • 4. 两个变数资料的散点图 函数关系 有精确的数学表达式 (确定性的关系) 直线回归分析 一元回归分析 变量间的关系 因果关系 曲线回归分析 (回归分析) 多元回归分析 多元线性回归分析 统计关系 多元非线性回归分析 (非确定性的关系) 简单相关分析 —— 直线相关分析 相关关系 复相关分析 (相关分析) 多元相关分析 偏相关分析 • 函数关系 是一种确定性的关系,例如圆面积与半径的关系为。 其不包含误差的干扰。 • 统计关系 是一种非确定性的关系。 例如,作物的产量与施肥量的关系,两类变数受误差的干扰表现为统计关系。 2RS • 因果关系 :两个变数间的关系若具有原因和反应 (结果 )的性质。 • 相关关系 :呈现一种共同变化的特点,则称这两个变数间存在。 • 回归分析 :计算回归方程为基础的统计分析方法。 为 Y 依 X 的回归方程 (regression equation of Y on X )。 • 相关分析 :计算相关系数为基础的统计分析方法。 计算表示 Y 和 X 相关密切程度的统计数,并测验其显著性。 • 这个统计数在两个变数为直线相关时称为相关系数(correlation coefficient),记为 r;在多元相关时称为复相关系数 (multiple correlation),记作Ry12… m ;在两个变数曲线相关时称为相关指数(correlation index),记作 R。 )( xfy ˆ• 一般规则 : • 当两个变数中 Y 含有试验误差而 X 不含试验误差时着重进行回归分析;而当 Y 和 X 均含有试验误差时则着重去进行相关分析。 • 4. 两个变数资料的散点图 • 对具有统计关系的两个变数的资料进行初步考察的简便而有效的方法,是将这两个变数的 n对观察值 (x1, y1)、 (x2, y2)、 … 、 (xn, yn)分别以坐标点的形式标记于同一直角坐标平面上,获得散点图 (scatter diagram)。 • 根据散点图可初步判定双变数 X 和 Y 间的关系,包括:① X 和 Y 相关的性质 (正或负 )和密切程度; ② X 和 Y 的关系是直线型的还是非直线型的; ③是否有一些特殊的点表示着其他因素的干扰等。 • 例如图 3幅散点图,图 的生物产量 (X )和稻谷产量 (Y ),图 米土地上的总颖花数 (X )和结实率 (Y ),图 最高叶面积指数 (X )和每亩稻谷产量 (Y )。 从中可以看出:① 图 ,但方向 相反;前者 Y 随 X 的增大而增大,表示两个变数的关系是正的,后者 Y 随 X 的增大而减小,表示关系是负的。 ② 图 ,图 ;因此,图 X 和 Y 相关的密切程度必高于图。 ③ 图 X 和 Y 的关系是非直线型的;大约在 x≤(6 — 7)时, Y 随 X 的增大而增大,而当 x> (6— 7)时, Y 随 X 的增大而减小。 x,生物产量 (g) 水稻单株生物产量与稻谷产量的散点图 x,每 m2颖花数 (万 ) 水稻每 m2颖花数和结实率的散点图 x,最高叶面积指数 水稻最高叶面积指数和亩产量的散点图 第二节 直线回归 • 一、直线回归方程 • 二、直线回归的假设测验和区间估计 • 三、直线回归的矩阵求解 一、直线回归方程 (一 )直线回归方程式 (91) • 回归截距 (regression intercept) : a是 x=0时的值,即回归直线在 y 轴上的截距。 • 回归系数 (regression coefficient) : b是 x 每增加一个单位数时,平均地将要增加 (b> 0时 )或减少 (b< 0时 )的单位数。 bxay ˆ 时,分别对 a和 b 求偏导数并令其为 0,可得正规方程组 ( normal equations) : 得 ˆ 最小为)()( 2121bxayyyQnnxyxbxayxban2xbya (92) xSSSPxxyyxxxnxyxnxyb 22 )())(()(112)(ˆ xxbybxxbyy  )((93) (94) 将 (92)代入 (91)可得: y ① ② ③ ① a0,b0 ② a0,b0 ③ a0,b0 x 直线回归方程的图象 • 由 (94)可看到:①当 x以离均差 (x )为单位时 , 回归直线的位置仅决定于 和 b ;② 当将坐标轴平移到以 ( , )为原点时,回归直线的走向仅决定于 b, 所以一般又称 b为 回归斜率 (regression slope)。 xyx y• (二 )直线回归方程的计算 • [例 ] 一些夏季害虫盛发期的早迟和春季温度高低有关。 江苏武进连续 9年测定 3月下旬至 4月中旬旬平均温度累积值 (x, 旬 度 )和水稻一代三化螟盛发期(y, 以 5月 10日为 0)的关系 , 得结果于表。 试计算其直线回归方程。 • 首先由表 6个一级数据 (即由观察值直接算得的数据 ): x累积温 y盛发期 12 16 9 2 7 3 13 9 1 表 累积温和一代三化螟盛发期的关系。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。