统计学原理重要公式内容摘要:

统计学原理重要公式 一加权算术平均数和加权调和平均数的计算加权算术平均数:或 fx一组依大小顺序排列的测量值中,当按一定的组距将其分组时出现在各组内的测量值的数目,即落在各类别(分组)中的数据个数。 再如在 ,9出现的频数是 3,出现的频率是 3/18=一般我们称落在不同小组中的数据个数为该组的频数,频数与总数的 比为频率。 频数也称“次数” ,对总数据按某种标准进行分组,统计出各个组内含个体的个数。 而频率则每个小组的频数与数据总数的比值。 在变量分配数列中,频数(频率)表明对应组标志值的作用程度。 频数(频率)数值越大表明该组标志值对于总体水平所起的作用也越大,反之,频数(频率)数值越小,表明该组标志值对于总体水平所起的作用越小。 掷硬币实验:在 10 次掷硬币中,有 4 次正面朝上,我们说这 10 次试验中正面朝上 的频数是4 例题:我们经常掷硬币,在掷了一百次后,硬币有 40 次正面朝上,那么,硬币反面朝上的频数为_. 解答,掷了硬币 100 次,40 次朝上,则有 1000(次)反面朝上,所以硬币反面朝上的频数为 权算术平均数和加权调和平均数的计算加权算术平均数:或 fx 是 总 和 符 合 ; f 为 标 志 值 出 现 的 次 数。 平均数)的算术平均数。 比重也称为权重,数据的权重反映了该变量在总体中的相对重要性,每种变量的权重的确定与一定的理论经验或变量在总体中的比重有关。 依据各个数据的重要性系数(即权重)进行相乘后再相加求和,就是加权和。 加权和与所有权重之和的比等于加权算术平均数。 加 权 平 均 数 = 各 组 ( 变 量 值 × 次 数 ) 之 和 / 各 组 次 数 之 和 = f 为权数,加权调和平均数以各组标志总量 标准差和标准差系数的计算方法标准差:= 标准差也被称为标准偏差,或者实验标准差,公式如图。 简单来说,标准差是一组数据平均值分散程度的一种度量。 一个较大的标准差,代表大部分数值和其平均值之间差异较大;一个较小的标准差,代表这些数值较接近平均值。 例如,两组数的集合 0, 5, 9, 14 和 5, 6, 8, 9 其平均值都是 7 ,但第二个集合具有较小的标准差。 标准差可以当作不确定性的一种测量。 例如在物理科学中,做重复性测量时,测量数值集合的标准差代表这些测量的精确度。 当要决定测量值是否符合预测值,测量值的标准差占有决定性重要角色:如果测量平均值与预测值相差太远(同时与标准差数值做比较),则认为测量值与预测值互相矛盾。 这很容易理解,因为如果测量值都落在一定数值范围之外,可以合理推论预测值是否正确。 标准差应用于投资上,可作为量度回报稳定性的指标。 标准差数值越大,代表回报远离过去平均数值,回报较不稳定故风险越高。 相反,标准差数值越细,代表回报较为稳定,风险亦较小。 例如,A、B 两组各有 6 位学生参加同一次语文测验,A 组的分数为95、85、75、65、55、45,B 组的分数为 73、72、71、69、 68、67。 这两组的平均数都是 70,但A 组的标准差为 ,B 组的标准差为 (此数据时在 R 统计软件中运行获得),说明A 组学生之间的差距要比 B 组学生之间的差距大得多。 如是总体,标准差公式根号内除以 n 如是样本,标准差公式根号内除以(因为我们大量接触的是样本,所以普遍使用根号内除以(公式意义 所有数减去其平均值的平方和,所得结果除以该组数之个数(或个数减一),再把所得值开根号,所得之数就是这组数据的标准差。 标准差的意义标准差越高,表示实验数据越离散,也就是说越不精确 反之,标准差越低,代表实验的数据越精确 离散度标准差是反应一组数据离散程度最常用的一种量化形式,是表示精密确的最要指标。 说起标准差首先得搞清楚它出现的目 的。 我们使用方法去检测它,但检测方法总是有误差的,所以检测值并不是其真实值。 检测值与真实值之间的差距就是评价检测方法最有决定性的指标。 但是真实值 是多少,不得而知。 因此怎样量化检测方法的准确性就成了难题。 这也是临床工作质控的目的:保证每批实验结果的准确可靠。 虽然样本的真实值是不可能知道的,但是每个样本总是会有一个真实值的,不管它究竟是多少。 可以想象,一个好的检测方法,基检测值应该很紧密的分散在真实值周围。 如何不紧密,那距真实值的就会大,准确性当然也就不好了,不可能想象离散度大的方法,会测出准确的结果。 因此,离散度是评价方法的好坏的 最重要也是最基本的指标。 标准差系数:标准差系数又均方差系数。 反映标志变动程度的相对指标。 式中:标准差系数; 为标准差; 为平均数。 当以样本标准差系数(称变异系数/离散计总体标准差系数时,式中:变异系数;S 为样本标准差。 对于不同水平的总体不宜直接用标准差指标进行对比,标准差系数能更好的反映不同水平总体的标志变动度。 标准差变动系数为标志变异系数的一种。 标志变异系数指用标志变异指标与其相应的平均指标对比,来反应总体各单位标志值之间离散程度的相对指标,一般用 v 表示。 标志变异指标有全距、平均差和标准差,相对应的,便有全距系数、平均差系数和标准差系数 3 种。 计算方法为: 标志变异系数=标志变异值/相对应的平均值三总体平均数和总体成数的区间估计。 抽样平均误差的计算公式:1总体平均数:重复抽样: 重复抽样又称放回式抽样。 每次从总体中抽取的样本单位,经检验之后又重新放回总体,参加下次抽样,这种抽样的特点是总体中每个样本单位被抽中的概率是相等的。 不重复抽样: )1(2不重复抽样亦称不放回式抽样。 每次从总体中抽取的样本单位,经检验之后不再放回总体,在下次抽样时不会再次抽到前面已抽中过的样品单位。 总体每经一次抽样,其样品单位数就减少一个,因此每个样品单位在各次抽样中被抽中的概率是不同的。 2总体成数: 重复抽样: 不重复抽样: ( )1(抽样极限误差: 抽样极限误差又称“置信区间和抽样允许误差范围”,是指在一定的把握程度(P )下保证样本指标与总体指标之间的抽样误差不超过某一给定的最大可能范围,记作。 抽样极限误差是指用绝对值形式表示的 样本指标与总体指标偏差的可允许的最大范围。 它表明被估计的总体指标有希望落在一个以样本指标为基础的可能范围。 它是由抽样指标变动可允许的上限或下限与总体指标之差的绝对值求得的。 由于总体平均数和总体成数是未知的,它要靠实测的抽样平均数成数来估计。 因而抽样极限误差的实际意义是希望总体平均数落在抽样平均数的范围内,总体成数落在抽样成数的范围内。 基于理论上的要求,抽样极限误差需要用抽样平均误差 或 为标准单位来衡量。 即把极限误差x 或p 相应除以 或 ,得出相对的误差程度 t 倍,t 称为抽样误差的概率度。 于是有: 1总体平均数: 定 义 : 总 体 中 所 有 个 体 的 平 均 数 叫 做 总 体 平 均 数。 原 理 : 考 察 的 对 象 中 的 每 一 个 考 察 对 象 的 平 均 数 叫 做 总 体 平 均 数。 2. 总体成数: pp 总体成数。 它是指总体中具有某一相同标志表现的单位数占全部总体单位数的比重,一般用 P 表示。 总体中具有相同标志表现的单位数用 示。 总体平均数和总体成数的区间估计:1. 总体平均数:x - X x + tu x p - p p + tu 总体平均数: 重复抽样: n = t 2 2 / 2n = t 2 2 N /( x + )2 总体成数:重复抽样: n = t 2p(1:n = t 2p(1N /( p + )四相关系数的计算、回归方程的建立和应用相关系数的计算:2222 )()( 简单线性回归方程的建立:Y = a + 22)()数量指标指数:( - )01)质量指标指数:( - )01 10 ( / - / × 011 = ( - )×( - )11 1)由时期数列计算序时平均数: 2)由间隔相等的时点数列计算序时平均数:122113)由间隔不相等的时点数列计算序时平均数: 式表示为:012310)()()( 逐期增长量之和累积增长量平均增长量逐期增长量的个数 发展速度 - 均增长速度平均发展速度()。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。