浙大统计——描述统计内容摘要:

不同 (图 001)。  可见,平均数只反映了数据分布 (中心 )位置方面的特征 (平均水平 );数据分布的形状特征 (变异度 )应该有另一指标来表示。  常用的变异度指标有如下 4种: 一、极差或全距 ( R ) R=最大值-最小值。 其效果“极差”,因最大与最小值稳健性最差,即:若反复抽样,所得的 R值差别很大 (如潜伏期 )。  极差 ( R )的适用情况: 一般用于小样本非正态资料变异度的描述。 如急性食物中毒的潜伏期、考古学观察值等。 二、四分位数间距 ( Q )  百分位数 (Xp )解释: 设有 50个数据,从小到大排队,数据在队列中的顺序位置用百分数 p表示,如队列中第五个数据的位置为 10%,第六个数据的位置为 12%, … ,第五十个数据位置为 100%, 则称第五个数据的值为 10百分位数,第六个数据的值为 12百分位数, …。 百分位数是一种位置指标 (其它参考书记为 P x , p e r c e n t i l e)。 ex 0 2 设有 100个观察值如表 002, 表 002 发汞 1 00个数据从小到达排队及其百分位数 序号 观察值 百分位数 符号 序号 观察值 百分位数 符号 1 1百分位数 X 1 … … … … 2 2百分位数 X 2 75 上四分位数 X 75 X … … … … 3 3百分位数 X 3 95 95百分位数 X 95 4 4百分位数 X 4 96 96百分位数 X 96 5 5百分位数 X 5 97 97百分位数 X 97 … … … … X 97 25 下四分位数 X 25 98 98百分位数 X 98 … … … … 99 99百分位数 X 99 50 中位数 md 100 … …  重要的几个百分位数: 1)中位数:即 50百分位数,指 md的数据占 50% 2)下四分位数:即 25百分位数,指 X 25的数据占 25% 3)上四分位数:即 75百分位数,指 X 75的数据占 75% 0100200甲组 乙组图 001 两组身高比较 ( 均数都是 180cm )《医学统计学与电脑实验》 cbb3b7d89ba3a163798462f4ed6e8488 7 / 8 4 )其它: 5百分位数、 95百分位数, 2 . 5百分 位数、 9 7 . 5百分位数 (估计参考值范围 )。  百分位数计算公式:由于 n一般不会恰好等于 100,因此,不论直接法或频数表法,常用线性插值法计算,其公式为 )%(aab fpnff abaXp  ( 1 . 6 ) 前述中位数的计算公式 ( 1 . 5 )实际是式 ( 1 . 6 )的一个特例,即当 p =5 0时,式 ( 1 . 5 )与式 ( 1 . 6 )等价 (全等 )。  百分位数计算步骤: ex 03 计算例 1 . 5 (表 1 . 7 )的下、上四分位数。 解:即计算 X 25与 X 75 1)找 到 p百分位数对应的名次, np% ,本例 239 2 5 % =5 9 . 7 5 239 7 5 % =1 7 9 . 2 5 (保留小数位) 2)找到该名次所在组段 (位置 ),记为 a~ b,本例 X 25在组段“ 3~”, a=3, b=5 X 75在组段“ 7~”, a=7, b=9 3)找到 a和 b对应的累计频数,记为 f a, f b,本例 X 25的 f a =2 0, f b =8 6 X 75的 f a =1 4 6, f b =1 9 4 4)代如式 ( 1 . 5 )计算:下、上四分位数为 )/()(2086 35325 kgm olX  )/()(146194 79775 kgm olX   四分位数间距 ( Q )定义与计算公式: Q =X 75- X 25 本例: Q =8 . 3 9 4 . 2 0 =4 . 1 9 ( m o l / k g)  四分位数间距 ( Q )的意义: 表示分布于中间的一半数据的变异范围。 其稳健性比前述的极差 R好很多,因中间半数数据的稳健性较好。  四分位数间距 ( Q )的适用情况: 多用于大样本非正态资料变异度的描述。 如住院天数、慢性病潜伏期等。 三、方差与标准差  前述的极差 R与四分位数间距 Q都是依据 2个数值计算,只利用了样本的小部分信息,稳健性总是不理想的。  理想的变异度指标应能利用样 本中每一个数据的信息,方差与标准差符合此要求。 1)样本方差 (S2 ):  整个样本的变异由每一个个体提供的,个体的变异可由离均差的平方来表示,即 2)(个体变异度 xx   定义:整个样本的平均变异度便称为方差 (S2 ),即 《医学统计学与电脑实验》 cbb3b7d89ba3a163798462f4ed6e8488 8 / 8 总体方差 :nx22 )(   122 n xxS )( ( 1 . 7 ) 分母“ n- 1”称为自由度,数理统计学家认为,若为小样本,以 n来求均值,估计的方差偏大,故用 n 1作分母 (无偏估计 )。  应用公式 : 1 /)( 222  n nxxS ( 1 . 8 ) 式 ( 1 . 8 )是由式 ( 1 . 7 )推导出来的,两者完全等价,但式 ( 1 . 8 )在计算上比式 ( 1 .。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。