应用统计学2--数据的整理与抽样(编辑修改稿)内容摘要:
取 h = . • 确定组限 第一组下限值为 , 上限值为 , …., 第五组下限值为 ,上限值为 , • 计算频数,频率,频率密度,列出频数频率分布表 组序 分组界限 频数 频率 频率密度 1 [, ) 3 2 [, ) 5 3 [, ) 9 4 [, ) 8 5 [, ) 5 合计 30 1 三、数据的描述性指标 频数分布给出了数据的大概分布形状,需要进一步描述与刻画其分布的数量特征,包括:集中程度(位置的测度)、分散程度以及偏倚程度 集中程度 ( 1) 均值 均值 (算术平均值 )是数据集中程度的最主要的测度值。 NiiXNX11总体均值计算公式 样本均值计算公式 niixnx11 例 11 计算例 10所给 30个元件电阻数据的均值 1 iixx 30个元件的平均电阻值,反映该组数据分布的中心位置。 组序 分组界限 频数 频率 频率密度 1 [, ) 3 2 [, ) 5 3 [, ) 9 4 [, ) 8 5 [, ) 5 合计 30 1 若得到的数据是经过分组的频数分布资料, kiii fXNX11总体均值 样本均值 kiii fxnx11式中 Xi , xi为第 i 组的组中值。 (说明:公式以数据在各组中均匀分布为假定条件,违背该假定,则误差较大) 组序 分组界限 频数 fi 频率 频率密度 组中值 1 [, ) 3 2 [, ) 5 3 [, ) 9 4 [, ) 8 5 [, ) 5 合计 30 1 1 niii fxx 调整的均值 均值的大小受到数据集合中极端值的影响较大(不稳健)。 为此,常常对均值进行修改以减少这种极端值的影响。 调整方法:去掉若干最大及最小的极端值,再计算均值,得到所谓按一定百分数调整的均值。 均值是统计学中非常重要的内容,因为任何统计推断和分析几乎都涉及均值。 从统计思想上看,均值反映了一组数据集中程度,是数据数量规律性的一个特征值。 是数据的偶然性、随机性相互抵消后的稳定数值,反映数据的必然性的测度值。 其次,均值有很好的数学性质,如数据观察值与均值的离差之和为零,数据观察值与均值的离差平方和最小。 ( 2) 中位数 中位数是将数据排序后,位置处于最中间的那个数值。 对于未经分组的数据,中位数 2/)1 2/)1 nMNM dd (的位置(的位置 若 N(n)为奇数个,则 X(N+1)/2 (x(n+1)/2)为中位数数值。 若 N(n)为偶数个, 则取最中间的两个数据, xn/2与 x(n/2)+1的平均值为中位数数值。 对于已经分组的数据,中位数的近似计算公式为 式中: N/2表示中位数所在位置; L为中位数所在组的组下限; Sm1为中位数所在组以下各组的累计频数; fm为中位数所在组的频数; i为中位数所在组组距。 说明:公式以数据在各组中均匀分布为假定条件,违背该假定,则误差较大。 * 21ifSNLMmmd 例 12 计算例 10的中位数 )( dM计算分组后的中位数 )815( dM 中位数将所有数据分为两半,一半比中位数小,另一半比中位数大;由位置决定,不受极端值的影响;此外,中位数与数据观察值的绝对离差和最小。 四分位数 将所有数据四等分的三个数值。 例 13。应用统计学2--数据的整理与抽样(编辑修改稿)
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。
用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。