描述统计
不同 (图 001)。 可见,平均数只反映了数据分布 (中心 )位置方面的特征 (平均水平 );数据分布的形状特征 (变异度 )应该有另一指标来表示。 常用的变异度指标有如下 4种: 一、极差或全距 ( R ) R=最大值-最小值。 其效果“极差”,因最大与最小值稳健性最差,即:若反复抽样,所得的 R值差别很大 (如潜伏期 )。 极差 ( R )的适用情况:
不同 22 ,)()1(112 ssxxnsnii 2N122 ,)X()N(1 ii11 Variance amp。 standard deviation變異數 amp。 標準差 變異數 變異數為 0時,表示所有觀察值都同 單位相同時可做比較 每個觀察值的變化都被考慮 標準差 變異數開根號就得到標準差 與平均數有相同單位
位置。 Column content:确定列中输出内容。 第 6 章 统计报表和描述性统计 100 Values:输出变量名(如 KM)。 Values labels:输出变量标签(如 1)。 ( 3)当分类变量进入 Break Column 时,打开 summarie 对话框,选择有关的统计量,注意在此是选择各个品系的有关的统计量,例如均值、标准差等。 ( 4)当分类变量进入
“标志位于第一行 ”;如果输入区域没有标志项,该复选框将被清除, Excel 将在输出表中生成适宜的数据标志; 输出区域可以选择本表、新工作表或是新工作簿; 汇总统计:包括有平均值、标准误差 (相对于平均值 )、中值、众数、标准偏差、方差、峰值、偏斜度、极差、最小值、最大值、总和、总个数、最大值、最小值和置信度等相关项目。 其中: 中值:排序后位于中 间的数据的值; 众数:出现次数最多的值;
于样本抽取的随机性,作为样本的函数,统计量也是一个随机变量。 统计量的分布是由 X 的分布决定的 常用统计量有样本平均值 、中位数 、众数、极差 R、方差 S均方差 S等 x x~26 二 样本平均值 1 概念 从总体中随机抽取大小为 n的样本,其数据分别为 x x … xn,则其样本平均 值记为 样本平均值 是总体 X数学期望 μ的估计值 若样本数据的种类数为 k,第 j种数据的数值为
• 信息量小,缺乏敏感性,不适合代数运算 • 用于非对称的次数数列、特别是品质标志数列 • 用于数列中有较多的数值向某一数值集中 • 有时会存在多个众数 (二)、中位数 Medium • 中位数就是把计算对象的数据按大小顺序排列后,处于中间位置上的变量值。 = • 注意: • 是位置平均数,不受极端值的影响 • 假定各单位在组内是均匀分布的 • 信息量小,缺乏敏感性,不适合代数运算 •