第3章数据的概括性度量内容摘要:

公式为 6. 可看作是均值的一种变形 nniinnm xxxxG 121 nxxxxnGniinm 121lg)lglg( l g1lg STAT 几何平均数 (例题分析 ) 【 例 】 一位投资者持有一种股票 , 1996年 、1997年 、 1998年和 1999年收益率分别为%、 %、 %、 %。 计算该投资者在这四年内的平均收益率。 %%%%%21 nnmxxxG 平均收益率= %1=% STAT 众数、中位数和均值的比较 STAT 众数、中位数和均值的关系 左偏分布 均值 中位数 众数 对称分布 均值 = 中位数 = 众数 右偏分布 众数 中位数 均值 STAT 众数、中位数和均值的特点和应用 1. 众数 – 不受极端值影响 – 具有不唯一性 – 数据分布偏斜程度较大时应用 2. 中位数 – 不受极端值影响 – 数据分布偏斜程度较大时应用 3. 平均数 – 易受极端值影响 – 数学性质优良 – 数据对称分布或接近对称分布时应用 STAT 数据类型与集中趋势测度值 数据类型和所适用的集中趋势测度值 数据类型 分类数据 顺序数据 间隔数据 比率数据 适 用 的 测 度 值 ※ 众数 ※ 中位数 ※ 均值 ※ 均值 — 四分位数 众数 调和平均数 — 众数 中位数 几何平均数 — — 四分位数 中位数 — — — 四分位数 — — — 众数 STAT 离散程度的测度 一. 分类数据:异众比率 二. 顺序数据:四分位差 三. 数值型数据:方差及标准差 四. 相对位置的测量:标准分数 五. 相对离散程度:离散系数 STAT 离中趋势 1. 数据分布的另一个重要特征 2. 反映各变量值远离其中心值的程度 ( 离散程度 ) 3. 从另一个侧面说明了集中趋势测度值的代表程度 4. 不同类型的数据有不同的离散程度测度值 STAT 分类数据:异众比率 STAT 异众比率 (variation ratio) • 1. 离散程度的测度值之一 • 2. 非众数组的频数占总频数的比率 • 3. 计算公式为 4. 用于衡量众数的代表性  imimir fffffV 1STAT 异众比率 (例题分析 ) 某城市居民关注广告类型的频数分布 广告类型 人数 (人 ) 频率 (%) 商品广告 服务广告 金融广告 房地产广告 招生招聘广告 其他广告 112 51 9 16 10 2 合计 200 100 解: 在所调查的 200人当中 , 关注非商品广告的人数占 44%, 异众比率还是比较大。 因此 , 用 “ 商品广告 ” 来反映城市居民对广告关注的一般趋势 , 其代表性不是很好 %2001121112112200rVSTAT 顺序数据:四分位差 STAT 四分位差 (quartile deviation) 1. 离散程度的测度值之一 2. 也称为内距或四分间距 3. 上四分位数与下四分位数之差 QD = QU QL 4. 反映了中间 50%数据的离散程度 STAT 四分位差 (顺序数据的算例 ) 解: 设非常不满意为1,不满意为 2, 一般为3, 满意为 4, 非常满意为 5 已知 QL = 不满意 = 2 QU = 一般 = 3 四分位差: QD = QU = QL = 3 – 2 = 1 甲城市家庭对住房状况评价的频数分布 回答类别 甲城市 户数 (户 ) 累计频数 非 常 不 满意 不满意 一般 满意 非常满意 24 108 93 45 30 24 132 225 270 300 合计 300 — STAT 数值型数据:方差和标准差 STAT 极差 (range) 1. 一组数据的最大值与最小值之差 2. 离散程度的最简单测度值 3. 易受极端值影响 4. 未考虑数据的分布 5. 计算公式为 6. R = max(xi) min(xi) STAT 平均差 (mean deviation) • 1. 离散程度的测度值之一 • 2. 各变量值与其均值离差绝对值的平均数 • 3. 能全面反映一组数据的离散程度 • 4. 数学性质较差,实际中应用较少 5. 计算公式为 未分组数据 组距分组数据 nxxMniid 1nfxMMkiiid 1STAT 平均差 (例题分析 ) 某电脑公司销售量数据平均差计算表 按销售量分组 组中值 (Mi) 频数 (fi) 140— 150 150— 160 160— 170 170— 180 180— 190 190— 200 200— 210 210— 220 220— 230 230— 240 145 155 165 175 185 195 205 215 225 235 4 9 16 27 20 17 10 8 4 5 40 30 20 10 0 10 20 30 40 50 160 270 320 270 0 170 200 240 160 250 合计 — 50 — 2040 xMi  ii fxM STAT 平均差 (例题分析 ) )(171 2 02 0 4 01台nfxMMkiiid 含义:每一天的销售量平均数相比 , 平均相差 17台 STAT 方差和标准差 (variance and standard deviation) ,称为总体方差或。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。