统计学原理课件上(编辑修改稿)内容摘要:
累计频数) 向下累计分布:(变量下限,累计频数) 变量的组数无限增多时,折线便趋于一条光滑的曲线。 图形 0102030405060708090第一季度 第二季度 第三季度 第四季度0102030405060708090100第一季度 第二季度 第三季度 第四季度东部第一季度第二季度第三季度第四季度01020304050607080901000 2 4 6东部返回 综合指标概述 总量指标 (绝对数指标) 相对数指标(相对数 指标 ) 平均数指标(平均数 指标 ) 标志变异指标 主要内容 案例 第 4章 综合指标 综合指标概述 统计指标 统计指标是综合反映统计总体数量特征的概念和数值。 指标名称 指标数值 反映总体某一方面的质的规定性 , 是对总体本质特征的一种概括。 是总体量的规定性在一定时间、地点、条件下的具体表现。 统计指标 重要特点:具体性;综合性。 描述指标 评价指标 监测指标 分类 数量指标 质量指标 绝对数指标 相对数指标 平均数指标 指标体系 具有内在联系的一系列指标所构成的整体 , 即称为指标体系。 分类 社会指标体系 经济指标体系 科技指标体系 基本统计指标体系 是针对某项社会经济问题而制定的专项指标体系,如工业经济效益指标体系、价格指标体系等。 专题统计指标体系 总量指标(绝对数指标) 概念: 总量指标是反映社会经济现象 总规模 、总水平的总和指标。 ( 1)反映国情、国力和企事业单位人、财、物 的状况; ( 3)是计算相对指标和平均指标的基础。 ( 2)是国民经济宏观管理和企业经济核算的基础性指标,是实行目标管理的工具; 作用: 分类: 按反映总体的内容分 按反映的时间状态分 ( 1)社会总产品 ( 2)增加值 ( 3)国内生产总值( GDP) 按计量单位分 国民经济统计中几个重要的生产总量指标: 标志总量 总体单位总数 时期总量 时点总量 实物量 劳动量 价值量 相对指标(相对数) 概念: 相对指标是两个有联系的指标对比的比值 , 反映事物的数量特征和数量关系。 ( 1)反映总体内在的结构特征; ( 3)反映事物发展变化的过程和趋势。 ( 2)用于不同对象的比较评价; 作用: 种类 计划完成相对数 结构相对数 比例相对数 比较相对数 强度相对数 动态相对数 不同时期 比 较 动 态 相对数 强 度 相对数 不同现象 比较 不同总体 比较 比 较 相对数 同一总体中 部分与部分 比 较 部分与总体 比 较 实际与计划 比 较 比 例 相对数 结 构 相对数 计划完成 相对数 同一时期比较 同类现象比较 应用原则: ( 1)正确选择对比的基数; ( 2)必须注意统计的可比性; ( 3) 相对指标要与总量指标相结合; ( 4) 应选取多种相对指标结合分析。 平均指标(平均数) 概念: 平均指标反映同类现象的 一般水平 , 是总体内各单位参差不齐的标志值的 代表值 , 也是对变量分布 集中趋势 的测定。 数据集中区 变量 x x常用的几种平均数: 概 念 计算 公 式 特 点 优点 :① 容易理解, 便于计算; ②灵敏度高; ③稳定性好; ④ 、 和。 缺点 :① 易受极值影响; ②在偏斜分布和 U形分布中,不具有代 表性。 1. 算术平均数 ( ) 标志总量与总体单位总数的比值 nxx iiiiffxx简单: 加权: 0 xx 最小 2xxx常用的几种平均数: 概 念 计算 公 式 特 点 优点:①灵敏度高; ②在某种不能计 算的条件下, 可以代替算术 平均数。 缺点:①不易理解; ②易受极值影响; ③有“ 0”值时不能 计算。 2. 调和平均数 ( ) 标志值倒数平均数的倒数 简单: 加权: HxiH xnx/1iXiiH mmx/常用的几种平均数: 概 念 计算 公 式 特 点 优点 : ① 灵敏度高; ② 受极值影响小于 和 ③ 适宜于各比率之积 为总比率的变量求 平均。 缺点 : ① 有 “ 0”或负值时 不能计算; ② 偶数项数列只能 用正根。 3. 几何平均数 ( ) 几个变量值连乘积的几次根 简单: 加权: Gxn iG xx if ifiG xx 常用的几种平均数: 概 念 计算 公 式 特 点 4. 中位数 ( Me) 标志值由小到大顺序排列中居中间位置的标志值位置平均数 212221nnenexxMxMifSfLMmme 12优点 :① 容易理解; ②不受极值影响; ③适宜于开口组资 料和些不能用数 字测定的事物。 缺点 :① 灵敏度和计算功 能差; ②间断数 Me。 常用的几种平均数: 概 念 计算 公 式 特 点 5. 众数 ( Mo) 分配数列中出现次数最多的标志值位置平均数 上限公式: 下限公式: 优点: ① 容易理解; ②不受极值影响。 缺点: ① 灵敏度和计算功 能差; ②稳定性差; ③ 具有不唯一性。 idd dUM o 212idd dLM o 211要点解释 权数 ( Weighted) , 是分布数列中的频数或频率。 对求平均数具有 权衡轻重 的作用 , 是影响平均数变动的两个因素之一 ( 另一因素是变量值 )。 权数 例 (1) (2) (3) X 4 5 6 合计 频数 频率 (%) 10 20 10 40 X 4 5 6 合计 频数 频率 (%) 20 40 20 80 X 4 5 6 合计 频数 频率 (%) 20 10 10 80 =5 =5 = x x x调和平均数与算术平均数的区别 例 频率分布变了,均值也变。 因此,严格地说,权数应指 频率。 凡是掌握被平均指标的分母资料时,用算术平均法。 凡是掌握被平均指标的分子资料时,用调和平均法。 平均指标 分子:标志总量 分母:总体单位总数 = 几何平均等于对数的算术平均 例 组距数列求中位数 是用插值法对中位数组分割的结果。 例 组距数列求众数 是以频数之差计算的比例分割众数。统计学原理课件上(编辑修改稿)
相关推荐
的无偏估计时, 方差 越 小,无偏估计越有效。 ˆ 2)ˆ( Eˆ一致性 对于无限总体, 如果对任意 , 0>0)|ˆ(| nn PL im , 则称 是 的一致估计。 充分性 一个估计量如能完全地包含未知参数信息,即为充分量。 估计量 的 ˆ 区间估计 估计未知参数所在的可能的区间。 评价准则 随机区间 置信度 精确度 随机区间
定义为 , 统计量 取该值或更极端的值 的概率等于 a。 也就是说 ,“ 统计量的实现值比临界值更极端 ”等价于 “ p值小于 a”。 使用临界值的概念进行的检验不计算 p值。 只比较统计量的取值和临界值的大小。 167。 假设检验的过程和逻辑 • 使用临界值而不是 p值来判断拒绝与否是前计算机时代的产物。 当时计算 p值不易 ,只采用临界值的概念。 但从给定的 a求临界值同样也不容易 ,
有次品的个数及概率如下表 次品数 X = xi 0 1 2 3 概率 P(X=xi)pi 每 100个配件中的次品数及概率分布 求该供应商次品数的数学期望和标准差 iii px22( ) , ( ) 0 . 7 0 5 1 0 . 8 3 9 7iiiD X x p 167。 连续变量的分布 • 取连续值的变量 , 如高度 、 长度 、重量
025 1921 101835 310505 170094 2x2y xy解:( 1)绘制散点图 ( 2)建立简单直线回归方程: )1025(101835121921102517009412222 XXnYXXYnb 24121 02 54 20 121 92 11 XbYXbYna00ˆ bxay 其中 a=
VC维 :对于一个指示函数(即只有 0和 1两种取值的函数)集,如果存在 h个样本能够被函数集里的函数按照所有可能的 2h种形式分开,则称函数集能够把 h个样本打散,函数集的 VC维就是能够打散的最大样本数目。 如果对任意的样本数,总有函数能打散它们,则函数集的 VC维就是无穷大。 VC维(续) 一般而言 ,VC维越大 , 学习能力就越强 ,但学习机器也越复杂。
它为变量 (variable)。 167。 变量和数据 当变量按照随机规律所取的值是数量时该变量称为定量变量或 数 量 变 量 (quantitative variable); 因为是随机的 , 也称为随机变量 (random variable)。 如身高体重 , 购买某商品的人数等等 167。 变量和数据 象性别 , 观点之类的取非数量值的变量就称为定性变量或属性变量或分类变量