统计学对应分析(编辑修改稿)内容摘要:

投保人 年龄 投保人 年龄 1 2 3 4 5 6 7 8 9 32 50 40 24 33 44 45 48 44 10 11 12 13 14 15 16 17 18 47 31 36 39 46 45 39 38 45 19 20 21 22 23 24 25 26 27 27 43 54 36 34 48 23 36 42 28 29 30 31 32 33 34 35 36 34 39 34 35 42 53 28 49 39 STAT 上表是一个由 36个投保人组成的简单随机样本的年龄数据。 现求总体的平均年龄的区间估计。 分析:区间估计包括两个部分 —— 点估计和误差边际,只需分别求出即可到的总体的区间估计。 解:已知 ( 1)样本的平均年龄 ( 2)误差边际 %90136 2   Zn ,(大样本), 36405032   n xxs2样本标准差(未知)总体标准差 nZxSTAT 样本标准差 误差边际 ( 3) 90%的置信区间为 177。 即( , )岁。 注意 ( 1)置信系数一般在抽样之前确定,根据样本所建立的区间能包含总体参数的概率为 ( 2)置信区间的长度(准确度)在置信度一定的情况下,与样本容量的大小呈反方向变动,若要提高估计准确度,可以扩大样本容量来达到。 1)(2 nxxs36*22nsZnZx  STAT :小样本的情况 在小样本的情况下,样本均值的抽样分布依赖于总体的抽样分布。 我们讨论总体服从正态分布的情况。 t分布的图形和标准正态分布的图形类似,如下图示: )(30nstxx分布服从未知总体标准差服从正态分布已知总体标准差小样本STAT 0 标准正态分布 t分布(自由度为 20) t分布(自由度为 10) 图 2标准正态分布与 t分布的比较 STAT 在t分布中,对于给定的置信度,同样可以通过查表找到其对应的临界值 ,利用临界值也可计算区间估计的误差边际 因此,总体均值的区间估计在总体标准差未知的小样本情况下可采用下式进行: 假定总体服从正态分布; 2tnst 2nsZx 2值。 的供的面积为分布的右侧尾部中所提)的自由度为(为在为样本的标准差;)为置信系数;式中,(t2t1n12 tsSTAT 【 例 3】 谢尔工业公司拟采用一项计算机辅助程序来培训公司的维修支援掌握及其维修的操作,以减少培训工人所需要的时间。 为了评价这种培训方法,生产经理需要对这种程序所需要的平均时间进行估计。 以下是利用新方对15名职员进行培训的培训天数资料。 根据上述资料建立置信度为95%的总体均值的区间估计。 (假定培训时间总体服从正态分布)。 职员 时间 职员 时间 职员 时间 1 52 6 59 11 54 2 44 7 50 12 58 3 55 8 54 13 60 4 44 9 62 14 62 5 45 10 46 15 63 STAT 解:依题意,总体服从正态分布,n=15(小样本),此时总体方差未知。 可用自由度为( n1) =14的 t分布进行总体均值的区间估计。 样本平均数 样本标准差 误差边际 95%的置信区间为 63554452   n xx14 5 11)(2 nxxs15*2nstx  177。 即( , )天。 STAT 误差边际 其计算需要已知 若我们选择了置信度 由此,得到计算必要样本容量的计算公式: nZx  2。 和样本容量 n,2Z2,1  Z就可以确定2Zn在 已 知 和 后 , 我 们 可 以 求 出 误 差 边 际 为 任 何 数 值 时 的样 本 容 量等于期望的误差边际。 令 E)(222222 EZnEZnnZE STAT 【 例 4】 在以前的一项研究美国租赁汽车花费的研究中发现,租赁一辆中等大小的汽车,其花费范围为,从加利福尼亚州的奥克兰市的每天 36美元到康涅狄格州的哈特福德市的每天 元不等,并且租金的标准差为。 假定进行该项研究的组织想进行一项新的研究,以估计美国当前总体平均日租赁中等大小汽车的支出。 在设计该项新的研究时,项目主管指定对总体平均日租赁支出的估计误差边际为 2美元,置信水平为 95%。 解:依题意, 可得 将以上结果取下一个整数( 90)即为必要的样本容量。 2,%,951 2  EZ  2)(2222222EZn STAT 说明: 由于总体标准差 在大多数情况下 是未知的,可以有以下方法取得 的值。 ( 1)使用有同样或者类似单元的以前样本的样本标准差; ( 2)抽取一个预备样本进行试验性研究。 用实验性样本的标准差作为 的估计值。 ( 3)运用对 值的判断或者“最好的猜测”,例如,通常可用全距的作为 的近似值。  STAT 对总体比例 的区间估计在原理上与总体均值的区间估计相同。 同样要利用样本比例 的抽样分布来进行估计。 若, 则样本比例近似服从正态分布。 同样,抽样误差 类似的,利用抽样分布(正态分布)来计算抽样误差 pp5)1(,5,30  pnnpnppp 2 2 2( 1 )p pppp p Z Z Znn           STAT 上式中, 是正待估计的总体参数,其值一般是未知,通常简单的用 替代。 即用样本方差 替代总体方差。 则, 误差边际的计算公式为: pp p)1( pp  )1( pp nppZp)1(2 的置信区间则为:1nppZp)1(2 值。 的为侧尾部中所提供的面积为在标准正态分布的右)为置信系数;式中,(Z212ZSTAT 【 例 5】 1997年菲瑞卡洛通讯公司对全国范围每内的 902名女子高尔夫球手进行了调查,以了解美国女子高尔夫球手对自己如何在场上被对待的看法。 调查发现, 397名女子高尔夫球手对得到的球座开球次数感到满意。 试在 95%的置信水平下估计总体比例的区间。 分解: 解:依题意已知, ( 1)样本比例 ( 2)误差边际 误差边际点估计区间 %951902 2   Zn ,(大样本),  nmp03 9。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。