概率论与数理统计样本及抽样分布(编辑修改稿)内容摘要:

, 可视为一个随机试验 , 试验结果可用一随机变量 X 来刻画 : 若恰好抽到具有 该特征的个体 , 记 1X。 否则 , 记 0X . 这样 , X 便服从以 p为参数的伯努利分布 . 通常参数 p是未知的 , 故需通过抽样对其作统计推断 . 例 4 设总体 X 服从参数为  的泊松分布 , nXXX , 21  为其样本 , 则样本的概率分布为 ,!,!,!!}{},{ 21112211   nnsnk kink knn eiiieiiXPiXiXiXP nk      其中 )1( nkik  取非负整数 , 而 nn iiis  21 . 例 5 (讲义例 4) 从某厂生产的某种零件中随机抽取 120 个 , 测得其质量 (单位 : g) 如表 所示 . 列出分组表 , 并作频率直方图 . 表 511 198202020206206213216206205220207211202209208209211216202011204199214214209208221204216210206216212211213212202020217206214207207214199208211219190218218211221208211219214218209211221216203211220214211211208210208213207208202096207206203213209208206204206204208208213193211213203194202208207218213206203202208206209206208197203216219209213222206216208203202200 例 6 (讲义例 5) 随机观察总体 X ,得到一个容量为 10 的样本值: , , 2 , , 0, 3, 2, , 2, 4 求 X 经验分布函数 . 例 7 (讲义例 6) 某厂实行计件工资制 , 为及时了解情况 ,随机抽取 30 名工人 , 调查各自在一周内加工的零件数 , 然后按规定算出每名工人的周工资如下 : (单位 :元 ) 156 134 160 141 159 141 161 157 171 155 149 144 169 138 168 147 153 156 125 156 135 156 151 155 146 155 157 198 161 151 这便是一个容量为 30 的样本观察值 , 其样本均值为 : )151161134156(301  x 它反映了该厂工人周工资的一般水平 . 试计算其样本方差与样本标准差 . 例 8 (讲义例 7) (分组样本均值的近似计算 ) 如果在例 7中收集得到的样本观察值用分组样本形式给出 (见表 ), 此时样本均值可用下面方法近似计算 : 以 ix 表示第 i 个组的组中值 (即区间的中点 ), in 为第 i 组的频率 , nnki ki i  1,2,1, 则  ki iixnnx 11 () 表 某厂 30 名工人周平均工资额 4600301951951]200,190(01850]190,180(1751751]180,170(6601654]170,160(217015514]160,150(8701456]150,140(4051353]140,130(1251251]130,120(合计组中值工人数周工资额区间 iiii xnxn 则本例中 x 这与例 的完全样本结果差不多 . 注:在样本容量较大时 ,给出分组样本是常用的一种方法 ,虽然会损失一些信息 ,但对总体数学期望给出的信息还是十分接近的 . 例 9 (讲义例 8) 设我们获得了如下三个样本 : 样本 A: 3,4,5,6,7;样本 B: 1,3,5,7,9; 样本 C: 1,5,9 如果将它们画在数轴上 (图 513), 明显可见它们的“分散”程度是不同的 : 样本 A在这三个样本中比较密集 , 而样本 C比较分散 . 这一直觉可以用样本方差来表示 . 这三个样本的均值都是 5, 即 ,5 CBA xxx 而样本容量 ,3,5,5  CBA nnn 从而它们的样本方差 分别为 : 10440])59()57()55()53()51[(15 1])57()56()55()54()53[(15 1222222222222BAss 16232)59()55()51[(13 1 2222 Cs . 由此可见 222 ABC sss  ,这与直觉是一致的 , 它们反映了取值的分散程度 . 由于样本方差的量纲与样品的量纲不一致 , 故常用样本标准差表示分散程度 , 这里有 ,4,  CBA sss 同样有 .ABC sss  由于样本方差 (或样本标准差 )很好地反映了总体 方差 (或标准差 )的信息 , 因此若当方差2 未知时 , 常用 2S 去估计 , 而总体标准差  常用样本标准差 S去估计 . 课堂练习 1. 一组工人完成某一装配工序所需的时间 (分 )分别如下 : 35 38 44 33 44 43 48 40 45 30 45 32 42 39 49 37 45 37 36 42 35 41 45 46 34 30 43 37 44 49 36 46 32 36 37 37 45 36 46 42 38 43 34 38 47 35 29 41 40 41 (1) 将上述数据整理成组距为 3 的频数表 ,第一组以 27 为起点。 (2) 绘制样本直方图。 (3) 写出经验分布函数 . 第二节 常用统计分布 取得总体的样本后 , 通常是借助样本的统计量对未知的总体分布进行推断 , 为此须进一步确定相应的统计量所服从的分布 , 除在概率论中所提到的常用分布外 , 本节还要介绍几个在统计 学中常用的 统计分布 : 2 分布 t分布 F分布 内容分布图示 ★ 引言 ★ 分位数 ★ 例 1 ★ 2 分布 ★ 例 2 ★ t 分布 ★ 例 3 ★ F 分布 ★ 例 4 ★ 内容小结 ★ 课堂练习 ★ 习题 52 ★ 返回 内容要点 : 一、分位数 设随机变量 X 的分布函数为 )(xF , 对给定的实数 ),10(  若实数 F 满足不等式   }{ FXP , 则称 F 为随机变量 X 的分布的水平  的 上侧分位数 . 若实数 T 满足不等式   }|{| TXP , 则称 T 为随机变量 X 的分布的水平  的 双侧分位数 . 二、 2 分布 定义 1 设 nXXX , 21  是取自总体 )1,0(N 的样本 , 则称统计量 222212 nXXX  。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。