统计学数据的描述(编辑修改稿)内容摘要:

件 )。 167。 概率的运算 : • 按照集合的记号 , 如果一个事件记为 A, 那么另一个记为 AC( 称为 A的余集或补集 )。 • 显然互补事件的概率之和为 1, 即P(A)+P(AC)=1 , 或者 P(AC) = 1 -P(A)。 • 在西方赌博时常常爱用 优势 或 赔率( odds) 来形容输赢的可能。 • 它 是 互 补 事 件 概 率 之 比 , 即P(A)/P(AC)= P(A)/[1P(A)]来表示。 167。 概率的运算 : • 如果两个事件不可能同时发生 ,那么至少其中之一发生的概率为这两个概率的和。 • 比如 “ 掷一次骰子得到 3或者 6点 ”的概率是 “ 得到 3点 ” 的概率与“ 得到 6点 ” 的概率之和 , 即1/6+1/6=1/3。 • 但是如果两个事件可能同时发生时这样做就不对了。 167。 概率的运算 : • 假定掷骰子时 , 一个事件 A为 “ 得到偶数点 ” ( 有 3种可能: 6点 ) ,另一个事件 B为 “ 得到大于或等于 3点 ”( 有 4种可能: 6点 ) ; • 这样 , 事件 A的概率显然等于 3/6=1/2,即 P(A)=1/2。 而 事 件 B 的概率为P(B)=4/6=2/3。 • 但是 , “ 得到大于或等于 3点或者偶数点 ” 的 事 件 的 概 率 就 不 是P(A)+P(B)=1/2+2/3=7/6了; 167。 概率的运算 : • 这显然多出来了。 概率怎么能够大于1呢。 • 按照中学时关于集合的记号 , 该事件称为 A和 B的并 , 记为 A∪ B。 刚才多出来的部分就是 A和 B的共同部分A∩B( 称为 A和 B的交 ) 的概率 ( 这个概率算了两遍 ) ; • 它为 “ 得到既是偶数 , 又大于等于 3”的部分 , 即 4和 6两点。 出现事件 4或者 6的概率为 1/6+1/6=1/3。 167。 概率的运算 : • 于是应该把算重了的概率减去。 这样“ 得到大于或等于 3点或者偶数点 ”的事件 A∪ B的概率就是 P(A∪ B)=P(A)+P(B)P(A∩B)= 1/2+2/31/3= 5/6。 • 这种 P(A∪ B)= P(A)+P(B)P(A∩B)的公式也适用于两个不可能同时发生的事件;但因为那时 P(A∩B)=0, 所以只剩下 P(A∪ B)= P(A)+P(B)了。 167。 概率的运算 : • 这种交等于空集 ( A∩B=F, 这里 F表示空集或空事件 ) 的事件为两个不可能同时发生的事件 , 称为 互不相 容 事 件 ( mutually exclusive events)。 167。 概率的运算 : • 如果你有一个固定电话和一个手机 ,假定固定电话出毛病的概率为 ,而手机出问题的概率为 , • 那么 , 两个电话同时出毛病的概率是多少呢。 • 聪 明 的 读 者 马 上 会 猜 出 , 是 =。 • 但是这种乘法法则 , 即 P(A∩B)=P(A)P(B), 仅仅在两个事件 独立(independent)时才成立。 167。 概率的运算 : • 如果事件不独立则需要引进 条件概率 (conditional probability)。 • 比如三个人抽签 , 而只有一个人能够抽中 , 因此每个人抽中的机会是1/3。 • 假定用 A A2和 A3分别代表这三个人 抽 中 的 事 件 , 那么 ,P(A1)=P(A2)=P(A3)=1/3。 167。 概率的运算 : • 但是由于一个人抽中 , 其他人就不可能抽中 , • 所以 , 这三个事件不独立。 刚才的乘法规则不成立; • 这时 , P(A1∩A3) = P(A1∩A2) =P(A2∩A3)= 0;如错误照搬乘法规则会得到错误的 (1/3)2=1/9。 167。 概率的运算 : • 但是可以计算条件概率 , 比如第一个人抽到 ( 事件 A1) , 则在这个条件下其他两个人抽到的概率都为 0;记为 P(A2|A1)=P(A3|A1)=0。 • 如第一个人没有抽到 ( 事件 A1C) ,那么其他两人抽到的概率均为 1/2,记为 P(A2|A1C)=P(A3|A1C )=1/2。 167。 概率的运算 : • 一般地 , 在一个事件 B已经发生的情况下 , 事件 A发生的条件概率定义为( 贝叶斯公式 ) 离散型随机变量与连续型随机变量 第四章 概率与概率分布 试验 随机变量 可能的取值 抽查 100个产品 取到次品的个数 0,1,2,…,100 一家餐馆营业一天 顾客数 0,1,2,… 抽查一批电子原件 使用寿命 X0 新建一座住宅楼 半年完成工程的百分比 0X 100 分布 • 随机变量取一切可能值或范围的概率或概率的规律称为概率分布(probability distribution, 简称分布 )。 • 概率分布可以用各种图或表来表示;一些可以用公式来表示。 • 概率分布是关于总体的概念。 有了概率分布就等于知道了总体。 分布 • 前面介绍过的样本均值 、 样本标准差和样本方差等样本特征的概念是相应的总体特征的反映。 • 我们也有描述变量 “ 位置 ” 的总体均值 、 总体中位数 、 总体百分位数以及描述变量分散 ( 集中 ) 程度的总体标准差和总体方差等概念。 167。 离散变量的分布 • 离散变量只取离散的值 , 比如骰子的点数 、 网站点击数 、 顾客人数等等。 每一种取值都有某种概率。 各种取值点的概率总和应该是 1。 • 当然离散变量不不仅仅限于取非负整数值。 • 一般来说 , 某离散随机变量的每一个可能取值 xi都相应于取该值的概率 p(xi),这些概率应该满足关系 ( ) 1 , ( ) 0iiip x p x167。 二项分布 • 最简单的离散分布应该是基于 可重复 的有 两 结果 ( 比如成功和失败 )的相同 独立 试验 ( 每次试验成功概率相同 ) 的分布 , 例如抛硬币。 • 比如用 p代表得到硬币正面的概率 ,那么 1- p则是得到反面的概率。 • 如果知道 p, 这个抛硬币的试验的概率分布也就都知道了。 167。 二项分布 • 这种有两个可能结果的试验有两个特点: • 一是各次试验互相独立 , • 二是每次试验得到一种结果的概率不变 ( 这里是得到正面的概率总是p)。 • 类似于抛硬币的仅有两种结果的重复独立试验被称为 Bernoulli试验( Bernoulli trials)。 167。 二项分布 • 下面试验可看成为 Bernoulli试验: • 每一个进入某商场的顾客是否购买某商品 • 每个被调查者是否认可某种产品 • 每一个新出婴儿的性别。 • 根据这种简单试验的分布 , 可以得到基于这个试验的更加复杂事件的概率。 167。 二项分布 • 为了方便 , 人们通常称 Bernoulli试验的两种结果为 “ 成功 ” 和 “ 失败 ”。 • 和 Bernoulli试验相关的最常见的问题是: 如果进行 n次 Bernoulli试验 ,每次成功的概率为 p, 那么成功 k次的概率是多少。 • 这个概率的分布就是所谓的二项分布 (binomial distribution)。 167。 二项分布 • 这个分布有两个参数 , 一个是试验次数 n, 另一个是每次试验成功的概率 p。 • 基于此 , 二项分布用符号 B(n,p)或Bin(n,p)表示。 • 由于 n和 p可以根据实际情况取各种不同的值 , 因此二项分布是一族分布 , • 族内的分布以这两个参数来区分。 167。 二项分布 • 二项分布的概率通常用二项分布表来查出。 但一般统计软件可以很容易得到这个概率。 • 在目前统计软件发达的情况下 , 涉及的二项分布一般都自动处理了;在处理实际问题中很少会遇到直接计算二项分布概率的情况。 167。 二项分布 • 但这里还是给出其一般公式。 下面p(k)代表在 n次 Bernoulli试验中成功的次数的概率 , p为每次试验成功的概率。 有 ( ) ( 1 ) , 0 , 1 , . . . ,k n knp k p p k nk  这里 !! ( ) !n nk k n k  为二项式系数,或记为 knC0 . 0 00 . 2 00 . 4 00 . 6 0概率p = 0 . 1 p = 0 . 2 p = 0 . 3p = 0 . 4 p = 0 . 5 p = 0 . 6p = 0 . 7 p = 0 . 8 p = 0 . 90 . 0 00 . 2 00 . 4 00 . 6 0概率0 1 2 3 4 5值0 . 0 00 . 2 00 . 4 00 . 6 0概率0 1 2 3 4 5值0 1 2 3 4 5值图 九个二项分布 B(5,p) (p= )的概率分布图 167。 Poisson分布 • 另一个常用离散分布是 Poisson分布( 翻译成 “ 泊松分布 ” 或 “ 普阿松分布 ” )。 • 它可以认为是衡量某种事件在一定期间出现的数目的概率。 • 比如说在一定时间内顾客的人数 、打入电话总机电话的个数 、 放射性物质放射出来并到达某区域的粒子数等等。 167。 Poisson分布 • 在不同条件下 , 同样事件在单位时间中出现同等数目的概率不尽相同。 • 比如中午和晚上某商店在 10分钟内出现 5个顾客的概率就不一定相同。 • 因此 , Pois。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。