(人教A版)选修2-3数学 3.2《独立性检验的基本思想及其初步应用》ppt课件内容摘要:

1、3 2 独立性检验的基本思想及其初步应用 自 主 预 习 学习目标 了解 2 2列联表的意义3了解随机变量 通过对典型案例分析,了解独立性检验的基本思想和方法 点是 2 2列联表的意义及随机变量 难点是独立性检验的基本思想 分类变量和列联表 (1) 分类变量 变量的不同 “ 值 ” 表示个体所属的 ,这样的变量称为 ; 不同类别分类变量(2) 列联表 一般地,假设有两个分类变量 X 和 Y ,它们的取值分别为 和 ,其样本频数表称为 ,其形式为 b a b d c d 总计 a c b d a b c d 列联表2. 等高条形图 (1) 等高条形图与表格相比,更能直观地反映出两个分类变量间是否 2、 ,常用等高条形图展示列联表数据的 (2) 观察等高条形图发现 和 相差很大,就判断两个分类变量之间有关系 相互影响 频率特征b d 问题思考 1 : 列联表中 | 的值与两个分类变量之间关系的强弱有什么关系。 提示: 在列联表中,如果两个分类变量没有关系 ,则应满足 0 ,因此 | 越小,说明两个分类变量之间关系越弱; | 越大,说明两个分类变量之间关系越强 3 独立性检验 (1) 独立性检验的定义 ,其中 n a b c 用随机变量 两个分类变量有关系 ”的方法称为 (2) 独立性检验的步骤 根据实际问题的需要确定容许推断 “ 两个分类变量有关系 ” 犯错误概率的上界 ,然后查表确定临界值 3、 k . n 2 a b c d a c b d 独立性检验 利用公式 K2n 2 a b c d a c b d 计算 k . 如果 k 推断 “ X 与 Y 有关系 ” ,这种推断犯错误的概率不超过 ;否则,就认为在犯错误的概率不超过 的前提下不能推断 “ X 与 Y 有关系 ” ,或者在样本数据中没有发现足够证据支持结论 “ X 与 Y 有关系 ” 问题思考 2 : 利用 K 2 进行独立性检验,估计值的准确度与样本容量有关吗。 提示: 利用 以对推断的正确性的概率作出估计,样本容量 n 越大,这个估计值越准确如果抽取的样本容量很小,那么利用 要 点 导 学 要点一 等高条形图判断分类变 4、量是否相关若要推断的论述为 “ X 与 Y 有关系 ” 可以用等高条形图来直观地分析两个分类变量 X 与 Y 是否有关系其原理是:分析 2 2 列联表中满足条件 X b,与 满足条件 X d,两个比例的值相差越大, 某学校对高三学生作了一项调查,发现:在平时的模拟考试中,性格内向的学生 426 人中有 332 人在考前心情紧张,性格外向的学生 594 人中有 213 人在考前心情紧张作出等高条形图,利用图形判断考前心情紧张与性格类别是否有关系 【思路启迪】 利用 2 2 列联表作出等高条形图,观察两分类变量的差异,作出判断 【解】 作列联表如下: 性格内向 性格外向 总计 考前心情紧张 332 5、 213 545 考前心情不紧张 94 381 475 总计 426 594 1 020 相应的等高条形图如图所示: 图中阴影部分表示考前心情紧张与考前心情不紧张中 性格内向的比例从图中可以看出考前心情紧张的样本中性格内向占的比例比考前心情不紧张样本中性格内向占的比例高,可以认为考前紧张与性格类型有关 条形图能形象直观地反映两个分类变量 之间频率大小差异的关系,进而可以推断它们之间是否具有相关关系,但这只是一种粗略的估计,不能够精确地反映两个分类变量有关系的可信程度 打鼾不仅影响别人休息,而且还可能与患某种疾病有关,在某一次调查中,其中每一晚都打鼾的 254 人中,患心脏病的有 30 人,未患 6、心脏病的有 224 人,在不打鼾的 1 379 人中,患心脏病的有 24 人,未患心脏病的有 1 355 人,利用图形判断打鼾与患心脏病是否有关 解: 根据题目所给的数据得到如下 2 2 列联表 患心脏病 未患心脏病 合计 每一晚都打鼾 30 224 254 不打鼾 24 1 355 1 379 合计 54 1 579 1 633 相应的等高条形图如图 图中两个深色的高分别表示每一晚都打鼾和不打鼾的 人中患心脏病的频率,从图中可以看出,每一晚都打鼾样本中患心脏病的频率明显高于不打鼾样本中患心脏病的频率,因此可以认为打鼾与患心脏病有关系 . 要点二 检验问题,首先由所给 2 2 列联表确定 a 7、, b , c , d , n 的值,然后代入随机变量的计算公式 K2n 2 a b a c b d c d ,求出观测值 k ,将 k 与临界值 k 0 进行对比,确定有多大的把握认为两个分类变量有关系 某学校发现有大批学生不进行正常午休,于是开始对学生进行正确教育,并施行了一些奖罚措施,但是仍有些学生不能正确午休,教师进行谈话教育时这些学生总能找到许多理由,如 “ 不午休不影响我的学习,不午休是我多年的 习惯,我下午、晚上精力仍然很充沛 ” 等等,使教师的说服教育效果很差,于是一位数学老师就对一次数学考试成绩进行了如下的统计 ( 数据如下表 ) 单位:人 分数段 午休 不午休 69 90 8、23 17 91 100 47 51 101 1 10 30 67 111 120 21 15 121 130 14 30 131 140 31 17 141 150 14 3 那么请你利用这些数据统计分析来说明午休与学习的 关系 【思路启迪】 解决独立性检验问题就是观测值 k 与临界值 k 0 进行对比,从而确定两个分类变量 的关系 【解】 首先我们可以把考试成绩分成两个方面,及格与不及格完成列联表: 单位:人 及格 不及格 合计午休 80 100 180不午休 65 135 200合计 145 235 380这时通过表格会发现午休学生的及格率 018049,不午休学生的及格率 520013 9、40,显然 么我们有多大的把握承认这个结论。 于是进行独立性检验,计算得 k 380 80 135 6 5 100 2180 200 145 235 所以在犯错误的概率不超过 前提下认为午休可以提高学习成绩因此我们的结论是:适当午休有助于保持我们良好的学习状态,提高我们的学习成绩 解决独立性检验问题的基本步骤是: (1) 指出相关数据,作列联表; (2 ) 求 (3) 判断可能性,注意与临界值作比较,得出事件有关的可能性大小 在一次天气恶劣的 飞行航程中,调查了男女乘客在飞机上晕机的情况:男乘客晕机的有 24 人,不晕机的有 31 人;女乘客晕机的有 8 人,不晕机的有 26 人根据所给数据,能 10、否在犯错误的概率不超过 前提下认为在天气恶劣的飞行航程中,男乘客比女乘客更容易晕机。 解: 根据题意,列出 2 2 列联表如下: 晕机 不晕机 总计 男乘客 24 31 55 女乘客 8 26 34 总计 32 57 89 假设在天气恶劣的飞机航程中男乘客不比女乘客更容 易晕机 由公式可得 k n 2 a b c d a c b d 89 24 26 31 8 255 34 32 57 因此,在犯错误的概率不超过 前提下,认为 “ 在天气恶劣的飞行航程中男乘客比女乘客更容易晕机 ” . 要点三 独立性检验的综合应用独立性检验是数理统计的一种方法,是数学中的一种基本理论,是数学体系中对数据关系进 11、行探索的一种基本思想当然,对数据的统计分析得出的结论只能是在一定程度上对某种关系进行判断,而 不是一种确定性的关系,这也是统计思想与确定性思维的差异所在独立性检验在实际中有着广泛的应用,是对实际生活中数据进行分析的一种方法,通过这种分析得出的结论对实际生活或者生产都有一定的指导作用 某校为了探索一种新的教学模式,进行了一项课题实验,乙班为实验班,甲班为对比班,甲、乙两班均有50 人,一年后对两班进行测试,成绩如下表 ( 总分: 150 分 ) : 甲班 成绩 80,90) 90,100) 100,110) 110,120) 120,130)频数 4 20 15 10 1乙班 成绩 80,90) 12、 90,100) 100,110) 110,120) 120,130)频数 1 11 23 13 2(1) 现从甲班成绩位于 90,120) 内的试卷中抽取 9 份进行试卷分析,请问用什么抽样方法更合理,并写出最后的抽样结果; (2) 根据所给数据可估计在这次测试中,请你估计乙班的平均分,并计算两班平均分相差几分; (3) 完成下面 2 2 列联表,前提下, “ 这两个班在这次测试中成绩的差异与实施课题实验有关 ” 吗。 并说明理由 . 成绩小于 100 分 成绩不小于 100 分 总计 甲班 a 26 50 乙班 12 d 50 总计 36 64 100 【思路启迪】 【解】 (1) 用分层抽样的方法更 合理甲班成绩位于90,1 20) 内的试卷共有 20 15 10 45( 份 ) ,从中抽取 9 份,抽样比为94515,故在 90,100) , 100, 1 10) , 1 10,120) 各分数段内抽取试卷 20 15 4( 份 ) , 15 15 3( 份 ) , 10 15 2( 份 ) (2) 估计乙班的平均分为 x乙 85 150 95 1150 105 2350 1 15 1350 1 25 250 105. 8, 10 4 ,即两班的平均分差 4 分。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。