多元统计分析均值向量与协方差阵的检验(编辑修改稿)内容摘要:

两类企业间有无显著性差异 ? Dependent Variable: x3 Sum of Source DF Squares Mean Square F Value Pr F Model 1 .0001 Error 36 Corrected Total 37 Dependent Variable: x4 Sum of Source DF Squares Mean Square F Value Pr F Model 1 Error 36 Corrected Total 37 协方差阵不相等时,两个正态总体均值向量的检验 二、成对试验的 T2统计量 • 前面我们讨论的是两个独立样本的检验问题,但是不少的实际问题中,两个样本的数据是成对出现的。 例如当讨论男女职工的工资收入是否存在差异;一种新药的疗效等。 思考 :两独立样本和成对样本的观测值有何不同 ? 设 (xi,yi),i=1,2,3,„,n ,是成对的试验数据,由于总体 X和 Y均服从 p维正态分布,且协方差相等。 12, ~ ( , ) ,i i i p dN     id x y d δ μ μ令 则。 假设检验 0 1 2 1 1 2: , :HH   01: 0 , : 0HH 检验的统计量为 2 dTn  1d S d 其中 d x y11 ( ) ( )1niiin    dS d d d d 当原假设为真时 2 ~ ( , )( 1 )npF T F p n ppn2 ( , ) ,( 1 )np T F p n ppn   拒 绝 原 假 设2 ( , ) ,( 1 )np T F p n ppn   接 受 原 假 设例 1 一组学生共 5人 , 采用两种不同的方式进行教学 , 然后对 5个学生进行测验 , 得如下得分数: 学生序号 教学方式 A B 数学 物理 数学 物理 1 89 90 82 85 2 98 88 80 83 3 75 69 61 70 4 76 70 67 66 5 90 76 63 65 分析不同的教学方式是否有差异。 167。 5 两个总体均值分量间结构关系的检验 一、问题提出 设从总体 , 中各自独立地抽取样本 和 ,。 他们的均值向量差为: 1( , )pN   和 2( , )pN  112( , , , )nx x x x 212( , , , )ny y y y 011 2112 22212pp1μ μ 例 在爱情和婚姻的调查中,对一个由若干名丈夫和妻子组成的样本进行了问卷调查,请他们回答以下几个问题: (1)你对伴侣的爱情的“热度”感觉如何。 (2)伴侣对你的爱情的“热度”感觉如何。 (3)你对伴侣的爱情的“可结伴”水平感觉如何。 (4)伴侣对你的爱情的“可结伴”水平感觉如何。 回答采用没有、很小、有些、很大和非常大 5个等级,得到结果如表。 丈夫对妻子 妻子对丈夫 X1 X2 X3 X4 X1 X2 X3 X4 2 3 5 5 4 4 5 5 5 5 4 4 4 5 5 5 4 5 5 5 4 4 5 5 4 3 4 4 4 5 5 5 3 3 5 5 4 4 5 5 3 3 4 5 3 3 4 4 3 4 4 4 4 3 5 4 4 4 5 5 3 4 5 5 4 5 5 5 4 4 5 4 4 4 3 3 3 4 4 4 4 4 5 5 4 5 5 5 5 5 4 4 5 5 5 5 现在我们关心均值分量间的差异是否满足某种结构关系。 比如每个指标均值间的差异是否相等。 丈夫对妻子以及妻子对丈夫的回答在 α= 显著水平上没有差异。 在四个指标上他们是否会有相同的分数。 即检验四个分数的平均值是否相等。 二、统计量与检验 检验 0 1 2: ( )H C μ μ φ 1 1 2: ( )H C μ μ φ在原假设为真的条件下,检验的统计量为:    12 1212(( pnnT nn       C x y ) φ C S C C x y ) φ2121212( 1 ) ~ ( , 1 )( 2 )n n kF T F k n n kk n n     167。 6 多总体均值的检验 • 单因素方差分析 • 多元方差分析 单因素方差分析 问题的提出 统计的模型及检验方法 多重比较检验 问题的提出 某工厂实行早、中、晚三班工作制。 工厂管理部门想了解不同班次工人劳动效率是否存在明显的差异。 每个班次随机抽出了 7个工人,得工人的劳动效率(件 /班)资料如表。 分析不同班次工人的劳动效率是否有显著性差异。 a=,。 早班 中班 晚班 34 49 39 37 47 40 35 51 42 33 48 39 33 50 41 35 51 42 36 51 40 为什么各值 会有差异。 可能的原因有两个 一是 , 各个班次工人的劳动效率可能有差异 ,从而导致了不同水平下的观察值之间差异 , 即存在条件误差。 二是 , 随机误差的存在。 如何衡量两种原因所引起的观察值的差异 ? 总平均劳动效率为:   kinij ijnyy i1/)( 40423734  三个班次工人的平均劳动效率分别为: y y y总离差平方和 ss   kinj iji yy1 12)(222 )())(  1 4 2 2 5 202011 n自由度:组间离差平方和 (条件误差 )ssA  ki ii yyn1 2)(22 )5 7 7 (7)5 7 1 (7 2)5 7 2 (7  组内离差平方和 ( 随机误差 ) sse   kinj iiji yy1 12)(22 )7 1 ()7 1 (  22 )()(  8 5 )4 2 ()4 2 ( 22  18321  kn自由度 统计量 F knSSkSS eA 11 1 8 218 8 5 2 8 8 6 把计算的 F值与临界值比较 , 当 F  F时 , 拒绝原假设 , 不同水平下的效应有显著性差异;当 F F 时 , 接受原假设。  ki ii yyn1 2)( 1k 1kSSAknSSkSS eA 1   ki nj iiji yy1 1 2)( kn knSSe   ki nj iji yy1 1 2)( 1n方 差 来 源 离差平方和 自由度 方差 F值 组间 A 组内 E — 总和 — — NEXT 查 F分布表得临界值 因为 故应拒绝原假设 , 即不同班次工人的劳动效率有显著的差异。 )18,2( F 0 1 )18,2( F0 )18,2(1 82  FF 方差分析 :比较 3个或 3个以上的总体均值是否有显著性差异。 用组间的方差与组内方差相比,据以判别误差主要源于组间的方差(不同组工人的产量,条件误差),还是源于组内方差(随机误差)。 50家上市公司,按行业计算其 1999年底的资产负债情况,如下: 序号 制造业 商业 运输业 公用事业 房地产业 1 65 90 50 25 70 2 55 95 65 30 75 3 50 90 58 45 60 4 45 93 63 50 80 5 40 92 64 40 65 6 58 90 60 25 70 7 60 85 58 30 72 8 75 88 56 30 76 9 80 90 60 35 68 10 60 92 55 25 66 平均 A N O V AX11 7 1 0 8 . 6 8 4 4 2 7 7 .1 7 0 7 2 .4 3 7 .0 0 02 6 5 7 .1 0 0 45 5 9 .0 4 71 9 7 6 5 . 7 8 49B e t w e e n G r o u p sW it h in G r o u p sT o t a lS u m o fS q u a r e s df M e a n S q u a r e F S i g .多重比较检验 多重比较检验 前面的 F检验只能说明在单一因素的影响下,不同水平是否存在显著性的差异,但不能断言哪些总体之间存在差异,在方差分析中否定了原假设,并不意味着接受了假设: ),2,1,( kjijiji  因而还应该进一步讨论到底是哪些总体之间存在差异。 Scheffe检验 ),2,1,(:0 kjijiH ji  )某些 jiH ji  (:1 ),1()1)(11(21knkFknnkn SS eij  定义:jiij xxD 定义:检验的结论:。 个水平间有显著性差异水平与第即第,则拒绝 jiHSD ijij ,0M u l t i p l e C o m p a r i s on sD e p e n d e n t V a r ia b le : X 1S c h e f f e 3 1 . 7 0 0 0 * 3 . 4 3 6 4 7 . 0 0 0 4 2 . 7 3 6 9 2 0 . 6 6 3 1 . 1 0 0 0 3 . 4 3 6 4 7 1 . 0 0 0 1 1 . 1 3 6 9 1 0 . 9 3 6 92 5 . 3 0 0 0 * 3 . 4 3 6 4 7 . 0 0 0 1 4 . 2 6 3 1 3 6 . 3 3 6 9 1 1 . 4 0 0 0 * 3 . 4 3 6 4 7 . 0 3 9 2 2 . 4 3 6 9 . 3 6 3 13 1 . 7 0 0 0 * 3 . 4 3 6 4 7。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。