定型数据的建模分析(编辑修改稿)内容摘要:

2020/10/5 中国人民大学六西格玛质量管理研究中心 44 167。 8 .3 Logistic回归基本理论和方法 目录 上页 下页 返回 结束 2020/10/5 中国人民大学六西格玛质量管理研究中心 45 167。 8 .3 Logistic回归基本理论和方法 目录 上页 下页 返回 结束 表 2020/10/5 中国人民大学六西格玛质量管理研究中心 46 167。 8 .3 Logistic回归基本理论和方法 目录 上页 下页 返回 结束 2020/10/5 中国人民大学六西格玛质量管理研究中心 47 167。 8 .3 Logistic回归基本理论和方法 目录 上页 下页 返回 结束 得年收入 8万元的家庭预计实际购房比例为 %,这个结果与未加权的结果很接近。 以上的例子是只有一个自变量的情况,分组数据的 Logistic回归模型可以很方便的推广到多个自变量的情况,在此就不举例说明了。 分组数据的 Logistic回归只适用于大样本的分组数据,对小样本的未分组数据不适用。 并且以组数 c为回归拟合的样本量,使拟合的精度低。 实际上,我们可以用极大似然估计直接拟合未分组数据的Logistic回归模型,以下就介绍这个方法。 二、未分组数据的 Logistic回归模型 2020/10/5 中国人民大学六西格玛质量管理研究中心 48 167。 8 .3 Logistic回归基本理论和方法 目录 上页 下页 返回 结束 2020/10/5 中国人民大学六西格玛质量管理研究中心 49 167。 8 .3 Logistic回归基本理论和方法 目录 上页 下页 返回 结束 2020/10/5 中国人民大学六西格玛质量管理研究中心 50 167。 8 .3 Logistic回归基本理论和方法 目录 上页 下页 返回 结束 )xxe x p (1)xxe x p (ipp1i10ipp1i10i ))]xxe x p (1l n ( )xx(y[Llnipp1i10n1iipp1i10i p ˆ,ˆ,ˆ,ˆ 210 2020/10/5 中国人民大学六西格玛质量管理研究中心 51 167。 8 .3 Logistic回归基本理论和方法 目录 上页 下页 返回 结束 2020/10/5 中国人民大学六西格玛质量管理研究中心 52 167。 8 .3 Logistic回归基本理论和方法 目录 上页 下页 返回 结束 表 : 序号 性别 年龄 月收入 序号 性别 年龄 月收入 1 0 18 850 0 15 1 20 1000 0 2 0 21 1200 0 16 1 25 1200 0 3 0 23 850 1 17 1 27 1300 0 4 0 23 950 1 18 1 28 1500 0 5 0 28 1200 1 19 1 30 950 1 6 0 31 850 0 20 1 32 1000 0 3x 1x 3x 1x 2x2x y y2020/10/5 中国人民大学六西格玛质量管理研究中心 53 167。 8 .3 Logistic回归基本理论和方法 目录 上页 下页 返回 结束 表 (续) 7 0 36 1500 1 21 1 33 1800 0 8 0 42 1000 1 22 1 33 1000 0 9 0 46 950 1 23 1 38 1200 0 10 0 48 1200 0 24 1 41 1500 0 11 0 55 1800 1 25 1 45 1800 1 12 0 56 2100 1 26 1 48 1000 0 13 0 58 1800 1 27 1 52 1500 1 14 1 18 850 0 28 1 56 1800 1 2020/10/5 中国人民大学六西格玛质量管理研究中心 54 167。 8 .3 Logistic回归基本理论和方法 目录 上页 下页 返回 结束 依次点选 SPSS软件的 StatisticsRegressionLogistic命令,进入 Logistic回归对话框,选入变量,点选 OK运行,以下表 85是部分运行结果 . 表 2020/10/5 中国人民大学六西格玛质量管理研究中心 55 167。 8 .3 Logistic回归基本理论和方法 目录 上页 下页 返回 结束 表 SEX(性别)、 AGE(年龄)、 X2(月收入)是 3个自变量, Wald是回归系数检验的统计量值, 2jj2)(BW a l d ( ) Sig是 Wald检验的显著性概率, R是偏相关系数。 可以看到, X2(月收入)不显著,决定将其剔除。 用 y对性别与年龄两个自变量做回归,输出结果见 86. 2020/10/5 中国人民大学六西格玛质量管理研究中心 56 167。 8 .3 Logistic回归基本理论和方法 目录 上页 下页 返回 结束 表 可以看到, SEX、 AGE两个自变量都是显著的,因而最终的回归方程为: )A G E x p (1)A G E x p (pˆi 2020/10/5 中国人民大学六西格玛质量管理研究中心 57 167。 8 .3 Logistic回归基本理论和方法 目录 上页 下页 返回 结束 以上方程式表明,女性乘公共汽车的比例高于男性,年龄越高乘车的比例也越高。 SPSS软件没有给出 Logistic 回归的标准化回归系数,对于 Logistic 回归,回归系数也没有普通线性回归那样的解释,因而计算标准化回归系数并不重要。 如果要考虑每个自变量在回归方程中的重要性,不妨直接比较 Wald值(或 Sig值), Wald值大者(或 Sig值小者)显著性高,也就更重要。 当然这里假定自变量间没有强的复共线性,否则回归系数的大小及其显著性概率都没有意义。 2020/10/5 中国人民大学六西格玛质量管理研究中心 58 167。 8 .4 Logistic回归的方法与步骤 目录 上页 下页 返回 结束 鉴于 Logistic回归与判别分析的相似性,我们可以对比两种方法的相似性和不同点。 Logistic回归的自变量可以是定量变量或定性变量(需要编码),这样可以检验自变量对于 Logistic回归模型的贡献、自变量的显著性以及 Logistic模型的判别精度。 Logistic回归一般有以下几个步骤。 ( 1)选择自变量和因变量。 这里因变量为分组变量(限于篇幅,我们仅介绍因变量分两组的情况),自变量可以是定量变量和定性变量。 Logistic回归对于资料数据有较强的稳健性(robustness),无须各组自变量的协差阵相等的假定。 2020/10/5 中国人民大学六西格玛质量管理研究中心 59 167。 8 .4 Logistic回归的方法与步骤 目录 上页 下页 返回 结束 ( 2)将一部分样品用于估计 Logistic函数(分析样品),另一部分样品用于检验模型的判别精度(保留样品)。 ( 3)模型中假定自变量之间不存在高度相关,因变量发生概率的模型服从于 Logistic模型。 这样我们可以进行 Logistic回归估计。 ( 4)估计模型参数,评估拟合情况。 我们选择回归估计的方法对回归参数进行估计并检验回归参数的显著性,对模型的拟合程度检验。 ( 5)解释所得到的模型结果。 通过参数的显著性和符号、大小来解释自变量对因变量的意义。 ( 6)通过保留样本来验证模型的判别精度。 Logistic回归的逻辑框图如下: 2020/10/5 中国人民大学六西格玛质量管理研究中心 60 167。 8 .4 Logistic回归的方法与步骤 目录 上页 下页 返回 结束 图 83 Logistic回归逻辑框图 2020/10/5 中国人民大学六西格玛质量管理研究中心 61 167。 8 .4 Logistic回归的方法与步骤 目录 上页 下页 返回 结束 () 2020/10/5 中国人民大学六西格玛质量管理研究中心 62 167。 8 .4 Logistic回归的方法与步骤 目录 上页 下页 返回 结束 [14]。 2020/10/5 中国人民大学六西格玛质量管理研究中心 63 167。 8 .4 Logistic回归的方法与步骤 目录 上页 下页 返回 结束 因变量为多组(大于两组)的情况下也可以使用Logistic回归模型。 Logistic回归分析大部分用于建构二元(dichotomous)因变量与一组解释变量之间的关系,不过有时候因变量多于两水平时, Logistic回归仍可使用,称为多元(Polytomous)Logistic回归,它用在很多研究领域,如企业上,研究者可能希望将公司资源执行大、中、小全面质量管理与公司大小、公司类型及其他可用的解释变量的关系找出来;又如,建构疾病的轻、中、重的严重性与患者的年龄、性别及其他有兴趣的解释变量。 多元 Logistic回归模型是二元Logistic回归模型的推广,这种推广问题变成很复杂,由于模型的建构基础、偏差的使用及统计推断,可以利用逼近法配合几个二元 Logistic回归模型做多元 Logistic回归。 这里不作详细介绍。 可参见参考文献 [14]、 [16]。 2020/10/5 中国人民大学六西格玛质量管理研究中心 64 2020/10/5 中国人民大学六西格玛质量管理研究中心 65 第九章 多变量的图表示法 目录 上页 下页 返回 结束 •167。 散点图矩阵 •167。 脸谱图 •167。 雷达图与星图 •167。 星座图 2020/10/5 中国人民大学六西格玛质量管理研究中心 66 第九章 多变量的图表示法 目录 上页 下页 返回 结束。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。