定型数据的建模分析(编辑修改稿)内容摘要:
2020/10/5 中国人民大学六西格玛质量管理研究中心 44 167。 8 .3 Logistic回归基本理论和方法 目录 上页 下页 返回 结束 2020/10/5 中国人民大学六西格玛质量管理研究中心 45 167。 8 .3 Logistic回归基本理论和方法 目录 上页 下页 返回 结束 表 2020/10/5 中国人民大学六西格玛质量管理研究中心 46 167。 8 .3 Logistic回归基本理论和方法 目录 上页 下页 返回 结束 2020/10/5 中国人民大学六西格玛质量管理研究中心 47 167。 8 .3 Logistic回归基本理论和方法 目录 上页 下页 返回 结束 得年收入 8万元的家庭预计实际购房比例为 %,这个结果与未加权的结果很接近。 以上的例子是只有一个自变量的情况,分组数据的 Logistic回归模型可以很方便的推广到多个自变量的情况,在此就不举例说明了。 分组数据的 Logistic回归只适用于大样本的分组数据,对小样本的未分组数据不适用。 并且以组数 c为回归拟合的样本量,使拟合的精度低。 实际上,我们可以用极大似然估计直接拟合未分组数据的Logistic回归模型,以下就介绍这个方法。 二、未分组数据的 Logistic回归模型 2020/10/5 中国人民大学六西格玛质量管理研究中心 48 167。 8 .3 Logistic回归基本理论和方法 目录 上页 下页 返回 结束 2020/10/5 中国人民大学六西格玛质量管理研究中心 49 167。 8 .3 Logistic回归基本理论和方法 目录 上页 下页 返回 结束 2020/10/5 中国人民大学六西格玛质量管理研究中心 50 167。 8 .3 Logistic回归基本理论和方法 目录 上页 下页 返回 结束 )xxe x p (1)xxe x p (ipp1i10ipp1i10i ))]xxe x p (1l n ( )xx(y[Llnipp1i10n1iipp1i10i p ˆ,ˆ,ˆ,ˆ 210 2020/10/5 中国人民大学六西格玛质量管理研究中心 51 167。 8 .3 Logistic回归基本理论和方法 目录 上页 下页 返回 结束 2020/10/5 中国人民大学六西格玛质量管理研究中心 52 167。 8 .3 Logistic回归基本理论和方法 目录 上页 下页 返回 结束 表 : 序号 性别 年龄 月收入 序号 性别 年龄 月收入 1 0 18 850 0 15 1 20 1000 0 2 0 21 1200 0 16 1 25 1200 0 3 0 23 850 1 17 1 27 1300 0 4 0 23 950 1 18 1 28 1500 0 5 0 28 1200 1 19 1 30 950 1 6 0 31 850 0 20 1 32 1000 0 3x 1x 3x 1x 2x2x y y2020/10/5 中国人民大学六西格玛质量管理研究中心 53 167。 8 .3 Logistic回归基本理论和方法 目录 上页 下页 返回 结束 表 (续) 7 0 36 1500 1 21 1 33 1800 0 8 0 42 1000 1 22 1 33 1000 0 9 0 46 950 1 23 1 38 1200 0 10 0 48 1200 0 24 1 41 1500 0 11 0 55 1800 1 25 1 45 1800 1 12 0 56 2100 1 26 1 48 1000 0 13 0 58 1800 1 27 1 52 1500 1 14 1 18 850 0 28 1 56 1800 1 2020/10/5 中国人民大学六西格玛质量管理研究中心 54 167。 8 .3 Logistic回归基本理论和方法 目录 上页 下页 返回 结束 依次点选 SPSS软件的 StatisticsRegressionLogistic命令,进入 Logistic回归对话框,选入变量,点选 OK运行,以下表 85是部分运行结果 . 表 2020/10/5 中国人民大学六西格玛质量管理研究中心 55 167。 8 .3 Logistic回归基本理论和方法 目录 上页 下页 返回 结束 表 SEX(性别)、 AGE(年龄)、 X2(月收入)是 3个自变量, Wald是回归系数检验的统计量值, 2jj2)(BW a l d ( ) Sig是 Wald检验的显著性概率, R是偏相关系数。 可以看到, X2(月收入)不显著,决定将其剔除。 用 y对性别与年龄两个自变量做回归,输出结果见 86. 2020/10/5 中国人民大学六西格玛质量管理研究中心 56 167。 8 .3 Logistic回归基本理论和方法 目录 上页 下页 返回 结束 表 可以看到, SEX、 AGE两个自变量都是显著的,因而最终的回归方程为: )A G E x p (1)A G E x p (pˆi 2020/10/5 中国人民大学六西格玛质量管理研究中心 57 167。 8 .3 Logistic回归基本理论和方法 目录 上页 下页 返回 结束 以上方程式表明,女性乘公共汽车的比例高于男性,年龄越高乘车的比例也越高。 SPSS软件没有给出 Logistic 回归的标准化回归系数,对于 Logistic 回归,回归系数也没有普通线性回归那样的解释,因而计算标准化回归系数并不重要。 如果要考虑每个自变量在回归方程中的重要性,不妨直接比较 Wald值(或 Sig值), Wald值大者(或 Sig值小者)显著性高,也就更重要。 当然这里假定自变量间没有强的复共线性,否则回归系数的大小及其显著性概率都没有意义。 2020/10/5 中国人民大学六西格玛质量管理研究中心 58 167。 8 .4 Logistic回归的方法与步骤 目录 上页 下页 返回 结束 鉴于 Logistic回归与判别分析的相似性,我们可以对比两种方法的相似性和不同点。 Logistic回归的自变量可以是定量变量或定性变量(需要编码),这样可以检验自变量对于 Logistic回归模型的贡献、自变量的显著性以及 Logistic模型的判别精度。 Logistic回归一般有以下几个步骤。 ( 1)选择自变量和因变量。 这里因变量为分组变量(限于篇幅,我们仅介绍因变量分两组的情况),自变量可以是定量变量和定性变量。 Logistic回归对于资料数据有较强的稳健性(robustness),无须各组自变量的协差阵相等的假定。 2020/10/5 中国人民大学六西格玛质量管理研究中心 59 167。 8 .4 Logistic回归的方法与步骤 目录 上页 下页 返回 结束 ( 2)将一部分样品用于估计 Logistic函数(分析样品),另一部分样品用于检验模型的判别精度(保留样品)。 ( 3)模型中假定自变量之间不存在高度相关,因变量发生概率的模型服从于 Logistic模型。 这样我们可以进行 Logistic回归估计。 ( 4)估计模型参数,评估拟合情况。 我们选择回归估计的方法对回归参数进行估计并检验回归参数的显著性,对模型的拟合程度检验。 ( 5)解释所得到的模型结果。 通过参数的显著性和符号、大小来解释自变量对因变量的意义。 ( 6)通过保留样本来验证模型的判别精度。 Logistic回归的逻辑框图如下: 2020/10/5 中国人民大学六西格玛质量管理研究中心 60 167。 8 .4 Logistic回归的方法与步骤 目录 上页 下页 返回 结束 图 83 Logistic回归逻辑框图 2020/10/5 中国人民大学六西格玛质量管理研究中心 61 167。 8 .4 Logistic回归的方法与步骤 目录 上页 下页 返回 结束 () 2020/10/5 中国人民大学六西格玛质量管理研究中心 62 167。 8 .4 Logistic回归的方法与步骤 目录 上页 下页 返回 结束 [14]。 2020/10/5 中国人民大学六西格玛质量管理研究中心 63 167。 8 .4 Logistic回归的方法与步骤 目录 上页 下页 返回 结束 因变量为多组(大于两组)的情况下也可以使用Logistic回归模型。 Logistic回归分析大部分用于建构二元(dichotomous)因变量与一组解释变量之间的关系,不过有时候因变量多于两水平时, Logistic回归仍可使用,称为多元(Polytomous)Logistic回归,它用在很多研究领域,如企业上,研究者可能希望将公司资源执行大、中、小全面质量管理与公司大小、公司类型及其他可用的解释变量的关系找出来;又如,建构疾病的轻、中、重的严重性与患者的年龄、性别及其他有兴趣的解释变量。 多元 Logistic回归模型是二元Logistic回归模型的推广,这种推广问题变成很复杂,由于模型的建构基础、偏差的使用及统计推断,可以利用逼近法配合几个二元 Logistic回归模型做多元 Logistic回归。 这里不作详细介绍。 可参见参考文献 [14]、 [16]。 2020/10/5 中国人民大学六西格玛质量管理研究中心 64 2020/10/5 中国人民大学六西格玛质量管理研究中心 65 第九章 多变量的图表示法 目录 上页 下页 返回 结束 •167。 散点图矩阵 •167。 脸谱图 •167。 雷达图与星图 •167。 星座图 2020/10/5 中国人民大学六西格玛质量管理研究中心 66 第九章 多变量的图表示法 目录 上页 下页 返回 结束。定型数据的建模分析(编辑修改稿)
相关推荐
分析评价,具体见表 31。 表 31 环境空气现状监测与评价结果汇总 (单位: mg/Nm3) 时间 SO2 NO2 TSP 日平均浓度范围 2020 年全年均值 < 二级标准 评价结果 达标 达标 达标 由表 31 可知,评价区域中环境空气现状较好, SO NO2和 TSP 三项常规污染物指标均能达到 GB30951996《环境空气质量标准》二级标准,尚具有较大的环境容量。 近岸海域
单调区间; ( 2)若在区间 ),0( 上至少存在一点 0x ,使得 1)( 0 xf 成立,求实数 a 的取值范围 . 21.(本小题 满分 12 分) 已知数列 1,12,2}{},{ 11 nnnnnnn abaaaaba 满足 ,设数列 }{nb 的前 n 项和为nS ,令 .2 nnn SST ( 1)求数列 }{nb 的通项公式; ( 2)求证: ).(
( ) | | ln ( 0 ) .f x x a x a ( 1)若 1,a 求 ()fx的单调区间及 ()fx的最小值; 试卷 ( 2)若 0a ,求 ()fx的单调区间; 试卷 ( 3)试比较) 2 2 22 2 2l n 2 l n 3 l n ( 1 ) ( 2 1 )2 3 2 ( 1 )n n nnn 与的大小, *( 2)n N n且
率是稳健的, 定向增发新股 方式是影响 定向增发新股 折扣率的主要因素,并通过折扣率实现了在 定向增发新股 中向控股股东输送利益。 此外, 我国 上市公司 定向增发新股 的发行规模和资产负债率对 发行折价 有正面的影响,发行规模越大,资产负债率越高,则折扣率越高,说明发行规模越大 ,增发的融资难度越大,资产负债率越高,投资者所面临的风险越高,因此,为了吸引投资者参与增发,上市公司有可能在
k为现金比率; t为定期存款比率。 trkerm t 1 结合上面实例, A银行得到现金存款 1000元,甲客户现金提取 100元(现金比率 k=100/1000=10%),另外的 900元活期存款中,有 300元转化为定期存款(定期存款比率t=300/600=50%),假定定期存款法定准备金率 rt为 5%,活期存款法定准备金率 r为 10%。 则存款乘数为
价值的商品。 如果你承诺你讲交付金币,那么实际上信贷产生了,而信贷并没有同等的内在价值。 贷方愿意提供信贷是期望将获取更多的货币,相比借出的货币,最后收回的能够购买更多的商品和服务。 他们放弃现在的消费用信贷来交换未来更多的消费。 信贷产生后,贷方接着可能会问:谁控制货币体系呢。 我怎么知道更多的货币不会发行出来,保障未来我能够买到比现在更多的商品和服务。 在不同的时期,这个问题有不同的回答。