高级计量经济学离散和限制因变量模型(编辑修改稿)内容摘要:

分成若干的组,组与组之间是相互独立的,但组内的选择之间却是相互关联的。 这时,则需要采用嵌套模型来估计各种选择的概率。 例如,一个高中毕业生首先面临两种选择:不上大学和上大学。 在上大学的选择中又存在着上公立学校和私立学样的选择。 也就是说,他面临的是三种选择:不上大学、上公立大学或上私立大学。 后两种选择与第一种选择之间是相互独立的,但是后两者之间却是相关联的。 以下我们就分析这种 M=2,即 j=0, 1, 2三种选择时的情形。 随机效用模型 设 j=0, 1, 2。 假设 可分为两组, 一组, 和 一组。 两组之间相互独立,但 和 的相关系数为。 假设 和 的联合分布为以下 II型极端值分布: *** ,ij ij iji ij ilYUY j Y Y l j  当且仅当 0 1 2,i i i   0i1i 2i1i1i21 2i 2i 111 2 1 2( , ) e x p e x p ( ) e x p ( )i i i iF           仍为 I型极端值分布: 此时的嵌套 Logit模型为: 0i 00( ) e x p e x p ( )iiF    0110 1 2* * * *0 1 0 2P r ( 0 | ) P r ( , | )ii i ii i i i i i iUU U Uo b Y o b Y Y Y Yee e e   XX   111 1211111120 1 2* * * *1 0 1 2P r ( 1 | ) P r ( , | )P r ( 1 | 0 , ) P r ( 0 | )iiiiii i ii i i i i i iUUUUUU U Ui i i i iob Y ob Y Y Y Yeeeee e e eob Y Y ob Y        XXXX  111 1221111120 1 2* * * *2 0 2 1P r ( 2 | ) P r ( , | )P r ( 2 | 0 , ) P r ( 0 | )iiiiii i ii i i i i i iUUUUUU U Ui i i i iob Y ob Y Y Y Yeeeee e e eob Y Y ob Y        XXXX第三节 计数数据模型 计数数据模型的设定 计数数据模型的估计 当因变量为计数数据时,一般是以泊松分布而非正态分布来描述它的概率,此时,因变量 Y的概率分布函数为 ( ) 其中, ui一般设定为 或 ( ) 其中 Xi是包括常数项在内的 k个解释变量。 可以证明, ( ) 对 ()式的设定可以保证 Yi的预测值是非负的。 P r ( )!iiuYiiieuo b Y YYiiue  X β lo g iiu  X β( | ) ( | ) ii i i i iE Y V a r Y u e    X βXX由( )式可得: ( ) 根据( )式,可以认为 β是解释变量的变动对Y的变动率的平均影响。 例如,假设第 j个解释变量的系数是 βj,则它表明在其他变量不变的情况下, Xj每增加一个单位,则 Y发生的次数将平均增加 βj。 如果第 j个解释变量是虚拟变量的话,则它从 0到 1发生变化时, Y发生的次数将平均增加。 在( )式中加入随机扰动项,得到计数数据模型 ( ) l o g ( | )iiiEYX X β1 0 0 [ e x p ( ) 1 ] %jiiiYe X β 对( )式参数的估计,虽然可以对对数方程直接进行 OLS估计,但是会丢失那些因变量取值为 0的数据,因为 0是无法取对数的。 另一种选择是直接采用非线性的迭代方法,但往往无法克服模型中的异方差特性,因此更多的是采用最大似然法进行估计。 其对数似然函数为 ( ) 1l n e x p ( ) l n !Ni i i iiL Y Y     X β X β将参数的估计结果代入( )式,可以得到在给定解释变量 X的值的情况下 Y的各种取值的概率的估计: ˆ ˆ()Pr ( ) , 0 , 1 , 2 ,!ii Yiiiieo b Y Y YY   X β X β第四节 限制因变量模型 截断模型 审查模型 最大似然估计( MLE) Heckman二阶段估计 截断模型 设以下隐变量模型: 其中, Yi*是隐变量,对于截断数据 Yi , 当且仅 因此,对 Yi来说, ( ) * 1 , 2 , ,i i iY i T  X β*iiYY * 0iY **( | , 0 )( | , 0 )ii i i i ii i iY E Y YE Y Y    XX其中, ( ) **ii( | , 0 )( | , )( | , )( | )iiiii i i i ii i i i ii i i iE Y YEEfd            X βXX β X X βX β X X βX β X β在( )中, 是 的条件概率密度函数。 因为 所以( )式可以写成: ( ) 将( )式代入( )式得: ( ) 其中,。 i( | )iifX   ii i i i i( | ) = ( ) ( ) ( ) 0i i i i i if d f d E                 X β X β X β**( | , 0 ) ( )i i i i iE Y Y   XX β X β()i i i iiiYV  X β X βX β()i i iV X β对于( )式,如果直接将 Y对 X进行 OLS回归,由于 ,所以 OLS估计量 不是一致估计量。 当 时, 的条件概率密度函数 ( ) 因此( )中, ( ) ( ) ( ) 0iiE V E  X βOLSii  X β iiii( ) ( )( | ) =P r ( ) ()iiiii iifffob fd    X βX βX βiiii( ) ( | )()()iiii i i iiiifdfdfd        X βX βX βX β X β当假设 服从均值为零,方差为 的正态分布时,( )式可以进一步写成: ( ) 其中 和 分别表示标准正态分布的累积函数和概率密度函数。 i 2()iii X βX βX β 定义( )式中的比值 ( ) 称为逆 Mills比率 (Inverse Mills Ratio)。 将()式代入( )式,得到截断数据 Y的实际的方程 ( ) iii X βX βii i i iY      X β 审查模型 对隐变量模型: 其中, Yi *是隐变量,如果实际获取的是审查数据 即只能获得 Yi *大于 0时的数据,当 Yi *小于 0时,只能得到观测值 0。 * 1 , 2 , ,i i iY i T  X β***,00 , 0iiiiYYYY  当当  因此,对 Yi来说, () **( | , 0)P r ( 0) 0 P r ( 0) ( | , 0)P r ( 0) ( | , 0)P r ( 0) ( | , )i i i i ii i i i i ii i i i ii i i i i i iY E Y Yob Y ob Y E Y Yob Y E Y Yob Y E                     XXXX β XX β从( )式至( )式可知,( )式的 = 因此( )式可进一步简化为 ( ) ( )即为审查数据的实际模型。 ( | , )i i i iE  XX β()iii X βX βX βiii i iY                     X β X βX β 最大似然估计( MLE) 对于( )式和( )式的截断模型和审查模型来说,都是非线性的, Y对 X的 OLS估计也不再是一致估计。 当假设模型中的扰动项 时,可以用最大似然估计法估计模型中的参数 和。 2~ ( 0 , )i N一、截断模型的似然函数 对于截断数据来说 ,当 Yi 0时 ,由 可以推出。 根据( )式和( )式, * 0i i。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。