静态博奕的多重nash均衡及其在经济系统均_衡中应用毕业论文(编辑修改稿)内容摘要:

罪(因已有证据表明其有罪)再加刑 2年,而坦白者有功被减刑 8年,立即释放。 如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱 1 年。 表 给出了这个博弈的支付矩阵。 南京邮电大学 2020 届本科生毕业设计(论文) 3 表 1:支付矩阵 关于案例,显然最好的策略是双方都抵赖,结果是大家都只被判 1 年。 但是由于两人处于隔离的情况,首先应该是从心理学的角度来看,当事双方都会怀疑对方会出卖自己 以求自保、其次才是亚当 斯密的理论,假设每个人都是 “ 理性的经济人 ” ,都会从利己的目的出发进行选择。 这两个人都会有这样一个盘算过程:假如他坦白,我抵赖,得坐 10年监狱,坦白最多才 8 年;他要是抵赖,我就可以被释放,而他会坐 10 年牢。 综合以上几种情况考虑,不管他坦白与否,对我而言都是坦白了划算。 两个人都会动这样的脑筋,最终,两个人都选择了坦白,结果都被判 8年刑期。 基于经济学中 Rational agent 的前提假设,两个囚犯符合自己利益的选择是坦白招供,原本对双方都有利的策略不招供从而均被释放就不会出现。 这样两 人都选择坦白的策略以及因此被判 8 年的结局,纳什均衡 ” 首先对亚当 斯密的 “ 看不见的手 ” 的原理提出挑战:按照斯密的理论,在市场经济中,每一个人都从利己的目的出发,而最终全社会达到利他的效果。 但是我们可以从 “ 纳什均衡 ” 中引出 “ 看不见的手 ” 原理的一个悖论 :从利己目的出发 ,结果损人不利己 ,既不利己也不利他。 纳什均衡的重要影响 从 “纳什均衡 ”的普遍意义中我们可以深刻领悟司空见 惯的经济、社会、政治、国防、管理和日常生活中的博弈现象。 现实生活中有 许多类似于 “囚徒的两难处境 ”这样的例子。 如价格战、军奋竞赛、污染等等。 纳什均衡的重要影响可以概括为以下六个方面 ( 1)改变了经济学的体系和结构。 非合作博弈论的概念、内容、模型和分析工具等,均已渗透到微观经济学、宏观经济学、劳动经济学、国际经济学、环境经济学等经济学科的绝大部分学科领域,改变了这些学科领域的内容和结构,成为这些学科领域的基本研究范式和理论分析工具,从而改变了原有经济学理论体系中各分支学科的内涵。 ( 2)扩展了经济学研 究经济问题的范围。 原有经济学缺乏将不确定性因素、变动环境因素以及经济个体之间的交互 作用模式化的有效办法,因而不能进行微观层次经济问题的解剖分析。 纳什均衡及相关模型分析方法,包括扩展型博弈法、逆推归纳法、子博弈完美纳什均衡等概念方法,为经济学家们提供了深入的分析工具。 ( 3)加强了经济学研究的深度。 纳什均衡理论不回避经济个体之间直接的交互作用,A╲ B 坦白 抵赖 坦白 8, 8 0, 10 抵赖 10, 0 1, 1 南京邮电大学 2020 届本科生毕业设计(论文) 4 不满足于对经济个体之间复杂经济关系的简单化处理,分析问题时不只停留在宏观层面上而是深入分析表象背后深层次的原因和规律,强调从微观个体行为规律的角度发现问题的根源, 因而可以更深刻准确地理解和解释经济问题。 ( 4)形成了基于经典博弈的研究范式体系。 即可以将各种问题或经济关系 ,按照经典博弈的类型或特征进行分类,并根据相应的经典博弈的分析方法和模型进行 研究,将一个领域所取得的经验方便地移植到另一个领域。 ( 5)扩大和加强了经济学与其他社会科学、自然科学的联系。 纳什均衡 普 遍 到几乎无处不在。 纳什均衡理论既适用于人类的行为规律,也适合于人类以外的其他生物的生存、运动和发展的规律。 纳什均衡和博弈论的桥梁作用,使经济学与其他社会科学、自然科学的联系更加紧密,形成了经济学与 其他学科相互促进的良性循环。 ( 6)改变了经济学的语言和表达方法。 博弈论的应用在最近一些年的发展开始从原来单纯集中于经济学领域向着整个社会科学多个领域渗透,同时,即使是经济学本身也有一些新的发现,如著名的 Bertrand 价格竞争模型也发现有新的混合战略纳什均衡,这种新的混合战略纳什均衡可以对我们实际所观察到的价格多样性现象作出解释。 最近一些年,心理学与博弈论的结合也逐渐取得了引人注目的成就,建立在心理学证据上的博弈论法则是当前这个领域中出现十分有趣的现象,而作为博弈论比较陈旧的领域之一的合作博弈也有新的 发现。 博弈论这种工具使得经济学逐步从一种抽象的纯粹理论形态向着可操作的应用形态的转变开始变得可能。 这一点从匹配问题解决过程中可以比较明确地看出来,以至于有人提出通过博弈论方法的应用将许多经济领域的机制设计统一形成一个所谓“经济工程学”的新兴学科的构想。 不管这一富于想象力的创意最终是否能够实现,博弈论在把抽象经济理论变得更加可操作这一点上起着至关重要的作用毋庸置疑的。 南京邮电大学 2020 届本科生毕业设计(论文) 5 11 12 121 22 21 2 11nnmma a aa a aa a a骣 247。 231。 247。 231。 247。 231。 247。 231。 247。 231。 247。 231。 247。 231。 247。 247。 231。 247。 231。 247。 231。 247。 231。 桫LLLLLLLL第二章 矩阵对策下均衡与鞍点的存在性 矩阵对策 博弈论 中,用来描述两个人或多个参与人的策略和支付的矩阵。 不同参与人的利润或效用就是支付。 也称 “ 赢得矩阵 ” ,是指从支付表中抽象出来由损益值组成的矩阵。 设局中人 1有个策略 1,...,im ;局中人 2有 n 个策略 1,...,jn=。 定义 : 若局中人 1选择策略 i ,局中人 2选择策略 j ,局中人 1从局中人 2得到的支付是 ija ,则支付矩阵是 式 (21) 对策由该支付矩阵完全决定,所以这种对策称为 矩阵对策。 见文献 [2]。 在这种对策里,局中人 1 希望支付值 ija 越大越好,局中人 2 则希望付出的 ija 越小越好 .因此,矩阵对策完全是对抗性的。 如果局中人 1 选择他的第 1个策略,即 1i ,则他至少可以得到支付 1min ijjna# 一般地,如果局中人 1 采用他的第 i 个策略,则他至少 可以得 到支付 1min ijjna# 式 (22) 这就是支付矩阵第 i 行元素中的最小元素 .由于局中人 1 希望 ija 越大越好,因此,他可以选择 i使 式 ()为最大 .这就是说,局中人 1可以选择 i ,使得他得到的支付不少于 11maxmin ijjnim a## 式 () 同样,如果局中人 2选择他的第 1个策略,即 1j ,则他最多失去 (输掉 ) 1max ijina# 南京邮电大学 2020 届本科生毕业设计(论文) 6 一般地,如果局中人 2 采用他的第 j 个策略,则他至多失去 1max ijina# 式 () 这是支付矩阵第 j 列的最大元素 .由于局中人 2 希望 ija 越小越好,因此,他可以选择 j使 式 ()为最小 .这就是说,局中人 2可以选择 j,保证他失去的不大于 1 1minmax ijim jna# # 式 () 也可以说,如果局中人 2处理得当,局中人 1得到的支付不会大于 ()中的值。 并且有 11maxmin ijjnim a## 163。 1 1minmax ijim jna# # 式 () 鞍点 一个矩阵对策,如果支付矩阵 ()ija 的元素满足 11maxminijjnim a##v= =1 1minmaxijim jn# # 式 (27) 此时设存在 *i 和 *j ,使得 **ijva= ,此时的 ( )*, *ij 成为对策的一个鞍点。 首先,一个矩阵对策如果有鞍点,则可能不只一个。 但对于不同的鞍点支付值是相同的,且都等于对策的值。 例如:对策的支付矩阵是 0 1 0 32 5 1 33 3 3 4A骣 247。 231。 247。 231。 247。 231。 247。 = 231。 247。 231。 247。 231。 247。 231。 桫 较容易得到,该矩阵对策的鞍点为 31a , 32a 和 33a。 其中 31a = 32a = 33a =v =3。 其次,对于某些离散策略集下未必有均衡与鞍点存在。 例如矩阵对策: 0 00Aeeeeee骣 247。 231。 247。 231。 247。 231。 247。 =231。 247。 231。 247。 231。 247。 247。 231。 桫 其中1111m a x m i n m i n m a xi j i jj n i mi m j naaee####= =。 混合策略 南京邮电大学 2020 届本科生毕业设计(论文) 7 在博弈中,一旦每个参与者 都在竭力猜测其他参与者的战略选择 ,而不能通过收益函数作出最有反映,那么在这类博弈中,因为最有行为是不确 定的,所以就不存在纳什均衡。 鉴于这种情况,我们引入混合战略。 定义 : 混合策略: 是指参与者以一定的概率去选择某种战略。 这类博弈虽然在一次操作中有输有赢,但这个博弈多次重复进行,可以研究某个战略应赋予多大的概率,能获取最大的期望收益。 定义 : 规范的表述,参与者 i 的混合战略是在其战略空间 iS 中战略 is 的概率分布 ,is 称为纯战略。 对完全信息静态博弈来说,一个参与者的纯战略是他可以选择的一种特定的行动。 一个参与者的混合战略就是规定他以某种概率分布随机去选择不同的行动。 假设 { }12, ,..., ,i i i iKS s s s= ,选择战略 iKs 的概率为 iKp ,则有如下分布律。 这时,概率分布 ( )12, ,...,i i iKp p p 就是参与者 i 的一个混合战略,其中 01ikp# 且 12 ... 1i i iKp p p+ + + =,概率不同就构成参与者不同的混合战略。 我们用 ( )12, ,...,i i i iKp p p p= 表示基于战略空间 iS的任意一个混合战略,正如之前用 is 表示 iS 中任意一个纯战略。 设矩阵对策矩阵 ( )ijAa= ,其中 1,...,im= , 1,...,jn=。 设 局中人 1 的混合策略 是一组数 0ix179。 , 1,...,im= ,满足 1 1mii x= =229。 局中人 2 的一个混合策略是一组数 0iy179。 , 1,...,jn= ,满足 1 1nij y= =229。 设 ( )1,..., mX x x= 和 ( )1,..., nY y y= 分别是局中人 1 和 2 的混合策略。 局中人 1 以概率 ix 选用策略 i ,局中人 2 以概率 jy 选用策略 j。 因此,局中人 1 选择策略 i ,局中人 2 选择策略j ,并且支付为 ija 的概率是 ijxy ,每一个支付相应的概率乘以 ijxy ,对所有的 i 和所有的 j求和,我们就得到局中人 1 的期望支付 11mnij i jija x y==邋 式 (28) 南京邮电大学 2020 届本科生毕业设计(论文) 8 局中人 1 希望这个期望支付越大越好,局中人 2 则相反,希望它越小越好,设 mS 是满足 0ix179。 , 1,...,im= ,1 1mii x= =229。 的一切 ( )1,..., mX x x= 的集,如果局中人 1 选用策略 mXS206。 ,则它的期望支付至少是 11m innmnij i jYS ija x y206。 ==邋 式 (29) 这里 mS 是满足 0iy179。 , 1,...,jn= ,1 1nij y= =229。 的一切 ( )1,..., nY y y= 的。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。