静态博奕的多重nash均衡及其在经济系统均_衡中应用毕业论文(编辑修改稿)内容摘要:
罪(因已有证据表明其有罪)再加刑 2年,而坦白者有功被减刑 8年,立即释放。 如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱 1 年。 表 给出了这个博弈的支付矩阵。 南京邮电大学 2020 届本科生毕业设计(论文) 3 表 1:支付矩阵 关于案例,显然最好的策略是双方都抵赖,结果是大家都只被判 1 年。 但是由于两人处于隔离的情况,首先应该是从心理学的角度来看,当事双方都会怀疑对方会出卖自己 以求自保、其次才是亚当 斯密的理论,假设每个人都是 “ 理性的经济人 ” ,都会从利己的目的出发进行选择。 这两个人都会有这样一个盘算过程:假如他坦白,我抵赖,得坐 10年监狱,坦白最多才 8 年;他要是抵赖,我就可以被释放,而他会坐 10 年牢。 综合以上几种情况考虑,不管他坦白与否,对我而言都是坦白了划算。 两个人都会动这样的脑筋,最终,两个人都选择了坦白,结果都被判 8年刑期。 基于经济学中 Rational agent 的前提假设,两个囚犯符合自己利益的选择是坦白招供,原本对双方都有利的策略不招供从而均被释放就不会出现。 这样两 人都选择坦白的策略以及因此被判 8 年的结局,纳什均衡 ” 首先对亚当 斯密的 “ 看不见的手 ” 的原理提出挑战:按照斯密的理论,在市场经济中,每一个人都从利己的目的出发,而最终全社会达到利他的效果。 但是我们可以从 “ 纳什均衡 ” 中引出 “ 看不见的手 ” 原理的一个悖论 :从利己目的出发 ,结果损人不利己 ,既不利己也不利他。 纳什均衡的重要影响 从 “纳什均衡 ”的普遍意义中我们可以深刻领悟司空见 惯的经济、社会、政治、国防、管理和日常生活中的博弈现象。 现实生活中有 许多类似于 “囚徒的两难处境 ”这样的例子。 如价格战、军奋竞赛、污染等等。 纳什均衡的重要影响可以概括为以下六个方面 ( 1)改变了经济学的体系和结构。 非合作博弈论的概念、内容、模型和分析工具等,均已渗透到微观经济学、宏观经济学、劳动经济学、国际经济学、环境经济学等经济学科的绝大部分学科领域,改变了这些学科领域的内容和结构,成为这些学科领域的基本研究范式和理论分析工具,从而改变了原有经济学理论体系中各分支学科的内涵。 ( 2)扩展了经济学研 究经济问题的范围。 原有经济学缺乏将不确定性因素、变动环境因素以及经济个体之间的交互 作用模式化的有效办法,因而不能进行微观层次经济问题的解剖分析。 纳什均衡及相关模型分析方法,包括扩展型博弈法、逆推归纳法、子博弈完美纳什均衡等概念方法,为经济学家们提供了深入的分析工具。 ( 3)加强了经济学研究的深度。 纳什均衡理论不回避经济个体之间直接的交互作用,A╲ B 坦白 抵赖 坦白 8, 8 0, 10 抵赖 10, 0 1, 1 南京邮电大学 2020 届本科生毕业设计(论文) 4 不满足于对经济个体之间复杂经济关系的简单化处理,分析问题时不只停留在宏观层面上而是深入分析表象背后深层次的原因和规律,强调从微观个体行为规律的角度发现问题的根源, 因而可以更深刻准确地理解和解释经济问题。 ( 4)形成了基于经典博弈的研究范式体系。 即可以将各种问题或经济关系 ,按照经典博弈的类型或特征进行分类,并根据相应的经典博弈的分析方法和模型进行 研究,将一个领域所取得的经验方便地移植到另一个领域。 ( 5)扩大和加强了经济学与其他社会科学、自然科学的联系。 纳什均衡 普 遍 到几乎无处不在。 纳什均衡理论既适用于人类的行为规律,也适合于人类以外的其他生物的生存、运动和发展的规律。 纳什均衡和博弈论的桥梁作用,使经济学与其他社会科学、自然科学的联系更加紧密,形成了经济学与 其他学科相互促进的良性循环。 ( 6)改变了经济学的语言和表达方法。 博弈论的应用在最近一些年的发展开始从原来单纯集中于经济学领域向着整个社会科学多个领域渗透,同时,即使是经济学本身也有一些新的发现,如著名的 Bertrand 价格竞争模型也发现有新的混合战略纳什均衡,这种新的混合战略纳什均衡可以对我们实际所观察到的价格多样性现象作出解释。 最近一些年,心理学与博弈论的结合也逐渐取得了引人注目的成就,建立在心理学证据上的博弈论法则是当前这个领域中出现十分有趣的现象,而作为博弈论比较陈旧的领域之一的合作博弈也有新的 发现。 博弈论这种工具使得经济学逐步从一种抽象的纯粹理论形态向着可操作的应用形态的转变开始变得可能。 这一点从匹配问题解决过程中可以比较明确地看出来,以至于有人提出通过博弈论方法的应用将许多经济领域的机制设计统一形成一个所谓“经济工程学”的新兴学科的构想。 不管这一富于想象力的创意最终是否能够实现,博弈论在把抽象经济理论变得更加可操作这一点上起着至关重要的作用毋庸置疑的。 南京邮电大学 2020 届本科生毕业设计(论文) 5 11 12 121 22 21 2 11nnmma a aa a aa a a骣 247。 231。 247。 231。 247。 231。 247。 231。 247。 231。 247。 231。 247。 231。 247。 247。 231。 247。 231。 247。 231。 247。 231。 桫LLLLLLLL第二章 矩阵对策下均衡与鞍点的存在性 矩阵对策 博弈论 中,用来描述两个人或多个参与人的策略和支付的矩阵。 不同参与人的利润或效用就是支付。 也称 “ 赢得矩阵 ” ,是指从支付表中抽象出来由损益值组成的矩阵。 设局中人 1有个策略 1,...,im ;局中人 2有 n 个策略 1,...,jn=。 定义 : 若局中人 1选择策略 i ,局中人 2选择策略 j ,局中人 1从局中人 2得到的支付是 ija ,则支付矩阵是 式 (21) 对策由该支付矩阵完全决定,所以这种对策称为 矩阵对策。 见文献 [2]。 在这种对策里,局中人 1 希望支付值 ija 越大越好,局中人 2 则希望付出的 ija 越小越好 .因此,矩阵对策完全是对抗性的。 如果局中人 1 选择他的第 1个策略,即 1i ,则他至少可以得到支付 1min ijjna# 一般地,如果局中人 1 采用他的第 i 个策略,则他至少 可以得 到支付 1min ijjna# 式 (22) 这就是支付矩阵第 i 行元素中的最小元素 .由于局中人 1 希望 ija 越大越好,因此,他可以选择 i使 式 ()为最大 .这就是说,局中人 1可以选择 i ,使得他得到的支付不少于 11maxmin ijjnim a## 式 () 同样,如果局中人 2选择他的第 1个策略,即 1j ,则他最多失去 (输掉 ) 1max ijina# 南京邮电大学 2020 届本科生毕业设计(论文) 6 一般地,如果局中人 2 采用他的第 j 个策略,则他至多失去 1max ijina# 式 () 这是支付矩阵第 j 列的最大元素 .由于局中人 2 希望 ija 越小越好,因此,他可以选择 j使 式 ()为最小 .这就是说,局中人 2可以选择 j,保证他失去的不大于 1 1minmax ijim jna# # 式 () 也可以说,如果局中人 2处理得当,局中人 1得到的支付不会大于 ()中的值。 并且有 11maxmin ijjnim a## 163。 1 1minmax ijim jna# # 式 () 鞍点 一个矩阵对策,如果支付矩阵 ()ija 的元素满足 11maxminijjnim a##v= =1 1minmaxijim jn# # 式 (27) 此时设存在 *i 和 *j ,使得 **ijva= ,此时的 ( )*, *ij 成为对策的一个鞍点。 首先,一个矩阵对策如果有鞍点,则可能不只一个。 但对于不同的鞍点支付值是相同的,且都等于对策的值。 例如:对策的支付矩阵是 0 1 0 32 5 1 33 3 3 4A骣 247。 231。 247。 231。 247。 231。 247。 = 231。 247。 231。 247。 231。 247。 231。 桫 较容易得到,该矩阵对策的鞍点为 31a , 32a 和 33a。 其中 31a = 32a = 33a =v =3。 其次,对于某些离散策略集下未必有均衡与鞍点存在。 例如矩阵对策: 0 00Aeeeeee骣 247。 231。 247。 231。 247。 231。 247。 =231。 247。 231。 247。 231。 247。 247。 231。 桫 其中1111m a x m i n m i n m a xi j i jj n i mi m j naaee####= =。 混合策略 南京邮电大学 2020 届本科生毕业设计(论文) 7 在博弈中,一旦每个参与者 都在竭力猜测其他参与者的战略选择 ,而不能通过收益函数作出最有反映,那么在这类博弈中,因为最有行为是不确 定的,所以就不存在纳什均衡。 鉴于这种情况,我们引入混合战略。 定义 : 混合策略: 是指参与者以一定的概率去选择某种战略。 这类博弈虽然在一次操作中有输有赢,但这个博弈多次重复进行,可以研究某个战略应赋予多大的概率,能获取最大的期望收益。 定义 : 规范的表述,参与者 i 的混合战略是在其战略空间 iS 中战略 is 的概率分布 ,is 称为纯战略。 对完全信息静态博弈来说,一个参与者的纯战略是他可以选择的一种特定的行动。 一个参与者的混合战略就是规定他以某种概率分布随机去选择不同的行动。 假设 { }12, ,..., ,i i i iKS s s s= ,选择战略 iKs 的概率为 iKp ,则有如下分布律。 这时,概率分布 ( )12, ,...,i i iKp p p 就是参与者 i 的一个混合战略,其中 01ikp# 且 12 ... 1i i iKp p p+ + + =,概率不同就构成参与者不同的混合战略。 我们用 ( )12, ,...,i i i iKp p p p= 表示基于战略空间 iS的任意一个混合战略,正如之前用 is 表示 iS 中任意一个纯战略。 设矩阵对策矩阵 ( )ijAa= ,其中 1,...,im= , 1,...,jn=。 设 局中人 1 的混合策略 是一组数 0ix179。 , 1,...,im= ,满足 1 1mii x= =229。 局中人 2 的一个混合策略是一组数 0iy179。 , 1,...,jn= ,满足 1 1nij y= =229。 设 ( )1,..., mX x x= 和 ( )1,..., nY y y= 分别是局中人 1 和 2 的混合策略。 局中人 1 以概率 ix 选用策略 i ,局中人 2 以概率 jy 选用策略 j。 因此,局中人 1 选择策略 i ,局中人 2 选择策略j ,并且支付为 ija 的概率是 ijxy ,每一个支付相应的概率乘以 ijxy ,对所有的 i 和所有的 j求和,我们就得到局中人 1 的期望支付 11mnij i jija x y==邋 式 (28) 南京邮电大学 2020 届本科生毕业设计(论文) 8 局中人 1 希望这个期望支付越大越好,局中人 2 则相反,希望它越小越好,设 mS 是满足 0ix179。 , 1,...,im= ,1 1mii x= =229。 的一切 ( )1,..., mX x x= 的集,如果局中人 1 选用策略 mXS206。 ,则它的期望支付至少是 11m innmnij i jYS ija x y206。 ==邋 式 (29) 这里 mS 是满足 0iy179。 , 1,...,jn= ,1 1nij y= =229。 的一切 ( )1,..., nY y y= 的。静态博奕的多重nash均衡及其在经济系统均_衡中应用毕业论文(编辑修改稿)
相关推荐
展。 孔径雷达、毫米波雷达、全相参雷达、超视距雷达、双 /多基地雷达、三坐标雷达和单脉冲雷达等将作为主要发展体制,敏感蒙皮与共形阵天线也会迅速发展并且得到应用,雷达的多传感器的融合技术、组网技术将是其发 展的方向。 通过通用化、系列化和模块化的技术设计,从而不断使得雷达的可靠性、维修性等获得提高,也是雷达系统的发展主题。 现代雷达的突出特点是:侦察一反侦察、隐蔽一反隐蔽、摧毁一反摧毁、干 7
三大工作主题,并取得了很多突破。 化学镀镍一磷合金技术、三价铬盐镀铬、电镀锌三价铬及无铬钝化等代铬技术得到推广应用;以金刚石、氧化铝、聚四氟乙烯等作为弥散相的各种复合电镀取得较大进展,有的已得到工业应用,成为耐磨、减摩领域的重要发展方向;镀领域取得长足进步,纳米电镀、各种花色电镀的开发都取得重大进展。 各种节能、节水技术,如膜技术、高压水清洗工艺、各种节能电源在电镀生产中得到广泛应用。
占有整个电 力拖动容量的 80%的不变速拖动系统都是采用的交流电动机,而只占20%的高控制性能可调速的电力拖动系统采用的是直流电动机。 这几乎已经成为一种举世公认的格局。 交流调速系统的调速方案虽然早已有多种发明并得到了实际应用,但由于其调速性能始终无法与直流调速系统相匹配,所以一直没有在高控制性能的调速中得以使用。 但近年来,随着电子工 业与技术的发展
一旦条件成熟,中国的青蒿产业将会面临失去原料优势的后果。 与此同时,欧美一些大的企业也开始注意到青蒿的巨大利润,开始在欧美引种生产。 生产集中度高 我国主要的青蒿素原料生产厂有酉阳县重庆武陵山制药厂和湖南吉 首制药厂,这两家所生产的青蒿素占我国青蒿素产量的 80%以上, 2020 以前,两家都被华立集团收购。 酉阳武陵制药厂是目前世界上最大的抗疟疾新药(青蒿素)原料生产基地,可年产6吨青蒿素原药
招投标情况书面报告 计财、物资部 合同管理文件 合同审查文件 内部审查文件、 综合部 咨询审查文件 综合部 律师审查文件 合同联签文件 综合部 合同变更、解除及纠纷处理文件 18 合同变更文件 综合部 合同解除文件 综合部 合同纠纷处理文件 综合部 合同文本 综合部 合同管理台账 综合部 不列入竣工文件 开工报告 建设项目开工报告 综合部 建设项目开工报告批复文件 综合部
永安镇及黄龙 溪镇的双流新区。 公兴镇面积 42 平方公里,总人口 万人,是全国百强县双流县中南部重要的交通枢纽和物资集散地,系四川省小城镇试点镇、四川省经济百强乡镇。 该镇地处成都市区、西南航空港、华阳城市副中心的黄金三角地带。 南距成都市 16公路 10 分钟车程,北距双流县城 13 公里 10 分钟车程,双流机场 13 公里 10 分钟车程,东南距成都市副中心华阳镇 6 公里 4 分钟车程