经济博弈论完全信息静态博弈(编辑修改稿)内容摘要:
策略 纳什均衡,(战争,战争) 和(和平,和平),显然 后者帕累托优于前者,所 以,(和平,和平)是本 博弈的一个帕累托上策均衡。 5, 5 10, 8 8, 10 10, 10 战争 和平 国家 2 战争 和平 国 家 1 战争与和平 二、风险上策均衡 考虑、顾忌博弈方、其他博弈方可能发生错误等时,帕累托上策均衡并不一定是最优选择,需要考虑:风险上策均衡。 下面就是两个例子。 9, 9 8, 0 0, 8 7, 7 L R 博弈方 2 U D 博 弈 方 1 风险上策均衡( D, R) 5, 5 3, 0 0, 3 3, 3 鹿 兔子 猎人 2 鹿 兔子 猎 人 1 猎鹿博弈 风险上策均衡(兔子,兔子) 三、聚点均衡 利用博弈设定以外的信息和依据选择的均衡 文化、习惯或者其他各种特征都可能是聚点均衡的依据 城市博弈(城市分组相同)、时间博弈(报出相同的时间)是聚点均衡的典型例子 四、相关均衡 5, 1 4, 4 0, 0 1, 5 L R 博弈方 2 U D 博 弈 方 1 相关均衡例子 三个纳什均衡 : ( U, L)、( D, R) 和混合策略均衡 [( 1/2, 1/2),( 1/2, 1/2) ] 结果都不理想,不如( D, L)。 可利用聚点均衡( 天气,抛硬币) ,但仍不理想。 相关装置: 各 1/3概率 A、 B、 C 博弈方 1看到是否 A,博弈方 2看到是否 C 博弈方 1见 A采用 U,否则 D;博弈方 2见 C采用 R,否则 L。 相关均衡要点: 构成纳什均衡 有人忽略不造成问题 一、多人博弈中的共谋问题 本博弈的纯策略纳什均衡:( U, L, A)、( D, R, B) 前者帕累托优于后者。 博弈的结果会是什么呢。 ( U, L, A) 有 共谋 (Coalition)问题:博弈方 1和 2同时偏离。 0,0,10 5,5,0 5,5,0 1,1,5 L R U D 博弈方 2 博 弈 方 1 博弈方 3—— A 2,2,0 5,5,0 5,5,0 1,1,5 L R U D 博弈方 2 博 弈 方 1 博弈方 3—— B 共谋和防共谋均衡 二、防共谋均衡 如果一个博弈的某个策略组合满足下列要求: ( 1)没有任何单个博弈方的 “ 串通 ” 会改变博弈的结果,即单独改变策略无利可图; ( 2)给定选择偏离的博弈方有再次偏离的自由时,没有任何两个博弈方的串通会改变博弈的结果; ( 3)依此类推,直到所有博弈方都参加的串通也不会改变博弈的结果。 称为 “ 防共谋均衡 ”。 前面例子中:( D, R, B) 是防共谋均衡 ( U, L, A)不是防共谋均衡 第三章 完全且完美信息动态博弈 本章讨论动态博弈,所有博弈方都对博弈过程和得益完全了解的完全且完美信息动态博弈。 这类博弈也是现实中常见的基本博弈类型。 由于动态博弈中博弈方的选择、行为有先后次序,因此在表示方法、利益关系、分析方法和均衡概念等方面,都与静态博弈有很大区别。 本章对动态博弈分析的概念和方法,特别是子博弈完美均衡和逆推归纳法作系统介绍,并介绍各种经典的动态博弈模型。 本章分六节 动态博弈的表示法和特点 阶段和扩展性表示 动态博弈的基本特点 阶段和扩展性表示 阶段:动态博弈中一个博弈方的一次选择行为 例子:仿冒和反仿冒博弈 A B B A 不制止 制止 ( 2, 5) ( 2, 2) ( 10, 4) ( 5, 5) 不仿冒 ( 0, 10) 仿冒 不制止 制止 仿冒 不仿冒 动态博弈的基本特点 策略是在整个博弈中所有选择、行为的计划 结果是上述 “ 计划型 ” 策略的策略组合,构成一条路径 得益对应每条路径,而不是对应每步选择、行为 动态博弈的非对称性 —— 先后次序决定动态博弈必然是非对称的。 先选择、行为的博弈方常常更有利,有 “ 先行优势 ”。 可信性和纳什均衡的问题 相机选择和策略中的可信性问题 纳什均衡的问题 逆推归纳法 相机选择和策略中的可信性问题 不同版本的开金矿博弈 —— 分钱和打官司的可信性 乙 甲 ( 0, 4) ( 2, 2) ( 1, 0) 不借 借 分 不分 开金矿博弈 不借 乙 甲 乙 借 不分 分 ( 1, 0) 不打 打 ( 0, 4) ( 1, 0) ( 2, 2) 有法律保障的开金矿博弈 —— 分钱打官司都可信 乙 甲 乙 打 ( 2, 2) 不分 分 不借 借 ( 0, 4) ( 1, 0) 不打 ( 1, 0) 法律保障不足的开金矿博弈 —— 分钱打官司都不可信 纳什均衡的问题 第三种开金矿博弈中, (不借 不打,不分)和(借 打,分)都是纳什均衡。 但后者不可信,不可能实现或稳定。 结论 :纳什均衡在动态博弈可能缺乏稳定性,也就是说,在完全信息静态博弈中稳定的纳什均衡,在动态博弈中 可能 是不稳定的,不能作为预测的基础。 根源 :纳什均衡本身不能排除博弈方策略中包含的不可信的行为设定,不能解决动态博弈的相机选择引起的可信性问题 逆推归纳法 定义 :从动态博弈的最后一个阶段博弈方的行为开始分析,逐步倒推回前一个阶段相应博弈方的行为选择,一直到第一个阶段的分析方法,称为 “ 逆推归纳法 ”。 逆推归纳法是动态博弈分析最重要、基本的方法。 乙 不借 借 ( 1, 0) 甲 不分 分 ( 0, 4) ( 2, 2) 子博弈和子博弈完美纳什均衡 子博弈 子博弈完美纳什均衡 子博弈 定义:由一个动态博弈第一阶段以外的某阶段开始的后续博弈阶段构成的,有初始信息集和进行博弈所需要的全部信息,能够自成一个博弈的原博弈的一部分,称为原动态博弈的一个“ 子博弈 ”。 乙 甲 不借 借 不分 分 ( 1, 0) ( 0, 4) ( 2, 2) 乙 ( 1, 0) 子博弈完美纳什均衡 定义 :如果一个完美信息的动态博弈中,各博弈方的策略构成的一个策略组合满足,在整个动态博弈及它的所有子博弈中都构成纳什均衡,那么这个策略组合称为该动态博弈的一个 “子博弈完美纳什均衡”。 子博弈完美纳什均衡能够排除均衡策略中不可信的威胁和承诺,因此是真正稳定的。 逆推归纳法 是求完美信息动态博弈子博弈完美纳什均衡的基本方法。 几个经典动态博弈模型 寡占的斯塔克博格模型 劳资博弈 讨价还价博弈 委托人 — 代理人理论 寡占的斯塔克博格模型 先后选择产量的产量竞争博弈 把古诺模型改为厂商 1先选择,厂商 2后选择,而非同时选择即可。 PPqqQ 8)(,21 221 cc12111111 2)](8[)( qqqqqcQPqu 212116 qqqq 22122222 2)](8[)( qqqqqcQPqu 。经济博弈论完全信息静态博弈(编辑修改稿)
相关推荐
提高经销商团队的操作能力 山东万德酒业内训 终端维护的管理体系 • “ 四定” —— 定点、定时、定线、定人的巡回拜访 • 进行终端分类,制定不同的投入和维护标准 • 内外部的包装、出样陈列品种、数量与规格、安全库存 • 确定不同类型店的拜访频率 • 根据最佳交通线路设计拜访路线,提高效率 • 合理配置人员,达到与店数和路线的匹配 • 明确每人每天或每周拜访多少店次。 山东万德酒业内训
22 π , πVV R H RRH由 于dVVV V R HRH 于 是? , 1 . 0 4 , 20 6 少黄铜 问需要准备多 的黄铜 均匀地镀上一层厚度为 的圆柱体表面 半径 要在高为 例 cm cm R cm H 160 π 16 π 31 9 .2 π cm1 9 .2 π 8 .9 .g从而所需准备的黄铜为
负效用)。 厂商只能看到产量高低,高产量为 ,低产量 0。 工人努力工作时一定是高产量 ,不努力时却并不一定是 0,而是高产量 的概率为 ,低产量 0的概率为。 工人努力工作时,厂商得益为 ,工人得益为 ; 工人偷懒时,厂商期望得益为 ,工人得益为。 w0w ww e0yyypp1wyew wpy0w考虑如下的触发策略 : 厂商在第一阶段给工资率 ,在第 t阶段,如果前面
晚三叠系、侏罗系、白垩系 及晚第三系的沉积外 ,其余地 层均有 分布 ,以 三叠系 、 二叠 系 、 石炭系 地层分布最广, 发育最好,晚 二叠 系为区内主要成煤时期,晚 二叠 系早期有 玄武岩 流喷发 ,见表 2- 1。 表 2- 1 区 域 地 层 简 表 地 层 系 统 代号 厚度 ( m) 岩 性 系 统 组 第四系 Q 020 坡积、残积物。 三叠系 中统 关岭组 T2g 669929
cceptance amp。 Groupthift • Groupthinkphenomenon in which the norm for consensus overrides the realistic appraisal of alternative courses of action • groupshiftA chance in decision risk between the
矩使机身绕 y 轴旋转(方向如图所示),同理,当电机 1 的转速下降 ,电机 3 的转速上升,机身便绕 y 轴向另一个方向旋转,实现飞行器的俯仰运动。 ( 3)滚转运动:与图 b 的原理相同,在图 c 中,改变电机 2 和电机 4 的转速,保持电机 1 和电机 3 的转速不变,则可使机身绕 x 轴旋转(正向和反向),实现飞行器的滚转运动。 ( 4)偏航运动