经济博弈论重复博弈(编辑修改稿)内容摘要:
负效用)。 厂商只能看到产量高低,高产量为 ,低产量 0。 工人努力工作时一定是高产量 ,不努力时却并不一定是 0,而是高产量 的概率为 ,低产量 0的概率为。 工人努力工作时,厂商得益为 ,工人得益为 ; 工人偷懒时,厂商期望得益为 ,工人得益为。 w0w ww e0yyypp1wyew wpy0w考虑如下的触发策略 : 厂商在第一阶段给工资率 ,在第 t阶段,如果前面 t1阶段结果都是 则继续给 ,否则从此永远是。 工人的策略是如果 则接受,否则宁愿作个体户得到 ,并在以前各期结果都是 和当前工资率为 时努力工作,否则偷懒。 设厂商已采用上述触发策略。 由于 ,工人接受工作是最佳反应。 用 记工人努力工作时无限次重复博弈得益的现值,则 即 *w),( * yw *w0w0ww0w ),(* yw*w0* ww eVee VewV )( * )1()(* ewV e 用 记工人选偷懒时无限重复博弈得益的现值,则: 即 因此当 即 时,努力是工人的最佳选择。 反过来,设工人已采用上述触发策略。 若厂商给的工资率满足上式条件,并且威胁一旦产量降低就解雇工人,则各阶段的得益为 ,无限次重复博弈得益现值为。 若不愿给 ,则解雇工人,以后得益为 0。 因此只要 ,厂商选择前述触发策略就是最佳反应。 sV)1)1(( 0* wppVwV ss )1()1()1()1( 0* pwpwV sse VV epeweppww )1(1)1(1 00* *wy)1()( * wy *w0* wy 综上所述,在满足 的条件下,双方的触发策略构成一个纳什均衡。 而上述两式实际上意味着 即工人努力的产出扣除努力负效用后的剩余,必须不小于工人作个体户的收入即机会成本,加上一定比例的取决于努力负效用、贴现系数和偷懒可能得高产量概率的附加部分。 最后这个不等式正是存在有效工资率,工作激励有效的基本条件。 epey )1(10 0** 和epwey )1(10 第五章 有限理性和进化博弈 本章介绍有限理性基础上的进化博弈分析。 完全理性在现实中很难满足,当社会经济环境和决策问题较复杂时,人们必须存在很大的理性局限。 有限理性对人们的决策、行为选择方式有很大影响,有限理性基础上的博弈分析与完全理性博弈分析也有很大区别。 进化博弈分析是有限理性博弈分析的基本框架。 本章介绍以最优反应动态和复制动态为核心,以进化稳定策略为基本均衡概念的进化博弈分析,包括基本方法、概念和各种经典模型等。 本章分四节 : 两人对称博弈 : 两人非对称博弈 有限理性博弈及其分析框架 有限理性及其对博弈的影响 有限理性博弈分析框架 有限理性及其对博弈的影响 有限理性博弈方:不满足完全理性假设的博弈方 有限理性意味着一般至少有部分博弈方不会采用完全理性博弈的均衡策略 有限理性意味着均衡是不断调整和改进而不是一次性选择的结果,而且即使到达了均衡也可能再次偏离 有限理性博弈方会在博弈过程中学习博弈通过试错寻找较好的策略 有限理性博弈分析框架 最优反应动态 :有快速学习能力的小群体成员的反复博弈 复制动态 :学习速度很慢的成员组成的大群体随机配对的反复博弈 进化稳定策略 ( ESS) 最优反应动态 协调博弈的有限博弈方 快速学习模型 古诺调整过程。经济博弈论重复博弈(编辑修改稿)
相关推荐
在 )0,0( 处连续 ,但 )0,0()0,0( yx ff 不存在 .例如 , 一、 填空题 : 1. 设yxz ta nln, 则xz____ ___ _。 yz___ _____ _. 2. 设xzyxezxy则),(_ _____ _。 yz__ _____ _. 3. 设 ,zyxu 则 xu_ ____ ___ __。 yu__
生产出来的半成品每个每月的储存费是 元,试求每批生产量为多少时,可使每月总成本为最少。 16. 某产品的年需求量是 4000 单位,每次生产该种产品的转产调整费为 10 元,存储的年保管费为产值的 8% ,产品每单位的价值为 8 元,问每批产量为多少时可使总储存费为最小。 17. 某厂全年生产需要甲材料 51 70 吨,每次订购 570吨,每吨甲材料单价及库存保管费用率分别为 600元, 14.
eCC,31121 eCC,6512 21 eCC由 解得 ,121,61221eCeC所以原方程满足初始条件的特解为 .26])121(612[23xxx exexexeey ).2c o s(214 xxyy 求解方程例 5 解 特征方程 ,042 r特征根 ,22,1 ir 对应的齐方的通解为 .2s i n2c os 21
22 π , πVV R H RRH由 于dVVV V R HRH 于 是? , 1 . 0 4 , 20 6 少黄铜 问需要准备多 的黄铜 均匀地镀上一层厚度为 的圆柱体表面 半径 要在高为 例 cm cm R cm H 160 π 16 π 31 9 .2 π cm1 9 .2 π 8 .9 .g从而所需准备的黄铜为
提高经销商团队的操作能力 山东万德酒业内训 终端维护的管理体系 • “ 四定” —— 定点、定时、定线、定人的巡回拜访 • 进行终端分类,制定不同的投入和维护标准 • 内外部的包装、出样陈列品种、数量与规格、安全库存 • 确定不同类型店的拜访频率 • 根据最佳交通线路设计拜访路线,提高效率 • 合理配置人员,达到与店数和路线的匹配 • 明确每人每天或每周拜访多少店次。 山东万德酒业内训
策略 纳什均衡,(战争,战争) 和(和平,和平),显然 后者帕累托优于前者,所 以,(和平,和平)是本 博弈的一个帕累托上策均衡。 5, 5 10, 8 8, 10 10, 10 战争 和平 国家 2 战争 和平 国 家 1 战争与和平 二、风险上策均衡 考虑、顾忌博弈方、其他博弈方可能发生错误等时,帕累托上策均衡并不一定是最优选择,需要考虑:风险上策均衡。 下面就是两个例子。 9, 9 8,