博弈论囚徒困境与纳什均衡(编辑修改稿)内容摘要:
歹徒实施抢劫 少女被压在地上 歹徒抢夺财物 ①少女在车站等车 ②歹徒实施抢劫 ③少女被压在地上 ④歹徒抢夺财物 多人博弈 无论在自然界还是在人类社会, “ 合作 ” 都是一种随处可见的现象,然而多方合作却是难得一见。 多方博弈之所以能够合作,是因为囚徒困境如果是一次性博弈 (One shot game)的话,基于个人利益最大化,得到纳什均衡解(即不合作),但如果是多次博弈,就有了合作的可能性,囚徒困境就有可能破解。 连续的合作有可能成为重复的囚徒困境的均衡解,这也是博弈论上著名的 “ 大众定理 ” (Folk Theorem)的含义。 决定合作与否其实取决于一次博弈还是多次博弈 . OPEC组织成员国之间的合作与背叛 石油输出国组织( OPEC)(其目的是限制各石油生产国的产量,以保持石油价格,获取利润)经常会有成员国不遵守协定,私自增加石油产量。 每个成员国都这样想:如果他们不增加产量,我增加一点点产量对价格没什么影响;如果他们增加,那我也得增加。 结果每个国家都增加产量,造成价格下降 ——结果,大家的利润都受到损失。 OPEC后来为什么合作成功了。 OPEC组织成员国之间的合作与背叛 博弈论的研究表明,要想使合作成为多次博弈的均衡解,博弈的一方(最好是实力更强的一方)必须主动通过“ 可信的承诺 ” (Credible mitment) ,向另一方明确表达合作的诚意。 如果该困境同时涉及多个对手,则要在博弈对手中形成声誉,并用心地维护这个声誉。 这里 “ 可信的承诺 ” 并不是什么空口诺言,而是实实在在的付出。 所以合作是非常困难的。 OPEC组织成员国之间的合作与背叛 理论上,几乎所有的卡特尔(类似于 “ 同盟 ” )都会遭到失败,原因就在于卡特尔的协定不是一个纳什均衡,没有成员有兴趣遵守。 理论上,如果是无限期的合作,双方考虑长远利益,他们的合作是会成功的。 但只要是有限次的合作,合作就不会成功。 比如合作 10次,那么在第 9次博弈参与人就会采取不合作态度,因为大家都想趁最后一次机会捞一把,反正以后我也不会跟你合作了。 但是大家料到第九次会出现不合作,那么就很可能在第八次就采取不合作的态度。 第八次不合作会使大家在第七次就不合作 …… 一直到,从第一次开始大家都不会采取合作态度。 运用向前展望,倒后推理的原则,合作就无从开始。 深谙策略思维者懂得瞻前顾后,避免失足于最后一步。 假如他预计自己会在最后一轮遭到欺骗,他就会提前一轮中止这一关系。 这样一来,倒数第二轮就变成了最后一轮。 ( 1)使得未来相对于现在更重要些; ( 2)改变对策者的四个可能的结果的收益值; ( 3)教给对策者那些促进合作的准则、事实和技能。 走出囚徒困境的三大途径 改变对策者的四个可能的收益值 思考: 如何促使“囚徒困境”中的两个囚徒合作而非背叛。 如何走出“囚徒困境” 烟草商为何不反对禁止烟草广告。 1971年,在 “ 禁烟运动 ” 的声势下,美国国会通过了禁止在电视上做烟草广告的法律。 令许多人奇怪的是,这一回财大气粗的烟草公司反应相当平静,并没有动用其庞大的社会资源和影响力阻止这个法律的通过。 后来的统计资料表明:尽管烟草广告因受到限制而减少,可是烟草公司的利润却提高了。 因为禁令使他们从 “ 囚徒困境 ” 中解放出来。 烟草行业竞争激烈,为争夺市场,各大烟草公司每年都要花费巨额广告费用,这无疑降低了它们的利润水平。 也就是说,如果烟草公司都不做广告,它们的利润更高。 烟草公司本身能否达成都不做广告的协议呢。 不能,因为谁遵守协议,就很可能被对手耍弄。 烟草公司做不到的,国家为它做了:法律起到了协议的作用,而政府承担了监督的成本。 烟草商为何不反对禁止烟草广告。 如何走出“囚徒困境” A公司与 B公司是合作伙伴, A公司经常向 B公司购买原材料,由于两家公司在不同的城市,于是两个公司谈判后签定合同:合同签订一周之后的那一天,在公司 A将现金打入公司 B的银行帐户,公司B则发货到公司 A,若违约则处于 25倍罚款。 改变对策者的四个可能的收益值 在没有法律背景的条件下,双方选择不合作 (逃款或逃货) 是 自然的纳什均衡点。 然而引入强制性的法律则不同,这时他们所签合同具有法律效应,一旦有一方违约,另一方有权罚款,并且法院可以强制实行。 在这种情况下,两个 “ 囚徒 ”公司自然都会采取合作策略,完成合同。 简单说来,就是 法律 改变了两个公司博弈的均衡结果。 改变对策者的四个可能的收益值 民航“禁折令”的失败 为了遏制航空公司的恶性竞争, 1999年,民航总局颁布了 “ 禁折令 ”。 但成效却不大。 政府 不允许机票打折,航空公司于是别出心裁,搞出了送礼的新花样。 买机票送 T恤,或买十送一, 免费接送 ……。 送礼与打折本质上是一回事。 不过后者是明折,前者是暗折。 机票打折 不可能禁也不应该禁 , 另一重要原因是 沉没成本 引起 的 ,除非每班机都能保证满座。 “ 法律 ” 制定不合理 ,也不能破解 “ 囚徒困境 ” ,如中小学生 “ 减负令 ”。 法律(作弊与惩罚) 霍布斯认为,国家以法律形式规定对某种行为如“违约”采取惩罚措施,如果惩罚措施不力,即使扣除惩罚的成本,行动者从“违约”策略中获取的好处大于他采取“守信”策略所带来的好处,那么国家的法律措施是无效率的或者说是低效率的。 因此国家法律的制定应以抑制对他人的危害行动为原则。 这就是法律制定的第一条原则:效率原则。 效率原则是从对社会的整体考虑分析得出的,从这个意义上讲,法律越严格越好,越严格越有效率。 法律(作弊与惩罚) 强制性有效率的法律之重要性还可从冷战时期美苏两个超级大国 40多年的军备竞赛中得出反证。 尽管他们双方签定一些制止军备竞赛的协议,但是由于缺乏一个世界性的公平合理又具有强制性的法律环境,其结果仍然是陷入无法解脱的囚徒困境。 法律制定的第二条原则是,法律对犯法者的惩罚应以与犯法者给社会或他人造成的危害相等为原则,这就是公平原则。 用简单的一句话说,法律惩罚太重对犯法者不公平,惩罚太轻则对社会或他人不公平。 法律(作弊与惩罚) 大唐电信虚增利润再暴诚信劣迹 证监会处罚太轻凸显制度缺陷 案例 : ST大唐于 2020年 8月 20日收到证监会下达的《 行政处罚事先告知书。博弈论囚徒困境与纳什均衡(编辑修改稿)
相关推荐
华容道后,八十万大军只剩二十七骑。 这是曹操和诸葛亮的一次零和博弈。 曹操需选择走大路还是小路;而诸葛亮则需选择在大路还是小路上埋伏。 博弈的关键是谁能猜到对方的策略选择。 这个博弈不存在纯策略纳什均衡点。 曹操败走华容道 快过年了,一对新婚夫妇想一起回老家过年,然双方父母家在不同的省份,假如只能到一家父母家过年,夫想一起回夫家,妻想一起回娘家。 这对夫妻很恩爱,不想分开过年。
(六)每次提供服务后及时将相关信息记入患者的健康档案。 五、考核指标 (一)糖尿病患者健康管理率 =年内已管理糖尿病人数 /年内辖区内糖尿病患病总人数 100%。 辖区糖尿病患病总人数估算:辖区常住成年人口总数成年人糖尿病患病率(通过当地流行病学调查、社区卫生诊断获得或是选用本省(全国)近期 2型糖尿病患病率指标)。 (二)糖尿病患者规范健康管理率 =按照要求进行糖尿病患者健康 管理的人数
的活化 , 或抑癌基因的失活。 28 15 September 2020 第三节 细胞功能障碍与毒性 一 毒物引起的细胞调节功能障碍: (一)基因表达调节障碍: 1 转录调节障碍: 遗传信息从 DNA转录给 mRNA 主要受转录因子( TFs)与基因的 调节或启动区域间的相互作用所控制。 通过与这一区域的核苷酸 序列相结合,激活的转录因子促进前起始复合物的形成,促使相 毗邻的基因的转录。
时应 自下向上 进 行 , 并注意与底板防水 层 的 预 留外 贴 接 头 搭接 应 粘 贴紧 密,在立面防水 层 完成后 , 随 即砌筑保 护墙。 ( 4)卷材 铺贴 工 艺 用同“ 屋面 SBS 卷材施工 ”。 (三)土方回填 土宜优先利用基槽中挖出的土 , 但不得含有有机 杂质。 其粒 径 不大于 50mm, 含水率 应 符合 规 定。 填前 应对 基 础进 行 检 查 验 收 , 并且要
当 m< 6时,婚后各人所得小于 9。 此时 Y的状况变糟,她对婚姻是不满意的。 当 m= 6时,婚后各人所得等于 9。 此时 X得到帕累托改进, Y不变,此时, Y对婚姻不是很积极。 当 m> 6时,婚后各人所得大于 9。 此时 X、 Y都得到帕累托改进,皆大欢喜。 所以,两人的婚后所得至少要达到 6,才能维持稳定的婚姻。 婚姻中的帕累托最优 B.如果是一对门当户对的人,假设 X= Y
50 (2)产品经济寿命期的预测 该厂通过十几年的生产实踪践,不断探索与创新,通过一系列的改造、采用新技术、推动科技进步,生产技术、工艺不断完善,由初期设计能力的年产 100 万支,发展到目前年产 300 万支的能力。 成功地由导入期,完成成长期,步入了生产的成熟期。 为扩能奠定了坚实的基础。 同时,随着科学技术的日益发展,人民生活水平的不断提高