博弈论零和游戏与混合策略(编辑修改稿)内容摘要:
华容道后,八十万大军只剩二十七骑。 这是曹操和诸葛亮的一次零和博弈。 曹操需选择走大路还是小路;而诸葛亮则需选择在大路还是小路上埋伏。 博弈的关键是谁能猜到对方的策略选择。 这个博弈不存在纯策略纳什均衡点。 曹操败走华容道 快过年了,一对新婚夫妇想一起回老家过年,然双方父母家在不同的省份,假如只能到一家父母家过年,夫想一起回夫家,妻想一起回娘家。 这对夫妻很恩爱,不想分开过年。 你知道这对夫妻最终上了开往哪一家的火车吗。 案例 ——夫妻博弈 案例 ——夫妻博弈 丈夫和妻子商量晚上的活动。 丈夫喜欢看拳击,而妻子喜欢欣赏歌剧。 但两人都希望在一起度过夜晚。 这个 “ 夫妻博弈 ” 有两个纳什均衡点: (歌剧,歌剧 ),(拳击,拳击 )。 有两个或两个以上纳什均衡点的博弈中,其最后结果难以预测。 在 “ 夫妻博弈 ” 中,我们无法知道,最后结果是一同欣赏歌剧还是一起去看拳击。 在博弈论中,可以选择出某个策略的纳什均衡,这个策略叫做纯策略。 纯策略的纳什均衡只是博弈的一种特例。 所谓纯策略是指参与者在他的策略空间中选取惟一确定的策略。 纯策略是参与者一次性选取的,并且坚持他选取的策略。 纳什定理与混合策略 所谓混合策略是指参与者采取的不是惟一的策略,而是其策略空间上的概率分布。 混合策略是参与者在各种备选策略中采取随机方式选取的。 这就是纳什于 1950年证明了的纳什定理。 而这个博弈没有纯策略纳什均衡点,而有混合策略均衡点。 最常见混和策略就是猜硬币游戏。 比如在足球比赛开场,裁判将手中的硬币让双方队长猜正反面。 由于硬币落下是正是反是随机的,概率都是 1/2。 那么,猜硬币游戏的参与者都是 1/2的概率择正与反,这时博弈达到混和策略纳什均衡。 纳什定理与混合策略 “剪、布、锤”就不存在纯策略均衡,对每个小孩来说,自己采取出“剪”、“布”还是“锤”的策略应当是随机的。 因此,每个小孩的最优混合策略是采取每个策略的可能性是 l/ 3。 在这样的博弈中,每个小孩各取三个策略的 1/ 3是纳什均衡。 纳什定理与混合策略 两个不到十岁的小男孩,一起玩的时候发生争执,两人商量用‘剪刀、石头、布’,谁赢就听谁的。 下面是他们的对话: 甲说: “ 喂,咱们俩是好兄弟,非要分出胜负就太伤和气了。 待会儿咱们都出 ‘ 剪刀 ’ 就算了事了,好不。 ” 乙说: “ 没问题,好兄弟嘛。 ” 他们说话的时候一脸的纯真。 结果 —— 甲出的是石头,乙出的是布。 纳什定理与混合策略 随机策略 随机策略的最广泛用途在于以较低的监管成本促使人们遵守规则,同时解释了 惩罚不一定要和罪行吻合 的原因。 违章停车的罚金是正常收费标准的许多倍。 设想一下,假如正常收费标准是 1美元 /小时,按每小时 1. 01美元的标准进行处罚能不能让大家服服帖帖呢。 有可能,条件是交通警察在你违章停车时一定能逮住你。 而这需要大量的交警,费用巨大。 监管当局有一个同样管用、代价又小的策略,就是提高罚金数目,同时放松监管力度。 假如监管属于随机性质,我们必须定出一个超过罪行本身的惩罚。 规则在于,预期的惩罚应该与罪行相称,而这种心理预期应该将被逮住的概率考虑在内。 国税局的审查策略也是随机策略 混合策略 公司年饭抽奖,。博弈论零和游戏与混合策略(编辑修改稿)
相关推荐
(六)每次提供服务后及时将相关信息记入患者的健康档案。 五、考核指标 (一)糖尿病患者健康管理率 =年内已管理糖尿病人数 /年内辖区内糖尿病患病总人数 100%。 辖区糖尿病患病总人数估算:辖区常住成年人口总数成年人糖尿病患病率(通过当地流行病学调查、社区卫生诊断获得或是选用本省(全国)近期 2型糖尿病患病率指标)。 (二)糖尿病患者规范健康管理率 =按照要求进行糖尿病患者健康 管理的人数
的活化 , 或抑癌基因的失活。 28 15 September 2020 第三节 细胞功能障碍与毒性 一 毒物引起的细胞调节功能障碍: (一)基因表达调节障碍: 1 转录调节障碍: 遗传信息从 DNA转录给 mRNA 主要受转录因子( TFs)与基因的 调节或启动区域间的相互作用所控制。 通过与这一区域的核苷酸 序列相结合,激活的转录因子促进前起始复合物的形成,促使相 毗邻的基因的转录。
证书之一: ( 1) CEAC 办公信息化应用专家证书(信息产业部); ( 2)微 软认证办公应用系统专家证书(微软 MLC)。 (三)外语能力要求 达到学校职业英语能力 要求。 (四)职业资格证书 印刷技术专业 学生 须取得 如表 4 所示 的 5 种证书 之一。 表 4 印刷技术专业核心岗位职业资格证书 序号 职业资格名称 颁证单位 等级 1 平版印刷工 劳动部门 高级 2 电脑照排工
歹徒实施抢劫 少女被压在地上 歹徒抢夺财物 ①少女在车站等车 ②歹徒实施抢劫 ③少女被压在地上 ④歹徒抢夺财物 多人博弈 无论在自然界还是在人类社会, “ 合作 ” 都是一种随处可见的现象,然而多方合作却是难得一见。 多方博弈之所以能够合作,是因为囚徒困境如果是一次性博弈 (One shot game)的话,基于个人利益最大化,得到纳什均衡解(即不合作),但如果是多次博弈
时应 自下向上 进 行 , 并注意与底板防水 层 的 预 留外 贴 接 头 搭接 应 粘 贴紧 密,在立面防水 层 完成后 , 随 即砌筑保 护墙。 ( 4)卷材 铺贴 工 艺 用同“ 屋面 SBS 卷材施工 ”。 (三)土方回填 土宜优先利用基槽中挖出的土 , 但不得含有有机 杂质。 其粒 径 不大于 50mm, 含水率 应 符合 规 定。 填前 应对 基 础进 行 检 查 验 收 , 并且要
当 m< 6时,婚后各人所得小于 9。 此时 Y的状况变糟,她对婚姻是不满意的。 当 m= 6时,婚后各人所得等于 9。 此时 X得到帕累托改进, Y不变,此时, Y对婚姻不是很积极。 当 m> 6时,婚后各人所得大于 9。 此时 X、 Y都得到帕累托改进,皆大欢喜。 所以,两人的婚后所得至少要达到 6,才能维持稳定的婚姻。 婚姻中的帕累托最优 B.如果是一对门当户对的人,假设 X= Y