博弈论零和游戏与混合策略(编辑修改稿)内容摘要:

华容道后,八十万大军只剩二十七骑。  这是曹操和诸葛亮的一次零和博弈。 曹操需选择走大路还是小路;而诸葛亮则需选择在大路还是小路上埋伏。  博弈的关键是谁能猜到对方的策略选择。 这个博弈不存在纯策略纳什均衡点。 曹操败走华容道  快过年了,一对新婚夫妇想一起回老家过年,然双方父母家在不同的省份,假如只能到一家父母家过年,夫想一起回夫家,妻想一起回娘家。 这对夫妻很恩爱,不想分开过年。 你知道这对夫妻最终上了开往哪一家的火车吗。 案例 ——夫妻博弈 案例 ——夫妻博弈 丈夫和妻子商量晚上的活动。 丈夫喜欢看拳击,而妻子喜欢欣赏歌剧。 但两人都希望在一起度过夜晚。 这个 “ 夫妻博弈 ” 有两个纳什均衡点: (歌剧,歌剧 ),(拳击,拳击 )。 有两个或两个以上纳什均衡点的博弈中,其最后结果难以预测。 在 “ 夫妻博弈 ” 中,我们无法知道,最后结果是一同欣赏歌剧还是一起去看拳击。  在博弈论中,可以选择出某个策略的纳什均衡,这个策略叫做纯策略。 纯策略的纳什均衡只是博弈的一种特例。  所谓纯策略是指参与者在他的策略空间中选取惟一确定的策略。 纯策略是参与者一次性选取的,并且坚持他选取的策略。 纳什定理与混合策略 所谓混合策略是指参与者采取的不是惟一的策略,而是其策略空间上的概率分布。 混合策略是参与者在各种备选策略中采取随机方式选取的。 这就是纳什于 1950年证明了的纳什定理。 而这个博弈没有纯策略纳什均衡点,而有混合策略均衡点。  最常见混和策略就是猜硬币游戏。 比如在足球比赛开场,裁判将手中的硬币让双方队长猜正反面。 由于硬币落下是正是反是随机的,概率都是 1/2。 那么,猜硬币游戏的参与者都是 1/2的概率择正与反,这时博弈达到混和策略纳什均衡。 纳什定理与混合策略  “剪、布、锤”就不存在纯策略均衡,对每个小孩来说,自己采取出“剪”、“布”还是“锤”的策略应当是随机的。 因此,每个小孩的最优混合策略是采取每个策略的可能性是 l/ 3。 在这样的博弈中,每个小孩各取三个策略的 1/ 3是纳什均衡。 纳什定理与混合策略 两个不到十岁的小男孩,一起玩的时候发生争执,两人商量用‘剪刀、石头、布’,谁赢就听谁的。 下面是他们的对话: 甲说: “ 喂,咱们俩是好兄弟,非要分出胜负就太伤和气了。 待会儿咱们都出 ‘ 剪刀 ’ 就算了事了,好不。 ” 乙说: “ 没问题,好兄弟嘛。 ” 他们说话的时候一脸的纯真。 结果 —— 甲出的是石头,乙出的是布。 纳什定理与混合策略 随机策略  随机策略的最广泛用途在于以较低的监管成本促使人们遵守规则,同时解释了 惩罚不一定要和罪行吻合 的原因。  违章停车的罚金是正常收费标准的许多倍。 设想一下,假如正常收费标准是 1美元 /小时,按每小时 1. 01美元的标准进行处罚能不能让大家服服帖帖呢。 有可能,条件是交通警察在你违章停车时一定能逮住你。 而这需要大量的交警,费用巨大。  监管当局有一个同样管用、代价又小的策略,就是提高罚金数目,同时放松监管力度。  假如监管属于随机性质,我们必须定出一个超过罪行本身的惩罚。 规则在于,预期的惩罚应该与罪行相称,而这种心理预期应该将被逮住的概率考虑在内。  国税局的审查策略也是随机策略 混合策略  公司年饭抽奖,。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。