当前位置:文档之家› 博弈论——换一种方式思考问题

博弈论——换一种方式思考问题

博弈论——换一种方式思考问题
博弈论——换一种方式思考问题

博弈论——换一种方式思考问题

花了一个月的时间研究了下博弈论,收获很多,于是又花了一个礼拜写了这篇算是读后感的日志,希望能激起大家对博弈论的兴趣,尤其是几个经典博弈,真的很有意思。

? 博弈论的内涵

什么是博弈论?简单的说,就是“互动的决策论”,指在充分考虑对方的决策后做出的决策。“博弈论”的英文是“Game Theory”,所以博弈论最贴切的直译是“游戏理论”。

现代博弈理论由匈牙利大数学家冯·诺伊曼于20世纪20年代开始创立,对于冯·诺伊曼我们更为熟知的头衔是“计算机之父”,其实,他还有另一个身份,就是“博弈论之父”。1944年,他与经济学家奥斯卡·摩根斯特恩合作出版的巨著《博弈论与经济行为》,标志着现代系统博弈理论的初步形成。诺伊曼与摩根斯特恩认为,博弈论就是运用数学的方法研究有利益冲突的双方在竞争性活动中制定最优化策略的理论。

但是诺伊曼所解决的只有二人零和博弈,1949年,21岁的纳什写下一篇著名的论文《多人博弈的均衡点》,提出了纳什均衡的概念和解法。这是整个现代博弈论中最重要的思想之一。相信很多人都知道纳什,因为那部经典的奥斯卡最佳影片《美丽心灵》,他传奇的人生,坚强的毅力,深深的打动了我。他在普林斯顿大学深造时,冯·诺伊曼正好在普林斯顿任教,那个时候的普林斯顿还聚集了众多著名的科学大师,包括罗伯特?奥本海默、诺曼·斯蒂恩罗德以及爱因斯坦,据说纳什曾经造访过爱因斯坦,向他讲述自己对于重力的看法。在一个小时的讨论之后,爱因斯坦对纳什说:“年轻人,你应该来学一点物理。”

1950年和1951年纳什的两篇关于非合作博弈论的重要论文,彻底改变了人们对竞争和市场的看法。他证明了非合作博弈及其均衡解,并证明了均衡解的存在性,即著名的纳什均衡。

表面上看,博弈论似乎是数学家玩的游戏,而事实上,博弈论首先是我们思考现实世界的一套逻辑,其次才是把这套逻辑严密化的数学形式,博弈论的目的在于巧妙的策略,而不是解法。我们学习博弈论的目的,不是为了享受博弈论的分析过程,而在于赢得更好的结局。说到底,博弈论只是一个分析问题的工具,用这个工具来简化问题,使问题的分析清晰明了就够了。

? 博弈论的基本概念

首先我们需要了解的是纳什均衡。在某个房地产开发中,假定市场需求有限,只能满足某种规模的开发量,A、B两个开发商都想开发这一规模的房地产,如果A选择开发,则B 的最优策略是不开发,同样,如果B选择开发,则A的最优策略是不开发。这时无论对A 还是B,都不存在一种策略优于另一种策略,也不存在严格劣策略(不论其它人采取的策略,某人采取对自己不利的策略)。研究这类问题的均衡解,需要引入纳什均衡。

在纳什均衡中,每个参与人都确信,在给定其它参与人的策略情况下,己方选择了最优策略。所以在纳什均衡点上,每个参与者的策略都是最好的,此时没人愿意先改变或主动改变自己的策略。

在博弈论中,博弈行为都可以分为两类,即零和博弈与非零和博弈。零和博弈是一种完全对抗,强烈竞争的对局。参与者的总收益为零,因此一个参与者的所得必然是另一个参与者的损失。而非零和博弈,是各参与者的目标不完全对立,参与者只按本身的厉害关系单方面做出决策,有时为了共同利益而合作,有时为了个人利益而对立,收益的总和是可变的,参与者可以同时有所得和有所失。

在博弈论中,最基本的假设之一就是:人是理性的。所谓理性人是指行动者具有推理能力,在具体策略选择时的目的是使自己的利益最大化。而现实生活中,人们在做决策时往往是有限理性的。每个人都不是绝对聪明的人,而且绝对聪明的人也未必会用绝对聪明的方式去做决策,因此博弈论是有局限性的。

尽管如此,人类至今还没有找到一种比博弈更好的思考工具,可以对现实的客观世界进行如此近似的描述。就像力学是自然科学的哲学和数学一样,博弈论是社会科学的哲学与数学。没有牛顿力学我们连最简单的物理现象都无法理解;同样的道路,没有博弈论我们也无法解释分析很多的社会现象。

? 囚徒困境:博弈论的经典模型

有这样一个案例:两个共同偷窃的犯罪嫌疑人甲和乙被带到警察局。警方对两名犯罪嫌疑人实行隔离关押,隔离审讯,每个犯罪嫌疑人都无法观察到同伴的选择。

警方虽然怀疑他们作案,但手中没有掌握确凿的证据,于是分别告知两名犯罪嫌疑人:对犯罪事实的认定及相应的量刑完全取决于他们自己的招供。如果你们一方供认,而另一方抵赖,那么供认方将作为证人无罪释放,而另一方将被判10年徒刑;如果双方都与警方合作,共同招认,则都将被判5年有期徒刑;如果双方均不认罪,则各判2年。

我们先不管这样的量刑方式是否合理,假设规则就是这个样子,从常理来看,双方都不认罪是最好的选择,但从博弈论角度出发,对于A来说,如果B招供,则A如果不招供的话,将会受到重罚,因此A的最佳策略是招供,如果B不招供,A的最佳策略仍然是招供,所以理性的A一定会选择招供,对于B来说,也是一样的道理。这样双方都招供就是一个纳什均衡。

从逻辑上分析确实没问题,但生活中我们可以这样来分析问题吗?有这样一则故事:两位交往甚密的大学生修化学课。两人在小考、实验和中期考中都表现都很优秀。在期末考试前的周末,他们非常自信,于是去参加了一场聚会。聚会太尽兴了,结果周日这天睡过了头,来不及准备周一的考试,要知道,大学里的考试全都要看考前一两天的复习。他们没有参加考试,而是向老师撒了个谎,说在回来的路上轮胎爆了,由于没有备用胎,只好整夜在路边整夜等待救援。现在他们太累了,请求老师容许他们隔天再考。老师想了想,同意了。他们便好好准备了一个晚上,周二来考试了。老师安排他们在两间教室做答。第一个题目在考卷第一页,占了十分,非常简单,两人都写出了正确答案,心情舒畅的翻到了第二页,第二页只有一个问题,占了九十分,题目是:“请问是哪只轮胎爆了?”结果不言而喻,两位学生只有乖乖向老师认错。

所以利用囚徒困境,我们至少可以学到一点,在生活中,如果能善于建立囚徒困境,往往能将看似很棘手的问题用很简单的方法解决。

也许你现在跟我一样有一个疑问,按照上面的分析,对每个参与者来说选择背叛永远比选择合作获得更多的利益,在现实生活中,这显然不合理。原因在于博弈的次数问题,在任何博弈中,表现最好的策略直接取决于对方采用的策略,总的来说,如果你认为今后将难以与对方相遇,或者你不关心自己未来的利益,那现在就选择背叛。而事实上,现实生活中反复交往的人际关系,则是一种“不定次数的重复博弈”。因此,我们在博弈过程中,必然要考虑是否还有重复博弈的可能,如果将来的重复博弈带来的利益要更多的话,那当前博弈就会选择合作。

有了重复博弈还是不够的,当我们在确定合作时必须要制定相应的规则,规定背叛后的惩罚,只有带剑的契约才是游戏合作的保证。当参与者在博弈过程中选择背叛后为此要付出更大的代价后,就自然降低了他的背叛动机。

从囚徒困境中我们获得以下几点启发:第一,善于建立囚徒困境,如上面警察与教授就

通过建立囚徒困境成为了“渔翁得利”者。

第二,当自己处于不利地位时可以将对方也拉入囚徒困境中,为自己谋得最大利益。《战国策》有这样一则故事,公元前522年,楚平王怀疑太子谋反,迁怒于伍家,将伍子胥的父亲与哥哥均杀害,伍子胥只身逃往吴国。在逃亡中,伍子胥被守关的斥候抓住,伍子胥说:“你知道楚王为什么要抓我吗?是因为有人跟楚王说我有一颗宝珠,可我的宝珠已经丢失了,楚王不信,以为我在欺骗他。没有办法,我只有逃走,现在你抓住我,还要把握交给楚王,那我将在楚王面前说是你夺去了我的宝珠,并吞到肚子里,楚王为了得到宝就一定会先把你杀掉。”斥候信以为真,就赶紧把伍子胥给放了。

这是书中提到的一个故事,听起来有点假,不过还是可以说明问题的。在这个故事中,伍子胥自身处于极不利的形式,但他巧妙的构造了一个囚徒困境,而且自己先做了决策。本来斥候的最大利益是将伍子胥送给楚王,并且伍子胥不揭发他,而这是伍子胥的严格劣策略,也就是说伍子胥肯定不会采取这个策略的,而在伍子胥肯定揭发他这个前提下,斥候做出的最好选择就是放了伍子胥。呵呵,是不是有点绕啊,不过把关系理顺了,还是觉得用博弈论来分析问题确实挺有意思的。

第三,也是囚徒困境最直接告诉我们的一个道理,在大多数情况下,背叛都是最优的选择。也许你要说道德问题,当然,如果是朋友跟亲人,那就先忘了博弈吧,而如果我们身陷囚徒困境中,就应该分析形势,首先判断与对方有无再合作的可能,如果本次合作会为双方将来谋得更大利益,则选择合作;如果不是的话,而双方又无严格的相互约束的话那就要选择背叛,因为对方同样有背叛的倾向,不背叛自己的利益就会受到侵害。

? 酒吧博弈:混沌系统中的博弈

这也是博弈论中的一个经典模型,而且很有意思,案例是这样的:

假设有100个人很喜欢泡酒吧。这些人在每个周末,都要决定是去酒吧活动还是待在家里休息。酒吧的容量是有限的,也就是说座位是有限的。如果去的人多了,去酒吧的人会感到不舒服。此时,他们留在家中比去酒吧更舒服。

假定酒吧的容量是60人,如果某人预测去酒吧的人数超过60人,他的决定是不去,反之则去。这100人如何做出去还是不去的决定呢?

这个博弈的前提条件做了如下限制:每一个参与者面临的信息只是以前去酒吧的人数,因此,他们只能根据以前的历史数据,归纳出此次行动的策略,没有其它的信息可以参考,他们之间更没有信息交流。

酒吧问题所模拟的情况,非常接近于一个赌博者下注时面临的情景,比如股票选择、足球博彩。这个博弈的每个参与者,都面临着这样一个困惑:如果许多人预测去的人数超过60,而决定不去,那么酒吧的人数会很少,这时候做出的这些预测就错了。反过来,如果有很大一部分人预测去的人数少于60,他们因而去了酒吧,则去的人会很多,超过了60,此时他们的预测也错了。

因而一个做出正确预测的人应该是,他能知道其他人如何做出预测。但是在这个问题中每个人预测时面临的信息来源都是一样的,即过去的历史,同时每个人无法知道别人如何做出预测,因此所谓正确的预测几乎不可能存在。

呵呵,如果知道怎么去预测,那了解博弈论的人都可以去买炒股了。有位学者通过真实的人群以及计算机模拟两种实验得到了两个迥异的、有趣的结果。在对真实人群的实验中,实验对象的预测呈有规律的波浪状形态,更多的博弈者是根据上一次其他人做出的选择而做出这一次的预测,这种预测是一个非线性的过程。所谓这样一个非线性的过程是说,系统的未来情形对初始值有着强烈的敏感性,这就是人们常说的“蝴蝶效应”:在北京的一只蝴蝶动了一下翅膀,华盛顿就下了一场大暴雨。

从枪战博弈中我们可以发现,在多方博弈中进攻方向的选择其实是与各方的实力相关的。即使我们实力处于劣势的话,擅于运用枪战博弈,往往能提升自己获胜的概率。但如果自己不小心是甲呢,呵呵,虽然本来是件好事,但枪战博弈还是告诉我们,在这种多方博弈中,最强者未必是最有优势的,我们需要做的是擅于伪装自己,明明是只乌龟,却背了一个蜗牛的壳,这才是真正的高手。

? 猎鹿博弈:团结就是力量

假设某个部落有两个出色的猎人,某一天他们狩猎的时候,看到一头梅花鹿。只要他们能够齐心协力,梅花鹿就会成为他们的盘中餐。不过只要其中有任何一人放弃围捕,梅花鹿就会逃跑掉。“福兮祸之所依;祸兮福之所伏。”有时运气太好并不一定有好的结果。正当两个猎人严阵以待,围捕梅花鹿的时候,在两个路口都跑过一群兔子,如果猎人去抓兔子,会抓住4只兔子。从维持生存的角度来看,4只兔子可以供一个人吃4天,1只梅花鹿如果被抓住将被两个猎人平分,可供每人吃10天。

在这个博弈中,可以得到该博弈有两个纳什均衡点,那就是:要么分别打兔子,每人吃饱4天;要么合作,每人吃饱10天。两个纳什均衡,就是两个可能的结局。两种结局到底哪一个最终发生,这无法用纳什均衡本身来确定。

按照经济学的说法,合作猎鹿的纳什均衡,分头抓打兔子的纳什均衡,具有帕累托优势。经济学中,如果想再改善任何人都必须损害别的人了,这时候就说一个经济已经实现了帕累托效率。相反,如果还可以在不损害别人的情况下改善任何人,就认为经济资源尚未充分利用,即任何重新改变资源配置的方式,都不可能使一部分人在没有其他人受损的情况下受益。这一资源配置的状态,被称为“帕累托最优”状态。这个也挺有意思的,大家如果有兴趣的话可以看一下曼昆的《经济学原理》,里面介绍的比较详细。

我们不妨做这样一种假设,A猎人与B猎人合作猎鹿之后的分配不是两人平分成果,而是A猎人仅分到了够吃2天的梅花鹿肉,B猎人却分到了够吃18天的梅花鹿肉。在这种情况下,整体效率虽然提高,但却不是帕累托改善,因为整体的改善反而伤害到猎人A的利益。所以这时,猎鹿对于A来说就是严格劣策略了。当然,纳什均衡也就剩了一个了。

猎鹿博弈与囚徒困境不一样的是,在个体追求利益最大化时团体也能达到利益最大化,这个好像在《美丽心灵》中有提过,纳什在酒吧中看见一个美女,受到启发,提出博弈中应该考虑团体利益,然后就把亚当.斯密的理论推翻了,不知道是真的假的。

还有一个比较有意思的是,猎鹿博弈的理论源泉来自于卢梭的《论人类不平等的起源与基础》,在远古时候,人类没有什么对未来的预见,所以当他们在共同猎鹿的过程中,如果有兔子在某个人面前走过,他们会不犹豫的选择捕捉兔子,就这样人类社会的种种矛盾就产生了。猎鹿博弈很好的解释了现实生活中合作共赢的局面,对于现代社会的我们,必须站在更高的角度制定策略,眼前利益虽然很重要,但更需要考虑长远利益。

? 智猪博弈:多劳未必多得

世上有没有免费的午餐呢?智猪博弈告诉你,这个,还真有。

假设笼子里面有两只猪,一只大,一只小。笼子很长,一头有一个踏板,另一头是饲料的出口和食槽。每踩一下踏板,在远离踏板的猪圈的另一边的投食口就会落下少量的食物。如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩一下踏板,将有相当于10个单位的猪食流进食槽,但是踩完踏板之后跑到食槽所需要付出的“劳动”,要消耗相当于2个单位的猪食;如果两只猪同时踩踏板,再一起跑到食槽吃,大猪吃到7个单位,小猪吃到3个单位,减去劳动耗费各自2个单位,大猪净得益5个单位,小猪净得益1个单位;如果大猪踩踏板,小猪等着先吃,大猪再赶过去吃,大猪吃到6个单位,去掉踩踏板的

劳动耗费2个单位净得4个单位,小猪也吃到4个单位;如果小猪踩踏板,大猪等着先吃,大猪吃到9个单位,小猪吃到1个单位,再减去踩踏板的劳动耗费,小猪是净亏损1个单位;如果大家都等待,结果是谁都吃不到。听起来有点复杂,其实只要列一个表就很清楚了,如果想真正了解智猪博弈,再看两遍哦。

可以得出结论,唯一解是大猪踩踏板,小猪等待。因为,小猪踩踏板将一无所获,不踩踏板反而能吃上食物。对小猪而言,无论大猪是否踩动踏板,不踩踏板总是好的选择。反观大猪,已明知小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,所以只好亲力亲为了。

怎么样,世上确实有“免费的午餐”吧,而且这种情况在日常生活中比比皆是,比如两户人家需要修一条路,一户条件很好,另一户没有能力修,那最终的结果肯定是富裕的那户人修路,贫穷的那户人坐享其成。

从智猪博弈中,我不禁想到微软的市场策略,对于新技术都是从模仿跟随,再到创新超越。在新领域中微软一开始扮演的就是小猪的角色,这种跟随能确保自己处于风险最低的形式,也可以说最大限度的处于不败的地步。比如有一场赌局,每个人都有1000块筹码,赌到最后谁筹码最多就获胜,假设最后一局之前甲已经领先了,这时乙只有获胜才有可能超过甲,那对于甲来说,最佳策略就是跟随乙,乙如何决定甲都照跟,哪怕乙做出的决策很荒唐,这样他最后一局就能不败,最终就能赢得比赛。

从更高的角度来说,就是当你在对局中处于不利的地位,冒更大的风险去做决定更有利;而在对局中处于有利的地位,采取保守策略跟随对付就比较有利。

当然,我们也不能一直扮小猪空手套白狼,我们必须正确的意识到自己是否是小猪,如果确实是小猪,没有必要打肿脸充胖子,而是善于让大猪明白,自己除了不作为没有其它选择了,然后在跟随中不断发展自己;如果自己是大猪的话,更要清楚的分析自己的付出会不会有让小猪威胁到自己的地步,如果自己能得到远多于小猪利益的话,就必须担负起做大猪的义务。

? 蜈蚣博弈:倒过来想问题

假设A、B轮流进行策略选择,可供选择的策略有“合作”与“不合作”两种,规则是:A、B两次决策为一组,第一轮若A决策结束,A、B都得n,若B结束,则A得n-1而B得n+2;下一轮A、B都从n+1开始。假设一共博弈100次。

说的更明确点就是A、B分别做决策,而且合作次数越多,双方获得的利益越大。蜈蚣博弈其实反映的是一种“倒推法”这种思考问题的方法。从倒数第二轮来看,B显然选择“不合作”能获得更多的利益,而A知道B会不合作,所以他也选择“不合作”,这样一直往前推,最终的结果就是双方根本就一次也不合作。

这样说有点枯燥,我们可以用蜈蚣博弈来分析恋爱过程。假设小丽与小东谈恋爱,这个博弈中他们都有两个选择,一是继续,另一个是分手。他们的博弈展开式如下:事实上,每一轮的决定后,两个人的总效益都是在不断增加的,所以对团体来说,最好的结果就是一直选择继续到最后。而按照蜈蚣博弈的理论,用倒推的方法来分析,小东在最后一轮肯定会选择分手,因为选择恋爱对自己没有更多好处,小丽在倒数第二轮会考虑,既然小东最后会选择分手,那自己选分手可以得到更多利益,这样一直往前推,最终的结果就是小丽从一开始就选择分手,两者所得各为1。

从逻辑推理来看,倒推法是严密的,但结论却违反直觉。这就是蜈蚣博弈的悖论,通过实验可以发现,双方在一开始不会选择分手,但随着博弈的进行,理性的人出于自身利益的考虑,肯定会在某一步选择分手,倒推法肯定会在某一步起作用,只要倒推法起作用,合作则无法继续。

蜈蚣博弈有些类似重复多次的“囚徒困境”,感觉有些过于理论,不过学会使用倒推法来思考问题倒是很好的,而且还是那句好,时刻准备着背叛,当然,恋爱是另外一回事。为了安全起见,我还是决定把蜈蚣博弈忘了。

? 鹰鸽博弈:进化中的路径依赖

这也是很有意思的一个博弈,鹰与鸽其实一个代表激进创新策略,一个代表保守温和策略。这个可以用博弈论中的ESS策略来说明,所谓ESS,即进化上的稳定策略,指凡是种族群大部分成员采用某种策略,而且这种策略的好处为其它策略所比不上的,这种策略就是进化上的稳定策略或ESS。换句话说,对于个体来说,最好的策略取决于种群的大多数成员在做什么,它一旦成立,任何异常的个体的策略都不可能与之比拟。

这里通过两个例子来说明进化中的路径依赖,一个是猴子吃香蕉的实验。在一个密封的房间里,让猴子一直饿着,然后从房间上面的小洞放下一串香蕉,一只饿的头昏眼花的大猴子立刻冲上去,可是当它还没有拿到香蕉时,就触动了预设机关,滚烫的热水烫的全身是伤,后面三个猴子依次爬上去拿香蕉时,一样被烫伤,于是众猴只能望蕉兴叹。几天后,实验者用一只新猴子换走一只老猴子,当这个新猴子想去拿香蕉时,立刻被其它猴子制止。这样当四只猴子全部换掉后,仍然没有猴子去拿香蕉,因为当新猴子去那时,所有的老猴子都阻止它,尽管它们都没有被热水烫过。

另外一个例子是关于铁路宽度的由来,现代铁路的标准宽度是1435毫米,这是因为铁路是由建电车的人所设计的,而1435毫米正是电车所用的轮距标准。那电车的轮距标准又从何而来的呢?这是因为最先造电车的人原先是造马车的,而马车有是根据英国马路的宽度设计的,如果马车不按其标准设计,它的轮子就会在老路上撞坏。原来,整个欧洲,包括英国的长途马路都是罗马人为其军队所铺设的,它是按照罗马军队的战车所设计的,以1435毫米的宽度设计原因其实很简单,这是牵引一辆战车的两匹马的屁股宽度。哈哈,原来现在铁路的宽度是从马屁股那传来的,如果下次大家坐火车嫌窄的话,可以抱怨一下为什么古时候人们不用牛或者大象去拉车。

通过路径依赖可以解释社会中出现的很多现象,路径依赖有时会阻碍集体的进步,但对于个体来说,如果不是集体的绝对领导者,保持路径依赖是一种较优的选择。

博弈是智者的游戏,通过前人总结的一个个博弈,我们可以在生活中做出更优的选择。知道博弈的本身并没有用,关键是要将其思想深入到脑髓中,在做决策时增加获胜的筹码。

以上纯属个人见解,欢迎大家批评指正、交流分享!

基于博弈论的夫妻冲突分析

一个女人能有多美,通常是由与她相伴的男人来决定;一个男人能走多远,往往是由与他相随的女人来决定。夫妻之间的物质生活水平,通常是由收入较高的一方来决定;夫妇之间的精神生活水平,往往是由素质较低的一方来决定。 囚徒困境 在囚徒困境这个例子中,两个囚犯的上策都是坦白,因此最容易出现的结局也就是两人都被判5年。这个结局构成了一种博弈均衡状态,当对局者选择的都是上策的时候,这种均衡叫做上策均衡。在博弈论中,所谓均衡是指一种稳定的结局,当这种结局出现的时候,所有对局者都不想再改变他们所选择的策略。二.情侣冷战对峙 现将囚徒困境的报酬矩阵分析引入到一对情侣的冷战对峙中,见下图: H表示主动的一方感觉自己付出更多从而受到伤害,生出不平衡感;E代表不主动的一方有种优越成就感谈过恋爱的人都会对此有深刻的体会吧。闹矛盾有别扭之后,有时也可能两人都想主动了,但谁也不先迈出这一步,在不知道对方策略和想法的情况下,一权衡一算计就总害怕自己亏了,又或者碍于情面拉不下面子,不肯服个软。于是乎,秋水望穿了,花瓣也掰完了,最后是怎样呢?在这个矩阵中我们需要考虑的是,或者说我们的假设前提是,双方都是完全理性的,是完全以利己目的和最大化利益为原则行事的人。上策均衡显然并非最好的结局,但却是博弈双方经过反复权衡后所采取的认为对自己最有利的选择。但我们知道,所谓的爱情是没有理性可言的,它是一种激情,一旦斤斤计较反复权衡利弊得失,那就不叫爱。所以非常有意思的是,这个矩阵中出现的上策均衡(O,O——OVER),即双方都不主动从而导致感情破裂爱情失败的结局,正说明了爱情只要一权衡一算计,俩人都矜持和自私的话,那么最终铁定玩完。 三、夫妻关系的博弈分析 感情,爱情,亲情夫妻关系尴尬的了现实的活动中,夫妻关系既有和谐、融洽的一面,也存在冲突、矛盾的一面。每5对佳侣新婚燕尔之时,就有一对夫妻分道扬镳。 无论是丈夫还是妻子,双方都有自己的利益追求和价值取向,而家庭生活成为他们博弈的载体和工具。

博弈论视角去思考生活中的问题与现象

姓名:学院:专业: 年级:2010级 学号: 题目:博弈论视角去思考生活中的问题与现象 关键词:经济学,大学生,考试作弊。 内容摘要: 考试是人才培养过程中的一个重要的教学环节,是检查教师教学效果, 是检验学生对知识和技术掌握程度的一种手段。近年来考试作弊现象越来越普遍、越来越严重,并呈现不断蔓延之势,严重影响了考试应有的严肃性、公正性和科学性,引起了社会公众的广泛关注。考试作弊行为的存在严重影响着考试功能的正常发挥,同时也严重损害着学生的心理健康和品德培养。如何有效地杜绝和减少学生考试作弊行为已成为近年来高等教育势在必行的一项工作。本文从从成本-收益分析维度对考试作弊行为进行简要分析,通过分析考生作弊的成本,提出控制作弊的对策。 一、大学生考试作弊的成本-收益之博弈 作弊行为包括夹带小抄、桌面留言、互对答案、偷看他人答卷、互换试卷、替考等,呈现出方式多样化、主体多样化、规模集团化、过程组织化、人员职业化、手段现代化、水平专业化等特点.经济学原理告诉我们,经济活动主体总是在一定约束条件下追求自身利益的最大化,这也正是大学生考试作弊的内在动因。因为考试成绩是衡量学生表现的关键指标,它直接影响着大学生的奖学金、评优、入党、提干、推研、就业和心理满足。在这一动因的作用下,大学生在考试中可能会违背学校规定,具有作弊、不作弊和按照一定的概率分布进行作弊等三种不同的行为选择。寻求最佳的作弊与不作弊的概率分布是大学生的行为选择。在个体理性作用下,大学生选择行为时常从两方面考虑,一是将作弊带来的超常收益与作弊被发现而受惩罚的损失进行对比,若作弊的超常收益低于受惩罚的损失,将不会试图作弊,否则,作弊有利可图,就会发生作弊现象;二是估计作弊被监考教师发现的可能性,如果这一可能性很大,作弊概率就小,否则作弊概率就大。 1.学习机会成本大,课堂学习收益小

基于博弈论的恋爱模型

《数学建模》 课程考核论文 姓名:王湘衡齐久坤张程勇 学号:08100225 08100217 08100232 班级:08信息2班 2011年5 月10日

基于博弈论的恋爱数学模型 摘要 本文用数学建模的方法研究博弈论中的问题,从不完全信息静态博弈建立模型建立模型,并利用纳什均衡原理程序来确定纳什均衡点,对不同均衡点进行分析,从而来确定最佳策略。然后通过海萨尼转换将不完全信息静态博弈转换成不完全信息动态博弈,来模拟现实社会中的恋爱,再利用恋爱者不同类型的分布概率,求出恋爱者的期望,最终来决策恋爱者自己下一步的策略。 关键词:恋爱模型博弈论贝叶斯纳什均衡

1、问题重述 随着社会的进步和发展,现在恋爱问题越来越成为生们关注的热门话题,那么如何利用数学知识来确定恋爱中双方能找到适合自己的恋人,成为现在数学建模中研究的一个重要领域。恋爱模型可以用博弈论来确定双方的合适恋人,这其中将恋爱双方都理想化,这样将给我们研究恋爱问题和建立数学模型带来方便,使我们能将恋爱模型数学化,从而确定恋爱者的进一步决定。 2.模型假设及符号说明 模型假设: 1、恋爱双方都有自己明确的恋爱目标 2、恋爱双方从始至终都保持着自己的理性 3、恋爱双方都有自己喜欢类型的人,并且不会随时间变化 4、恋爱的男女通过对方的行为能够明确的判断出对方为哪种类型的人 5、恋爱的参与生都选择的是均衡战略 符号说明: 3. 问题分析与模型建立 3.1 问题分析 谈恋爱作为一个日常生活中最常见的现象要模型化却也并不简单。我们不妨

这样来看,谈恋爱的男女双方,各有不同类型,我们简单将其分为为了寻找真正爱情的人和为了骗财骗色的人。虽然这样不免有所武断,但我们分析的是一般现象,寻求的是一般解释。有了这样的分类便有了不同的组合,有了我们这个世界的爱恨情仇。我们的分析中有现代版的陈世美,却不会让他得逞,原因是理性经济人的假设。有人说这一点说不通,我不这样认为,经济学说所有人都是理性的并不影响不理性家伙们的存在,能解释一切的理论只能是没有内容的套套逻辑。一个理论的解释力只不过是它一般化的程度罢了。 简单的博弈理论己深入人心,显然上面的问题是不完全信息博弈,无论是男追女还是女追男,信息的不完全或是不对称是显而易见的,用博弈论的话说是对对方的了解不够精确。因此,我们依据博弈论理论可以将其分为静态博弈和动态博弈。静态分析是找出其静态均衡,动态分析是揭示现实中生的行为。 3.2 模型的建立 3.2.1不完全信息静态博弈模型 所谓静态是指所有参与生都同时行动,不会以别人行动的信息来更改自己的行动。我们以最常见的男追女为例,一个男生追求一个女生,在此情况下女生最苦恼的是不知男生是A类型的人还是B类型的人,虽然自己可以从各种渠道了解男生,但知生知面不知心,风险还是存在的。在这种情况下女生所遇到的就是不确定性条件下的选择问题,因为女生不仅不知道男生的类型(A还是B),而且还不知道不同类型的分布概率,但她对自己所属的类型是清楚的,这是她的私人信息。同理男生也是这样。 下面来设定支付函数的权值,以便求出纳什均衡点,设男A类追求者,只要他追求A类女生就得到10,他不追求A类女生就得到-10,A类女生接受得到10,拒绝得到-10;男B类追求者,他追求A类女生得到10,不追求得到-10,A类女生接受得到-10,拒绝得到10;男A类追求者,他追求B类女生得到-10,不追求得到10,B类女生接受得到10,拒绝得到-10;男B类追求者,他追求B类女生得到10,不追求得到0,B类女生接受得到10,拒绝得到0;他们的支付函数的权值依赖追求者的类型。这里用下面四张表说明:

博弈论在管理制度中的应用

博弈论在管理中的应用

————————————————————————————————作者:————————————————————————————————日期:

博弈论在管理中的应用 不知道大家有没有为这些事情困惑过:为什么员工技能竞赛,技能比拼很难开展,即便开展了,为什么工作效率也没有像预想的那样提高?为什么企业中总有些人拖大家的后退而不努力工作?为什么有的领导手段强硬,有的领导风格怀柔?你是否为“办公室政治”烦恼不已?你有没与遇到过和你看法不一致,总是与你针锋相对的下属?遇到强硬的下属你该怎么办?为什么酒店联盟或者企业间的联盟总是很难做?你是否在做决策之时衡量反复却不知道选择何种策略?。。。。。。。。等等等等这些问题、困惑你是否明白其中的原理?你如何提出科学而又合理解决方法? 以上种种问题,你都能从博弈理论中得到合理而科学的解释。而大家是否了解博弈论呢。我们这次分享就是和大家一起了解博弈论的一些知识,并以隐藏在我们身边的博弈为例子,给大家提供解决某些实际问题的思路。 那么什么是博弈论呢?所谓博弈论,就是一套研究互动决策行为的理论。它实际上也可以看做是一种方式,既谋略性思考问题的方式。对博弈论通俗的理解就是,关于人与人的斗争中“老谋深算”的学问。 假如你正跟恋人用手机通电话,突然信号断了。这时你是会立即拨电话过去,还是等你的恋人拨电话过来?很显然,你是否拨电话过去取决于你的恋人是否会拨过来。如果你们其中一方拨,那么另一方最好是等待;如果一方等待,那么另一方最好拨过去。如果双方都拨,那么就会出现线路忙;如果双方都等待,那么时间就会在等待中消逝。 这,就是博弈。

博弈论论文囚徒困境的启示和思考

囚徒困境的启示和思考 二、囚徒困境的解释 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 若对方沉默、背叛会让我获释,所以会选择背叛。 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑8年。 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑1年,总体利益更高,结果也比两人背叛对方、判刑8年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。 实际上囚徒困境在我们的实际生活中也有很多,下面举两个进行说明

三、经济学例子:关税战 两个国家,在关税上可以有以两个选择: 提高关税,以保护自己的商品。(背叛) 与对方达成关税协定,降低关税以利各自商品流通。(合作) 当一国因某些因素不遵守关税协定,独自提高关税(背叛),另一国也会作出同样反应(亦背叛),这就引发了关税战,两国的商品失去了对方的市场,对本身经济也造成损害(共同背叛的结果)。然后二国又重新达成关税协定。(重复博弈的结果是将发现共同合作利益最大。) 四、商业例子:广告战 商业活动中亦会出现各种囚徒困境例子。以广告竞争为例。 两个公司互相竞争,二公司的广告互相影响,即一公司的广告较被顾客接受则会夺取对方的部分收入。但若二者同时期发出质量类似的广告,收入增加很少但成本增加。但若不提高广告质量,生意又会被对方夺走。 此二公司可以有二选择: 互相达成协议,减少广告的开支。(合作) 增加广告开支,设法提升广告的质量,压倒对方。(背叛) 若二公司不信任对方,无法合作,背叛成为支配性策略时,二公司将陷入广告战,而广告成本的增加损害了二公司的收益,这就是陷入囚徒困境。在现实中,要二互相竞争的公司达成合作协议是较为困难的,多数都会陷入囚徒困境中。 除了这些还有的很多类似的例子,比如说公共产品的提供,商家的价格战等等,在这里就不多赘述了。 五、“囚徒困境”现象的意义和启示 通过以上几个关于囚徒困境的例子,特别是作为经济管理学院的学生,我们可以将博弈论的一些知识运用好,更好的指导我们的经济生活。理论的重要意义在于类似的情况之下给人们社会经济生活带来指导。在经济发展中,我们应该认识到“看不见的手”还有更多内涵,有待我们去发掘。 本文主要通过对该理论的分析,从中发现对企业经营管理活动的有义启示。 第一,在市场竞争过程中,一名优秀的经营者,无论做任何决策还是考虑问题应该有战略眼观,特别是在做出对企业乃至行业今后发展的竞争策略时,从长远出发,做正确的决断。 第二,保存对手就是保存自己。在市场竞争中,让竞争对手发展就是自己发展,本着求同存异的思想,共谋发展,避免恶性竞争,避免两败俱伤的情况。 第三,市场竞争不是纯粹的竞争,在义和利之间应该如何取舍,是一位有战略眼观的企业家该做的第一个选择。 2杜兰:走出“囚徒困境”《通信企业管理》[J] 2003年第4期,第31页

博弈论基础作业及答案

博弈论基础作业及答案Last revision on 21 December 2020

博弈论基础作业 一、名词解释 纳什均衡占优战略均衡纯战略混合战略子博弈精炼纳什均衡 贝叶斯纳什均衡精炼贝叶斯纳什均衡共同知识 见PPT 二、问答题 1.举出囚徒困境和智猪博弈的现实例子并进行分析。 囚徒困境的例子:军备竞赛;中小学生减负;几个大企业之间的争相杀价等等; 以中小学生减负为例:在当前的高考制度下,给定其他学校对学生进行减负,一个学校最好不减负,因为这样做,可以带来比其他学校更高的升学率。给定其他学校不减负,这个学校的最佳应对也是不减负。否则自己的升学率就比其他学校低。因此,不论其他学校如何选择,这个学校的最佳选择都是不减负。每个学校都这样想,所以每个学校的最佳选择都是不减负,因此学生的负担越来越重。 请用同样的方法分析其他例子。 智猪博弈的例子:大企业开发新产品;小企业模仿;股市中,大户搜集分析信息,散户跟随大户的操作策略 以股市为例:给定散户搜集资料进行分析,大户的最佳选择是跟随。而给定散户跟随,大户的最佳选择是自己搜集资料进行分析。但是不论大户是选择分析还是跟随,散户的最佳选择都是跟随。因此如果大户和散户是聪明的,并且大户知道散户也是聪明的,那么大户就会预见到散户会跟随,而给定散户跟随,大户只有自己分析。 请用同样的方法分析其他例子。 2.请用博弈论来说明“破釜沉舟”和“穷寇勿追”的道理。 破釜沉舟是一个承诺行动。目的是要断绝自己的退路,让自己无路可退,让自己决一死战变得可以置信。也就是说与敌人对决时,只有决一死战,这样才可以取得胜利。否则,如果不破釜沉舟,那么遇到困难时,就很有可能退却,也就无法取得胜利。穷寇勿追就是要给对方一个退路,由于有退路,对方就不会殊死抵抗。否则,对方退无可退,只有坚决抵抗一条路,因而必然决一死战。自己也会付出更大的代价。

博弈论基础作业及答案【最新资料】

博弈论基础作业 一、名词解释 纳什均衡占优战略均衡纯战略混合战略子博弈精炼纳什均衡 贝叶斯纳什均衡精炼贝叶斯纳什均衡共同知识 见PPT 二、问答题 1.举出囚徒困境和智猪博弈的现实例子并进行分析。 囚徒困境的例子:军备竞赛;中小学生减负;几个大企业之间的争相杀价等等; 以中小学生减负为例:在当前的高考制度下,给定其他学校对学生进行减负,一个学校最好不减负,因为这样做,可以带来比其他学校更高的升学率。给定其他学校不减负,这个学校的最佳应对也是不减负。否则自己的升学率就比其他学校低。因此,不论其他学校如何选择,这个学校的最佳选择都是不减负。每个学校都这样想,所以每个学校的最佳选择都是不减负,因此学生的负担越来越重。 请用同样的方法分析其他例子。 智猪博弈的例子:大企业开发新产品;小企业模仿;股市中,大户搜集分析信息,散户跟随大户的操作策略 以股市为例:给定散户搜集资料进行分析,大户的最佳选择是跟随。而给定散户跟随,大户的最佳选择是自己搜集资料进行分析。但是不论大户是选择分析还是跟随,散户的最佳选择都是跟随。因此如果大户和散户是聪明的,并且大户知道散户也是聪明的,那么大户就会预见到散户会跟随,而给定散户跟随,大户只有自己分析。 请用同样的方法分析其他例子。 2.请用博弈论来说明“破釜沉舟”和“穷寇勿追”的道理。 破釜沉舟是一个承诺行动。目的是要断绝自己的退路,让自己无路可退,让自己决一死战变得可以置信。也就是说与敌人对决时,只有决一死战,这样才可以取得胜利。否则,如果不破釜沉舟,那么遇到困难时,就很有可能退却,也就无法取得胜利。穷寇勿追就是要给对方一个退路,由于有退路,对方就不会殊死抵抗。否则,对方退无可退,只有坚决抵抗一条路,因而必然决一死战。自己也会付出更大的代价。

工作中的博弈论与思考

工作中的博弈论与思考 这是一篇看最后面才有意思和意义的文章 今天在职场中遇到一件事,上面发下一个任务,需要几个人同时完成,一位同事做事效率很高,先于其它几位同事倍许的速度先完成其负责的部分工作,而其它人的工作还只进行了一半,新加入的同事则刚刚开始工作,尚在熟悉中。为了加快工作进度,我决定给效率高的同事再一分配其他人的一部分任务,以便以最快的时间完成工作。但是,这位同事先前已完成了其它人任务量的140%左右,再加量从感情上是难以接受的,并出现了抵触情绪,我个人也很难忍心再给其加工作量,不作休息,由此,我想到了很多。 在现实中,我们经常会发现在工作中许多同事都有自己善长和效率较高的工作能力,在从事同样工作时,会比他人有更高的效率(我们要感谢这些伟大的人带领我们,提供给我们贵的经验和学习的榜样),但一个人又不能单独完成全部工作(因为一个人单位效率再高,也不如人多一起干,而且会加长完成工作总时间),而在工作中我们又不能对每项工作中的效率高个体作出奖励(虽然绩效工资很常见,我个也比较倾向这种工作方式,但工作中不是每一件都绩效的),这就出现一个问题,当效率高的人先完成工作,而其它人未完成时,如果为了尽快完成总工作量,他会被分配更多的工作量,其个工作量会加大,在报酬相同情况

下,显然对其是不公平的,是一种对个体单位劳动力报酬的损失,降低自己的报酬。对于个人最好的选择就是停下来等他人完成工作,再一起进入下一项工作,其它人同样如此,在完成工作后会等待其它人的工作完成,以使自己不会比其他人做的更多,使自己的利益得到最大化。但我们也可看出,这样的等待加长了总工作时间,使任务完成总是以团队中效率最低的成员的效率为标准,这对所有团队成员也都是不利的,因为这会减少成员总的完成任务休息时间。 听到这里,我想大家已经想到了这是一个博弈论问题,当然,也有人不知道这个问题的,下面,我就摘录一些百度上的囚徒困境问题回顾和讨论一下。 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 若一人认罪并作证检控对方(相关术语称“背叛”对方),而对方保持沉默,此人将 即时获释,沉默者将判监10年。 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监1年。 若二人都互相检举(相关术语称互相“背叛”),则二人同样判监8年。 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都 寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何 情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝 监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人 的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚 徒会如何作出选择: 若对方沉默、背叛会让我获释,所以会选择背叛。 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛 是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参 与者都背叛对方,结果二人同样服刑8年。 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利 益而言,如果两个参与者都合作保持沉默,两人都只会被判刑1年,总体利益更高,结果 也比两人背叛对方、判刑8年的情况较佳。但根据以上假设,二人均为理性的个人,且只

基于博弈论的爱情浅析

基于经济学的爱情攻略浅析 摘要 随着市场经济的发展,人们对事物认知态度的变化,经济学的应用范围进一步扩大,人们的行事原则越来越趋向于经济学上的“理性”。就现状而言,经济学的分析不仅局限于某些领域,只要存在人类的社会活动,就存在经济,就存在资源合理配置问题,也就有经济分析的必要。谈恋爱是校园中的一个普遍现象,本文从经济学的视野中透视,爱情中的微观经济学问题,包括从预算线角度分析择偶以及爱情中的博弈关系,并试图以经济学的理论提出缓解和解决有关爱情现象问题的建议。 关键词:微观经济学;爱情;预算线;博弈论

Analysis based on the economics of love Raiders 【Abstract】:With the development of market economy, people's attitudes change perception of things, to further expand the scope of application of economics. More and more people tend to act on the principle of "rational" economics. On the current situation, the analysis is not limited to certain areas of economics. As long as the existence of human social activities, there is the economy. There is a reasonable allocation of resources, there is need for economic analysis. Love is a common phenomenon in the campus. This paper is from the perspective of economy. The love of microeconomics issues, including the budget line from the perspective of the relationship between mate and love the game, and tried to ease the economic theory proposed and recommendations to address issues related to the phenomenon of love. 【Key words】:Game theory; microeconomics; love; budget line

博弈论各章节课后习题答案 (4)

第四章谈判与协调 1.帕累托占优均衡和纳什均衡的关系是什么? 纳什均衡的基本思想是:每一个局中人选择一个策略,由所有局中人的策略构成了一个策略组合;在其它局中人选定策略不变的情况下,若某一个局中人单独地违背自己已选的策略,那么他的收益只会下降(或收益不会增加)。这样的策略组合构成一个均衡局势,并命名为纳什均衡。纳什均衡有纯策略的纳什均衡和混合策略的纳什均衡。一个博弈中有不止一个纳什均衡时,就构成一个多重纳什均衡问题。在多重纳什均衡下给出一些选择标准就得到一些特定的纳什均衡。其中帕累托占有纳什均衡是根据这样的选择标准选择的均衡。在博弈 中,若均为G 的其纳什均衡,若满足[,{},{}]i i G N S P =12,,,m s s s ????0 i s ?,0()()i i i j P s P s ?? >1,2,,,1,2,,i n j m ==??则称为博弈G 的帕累托占优纳什均衡。可见帕累托占有纳什均衡是纳什均衡中收益最大 0i s ? 的一种均衡。 2.分别找出具有下列性质的2人博弈的例子。 (1)不存在纯策略纳什均衡; (2)至少有两个纳什均衡,并且其中之一是帕累托占优均衡。 (1 )不存在纯策略的纳什均衡:该博弈不存在纯策略的纳什均衡 (2) 该博弈有三个纳什均衡:(战争,战争)、(和平,和平)和一个混合策略纳什均 衡。很显然,(和平,和平)是一个帕累托占优纳什均衡。 2525((,),(,77773.假设在某一产品市场上有两个寡头垄断企业,它们的成本函数分别为: TC 1=0.1q +20q 1+100000TC 2=0.4q +32q 2+20000 2122这两个企业生产一同质产品,其市场需求函数为:Q=4000-10p 。试分别基于古诺模型和纳什谈判模型求解两企业的利润。 解:由和400010Q p =?12 Q q q =+得124000.1() p q q =?+战争 和平国 家 1战争-5,-58,-10和平-10,810,10

博弈论与决策思维

《博弈论与决策思维》感想 这次很荣幸的去听了郑教授的《博弈论与决策思维》讲座,非常感谢浙江大学东方财智能给我提供的这次机会,听完这个课程之后,内心深处感受颇深,第一次觉得博弈思维是如此的精湛,更令人感叹的是郑教授教了我们在生活当中如何运用博弈思维来处理一些棘手的事。与我以前听过的所有精彩的课程相比,我只想说一句:教授不愧是教授,教授与老师的讲课方式与方法是截然不同的! 在整个博弈论课程演讲的过程中,郑教授都是用一些有趣的例子来引导大家在课堂上的互动,从而通过在例子上总结出来的一些启示来告诉大家,在生活当中遇到一些进退两的困境时,我们应当如何巧妙地运用博弈思维来思考问题,并让那些问题能得到妥善的处理。 如果就像宣读课本一样把那些道理说给大家听,把那些PPT画面一页页放给大家看的话,那效果肯定就犹如过眼云烟,但是郑教授说的每一点重点我们都会牢牢紧记!比如:田忌赛马,这是大家都知道的故事。大家都只知道田忌之所以赢了齐王是因为他改变了策略,然而改变策略视需要前提条件的:第一就是对方愚蠢,第二就是对方的信息的公知的。所以在现实生活中我们应该用全局、动静思维来考虑问题! 博弈分为很多种:换位思考、信任危机、收益问题、隐性激励、推理方式、、、、、其中有一点我记得最清楚的就是隐性激励。说的大概就是一个公司的上层不能什么事都必须是亲力亲为,应该对有些事松松手或者对于有些事假装不清楚,让下属自己拿主意,让他们以后做事能越来越有自信,在这个过程中能逐渐成长起来,正好验证了那句话“水至清则无鱼,人至察则无徒”! 不仅人与人之间存在博弈,物品之间也同样存在博弈,只不过换了一种说法。物品间的竞争是替代,合作就是互补。而市场决定着物品之间的关系,所以说博弈是无处不在的。郑教授所讲的博弈内容远不止这么点,用一句话来概括:只可意会不可言传。只有亲自去听了之后才会有那种突然觉自己的智慧一下子就升华了的感觉。 学会博弈论会让你活的更有智慧!

什么是博弈论博弈论的思考

什么是博弈论博弈论的思考 博弈论原是数学运筹中的一个支系,其研究运用了种种数学工具,大量的数学模型成了博弈论和我们普通人的生活之间的一条难以逾 越的鸿沟。面对这条鸿沟,很多人的反应是耸耸肩膀走开,少数人会企图通过学习数学来渡过。但是这两种反应都忽略了一个很浅显的道理:如同一个不会编程的人照样可以成为电脑应用高手,没有高深的数学知识,我们同样通过博弈论的学习成为生活中的策略高手。孙膑没有学过高等数学,但是这并不影响他通过运用博弈策略来帮助田忌赢得赛马。 有时候,科学并不一定意味着繁琐的计算与测量,而是一种有浓 厚艺术气息的思维方式。比如书中所讲述的一报还一报策略。 美国密西根大学一位叫做罗伯特?爱克斯罗德组织了一场计算机 模拟竞赛:任何想参加这个计算机竞赛的人都扮演“囚徒困境”案例中一个囚犯的角色。他们把自己的策略编入计算机程序,进行捉对博弈。他们每个人都要在合作与背叛之间做出选择。但与囚徒困境案例中有个不同之处:他们不只玩一遍这个游戏,而是以单循环赛的方式玩上200次。第一轮游戏有14个程序参加,其中包含了各种复杂的 策略。竞赛的桂冠属于一种被称为“一报还一报”的策略。这种神奇的一报还一报策略说起来很简单,简单到有些 __:第一步合作,此 后每一步都重复对方上一步的行为。如此简单的程序之所以反复获胜,

是因为它实行了以其人之道还治其人之身的原则,并且用如下特质使它能够最有效地鼓励其他程序同它长期合作:善良、可激怒、宽容、简单、不妒忌别人的成功。 在静态的群体中竞赛是这样一种状况,那么,在一个动态的进化 的群体中,这种合作策略能否产生、发展、生存下去呢?群体是会向合作的方向进化,还是向不合作的方向进化?如果大家开始都不合作,能否在进化过程中产生合作? 为了回答这些疑问,爱克斯罗德重新设计了一个实验,假设63个对策者中,谁在第一轮中的得分高,他在第二轮的群体中所占比例就越高,而且是他的得分的正函数。这样,群体的结构就会在进化过程中改变,由此可以看出群体是向什么方向进化的。 实验结果很有趣。一报还一报策略原来在群体中占1/63,经过1000代的进化,结构稳定下来时,它占了24%。因此,以合作系数来测量,群体是越来越合作的。这个结论还可以引申为:共同演化会使一报还一报的合作风格在充满背信弃义劣行的世界上蔚然成风。我 们可以用以上实验结果来对照一下商界的一句经典老话:商场如战场。商场如战场,就是说商业竞争的对手就是敌人,而对待敌人的办法在人类几千年来的历史上似乎只有一个,那就是把它干掉――或者通过消灭,或者通过吞并。胜利的定义是唯一的,那就是敌人必须一败涂

博弈论作业及答案 浙江财经大学 张老师作业答案

第1次作业 1、考虑一个工作申请的博弈。两个学生同时向两家企业申请工作,每家企业只有一个工作岗位。工作申请规则如下:每个学生只能向其中一家企业申请工作;如果一家企业只有一个学生申请,该学生获得工作;如果一家企业有两个学生申请,则每个学生获得工作的概率为1/2。现在假定每家企业的工资满足:W1/2

博弈论的读书笔记

博弈论的读书笔记 【篇一:博弈论读书笔记】 博弈论读书笔 博弈论 :亦名“对策论”、“赛局理论”,属应用数学的一个分支,主要研究公式化了的激励结构间的相互作用。是研究决策主体的行 为发生直接相互作用时候的决策以及这种决策的均衡问题,具有斗 争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优 化策略。 博弈论的目的在于巧妙的策略,而不是解法。我们学习博弈论的目的,不是为了享受博弈分析的过程,而在于赢得更好的结局。博弈 的思想既然来自现实生活,它就可以高度抽象化地用数学工具来表述,也可以用日常事例来说明,并运用到生活中去。没有高深的数 学知识,我们同样通过博弈论的学习成为生活中的策略高手。孙膑 没有学过高等数学,但是这并不影响他通过运行策略来帮助田忌赢 得赛马。 博弈时时存在,它就在你的身边。本书就是试图通过日常生活中常 见的例子,来介绍博弈论的基本思想及运用,并且寻求用种智慧来 指导生活决策的方法。 在李凌、王翔的《论博弈论中的策略思维》中,作者从博弈论的起 源谈起,回顾了博弈论在诺贝尔经济学奖上所取得的成就,把博弈 论中的经典案例同生活中的实际例子联系起来进行分析,从合作、 模仿、创新、拍卖、战争和群居等实例表明博弈论中的策略思维是 如何影响人们的行为的, 又是如何使得博弈达到均衡的。最后,围 绕演进博弈论的基础理论与实例案例来分析对传统博弈论的冲击, 及其使博弈论的发展上升到了一个新的阶段和深度。

! 以下是对这篇文章中的囚徒困境、智猪博弈和演进博弈论的简述和分析: 一、囚徒困境—合作还是不合作 在这个模型中,合作还是不合作问题得到了很好的解释,纳什均衡解就是都选择坦白,也就是跟对方囚徒不合作,但这个解对两个囚徒来说并不是帕累托最优解,囚徒困境反映了集体理性和个人理性的矛盾。联系到实际生活中的例子政府提供公共物品,如果让使用资源者自愿承担费用,则会由于搭便车现象的出现,而无法实现共同提供公共物品的目标,所以需要政府通过纳税的方式来提供,以实现帕累托最优,达到资源的有效配置。囚徒困境有限次重复博弈中,当一次性违约的收益大于失信所必须付出的代价时, 企业就存在偏离合同规 定行事的激励,这种内生的激励表明,“损人利己”也是行为人的理性选择。在无限次重复博弈中,如果企业之间致力于长期合作, 就应当设法改变合作机制, 降低合作企业发生机会主义行为的概率。除了健全社会诚信体系之外, 一种行之有效的方法便是提高失信成本。然而在实际生活中的局中人可能受各种外部环境因素或者市场地位的影响,并非是完全理性的,所以在合作方面还存在着一定的风险,这就需要订立合作契约,将这种风险最小化,从现实经济利益的角度提高失信成本,使失约威胁实现真正的可置信。 二、智猪博弈—创新还是模仿 在智猪博弈中,在理性人的假设下,大猪和小猪的支付矩阵决定了大猪选择按,小猪选择等待。类似的,在股票市场中,大户是大猪, 他们进行技术分析, 收集信息、预测股价走势, 所付出的成本高,而相应得到的收益也比较高,而大量散户就是小猪, 他们几乎不花成本去进行技术分析, 而是跟着大户的投资策略进行股票买卖, 这就是股票市场上著名的“散户跟大户”现象。在股份公司中, 大股东是大猪, 他们收集信息、监督经理, 拥有决定经理任免的投票权,

张维迎《博弈论与信息经济学》部分答案

张维迎《博弈论与信息经济学》部分习题答案 如果图片不显示,用打印预览就可以了。 P127 第一题:领悟精神就可以了,而且每本书上都有这些例题,不找了。 第二题: UMD 为参与人1的战略,LMR 为参与人2的战略。前面的数字代表参与人1的得益,后面的代表参与人2的得益。 参与人2的R 战略严格优于M 战略,剔除参与人2的M 战略,参与人1的U 战略优于M 战略,剔除参与人1的M 战略,参与人1的U 战略优于D 战略,剔除参与人1的D 战略,参与人2的L 战略优于R 战略,剔除参与人2的R 战略。最后均衡为U ,L (4,3)。这样可能看不清,按照步骤一步步画出图就好多了。 第三题:恩爱型 厌恶型 用划线法解出,恩爱的都活着或者都死,厌恶的或者受罪,死了对方另一个人开心的不得了。 第四题:没有人会选择比原来少的钱,战略空间为{原来的钱,比原来多的钱}。支付为{0,原来的钱,比原来多的钱}。纳什均衡为选择原来的钱。要画图自己画画。 第五题:n 个企业,其中的一个方程:π1=q 1(a -(q 1+q 2+q 3……q n )-c ),其他的类似就可以了,然后求导数,结果为每个值都相等,q 1= q 2=……q n =(a-c)/(n+1)。或者先求出2个企业的然后3个企业的推一下就好了。

第六题:在静态的情况下,没有一个企业愿意冒险将定价高于自己的单位成本C ,最终P=C ,利润为0。因为每个参与人都能预测到万一自己的定价高于C ,其他人定价为C 那么自己的利益就是负的(考虑到生产的成本无法回收)。就算两个企业之间有交流也是不可信的,最终将趋于P=C 。现实情况下一般寡头不会进入价格竞争,一定会取得一个P 1=P 2=P 均衡。此时利润不为零,双方将不在进行价格竞争。 第七题:设企业的成本相同为C ,企业1的价格为P 1,企业2的价格为P 2。 π1=(P 1-C)(a-P 1+P 2),π2=(P 2-C)(a-P 2+P 1)。一阶最优:a-2P 1+C+P 2=0,a-2P 2+C+P 1=0。 解得:P 1=P 2=a+C ,π1=π2=a 2。 第八题:不会! 到纳什均衡为(A,A,A),(A,B,A),(B,B,B),(A,C,C),(C,C,C)。 第十题: 无纯战略纳什均衡,设参与人1为P 1~P 4,参与人2为Q 1~Q 4。 得到:-Q 2+Q 4=Q 1-Q 3=Q 2-Q 4=-Q 1+Q 3,推出:Q 1=Q 2=Q 3=Q 4=1/4。同理P 1=P 2=P 3=P 4=1/4。以上述的概率在杆子,老虎,鸡,虫子中选择一个。

博弈论复习思考题.doc

博弈论复习题 1、静态博弈的三要素?动态博弈的?五要素? 参与人、策略(行动)、支付函数 参与人、每个参与人选择行动的时点、每个参与人在每次行动时可供选择的行动 集合、每个参与人在每次行动时有关过去行动选择的信息、支付函数在这里行动 和策略分开 2、博弈的分类及分类的标准。P4 按照参与人行动的先后顺序,分为静态博弈(博弈中,参与人同吋选择行动, 或虽非同时但后行动者并不知道前行动者采取了什么具体行动)呵动态博弈(只参与人行动有先后顺序,并且后行动者能观察出先行动者的行动选择)按照信息结构:参与人对有关其他参与人的特征、战略空间、支付函数的知识分为完全信息呵不完全信息。 3、给下列每一个博弈举出一?个生活屮的实例,并构建其矩阵式表述,进一步分 析它的纳什均衡。(1)智猪博弈;(2)情侣博弈;(3)斗鸡博弈; (4)囚徒困境;(5)零和博弈。 4、请准确地写出“纳什均衡”的定义,并举一个用矩阵图表示的实例,说明纳什 均衡战略形成的条件。 5、纳什均衡与西方经济学屮“一般均衡”有什么不同? 6、举出一?个优势均衡的实例和一?个非优势均衡的实例,并作适当的解释。 7、请分析海盗分宝问题。 8、寻找均衡的方法你会哪一?种?用你知道的方法举例予以解释。 9、请举例解释混合策略,给出矩阵图,计算其混合策略纳什均衡。P12 10、熟悉连续情形的纳什均衡的求解方法。P8 11、举例说明什么是共同知识。P9 12、帕累托优势是什么意思? 帕累托优势是博弈论屮一个非常有名的定理,它有一个准则,即帕累托效率准则:经济的效率体现于配置社会资源一改善人们情况,主要看资源是否己经被充分利用。如果资源已经被充分利用,要想再改善我就必须损害你或是别的什么人,要想再改善你就必须损害某个人。-?句话,要想在改善任何人都必须损害别人,这是后就说一?个经济已经实现了帕累托效率。 打个简单的比方:假设有AB两人,两个人分别做同一样工作吋收益为分别4,若两-人合作,每人收益都为10 很显然,两人合作所得(10 10)大于两人单独行动(44) 13、计算下列问题的纳什均衡:(1)库诺特产量纳什均衡;垄断条件下的企业 产量及收益;斯坦克尔伯格寡头竞争均衡;对比以上三种产量及收益,指出他们的差别及其蕴涵的意义。(3)不完全信息库诺特纳什均衡。 14、举例说明什么是先动优势,什么是后动优势,并用博弈论的知识加于解释。 15、为什么说“终生低价保证”是自动实施的制约机制? 16、用实例解释什么是期望收益? 17、纯策略纳什均衡与混合策略纳什均衡有什么不同? 18、指出重复博弈与序贯博弈的区别? 19、用囚徙困境博弈讨论有限次重复博弈问题和无限次重复博弈问题。懂得用贴

博弈论——换一种方式思考问题

博弈论——换一种方式思考问题 花了一个月的时间研究了下博弈论,收获很多,于是又花了一个礼拜写了这篇算是读后感的日志,希望能激起大家对博弈论的兴趣,尤其是几个经典博弈,真的很有意思。 ? 博弈论的内涵 什么是博弈论?简单的说,就是“互动的决策论”,指在充分考虑对方的决策后做出的决策。“博弈论”的英文是“”,所以博弈论最贴切的直译是“游戏理论”。 现代博弈理论由匈牙利大数学家冯·诺伊曼于世纪年代开始创立,对于冯·诺伊曼我们更为熟知的头衔是“计算机之父”,其实,他还有另一个身份,就是“博弈论之父”。年,他与经济学家奥斯卡·摩根斯特恩合作出版的巨著《博弈论与经济行为》,标志着现代系统博弈理论的初步形成。诺伊曼与摩根斯特恩认为,博弈论就是运用数学的方法研究有利益冲突的双方在竞争性活动中制定最优化策略的理论。 但是诺伊曼所解决的只有二人零和博弈,年,岁的纳什写下一篇著名的论文《多人博弈的均衡点》,提出了纳什均衡的概念和解法。这是整个现代博弈论中最重要的思想之一。相信很多人都知道纳什,因为那部经典的奥斯卡最佳影片《美丽心灵》,他传奇的人生,坚强的毅力,深深的打动了我。他在普林斯顿大学深造时,冯·诺伊曼正好在普林斯顿任教,那个时候的普林斯顿还聚集了众多著名的科学大师,包括罗伯特?奥本海默、诺曼·斯蒂恩罗德以及爱因斯坦,据说纳什曾经造访过爱因斯坦,向他讲述自己对于重力的看法。在一个小时的讨论之后,爱因斯坦对纳什说:“年轻人,你应该来学一点物理。” 年和年纳什的两篇关于非合作博弈论的重要论文,彻底改变了人们对竞争和市场的看法。他证明了非合作博弈及其均衡解,并证明了均衡解的存在性,即著名的纳什均衡。 表面上看,博弈论似乎是数学家玩的游戏,而事实上,博弈论首先是我们思考现实世界的一套逻辑,其次才是把这套逻辑严密化的数学形式,博弈论的目的在于巧妙的策略,而不是解法。我们学习博弈论的目的,不是为了享受博弈论的分析过程,而在于赢得更好的结局。说到底,博弈论只是一个分析问题的工具,用这个工具来简化问题,使问题的分析清晰明了就够了。 ? 博弈论的基本概念 首先我们需要了解的是纳什均衡。在某个房地产开发中,假定市场需求有限,只能满足某种规模的开发量,、两个开发商都想开发这一规模的房地产,如果选择开发,则的最优策略是不开发,同样,如果选择开发,则的最优策略是不开发。这时无论对还是,都不存在一种策略优于另一种策略,也不存在严格劣策略(不论其它人采取的策略,某人采取对自己不利的策略)。研究这类问题的均衡解,需要引入纳什均衡。 在纳什均衡中,每个参与人都确信,在给定其它参与人的策略情况下,己方选择了最优策略。所以在纳什均衡点上,每个参与者的策略都是最好的,此时没人愿意先改变或主动改变自己的策略。 在博弈论中,博弈行为都可以分为两类,即零和博弈与非零和博弈。零和博弈是一种完全对抗,强烈竞争的对局。参与者的总收益为零,因此一个参与者的所得必然是另一个参与者的损失。而非零和博弈,是各参与者的目标不完全对立,参与者只按本身的厉害关系单方面做出决策,有时为了共同利益而合作,有时为了个人利益而对立,收益的总和是可变的,参与者可以同时有所得和有所失。 在博弈论中,最基本的假设之一就是:人是理性的。所谓理性人是指行动者具有推理能

相关主题
文本预览
相关文档 最新文档