当前位置:文档之家› 区域经济合作的博弈论分析

区域经济合作的博弈论分析

区域经济合作的博弈论分析
区域经济合作的博弈论分析

博弈论案例分析

博弈论 博弈论(Game Theory),亦名―对策论‖、―游戏理论‖,属应用数学的一个分支,博弈论已经成为经济学的标准分析工具之一。目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。博弈论主要研究公式化了的激励结构间的相互作用。是研究具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。生物学家使用博弈理论来理解和预测进化论的某些结果。 博弈论是指某个个人或是组织,面对一定的环境条件,在一定的规则约束下,依靠所掌握的信息,从各自选择的行为或是策略进行选择并加以实施,并从各自取得相应结果或收益的过程,在经济学上博奕论是个非常重要的理论概念。 什么是博弈论?古语有云,世事如棋。生活中每个人如同棋手,其每一个行为如同在一张看不见的棋盘上布一个子,精明慎重的棋手们相互揣摩、相互牵制,人人争赢,下出诸多精彩纷呈、变化多端的棋局。博弈论是研究棋手们―出棋‖ 招数中理性化、逻辑化的部分,并将其系统化为一门科学。换句话说,就是研究个体如何在错综复杂的相互影响中得出最合理的策略。现在,我们就一些例子来讨论博弈论相关内容。 一、从“囚徒困境”开始 在博弈论中,含有占优战略均衡的一个著名例子是由塔克给出的―囚徒困境‖(prisoners’ dilemma)博弈模型。该模型用一种特别的方式为我们讲述了一个警察与小偷的故事。假设有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果一个犯罪嫌疑人坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪。如果另一个犯罪嫌疑人也作了坦白,则两人各被判刑8年;如果另一个犯罪嫌人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。下表给出了这个博弈的支付矩阵。 表囚徒困境博弈 [Prisoner's dilemma] 我们来看看这个博弈可预测的均衡是什么。对A来说,尽管他不知道B作何选择,但他知道无论B选择什么,他选择―坦白‖总是最优的。显然,根据对称性,B也会选择―坦白‖,结果是两人都被判刑8年。但是,倘若他们都选择―抵赖‖,每人只被判刑1年。在表2.2中的四种行动选择组合中,(抵赖、抵赖)是帕累托最优的,因为偏离这个行动选择组合的任何其他行动选择组合都至少会使一个人的境况变差。不难看出,―坦白‖是任一犯罪嫌疑人的占优战略,而(坦白,坦白)是一个占优战略均衡。 要了解纳什的贡献,首先要知道什么是非合作博弈问题。现在几乎所有的博弈论教科书上都会讲―囚犯的两难处境‖的例子,每本书上的例子都大同小异。 话说有一天,一位富翁在家中被杀,财物被盗。警方在此案的侦破过程中,抓到两个犯罪嫌疑人,斯卡尔菲丝和那库尔斯,并从他们的住处搜出被害人家中丢失的财物。但是,他们矢口否认曾杀过人,辩称是先发现富翁被杀,然后只是顺手牵羊偷了点儿东西。于是警方将两人隔离,分别关在不同的房间进行审讯。由地方检察官分别和每个人单独谈话。

博弈论与经济行为

博弈论与经济行为 博弈论已经成为整个社会科学特别是经济学的核心。萨缪尔森在他的经典教科书中曾引用过的短谚是:“你可以使鹦鹉成为训练有素的经济学家,所有它必须要学的只是两个词,供给和需求”——现在它们或许可换成“博弈”和“均衡”。 天才数学家冯诺伊曼(1904-1957)是“传奇中的传奇”。他是一个卓尔不群的数学天才,他几乎独立完成了这篇1200页的论文,进行史无前例的论述了“博弈论是一切经济学理论的正确基础”,为博弈论以后的发展打下了坚实的基础。 按照1998年诺贝尔经济学奖得主阿玛蒂亚森的看法,博弈论和社会选择理论是20世纪社会科学最主要的成就。 到目前为止,我们对经济活动的考察没有考虑人们之间的相互影响。其实,一个人的行为总是受到他人行为的影响。人们在追逐自己利益时,难免要与他人发生利益冲突或矛盾,于是就出现了各种各样的问题,比如如何克服和解决人们之间的利益冲突,如何才能实现一种既能让每个人都实现自己的利益,又能让每个人都不妨碍和伤害他人利益的互利互惠的和谐局面,显而易见,这些问题的解决并非易事,于是就出现了博弈论。它为解决这些问题提供了有力工具。博弈论以人的理性为基本假定,强调策略性——一种普遍的行为现象。这种现象的广阔背景是市场中的竞争与合作。20世纪80年代以来,博弈论在经济学中得到了广泛应用,在揭示经济行为的相互影响和制约方面取得了重大进展。大部分经济活动都可以用博弈论加以解释,甚至连市场调节与宏观调控这样的重大问题,都可看成博弈现象来研究。 下边列举两个故事,来简单说明一下。 1. 智猪博弈的故事猪圈里有一大一小两头猪,猪圈一边装有踏板,踩一下,远离踏板的食槽端就会落下食物。若一猪去踩踏板,另一猪就会等在槽边抢先吃到

博弈论在经济学中的应用

博弈论在经济学中的应用 刘肃素 (华中师范大学经济与工商管理学院 2011211086) 摘要:博弈论是研究策略博弈的数学理论,亦称对策论。它的作用在于发现普遍有效的博弈原则。在现代经济社会中充满了博弈,这就需要了解博弈的思想,用科学理论来指导行为。博弈论应用于经济学,已经和正在引起现代经济学一系列的发展和突破。博弈论在经济学中所取得的重大进展发现,博弈论方法越来越成为经济学研究的主流方法。随着博弈论在现代经济学中的运用和研究的深化以及经济复杂性现象的不断涌现,博弈论的经济学研究呈现出合作化、对称化和连续化的发展新趋势。 关键词:博弈论经济学对策论应用 Abstract:game theory is the mathematical theory of research strategy game, which is also called game theory. It is found that the average effective principles of game. In the modern economic society is full of game, this game, you need to understand in a scientific theory to guide behavior. Game theory is applied to economics, has been and is causing a series of modern economics development and breakthrough. Major progress was made in the game theory in economics, found that the game theory method is becoming the mainstream in the economics research method. With

博弈论经典案例分析

博弈论经典案例分析 囚徒困境 案例:警察把甲乙分开关押,并在提审时分别告之,如果你坦白而他不坦白,那么你将只判0年,他将被判8年;如果你不坦白而他坦白,那么你判8年,他判0年;如果你们两人都坦白了,各判5年;如果你们两人都不坦白了,各判1年。 分析:每个博弈方选择自己的策略时,虽然无法知道另一方的实际选择,但他却不能忽视另一方的选择对他自己的得益的影响,因此他应该考虑到另一方有两种可能的选择,并分别考虑自己相应的最佳策略。对囚徒A 来说,囚徒B 有坦白和不坦白两种可能的选择,假设囚徒B 的选择是不坦白,则对囚徒A 来说,不坦白得益为-1,坦白得益为0,他应该选择坦白; 假设囚徒B 选择的是坦白,则囚徒A 不坦白得益为-8,坦白得益为-5,他还是该选择坦白。因此,在此博弈中,无论囚徒B 采取何种策略囚徒A 的选择只有一种,即坦白,因为在另一方两种可能的情况下,坦白给自己带来的得益都是较大的。同样的道理,囚徒B 的唯一的选择也是坦白。 所以最可能的结局:该博弈的最终结果是两博弈方同选择坦白策略。 其支付矩阵如下: 性格大战 案例:一对恋人准备在周末晚上一起出去,男的喜欢看足球,但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。 分析:可以看出,分开将使他们两人得不到任何满足,只要在一起,不管是看时装表演还是看足球,两人都会得到一定的满足。但看足球将使男的得到更大的满足,看时装表演则使女的得到更大的满足。 在这样的一个对局中,男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择,一旦对方选定了某一项活动,另一个人选择同样的活动就是最好的策略。因此,如果男的已经买好了足球的门票,女的当然就不再反对;反之,如果女的已经买好了时装表演票,男的也就会与她一起看时装表演。 1,1 8, 0 不坦白 0,8 5,5 坦白 嫌疑犯乙 不坦白 坦白 嫌疑犯甲 1,2 -1, -1 时装 0,0 2,1 足球 男 时装 足球 女

博弈论基础作业及答案

博弈论基础作业 一、名词解释 纳什均衡占优战略均衡纯战略混合战略子博弈精炼纳什均衡 贝叶斯纳什均衡精炼贝叶斯纳什均衡共同知识 见PPT 二、问答题 1.举出囚徒困境和智猪博弈的现实例子并进行分析。 囚徒困境的例子:军备竞赛;中小学生减负;几个大企业之间的争相杀价等等; 以中小学生减负为例:在当前的高考制度下,给定其他学校对学生进行减负,一个学校最好不减负,因为这样做,可以带来比其他学校更高的升学率。给定其他学校不减负,这个学校的最佳应对也是不减负。否则自己的升学率就比其他学校低。因此,不论其他学校如何选择,这个学校的最佳选择都是不减负。每个学校都这样想,所以每个学校的最佳选择都是不减负,因此学生的负担越来越重。 请用同样的方法分析其他例子。 智猪博弈的例子:大企业开发新产品;小企业模仿;股市中,大户搜集分析信息,散户跟随大户的操作策略 以股市为例:给定散户搜集资料进行分析,大户的最佳选择是跟随。而给定散户跟随,大户的最佳选择是自己搜集资料进行分析。但是不论大户是选择分析还是跟随,散户的最佳选择都是跟随。因此如果大户和散户是聪明的,并且大户知道散户也是聪明的,那么大户就会预见到散户会跟随,而给定散户跟随,大户只有自己分析。 请用同样的方法分析其他例子。 2.请用博弈论来说明“破釜沉舟”和“穷寇勿追”的道理。 破釜沉舟是一个承诺行动。目的是要断绝自己的退路,让自己无路可退,让自己决一死战变得可以置信。也就是说与敌人对决时,只有决一死战,这样才可以取得胜利。否则,如果不破釜沉舟,那么遇到困难时,就很有可能退却,也就无法取得胜利。穷寇勿追就是要给对方一个退路,由于有退路,对方就不会殊死抵抗。否则,对方退无可退,只有坚决抵抗一条路,因而必然决一死战。自己也会付出更大的代价。

博弈论分析

中美军备竞赛的博弈分析 1.理论介绍 1.1博弈论的概念 博弈论(Game Theory),亦名“对策论”、“赛局理论”,属应用数学的一个分支,博弈论已经成为经济学的标准分析工具之一。目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。博弈论主要研究公式化了的激励结构间的相互作用。是研究具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。 1.2博弈论的主要特点 博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。表面上不同的相互作用可能表现出相似的激励结构(incentive structure),所以他们是同一个游戏的特例。其中一个有名有趣的应用例子是囚徒困境悖论(Prisoner's dilemma)。 具有竞争或对抗性质的行为成为博弈行为。在这类行为中,参加斗争或竞争的各方各自具有不同的目标或利益。为了达到各自的目标和利益,各方必须考虑对手的各种可能的行动方案,并力图选取对自己最为有利或最为合理的方案。比如日常生活中的下棋,打牌等。博弈论就是研究博弈行为中斗争各方是否存在着最合理的行为方案,以及如何找到这个合理的行为方案的数学理论和方法。 1.3博弈的分类 博弈的分类根据不同的基准也有不同的分类。一般认为,博弈主要可以分为合作博弈和非合作博弈。合作博弈和非合作博弈的区别在于相互发生作用的当事人之间有没有一个具有约束力的协议,如果有,就是合作博弈,如果没有,就是非合作博弈。 从行为的时间序列性,博弈论进一步分为静态博弈、动态博弈两类:静态博弈是指在博弈中,参与人同时选择或虽非同时选择但后行动者并不知道先行动者采取了什么具体行动;动态博弈是指在博弈中,参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。通俗的理解:"囚徒困境"就是同时决策的,属于静态博弈;而棋牌类游戏等决策或行动有先后次序的,属于动态博弈。 按照参与人对其他参与人的了解程度分为完全信息博弈和不完全信息博弈。完全博弈是指在博弈过程中,每一位参与人对其他参与人的特征、策略空间及收益函数有准确的信息。不完全信息博弈是指如果参与人对其他参与人的特征、策略空间及收益函数信息了解的不够准确、或者不是对所有参与人的特征、策略空间及收益函数都有准确的信息,在这种情况下进行的博弈就是不完全信息博弈。 目前经济学家们现在所谈的博弈论一般是指非合作博弈,由于合作博弈论比非合作博弈论复杂,在理论上的成熟度远远不如非合作博弈论。非合作博弈又分为:完全信息静态博弈,完全信息动态博弈,不完全信息静态博弈,不完全信息动态博弈。与上述四种博弈相对应的均衡概念为:纳什均衡(Nash equilibrium),子博弈精炼纳什均衡(sub game perfect Nash equilibrium),贝叶斯纳什均衡(Bayesian Nash equilibrium),精炼贝叶斯纳什均衡(perfect Bayesian Nash equilibrium)。 博弈论还有很多分类,比如:以博弈进行的次数或者持续长短可以分为有限博弈和无限博弈;以表现形式也可以分为一般型(战略型)或者展开型等等。 1.4纳什均衡 纳什均衡的定义:在博弈G=﹛S1,…,Sn:u1,…,un﹜中,如果由各个博弈方的各一个策略组成的某个策论组合(s1*,…,sn*)中,任一博弈方i的策论si*,都是对其余博弈方

博弈论与行为经济学论文

深圳大学考试答题纸 (以论文、报告等形式考核专用) 二○一四~二○一五学年度第二学期 课程编号8001510001 课程名称博弈论与行为经济学主讲教师评分 学号姓名专业年级 题目:高考志愿博弈 转眼又一年高考了,然而各地高考和报志愿的顺序并不相同,2014年以前北京为先报志愿再高考,其他大部分地区都为先出成绩再报志愿,还有个别地区为高考完后估分报志愿。然而高考过后总有一部分人过高估算自己的成绩而没有被大学录取,当然也有不少的考生原本可以上更好的大学,却因他们的保守估算而失去更好的机会,所以大学开学后,总有一些学生放弃入学资格未报到,或者入学后对学校各方面的不满意,学习兴趣大减,沉迷游戏或半路辍学重新高考。 而发生这些情况的原因是什么呢,我们应该怎样改进高考报志愿的方式呢,这是我接下来要讨论的话题。 填报志愿的时候大部分人都认同考得好不如报得好,实质上考生填志愿时都在进行一场不完全信息的静态博弈。 在先报志愿再高考的方式中 由图中可知考生报考志愿时,不考虑大家集中式填报某一学校的情况下,填超出自己水平的院校只有在自己超水平发挥时才能被录取,报适合自己自己水平的志愿时,超水平发挥和正常发挥都可以被录取,填报低于自己水平的志愿时,无论怎样发挥都可被录取。填报超出自己水平的志愿虽然有可能被高于自己水平的院校录取,但落榜的风险很大,很可能得不偿失,填报低于自己水平的院校时,虽然肯定能考上大学,但过于保守,失去了很多更好的机会,所以填报适合自己水平的志愿更合适,虽然失去了拼搏更好的院校的机会,但保障了适合自己水平的院校。所以最终因志愿目标过高未被录取和填报低于自己水平志愿被录取的考生都是博弈中的失败者。 而先报志愿再高考的方式劣于先出成绩再填志愿的方式,因先填报志愿再高考比先出成绩再填志愿多了更多的不确定性,考生无法预知高考时的发挥水平,增大了考生目标过高落榜和因保守不能上更好的院校的机率。假设高校根据考生的成绩而确定其能被录取的机率为X,先出成绩再填志愿的方式中,考生能被录取的机率就是X,而在先填志愿再高考的方式中,首先高校根据考生的成 第1页共3页

浅析价格战中的博弈论

价格战中博弈论的浅析 2011-2012学年第一学期 课程名称:博弈论 班级:10物流治理(采购与供应链1班) 学号:1040407122 姓名:曾维乐

二〇一一年十二月十八日 价格战中的博弈论浅析 摘要:博弈论研究互动决策行为,大多数时候是研究对抗性行为,但并不是所有的对抗行为。博弈论是运筹学的一个重要分支,类型众多。本文在简要介绍了博弈论相关内容的基础上,重点介绍了纳什均衡。通过案例,充分运用囚徒困境、智猪博弈、反向归纳法等进行分析,从而得出在经济决策中行为人如何决定最优决策的方法。在此基础上,结合博弈论相关知识,分析解决经济生活中的一些实际问题。如:针对商家的价格战问题。

关键词:囚徒困境懦夫博弈安全博弈纳什均衡 一、理论介绍 1、博弈论简介 博弈论(game theory),也称对策论,它是运筹学的一个重要分支,是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题,简单讲来确实是一些个人或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自同意选择的行为或策略中进行选择并加以实施,各自取得相应结果的过程。 从上述定义中能够看出,一个完整的博弈一般由以下几个要素组成:博弈的参加者,各博弈方各自选择的全部策略或行为的集合、博弈方的得益(得益矩阵)、结果、均衡等。 1、参与人指的是博弈中选择行动以最大化自己效用的决策主体(能够是个人,也能够是团体)。 2、行动是指参与人在博弈进程中轮到自己选择时所作的某个具体决策。 3、策略是指参与人选择行动的规则,即在博弈进程中,什么情况下选择什么行动的预先安排。 4、信息指的是参与人在博弈中所明白的关于自己以及其他参与人的行动、策略及其得益函数等知识。 5、得益是参与人在博弈结束后从博弈中获得的效用,一般

用博弈论分析生活中的现象

上海第二工业大学 2012-2013学年第二学期 用博弈论分析生活现象论文

博弈论分析生活中现象 博弈论它较好地解决了对竞争等问题的可操作性分析,成为经济学中激荡人心的一个研究领域,主要是研究各相关行为主体的决策行为相互影响、相互作用的假定条件下,博弈论就是分析博弈行为和博弈决策的一门科学。其实博弈现象不只现身于经济领域对于我们日常生活中也是处处可见的,所以博弈论的思想不仅仅能够用来分析经济从而获得最大的盈利,我们也可以尝试将博弈论的思想运用到生活实践中从而获得最优的策略。 比如某一天你觉得应该是你女朋友的生日,但又不能肯定,如果是女朋友的生日的话,你可以送一束花,女朋友会特别高兴,你不送花,女朋友会埋怨你忘了她的生日如果不是女朋友的生日的话,你可以送女朋友一束花女朋友感到意外的惊喜,你不送花结果生活同往常一样。 生日非生日 买花 1 ,1 2 ,1 不买花-1,-1 0 ,0 确定今天是女朋友的生日或确定今天不是女朋友的生日,但你的最好行动都是买花。 谈到博弈论我们不得不说到囚徒困境,其内容大致为两名罪犯A 和B隔离审讯。如果两个都不招,因为证据不充分,两人都只能判1年。如果一方招了,属立功表现,功罪相抵,无罪释放;而另一方则属抗拒从严,判10年刑但如果两人都招了,则各判 5 年。结果大家都知道:两个人争先恐后地招了,结结实实地各判了5年。两个犯

人陷入的就是囚徒困境, A B 招不招 招 5 ,5 无罪释放,10 不招10,无罪释放 1 ,1 其结果就是A和B都招,判5年刑。如果两人协商后选择不招,但如果A或B其中一人招了,另一人就会判10年,而招的一人就会无罪释放,这样的诱惑足以让两名罪犯违背两人协议。而选择招。这样最有可能就是俩人都招。 人际交往中的博弈 人与人之间的相互矛盾和相互冲突的关系实际上就是一种博弈关系。矛盾冲突的结果也有三种情况负和游戏、零和游戏和正和游戏。“负和游戏”是一种两败俱伤的游戏故也称为双输博弈。在人与人的交往时由于相互的冲突和矛盾不能达到统一交际双方都不让步,最后使交际活动不能展开,结果是交际的双方都从中受损两败俱伤。如果是朋友,也会因不断发生“负和游戏”而逐渐疏远,夫妻间经常出现“负和”现象感情自然会受到影响。交际中之所以经常会发生“负和博弈”现象,大多是因为心胸狭窄,遇事爱使性负气,必然会出现“负和”局面。如果不使性负气,而是互相谅解,与人交往采取合作态度,便能使有矛盾和冲突的交际活动朝好的方向发展。在交际中如果遇到了和交际对象发生冲突的时候能够想着退一步海阔天高,采取一种和对方合作的态度就一定能避免交际中“负和游戏”的发生。至于“零和游戏”这种简单的“你输我赢”的思考方式往往会给人们带来更大的麻烦。其实在人与人之间的交往中双方的关系并不是简单

博弈论案例分析

(1)失火了,你往哪个门跑 失火了,你往哪个门跑——这就是博弈论 一天晚上,你参加一个派对,屋里有很多人,你玩得很开心。这时候,屋里突然失火,火势很大,无法扑灭。此时你想逃生。你的面前有两个门,左门和右门,你必须在它们之间选择。但问题是,其他人也要争抢这两个门出逃。如果你选择的门是很多人选择的,那么你将因人多拥挤、冲不出去而烧死;相反,如果你选择的是较少人选择的,那么你将逃生。这里我们不考虑道德因素,你将如何选择?这就是博弈论! 你的选择必须考虑其他人的选择,而其他人的选择也考虑你的选择。你的结果——博弈论称之为支付,不仅取决于你的行动选择——博弈论称之为策略选择,同时取决于他人的策略选择。你和这群人构成一个博弈(game)。 上述博弈是一个叫张翼成的中国人在1997年提出的一个博弈论模型,被称之为少数者博弈或少数派博弈(Minority Game)。当然,原来的博弈形式不是这么简单,这里我把它简化了,我们在第三部分论述归纳推理时还要谈这个博弈模型。现在很多学者在研究这个问题。 生活中博弈的案例很多,你会见到很多例子。只要涉及到人群的互动,就有博弈。 什么叫博弈?博弈的英文为game,我们一般将它翻译成“游戏”。而在西方,game的意义不同于汉语中的游戏。在英语中,game即是

人们遵循一定规则下的活动,进行活动的人的目的是使自己“赢”。奥林匹克运动会叫Olympic Games。在英文中,game有竞赛的意思,进行game的人是很认真的,不同于汉语中游戏的概念。在汉语中,游戏有儿戏的味道。因此将关于game的理论,即game theory翻译成博弈论或者对策论,是恰当的。本书下面统称game theory为博弈论。 博弈论的出现只有50多年的历史。博弈论的开创者为诺意曼与摩根斯坦,他们1944年出版了《博弈论与经济行为》。诺意曼是着名的数学家,他同时对计算机的发明作出了巨大贡献,他去世时博弈论还未对经济学产生广泛影响,否则经济学的诺贝尔奖肯定有他的名字,因为诺贝尔奖有规定,只颁发给在世的学者。谈到博弈论,不能忽略博弈论天才纳什(John Nash)。纳什的开创性论文《n人博弈的均衡点》(1950)、《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。今天博弈论已发展成一个较完善的学科。 博弈论对于社会科学有着重要的意义,它正成为社会科学研究范式中的一种核心工具,以至于我们可称博弈论是“社会科学的数学”,或者说是关于社会的数学。从理论上讲,博弈论是研究理性的行动者(agents)相互作用的形式理论,而实际上它正深入到经济学、政治学、社会学等等,被各门社会科学所应用。甚至有学者声称要用博弈论重新改写经济学。1994年经济学诺贝尔奖颁发给三位博弈论专家:纳什、塞尔屯、哈桑尼(),而像1985年获得诺贝尔奖的公共选择学派的领导者布坎南,1995年获得诺贝尔奖的理性主义学派的领袖卢

浅谈经济博弈论

浅谈经济博弈论 姓名:李欣航学号:20081065 班级:02310802 人生如梦亦如戏,游戏人生,就要猜透别人怎么想,博弈论就是告诉你怎么跟人打交道,如何参透别人的心思。同时,用博弈论观照一些所谓的千古美谈,会发现那其实是无稽之谈。比如诸葛亮,其实远非司马懿之对手。 从一则故事说起,这个故事需要动点脑筋。 有五个海盗,劫掠了100两金子,需要分赃。办法是抓阄,盗亦有道。 抓到第一个阄的人,可以先提出一个分配方案,如果他的方案被一半以上的人同意,就照他的方案分金子,否则,第一个人就要被杀掉。余下的人也照此办理。 我们的问题是:如果你是第一个人,你会提出怎样的分配方案? 为了分析问题更确定,我们假定每个人都是追求自己利益极大化的人。

可能你会提出平均分配,每人20两,或者自己不要,等等。 可是正确的答案却并非如此。第一个人会说:“100两金子全归我!” 而且这个方案一定会被一半以上的人同意,这个人不会被杀掉。 这个问题比较复杂,当遇到复杂的问题时,我们可以从最后的环节开始考虑,这样,可以使问题清晰起来。 那我们就从抓到最后一个阄的人开始考虑。对于这个人来说,他知道,当轮到他提方案的时候,其他人都已经死掉了,金子将全是他一个人的。所以,他利益最大化行为便是,不管前边谁,包括第一个人,提了任何方案,他都一概摇头,不同意。 再看第四个人,他知道,不管自己提出什么方案,第五个人都不会同意,都会被杀掉,所以,他的利益最大化行为是,尽量不要轮到自己提方案。所以,不管第一个人提了怎样的方案,他都会表示同意。

第三个人,知道第四和第五个人的选择策略,所以,他的利益最大化的方案是100两金子全归自己。这个方案,因为自己和第四个人同意,超过了此时的一半以上的人的同意,可以行得通,所以,不管第一个人提出什么样的方案,第三个人都会反对。 第二个人,知道自己提什么方案,第三个人、第五个人都将反对,一旦轮到自己提,自己就死定了,所以,他会同意第一个人提出的任何方案,这是他的利益最大化行为。 所以,不管第一个人提出怎样的方案,第二个人与第四个人都会同意,加上第一个人自己的票,就是三票,一半以上,可以通过。 既然任何方案都可以通过,而第一个人又要追求自己利益的极大化,所以,他的方案是:100两金子全归自己。 这个例子告诉我们,想问题,确实需要方法论,靠直觉是不可以的,直觉在很多情况下是错误的,必须依靠方法,依靠逻辑的力量。 很多问题看起来没有头绪,是因为没有找到解决问题的路径,而方法的作用,就是帮我们找到切入点,找到了切入点,问

价格战中博弈论的浅析

价格战中博弈论的浅析

价格战中博弈论的浅析 2011-2012学年第一学期 课程名称:博弈论 班级:10物流管理(采购与供应链1班) 学号:1040407122 姓名:曾维乐 二〇一一年十二月十八日

价格战中的博弈论浅析 摘要:博弈论研究互动决策行为,大多数时候是研究对抗性行为,但并不是所有的对抗行为。博弈论是运筹学的一个重要分支,类型众多。本文在简要介绍了博弈论相关内容的基础上,重点介绍了纳什均衡。通过案例,充分运用囚徒困境、智猪博弈、反向归纳法等进行分析,从而得出在经济决策中行为人如何决定最优决策的方法。在此基础上,结合博弈论相关知识,分析解决经济生活中的一些实际问题。如:针对商家的价格战问题。 关键词:囚徒困境懦夫博弈安全博弈纳什均衡 一、理论介绍 1、博弈论简介 博弈论(game theory),也称对策论,它是运筹学的一个重要分支,是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题,简单说来就是一些个人或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,各自取得相应结果的过程。 从上述定义中可以看出,一个完整的博弈一般由以下几个要素组成:博弈的参加者,各博弈方各自选择的全部策略或行为的集合、博弈方的得益(得益矩阵)、结果、均衡等。 1、参与人指的是博弈中选择行动以最大化自己效用的决策主体(可以是个人,也可以是团体)。 2、行动是指参与人在博弈进程中轮到自己选择时所作的某个具体决策。 3、策略是指参与人选择行动的规则,即在博弈进程中,什么情况下选择什么行动的预先安排。 4、信息指的是参与人在博弈中所知道的关于自己以及其他参与人的行动、

博弈论经典案例与分析

博弈论的经典案例与分析 囚徒困境 案例:警察把甲乙分开关押,并在提审时分别告之,如果你坦白而他不坦白,那么你将只判0年,他将被判8年;如果你不坦白而他坦白,那么你判8年,他判0年;如果你们两人都坦白了,各判5年;如果你们两人都不坦白了,各判1年。 分析:每个博弈方选择自己的策略时,虽然无法知道另一方的实际选择,但他却不能忽视另一方的选择对他自己的得益的影响,因此他应该考虑到另一方有两种可能的选择,并分别考虑自己相应的最佳策略。对囚徒A来说,囚徒B有坦白和不坦白两种可能的选择,假设囚徒B的选择是不坦白,则对囚徒A来说,不坦白得益为-1,坦白得益为0,他应该选择坦白; 假设囚徒B选择的是坦白,则囚徒A不坦白得益为-8,坦白得益为-5,他还是该选择坦白。因此,在此博弈中,无论囚徒B采取何种策略囚徒A的选择只有一种,即坦白,因为在另一方两种可能的情况下,坦白给自己带来的得益都是较大的。同样的道理,囚徒B 的唯一的选择也是坦白。 所以最可能的结局:该博弈的最终结果是两博弈方同选择坦白策略。 其支付矩阵如下: 性格大战 嫌疑犯乙

案例:一对恋人准备在周末晚上一起出去,男的喜欢看足球,但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。 分析:可以看出,分开将使他们两人得不到任何满足,只要在一起,不管是看时装表演还是看足球,两人都会得到一定的满足。但看足球将使男的得到更大的满足,看时装表演则使女的得到更大的满足。 在这样的一个对局中,男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择,一旦对方选定了某一项活动,另一个人选择同样的活动就是最好的策略。因此,如果男的已经买好了足球的门票,女的当然就不再反对;反之,如果女的已经买好了时装表演票,男的也就会与她一起看时装表演。 价格战 案例:假设市场中仅有A 、B 两家企业,每家企业可采取的定价策略都是10元或15元,我们可以得出得益矩阵如下: 分析:无论对企业A 还是企业B 来说,低价都是他们的占优战略。从表可见,企业A 的占优战略是10元,因为无论B 采取什么战略,企业A 都能获取比定价15元更多的利润。 如果企业B 定价10元,企业A 定价10元能够获利80万元,而定价15元只能获得30万元;如果企业B 定价15元,企业A 定价10元可获利170万元,而定价15元却只能获利120万元。同样地,企业B 的占优战略也是定价10元的策略。 企业B 男

博弈论的经典案例与分析

博弈论的经典案例与分析 囚徒困境 案例:警察把甲乙分开关押,并在提审时分别告之,如果你坦白而他不坦白,那么你将只判0年,他将被判8年;如果你不坦白而他坦白,那么你判8年,他判0年;如果你们两人都坦白了,各判5年;如果你们两人都不坦白了,各判1年。 分析:每个博弈方选择自己的策略时,虽然无法知道另一方的实际选择,但他却不能忽视另一方的选择对他自己的得益的影响,因此他应该考虑到另一方有两种可能的选择,并分别考虑自己相应的最佳策略。对囚徒A 来说,囚徒B 有坦白和不坦白两种可能的选择,假设囚徒B 的选择是不坦白,则对囚徒A 来说,不坦白得益为-1,坦白得益为0,他应该选择坦白; 假设囚徒B 选择的是坦白,则囚徒A 不坦白得益为-8,坦白得益为-5,他还是该选择坦白。因此,在此博弈中,无论囚徒B 采取何种策略囚徒A 的选择只有一种,即坦白,因为在另一方两种可能的情况下,坦白给自己带来的得益都是较大的。同样的道理,囚徒B 的唯一的选择也是坦白。 所以最可能的结局:该博弈的最终结果是两博弈方同选择坦白策略。 其支付矩阵如下: 性格大战 案例:一对恋人准备在周末晚上一起出去,男的喜欢看足球,但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。 分析:可以看出,分开将使他们两人得不到任何满足,只要在一起,不管是看时装表演还是看足球,两人都会得到一定的满足。但看足球将使男的得到更大的满足,看时装表演则使女的得到更大的满足。 在这样的一个对局中,男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择,一旦对方选定了某一项活动,另一个人选择同样的活动就是最好的策略。因此,如果男的已经买好了足球的门票,女的当然就不再反对;反之,如果女的已经买好了时装表演票,男的也就会与她一起看时装表演。 1,1 8, 0 不坦白 0,8 5,5 坦白 嫌疑犯乙 不坦白 坦白 嫌疑犯甲 1,2 -1, -1 时装 0,0 2,1 足球 男 时装 足球 女

经济博弈论论文

博弈论及其在现代经济生活中的应用 工造3班 魏XX [摘要]:本文从“囚徒困境模型”和“智猪博弈模型”两个方面来阐述博弈论及其 在现代经济生活中的运用。 [关键词]:博弈论囚徒困境模型智猪博弈模型应用 [正文]: 有一个典型的案例:甲乙两人合伙作案,结果被警察抓了起来,分别被隔离 审讯。在不能互通信息的情形下———也就是不知道对方是坦白还是缄默的前提 下,每个嫌疑犯都可以作出自己的选择:或者供出同伙,即与警察合作,从而背 叛同伙;或者保持沉默,也就是与同伙合作,而不是与警察合作。这样会出现以 下几种情况:如果两人都不坦白,警察会因证据不足而将两人各判刑! 年;如果 一人招供而另外一人不招,坦白者作为证人将不会被起诉,另一人将会被重判!" 年;如果两人都招供,则会因罪名成立各判!# 年。这两个嫌疑犯该怎么办呢? 是选择合作还是互相背叛?从表面上看,他们应该互相合作,保持沉默,因为这 样对他们整体而言是最好的结果———都只判!年。但是他们不得不仔细考虑对 方可能采取的选择。问题就这样开始了,两个人都十分精明,而且只关心减少自 己的刑期,并不会在乎对方被判多少年。每个人都会这样推理:假如对方不招, 我只要一招供,马上可以获得自由,而不招却要坐牢! 年,显然招比不招好;假 如对方招了,我若不招,则要坐牢!" 年。招了只要坐牢!# 年,显然还是招更好 些。可见,对方无论招或者不招,我的最佳选择都是招认。两个人都会基于同样 的想法作出招供的选择,这对他们个人来说都是最佳策略,但对整体而言却是一 个最差的结果。 这就是博弈论的一个经典模型———“囚徒困境模型”。作为一种关于决策和 策略的理论,博弈论其实就在我们身边,它研究的许多例子来自于日常生活和经 济活动中的游戏和事物。 博弈的英文即,中文译为“博弈”是非常传神和贴切的,因为中国古代称下棋 为“弈”,“博”则含有争斗的意思。在下棋这样的游戏中有一个重要的特点:即策 略在其中起着举足轻重的影响和作用。精明慎重的棋手们相互揣摩、相互牵制, 人人争赢,布每一个棋子时,都必须考虑到对手的策略选择,从而选择自己的最 佳策略。这也就是博弈的核心问题:决策主体的一方行动后,参与博弈的其他人 将会采取什么行动?参与人为取得最佳效果应采取怎样的对策?我们可以将博 弈论定义为:一些个人、一些团队或其他组织,面对一定的环境条件,在一定的 规则约束下,依靠所掌握的信息,同时或先后,一次或多次,从各自允许选择的 行为或策略进行选择并加以实施,并从中各自取得相应结果或收益的过程。博弈 论是(# 世纪四五十年代发展起来的。美国经济学家冯?诺依曼与奥斯卡?摩根斯特 恩于!)**年合著的《博弈论与经济行为》被公认为博弈论诞生的标志。 博弈论可以分为合作博弈理论和非合作博弈理论。前者主要强调的是集体理 性;而后者主要研究人们在利益相互影响的局势中如何选择策略使自己的收益最 大,强调的是个人理性。所谓“个人理性”是反映个体的行为始终都是以实现自身 的最大利益为惟一目标,除非是为了实现自身利益的需要,否则不会考虑其他的 个体或社会利益这样一种决策原则。非合作博弈要求各参与人之间不能存在任何

对孙子兵法博弈论分析

对《孙子兵法》的博弈论分析 《孙子兵法》是一部以战争为研究对象,包括对策智慧、对策原则、对策类型、对策方法在内的系统而完整的对策及策略兵书。战争存在 着相互对立的两方,“对策”是作战双方相互制约、相互作用的一种策略选择。因此,《孙子兵法》作为一部对策及策略全书,不仅具有“博 弈”的某些基本特征,而且还构成了单方完全信息下的零和动态博弈模型。 如果从博弈的思维方式出发,《孙子兵法》是以“智”为基础,以“计”为核心,以“谋”为最高境界(最优化),在“计”与“谋”的 应用中来完成单人博弈的最优化过程的。所谓的“计”,可以理解为“对策”,它包括了各种不同环境和条件下的“对策”选择。所谓的“谋 ”,可以理解为一种最优化的境界或状态,它既是“计”的结果,又是高于“计”的选择。 一、“智”与信息不对称 博弈是指一些个人、队组面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并 付诸实施,从中取得相应结果的过程。博弈方拥有的信息越多,即对决策的环境条件了解得越多,决策的正确性就越高,得益自然也就越好。 博弈中,最重要的信息之一就是关于得益的信息。在博弈论中,通常把各博弈方都完全了解所有博弈方各种情况下得益的博弈,称为“具 有完全信息的博弈”。而将至少存在部分博弈方不完全了解其他博弈方得益情况的博弈,称为“具有不完全信息的博弈”。 信息是决策的前提,不仅不同的信息及不同的信息拥有量影响决策的结果,而且信息完全与否也影响决策的选择。尤其在单人博弈的模型 中,信息就是决策。因为在一个单人博弈的框架中,信息越多,即对决策的环境了解的越多越充分,决策的正确性就越高(“计”的针对性就 越强),得益也就越好(“计”的效果就越好)。因此,信息的数量和准确性,就成了“决策”的关键。尽管《孙子兵法》中没有信息的字样 ,但信息对称是“知彼知己”的重要内涵。“知彼知己,百战不殆”的含义可以理解为:对自己和对方的信息掌握,是取得战争胜利的保障。 在任何情况下,信息及对信息的把握都是取得战争胜利的前提和保障。 然而,获取信息是需要支付成本的,在经济学中人们把这种成本的支付称为交易费用,它通常是以价值的形态表现出来的。但在《孙子兵 法》中,包含准确判断力和丰富经验的“智”,是获得信息并进而克服信息不对称,甚至制造信息不对称的无形成本。因此,可以把《孙子兵 法》中的“多算胜,少算不胜”中的“算”理解为“智”或“智慧判断”。即多动用智慧以获取更多的信息,是取得战争胜利的保障。而信息 缺乏或不对称,从而无法正确地制定、选择对策,则是战争失败的根本原因。

1.3.7 博弈论分析方法的主要特征

博弈论分析方法的主要特征 博弈论已形成一套完整的思想体系和方法论体系。其分析方法具有下列特征: 1. 研究对象的普遍性和应用范围的广泛性 人们的行为之间存在相互作用与相互依赖,不同的行为主体及其不同的行为方式所形成的利益冲突与合作,已成为一种普遍现象,这使博弈论的研究对象具有普遍性。一切涉及到人们之间利益冲突与一致的问题、一切关于竞争或对抗的问题都是博弈论的研究对象。 现实社会中广泛存在的合作与非合作博弈、完全信息与不完全信息博弈的事实,使博弈论的研究内容和应用范围十分广泛,涉及到政治学、社会学、伦理学、经济学、生物学、军事学等诸多领域,在经济学中的应用尤为突出。 2. 研究方法的模型化、抽象化以及涉及学科的综合性 一是运用数学模型来描述所研究的问题,使博弈论的分析更为精确。 二是研究方法具有抽象化的特征,由于博弈论分析大量使用了现代数学,使它所描述和分析的过程及所揭示的结论都带 有抽象、一般化的特点。 三是博弈论分析方法所体现的模式化特征,博弈论为人们提供了一个统一的分析框架或基本范式,从而使博弈论能够分 析和处理其它数学工具难以处理的复杂行为,成为对行为主 体间复杂过程进行建模的最适合的工具。

四是博弈论方法所涉及的学科的综合性。在博弈论分析中,不仅要应用现代数学的大量知识,还涉及到经济学、管理学、 心理学和行为科学等学科。 3. 研究方法的实证性与研究结论的真实性 博弈论中的最佳策略是经济学意义上的最优化,它只回答是什么导致博弈均衡,均衡的结果是什么,所遵循的基本原则是科学结论的客观性和普遍性。从实践上看,博弈论突破了传统的完全竞争、完全信息假定,更加强调决策者的个人理性,强调不完全信息、不完全竞争条件下的经济分析,强调决策个体之间的相互影响和相互作用等外部性,强调通过规则、机制和制度的设计和优化在个人理性得到满足的基础上达到个人理性和集体理性的一致,等等。作为一门方法论科学,除了提供分析和解决博弈问题的独特和新颖的具有战略思维的思想方法以外,还提供了更加贴近现实的分析工具并填补了传统经济分析的许多空白。从这个意义上说,博弈论方法具有实证的特征,使研究结果更具有真实性。

耶鲁大学公开课博弈论课习题

耶鲁大学公开课:博弈论 习题集1(第1-3讲内容) Ben Polak, Econ 159a/MGT522a. 由人人影视博弈论制作组Darrencui翻译 1.严格劣势策略与弱劣势策略:严格劣势策略的定义是什么?弱劣势策略的定义是什么?请用 一个包含两个参与人的博弈矩阵来举例说明,要求其中一个参与人有三个策略且三者之一为严格 劣势策略;另一个参与人有三个策略但三者之一为弱劣势策略。请指出你所举例子中的劣势策略。 2.迭代剔除(弱)劣势策略:请看下面的博弈 2 (a). 这个博弈中是否存在严格劣势策略和弱劣势策略?如果存在,请指出并说明。 (b). 剔除掉严格劣势策略和弱劣势策略之后,在简化的博弈中是否还有劣势策略呢?如果是,请指出并说明。最后哪些策略不会被剔除呢? (c). 回顾你第一次剔除劣势策略时哪些策略是劣势策略并给出解释。把它与第二次剔除的劣势策略作比较。从中你能得出关于迭代剔除劣势策略的何种结论? 3. 霍特林的选址博弈(也称霍特林模型):回顾一下课堂中所讲的选票博弈。其中有两个参与人,每个参与人都从集合* +中选出自己的立场。这十个立场均分全部的选票。选民把选票投给与自己立场最接近的候选人。如果两个候选人站在同一个立场上,那么持该立场选民 的选票平均分给每个候选人。候选人想要最大化自己的得票率。举例来说,()。而 () [提示:回答这道题时不必画出整个矩阵] (a).课堂中我们指出立场2严格优于立场1,而实际上还有其它的立场也是严格优于立场1的,请找出所有优于立场1的立场并作出解释。 (b).假设现在有三名候选人。举例来说,()而()。此时立场2是否严格优于立场1?立场3呢?请作出解释。另外,假设我们剔除了立场1和10,但是该立场的选票依然存在。在简化的博弈中,立场2是否严格劣于或弱劣于其它(纯)策略?请作出解释。

历史的制度分析:博弈论分析方法

历史的制度分析:博弈论分析方法 把博弈论作为研究方法和分析工具应用于经济体制与制度问题的研究,目前主要有两种方法。一种是“进化博弈论方法”(evolutionary game approach)。经济学中的进化博弈论是在生物学的进化博弈论的基础上产生、发展起来的。它将人类的经济活动和竞争性经济行为同生物的进化相类比,研究人类经济行为中的策略和行为方式的均衡,以及向均衡状态调整、收敛的过程与性质。采用这一方法的研究者认为,社会制度并不是由什么人有意设计出来的,而是在那些适应环境和社会变化的新的制度结构不断被发现、更为理想的制度结构不断被保存的过程中产生的。这就是所谓的“适应性进化”过程。进化博弈论的引入,就是为了分析和说明社会制度的这一适应性进化过程。进化博弈论之所以在制度变迁理论中受到重视,主要是因为它是在不严重依赖决策者计算能力的前提下来说明均衡选择过程,从而在纳什均衡的理性主义解释遇到理论困难时,显示出了通过进化机制实现纳什均衡的可能性。 应用博弈论研究制度变迁的另一种新方法是“重复博弈论方法”(repeated game approach),它运用更精细的均衡概念,如“子博弈精炼均衡”(subgame perfect equilibrium)来分析历史与现实中的制度选择与变迁过程。其中最具代表性的,就是格瑞夫进行的“历史的比较制度分析”。 所谓的重复博弈,实际上是指同样结构的博弈重复地进行多次。与一次性博弈不同,它是由若干个阶段博弈(stage game)构成的一个完整的和相对长期的博弈过程。因此,在重复博弈中,各博弈方的着眼点就不是其在某一阶段上的局部利益或短期利益,而是他们在整个博弈过程中的总体利益和长期利益。当各博弈方面对不同的策略选择时,他必须考察到其在当前阶段的博弈中所采取的策略,不致在随后阶段中引起其他博弈方的对抗、报复或恶性竞争。也就是说,他不能像在一次性博弈中那样,毫不顾及其他博弈方的利益。有时,一方若作出一种合作姿态,可能会使其他博弈方在随后的阶段中也采取合作态度,从而实现共同的长远利益。这样,在重复博弈中就存在着比一次性博弈更大的合作的可能性,也有可能实现比一次性博弈更有效率的均衡。重复博弈论的这一特征,为它说明人类之间的合作行为,特别是说明历史与现实社会中体制与制度的演变过程,提供了强有力的支持。 在历史的比较制度分析那里,制度被定义为本身是“自我实施的对行为的非技术决定的约束” ,即所谓的自我实施制度(self-enforcing institution )。自我实施制度的一个最基本的特征,就是它的自发产生和自我实施的性质。与那些由国家和法律强制实施的制度不同,自我实施制度必须是参与人各方经过协商、谈判、讨价还价后自愿达成一致的结果。因此,历史的比较制度分析将自我实施制度视为特定历史条件下制度博弈的一种均衡状态或均衡结果。自我实施制度产生的过程,也就是制度博弈各方在特定的战略局势中,根据自己不同的目标自主地选择各自的最优策略与对手进行博弈,最后求得制度均衡的过程。而所谓的“子博弈精炼均衡”,恰恰是指在构成动态博弈的所有子博弈阶段上都实现了纳什均衡。这就是说,一个子博弈精炼均衡,必须是各博弈方在整个博弈的每个阶段(子博弈)都选择了不愿单独改变的策略(纳什均衡)的最终结果。如果我们从博弈论的角度来观察自我实施制度,就会发现自我实施制度与子博弈精炼均衡之间的内在联系。简单地说,自我实施制度所具有的自发产生和自我实施的基本属性,说明了它必定是制度博弈各方在每个子博弈中都选择了不愿单独改变的最优策略的结果,也即实现子博弈精炼均衡的结果。更直接地说,自我实施制度的产生,必定是一个制度博弈实现了子博弈精炼均衡的结果。反过来说,如果一个制度博弈实现了子博弈精炼均衡的结果,那它也应该是自我实施的。

相关主题
文本预览
相关文档 最新文档