当前位置:文档之家› 博弈论纳什均衡

博弈论纳什均衡

博弈论纳什均衡

什么是纳什均衡?

1、纳什均衡(Nash equilibrium ),又称非合作博弈均衡,是博弈论概念,指的是:

一种博弈稳定结果,谁单方改变策略,谁就会损失。

两个囚徒互相揭发,就是一种纳什均衡。

对于每个囚徒来说,如果打破纳什均衡,在对方实施揭发策略时,改变揭发策略,保持沉默,自己就会由判刑2年,变成判刑5年。

也就是说,两个囚徒互相揭发是稳定博弈结果,谁单方改变策略,就会受到损失。

这也就是均衡涵义所在,两个囚徒从利己角度,都不会单方改变策略。博弈策略稳定,博弈结果也稳定。

之所以命名为纳什均衡,是因为提出者是经济学家、博弈论创始人约翰.纳什。

之所以称为非合作博弈均衡,原因就是:两个囚徒如果合作,互相保持沉默,各自只要坐牢1年;但最终博弈结果,也就是纳什均衡显著特

征,是不合作。

2、纳什均衡意义重大。

纳什均衡提出,震动整个经济学界。

诺贝尔经济学奖得主萨缪尔森曾说:“你只要教会鹦鹉说‘需求和供给’,它也是经济学家。”博弈论专家坎多瑞则说:“这只鹦鹉现在必须多学一个词了,那就是‘纳什均衡’。”

诺贝尔经济学奖得主迈尔森也说:“发现纳什均衡意义,可以和生命科学中发现DNA 双螺旋结构相媲美。”

纳什也因为提出纳什均衡,创立博弈论,而获得1994年诺贝尔经济学家奖。

纳值均衡意义重大,简单来说,就是它对于经济学具有重大意义。

读友们如果了解经济学看不见的手原理,就知道,古典经济学认为,通过市场这只‘看不见的手’调节,个体追求私利行为,会促进集体利益最大化。

但纳什均衡却违反上述原理:两个囚徒分别追求私利行为,并没有促进集体(囚徒整体)利益最大化,反而是损人不利己。

这正是市场失灵软肋之处,通过博弈论视角可以得到合乎逻辑解释,更有条件找到合适解决方案。从上述这点,读友们可以“一斑窥全豹”,感受到博弈论重要性。

更重要的是,纳什均衡非常普遍,小至个人沟通,中到公司竞争,大到国家往来,都可以观察到。

Q2:怎样运用纳什均衡?

1、分析囚徒困境。

如上所述,囚徒困境纳什均衡结果是,两个囚徒互相揭发。发生这个过程并不难理解:

先从心理学视角分析,由于两人相互隔离,彼此无法传递信息、做好串供,就会怀疑对方会出卖自己以求自保。

再从经济学视角分析,囚徒都是“理性经济人”,遵循看不见的手原理,会从利己角度进行选择:

假如他坦白,如果我沉默,得坐5年监狱;如果我坦白,最多才2年;假如他要是沉默,如果我也沉默,我就会被判1年;如果我坦白,就可以被释放,而他会坐5年牢。

综合来说,不管对方坦白与否,对我而言,都是坦白划算。

由于两个囚徒都是这么想,那么,最终都会被判坐牢2年。也就是说,“都坦白”,是囚徒困境中唯一稳定的“纳什均衡”。

从囚徒困境这个案例,我们可以看到:在一个博弈过程中,无论对方策略选择如何,当事人一方都会选择某个确定策略。那么,这个确定的策略就被称作支配性策略。

如果两个博弈当事人策略组合,分别构成各自支配性策略,那么这个组合就被定义为纳什均衡。这是纳什均衡更准确定义。

如果要应对囚徒困境,获得集体利益最优,要从博弈论视角,也就是运用数学思维来归因,我们会发现两个原因:

第一,背叛诱惑,合作报酬。

合作报酬是判刑1年,背叛诱惑却是立即释放。这使得“都不坦白”不构成稳定纳什均衡。

第二,受骗支付,背叛惩罚。

背叛惩罚是判刑2年,受骗支付却是判刑5年。这使得“都坦白”构成稳定纳什均衡。

从博弈论视角理解囚徒困境原理,解决方案也就不难得到,意即:让合作报酬>背叛诱惑;让背叛惩罚,受骗支付。

比如说,警匪片中的黑帮,如果一个黑帮份子入狱,帮内就会让人带话:会照顾好你家里人,并且在你出狱后给你一大笔钱。

如果入狱黑帮份子因为坦白而获释,那么,黑帮的人就会安排刺杀,有仇必报。这就是让合作报酬>背叛诱惑。

比如说,黑帮会塑造“忠义文化”,在心理上增加“背叛惩罚”:如果你不讲义气,那么,整个黑社会江湖都会唾弃你,让你出狱后找不到工作。这就是增加背叛惩罚。

如果你被出卖,黑帮除了给钱,和帮你赡养家人之外,还会安排追杀出卖你的人,帮你报仇。这就是减少受骗支付。一增一减,就是让背叛惩罚>受骗支付。

这其实就是通过制度设计,将不期望看到的纳什均衡,变成期望看到的纳什均衡。

类似的,两家公司合作,为了避免互相猜疑,都不投入,也可以采用上述原则。例如,可以签署违约条款,让单方违约付出足够成本,使得共同投入,变成唯一稳定纳什均衡。

2、分析智猪博弈。

我们再来看博弈论界另一个经典博弈案例,就是智猪博弈。

智猪博弈说的是,猪圈很长,一头是一个踏板,另一头是一个食槽。如果在这一头踩下踏板,那一头的食槽就会掉下10份食物。

猪圈里面,有一只大猪,一只猪。不管谁去踩踏板,都要消耗相当于2份食物能量。

如何踩踏板,有4种情况:

第一种是,大猪小猪都守在食槽边,等着对方去踩踏板。这样,谁也没得吃。

第二种是,大猪小猪同时踩踏板,然后同时跑向食槽,同时吃。大猪比较能吃,吃了7份食物,减去跑步消耗2份体能,实得5份;小猪吃

3份,实得1份。

第三种是,大猪守着食槽不动,小猪跑去踩踏板。这时大猪能吃得更多,独得9份,而且因为没有运动,实得9份;小猪踩完踏板跑到食槽边,就只能吃到1份,减去跑步消耗2份体能,实得﹣1份。

第四种是,小猪守着食槽不动,大猪跑去踩踏板。这时小猪抢先,能吃到4份,实得4份;大猪跑回来,还能抢到6份,实得4份。

对上述4种情况进行分析,智猪博弈中纳什均衡是:大猪踩踏板,小猪不动。

原因在于,如果大猪单方面改变策略,不去踩踏板,策略组合将变为“大猪不动,小猪不动”,大猪获益将从4减为0,大猪不会这么做。

如果小猪单方面改变策略去踩踏板,策略组合将变为“大猪踩踏板,小猪踩板”,小猪获益将从4减为1,小猪也不会做。

所以,“大猪踩踏板,小猪不动”,各自获益4份食物,是一个稳定纳什均衡。

读友们如果对搭便车问题有印象,就会发现,智猪博弈中,小猪就是搭大猪踩踏板便车,不劳而获。

这与囚徒困境不同,两名囚徒各自心怀鬼胎,但是一荣俱荣、一损俱损,最后纳什均衡就是一损俱损体现。但在智猪博弈中,小猪明显占

优。

工作和生活中,有很多类似小猪这样搭便车行为。

例如,小房地产商,在大品牌房地产商项目周围拿地,等生地炒熟,让自己项目升值。

例如,小公司等待大公司花费巨资研发,在新市场推出盈利模式被验证产品,再从中找一个细分市场,搭便车分蛋糕。

例如,发展中国家制定“跟随型国家战略”,在科技、产、创新上“搭便车”,由瘦变胖,由小变大。

当然,搭便车有好有坏,如果理解智猪博弈纳什均衡,就可以针对性提出解决方案,鼓励好的搭便车,减少坏的搭便车。

例如,智猪博弈中,养猪的人(第三方)规定,在食槽里锁定一块区域,给踩到踏板的猪独享。这样,大猪就不用担心,自己出力,到了食槽却发现食物被抢光。

类似的,国家设计专利保护制度目的,允许专利在一定时期内能获得特权,也是激励人和组织去创新,而不是等着搭便车。

在制度完善时,小猪、懒猪或者是慢猪,就会发现守在食槽等待,就不是“占优”博弈策略,也会努力去踩踏板。

纳什均衡

纳什均衡简介 纳什均衡,又称为非合作博弈均衡,是博弈论的一个重要术语,以 约翰·纳什命名。在一 个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,则该策略被称作支配性策略。如果两个博弈的当事人的策略组 合分别构成各自的支配性策略,那么这个组合就被定义为纳什均衡。 一个策略组合被称为纳什均衡,当每个博弈者的均衡策略都是为了达到自己期望收益的最大值,与此同时,其他所有博弈者也遵循这样的策略。 纳什均衡的得来 关于纳什均衡的普遍意义和存在性定理的证明等奠定非合作博弈理论发展基础的重要成果,是约翰·纳什在 普林斯顿大学攻读博士学位时完成 的。实际上,博弈论的研究起始于1944年冯·诺依曼( Von Neumann)和 奥斯卡·摩根斯坦 (Oscar Morgenstern)合著的《博弈论和经济行 为》。然而却是纳什首先用严密的数学语言和简明的文字准确地定义了纳什均衡这个概念,并在包含“混合策略(mixed strategies)”的情况下, 证明了纳什均衡在n人有限博弈中的普遍存在性,从而开创了与诺依曼和摩根斯坦框架路线均完全不同的“非合作博弈(Non-cooperative Game)”理论,进而 对“合作博弈 (Cooperative Game)”和“ 非合作博弈”做了明确 的区分和定义。阿尔伯特·塔克(Albert tucker)教授评价其论文,“这是对博弈理论的高度原创性和重要的贡献。它发展了本身很有意义的n人有限非合作博弈的概念和性质。并且它很可能开拓出许多在两人零和问题以外的,至今尚未涉及的问题。在概念和方法两方面,该论文都是作者的独立创造。” 纳什均衡例子 博弈论中一个著名的例子就是囚徒困境。 囚徒困境是一个 非零和博弈,说的是两个嫌疑犯 甲和乙私人民宅联手作案,被警方逮住但未获证据。警方于是将两个嫌疑犯分开审讯。警官分别告诉 两个囚犯,如果你招供,而对方不招供,则你将被判刑3个月,对方将被判刑10年;若两人都不招供则因未获证据但私人民宅将各拘留1年;如果两人均招供,每人将被判刑5年。于是,两个人同时陷入招供还是不招供的两难处境。结果是,尽管甲不知乙是否招供,但他认为自己选择“招供”最好,因而甲会选择“招供”,同样乙也会选择“招供”,两人各判5年。而两人都选择不招供,虽证据不足但因私人民宅将各拘留1年的结果是不会出现的。 博弈矩阵囚犯甲 招供不招供 囚犯乙招供判刑五年 甲判刑十年;乙判刑三个月 不招供

博弈论和纳什均衡

博弈论和纳什均衡 博弈论是一门研究决策者在特定情境下进行策略选择的学科,它主要研究个体或团体之间的冲突与合作关系,并提供一种分析和解决这些问题的方法。在博弈论中,纳什均衡是一个非常重要的概念,它被广泛应用于社会科学、经济学、政治学、生物学等领域。 一、博弈论的基本概念 1. 博弈 博弈是指在特定情境下,两个或多个决策者进行策略选择的过程。每个决策者都有自己的目标和利益,他们通过选择不同的策略来达到自己的目标。 2. 策略 策略是指在博弈中每个决策者可以采取的行动方案。每个决策者根据自己的利益和目标选择最优的行动方案。 3. 支配策略

支配策略是指在某种情况下,一个决策者采取某种行动方案时,其他 所有决策者都会采取同样的行动方案。这种情况下,该行动方案被称 为支配策略。 4. 纳什均衡 纳什均衡是指在博弈中,每个决策者都采取最优的策略,且没有任何 一方可以通过改变自己的策略来获得更多的利益。在纳什均衡下,每 个决策者都做出了最优的选择,整个博弈过程达到了一个稳定状态。 二、纳什均衡的应用 1. 社会科学 在社会科学领域中,纳什均衡被广泛应用于研究人类行为和社会现象。例如,在政治学中,研究政治家之间的竞争和合作关系时可以使用博 弈论模型,并通过计算纳什均衡来预测政治家们可能采取的行动。 2. 经济学 在经济学领域中,博弈论和纳什均衡被广泛应用于市场竞争分析、价 格战、拍卖等问题。例如,在拍卖中,参与者可以根据自己的信息和 目标选择不同的出价策略。通过计算纳什均衡,可以预测最终获胜者

以及他所支付的价格。 3. 生物学 在生物学领域中,博弈论和纳什均衡被用于研究动物之间的竞争和合作关系。例如,在动物群体中,个体之间会存在资源的竞争和合作,通过使用博弈论模型并计算纳什均衡,可以预测不同类型的动物在不同情境下采取的行动。 三、纳什均衡的局限性 虽然纳什均衡在博弈论中被广泛应用,并且在很多情况下能够提供准确的预测结果,但是它也存在一些局限性。 1. 纳什均衡不一定是唯一的 在某些情况下,博弈模型可能存在多个纳什均衡。例如,在囚徒困境博弈中,存在两个纳什均衡:双方都选择背叛和双方都选择合作。这种情况下,无法确定哪种策略会被采取。 2. 纳什均衡可能不稳定 有些博弈模型中可能存在非稳定的纳什均衡。例如,在石头剪刀布游

博弈论与纳什平衡

博弈论与纳什平衡 博弈论(game theory)对人的基本假定是:人是理性的(rational,或者说自私的),理性的人是指他在具体策略选择时的目的是使自己的利益最大化,博弈论研究的是理性的人之间如何进行策略选择的。 纳什(John Nash)编制的博弈论经典故事"囚徒的困境",说明了非合作博弈及其均衡解的成立,故称"纳什平衡"。 所有的博弈问题都会遇到三个要素。在囚徒的故事中,两个囚徒是当事人(players)又称参与者;当事人所做的选择策略(strategies)是承认了杀人事实,最后两个人均赢得(payoffs)了中间的宣判结果。如果两个囚徒之中有一个承认杀人,另外一个抵赖,不承认杀人,那么承认者将会得到减刑处理,而抵赖者将会得到最严厉的死刑判决,在纳什故事中两个人都承认了犯罪事实,所以两个囚徒得到的是中间的结果。 类似的:我们也能从“自私的基因”等理论中看到“纳什平衡”的体现。 在互联网这个原始丛林中:最优策略是如何产生的呢? 一、博弈中最优策略的产生 艾克斯罗德(Robert Axelrod)在开始研究合作之前,设定了两个前提:一、每个人都是自私的;二、没有权威干预个人决策。也就是说,个人可以完全按照自己利益最大化的企图进行决策。在此前提下,合作要研究的问题是:第一、人为什么要合作;第二、人什么时候是合作的,什么时候又是不合作的;第三、如何使别人与你合作。 社会实践中有很多合作的问题。比如国家之间的关税报复,对他国产品提高关税有利于保护本国的经济,但是国家之间互提关税,产品价格就提高了,丧失了竞争力,损害了国际贸易的互补优势。在对策中,由于双方各自追求自己利益的最大化,导致了群体利益的损害。对策论以著名的囚犯困境来描述这个问题。 A和B各表示一个人,他们的选择是完全无差异的。选择C代表合作,选择D代表不合作。如果AB都选择C合作,则两人各得3分;如果一方选C,一方选D,则选C的得零分,选D的得5分;如果AB都选D,双方各得1分。 显然,对群体来说最好的结果是双方都选C,各得3分,共得6分。如果一方选C,一方选D,总体得5分。如果两人都选D,总体得2分。 对策学界用这个矩阵来描述个体理性与群体理性的冲突:每个人在追求个体利益最大化时,就使群体利益受损,这就是囚徒困境。在矩阵中,对于A来说,当对方选C,他选D得5

博弈论纳什均衡

博弈论纳什均衡 什么是纳什均衡? 1、纳什均衡(Nash equilibrium ),又称非合作博弈均衡,是博弈论概念,指的是: 一种博弈稳定结果,谁单方改变策略,谁就会损失。 两个囚徒互相揭发,就是一种纳什均衡。 对于每个囚徒来说,如果打破纳什均衡,在对方实施揭发策略时,改变揭发策略,保持沉默,自己就会由判刑2年,变成判刑5年。 也就是说,两个囚徒互相揭发是稳定博弈结果,谁单方改变策略,就会受到损失。 这也就是均衡涵义所在,两个囚徒从利己角度,都不会单方改变策略。博弈策略稳定,博弈结果也稳定。 之所以命名为纳什均衡,是因为提出者是经济学家、博弈论创始人约翰.纳什。 之所以称为非合作博弈均衡,原因就是:两个囚徒如果合作,互相保持沉默,各自只要坐牢1年;但最终博弈结果,也就是纳什均衡显著特 征,是不合作。 2、纳什均衡意义重大。 纳什均衡提出,震动整个经济学界。

诺贝尔经济学奖得主萨缪尔森曾说:“你只要教会鹦鹉说‘需求和供给’,它也是经济学家。”博弈论专家坎多瑞则说:“这只鹦鹉现在必须多学一个词了,那就是‘纳什均衡’。” 诺贝尔经济学奖得主迈尔森也说:“发现纳什均衡意义,可以和生命科学中发现DNA 双螺旋结构相媲美。” 纳什也因为提出纳什均衡,创立博弈论,而获得1994年诺贝尔经济学家奖。 纳值均衡意义重大,简单来说,就是它对于经济学具有重大意义。 读友们如果了解经济学看不见的手原理,就知道,古典经济学认为,通过市场这只‘看不见的手’调节,个体追求私利行为,会促进集体利益最大化。 但纳什均衡却违反上述原理:两个囚徒分别追求私利行为,并没有促进集体(囚徒整体)利益最大化,反而是损人不利己。 这正是市场失灵软肋之处,通过博弈论视角可以得到合乎逻辑解释,更有条件找到合适解决方案。从上述这点,读友们可以“一斑窥全豹”,感受到博弈论重要性。 更重要的是,纳什均衡非常普遍,小至个人沟通,中到公司竞争,大到国家往来,都可以观察到。 Q2:怎样运用纳什均衡? 1、分析囚徒困境。 如上所述,囚徒困境纳什均衡结果是,两个囚徒互相揭发。发生这个过程并不难理解:

博弈论中的均衡

博弈论中的均衡 一、博弈论的定义 博弈论是研究决策者之间相互影响的一种数学工具。它主要关注的是 在决策者之间存在相互作用和相互依存的情况下,如何做出最优决策。 二、博弈论中的均衡概念 均衡是博弈论中一个重要的概念。它指的是在一个博弈中,每个参与 者都采取了最优策略,并且没有任何一个参与者能够通过改变自己的 策略来获得更多的收益。 三、纳什均衡 纳什均衡是博弈论中最为常见和重要的均衡概念之一。它指的是在一 个非合作博弈中,每个参与者都采取了最优策略,并且这些最优策略 构成了一个稳定状态,即没有任何一个参与者能够通过改变自己的策 略来获得更多的收益。 四、纳什均衡存在定理 纳什均衡存在定理指出,在任何一个有限制性条件(例如有限次迭代)下满足某些基本条件(例如紧致性)的非合作博弈中,至少存在一个 纳什均衡。 五、纳什均衡的计算方法 在一些简单的博弈中,可以通过列出参与者的收益矩阵来计算纳什均衡。具体方法是找到每个参与者的最优策略,并检查这些最优策略是 否构成了一个稳定状态。

在一些复杂的博弈中,计算纳什均衡可能非常困难甚至不可能。此时,可以采用数值方法(例如迭代法)或者近似方法(例如线性规划)来 求解。 六、纳什均衡的应用 纳什均衡在经济学、政治学、生物学等领域都有广泛应用。在市场竞 争中,企业可以通过分析竞争对手的行为和策略来制定自己的最优策略;在国际关系中,各国可以通过分析其他国家的行为和策略来制定 自己的外交政策。 七、纳什均衡存在局限性 尽管纳什均衡是博弈论中最为常见和重要的均衡概念之一,但它也存 在一些局限性。在一些博弈中,存在多个纳什均衡,而且这些纳什均 衡可能会导致非常不同的结果;在一些博弈中,参与者的收益函数可 能并不是凸函数,因此纳什均衡可能不存在或者不唯一。 八、总结 博弈论中的均衡是一个重要的概念,其中纳什均衡是最为常见和重要 的一种。通过计算纳什均衡,参与者可以找到自己的最优策略,并且 预测其他参与者的行为和策略。然而,纳什均衡也存在局限性,在实 际应用中需要注意。

博弈论与纳什均衡

《博弈论与纳什均衡理论》 姓名张贺祺 学号 2010010404 专业政治经济学 指导老师张秉云

摘要 博弈论是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题,具有斗争或竞争性质现象的数学理论和方法,也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。纳什均衡指的是这样一种战略组合,这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下,没有人有足够理由打破这种均衡。纳什均衡,从实质上说,是一种非合作博弈状态。 关键字:博弈论;纳什均衡;合作博弈;非合作博弈

目录 摘要 (2) 关键字 (2) 一、引言 (4) 二、博弈论与纳什均衡的主要内容 (4) (一)博弈论的主要思想 (4) (二)博弈论的分类 (5) 三、经典案例 (7) (一)博弈论的经典案例 (7) (二)纳什均衡经典案例 (7) 四、博弈论和纳什均衡的重要影响 (8) (一)博弈论的重要影响 (8) (二)纳什均衡的重要影响 (8) 参考文献 (9)

博弈论与纳什均衡理论 一、引言 近代对于博弈论的研究,开始于策墨咯(Zermelo),波雷尔(Borel)及冯·诺伊曼(von Neumann)。 1928年,冯·诺依曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。1944年,冯·诺依曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。1950~1951年,约翰·福布斯·纳什(John Forbes Nash Jr)利用不动点定理证明了均衡点的存在,为博弈论的一般化奠定了坚实的基础。纳什的开创性论文《n人博弈的均衡点》(1950),《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。此外,塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。今天博弈论已发展成一门较完善的学科。 博弈论(Game Theory):亦名“对策论”、“赛局理论”,属应用数学的一个分支,主要研究公式化了的激励结构间的相互作用。是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题,具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。 纳什均衡:(Nash equilibrium)又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。假设有n人局中人参与博弈,给定其他人策略的条件下,每个局中人选择自己的最优策略(个人最优策略可能依赖于也可能不依赖于他人的战略),从而使自己利益最大化。所有局中人策略构成一个策略组合(Strategy Profile)。纳什均衡指的是这样一种战略组合,这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下,没有人有足够理由打破这种均衡。纳什均衡,从实质上说,是一种非合作博弈状态。 二、博弈论与纳什均衡的主要内容 (一)博弈论的主要思想 一个完整的博弈应当包括五个方面的内容:第一,博弈的参加者,即博弈过程中独立决策、独立承担后果的个人和组织;第二,博弈信息,即博弈者所掌握的对选择策略有帮助的情报资料;第三,博弈方可选择的全部行为或策略的集合;第四,博弈的次序,即博弈参加者做出策略选择的先后;第五,博弈方的收益,即各博弈方做出决策选择后的所得和所失。博弈论模型可以用五个方面来描述:G = {P, A S, I, U) P:为局中人,博弈的参与者,也称为博弈方,局中人是能够独立决策,独立承担责任的个人或组织,局中人以最终实现自身利益最大化为目标。决策人:在博弈中率先做出决策的一方,这一方往往依据自身的感受、经验和表面状态优先采取一种有方向性的行动。对抗者:在博弈二人对局中行动滞后的那个人,与决策人要做出基本反面的决定,并且他的动作是滞后的、默认的、被动的,但最终占优。他的策略可能依赖于决策人劣势的策略选择,因此对

纳什均衡理论与博弈论的经济解释

纳什均衡理论与博弈论的经济解释导语: 在经济学领域中,纳什均衡理论与博弈论是两个非常重要的概念,它们为我们 解决各种经济问题提供了有力的工具。本文将通过对纳什均衡理论和博弈论的解释,探讨它们在经济学中的应用和影响。 第一部分:纳什均衡理论的基本原理 纳什均衡理论最早由约翰·福布斯·纳什提出,他通过对全局性决策和局部性决 策的研究,提出了纳什均衡理论。纳什均衡理论认为,在博弈过程中,当每个参与者都选择了最佳策略时,整个博弈系统将达到一个相对稳定的平衡点,即纳什均衡。 纳什均衡的基本原理可以通过一个简单的例子进行说明。假设有两个参与者 (甲和乙)参与一场博弈,分别有两种策略可供选择(策略A和策略B)。如果 甲选择策略A,乙选择策略A,它们的收益分别是10和10;如果甲选择策略A, 乙选择策略B,它们的收益分别是5和20;如果甲选择策略B,乙选择策略A, 它们的收益分别是20和5;如果甲选择策略B,乙选择策略B,它们的收益分别 是0和0。在这种情况下,甲乙双方最佳的选择是选择策略A,因为此时它们的收 益最高。所以,在这个例子中,策略A和策略A就是纳什均衡。 第二部分:博弈论的经济解释 博弈论是研究决策者如何在相互竞争或合作的环境中做出最合理决策的一门学科。在博弈论中,决策者被称为“玩家”,他们的选择被称为“策略”。博弈论通过分 析玩家的策略选择和相互作用的结果,揭示了决策者之间的相互影响和决策结果。 博弈论在经济学中的应用非常广泛。它可以帮助我们分析市场竞争、资源分配、价格形成等一系列经济现象。例如,在市场竞争中,博弈论可以帮助我们理解企业之间的策略选择和竞争结果。在资源分配中,博弈论可以帮助我们分析个体如何在

纳什均衡理论

百科名片 纳什均衡,Nash equilibrium ,又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。 目录

每个人都是“理性的经济人”,都会从利己的目的出发进行选择。这两个人都会有这样一个盘算过程:假如他坦白,我抵赖,得坐10年监狱,坦白最多才8年;他要是抵赖,我就可以被释放,而他会坐10年牢。综合以上几种情况考虑,不管他坦白与否,对我而言都是坦白了划算。两个人都会动这样的脑筋,最终,两个人都选择了坦白,结果都被判8年刑期。 基于经济学中Rational agent的前提假设,两个囚犯符合自己利益的选择是坦白招供,原本对双方都有利的策略不招供从而均被释放就不会出现。这样两人都选择坦白的策略以及因此被判8年的结局,纳什均衡”首先对亚当·斯密的“看不见的手”的原理提出挑战:按照斯密的理论,在市场经济中,每一个人都从利己的目的出发,而最终全社会达到利他的效果。但是我们可以从“纳什均衡”中引出“看不见的手”原理的一个悖论:从利己目的出发,结果损人不利己,既不利己也不利他。 编辑本段纳什均衡的重要影响 纳什均衡理论奠定了现代主流博弈理论和经济理论的根本基础,正如克瑞普斯(Kreps,1990)在《博弈论和经济建模》一书的引言中所说,“在过去的一二十年内,经济学在方法论以及语言、概念等方面,经历了一场温和的革命,非合作博弈理论已经成为范式的中心……在经济学或者与经济学原理相关的金融、会计、营销和政治科学等学科中,现在人们已经很难找到不懂纳什均衡能够‘消费’近期文献的领域。”纳什均衡的重要影响可以概括为以下六个方面 (1)改变了经济学的体系和结构。非合作博弈论的概念、内容、模型和分析工具等,均已渗透到微观经济学、宏观经济学、劳动经济学、国际经济学、环境经济学等经济学科的绝大部分学科领域,改变了这些学科领域的内容和结构,成为这些学科领域的基本研究范式和理论分析工具,从而改变了原有经济学理论体系中各分支学科的内涵。 (2)扩展了经济学研究经济问题的范围。原有经济学缺乏将不确定性因素、变动环境因素以及经济个体之间的交互作用模式化的有效办法,因而不能进行微观层次经济问题的解剖分析。纳什均衡及相关模型分析方法,包括扩展型博弈法、逆推归纳法、子博弈完美纳什均衡等概念方法,为经济学家们提供了深入的分析工具。 (3)加强了经济学研究的深度。纳什均衡理论不回避经济个体之间直接的交互作用,不满足于对经济个体之间复杂经济关系的简单化处理,分析问题时不只停留在宏观层面上而是深入分析表象背后深层次的原因和规律,强调从微观个体行为规律的角度发现问题的根源,因而可以更深刻准确地理解和解释经济问题。 (4)形成了基于经典博弈的研究范式体系。即可以将各种问题或经济关系,按照经典博弈的类型或特征进行分类,并根据相应的经典博弈的分

纳什均衡

什么是纳什均衡呢?纳什均衡名称来源及简介: 纳什均衡,Nash equilibrium ,又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰〃纳什命名… 约翰〃纳什1948年作为年轻数学博士生进入普林斯顿大学。其研究成果见于题为《非合作博弈》(1950)的博士论文。该博士论文导致了《n人博弈中的均衡点》(1950)和题为《非合作博弈》(1951)两篇论文的发表。纳什在上述论文中,介绍了合作博弈与非合作博弈的区别。他对非合作博弈的最重要贡献是阐明了包含任意人数局中人和任意偏好的一种通用解概念,也就是不限于两人零和博弈。该解概念后来被称为纳什均衡。 纳什均衡定义: 假设有n个局中人参与博弈,给定其他人策略的条件下,每个局中人选择自己的最优策略(个人最优策略可能依赖于也可能不依赖于他人的战略),从而使自己效用最大化。所有局中人策略构成一个策略组合(Strategy Profile)。纳什均衡指的是这样一种战略组合,这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下,没有人有足够理由打破这种均衡。 纳什均衡经典案例:囚徒困境 (1950年,数学家塔克任斯坦福大学客座教授,在给一些心理学家作讲演时,讲到两个囚犯的故事。) 假设有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人

分别臵于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果一个犯罪嫌疑人坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪。如果另一个犯罪嫌疑人也作了坦白,则两人各被判刑8年;如果另一个犯罪嫌人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。表2.2给出了这个博弈的支付矩阵。 表2.2囚徒困境博弈—————————————————————————— ┃ B ┃ B ┃————————┃————————┃————————┃ ┃坦白┃抵赖┃————————┃————————┃————————┃ A 坦白┃–8, –8 ┃0, –10 ┃————————┃————————┃————————┃ A 抵赖┃–10, 0 ┃–1, –1 ┃————————┃————————┃————————┃ 关于案例,显然最好的策略是双方都抵赖,结果是大家都只被判1年。但是由于两人处于隔离的情况,首先应该是从心理学的角度来看,当事双方都会怀疑对方会出卖自己以求自保、其次才是亚当〃斯密的理论,假设每个人都是“理性的经济人”,都会从利己的目的出发进

四方博弈模型的纳什均衡

四方博弈模型的纳什均衡 纳什均衡是博弈论中的一个重要概念,指的是在博弈中每个参与者根据其他参与者的策略选择,无法通过单方面改变自己的策略来获得更好的结果。四方博弈模型是博弈论中常见的一种情景,即有四个参与者进行博弈。 在四方博弈模型中,每个参与者都面临着多种策略的选择。他们的目标是通过选择最优的策略来获得最大的利益。而在纳什均衡中,每个参与者的策略选择都是最佳响应其他参与者的策略选择的结果。 假设有四个参与者A、B、C和D,他们分别可以选择策略X、Y和Z。他们的目标是通过选择最优的策略来获得最大的利益。在四方博弈模型中,每个参与者的策略选择都会影响其他参与者的利益,因此他们需要考虑其他参与者的策略选择。 在纳什均衡中,每个参与者的策略选择都是最佳响应其他参与者的策略选择的结果。也就是说,如果每个参与者选择了最优的策略,其他参与者也无法通过改变自己的策略来获得更好的结果。这种情况下,博弈达到了均衡状态。 在四方博弈模型中,纳什均衡可以有多个。这是因为每个参与者都可以有多种策略选择,而其他参与者的策略选择也会影响到最终的结果。因此,在选择策略时,参与者需要综合考虑自己的利益和其

他参与者的策略选择。 为了找到纳什均衡,参与者可以通过分析其他参与者的策略选择和利益来确定自己的最优策略。在这个过程中,参与者需要考虑到其他参与者的行为和可能的反应,以及自己的利益和目标。只有当每个参与者的策略选择都是最佳响应其他参与者的策略选择时,博弈才能达到纳什均衡。 纳什均衡在实际生活中有着广泛的应用。例如,在市场竞争中,各个企业通过选择最优的策略来争夺市场份额。在政治博弈中,各个政党通过选择最优的策略来争取选民支持。在国际关系中,各个国家通过选择最优的策略来维护自身利益。 然而,纳什均衡并不一定是最优的结果。在某些情况下,参与者可能通过合作或协商达到更好的结果。但是,在没有合作或协商的情况下,纳什均衡是参与者可以依靠的最佳策略选择。 四方博弈模型的纳什均衡是参与者在博弈中选择最优策略的结果。每个参与者在选择策略时需要考虑其他参与者的行为和可能的反应,以及自己的利益和目标。只有当每个参与者的策略选择都是最佳响应其他参与者的策略选择时,博弈才能达到纳什均衡。纳什均衡在实际生活中有着广泛的应用,但并不一定是最优的结果。

纳什均衡条件

纳什均衡条件 一、引言 纳什均衡是博弈论中最重要的概念之一,它被广泛应用于经济学、政治学、社会学等领域。纳什均衡条件是指在博弈中每个参与者都采取最优策略时达到的状态,也就是说,没有任何参与者可以通过改变自己的策略来获得更好的结果。本文将从定义、性质、求解方法等方面对纳什均衡条件进行详细介绍。 二、定义 纳什均衡是指在一个博弈中,每个参与者都采取了最优策略,且没有任何一个参与者可以通过改变自己的策略来获得更好的结果。换句话说,每个参与者都已经做出了自己的选择,并且这些选择相互协调,达到了一种稳定状态。 三、性质 1. 稳定性:在纳什均衡状态下,所有参与者都已经做出了最优决策,并且这些决策相互协调。因此,在这种状态下,任何一个参与者都不会想要改变自己的决策。 2. 非合作性:纳什均衡条件是在每个参与者都采取最优策略的情况下达成的,因此,参与者之间没有合作的必要。 3. 稳定性不一定意味着最优性:纳什均衡是在所有参与者都采取最优

策略的情况下达成的,但是这并不意味着这种策略一定是全局最优的。 四、求解方法 1. 支配策略法:支配策略法是一种简单而有效的求解纳什均衡条件的 方法。它通过排除掉那些显然不会被选择的策略来缩小可行解空间, 从而找到纳什均衡点。 2. 最大化最小值法:最大化最小值法是一种比较常用的求解纳什均衡 条件的方法。它通过找到每个参与者能够获得的最小收益,并在其中 选择一个收益最大化的方案作为博弈结果。 3. 梅尔森-斯托尔提斯(Mertens-Stableitz)算法:梅尔森-斯托尔提斯算法是一种比较复杂但非常有效的求解纳什均衡条件的方法。它通 过逐步削减可行解空间来找到纳什均衡点。 五、应用 纳什均衡条件被广泛应用于经济学、政治学、社会学等领域。例如, 在竞争性市场中,厂商们通过考虑对手的反应来制定自己的价格和生 产策略,以达到最大化利润的目的。在政治博弈中,政治家们也会根 据对手的行为来调整自己的策略,以达到最终胜利的目标。 六、总结 纳什均衡条件是博弈论中最重要的概念之一,它描述了博弈参与者之 间相互作用所达成的一种稳定状态。求解纳什均衡点有多种方法,包

纳什均衡微观经济学名词解释

纳什均衡微观经济学名词解释 纳什均衡是微观经济学中的一个重要概念,指的是在博弈论中,多个决策者在互相影响下,选择最优策略的一种状态。它是由美国数学家约翰·纳什提出的,因此得名。 在纳什均衡中,每个决策者都会选择最优的策略,同时考虑到其他决策者的选择。这种状态下,所有决策者都无法通过单方面改变策略来提高自己的利益,因为其他决策者也会相应地调整自己的策略,从而保持均衡状态。 具体来说,纳什均衡有以下几个特点: 1.每个决策者都选择最优策略。在纳什均衡中,每个决策者都会选择能够最大化自己利益的策略。 2.所有决策者的策略相互独立。在纳什均衡中,每个决策者的策略都是独立的,没有任何一个决策者能够通过单方面改变自己的策略来影响其他决策者的策略。 3.所有决策者都认为其他决策者的策略不会改变。在纳什均衡中,每个决策者都认为其他决策者的策略不会改变,因此不会试图通过改变自己的策略来影响其他决策者的策略。 纳什均衡的应用非常广泛,尤其是在经济学中。例如,在市场竞争中,每个厂商都会根据市场需求和竞争对手的策略来选择自己的生产策略,从而达到最大化利润的目的。在这种情况下,如果每个厂商都选择最优策略,并认为其他厂商的策略不会改变,那么市场就会达到纳什均衡状态。

除了经济学之外,纳什均衡还被广泛应用于政治学、社会学、心理学等领域。例如,在国际关系中,不同国家之间的互动往往也是一个博弈过程,每个国家都会根据自己的利益来选择策略。在这种情况下,如果每个国家都选择最优策略,并认为其他国家的策略不会改变,那么国际关系也会达到纳什均衡状态。 需要注意的是,纳什均衡并不一定是最优的状态。在某些情况下,虽然达到了纳什均衡状态,但是每个决策者的利益都不是最大化的。因此,在实际应用中,需要根据具体情况来判断纳什均衡是否是最优的选择。 总之,纳什均衡是微观经济学中的一个重要概念,具有广泛的应用价值。通过了解纳什均衡的原理和特点,我们可以更好地理解市场竞争、国际关系等领域中的博弈过程,从而更好地制定策略和决策。

纳什均衡

纳什均衡(Nash equilibrium)——完全信息静态博弈 [编辑] 纳什均衡简介 纳什均衡,又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,则该策略被称作支配性策略。如果两个博弈的当事人的策略组合分别构成各自的支配性策略,那么这个组合就被定义为纳什均衡。 一个策略组合被称为纳什均衡,当每个博弈者的均衡策略都是为了达到自己期望收益的最大值,与此同时,其他所有博弈者也遵循这样的策略。 [编辑] 纳什均衡的得来 关于纳什均衡的普遍意义和存在性定理的证明等奠定非合作博弈理论发展基础的重要成果,是纳什在普林斯顿大学攻读博士学位时完成的。实际上,博弈论的研究起始于1944年冯·诺依曼(Von Neumann)和奥斯卡·摩根斯坦(Oscar Morgenstern)合著的《博弈论和经济行为》。然而却是纳什首先用严密的数学语言和简明的文字准确地定义了纳什均衡这个概念,并在包含“混合策略(mixed strategies)”的情况下,证明了纳什均衡在n人有限博弈中的普遍存在性,从而开创了与诺依曼和摩根斯坦框架路线均完全不同的“非合作博弈(Non-cooperative Game)”理论,进而对“合作博弈(Cooperative Game)”和“非合作博弈”做了明确的区分和定义。图克(Tucker)教授评价其论文,“这是对博弈理论的高度原创性和重要的贡献。它发展了本身很有意义的n人有限非合作博弈的概念和性质。并且它很可能开拓出许多在两人零和问题以外的,至今尚未涉及的问题。在概念和方法两方面,该论文都是作者的独立创造。”

相关主题
文本预览
相关文档 最新文档