当前位置:文档之家› 经济博弈论第三版

经济博弈论第三版

经济博弈论第三版
经济博弈论第三版

经济博弈论第三版习题

博弈论

判断题(每小题1分,共15分)

囚徒困境说明个人的理性选择不一定是集体的理性选择。(√)

子博弈精炼纳什均衡不是一个纳什均衡。(×)

若一个博弈出现了皆大欢喜的结局,说明该博弈是一个合作的正和博弈。()

博弈中知道越多的一方越有利。(×)

纳什均衡一定是上策均衡。(×)

上策均衡一定是纳什均衡。(√)

在一个博弈中只可能存在一个纳什均衡。(×)

在一个博弈中博弈方可以有很多个。(√)

在一个博弈中如果存在多个纳什均衡则不存在上策均衡。(√)

在博弈中纳什均衡是博弈双方能获得的最好结果。(×)

在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。(×)

上策均衡是帕累托最优的均衡。(×)

因为零和博弈中博弈方之间关系都是竞争性的、对立的,因此零和博弈就是非合作博弈。

(×)

在动态博弈中,因为后行动的博弈方可以先观察对方行为后再选择行为,因此总是有利的。(×)

在博弈中存在着先动优势和后动优势,所以后行动的人不一定总有利,例如:在斯塔克伯格模型中,企业就可能具有先动优势。

囚徒的困境博弈中两个囚徒之所以会处于困境,无法得到较理想的结果,是因为两囚徒都不在乎坐牢时间长短本身,只在乎不能比对方坐牢的时间更长。

(×)

纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。(√)

不存在纯战略纳什均衡和存在惟一的纯战略纳什均衡,作为原博弈构成的有限次重复博弈,共同特点是重复博弈本质上不过是原博弈的简单重复,重复博弈的子博弈完美纳什均衡就是每次重复采用原博弈的纳什均衡。(√)

多个纯战略纳什均衡博弈的有限次重复博弈子博弈完美纳什均衡路径:两阶段都采用原博弈同一个纯战略纳什均衡,或者轮流采用不同纯战略纳什均衡,或者两次都采用混合战略纳什均衡,或者混合战略和纯战略轮流采用。(√)

如果阶段博弈G={A1, A2,…,An; u1, u2,…,un)具有多重Nash均衡,那么可能(但不必)存在重复博弈G(T)的子博弈完美均衡结局,其中对于任意的t

零和博弈的无限次重复博弈中,所有阶段都不可能发生合作,局中人会一直重复原博弈的混合战略纳什均衡。(√)(或:零和博弈的无限次重复博弈中,可能发生合作,局中人不一定会一直重复原博弈的混合战略纳什均衡。(×))

原博弈惟一的纳什均衡本身是帕雷托效率意义上最佳战略组合,符合各局中人最大利益:采用原博弈的纯战略纳什均衡本身是各局中人能实现的最好结果,符合所有局中人的利益,因此,不管是重复有限次还是无限次,不会和一次性博弈有区别。(√)

原博弈惟一的纳什均衡本身是帕雷托效率意义上最佳战略组合,符合各局中人最大利益,但惟一的纳什均

衡不是效率最高的战略组合,存在潜在合作利益的囚徒困境博弈。(√)(或:原博弈惟一的纳什均衡本身是帕雷托效率意义上最佳战略组合,符合各局中人最大利益,不存在潜在合作利益的囚徒困境博弈。(×))根据参与人行动的先后顺序,博弈可以划分为静态博弈(static game)和动态博弈(dynamic game)。

如果阶段博弈G有唯一的Nash均衡,那么对任意有限次T,重复博弈G(T)有唯一的子博弈完美结局:在每一阶段取G的Nash均衡策略。(√)

四、名词解释(每小题3分,共15分)

参与人(player)

指的是博弈中选择行动以最大化自己效用(收益)的决策主体,参与人有时也称局中人,可以是个人,也可以是企业、国家等团体;

策略(strategy)

是参与人选择行动的规则,如“以牙还牙”是一种策略;

信息(information)

是指参与人在博弈中的知识,尤其是有关其他参与人的特征和行动的知识;

支付(payoff)函数

是参与人从博弈中获得的效用水平,它是所有参与人策略或行动的函数,是每个参与人很关心的东西;结果(outcome)

是指博弈分析者感兴趣的要素的集合,常用支付矩阵或收益矩阵来表示;

均衡(equilibrium)

是所有参与人的最优策略或行动的组合。

静态博弈

指参与人同时选择行动或虽非同时但后行动者并不知道先行动者采取什么样的行动;

动态博弈

指参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。

博弈

就是一些个人、队组或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,各自取得相应结果的过程。

零和博弈:

也称“严格竞争博弈”。博弈方之间利益始终对立,偏好通常不同

变和博弈:

零和博弈和常和博弈以外的所有博弈。合作利益存在,博弈效率问题的重要性。

完全信息静态博弈

即各博弈方同时决策,且所有博弈方对各方得益都了解的博弈。

上策:

不管其它博弈方选择什么策略,一博弈方的某个策略给他带来的得益始终高于其它的策略,至少不低于其他策略的策略

上策均衡:

一个博弈的某个策略组合中的所有策略都是各个博弈方各自的上策,必然是该博弈比较稳定的结果

严格下策:

不管其它博弈方的策略如何变化,给一个博弈方带来的收益总是比另一种策略给他带来的收益小的策略

合作博弈 非合作博弈 零和博弈 常和博弈 变和博弈 上策均衡 纳什均衡

纳什均衡:在博弈 中,如果由各个博弈方的各一个策略组成的某个策略组合

中,任一博弈方 的策略,都是对其余博弈方策略的组合

的最佳对策,也即

对任意

都成立,则称 为 的一个纳什均衡

(或纳什均衡是指这样一种策略组合,这种策略组合由所有参与人的最优策略组成,即给定别人策略的情况下,没有任何单个参与人有积极性选择其他策略,从而没有任何参与人有积极性打破这种均衡。) 完全信息博弈

混合策略:在博弈 中,博弈方 i 的策略空间为 ,则博弈方 以概率分布 随机在其 k 个可选策略中选择的“策略”,称为一个“混合策略”,

其中

对 都成立,且 帕累托上策均衡 风险上策均衡 聚点均衡 重复博弈

指同样结构的博弈重复多次,其中的每次博弈称为“阶段博弈”。 阶段博弈

重复博弈中的每次博弈称为“阶段博弈”。 贴现因子

下一期的一单位支付在这一期的价值。 触发战略(Trigger Strategy )

首先试探合作,一旦发现对方不合作,则也用不合作相报复的战略。 子博弈精炼纳什均衡

(夫妻博弈) 一对新婚夫妻为晚上看什么电视节目争执不下,丈夫(记为I 方)要看足球比赛节目,而妻子(记为Ⅱ方)要看戏曲节目.他们新婚燕尔,相亲相爱,所以若这方面的行动不一致,则是很伤感情的.因此,这对夫妻间的争执是一次非零和对策。

二、计算与分析题(每小题15分,共45分)

1、无限次重复博弈与有限重复博弈的区别:

a.

无限次重复博弈没有结束重复的确定时间。在有限次重复博弈中,存在最后一次重复正是破坏重复博弈中局中人利益和行为的相互制约关系,使重复博弈无法实现更高效率均衡的关键问题。

b.

无限次重复博弈不能忽视不同时间得益的价值差异和贴现问题,必须考虑后一期得益

},;,{11n n u u S S G =),(*

*n i s s )

,...,,(*

*1*1*n i i i s s s s +- i

j i S s ∈),...,,,(),...,,,(*

*1*1***1**1*n i ij i i i n i i i i i s s s s s u s s s s s u +-+-≥ ),(*

*n i s s },;,{11n n u u S S G =},{1ik i i s s S =),(1ik i i p p p =k

j ,,1 =10≤≤ij p 11=++ik i p p

的贴现系数,对局中人和博弈均衡的分析必须以平均得益或总得益的现值为根据。

c.无限次重复博弈与有限次重复博弈的共同点:试图“合作”和惩罚“不合作”是实现

理想均衡的关键,是构造高效率均衡战略的核心构件。

2、可口可乐与百事可乐(参与者)的价格决策:双方都可以保持价格不变或者提高价格(策略);博弈的目标和得失情况体现为利润的多少(收益);利润的大小取决于双方的策略组合(收益函数);博弈有四种策略组合,其结局是:

(1)如果双方都不涨价,各得利润10单位;

(2)如果可口可乐不涨价,百事可乐涨价,可口可乐利润100,百事可乐利润-30;

(3)如果可口可乐涨价,百事可乐不涨价,可口可乐利润-20,百事可乐利润30;

(4)如果双方都涨价,可口可乐利润140,百事可乐利润35;

求纳什均衡。

博弈的稳定状态有两个:都不涨价或者都涨价(均衡),均衡称为博弈的解。

3、猪圈里有一头大猪和一头小猪,猪圈的一头有一个饲料槽,另一头装有控制饲料供应的按钮。按一下按钮就会有10个单位饲料进槽,但谁按谁就要付出2个单位的成本。谁去按按纽则谁后到;都去按则同时到。若大猪先到,大猪吃到9个单位,小猪吃到一个单位;若同时到,大猪吃7个单位,小猪吃3个单位;若小猪先到,大猪吃六个单位,小猪吃4个单位。各种情况组合扣除成本后的支付矩阵可如下表示(每格第一个数字是大猪的得益,第二个数字是小猪的得益):

小猪

按等待

大猪按 5,1 4,4

等待 9,-1 0,0

求纳什均衡。

在这个例子中,我们可以发现,大猪选择按,小猪最好选择等待,大猪选择不按,小猪还是最好选择等待。即不管大猪选择按还是不按,小猪的最佳策略都是等待。也就是说,无论如何,小猪都只会选择等待。这样的情况下,大猪最好选择是按,因为不按的话都饿肚子,按的话还可以有4个单位的收益。所以纳什均衡是(大猪按,小猪等待)。

4、根据两人博弈的支付矩阵回答问题:

a b

A

B

(1)写出两人各自的全部策略,并用等价的博弈树来重新表示这个博弈(6分)

(2)找出该博弈的全部纯策略纳什均衡,并判断均衡的结果是否是Pareto有效。

(3)求出该博弈的混合策略纳什均衡。(7分)

(1)策略

甲:AB

乙:ab

博弈树(草图如下:

(2)Pure NE (A, a); (B, b)

都是Pareto 有效,仅(B, b)是K-H有效。 (3)Mixed NE ((2/5, 3/5); (2/3, 1/3))

5、用反应函数法求出下列博弈的所有纯战略纳什均衡。 参与人2

a b c d A

参与人1

B C

D

解答:

纯策略纳什均衡为(B ,a )与(A ,c )

分析过程:设两个参与人的行动分别为12a a 和,

player1的反应函数221222,,(),B a a B a b

R a A a c

C a d =??

=?=?

=??=?如果如果如果或者D,如果

player2的反应函数112111

,,(),D c a A a a B

R a c a C c a =??

=?=?=??=?如果如果如果,如果

交点为(B ,a )与(A ,c ),因此纯策略纳什均衡为(B ,a )与(A ,c )。

6、(entry deterrence 市场威慑)考虑下面一个动态博弈:首先,在一个市场上潜在的进入者选择是否进入,然后市场上的已有企业(在位者)选择是否与新企业展开竞争。在位者可能有两种类型,温柔型(左图)和残酷型(右图),回答下面问题。

.

左图:温柔型 右图:残酷型

(1) 找出给定在位者的两种类型所分别对应的纳什均衡,以及子博弈精炼纳什均衡(12分) (2) 已有企业为温柔型的概率至少多少时,新企业才愿意进入(8分)

(1) 温柔 NE (in, accommodate) 和 (out, fight)。 SPNE 为(in, accommodate)

残酷 NE (out, fight). SPNE 同理 (2)

2010(1)0p p -->= 1/3p >=得到

8、博弈方1 和博弈方 2就如何分 10,000 元钱进行讨价还价。假设确定了以下规则:双方同时提出自己要求的数额 A 和 B ,0≤A ,B ≤10,000。如果 A+B ≤10,000,则两博弈方的要求得到满足,即分别得 A 和 B ,但如果 A+B>10,000,则该笔钱就没收。问该博弈的纳什均衡是什么?如果你是其中一个博弈方,你会选择什么数额?为什么?

答十、纳什均衡有无数个。最可能的结果是(5000,5000)这个聚点均衡。

9、北方航空公司和新华航空公司分享了从北京到南方冬天度假胜地的市场。如果它们合作,各获得500000元的垄断利润,但不受限制的竞争会使每一方的利润降至60000元。如果一方在价格决策方面选择合作而另一方却选择降低价格,则合作的厂商获利将为零,竞争厂商将获利900000元。 (1)将这一市场用囚徒困境的博弈加以表示。

(2)解释为什么均衡结果可能是两家公司都选择竞争性策略。 答:(1)用囚徒困境的博弈表示如下表:

(2)如果新华航空公司选择竞争,则北方航空公司也会选择竞争(60000>0);若新华航空公司选择合作,北方航空公司仍会选择竞争(900000>500000)。若北方航空公司选择竞争,新华航空公司也将选择竞争(60000>0);若北方航空公司选择合作,新华航空公司仍会选择竞争(900000>0)。由于双方总偏好竞争,故均衡结果为两家公司都选择竞争性策略,每一家公司所获利润均为600000

元。

12、设啤酒市场上有两家厂商,各自选择是生产高价啤酒还是低价啤酒,相应的利润(单位: 万元)由下图的得益矩阵给出:

-10,25)

10,20)

20,30)

-10,0)

(1)有哪些结果是纳什均衡? (2)两厂商合作的结果是什么?

答(1)(低价,高价),(高价,低价) (2)(低价,高价)

13、A 、B 两企业利用广告进行竞争。若A 、B 两企业都做广告,在未来销售中,A 企业可以获得20万元利润,B 企业可获得8万元利润;若A 企业做广告,B 企业不做广告,A 企业可获得25万元利润,B 企业可获得2万元利润;若A 企业不做广告,B 企业做广告,A 企业可获得10万元利润,B 企业可获得12万元利润;若A 、B 两企业都不做广告,A 企业可获得30万元利润,B 企业可获得6万元利润。 (1)画出A 、B 两企业的支付矩阵。

(2)求纳什均衡。

3. 答:(1)由题目中所提供的信息,可画出A 、B 两企业的支付矩阵(如下表)。

(2)因为这是一个简单的完全信息静态博弈,对于纯策纳什均衡解可运用划横线法求解。

如果A 厂商做广告,则B 厂商的最优选择是做广告,因为做广告所获得的利润8大于不做广告获得的利润2,故在8下面划一横线。如果A 厂商不做广告,则B 厂商的最优选择也是做广告,因为做广告获得的利润为12,而不做广告的利润为6,故在12下面划一横线。

如果B 厂商做广告,则A 厂商的最优选择是做广告,因为做广告获得的利润20大于不做广告所获得的利润10,故在20下面划一横线。如果B 厂商不做广告,A 厂商的最优选择是不做广告,因为不做广告获得的利润30大于做广告所获得的利润25,故在30下面划一横线。

在本题中不存在混合策略的纳什均衡解,因此,最终的纯策略纳什均衡就是A 、B 两厂商都做广告。

15、求出下面博弈的纳什均衡(含纯策略和混合策略)。

L R

U D

由划线法易知,该矩阵博弈没有纯策略Nash 均衡。 可得如下不等式组

Q=a+d-b-c=7,q=d-b=4,R=0+5-8-6=-9,r=-1

可得混合策略Nash 均衡((

9891,),(7

374,)

16、 某产品市场上有两个厂商,各自都可以选择高质量,还是低质量。相应的利润由如下得益矩阵给出: (1) 该博弈是否存在纳什均衡?如果存在的话,哪些结果是纳什均衡?

参考答案:

由划线法可知,该矩阵博弈有两个纯策略Nash 均衡,即(低质量, 高质量), (高质量,低质量)。

乙企业

高质量 低质量

甲企业

高质量低质量该矩阵博弈还有一个混合的纳什均衡

Q=a+d-b-c= -970,q=d-b= -120,R= -1380,r= -630,可得138

63

y ,9712x =

= 因此该问题的混合纳什均衡为))138

75

,13863(),9785,9712((。

17、甲、乙两企业分属两个国家,在开发某种新产品方面有如下收益矩阵表示的博弈关系。试求出该博弈的纳什均衡。如果乙企业所在国政府想保护本国企业利益,可以采取什么措施?

乙企业 开发 不开发

甲企业

开发 不开发解:用划线法找出问题的纯策略纳什均衡点。

??

????--0,0100,00,10010,10 所以可知该问题有两个纯策略纳什均衡点(开发,不开发)和(不开发,开发)。 该博弈还有一个混合的纳什均衡((

111,1110),(11

1

,1110))。 如果乙企业所在国政府对企业开发新产品补贴a 个单位,则收益矩阵变为:

??

????++--0,0a 100,00,100a 10,10,要使(不

开发,开发)成为该博弈的唯一纳什均衡点,只需a>10。此时乙企业的收益为100+a 。

18、博弈的收益矩阵如下表:

(1)如果(上,左)是占优策略均衡,则a 、b 、c 、d 、e 、f 、g 、h 之间必然满足哪些关系?(尽量把所有必要的关系式都写出来)

(2)如果(上,左)是纳什均衡,则(1)中的关系式哪些必须满足? (3)如果(上,左)是占优策略均衡,那么它是否必定是纳什均衡?为什么?

(4)在什么情况下,纯战略纳什均衡不存在?

答:(1)e a >,g c >,d b >,h f >。本题另外一个思考角度是从占优策略均衡的定义出发。对乙而言,占优策略为),(),(h d f b >;而对甲而言,占优策略为),(),(g e c a >。综合起来可得到所需结论。

(2)纳什均衡只需满足:甲选上的策略时,d b >,同时乙选左的策略时,e a >。故本题中纳什均衡的条件为:d b >,e a >。

(3)占优策略均衡一定是纳什均衡,因为占优策略均衡的条件包含了纳什均衡的条件。 (4)当对每一方来说,任意一种策略组合都不满足纳什均衡时,纯战略纳什均衡就不存在。

19、Smith 和John 玩数字匹配游戏,每个人选择1、2、3,如果数字相同, John 给Smith 3美元,如果不同,Smith 给John 1美元。 (1)列出收益矩阵。

(2)如果参与者以1/3的概率选择每一个数字,证明该混合策略存在一个纳什均衡,它为多少? 答:(1)此博弈的收益矩阵如下表。该博弈是零和博弈,无纳什均衡。

(2)Smith 选(1/3,1/3,1/3)的混合概率时, John 选1的效用为:31131131)3(311-=?+?+-?=U John 选2的效用为:31131)3(311312-=?+-?+?=U John 选3的效用为:31)3(311311313-=-?+?+?=

U 类似地,John 选(1/3,1/3,1/3)的混合概率时,

Smith 选1的效用为:31)1(31)1(31331'1

=-?+-?+?=U Smith 选2的效用为:31)1(31331)1(31'2

=-?+?+-?=U Smith 选3的效用为:3

1331)1(31)1(31'3

=?+-?+-?=U 因为321U U U ==,'3

'2'1U U U ==,所以: ??

????)31,31,31(),31,31,31(是纳什均衡,策略值分别为John :31-=U ;Smith :31'

=U 。

20、假设双头垄断企业的成本函数分别为:1120Q C =,2

222Q C =,市场需求曲线为Q P 2400-=,其

中,21Q Q Q +=。

(1)求出古诺(Cournot )均衡情况下的产量、价格和利润,求出各自的反应和等利润曲线,并图示均衡点。

(2)求出斯塔克博格(Stackelberg )均衡情况下的产量、价格和利润,并以图形表示。

(3)说明导致上述两种均衡结果差异的原因。 答:(1)对于垄断企业1来说:

2

19020)](2400m ax[211

121Q Q Q Q Q Q -=

?-+-

这是垄断企业1的反应函数。

其等利润曲线为:21211122380

Q Q Q Q --=π 对垄断企业2来说:

4

502)](2400m ax[122

2

221Q Q Q Q Q Q -

=?-+-

这是垄断企业2的反应函数。

其等利润曲线为:2

2212242400Q Q Q Q --=π

在达到均衡时,有:

???==??

?? ??

--=308024501902

1

11Q Q Q Q 均衡时的价格为:180)3080(2400=+?-=P

两垄断企业的利润分别为:

12800802308028038021=?-??-?=π 3600304308023040022=?-??-?=π

均衡点可图示为:

(2)当垄断企业1为领导者时,企业2视企业1的产量为既定,其反应函数为:

4/5012Q Q -=

则企业1的问题可简化为:

???==?-????????? ??

-+-3

/803/280204502400max 21

1

111Q Q Q Q Q Q

均衡时价格为:1603803

2802400=???

??+-=P 利润为:3/392001=π,9/256002=π

该均衡可用下图表示:

企业2领先时可依此类推。

(3)当企业1为领先者时,其获得的利润要比古诺竞争下多。而企业2获得的利润较少。这是因为,企业1先行动时,其能考虑企业2的反应,并以此来制定自己的生产计划,而企业2只能被动地接受企业1的既定产量,计划自己的产出,这是一种“先动优势”

21、在一个由三寡头操纵的垄断市场中,逆需求函数为p=a-q 1-q 2-q 3,这里q i 是企业i 的产量。每一企业生产的单位成本为常数c 。三企业决定各自产量的顺序如下:(1)企业1首先选择q 1≥0;(2)企业2和企业3观察到q 1,然后同时分别选择q 2和q 3。试解出该博弈的子博弈完美纳什均衡。

答:该博弈分为两个阶段,第一阶段企业1选择产量q 1,第二阶段企业2和3观测到q 1后,他们之间作一完全信息的静态博弈。我们按照逆向递归法对博弈进行求解。

(1)假设企业1已选定产量q 1,先进行第二阶段的计算。设企业2,3的利润函数分别为:

223212cq q )q q q a (----=π 323213cq q )q q q a (----=π

由于两企业均要追求利润最大,故对以上两式分别求一阶条件:

023212

2

=----=??c q q q a q π (1)

0c q 2q q a q 3213

3

=----=?π? (2) 求解(1)、(2)组成的方程组有:

3

c

q a q q 1*

3*2--=

= (3) (2)现进行第一阶段的博弈分析: 对与企业1,其利润函数为;

113211cq q )q q q a (----=π 将(3)代入可得:

3

)

c q a (q 111--=

π (4)

式(4)对q 1求导:

0c q 2a q 11

1

=--=?π? 解得:

)c a (2

1

q *1-=

(5) 此时,2*

1)c a (12

1

-=

π (3)将式(5)代回(3)和(4)有该博弈的子博弈完美纳什均衡:

)c a (21q *1-=

,)c a (6

1q q *3*2-==

25、某寡头垄断市场上有两个厂商,总成本均为自身产量的20倍, 市场需求函数为Q=200-P 。 求(1)若两个厂商同时决定产量,产量分别是多少?

(2)若两个厂商达成协议垄断市场,共同安排产量,则各自的利润情况如何?

答:(1)分别求反应函数,180-2Q1-Q2=0,180-Q1-2Q2=0,Q1=Q2=60 (2)200-2Q=20,Q=90,Q1=Q2=45

26、一个工人给一个老板干活,工资标准是100元。工人可以选择是否偷懒,老板则选择是否克扣工资。假设工人不偷懒有相当于 50 元的负效用,老板想克扣工资则总有借口扣掉60 元工资,工人不偷懒老板有 150 元产出,而工人偷懒时老板只有 80元产出,但老板在支付工资之前无法知道实际产出,这些情况双方都知道。请问:

(1)如果老板完全能够看出工人是否偷懒,博弈属于哪种类型?用得益矩阵或扩展形表示 该博弈并作简单分析。

(2)如果老板无法看出工人是否偷懒,博弈属于哪种类型?用得益矩阵或扩展形表示该博 弈并作简单分析。

(1)完全信息动态博弈。

博弈结果应该是工人偷懒,老板克扣。

(2)完全信息静态博弈,结果仍然是工人偷懒,老板克扣。

27、举一个你在现实生活中遇到的囚犯两难困境的例子。

答:在校园的人行道交叉路口,无需红绿灯。现在两人分别骑车从东西方向和南北方向通过路口。若同时往前冲,必定相撞,各自支付为(-2,-2);若同时停下,都不能按时前进,支付为(0,0);若一人前进一人停下,支付为(2,0)或(0,2)。相应的策略和支付矩阵如下表。

28、给定两家酿酒企业A、B的收益矩阵如下表:

表中每组数字前面一个表示B企业的收益,后一个数字表示B企业的收益。

(1)求出该博弈问题的均衡解,是占优策略均衡还是纳什均衡?

(2)存在帕累托改进吗?如果存在,在什么条件下可以实现?福利增量是多少?

(3)如何改变上述A、B企业的收益才能使均衡成为纳什均衡或占优策略均衡?如何改变上述A、B企业的收益才能使该博弈不存在均衡?

答:(1)有两个纳什均衡,即(啤酒,白酒)、(白酒,啤酒),都是纳什均衡而不是占优策略均衡。

(2)显然,(白酒,啤酒)是最佳均衡,此时双方均获得其最大收益。若均衡解为(啤酒,白酒),则存在帕累托改善的可能。方法是双方沟通,共同做出理性选择,也可由一方向另一方支付报酬。福利由800+900变为900+1000,增量为200。

(3)如将(啤酒,白酒)支付改为(1000,1100),则(啤酒,白酒)就成为占优策略均衡。比如将(啤酒,白酒)支付改为(800,500),将(白酒,啤酒)支付改为(900,500),则该博弈就不存在任何占优策略均衡或纳什均衡。

30、在纳税检查的博弈中,假设A为应纳税款,C为检查成本,F是偷税罚款,且C

(1)写出支付矩阵。

(2)分析混合策略纳什均衡。

答:(1)该博弈的支付矩阵如下表:

(2)先分析税收检查边际:因为S 为税务机关检查的概率,E 为纳税人逃税的概率。给定E ,税收机关选择检查与否的期望收益为:

C A EF E C A E F C A E K -+=--++-=)1)(()(),1(

)1()1(0),0(E A E A E E K -+-+?=

解),0(),1(E K E K =,得:)/(F A C E +=。

如果纳税人逃税概率小于E ,税收机关的最优决策是不检查,否则是检查。 再分析逃税边际:给定S ,纳税人选择逃税与否的期望收益是:

S F A S S F A S K )()1(0)()1,(+-=-?+--=

A S A AS S K -=--+-=)1)(()0,(

解)0,()1,(S K S K =,得:)/(F A A S +=。即如果税收机关检查的概率小于S ,纳税人的最优选择是逃税,否则是交税。

因此,混合纳什均衡是(S ,E ),即税收机关以S 的概率查税,而纳税人以E 的概率逃税。

31、判断下列说法正确:

(1)斯塔克博格产量领导者所获得的利润的下限是古诺均衡下它得到的利润。

(2)由于两个罪犯只打算犯罪一次,所以被捕后才出现了不合作的问题即囚徒困境。但如果他们打算重复合伙多次,比如说20次,那么对策论预测他们将采取彼此合作的态度,即谁都不招供。

答:(1)正确。在斯塔克博格模型中,领导者可以根据跟随者的反应曲线来制定自己的最优产量。其利润一定不会小于古诺均衡下的利润,否则,领导者将采取古诺博弈中双方同时行动的策略而获得古诺均衡的利润。

(2)错误。只要两囚犯只打算合作有限次,其最优策略均为招供。比如最后一次合谋,两小偷被抓住了,因为将来没有合作机会了,最优策略均为招供。回退到倒数第二次,既然已经知道下次不会合作,这次为什么要合作呢。依此类推,对于有限次内的任何一次,两小偷均不可能合作。

32、简要评论博弈论在微观经济学运用中的优缺点。

答:博弈论是描述和研究行为者之间策略相互依存和相互作用的一种决策理论。它被广泛应用于政治、外交、军事、经济等研究领域,但在微观经济学中的应用是最成功的。博弈论的研究方法和特征与经济学结合得非常紧密。它强调个人理性,即在给定的约束条件下追求效用最大化。但博弈论又比传统的经济学更进一步,它研究的不是面临非人格化的价格参数下的决策问题,而是研究效用随各个主体的行为改变而改变的效用最大化问题。除了国际贸易、金融、拍卖等经济领域,博弈论在企业理论特别是寡头竞争研究方法方面做了大量的有益工作。

20世纪80年代以来,博弈论开始出现在西方经济学的教科书中,都将其作为经济学研究的最新成果与前沿。特别是产业组织理论方面的教材,几乎都是以博弈论为基础的。博弈论反映了经济学的研究对象越来越个体化、微观化;反映了经济学越来越重视人与人之间关系与相互作用的研究,特别是协调人际的利益与冲突的最佳制度安排倾向;反映了经济学越来越重视信息,即接近现实的有关信息不完全对个人选择与制度安排及其影响的倾向。总之,博弈论在经济学中的广泛应用,大大提高了经济学对现实的解释能力。

应该看到,博弈论在微观经济学运用中还存在许多疑难问题。它无法提供唯一解,无法完整地探讨个人发展与社会发展之间的相互依存关系。现有的博弈论结构可强有力地证明“合作比不合作好”这一命题,但无法解释清楚在现实中冲突与合作之间的复杂关系,认为个人组成的集团会采取合作行动以实现他们共同的利益。实际上,除非一个集团中的人数很少或者存在强制或其他某些特殊手段以使个人按照他们的共

同利益行事,有理性的、寻求个人利益最大化的个人不会采取行动以实现共同的利益。即使他们采取行动实现共同的利益之后都能获益,他们也仍然可能不会自愿地采取合作行动以实现共同利益的目标。

33、“囚徒困境”的内在根源是什么?举出现实中囚徒的困境的具体例子。

答八:内在根源是个体之间存在行为和利益相互制约的博弈结构中,个体理性与集体理性的矛盾。

34、假设古诺的双寡头模型中双寡头面临如下一条线性需求曲线:

P=30-Q

其中Q 为两厂商的总产量,即Q=Q 1+Q 2。

再假设边际成本为零,即 MC 1=MC 2=0

解释并讨论此例的纳斯均衡,为什么其均衡是一种囚徒困境。

厂商1的总收益TR 1由下式给出:

厂商1的边际收益MR 1为: MR 1=30-2Q 1-Q 2

利用利润最大化条件MR 1=MC 1=0,得厂商1的反应函数(reaction function)或反应曲线为: Q 1=15-0.5Q 2 (6-1) 同理可得厂商2的反应曲线为:

Q 2=15-0.5Q 1

(6-2)

均衡产量水平就是两反应曲线交点Q 1和Q 2的值,即方程组6-1和6-2的解。可以求得古诺均衡时的均衡产量水平为:Q 1=Q 2=10。

因此,在本例中,两个寡头的总产量Q 为Q 1+Q 2=20,均衡价格为P=30-Q=10。

刚才我们讨论了两寡头厂商相互竞争时的均衡产量。现在我们放松第(6)条不能串谋的假设,假定两寡头可以串谋。它们能共同确定产量以使总利润最大化。

这时,两厂商的总收益TR 为: TR=PQ=(30-Q)Q=30Q-Q 2

其边际收益MR 为:

MR=30-2Q

根据利润最大化条件MR=MC=0,可以求得当Q=15时总利润最大。如果两厂商同意平分利润,每个寡头厂商将各生产总产量的一半,即Q 1=Q 2=7.5。其实,任何相加为15的产量Q 1和Q 2的组合都使总利润最大化,因此,把Q 1+Q 2=15称为契约曲线,而Q 1=Q 2=7.5是契约曲线上的一个点。

我们还可以求得当价格等于边际成本时,Q 1=Q 2=15,各厂商的利润为零。

35、两家电视台竞争周末黄金时段晚8点到10点的收视率,可选择把较好的节目放在前面还是后面。他们决

策的不同组合导致收视率如下:

2

121111Q Q Q Q 30Q )Q 30(PQ TR --=-==2

12

1111Q Q Q Q 30Q )Q 30(PQ TR --=-==

(1)如果两家是同时决策,有纳什均衡吗?

有(前面,后面)

(2)如果双方采用规避风险的策略,均衡的结果是什么?

此题应用的思想是最大最小收益法:

也就是说,在对手采取策略时,所获得的最小收益中的最大值。

电视台1:对方采取前面战略的最小收益为18

对方采取后面战略的最小收益为16

固电视台1 会选择收益为18的战略——前面

电视台2:前面的策略是一个优超策略——前面

策略均衡为(前面,前面)

(3)如果电视台1先选择,结果有什么?若电视台2先选择呢?

(4)如果两家谈判合作,电视台1许诺将好节目放在前面,这许诺可信吗?结果能是什么? 电视台1 许诺将好节目放在前面的许诺不可信。 因为电视台2,前面为占优策略,

而在电视台2 ,选择前面的时候,电视台1 选择后面的收益要大于前面的收益。 所以,最终结果为(前面,后面)

36、如果将如下的囚徒困境博弈重复进行无穷次,惩罚机制为触发策略,贴现因子为δ。试问δ应满足什么条件,才存在子博弈完美纳什均衡?

参考答案:

由划线法求得该博弈的纯策略纳什均衡点为(不坦白,不坦白),均衡结果为(1,1),采用触发策略,局中人i 的策略组合s 的最好反应支付)s ,s (P m ax )s (i i i S s i i

i -∈=φ=5,P i (s*)=4,P i (s c

)=1。若存在子博弈完美纳什均衡,

必须满足:4

11545)s (P )s ()s (P )s (c i *i *i *i =--=-φ-φ≥δ,即只有当贴现因子δ>1/4时,才存在子博弈完美纳什均衡。

37、在Bertrand 价格博弈中,假定有n 个生产企业,需求函数为P=a-Q ,其中P 是市场价格,Q 是n 个生产企业的总供给量。假定博弈重复无穷多次,每次的价格都立即被观测到,企业使用“触发策略”(一旦某个企业选择垄断价格,则执行“冷酷策略”)。求使垄断价格可以作为完美均衡结果出现的最低贴现因子δ是多少。并请解释δ与n 的关系。 分析:此题可分解为3个步骤

(1)n 个企业合作,产量总和为垄断产量,价格为垄断价格,然后平分利润。

(2)其中一个企业采取欺骗手段降价,那个这家企业就占有的全部市场,获得垄断利润 (3)其他企业触发战略,将价格降到等于边际成本,所有的企业利润为零。 参考答案:

(1)设每个企业的边际成本为c ,固定成本为0 P=a-Q

TR=P*Q=(a-Q)*Q MR=a-2Q 因为:MR=MC a-2Q=c 则:Q=(a-c)/2 P=(a+c)/2

π=(P-c)*Q=(a-c)2/4 每家企业的利润为(a-c)2/4n

(2)假设A 企业自主降价,虽然只是微小的价格调整,但足以占领整个市场 ,获得所有的垄断利润——(a-c)2/4

(3)其他企业在下一期采取冷酷策略,使得所有企业的利润为0 考虑:

A 企业不降价: (a-c)2/4n , (a-c)2/4n , ……

A 企业降价: (a-c)2/4, 0, ……

使垄断价格可以作为完美均衡结果,就要使得不降价的贴现值大于等于降价的贴现值。 设贴现因子为δ

A 不降价的贴现值: [(a-c)2/4n][1/(1- δ)] A 降价的现值: (a-c)2/4

于是:[(a-c)2/4n][1/(1- δ)]≥ (a-c)2/4 解得: δ≥1-1/n

38、假设某劳动市场为完全竞争市场,其供求函数如下: S L

:W=120+2L D L

:W=360-L

已知某厂商(在完全竞争市场下)的生产函数为 f(L,K)=10L 0.5K 0.5

(K=100)

且其产品的需求与供给函数分别为 D:P=60-2q S: P=20+2q

试求 (a)该厂商的AC L

,MC L

及VMP L

各为多少?

(b)劳动工资为多少?厂商会雇用多少劳动? 由:S L

=D L

解得:W=280

由于产品市场为完全竞争市场,且要素市场也为完全竞争市场 所以,满足:产品市场均衡:P=MR=MC=W/MP L

要素市场均衡:W= AC L

=MC L

=VMP L

得到:AC L

=MC L

=VMP L

=280

由:D=S 解得:P= 40,q=10 厂商追求利润最大化的情况下:

W*=VMPL=P*MPL=P*50/L 0.5

L*=[100/2*PW*]2

=51 (取整数)

论述题(每小题20分,共20分)

解释“囚犯困境”,并举商业案例说明。

囚徒困境是博弈论里最著名的例子之一,几乎所有的博弈论著作中都要讨论这个例子。这个例子是这样的:两囚徒被指控是一宗罪案的同案犯。他们被分别关在不同的牢房无法互通信息。各囚徒都被要求坦白罪行。如果两囚徒都坦白,各将被判入狱5年;如果两人都不坦白,则很难对他们提起刑事诉讼,因而两囚徒可以期望被从轻发落入狱2年;另一方面,如果一个囚徒坦白而另一个囚徒不坦白,坦白的这个囚徒就只需入狱1年,而不坦白的囚徒将被判入狱10年。表6-2给出了囚徒困境的策略式表述。这里,每个囚徒都有两种策略:坦白或不坦白。表中的数字分别代表囚徒甲和乙的得益。(注意,这里的得益是负值。)

表6-2

囚徒困境

在囚徒困境这个模型中,纳什均衡就是双方都坦白,给定甲坦白的情况下,乙的最优策略是坦白;给定乙坦白的情况下,甲的最优策略也是坦白。而且这里双方都坦白不仅是纳什均衡,而且是一个上策(dominant strategy)均衡,即不论对方如何选择,个人的最优选择是坦白。因为如果乙不坦白,甲坦白的话就被轻判1年,不坦白的话就判2年,坦白比不坦白要好;如果乙坦白,甲坦白的话判5年,不坦白的话判10年,所以,坦白仍然比不坦白要好。这样,坦白就是甲的上策,当然也是乙的上策。其结果是双方都坦白。这个组合是纳什均衡。

寡头垄断厂商经常发现它们自己处于一种囚徒的困境。当寡头厂商选择产量时,如果寡头厂商们联合起来形成卡特尔,选择垄断利润最大化产量,每个厂商都可以得到更多的利润。但卡特尔协定不是一个纳什均衡,因为给定双方遵守协议的情况下,每个厂商都想增加生产,结果是每个厂商都只得到纳什均衡产量的利润,它远小于卡特尔产量下的利润。

《经济博弈论》期末考试复习

《经济博弈论》期末考试复习资料 第一章导论 1.博弈的概念: 博弈即一些个人、队组或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,并从中各自取得相应结果的过程。它包括四个要素:参与者,策略,次序和得益。 2.一个博弈的构成要素: 博弈模型有下列要素:(1)博弈方。即博弈中决策并承但结果的参与者.包括个人或组织等:(2)策略。即博弈方决策、选择的内容,包括行为取舍、经济活动水平或多种行为的特定组合等。各博弈方的策略选择范围称策略空间。每个博弈方各选一个策略构成一个策略组合。(3)进行博弈的次序:次序不同一般就是不同的博弈,即使博弈的其他方面都相同。(4)得益。各策略组合对应的各博弈方获得的数值结果,可以是经济利益,也可以是非经济利益折算的效用等。 3.合作博弈和非合作博弈的区别: 合作博弈:允许存在有约束力协议的博弈;非合作博弈:不允许存在有约束力协议的博弈。主要区别:人们的行为互相作用时,当事人能否达成一个具有约束力的协议。 假设博弈方是两个寡头企业,如果他们之间达成一个协议,联合最大化垄断利润,并且各自按这个协议生产,就是合作博弈。 如果达不成协议,或不遵守协议,每个企业都只选择自己的最优产品(价格),则是非合作博弈。 合作博弈:团体理性(效率高,公正,公平) 非合作博弈:个人理性,个人最优决策(可能有效率,可能无效率) 4.完全理性和有限理性: 完全理性:有完美的分析判断能力和不会犯选择行为的错误。 有限理性:博弈方的判断选择能力有缺陷。 区分两者的重要性在于如果决策者是有限理性的,那么他们的策略行为和博弈结果通常与在博弈方有完全理想假设的基础上的预测有很大差距,以完全理性为基础的博弈分析可能会失效。所以不能简单地假设各博弈方都完全理性。 5.个体理性和集体理性: 个体理性:以个体利益最大为目标;集体理性:追求集体利益最大化。 第一章课后题:2、4、5 2.设定一个博弈模型必须确定哪几个方面? 设定一个博弈必须确定的方面包括:(1)博弈方,即博弈中进行决策并承担结果的参与者;(2)策略(空间),即博弈方选择的内容,可以是方向、取舍选择,也可以是连续的数量水平等;(3)得益或得益函数,即博弈方行为、策略选择的相应后果、结果,必须是数量或者能够折算成数量;(4)博弈次序,即博弈方行为、选择的先后次序或者重复次数等;(5)信息结构,即博弈方相互对其他博弈方行为或最终利益

论经济博弈论

论经济博弈论 “博弈即一些个人、对组或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,各自取得相应结果的过程。”博弈由英文“game”翻译过来,过去每每听到博弈一词.都觉得这是一个高深莫测、充满神秘色彩的领域,如今通过了系统的学习,才终于可以对“博弈”有一些粗浅的理解。博弈论的英文名称为Gm,ne Theory,也翻译为对策论、游戏论。作为一门现代学科体系,博弈论早在半个世纪以前就已经出现,但长期以来并没有受到足够重视,除了少数博弈论专家以外,很少有人知道它。可是,近年来却受到高度的重视和青睐。1994 年三位致力于博弈论基础理论研究的经济学家共同获得了诺贝尔经济学奖,使得博弈论作为重要的经济学分支学科的地位和作用得到了最具权威性的肯定。此后1996年,诺贝尔经济学奖又由博弈论和信息经济学家莫里斯和维克瑞获得,这进一步肯定了博弈论在经济学中的重要地位,同时也从一个侧面体现出博弈理论已经渡过了成长期,步人了成熟期。 一、博弈论的发展进程 博弈论思想虽然有着悠久的历史,但是作为一门系统的学科来说还相当的年轻。近代以来,在学术研究的过程中许多学者逐渐认识到了博弈论的重要作用,对博弈理论进行了探索研究。一般认为,对于博弈理论的最早研究可以追溯到18世纪初。瓦德格拉夫(W aldegrave)在1713年提出了两人博弈的极小化极大混合策略解。古诺(Coumot)和波特兰德(Bertrand)分别在1838年和1883年提出了博弈论最经典的模型,两位学者分别从产茸决策和价格决策分析垄断的双寡头竞争模型,确定了在竞争之下各自的最优反应函数。但是作为一种理论来说,1944年,冯·诺依曼(VonNeumann)和奥·摩根斯坦(Morgenstem)合著了《博弈论与经济行为》在总结了以往关于博弈的研究成果的基础上,提出了博弈论的概念术语、一般框架和表述方法,提较系统的博弈理论,因此这被认为是博弈理论初步形成的标志。50年代初,纳什(J.Nash)的两篇非合作博弈论奠基性论文发表之后。博弈论飞速发展。作为博弈论的一部分,非合作博弈比合作博弈的发展更加迅速,在经济学等其他学科中的应用也更为广泛。提起博弈论,现在差不多总是指非合作博弈论。50年代以来,纳什(Nash)、泽尔腾(Sehen)、海萨尼(Harsanyi)等人是

生活中的博弈论试题和答案

1.假设三个人要在纸上写下金额,而且不可以说出来。他们必须在1元到100元之间挑一个整数(包括1和100),所编写数字最小的人则可以得到他所编写的金额。如果有平手的情形,总奖金则由赢的人平分。所以如果A写53元,B写22元,C写30元,则B可以得到22元;如果A写53元,B写22元,C也写22元,则B和C就会各自得到11元,因为他们要平分这22元。在所有人都很理性的情况下,找出这个博弈的合理结果,并给出分析过程。(10分) 答:(1)假设前提是所有人都很理性,那么,对于所有人,每人写100元都能得到最多的钱,但是这样每个人只能分到100元的三分之一,那么此时如果是A,在第一次博弈中为了得到最多的钱,便会写99元。 (2)当A想写99元时,B、C同样作这样的决策,那么此时三个人就只能每人获得33元,进而,又会重复之前的博弈。 (3)直到最后三个人都写了1元,因为三个人都非常的理性,而三个人之间又不够信任,就只能陷入困境,最终每个人只能会得到1块钱的三分之一。 2.你在9个信封里各装了100元,第10个信封里则没有装东西。你把这些信封混在一起,小张随便挑了一个信封打开来看。小李提议让他出一笔钱买下小张所挑选的信封,但他在提出这项建议时,并不知道小张的信封里有没有钱。小张可以接受小李的出价,也可以拒绝并把信封留下来。小李应该出多少钱买小张的信封?请说明理由。(10分)答:(1)如果小张小李都是理性人,那么根据概率方法,小李最多会出90元买信封,所以,小李的出钱范围是1-90元。 (2)而小张知道信封里到底有没有一百块钱,如果信封里有100,那么小李出任意小于100的数,小张都不会同意,在依据小李的出钱范围,小李会出1元。 (3)如果信封里没有100,那么小李出任意小于100的数,小张都会同意,在依据小李的出钱范围,小李出1元才是合理的。 (4)综合而言,无论里面有没有100元,小李都应该出1块钱买信封,如果小张同意,则小李便以1块钱买了一个信封。 3.在经济生活中,经常出现劣币会驱逐良币的现象,比如山寨手机对正规手机造成较大冲击,劣质商品大行其道等,请从博弈论和信息经济学(逆向选择)的角度进行解释,并谈谈你对山寨产品和山寨文化的看法。(11分) 答:(1)略 4. 在公共汽车上,两个陌生人可能会为了一个座位争吵,可如果他们认识就会相互谦让;在农村人们之间比较诚恳,一家有事全村人帮忙,可在城市生活的人们比较淡漠。请从博弈论的角度对上述现象进行解释。(12分) 答:(1)从博弈论角度看城市生活的人们之间人口流动比较大,一个人干了坏事,转眼便会消失在人群中,对方难以实施报复,就比如在火车上的东西都很贵一样属于一次博弈,

清华大学经济博弈论期末考试04

经济博弈论(2004年秋季学期)期末测验题答案 注意:请将所有题目的答案写在答题册上,写在本试题页上一律无效。 1. (20 points) Lucy offers to play the following game with Charlie: “Let us show pennies to each other, each choosing either heads or tails. If we both show heads, I pay you $3. If we both show tails, I pay you $1. If the two don’t match, you pay me $2.” Charlie reasons as follows. “The probability of both heads is 1/4, in which case I get $3. The probability of both tails is 1/4, in which case I get $1. The probability of no match is 1/2, and in that case I pay $2. So it is a fair game.” Is he right? If not, (a) why not, and (b) what is Lucy’s expected profit from the game?(game table, 5 points; solutions, 7 points; (a), 4 points; (b), 4 points) (20分)露西提出与查理玩下面的游戏:“让我们互相向对方亮出硬币,每个人可以选择正面或者背面。如果双方亮出的都是正面,我给你3美元。如果双方亮出的是背 面,我给你1美元。如果两枚硬币正背面不同,你给我2美元。”查理做了这样的推理: “两枚硬币都是正面的概率是1/4,如此我得到3美元。都是背面的概率为1/4,如此我 得到1美元。正背面不同的概率为1/2,如此我付出2美元。因此这是一个公平游戏。” 他的想法是否正确?如果不正确,(a)为什么不正确?(b)露西从游戏中得到的期望 利润是多少?(博弈表5分;解7分;(a)问4分;(b)问4分。) 解答: 该博弈为零和博弈。博弈表如下(5分): CHARLIE Head Tail LUCY Head -3 2 Tail 2 -1 求解博弈。容易看出,该零和博弈没有纯策略纳什均衡。(1分) 只有一个混合策略的纳什均衡为:露西和查理均以3/8的概率出正面,5/8的概率出背面。 (6分) (a)查理的推理不对。因为双方实际(策略性)选择的、出硬币的正背面的概率不同于完 全随机选择的概率(后者正背面概率各为1/2)。查理错误地将一个混合策略的博弈情境当成 了随机选择的“赌博”情境。(4分) (b)露西的期望利润为1/8。(4分)(相应的,查理的期望利润为-1/8,不要求) 2. (20 points) You have to decide whether to invest $100 in a friend’s enterprise, where in a year’s time the money will increase to $130. You have agreed that your friend will then repay you $120, keeping $10 for himself. But instead he may choose to run away with the whole $130. Any of your money that you don’t invest in your friend’s venture, you can invest elsewhere safely at the prevailing rate of interest r, and get $100(1+r) next year. (a) Draw the game tree for this situation and show the rollback equilibrium. (8 points) Next suppose this game is played repeatedly infinitely often. That is, each year you have the

经济博弈论

1、纳什均衡的概念。 对于任一个博弈游戏来讲,一定存在这么一组策略,使得其对于任一个局中人而言都是最好的,如果其它的所有局中人不改变他们的策略的话。 2、非合作博弈与合作博弈的区别。形成合作博弈的两个条件: (1)对联盟来说,整体收益大于其每个成员单独经营时的收益之和。 (2)对联盟内部而言,应存在具有帕累托改进性质的分配规则,即每个成员都能获得比不加入联盟时多一些的收益。 如何保证实现和满足这些条件,这是由合作博弈的本质特点决定的。也就是说,联盟内部成员之问的信息是可以互相交换的,所达成的协议必须强制执行。这些与非合作的策略型博弈中的每个局中人独立决策、没有义务去执行某种共同协议等特点形成了鲜明的对比。因此可以说:形成合作博弈的原因是在某种制度约束下的集体理性战胜了个人理性。 3、解释下列概念:纯策略、混合策略、策略组合、纳什均衡、贝叶斯均衡、反应函数 在完全信息博弈中,如果在每个给定信息下,只能选择一种特定策略,这个策略为纯策略。纯策略是混合策略的特例。 按照一定的概率,从一套“纯策略”中随机选取实际的对策,称为混合策略。混合策略是纯策略在空间上的概率分布,纯策略是混合策略的特例。 策略组合指参与者可能采取的所有行动方案的集合。策略集合必须有两个以上元素,否则,无所谓对策,只是独自决策。 所谓贝叶斯纳什均衡是指这样一组策略组合:在给定自己的特征和其他局中人特征的概率分布的情况下,每个局中人选择策略使自己的期望支付达到最大化,也就是说,没有人有积极性选择其他策略 反应函数,在无限策略的古诺博弈模型中,博弈方的策略有无限多种,因此各个博弈方的最佳对策也有无限种,它们之间往往构成一种连续函数的关系,把这个连续函数称为反应函数。4、解释下列概念:博弈、静态博弈和动态博弈、完全信息博弈和不完全信息博 弈、完美信息动态博弈和不完美信息动态博弈 博弈是指在一定的游戏规则约束下,基于直接相互作用的环境条件,各参与人依靠所掌握的信息,选择各自策略(行动),以实现利益最大化和风险成本最小化的过程。简单说就是人与人之间为了谋取利益而竞争。 静态博弈是指博弈中参与者同时采取行动,或者尽管参与者行动的采取有先后顺序,但后行动的人不知道先采取行动的人采取的是什么行动。 动态博弈是指参与人的行动有先后顺序,而且行动在后者可以观察到行动在先者的选择,并据此作出相应的选择。 完全信息博弈:是指每一参与者都拥有所有其他参与者的特征、策略集及得益函数等方面的准确信息的博弈。 不完全信息博弈,也称贝叶斯博弈,是指对其他参与人的特征、策略空间及收益函数信息了解的不够准确、或者不是对所有参与人的特征、策略空间及收益函数都有准确的信息,在这种情况下进行的博弈就是不完全信息博弈。博弈参与者对于对手的收益函数没有完全信息。 完全信息动态博弈,是指博弈中信息是完全的,即双方都掌握参与者对他参与人的战略空间和战略组合下的支付函数有完全的了解,但行动是有先后顺序的,后动者可以观察到前者的行动,了解前者行动的所有信息,而且一般都会持续一个较长时期。 不完美信息动态博弈,在动态博弈中,在不完全信息条件下,至少有一个局中人对其他某些局中人的收益不清楚。由于行动有先后顺序,后行动者可以通过观察先行动者的行为,获得有关先行动者的信息,从而证实或修正自己对先行动者的行动。 6、在公司制企业中,股东、经理、债券人、顾客、供货商等都被称为利益相关者。试分析不同

经济博弈论

用博弈论解释需求定理 企研08 282120202001 胡雁南 摘要:经济学中需求是指消费者在某一特定的时期内,在每一价格上愿意并且能够购买的商品和劳务的数量。需求定理或称需求规律,表明了某商品的价格与其需求量之间的关系。其基本内容是:在其他条件不变的情况下,某种商品的需求量与价格之间成反方向变动,即某种商品价格上升,则其需求量减少;反之,需求量增加。 一、背景介绍 商品的交易可以理解为供给者与需求者相互之间的博弈。供给者提供商品的时候可以考虑索取高价或者低价,需求者则考虑选择购买或者不购买。需求者对商品的需求是指消费者在某一特定的时期内,在每一价格上愿意并且能够购买的商品和劳务的数量。消费者对商品的需求量是指在某一特定时期内,消费者在特定价格水平上愿意并且能够购买的商品和劳务的数量。 很多因素都可能影响商品的需求,有经济因素,也有非经济因素。其影响因素主要有:1,商品本身的价格。商品本身价格高,需求少;价格低,需求多。2,消费者的偏好。一个消费者偏好某种商品,即使这种商品的价格不变,需求量也会增加。3,消费者的收入。当消费者收入增加时,消费者对某些商品在一定价格下的需求量也会增加,对另一些商品在一定价格下的需求量则可能会减少。4,其它商品的价格。有两种情况:两种商品为替代品,如果商品的价格上升则对其替代品的需求量就会增加(如茶叶和咖啡),反之亦然;两种商品为互补品,商品的价格上升会导致对其互补品需求量的下降(如汽车和轮胎),反之亦然。 本文将利用博弈论,通过建立一个供给者与需求者之间的博弈模型,来解释价格对消费者购买行为的影响。 二、博弈模型的建立

根据需求理论可以建立起供给者与需求者(为叙述方便,下文简称卖方和买方)的博弈模型。我们作如下假设: 假设1:两个参与者——卖方,买方。参与人Ⅰ是卖方,参与人Ⅱ是买方。 假设2:卖方仅提供一种商品A ,该商品仅有一种替代品B 。商品A 的单价为 1P ,商品B 的单价为2P ,买方的总购买能力为M ,M 总是不变。 假设3: 依据以上假设,可建立博弈模型的支付矩阵如表1-1. 表1-1 卖方与买方的支付矩阵 买方 购买y 不购买(1-y ) 卖 方 低价x (111CQ Q P -,111Q P CQ -) (1CQ ,11Q P ) 高价(1-x ) (*1*1*1CQ Q P -,*1*1*1Q P CQ -) (*1CQ ,* 1*1Q P ) 其中: 1P 是卖方采取低价时商品A 的价格; 1Q 是商品A 的价格为1P 时的需求量; C 是每件商品A 的成本; 当买方购买商品A 时付出购买商品的价格11Q P ,同时得到商品的成本1CQ ,于是买方购买商品时的支付为111Q P CQ -;而卖方则得到买方付给的价格但同时交付商品的成本,于是卖方的支付为111CQ Q P -; 当买方未购买商品A 时,卖方仍然持有商品的成本1CQ ,而买方仍然保有着商品的价格11Q P 。 当商家采取更高的价格* 1P 时,同理。 x 和y 分别代表卖方出低价和买方选择购买的概率。 三、模型的分析 首先用划线法分析表1-1:

浅谈经济博弈论

浅谈经济博弈论 姓名:李欣航学号:20081065 班级:02310802 人生如梦亦如戏,游戏人生,就要猜透别人怎么想,博弈论就是告诉你怎么跟人打交道,如何参透别人的心思。同时,用博弈论观照一些所谓的千古美谈,会发现那其实是无稽之谈。比如诸葛亮,其实远非司马懿之对手。 从一则故事说起,这个故事需要动点脑筋。 有五个海盗,劫掠了100两金子,需要分赃。办法是抓阄,盗亦有道。 抓到第一个阄的人,可以先提出一个分配方案,如果他的方案被一半以上的人同意,就照他的方案分金子,否则,第一个人就要被杀掉。余下的人也照此办理。 我们的问题是:如果你是第一个人,你会提出怎样的分配方案? 为了分析问题更确定,我们假定每个人都是追求自己利益极大化的人。

可能你会提出平均分配,每人20两,或者自己不要,等等。 可是正确的答案却并非如此。第一个人会说:“100两金子全归我!” 而且这个方案一定会被一半以上的人同意,这个人不会被杀掉。 这个问题比较复杂,当遇到复杂的问题时,我们可以从最后的环节开始考虑,这样,可以使问题清晰起来。 那我们就从抓到最后一个阄的人开始考虑。对于这个人来说,他知道,当轮到他提方案的时候,其他人都已经死掉了,金子将全是他一个人的。所以,他利益最大化行为便是,不管前边谁,包括第一个人,提了任何方案,他都一概摇头,不同意。 再看第四个人,他知道,不管自己提出什么方案,第五个人都不会同意,都会被杀掉,所以,他的利益最大化行为是,尽量不要轮到自己提方案。所以,不管第一个人提了怎样的方案,他都会表示同意。

第三个人,知道第四和第五个人的选择策略,所以,他的利益最大化的方案是100两金子全归自己。这个方案,因为自己和第四个人同意,超过了此时的一半以上的人的同意,可以行得通,所以,不管第一个人提出什么样的方案,第三个人都会反对。 第二个人,知道自己提什么方案,第三个人、第五个人都将反对,一旦轮到自己提,自己就死定了,所以,他会同意第一个人提出的任何方案,这是他的利益最大化行为。 所以,不管第一个人提出怎样的方案,第二个人与第四个人都会同意,加上第一个人自己的票,就是三票,一半以上,可以通过。 既然任何方案都可以通过,而第一个人又要追求自己利益的极大化,所以,他的方案是:100两金子全归自己。 这个例子告诉我们,想问题,确实需要方法论,靠直觉是不可以的,直觉在很多情况下是错误的,必须依靠方法,依靠逻辑的力量。 很多问题看起来没有头绪,是因为没有找到解决问题的路径,而方法的作用,就是帮我们找到切入点,找到了切入点,问

经济博弈论复习

《经济博弈论》复习精要 一.题型分值: 1.名词解释:4分* 5 = 20分; 2.判断题:2分* 10 = 20分; 3.简答题:7分*3=21分; 4.计算题:9分*1+10分*3=39分. 二.名词解释(4分* 5 = 20分,5题,共20 题) 1.博弈:指策略对抗,或策略有关键作用的游戏;博弈即一些个人、队组或其它 组织,面对一定的坏境条件,在一定的规则下,同时或先后,一次或多 次,从各自允许选择的行为或策略中进行选择并加以实施,各自取得相 应结果的过程。 2.博弈论(Game Theory):指系统研究各种各样博弈中参与人的合理选择及其 均衡的理论,该理论思想的主要特征是博弈中各 参与人的策略和得益相互依存、相互依赖。 3.策略:博弈中各博弈方的选择内容(每个博弈方可选策略不一定完全相同, 即不一定对称) 4.得益:各博弈方从博弈中所获得的利益(利润、收入、量化的效用、社会 效益、福利等,有效用,有损失) 5.上策均衡:一个博弈的某个策略组合中的所有策略都是各个博弈方各自的 上策,必然是该博弈比较稳定的结果。 6.严格下策:不管其它博弈方策略如何变化,给一个博弈方带来的收益总是 比另一策略给他带来收益小的策略。(严格下策反复消去法)7.划线法:指用策略之间的相对优劣关系,而不是绝对优劣关系来进行博弈 选择以求纳什均衡的方法。(划线法的思路是先找出每个博弈方针 对其他博弈方所有策略(或策略组合)的最佳对策,然后再找出相 互构成最佳对策的各博弈方策略组成的策略组合,即纳什均衡) 8.纳什均衡:使每个参与人的策略是对其他参与人策略的最优反应的策略组合。 9. 反应函数:指一博弈方对另一博弈方每种可能的决策内容的最佳反应决策所 构成的函数。 10.帕累托上策均衡:指多重纳什均衡中给所有博弈方带来的得益都大于其他所 有纳什均衡带来的得益的那个纳什均衡。 11. 风险上策均衡:如果所有博弈方在预计其他博弈方采用各种策略的概率相同 时,能给博弈方带来最大期望得益,且被各博弈方偏爱策 略组合。 12.逆推归纳法:指从动态博弈的最后一个阶段博弈方的行为开始分析,逐步 倒推回前一个阶段相应博弈方的行为选择,一直到第一个 阶段的分析方法。 13.子博弈:指由一个动态博弈第一阶段以外的某阶段开始的后续博弈阶段构 成的,有初始信息集和进行博弈所需要的全部信息,能够 自成一个博弈的原博弈部分。 14.子博弈完美纳什均衡:指如果一个完美信息的动态博弈中,各博弈方的策

博弈论复习题及答案

博弈论 判断题(每小题1分,共15分) 囚徒困境说明个人的理性选择不一定是集体的理性选择。(√) 子博弈精炼纳什均衡不是一个纳什均衡。(×) 若一个博弈出现了皆大欢喜的结局,说明该博弈是一个合作的正和博弈。()博弈中知道越多的一方越有利。(×) 纳什均衡一定是上策均衡。(×) 上策均衡一定是纳什均衡。(√) 在一个博弈中只可能存在一个纳什均衡。(×) 在一个博弈中博弈方可以有很多个。(√) 在一个博弈中如果存在多个纳什均衡则不存在上策均衡。(√) 在博弈中纳什均衡是博弈双方能获得的最好结果。(×) 在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。(×)上策均衡是帕累托最优的均衡。(×) 因为零和博弈中博弈方之间关系都是竞争性的、对立的,因此零和博弈就是非合作博弈。 (×) 在动态博弈中,因为后行动的博弈方可以先观察对方行为后再选择行为,因此总是有利的。(×) 在博弈中存在着先动优势和后动优势,所以后行动的人不一定总有利,例如:在斯塔克伯格模型中,企业就可能具有先动优势。 囚徒的困境博弈中两个囚徒之所以会处于困境,无法得到较理想的结果,是因为两囚徒都不在乎坐牢时间长短本身,只在乎不能比对方坐牢的时间更长。 (×) 纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。(√)不存在纯战略纳什均衡和存在惟一的纯战略纳什均衡,作为原博弈构成的有限次重复博弈,共同特点是重复博弈本质上不过是原博弈的简单重复,重复博弈的子博弈完美纳什均衡就是每次重复采用原博弈的纳什均衡。(√) 多个纯战略纳什均衡博弈的有限次重复博弈子博弈完美纳什均衡路径:两阶段都采用原博弈同一个纯战略纳什均衡,或者轮流采用不同纯战略纳什均衡,或者两次都采用混合战略纳什均衡,或者混合战略和纯战略轮流采用。(√) 如果阶段博弈G={A1, A2,…,An; u1, u2,…,un)具有多重Nash均衡,那么可能(但不必)存在重复博弈G(T)的子博弈完美均衡结局,其中对于任意的t

四川农业大学经济博弈论(本科)期末考试高分题库全集含答案

106307--四川农业大学经济博弈论(本科)期末备考题库106307奥鹏期末考试题库合集 单选题: (1)下面的例子中,()可以说明古诺模型。 A.两商店的距离 B.偏远农产品市场上两大西瓜种植垄断商的价格竞争 C.偏远农产品市场上两大西瓜种植垄断商的产量竞争 D.彩电的尺寸偏好差异 正确答案:C (2)探讨一下在“切蛋糕博弈”中,甲首先负责切蛋糕,而乙负责分配蛋糕,那乙有什么优势呢?() A.先动优势 B.后动优势 C.绝对优势 D.相对优势 正确答案:A (3)博弈中,局中人从一个博弈中得到的结果被称为() A.收益 B.支付 C.决策 D.利润 正确答案:B

(4)信号传递博弈在产业组织理论中的第一个应用是 ( ) A.斯坦克尔伯格模型 B.罗伯兹垄断限价模型 C.古诺模型 D.伯特兰德模型 正确答案:B (5)关于战略式与扩展式,以下命题正确的是 A.战略式方法只能表述静态博弈 B.扩展式方法不能表述无限博弈 C.扩展式方法只能表述动态博弈 D.扩展式与战略式可相互转换 正确答案:D (6)子博弈精炼纳什均衡是:() A.一个纳什均衡 B.不是一个纳什均衡 C.和纳什均衡没有关系 D.不是每一个博弈都有子博弈精炼纳什均衡 正确答案:B (7)经常听到家长对小孩子说:“除非你把碗里的蔬菜吃完,否则不准你吃糖果”,这句话是什么呢?() A.承诺 B.威胁

C.允诺 D.批评 正确答案:B (8)博弈论中,局中人从一个博弈中得到的结果常被称为() A.效用 B.支付 C.决策 D.利润 正确答案:B (9)“人不犯我,我不犯人;人若犯我,我必犯人”是博弈中的() A.策略 B.行动 C.均衡 D.结果 正确答案:A (10)()在1944出版的巨著《博弈论和经济行为》标志着现代博弈论的诞生呢? A.纳什 B.泽尔藤 C.塔克 D.冯?诺伊曼 正确答案:D

经济博弈论论文

经济博弈论论文 生活中的博弈 “博弈”一个围绕在每个人身边,却很少去深刻思考的生涩词汇,刚刚接 触这门学科的时候很多人不经要问:什么是博弈?书上是这样定义的:博弈是 指一些个人或者组织面对一定的环境条件,在一定的规则下同时或先后一次或 多次从各自允许选择夫人行为或策略中进行选择并加以实施,进而各自取得相 应结果的过程。 “弈”在中国古代是指围棋,“博弈”则是指对局和下棋,对手之间采取相互策略的行为。现代科学将这种“对策论”“对局理论”称之为博弈论。罗伯 特?尔曼是这样定义它的“策略性的互动决策”。用一句话简单概括博弈论就是 一套研究互动决策行为的理论。很多是人认为博弈论高深莫测,普通人难以触碰。这种想法是错误的,在中国古代很早就有了含有博弈思想的“田忌赛马” 的典故。其实我们每个人每天都在经历着大大小小的各种博弈。 一:购物中的博弈理论 经济学的最基本的假设就是经纪人或者理性人的目的就在于使收益最大化。参与博弈者正是为了自身收益的最大化而互相竞争。也就是说,参与博弈的各 方形成互相竞争、互相对抗的关系,以争得利益的多少来决定胜负,一定的外 部条件又决定了竞争和对抗的具体形式,这就形成了博弈在这个过程中双方各 自独立决策,但是双方的决策和利益具有相互依从关。 女生在外出购物时与老板砍价就是一场两方博弈。双方博弈的目的是利益,

利益形成博弈的基础。在购物砍价这类博弈中女生占据很大的优势,而男生则 相对较弱些在日常生活中,男生陪女朋友逛街买衣服经常会遇到这样一种情况,面对女朋友选择的高价衣服此时是否要砍价?此时就出现了一场单方博弈。作 为理性的人,首先可以做两种假设:①砍价,结果可能在女生面前显得很小气(不管女生觉不觉得,男生本身会有这种压力);②不砍,可能被商家出高价坑了。而对于商家而言也是一个单方博弈,一般商家有两种定价策略,①一种是 预料到顾客会砍价,于是故意定一个高价,给顾客砍价空间,也满足顾客的心 理需求;②一种是明码实价,坚定地拒绝顾客的砍价。如果男生选择砍价,商 家选择给高价,双方讨价还价就开始了一个新的两方博弈。在着这种供求关系下,买家在某一价格下,想以此价格买此商品,而想卖的人愿意在此价格下 卖出,此时达到了均衡。最终双方做出一个相对合理的决策,既满足男生的需求又保障商家有利可赚,这样才有了交易的完成,对于双方而言都是最优决策 达到均衡。 随着网络技术的发展网购成为很多人的新宠,在我们的身边非常普遍。在网上购物活动中,交易也可看作是一次博弈。交易者在进行交易及其信用模式 的选择时,做如下基本假设:①网购中交易者只存在两个参与人:买方和卖方, 且二者都是理性,同时不同的交易对象交易仅一次;②参与人在选择战略时,把其他参与人的战略当作给定;③虚拟市场信息是完全的;④无政府等第三方人干预;⑤双方的交易决策抽象为两种理想情况:守信和不守信;⑥买卖双方行动是同时进行的。 他们在进行交易时会面临以下三种情况:①交易双方都守信;②交易双方中 只有一方守信;③交易双方都不守信。整个交易活动中成员的守信情况就构成了社会的信用环境。如果双方都守信,那么他们的收益各为A,如果只有一方守信,则守信一方的收益为-A,不守信一方的收益为2A;如果双方都不守信,则 交易无法完成,双方收益为0。

经济博弈论试卷B.

一、填空题( 5 × 2 = 10 分) 1. 按 照 信 息 的 完 全 与 否 , 博 弈 模 型 可 划 分 为 5. 承诺行动可以划分为两类: 与 . 二、选择题( 5 × 2 = 10 分) 6. 图 1 所示博弈是一个( ). 贵 州 财 经 学 院 2010—2011 学年第一学期期末考试试卷 试卷名称: 经济博弈论(B 卷) 与 . 2. 提出连锁店悖论的博弈论学者是 . 3. 不完全信息动态博弈的解称之为 . 4. 信号博弈的均衡可划分为三类: , 以及准分离均衡. A. 完全信息静态博弈 C. 不完全信息静态博弈

B卷第1页(共6页)

三、判断题( 5 × 2 = 10 分) 11. 囚徒困境的结果是帕累托有效的. 0,0,0-1,1,2 1,-1,-12,-2,2 -1,1,2-3,3,3 2,-2,-24,-4,-4 图1 第 6-10 题博弈树 7. 在图 1 所示博弈中, 参与人 1, 参与人 2, 以及参与人 3 的信息 集个数分别是( ). A. 1,2,4 B. 1,4,4 C. 1,1,1 D. 1,2,8 8. 在图 1 所示博弈中, 参与人 1, 参与人 2, 以及参与人 3 的纯战 略个数分别是( ). A. 2,2,2 B. 2,4,2 C. 2,4,16 D. 2,2,8 9. 下列选项属于图 1 所示博弈的均衡结果的是( ). A. 行动组合(L,L,R) B. 行动组合(L,R,L) C. 行动组合(R,L,L) D. 行动组合(R,R,R) 10. 图 1 所示博弈子博弈与后续博弈的个数分别是( ). A. 1,3 B. 2,6 C. 3,7 D. 7,7 ( )

经济博弈论论文

博弈论及其在现代经济生活中的应用 工造3班 魏XX [摘要]:本文从“囚徒困境模型”和“智猪博弈模型”两个方面来阐述博弈论及其 在现代经济生活中的运用。 [关键词]:博弈论囚徒困境模型智猪博弈模型应用 [正文]: 有一个典型的案例:甲乙两人合伙作案,结果被警察抓了起来,分别被隔离 审讯。在不能互通信息的情形下———也就是不知道对方是坦白还是缄默的前提 下,每个嫌疑犯都可以作出自己的选择:或者供出同伙,即与警察合作,从而背 叛同伙;或者保持沉默,也就是与同伙合作,而不是与警察合作。这样会出现以 下几种情况:如果两人都不坦白,警察会因证据不足而将两人各判刑! 年;如果 一人招供而另外一人不招,坦白者作为证人将不会被起诉,另一人将会被重判!" 年;如果两人都招供,则会因罪名成立各判!# 年。这两个嫌疑犯该怎么办呢? 是选择合作还是互相背叛?从表面上看,他们应该互相合作,保持沉默,因为这 样对他们整体而言是最好的结果———都只判!年。但是他们不得不仔细考虑对 方可能采取的选择。问题就这样开始了,两个人都十分精明,而且只关心减少自 己的刑期,并不会在乎对方被判多少年。每个人都会这样推理:假如对方不招, 我只要一招供,马上可以获得自由,而不招却要坐牢! 年,显然招比不招好;假 如对方招了,我若不招,则要坐牢!" 年。招了只要坐牢!# 年,显然还是招更好 些。可见,对方无论招或者不招,我的最佳选择都是招认。两个人都会基于同样 的想法作出招供的选择,这对他们个人来说都是最佳策略,但对整体而言却是一 个最差的结果。 这就是博弈论的一个经典模型———“囚徒困境模型”。作为一种关于决策和 策略的理论,博弈论其实就在我们身边,它研究的许多例子来自于日常生活和经 济活动中的游戏和事物。 博弈的英文即,中文译为“博弈”是非常传神和贴切的,因为中国古代称下棋 为“弈”,“博”则含有争斗的意思。在下棋这样的游戏中有一个重要的特点:即策 略在其中起着举足轻重的影响和作用。精明慎重的棋手们相互揣摩、相互牵制, 人人争赢,布每一个棋子时,都必须考虑到对手的策略选择,从而选择自己的最 佳策略。这也就是博弈的核心问题:决策主体的一方行动后,参与博弈的其他人 将会采取什么行动?参与人为取得最佳效果应采取怎样的对策?我们可以将博 弈论定义为:一些个人、一些团队或其他组织,面对一定的环境条件,在一定的 规则约束下,依靠所掌握的信息,同时或先后,一次或多次,从各自允许选择的 行为或策略进行选择并加以实施,并从中各自取得相应结果或收益的过程。博弈 论是(# 世纪四五十年代发展起来的。美国经济学家冯?诺依曼与奥斯卡?摩根斯特 恩于!)**年合著的《博弈论与经济行为》被公认为博弈论诞生的标志。 博弈论可以分为合作博弈理论和非合作博弈理论。前者主要强调的是集体理 性;而后者主要研究人们在利益相互影响的局势中如何选择策略使自己的收益最 大,强调的是个人理性。所谓“个人理性”是反映个体的行为始终都是以实现自身 的最大利益为惟一目标,除非是为了实现自身利益的需要,否则不会考虑其他的 个体或社会利益这样一种决策原则。非合作博弈要求各参与人之间不能存在任何

经济博弈论第三版

经济博弈论第三版习题 博弈论 判断题(每小题1分,共15分) 囚徒困境说明个人的理性选择不一定是集体的理性选择。(√) 子博弈精炼纳什均衡不是一个纳什均衡。(×) 若一个博弈出现了皆大欢喜的结局,说明该博弈是一个合作的正和博弈。() 博弈中知道越多的一方越有利。(×) 纳什均衡一定是上策均衡。(×) 上策均衡一定是纳什均衡。(√) 在一个博弈中只可能存在一个纳什均衡。(×) 在一个博弈中博弈方可以有很多个。(√) 在一个博弈中如果存在多个纳什均衡则不存在上策均衡。(√) 在博弈中纳什均衡是博弈双方能获得的最好结果。(×) 在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。(×) 上策均衡是帕累托最优的均衡。(×) 因为零和博弈中博弈方之间关系都是竞争性的、对立的,因此零和博弈就是非合作博弈。 (×) 在动态博弈中,因为后行动的博弈方可以先观察对方行为后再选择行为,因此总是有利的。(×) 在博弈中存在着先动优势和后动优势,所以后行动的人不一定总有利,例如:在斯塔克伯格模型中,企业就可能具有先动优势。 囚徒的困境博弈中两个囚徒之所以会处于困境,无法得到较理想的结果,是因为两囚徒都不在乎坐牢时间长短本身,只在乎不能比对方坐牢的时间更长。 (×) 纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。(√) 不存在纯战略纳什均衡和存在惟一的纯战略纳什均衡,作为原博弈构成的有限次重复博弈,共同特点是重复博弈本质上不过是原博弈的简单重复,重复博弈的子博弈完美纳什均衡就是每次重复采用原博弈的纳什均衡。(√) 多个纯战略纳什均衡博弈的有限次重复博弈子博弈完美纳什均衡路径:两阶段都采用原博弈同一个纯战略纳什均衡,或者轮流采用不同纯战略纳什均衡,或者两次都采用混合战略纳什均衡,或者混合战略和纯战略轮流采用。(√) 如果阶段博弈G={A1, A2,…,An; u1, u2,…,un)具有多重Nash均衡,那么可能(但不必)存在重复博弈G(T)的子博弈完美均衡结局,其中对于任意的t

经济博弈论在实际生活中的运用

无人打扫的寝室 ——《博弈论》知识在现实生活中的应用 XXX 课程:经济博弈论 指导老师:XXX 这个学期我选修了肖老师的公共选修课《经济博弈论》,原本以为听起来高大上的课程会是一门高深枯燥的理论课,但是,在通过对这门课的初步学习和了解后,让我认识到博弈论的应用实际上在生活中是随处可见的。 最重要的一点是,我学会了运用博弈论中的一些经典模型来解决生活中的一些实际的问题。 在《博弈论》私人最优决策中的“修路博弈”时明确提到:在“成本由个人付出,而利益大家均占”的情况下,大家的最优策略都是不修路,最好是有一个人修路,由大家共同均占修路得来的利益。下面结合我在现实生活中的一个实际事例来分享一下我对“修路博弈”的理解与体会。 「问题描述」 我们学校的每间宿舍里一共有6名同学一起居住。由于一开始就没有安排值日的相关规则,所以寝室的公共区卫生也就靠大家的自觉偶尔打扫一下!开始一段时间,我们还会不时主动打扫。可时间一长打扫人数却越来越少,打扫的次数也越来越少……由于现在已经正直夏天的原因,每当看到地面脏乱不堪,无奈之下,我只好赶自己主动多打扫寝室卫生。 可是每每此时,我的心头总会产生一个疑问:明明宿舍里的每个同学都很爱干净,可为什么大家似乎都不太主动来打扫寝室公共卫生呢? 「建模与求解」 针对以上背景,对于我和我的舍友来讲,我们都需要一个地面洁净、空气清新的寝室环境,都希望能够有人能主动打扫寝室公共区卫生。 下面我们来建立一个博弈模型: 首先,假设把我们一共分为两组,一组是我,以字母A表示;另一组是我的舍友,以字母B表示。 其次,假设A和B的选择有两种:打扫或者不打扫。 然后,我们再次假设打扫卫生的成本为4,而我的舍友从打扫干净的卫生获得的好处为3;如果A和B联合打扫卫生,则每个人获得净好处为3-4/2=1;当只有A或B一个人打扫卫生时,打扫卫生的人得到的好处是3-4=-1,而没有打扫卫生的人的好处却是3-0=3. 最后,我们就按照以上的假设画出我们的博弈支付矩阵, 如下图:

经济博弈论教案

学习好资料欢迎下载 福州海峡职业技术学院教案 课程名称经济博弈论 授课班级 授课教师陈亮贤 总学时 3 2

《经济博弈论》教案 第一章导论 教学目的和要求: 通过本节课的学习,使学生了解什么是博弈,产生学习博弈理论的初步兴趣,同时要求学生掌握几类经典的博弈类型并能应用于现实生活中的相应案例,同时对博弈结构和分类有比较清晰的认识。 教学重点、难点: 博弈的定义、囚徒困境、产量决策的古诺模型、博弈策略。 教学方法: 讲授法与讨论法相结合,并结合案例进行分析。 主要参考资料 1、《妙趣横生博弈论》,阿维纳什K.迪克西特(Avinash K.Dixit), 巴里J.奈尔伯夫(Barry J.Nalebuff)编著,董志强、王尔山、李文霞译,机械工业出版社,第1版(2009年8月1日); 2、《博弈论教程》罗支峰编著,清华大学出版社,北京交通大学出版社,第1版(2007年9月1日)。 教学时数: 2课时 教学内容: 一、导入新课程:什么是博弈 学习一门新课程之前,我们首先要了解下这门课程名称:什么是“博弈”? 博弈,根据《辞海》的解释,就是在多决策主体之间行为具有相互作用时,各主体根据所掌握信息及对自身能力的认知,做出有利于自己的决策的一种行为。说到底,博弈就是决策行为。 (一)从游戏到博弈 博弈起源于游戏中的策略对抗,因此博弈也可以定义为“策略起关键作用的游戏”,在英文中,“博弈”单词为Game,“博弈论”也即为Game Theory,

Game即游戏、竞技。 游戏和经济决策竞争有一些共同要素及特征,如:规则、结果、策略选择,策略和利益相互依存,策略的关键作用。例如: 游戏——下棋、猜大小 经济——寡头产量决策、市场阻入、投标拍卖 政治、军事——美国和伊拉克、以色列和巴勒斯坦 (二)一个非技术性定义 博弈——就是一些个人、队组或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,各自取得相应结果的过程。博弈有四个核心方面: 博弈的参加者(Player)——博弈方 各博弈方的策略(Strategies)或行为(Actions) 博弈的次序(Order) 博弈方的得益(Payoffs) 二、几个经典博弈模型 (一)囚徒的困境 一个经典的“囚徒困境”模型:话说有一天,一位富翁在家中被杀,财物被盗。警方在此案的侦破过程中,抓到两个犯罪嫌疑人A和B,并从他们的住处搜出被害人家中丢失的财物。但是,他们都矢口否认曾杀过人,辩称是先发现富翁被杀,然后只是顺手牵羊偷了点儿东西。于是警方将两人隔离审讯。这个时候,聪明的警官找他们谈话,分别告诉他们说:“你们的偷盗罪确凿,所以可以判你们1年刑期。但是,我可以和你做个交易: 如果你招了,他不招,那么你会作为证人无罪释放,他将被判8年徒刑; 如果你招了,他也招了,你们都将被判5年有期徒刑; 如果他招了,你不招,他无罪释放,你被判8年徒刑; 如果你们都不招,各判1年。” 根据这个模型,我们可以得出嫌疑人A、B的得益矩阵:

相关主题
文本预览
相关文档 最新文档