当前位置:文档之家› 经济博弈论(第三章)

经济博弈论(第三章)

经济博弈论(第三章)
经济博弈论(第三章)

第三章完全信息动态博弈

上一章介绍了完全信息静态博弈,本章在前面的基础上探讨完全信息动态博弈。现实社会经济活动的决策大多数是有先后顺序的行为而不是同时选择的行为,而且后行者能够看到先行者的决策内容,在先行者的决策结果之后再定夺自己的策略。这样的经济行为比比皆是,如商业活动中的讨价还价,拍卖活动中的轮流竞价,资本市场上的收购兼并和反收购兼并都是如此。依次选择与一次性同时选择有很大的差异,因此这种决策问题构成的博弈也是从时间序列上有别于静态博弈的,我们称之为“动态博弈”(Dynamic Games)。例如下象棋通常需要两个参与人,我们定义为红方和黑方,红方先走,黑方后走,这是一个典型的完全信息动态博弈。

动态博弈由于添加了时间因素,因而更加贴近现实。根据博弈方是否相互了解得益情况,可分为“完全信息动态博弈”和“不完全信息动态博弈”,根据是否所有博弈方都对自己选择前的博弈过程完全了解,可分为“完美信息动态博弈”和“不完美信息动态博弈”。

在本章中,我们首先对博弈的扩展式表达给出完整的定义,为动态博弈的分析奠定基础;其次,我们从扩展式表述博弈的纳什均衡分析逐步深入到子博弈精炼纳什均衡,为动态博弈的分析提供可行的方法,接下来介绍两种完全信息动态博弈经典模型;最后,分析具有无穷次的重复博弈,推导出无名氏定理。

3.1 博弈的扩展式表述

在动态博弈中,博弈方的行动是有先后次序的,且后行动者在自己行动之前能够观测到先行动者的行动,每个博弈方的一次选择行为常称为一个“阶段”(Stage )。动态博弈中也可能存在几个博弈方同时选择的情况,这时博弈方的同时选择构成一个阶段。一个动态博弈至少有两个阶段,因此动态博弈有时也称为“多阶段博弈”(Multistage Games )。此外,也有把动态博弈称为“序列博弈”(Sequential Games )的,这也是由动态博弈中的次序特征引出来的。

设有一个商人要从A 地向B 地运输一批货物。假设从A 地到B 地有水、陆两条路线,走陆路运输成本为10000元,而走水路的运输成本为7000元。不过走陆路比较安全,而走水路有一定的风险,即可能会遇到恶劣的暴风雨天气会造成相当于这批货物总价值10%的损失。再假设已知该批货物的总价值为90000元,运输期间出现暴风雨天气的概率为1/4,问该商人应选择哪条运输路线?

该博弈中博弈方在面临决策时面临的条件中有一个不确定因素,即商人不知道运输期间的实际天气情况会怎样,所知道的只是出现坏天气、好天气的概率分布。对这个博弈我们同样可用得益矩阵和扩展式两种方法来表示,只是为了把天气因素放进博弈中加以考虑,我们可以引进一个代表随机选择作用的博弈方,这个博弈方就是“大自然”(Nature ),我们常常称它为“博弈方0”,在该博弈中,决策者商人称为“博弈方1”。上述博弈方0的任务就是分别以3/4的概率和1/4的概率随机选择好天气和坏天气。博弈方0不会有追求“自身利益”的愿望,不用我们去考虑它的得益。因此这个博弈方0与一般博弈方是不同的,也是我们称它为“博弈方0”的原因所在。

如果我们以商人的运输成本或者加上损失的负值作为商人的得益,则可以用图3.1中的得益矩阵表示该博弈。

自 然

好天气75% 坏天气25%

商 水路

人 陆路

图3.1 运输路线得益矩阵

图3.1中商人和自然为两个博弈方;商人有水路、陆路两种可选策略,自然则有好天气、坏天气两种可能的选择;由于商人决策时不知道未来天气的实际情况(即自然对天气的选择可以被看作在商人决策前早就做出的),而自然在选择天气时当然更不会去管商人做了怎样的决策,因此该博弈中的两博弈方可以看作是同时决策的;矩阵中的四个元素分别代表商人在四种可能情况下的得益(成本和损失的负值),自然的得益则不用考虑。

如果用扩展行来表示博弈,则如图3.2所示。 -7000 -16000 -10000 -10000

图3.2 运输路线扩展行 图3.2中第一个信息集为博弈方0,即自然的选择节点。因为博弈方1决策时无法知道自然的选择有两条路径,分别到达两个不同的节点,但博弈方1却仍然只作一个选择,而不是针对两个节点分别作选择。当然,对应博弈方1的两种策略,事实上仍然有四种不同的结果,即他的两种策略与两个不同的节点(对应自然的不同选择)组合。如图3.2中四个黑点表示终端所示,每个终端的数字表示沿相应的决策路径到达终端时,博弈方1(商人)的得益。

我们已经用得益矩阵和扩展式两种方法,将商人关于运输路线的决策问题表示为一个实质上的单人博弈,形式上两人博弈。那么这个博弈如何解法,商人应如何决策,最后他的得益(成本和损失之和的负值)结果又如何呢?实际上,由于该问题本身带有外生的不确定因素,因此最终的结果不一定能预先确定。不过,如果商人根据一般解决带概率分布,具有不确定性的问题常用数学期望值进行决策,而不是盲目冒险碰运气或一味害怕、躲避风险,我们还是可以确定商人的选择的。本例中,商人走水路时,得益为-7000的概率为75%(好天气),得益为-16000的概率为25%(坏天气),因此走水路的期望收益为(-7000)×75%+(-16000) ×25%=-9250;走陆路时,得益是确定的-10000。因为-9250﹥-10000,即走水路的期望费用9250小于走陆路的10000,所以该商人还是选择走水路。若多次碰到同样的决策选择并每次都做这样的选择,则平均每次的运输成本应接近9250。

下面我们再来看一个用兵打仗的博弈——空城计。公元29年,蜀国丞相诸葛亮出兵攻打祁山,因为错用马谡失了战略要地街亭,只好撤兵。这时魏国大将军司马懿带领15万人马来反击,诸葛亮只有2500兵士,此时撤退已经来不及了,诸葛亮于是唱起了空城计,镇定自若地走上城墙,羽扇纶巾,焚香弹琴,命令老弱兵士洒扫街道,并且打开城门。这个时候,诸葛亮的谋略是在掌握对司马懿作战经验的信息基础之上的,他料定司马定会知道自己是一个谨慎的人,不会打无准备的帐,这样自己虚张声势就会有效。司马懿作战经验颇丰,而且与诸葛交过手,以他对诸葛的了解,认为他是谨慎不会冒险的军事家,根据这些信息,立即判断出城里有埋伏,于是后军作前军,前军变后队,迅速撤退。这给诸葛留出了足够的时间带领小队人马撤退。

坏天气(25%)

好天气(75%) 1

(-7000)(-10000)(-16000)(-10000)

通过以上例子我们可以看出,用扩展式表述(extensive form representation)能够更好地描述和分析动态博弈。相对于我们前面分析的静态博弈来说,这里的扩展主要是对博弈人的战略空间而言:谁在什么时候行动,每次行动时有些什么具体行动可供选择,以及知道些什么。简单地说,在扩展式表述中,战略对应于参与人的相机行动规则(contingent action plan ),即什么情况下选择什么行动,而不是简单的、与环境无关的行动选择。如我们空城计的例子,就是在特定的环境下理性的选择,但这里存在着不可置信的因素,所以导致了理性选择结果并非理想的情况。

博弈的扩展式实际上就是对博弈树的节点(node )和枝(branch )做出严格的规范和定义。因而博弈的扩展式与博弈树是同义词。与博弈的基本式相比,博弈的扩展式特别善于描述复杂的博弈,博弈越复杂,博弈扩展式的优点就越突出。博弈树给出了有限博弈的几乎所有信息。结合上面的例子,我们给出博弈树的构造。博弈树的基本建筑材料(building block )包括结(node )、枝(branch )和信息集(information set )。

1.结(node ):结包括决策结(decision node )和终点结(terminal node )两类。决策结是参与人采取行动的时点,终点结是博弈行动路径的终点。例如图3.2中,决策结包括空心圆和椭圆中博弈方1的两个实心圆。终点结包括对应4个支付向量的点。

2.枝(branches ):在博弈树上,枝是从一个决策结到它的直接后续连线(有时候用箭头表示),每一个枝代表参与人的一个行动选择。例如在图

3.3中,魏国司马懿有两种选择,分别用反击和不反击两个枝来表示。

3.信息集(information set ):博弈树上的所有决策结分割成不同的信息集。每一个信息集市决策结集合的一个子集,该子集包括所有满足下列条件的决策结:⑴每一个决策结都是同一参与人的决策结;⑵该参与人知道博弈进入该集合的某个决策结,但不知道自己究竟处于哪一个决策结。引入信息集目的是描述下列情况:当一个参与人要做出决策时他可能并不知道“之前”发生的所有事情(这里我们将之前放在引号内,因为博弈树中的决策结的排列并不一定与行动的时间顺序相一致)。

前面给出的例子相对来说比较简单,只有两阶段。事实上,用扩展式完全可以表示更复杂的动态博弈。这里给出一个“仿冒和反仿冒”博弈的例子。设有一家企业A 生产一种畅销产品,被另一家企业B 仿冒,如果被仿冒企业采取措施制止,仿冒企业就会停止仿冒,如果被仿冒企业不采取措施制止,仿冒企业就继续仿冒。对被仿冒企业来说,被仿冒当然会带来产品销售和声誉受损等经济损失,因此采取措施制止是符合自身利益的,但同时采取措施也是要付出成本的,因此遭到仿冒的时候是否应该制止是需要研究的问题。对于仿冒企业来说,仿冒不被制止有很大的收益,但如果被制止就会血本无归,还要赔偿对方一定的损失。因此是否仿冒也是需要仔细推敲的。所以,这两个企业在仿冒和制止仿冒的问题上,存在着一个行为和利益相互依存的博弈问题。由于只有在已经遭到仿冒的情况下被仿冒企业才需要考虑是否加以制止的问题,因此,这必然是一个动态博弈的问题。 蜀国

(2500, 0) (0, 150000)

蜀攻 (失街亭) 魏不反击

蜀撤

魏反击 图3.3 空城计蜀汉博弈图

为了简单起见,我们假设仿冒最多进行两次,再假设第一次不仿冒、仿冒被制止,以及在第一次仿冒没制止的情况下,第二次不仿冒、仿冒被制止、仿冒不被制止这几种情况下,仿冒和被仿冒企业的得益分别为0和10、-2和5、5和5、2和2、10和4,那么该动态博弈可以用图3.4中扩展形来表示。图中得益数组的第一个数字是仿冒企业的得益,第二个数字为被仿冒企业的得益。

当然,也不是所有动态博弈都可以用扩展形表示。因为有些动态博弈的阶段很多,或者博弈方在一个阶段有许多可选择的行为,这些时候扩展式表示动态博弈就会很困难,或者根本不可能。如,下象棋这种动态博弈,它不仅博弈阶段很多,而且每个阶段的可能选择也很多,因此很难用扩展式来表示。此外,两个生产寡头先后决定产量的定产博弈也是动态博弈,但因为每个寡头可以选择的产量都是无穷多种,因此也无法用只能描述有限种行为选择的扩展式表示。无法用扩展式表示的动态博弈,通常可以直接用文字和数学函数式表示。

A

B

(2、2) B

A

(10、4)

(0、10)

(-2、5) (5、5)

图3.4 仿冒和反仿冒博弈扩展式

仿冒 仿冒 不仿冒

不仿冒

不制止 不制止 制止

制止

3.2 扩展式表述的纳什均衡

本节探讨动态博弈的分析方法。在引入博弈的扩展式表述后,让我们来讨论扩展式表述博弈的纳什均衡。在静态博弈分析中针对具有策略和利益相互依存特性决策问题发展的核心分析方法,也就是纳什均衡分析。相对而言,动态博弈不同之处在于在扩展式表述博弈,参与人是相机行事,即“等待”博弈方达到自己的信息集(包含一个或多个决策结)后再决定如何行动;在战略式表述博弈,参与人似乎是在博弈开始之前就制定出了一个完全的相机行动计划,即“如果……发生,我将选择……”。因此在动态博弈分析中,相机选择和策略中的可信性显得尤为重要。

动态博弈中一个参与人的一次行为称为一个“阶段”。由于每个参与人在动态博弈中可能不止一次行为,因此,每个参与人在一个动态博弈中就可能有数个甚至许多个博弈阶段。动态博弈的扩展形式中,括弧中前一个数字代表乙的得益,后一个数字代表甲的得益。

动态博弈的一个中心问题是“可信性”问题。所谓可信性是指动态博弈中先行为的参与人是否该相信后行为的参与人会采取对自己有利的或不利的行为。因为后行为方将来会采取对先行为方有利的行为相当于一种“许诺”,而将来会采取对先行为方不利的行为相当于一种“威胁”,因此我们可将可信性分为“许诺的可信性”和“威胁的可信性”。

3.1.1开金矿博弈

我们以“开金矿博弈”为例来讨论可信性问题。

甲要开采一价值4万元的金矿,缺1万元的资金,向乙借1万元,许诺采到金子后与乙平分。乙是否借钱给甲呢?

图3.5 没有约束的开金矿博弈

乙最需要关心的就是甲采到金子后是否会履行诺言跟自己平分,因为万一甲采到金子后不但不跟乙平分,而且还赖帐或卷款潜逃,则乙连自己的本钱都收不回来。关键的是要判断的许诺是否可信!我们在分析此类经济问题的时候,假设的前提是博弈方都是理性的以最追求自身利益为最终目标的行为者。根据这样的原则甲的最优选择是不分。乙清楚甲的行为准则,最好的选择是不借。对乙来说,甲的许诺是不可信的。

要想使甲的许诺成为可信的,加上第三阶段,让乙在甲违约时采用法律手段---“打官司”,乙的利益受到法律保护,甲遵守诺言的收益大于不遵守而遭到乙的起诉,甲的许诺是可信的。乙在第一阶段选择借,甲在第二阶段选择分。

图3.6 可信的诺言和威胁图3.7 法律保障不足的开金矿博弈

在第三阶段乙打官司不能收回本钱,还要承受1万元的损失,这时乙打官司的威胁是不可信的。

本博弈的分析可以看出,在一个个体都有私心,都只注重自身的利益的社会里,完善公正的法律制度不但能够保障社会的公平,还能提高社会经济活动的效率,是实现最有效率的社会分工的重要保障。可信性是动态博弈分析的一个中心问题。

3.2.2逆推归纳法

分析动态博弈的方法是从最后一个阶段参与人的行为开始分析,逐步倒退回前一个阶段相应参与人的行为选择,一直到第一阶段的方法,称为“逆推归纳法”(backwards induction)。逆推归纳法实际上是重复剔除劣战略方法在扩展式博弈中的应用。我们从最后一个决策结开始往回倒推,每一步剔除在该决策结上参与人的劣选择,因此,在均衡路径,每一个参与人在每一个信息集上的选择都是占优选择。

逆推归纳法的一般方法是这样的:从动态博弈的最后一个阶段开始分析,每一次确定出所分析阶段博弈方的选择和路径,然后再确定前一个阶段的博弈方选择和路径。逆推归纳到某个阶段,那么这个阶段及以后的博弈结果就可以肯定下来,该阶段的选择节点等于一个结束终端。我们甚至可以用不包括该阶段与其后所有阶段博弈的等价博弈来代替原来的博弈。

逆推归纳法可以用于许多动态博弈的分析求解,除了有些不完美信息动态博弈以外,是解析动态博弈的基本方法。在分析动态博弈问题时,我们必须发展新的均衡概念。

3.3 子博弈精炼纳什均衡

动态博弈中存在不可信的行为选择,纳什均衡具有不稳定性。为了排除不可信的威胁或承诺因素,博弈理论又一次得到了发展,泽尔腾(1965)提出了“子博弈完美纳什均衡”,用来分析动态博弈。子博弈完美纳什均衡要求均衡战略的行为在每一个信息集上都是最优的。为此,我们首先引进“子博弈”(subgame)的概念。简单的说,子博弈是原博弈的一个局部构成的次级博弈,它本身可以作为一个独立的博弈进行分析。

3.3.1子博弈

定义3.1由一个动态博弈第一阶段以外的某个阶段开始的后续博弈阶段构成,它必须有初始信息集,具备进行博弈所需要的各种信息,能够自成一个博弈的原博弈的一部分,称为原动态博弈的一个“子博弈”。

以三阶段开金矿博弈为例,如果乙在第一阶段选择了“借”,动态博弈进行到第二阶段甲作选择。这时甲选择是否分成,然后轮到乙作选择是否打官司。这本身构成了一个两阶段的动态博弈,是原博弈的一个“子博弈”。当甲选择不分,博弈进行到乙选择打官司还是不打的第三阶段,是子博弈的子博弈,称后面的子博弈是原博弈“的二级子博弈”。如图中两层虚线框出。

图3.8 开金矿博弈的两级子博弈

例如,开金矿博弈,两个虚线框代表两个“子博弈”。应用逆推归纳法分析,在最后的子博弈中,乙在“打官司”和“不打”中选择“打官司”,因为1>0,成为图3.9;这时甲在分与不分中选择分,因为2>1,成为图3.10;第一阶段乙的选择是借。

图3.9开金矿(守信)--逆推第一步图3.10开金矿(守信)--逆推第二步

上面用逆推归纳法导出的动态博弈的结果是由各阶段轮到行为的参与人的一种行为依次构成的,在开金矿博弈中结果为(借,分),是由乙在第一阶段的借和甲在第二阶段的分构成。当然该博弈本来应该有三个阶段,但当甲在第二阶段选择分时第三阶段就没有必要进行下去了,因此结果中只有两个阶段的行为。需要注意的是乙的第三阶段虽然没有进行,但是它是保证第二阶段甲选择分的关键,所以乙的战略中必须包含这个选择。

3.3.2子博弈完美纳什均衡

有了子博弈的概念,我们引进适合动态博弈的新的均衡概念,它必须满足(1)既是纳什均衡,从而具有战略稳定性,(2)又不能包含任何的不会信守的许诺或威胁。这样的动态博弈的战略组合称为“子博弈完美纳什均衡”。

定义 3.2 如果动态博弈中各参与人的策略在动态博弈本身和所有子博弈中都构成一个纳什均衡,则称该策略组合为一个“子博弈完美纳什均衡”。

“子博弈完美纳什均衡”是分析动态博弈,或者说完全且完美信息动态博弈的关键概念。而逆推归纳法正是(至少在完美信息动态博弈范围之内)寻找动态博弈的子博弈完美纳什均衡的基本方法。子博弈完美纳什均衡能够排除均衡策略中不可信的威胁或许诺,就意味着每阶段各参与人的选择都是按最大利益原则决策的,因此在每个子博弈中都只能采用纳什均衡的策略或行为选择。

3.4 完全信息动态博弈模型应用举例——经典模型

3.4.1. Stackelberg 的寡头竞争模型

斯塔克博格模型是一种动态的寡头市场博弈模型。该模型假设寡头市场上的两个厂商中,一方较强一方较弱。较强的一方领先行动,而较弱的一方则跟在较强的一方之后行动。

由于该模型中两厂商的选择是有先后的,且后一厂商(跟随者看着前一厂商的选择的,因此这是一个动态博弈。但是,因为两参与人的决策内容是产量水平,而可能的产量水平有无限多个,因此这是一个双方都有无限多种可能的选择的无限策略博弈。斯塔克博格模型与古诺模型相比,唯一的不同是前者有一个选择的次序问题,其他如参与人、策略空间和得益函数等完全都是相同的。

价格函数:Q Q P P -==8)(;产品完全相同(没有固定成本,边际成本相等)221==c c ; 总产量(连续产量)21q q Q +=;总成本分别为:2122q q 和。

得益函数:

2

2212221222222

12111211111162)](8[)(62)](8[)(q q q q q q q q q c Q P q u q q q q q q q q q c Q P q u --=-+-=-=--=-+-=-=

根据逆推归纳法的思路,我们首先要分析第二阶段厂商2的决策,为此,我们先假设厂商1的选择为1q 是已经确定的。这实际上就是在1q 定的情况下求使2u 实现最大值的2q ,它必须满足:

2

3)6(210

2611221q q q q q -=-==-- 3.1 实际上它就是厂商2对厂商1的策略的一个反应函数。厂商1知道厂商2的这种决策思

路,因此他在选择1q 的时就知道*2q 是根据(1)式确定的,因此可将(1)式代入他自己的得益

函数,然后再求其最大值。

)(213)2

3(66),(112112111121*211*211q u q q q q q q q q q q q q u =-

=---=--= 3.2 上式对1q 的导数为0,可得5.15.13,3,

03*2*1*1=-===-q q q 此时,,双方的得益

分别为4.5和2.25。

与两寡头同时选择的古诺模型的结果相比,斯塔克博格模型的结果有很大的不同。它的产量大于古诺模型,价格低于古诺模型,总利润(两厂商得益之和)小于古诺模型。但是,厂商1的得益却大于古诺模型中厂商1的得益,更大于厂商2的得益。这是因为该模型中两厂商所处地位不同,厂商1具有先行的主动,且他又把握住了理性的厂商2总归会根据自己的选择而合理抉择的心理,选择较大的产量得到了好处。

结论:本博弈也揭示了这样一个事实,即在信息不对称的博弈中,信息较多的参与人(如本博弈中的厂商2,他在决策之前可先知道厂商1的实际选择,因此他拥有较多的信息)不一定能得到较多的得益。这一点也正是多人博弈与单人博弈的不同之处。

3.4.2 国际贸易与关税

现在我们对前面所讨论的博弈型加以丰富。在完全且完美信息动态博弈中,我们继续假定博弈的进行分为一系列的阶段,下一阶段开始前参与者可观察到前面所有阶段的行动。不

同之处在于,这种模型中在某个阶段中存在着同时行动。我们主要讨论两阶段各有两个参与人同时选择的动态博弈,更多阶段和更多参与人不过是两阶段的简单推广。一般地,我们假设:

1. 博弈中有四个参与人1,2,3,4。

2. 参与人1和参与人2在第一阶段同时在各自的可选战略集合A 1和A 2中分别选择1a 和2a 。

3. 参与人3和参与人4在看到参与人1和参与人2的选择(1a ,2a )以后,在第二阶段中,同时在各自的可选战略集合3A 和4A 中分别选择3a 和4a 。

4. 所有参与人的得益都取决于1a ,2a ,3a 和4a ,参与人i 的得益为i u (1a ,2a ,3a ,4a ),是各参与人战略的函数。

许多经济学问题都符合以上的特点,经典的例子如,银行的挤兑,国际竞争和最优关税,工作竞争。很多经济问题可以在上述条件稍加变动后建立模型。解决这类问题的方法仍然是逆向归纳的思想。下面我们以国际竞争和最优关税博弈为例来讨论这种具有同时选择的动态博弈,这是博弈理论在国际经济学中的应用。

设我们讨论的是两个相似的国家,我们分别称它们为国家1和国家2,国家1和国家2在本博弈中作为参与人是确定对进口商品征收关税的税率。

假设两国各有一个企业(可看作是国内所有企业的集合体)生产既内销又出口的相互竞争的商品,我们称它们为企业1和企业2。两国的消费者在各自的国内市场上购买国货或进口货。

国家i 市场上的商品总量:i Q ,则市场出清价格:2,1,

)(=-=i Q a Q P i i i 。

企业i 生产i h 供内销和i e 供出口,因此j i i e h Q +=,2,1,=j i ,当21==j i 时,当12==j i 时。

再设两企业的边际生产成本同为常数c ,且都无固定成本,则企业i 的生产总成本为)(i i e h c +。当企业出口时,因为进口国征收的关税也是它的成本,设国家j 的关税率为j t ,企业i 的出口成本为i j i e t ce +,国内销售成本仍为i ch 。

假设首先由两国政府同时制订关税率21 t t 和;然后企业1和企业2根据21 t t 和,同时决定内销和出口产量2211e h e h 、和、。

企业的利润: i j i i i j i i j i i

j i i i j i i j i j i j i i i e t e h c e h e a h e h a e t e h c e P h P e e h h t t -+-+-++-=-+-+==)()]([)]([)(),,,,,(ππ

国家作为参与人的得益则是它们所关心的社会总福利,包括消费者剩余,本国企业的利润和国家的关税收入三部分:

j i i j i j i j i j i i i e t e h e e h h t t w w +++=

=π2)(2

1),,,,,( 从第二阶段开始,假设两国已选择关税率分别为21 t t 和,则如果),,,(*2*2*1*1e h e h 是在设

定21 t t 和情况下两企业之间的一个纳什均衡,那么),(**i i e h 必须是下列最大值问题的解:

),,,,,(max **

0,j i j i j i i e h e e h h t t i i π≥

由于利润可以分成企业在国内市场的利润和国外市场的利润两部分之和,且国内市场的

利润取决于*

j i e h 和,国外市场的利润取决于*j i h e 和,因此上述最大值问题就可分解为下列

两个最大值问题:

{

}{}

])([max ])([max *

0 *0

i j j i i e j i i h e t c h e a e c e h a h i i --+--+-≥≥ 3.43.3 ***

***

*1,.3 () 3.52

1 ,.4 () 3.62.5.61,22,11 (3j i j j j i j j i e a c h a e c h a c t e a h c t i j h ≤-=

--≤--=---===假设从3解得假设从3解得由于3和3对和成立,得到四个方程的联立方程组,解得:

*1) (2) 3

1,2j 2,1 ,i i j a c t e a c t i -+=--==其中,和这是两企业第二阶段静态博弈的纳什均衡。 如果没有关税,则本博弈就相当于是国内国外两个市场的古诺模型,两企业在两市场的均衡产量确实都为(a —c )/3,与古诺模型的均衡产量完全一样。由于有关税存在,一国的关税具有保护本国企业,提高本国企业国内市场占有率,打击外国企业的作用,也是世界各国普遍设置关税,想要提高本国关税的主要原因。

现在我们回到第一阶段两个国家之间的博弈,即两国家同时选择21 t t 和。因为国家1相国家2都清楚两国企业的决策方法,即知道当它们选定21 t t 和以后,两企业的均衡一定

是),,,(*

2*2*1*1e h e h ,因此,两国的得益为),,,,,(*2*2*1*121e h e h t t w w i i =,为了方便起见,我们简单地用2,1),(21==i t t w w i i ,来表示上述两国的得益。

3

)2(9)2( 9)(18])(2[),(*2*22*

j i j i i j i i t c a t t c a t c a t c a t t w --+--++-+--= 国家i 要选择*i t ,满足上式达到最大,令导数为零时,解得:

2,1,9,9)(4 ,3

2,13 **21*=-=-=

-===-=

i c a e c a h c a t t i c a t i i i 选择:得最佳内销和出口产量都是成立,两国的最佳关税对这就是两企业在第二阶段的最佳内销和出口产量选择。这是一个子博弈纳什均衡解。

3.5重复博弈

重复博弈指基本博弈重复进行构成的博弈过程。虽然重复博弈形式上是基本博弈的重复进行,但博弈方的行为和博弈结果却不一定是基本博弈的简单重复,因为博弈方对于博弈会重复进行的意识,会使他们对利益的判断发生变化,从而使他们在重复博弈过程不同阶段的行为选择受到影响。重复博弈在现实中具有普遍性,社会经济活动中存在着许多长期反复的合作和竞争关系。如经济活动中强调经济联盟和价值链整合,以谋求更广阔的市场空间和发展前景,就需要在竞争与合作中不断调整自己的战略选择。

具体来说,重复博弈有下列3项基本特征:1. 阶段博弈之间没有“物质上”的联系(no physical links),也就是说,前一阶段的博弈不改变后一阶段博弈的结构(对比之下,序贯博弈涉及物质上的联系);2. 所有参与人都观测到博弈过去的历史(如在每一个新的阶段博弈,两个囚徒都知道同伙在过去的每次博弈中选择了抵赖还是坦白);3. 参与人的总支付是所有阶段博弈支付的贴现值之和或加权平均值。

3.5.1 有限次重复博弈

重复博弈是静态或动态博弈的重复进行,或者说重复进行的过程。比较常见的是基本博弈重复两三次或者其他有限的次数,因为即使是社会经济活动中长期关系,通常长度也是有限的,有预定的结束时间。这样的由基本博弈的有限次重复构成的重复博弈为“有限次重复博弈”。

定义 3.?:给定一个基本博弈G(可以是静态博弈,也可以是动态博弈),重复进行T 次G,并且在每次重复G之前各博弈方都能观察到以前博弈的结果,这样的博弈过程称为“G的T次重复博弈”,记为G(T)。而G则称为G(T)的“原博弈”。G(T)中的每次重复称为G(T)的一个“阶段”。

注意重复博弈的一个阶段本身就是一个独立的静态博弈或动态博弈,各个博弈方都有相应的得益。这是重复博弈与一般动态博弈的主要区别之一。

定理:令G是阶段博弈,G(T)是G重复T次的重复博弈(T<∞)。那么,如果G有唯一的纳什均衡,重复博弈G(T)的唯一子博弈精炼纳什均衡结果是阶段博弈G的纳什均衡重复T 次(即每个阶段博弈出现的都是一次性博弈的均衡结果)。

上述定理表明,只要博弈的重复次数是有限的,重复本身并不改变囚徒困境的均衡结果。

下面我们来看一下有名的“连锁店悖论”。“连锁店悖论”是赛尔顿1978年提出的。连锁店悖论讨论的问题是一个在n个市场(也可以理解为n个城镇)都开设有连锁店的企业,对于各个市场的竞争者是否应该加以打击排斥的策略选择。由于n个市场的竞争者一般不会同时进入竞争,如果忽略各个市场环境、竞争者不同等方面的微小差异,这个问题对上述连锁企业来说相当于一个n次重复的重复博弈,重复博弈中的原博弈就是如下图所示的“先来后到”博弈扩展式。根据我们前面介绍的分析方法得知,竞争者选择进入,先占领市场的连锁企业选择不打击,是原博弈唯一的子博弈完美纳什均衡,是两个理性的博弈方之间博弈的唯一结果。根据定理或者直接用逆推归纳法很容易证明,在以这个博弈为原博弈的有限次重复博弈中,唯一的子博弈完美纳什均衡是重复原博弈的纳什均衡。也就是每个市场的竞争者都进入,连锁企业都不打击。但这种理论结论和预言也显然有问题的,首先现实中类似问题的直觉经验与该理论结论明显不符。其次如果连锁企业对开头几个市场竞争者不计成本地进行打击,那么这种打击的威慑作用应该能够吓退其余市场的潜在竞争者,从而使得连锁企业能够独享其余几十个甚至更多市场利益,总体上肯定是合算的。因此在理论上也能找到否定上述一般结论的根据,这也是关于有限次重复有唯一均衡博弈一般结论的悖论。

3.5.2 无限次重复博弈和无名氏定理

理论上重复博弈可以无限制进行下去,不一定经过一定次数重复以后必须结束。如果一个基本博弈G 一直重复博弈下去,这样的重复博弈我们成为“无限次重复博弈”,记为

()G ∞。

无限次重复博弈的基本博弈也称为原博弈。无限次重复博弈是有无限个阶段的动态博弈。

一、囚徒困境式博弈的无限次重复

我们证明,如果参与人有足够的耐心,(抵赖,抵赖)是一个子博弈精炼纳什均衡结果。表

-8,-8 0,10

-10,0 -1,-1

我们考虑下列所谓的“冷酷战略”(grim strategy ):⑴开始选择抵赖;⑵选择抵赖直到有一方选择了坦白,然后永远选择坦白。注意:根据这个战略,一旦一个囚徒在某个阶段博弈中自己选择了坦白,之后他将永远选择坦白。

我们首先证明冷酷战略是一个纳什均衡。假定囚徒j 选择上述冷酷战略,冷酷战略是不是囚徒i 的最优战略呢?因为博弈没有最后阶段,我们不能运用逆向归纳法求解。令δ为贴现因子(我们假定两人的贴现因子相同)。如果i 在博弈的某个阶段首先选择了坦白,他在该阶段得到0单位的支付,而不是-1单位的支付,因此他的当期净得益是1单位。但他的这个机会主义行为将触发囚徒j 的“永远坦白”的惩罚,因此i 随后每个阶段的支付都是-8。因此,如果下列条件满足,给定j 没有选择坦白,i 将不会选择坦白:

()()()()22088111δδδδ+-+-+≤-+-+-+

或:8111δδδ

-≤--- 解上述条件得:*1/8δ≥;就是说,如果1/8δ≥,给定j 坚持冷酷战略并且j 没有首先坦

白,i 不会选择首先坦白。

现在假定j 首先选择了坦白。那么i 是否有积极性坚持冷酷战略以惩罚j 的不合作行为呢?给定j 坚持冷酷战略,j 一旦坦白将永远坦白;如果i 坚持冷酷战略,他随后每阶段的支付是-8(在任何阶段,如果选择坦白,他达到-8;如果选择抵赖,他达到-10),因此,不B

A

(1、10)

(-2、3) (5、5)

图3. 先来后到博弈扩展式

进入 不进入

不打击 打击 囚徒2

坦白 抵赖

坦白 抵赖 囚徒1

论δ为多少,i 有积极性坚持冷酷战略。类似地,给定j 坚持冷酷战略,即使i 自己首先选择了坦白,坚持冷酷战略(惩罚自己)也是最优的。

由此我们证明,如果1/8δ≥(即参与人有足够的耐心),冷酷战略是无限次囚徒博弈的一个子博弈精炼纳什均衡,帕累托最优(抵赖,抵赖)是每一个阶段的均衡结果,囚徒走出了一次性博弈时的困境。隐藏在这个结果背后的原因是,如果博弈重复无穷次且每个人有足够的耐心,任何短期的机会主义行为的所得都是微不足道的,参与人有积极性为自己建立一个乐于合作的声誉,同时也有积极性惩罚对方的机会主义。

当然这个博弈还有许多其他子博弈精炼均衡。特别地,如同在一次性博弈中一样,在每个阶段博弈两人都选择坦白也是一个子博弈精炼均衡,并且,是唯一一个当期行为独立于过去行为历史的均衡。

无名氏定理(Friedman,1971)令G 为一个n 人阶段博弈,(),G δ∞为以G 为阶段博弈的无限次重复博弈,*a 是G 的一个纳什均衡(纯战略或者混合战略),()12,,,n e e e e = 是*

a 决定的支付向量,()12,,,n v v v v = 是一个任意可行的支付向量,V 是可行支付向量集合。那么,对于任何满足i i v e >的()v V i ∈?,存在一个贴现因子1δ*

<使得对于所有的δδ*

≥,()12,,,n v v v v = 是一个特定的子博弈精炼纳什均衡结果。 简单地说,无名氏定理说的是,在无限次重复博弈中,如果参与人有足够的耐心(即δ足够大),那么,任何满足个人理性的可行的支付向量都可以通过一个特定的子博弈精炼均衡得到。在上述定理中,阶段博弈的纳什均衡*

a 可能是混合战略均衡也可能是纯战略均衡;有*a 决定的支付向量()12,,,n e e e e = 是达到任何精炼均衡结果v 的惩罚点(或者称为纳什威胁点,Nash threat point )。在囚徒困境博弈中,*

a 是(坦白,坦白),()8,8e =--;在重复寡头博弈中,*a 是12c q q q ==,()

12,c c e ππ=。

3.6 应用举例——扩展讨论

动态博弈中博弈方的策略是他们自己预先设定的,在各个博弈阶段,针对各种情况的相应行为选择的计划。这些策略实际上并没有强制力,而且实施起来有一个过程,因此只要符合博弈方自己的利益,他们完全可以在博弈过程中改变计划。我们称这种状况为动态博弈中的“相机选择”(contingent play )问题。相机选择的存在使得博弈方的策略中,所设定的各个阶段、各种情况下会采取行为的“可信性”(credibility )有了疑问。也就是说,各个博弈方是否会真正、始终按照自己的策略所设定的方案行为,还是可能临时改变自己的行动方案呢?

下面我们通过一个供货商和客户之间博弈案例说明动态博弈中相机选择和策略中的可信性对最终决策的影响。假设某客户B 有一个项目,但为了完成这个项目需要供货商A 的合作,供货商A 选择合作,需投入20万货物,则可以获得20%的收益。根据对客户资料的掌握情况,客户的项目运行肯定会获得20%的收益,供货商A 所担心的问题是客户B 是否能够按时承诺回款,如果供货商A 不能按时收回货款,那么他不但不能获得收益,而且连本钱都收不回来。我们用图3.5中扩展式来表示这个博弈问题。

图3.5中最上方的圆圈代表供货商A 的选择信息或者称选择节点(node ),A 在此处有“供货”和“不供货”两个策略可以选择。如果A 选择不供货,则博弈结束,他能保住20万的货物不受损失,但得不到合作所获得的收益20*20%=4万元。如果A 选择供货则达到客户B 的选择信息集,轮到B 进行选择。因为经营过程我们不加以考虑,这里我们关注的是B 能不能在结账期按时付款,所以在B 的结点处,有两种可选择的行为“付款”和“不付款”。无论B 选择“付款”还是“不付款”博弈到此结束。“付款”则A 收回20万的货款,并且得到4万的收益。B 得到(20+4)*20%=4.8万的收益。若B 选择“不付款”,则得到28.8万的收益,A 损失20万货物。图3.5中三个终端黑点处的数组,表示由各博弈方各阶段行为依次构成的,到达这些终端的“路径”所实现的各博弈方得益,其中第一个数字是先行动的A 的得益,第二个数字是后行动的客户B 的得益。

从图3.5中我们可以看出供货商A 的处境,选择“不供货”虽然能够使货物不损失,但也不会获得收益,不符合商业经营的原则。选择“供货”,而客户B 信守承诺,会按期付款,那么A 不但能够收回本金,而且能够有4万的收益。因此,供货商A 的决策关键是要判断客户B 是否会按照约定按时回款。我们在经济行为分析中,一般都是假设博弈方都是为了实现自身利益最大化(得益)的理性行为,在决策的时候,伦理道德的约束在这里是不起作用的,当然在某种情况下,例如大企业或者注重声誉建设谋求长远发展的实体,也会把遵守承诺这些伦理道德因素折算为经济利益内化到综合得益中的。在这种情况下,我们可以看出轮到客户做决策时,必然会选择到期“不付款”,来实现自身利益最大化,得益28.8万元。供货商A 清楚B 的行为准则,因此他不可能被B 的没有约束的许诺所迷惑,知道一旦供货,到时候必然收不回账款,因此最合理的选择是“不供货”而不是“供货”,保住自己的货物。B

A

(0、0)

(4、4.8) (-20、28.8)

图3.5 供货商和客户博弈扩展式

供货 不供货

不付款 付款

对于供货商A 来说,本博弈中B 是一个不可信的许诺。

许诺不可信,是得博弈方的合作成为不可能,这当然不符合现实的经营目的,因为供货商的货物不能卖出去就无法实现增值的目的(获得收益),客户B 没有得到A 的合作,也无法实现自身的利润。那么怎样使得博弈方的行为能够继续下去呢?我们可以增加能够制约B 行为的约束条件。

在图3.5中,博弈方B 选择不付款时,A 没有任何约束机制来保障自己的权益,造成了A 对客户B 的承诺没有信心只能采取“不供货”的消极态度来避免被骗带来的损失。如果我们加入法律的因素,也就是客户B 不遵守承诺时供货商A 可以通过仲裁的法律手段保障自己的收益,则情况就发生了改观。因为从道理上B 选择“不付款”是一种受到惩罚的行为,仲裁的结果应该对A 有利,A 的合法权益也得到了保障,不用害怕被B 侵吞。这时候双方的选择,以及相关的对对方选择的判断,也都发生了变化,博弈的结果就会不同。

考虑到经济仲裁是一次解决,所以就到供货商是否决定仲裁博弈终止。通过法律仲裁要花费费用的,这里我们假设是货款的20%,也就是4.8万,并且由败诉的一方承担。我们假设仲裁的结果是B 承担费用,A 收回货物成本并收回利润,而B 经营所得收益都要付仲裁费,并要向A 支付货款。这样博弈就成为图3.6中的扩展式所表示的两博弈方之间的三个阶段动态博弈。与图3.5相比,现在多了一个A 选择是否仲裁的第三个阶段。

加上仲裁这个阶段,结果就大不相同了。现在,博弈进行到第三个阶段,即客户B 选择“不付款”,供货商A 可以选择法律仲裁来讨回公道。如果A 选择“不仲裁”,则B 得到A 的货款和自己的经营收益28.8万元,A 则是不但损失了货款,并且毫无收益,此时“仲裁”的收益远远大于“不仲裁”的收益。仲裁B 一无所有,A 则能够收回自己的货款并且还有盈利。所以对B 来说,应该十分清楚A 的思路,知道A 在自己“不付款”的选择下,A “仲裁”是可信的,知道如果自己在第二个阶段选择“不付款”等着他的必然是一无所获,因此B 作为一个有理性的最求自身收益最大化的博弈方来说,他必然选择“付款”,那样双方得益A 是4万元,B 是4.8万元。也就是说,在加入仲裁威慑的情况下,B 的及时付款成为可信的许诺了。这样,在第一阶段A “供货”就成了合理的选择。最终结果是A 在第一阶段选择“供货”,B 在第二阶段选择“付款”,双方都获得自己的收益。也就是说,这时B “付款”许诺称为可信的诺言。也就是说,在A 的利益受到法律保障的情况下,B “付款”许诺变成可信的会遵守的许诺。这样,A 第一阶段“供货”也成了合理的选择。最终结果是A 在第一个阶段选择“供货”,B 在第二阶段选择“付款”,从而结束博弈,双方都获得一定的收益。此时A 完整策略是“第一阶段选择‘供货’若第二阶段B 选择“不付款”,第三阶A

(4、0) B

A

(0、0)

(4、4.8) (-20、28.8)

图3.6 有仲裁约束的供货商和客户博弈

供货 仲裁 不供货

不仲裁

不付款 付款

段选择‘仲裁’”。B 的完整策略就是“第二阶段选择‘付款’”。这就是这个三阶段动态博弈的解。

上述的分析我们是考虑了交易额比较大的情况,如果交易额比较小,而且申请仲裁要先垫付费用,并且有一个最低费用,假设0.5万元,这样供货商A 在客户B 选择“不付款”的情况下就会重新考虑是否选择“仲裁”,例如我们把交易额该为2万元,从新得到博弈的扩展式为图3.7

在图3.7中,我们可以看出,假设B 在第二阶段不按时付款,那么A 如果仲裁的话就有0.4万元的收益,但需要有专门的人来办理这件事情,需要人力资本,并且这里面还有很重要的“机会成本”,如果这个业务人员去寻找其他客户或者维护其他更有价值的客户,那么收益也许更大一些,为了一点损失和收益去奔波的威慑力不可信,那么为了规避B “不付款”的选择,对于较小交易额的客户,A 根据掌握的信息会选择“不供货”。对于B 来说,他清楚A 不会为了一点损失大费周章,所以,为了自身获得最大的利益,会选择“不付款”,使收益最大化。在这里,我们的博弈就难以进行下去了。这种情况在现实当中有很大的意义,一般来说,对于小客户,我们在交易的时候采取现款现货的方式来规避风险。而不是通过法律手段去进行威慑,因为这种手段的费用一般要大于两者的收益。

通过上面对供货商和客户之间几种不同情况的博弈分析,我们清楚了在动态博弈问题中,各个博弈方的选择和博弈的结果,与各个博弈方在各个博弈阶段选择各种行为的可信程度有很大关系的。有时候虽然有些博弈方很想或者会声称要采取特定的行动,以影响和制约对方,但如果这些行动缺乏以经济利益为基础的可信性,那么这些威慑最终不会有真正的效力。因此,可信性问题是动态博弈分析的一个中心问题,需要对它十分重视。

A

(0.4、-0.02) B

A

(0、0)

(0.4、0.48) (-2、2.88)

图3.7 有仲裁约束交易额较小的供货商和客户博弈

供货 仲裁 不供货

不仲裁

不付款 付款

习题3

1. 举出生活中的一个重复博弈与一次性博弈效率不同的例子,并试图分析原因。

2. 请你运用(重复无限期的)囚徒困境博弈来说明无名氏定理。

3. 两次重复下面的得益矩阵表示的静态博弈。如果你是博弈方1,你会采取怎样的策略? 博弈方2

L R S

T M B 4. 求出下列得益矩阵表示的静态博弈的纳什均衡,并说明有限次和无限次重复博弈时两博弈方的均衡策略。

3,1 1,0 1,1

2,1 8,7 12,0 1,1 0,11 10,10

8,6 4,10 4,8 6,4 2,0 0,2

博 弈 方 1

博弈方2

L R

博 T

弈 M

方 D

2

本章扩展学习资源

《经济博弈论》期末考试复习

《经济博弈论》期末考试复习资料 第一章导论 1.博弈的概念: 博弈即一些个人、队组或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,并从中各自取得相应结果的过程。它包括四个要素:参与者,策略,次序和得益。 2.一个博弈的构成要素: 博弈模型有下列要素:(1)博弈方。即博弈中决策并承但结果的参与者.包括个人或组织等:(2)策略。即博弈方决策、选择的内容,包括行为取舍、经济活动水平或多种行为的特定组合等。各博弈方的策略选择范围称策略空间。每个博弈方各选一个策略构成一个策略组合。(3)进行博弈的次序:次序不同一般就是不同的博弈,即使博弈的其他方面都相同。(4)得益。各策略组合对应的各博弈方获得的数值结果,可以是经济利益,也可以是非经济利益折算的效用等。 3.合作博弈和非合作博弈的区别: 合作博弈:允许存在有约束力协议的博弈;非合作博弈:不允许存在有约束力协议的博弈。主要区别:人们的行为互相作用时,当事人能否达成一个具有约束力的协议。 假设博弈方是两个寡头企业,如果他们之间达成一个协议,联合最大化垄断利润,并且各自按这个协议生产,就是合作博弈。 如果达不成协议,或不遵守协议,每个企业都只选择自己的最优产品(价格),则是非合作博弈。 合作博弈:团体理性(效率高,公正,公平) 非合作博弈:个人理性,个人最优决策(可能有效率,可能无效率) 4.完全理性和有限理性: 完全理性:有完美的分析判断能力和不会犯选择行为的错误。 有限理性:博弈方的判断选择能力有缺陷。 区分两者的重要性在于如果决策者是有限理性的,那么他们的策略行为和博弈结果通常与在博弈方有完全理想假设的基础上的预测有很大差距,以完全理性为基础的博弈分析可能会失效。所以不能简单地假设各博弈方都完全理性。 5.个体理性和集体理性: 个体理性:以个体利益最大为目标;集体理性:追求集体利益最大化。 第一章课后题:2、4、5 2.设定一个博弈模型必须确定哪几个方面? 设定一个博弈必须确定的方面包括:(1)博弈方,即博弈中进行决策并承担结果的参与者;(2)策略(空间),即博弈方选择的内容,可以是方向、取舍选择,也可以是连续的数量水平等;(3)得益或得益函数,即博弈方行为、策略选择的相应后果、结果,必须是数量或者能够折算成数量;(4)博弈次序,即博弈方行为、选择的先后次序或者重复次数等;(5)信息结构,即博弈方相互对其他博弈方行为或最终利益

博弈论在经济学中的应用

博弈论在经济学中的应用 刘肃素 (华中师范大学经济与工商管理学院 2011211086) 摘要:博弈论是研究策略博弈的数学理论,亦称对策论。它的作用在于发现普遍有效的博弈原则。在现代经济社会中充满了博弈,这就需要了解博弈的思想,用科学理论来指导行为。博弈论应用于经济学,已经和正在引起现代经济学一系列的发展和突破。博弈论在经济学中所取得的重大进展发现,博弈论方法越来越成为经济学研究的主流方法。随着博弈论在现代经济学中的运用和研究的深化以及经济复杂性现象的不断涌现,博弈论的经济学研究呈现出合作化、对称化和连续化的发展新趋势。 关键词:博弈论经济学对策论应用 Abstract:game theory is the mathematical theory of research strategy game, which is also called game theory. It is found that the average effective principles of game. In the modern economic society is full of game, this game, you need to understand in a scientific theory to guide behavior. Game theory is applied to economics, has been and is causing a series of modern economics development and breakthrough. Major progress was made in the game theory in economics, found that the game theory method is becoming the mainstream in the economics research method. With

清华大学经济博弈论期末考试04

经济博弈论(2004年秋季学期)期末测验题答案 注意:请将所有题目的答案写在答题册上,写在本试题页上一律无效。 1. (20 points) Lucy offers to play the following game with Charlie: “Let us show pennies to each other, each choosing either heads or tails. If we both show heads, I pay you $3. If we both show tails, I pay you $1. If the two don’t match, you pay me $2.” Charlie reasons as follows. “The probability of both heads is 1/4, in which case I get $3. The probability of both tails is 1/4, in which case I get $1. The probability of no match is 1/2, and in that case I pay $2. So it is a fair game.” Is he right? If not, (a) why not, and (b) what is Lucy’s expected profit from the game?(game table, 5 points; solutions, 7 points; (a), 4 points; (b), 4 points) (20分)露西提出与查理玩下面的游戏:“让我们互相向对方亮出硬币,每个人可以选择正面或者背面。如果双方亮出的都是正面,我给你3美元。如果双方亮出的是背 面,我给你1美元。如果两枚硬币正背面不同,你给我2美元。”查理做了这样的推理: “两枚硬币都是正面的概率是1/4,如此我得到3美元。都是背面的概率为1/4,如此我 得到1美元。正背面不同的概率为1/2,如此我付出2美元。因此这是一个公平游戏。” 他的想法是否正确?如果不正确,(a)为什么不正确?(b)露西从游戏中得到的期望 利润是多少?(博弈表5分;解7分;(a)问4分;(b)问4分。) 解答: 该博弈为零和博弈。博弈表如下(5分): CHARLIE Head Tail LUCY Head -3 2 Tail 2 -1 求解博弈。容易看出,该零和博弈没有纯策略纳什均衡。(1分) 只有一个混合策略的纳什均衡为:露西和查理均以3/8的概率出正面,5/8的概率出背面。 (6分) (a)查理的推理不对。因为双方实际(策略性)选择的、出硬币的正背面的概率不同于完 全随机选择的概率(后者正背面概率各为1/2)。查理错误地将一个混合策略的博弈情境当成 了随机选择的“赌博”情境。(4分) (b)露西的期望利润为1/8。(4分)(相应的,查理的期望利润为-1/8,不要求) 2. (20 points) You have to decide whether to invest $100 in a friend’s enterprise, where in a year’s time the money will increase to $130. You have agreed that your friend will then repay you $120, keeping $10 for himself. But instead he may choose to run away with the whole $130. Any of your money that you don’t invest in your friend’s venture, you can invest elsewhere safely at the prevailing rate of interest r, and get $100(1+r) next year. (a) Draw the game tree for this situation and show the rollback equilibrium. (8 points) Next suppose this game is played repeatedly infinitely often. That is, each year you have the

经济博弈论

1、纳什均衡的概念。 对于任一个博弈游戏来讲,一定存在这么一组策略,使得其对于任一个局中人而言都是最好的,如果其它的所有局中人不改变他们的策略的话。 2、非合作博弈与合作博弈的区别。形成合作博弈的两个条件: (1)对联盟来说,整体收益大于其每个成员单独经营时的收益之和。 (2)对联盟内部而言,应存在具有帕累托改进性质的分配规则,即每个成员都能获得比不加入联盟时多一些的收益。 如何保证实现和满足这些条件,这是由合作博弈的本质特点决定的。也就是说,联盟内部成员之问的信息是可以互相交换的,所达成的协议必须强制执行。这些与非合作的策略型博弈中的每个局中人独立决策、没有义务去执行某种共同协议等特点形成了鲜明的对比。因此可以说:形成合作博弈的原因是在某种制度约束下的集体理性战胜了个人理性。 3、解释下列概念:纯策略、混合策略、策略组合、纳什均衡、贝叶斯均衡、反应函数 在完全信息博弈中,如果在每个给定信息下,只能选择一种特定策略,这个策略为纯策略。纯策略是混合策略的特例。 按照一定的概率,从一套“纯策略”中随机选取实际的对策,称为混合策略。混合策略是纯策略在空间上的概率分布,纯策略是混合策略的特例。 策略组合指参与者可能采取的所有行动方案的集合。策略集合必须有两个以上元素,否则,无所谓对策,只是独自决策。 所谓贝叶斯纳什均衡是指这样一组策略组合:在给定自己的特征和其他局中人特征的概率分布的情况下,每个局中人选择策略使自己的期望支付达到最大化,也就是说,没有人有积极性选择其他策略 反应函数,在无限策略的古诺博弈模型中,博弈方的策略有无限多种,因此各个博弈方的最佳对策也有无限种,它们之间往往构成一种连续函数的关系,把这个连续函数称为反应函数。4、解释下列概念:博弈、静态博弈和动态博弈、完全信息博弈和不完全信息博 弈、完美信息动态博弈和不完美信息动态博弈 博弈是指在一定的游戏规则约束下,基于直接相互作用的环境条件,各参与人依靠所掌握的信息,选择各自策略(行动),以实现利益最大化和风险成本最小化的过程。简单说就是人与人之间为了谋取利益而竞争。 静态博弈是指博弈中参与者同时采取行动,或者尽管参与者行动的采取有先后顺序,但后行动的人不知道先采取行动的人采取的是什么行动。 动态博弈是指参与人的行动有先后顺序,而且行动在后者可以观察到行动在先者的选择,并据此作出相应的选择。 完全信息博弈:是指每一参与者都拥有所有其他参与者的特征、策略集及得益函数等方面的准确信息的博弈。 不完全信息博弈,也称贝叶斯博弈,是指对其他参与人的特征、策略空间及收益函数信息了解的不够准确、或者不是对所有参与人的特征、策略空间及收益函数都有准确的信息,在这种情况下进行的博弈就是不完全信息博弈。博弈参与者对于对手的收益函数没有完全信息。 完全信息动态博弈,是指博弈中信息是完全的,即双方都掌握参与者对他参与人的战略空间和战略组合下的支付函数有完全的了解,但行动是有先后顺序的,后动者可以观察到前者的行动,了解前者行动的所有信息,而且一般都会持续一个较长时期。 不完美信息动态博弈,在动态博弈中,在不完全信息条件下,至少有一个局中人对其他某些局中人的收益不清楚。由于行动有先后顺序,后行动者可以通过观察先行动者的行为,获得有关先行动者的信息,从而证实或修正自己对先行动者的行动。 6、在公司制企业中,股东、经理、债券人、顾客、供货商等都被称为利益相关者。试分析不同

经济博弈论复习重点

博弈:博弈就是一些个人、队组或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,各自取得相应结果的过程。 上策均衡:一个博弈的某个策略组合中的所有策略都是各个博弈方各自的上策,必然是该博弈比较稳定的结果 纳什均衡:在博弈 中,如果由各个博弈方的各一个策略组成的某个策略组合 中,任一博弈方的策略,都是对其余博弈方策略的组合 的最佳对策,也即 对任意 都成立, 则称 为G 的一个纳什均衡 混合策略纳什均衡在博弈 中, 博弈方 的策略空间为 ,则博弈方 以概率分布 随机在其 个可选策略中选择的“策略”,称为一个“混合策略”,其中 对 都成立,且 混合策略扩展博弈:博弈方在混合策略的策略空间(概率分布空间)的选择看作一个博弈,就是原博弈的“混合策略扩展博弈)。 :包含混合策略的策略组合,构成纳什均衡。 多个纳什均衡的某一个给所有博弈方带来的得益都大于其他所有那好似均衡带来的得益,则各个博弈方都会倾向于此纳什均衡的策略,博弈能够实现帕雷托效率,称此纳什均衡为帕累托上策均衡。 如果所有博弈方在预计其他博弈方采用各种策略的概率相同时,某一策略给他带来的期望得益最大,各博弈方都偏爱这样的策略的策略组合,就称之为风险上策均衡。 “聚点”均衡(focal point equilibrium)。在制度经济学中,信息就可以解释为参与一个社会必须存在的“道德传统”(D.诺斯称之为“文化意识型态”),从而可以决定在多个纳什均衡中会出现某一个特定的均衡。此处的聚点(focal point )作用被解释为:当参与人之间没有正式的信息交流时,他们存在于其中的“环境”往往可以提供某种暗示,使得参与人不约而同地选择与各自条件相称的策略(聚点),从而达到均衡。 相关均衡:博弈方根据观察到的信号或者相关信号来确定自己的行为而形成的更广泛意义下的纳什均衡 如果一个博弈的某个策略组合满足下列要求: (1)没有任何单个博弈方的“串通”会改变博弈的结果,即单独改变策略无利可图; (2)给定选择偏离的博弈方有再次偏离的自由时,没有任何两个博弈方的串通会改变博弈的结果; (3)依此类推,直到所有博弈方都参加的串通也不会改变博弈的结果。 称为“防共谋均衡”。 从动态博弈的最后一个阶段博弈方的行为开始分析,逐步倒推回前一个阶段相应博弈方的行为选择,一直到第一个阶段的分析方法,称为“逆推归纳法” 如果一个完美信息的动态博弈中,各博弈方的策略构成的一个策略组合满足,在整个动态博弈及它的所有子博弈中都构成纳什均衡,那么这个策略组合称为该动态博弈的一个“子博弈完美纳什均衡”。 有限次重复博弈:给定一个基本博弈G (可以是静态博弈,也可以是动态博弈),重复进行T 次G ,并且在每次重复G 之前各博弈方都能观察到以前博弈的结果,这样的博弈过程称为“G 的T 次重复博弈”,记为G(T)。而G 则称为G(T)的“原博弈”。G(T)中的每次重复称为G(T)的一个“阶段”。无限次重复博弈:一个基本博弈G 一直重复博弈下去的博弈,记为G( )策略:博弈方在每个阶段针对每种情况如何行为的计划子博弈:从某个阶段(不包括第一阶 } ,;,{11n n u u S S G =),(* *n i s s ),...,,(**1*1*n i i i s s s s +- ),...,,,(),...,,,(**1*1***1**1*n i ij i i i n i i i i i s s s s s u s s s s s u +-+-≥ i j i S s ∈),(* *n i s s },;,{11n n u u S S G =

浅谈经济博弈论

浅谈经济博弈论 姓名:李欣航学号:20081065 班级:02310802 人生如梦亦如戏,游戏人生,就要猜透别人怎么想,博弈论就是告诉你怎么跟人打交道,如何参透别人的心思。同时,用博弈论观照一些所谓的千古美谈,会发现那其实是无稽之谈。比如诸葛亮,其实远非司马懿之对手。 从一则故事说起,这个故事需要动点脑筋。 有五个海盗,劫掠了100两金子,需要分赃。办法是抓阄,盗亦有道。 抓到第一个阄的人,可以先提出一个分配方案,如果他的方案被一半以上的人同意,就照他的方案分金子,否则,第一个人就要被杀掉。余下的人也照此办理。 我们的问题是:如果你是第一个人,你会提出怎样的分配方案? 为了分析问题更确定,我们假定每个人都是追求自己利益极大化的人。

可能你会提出平均分配,每人20两,或者自己不要,等等。 可是正确的答案却并非如此。第一个人会说:“100两金子全归我!” 而且这个方案一定会被一半以上的人同意,这个人不会被杀掉。 这个问题比较复杂,当遇到复杂的问题时,我们可以从最后的环节开始考虑,这样,可以使问题清晰起来。 那我们就从抓到最后一个阄的人开始考虑。对于这个人来说,他知道,当轮到他提方案的时候,其他人都已经死掉了,金子将全是他一个人的。所以,他利益最大化行为便是,不管前边谁,包括第一个人,提了任何方案,他都一概摇头,不同意。 再看第四个人,他知道,不管自己提出什么方案,第五个人都不会同意,都会被杀掉,所以,他的利益最大化行为是,尽量不要轮到自己提方案。所以,不管第一个人提了怎样的方案,他都会表示同意。

第三个人,知道第四和第五个人的选择策略,所以,他的利益最大化的方案是100两金子全归自己。这个方案,因为自己和第四个人同意,超过了此时的一半以上的人的同意,可以行得通,所以,不管第一个人提出什么样的方案,第三个人都会反对。 第二个人,知道自己提什么方案,第三个人、第五个人都将反对,一旦轮到自己提,自己就死定了,所以,他会同意第一个人提出的任何方案,这是他的利益最大化行为。 所以,不管第一个人提出怎样的方案,第二个人与第四个人都会同意,加上第一个人自己的票,就是三票,一半以上,可以通过。 既然任何方案都可以通过,而第一个人又要追求自己利益的极大化,所以,他的方案是:100两金子全归自己。 这个例子告诉我们,想问题,确实需要方法论,靠直觉是不可以的,直觉在很多情况下是错误的,必须依靠方法,依靠逻辑的力量。 很多问题看起来没有头绪,是因为没有找到解决问题的路径,而方法的作用,就是帮我们找到切入点,找到了切入点,问

经济博弈论复习

《经济博弈论》复习精要 一.题型分值: 1.名词解释:4分* 5 = 20分; 2.判断题:2分* 10 = 20分; 3.简答题:7分*3=21分; 4.计算题:9分*1+10分*3=39分. 二.名词解释(4分* 5 = 20分,5题,共20 题) 1.博弈:指策略对抗,或策略有关键作用的游戏;博弈即一些个人、队组或其它 组织,面对一定的坏境条件,在一定的规则下,同时或先后,一次或多 次,从各自允许选择的行为或策略中进行选择并加以实施,各自取得相 应结果的过程。 2.博弈论(Game Theory):指系统研究各种各样博弈中参与人的合理选择及其 均衡的理论,该理论思想的主要特征是博弈中各 参与人的策略和得益相互依存、相互依赖。 3.策略:博弈中各博弈方的选择内容(每个博弈方可选策略不一定完全相同, 即不一定对称) 4.得益:各博弈方从博弈中所获得的利益(利润、收入、量化的效用、社会 效益、福利等,有效用,有损失) 5.上策均衡:一个博弈的某个策略组合中的所有策略都是各个博弈方各自的 上策,必然是该博弈比较稳定的结果。 6.严格下策:不管其它博弈方策略如何变化,给一个博弈方带来的收益总是 比另一策略给他带来收益小的策略。(严格下策反复消去法)7.划线法:指用策略之间的相对优劣关系,而不是绝对优劣关系来进行博弈 选择以求纳什均衡的方法。(划线法的思路是先找出每个博弈方针 对其他博弈方所有策略(或策略组合)的最佳对策,然后再找出相 互构成最佳对策的各博弈方策略组成的策略组合,即纳什均衡) 8.纳什均衡:使每个参与人的策略是对其他参与人策略的最优反应的策略组合。 9. 反应函数:指一博弈方对另一博弈方每种可能的决策内容的最佳反应决策所 构成的函数。 10.帕累托上策均衡:指多重纳什均衡中给所有博弈方带来的得益都大于其他所 有纳什均衡带来的得益的那个纳什均衡。 11. 风险上策均衡:如果所有博弈方在预计其他博弈方采用各种策略的概率相同 时,能给博弈方带来最大期望得益,且被各博弈方偏爱策 略组合。 12.逆推归纳法:指从动态博弈的最后一个阶段博弈方的行为开始分析,逐步 倒推回前一个阶段相应博弈方的行为选择,一直到第一个 阶段的分析方法。 13.子博弈:指由一个动态博弈第一阶段以外的某阶段开始的后续博弈阶段构 成的,有初始信息集和进行博弈所需要的全部信息,能够 自成一个博弈的原博弈部分。 14.子博弈完美纳什均衡:指如果一个完美信息的动态博弈中,各博弈方的策

博弈论复习题及答案

博弈论 判断题(每小题1分,共15分) 囚徒困境说明个人的理性选择不一定是集体的理性选择。(√) 子博弈精炼纳什均衡不是一个纳什均衡。(×) 若一个博弈出现了皆大欢喜的结局,说明该博弈是一个合作的正和博弈。()博弈中知道越多的一方越有利。(×) 纳什均衡一定是上策均衡。(×) 上策均衡一定是纳什均衡。(√) 在一个博弈中只可能存在一个纳什均衡。(×) 在一个博弈中博弈方可以有很多个。(√) 在一个博弈中如果存在多个纳什均衡则不存在上策均衡。(√) 在博弈中纳什均衡是博弈双方能获得的最好结果。(×) 在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。(×)上策均衡是帕累托最优的均衡。(×) 因为零和博弈中博弈方之间关系都是竞争性的、对立的,因此零和博弈就是非合作博弈。 (×) 在动态博弈中,因为后行动的博弈方可以先观察对方行为后再选择行为,因此总是有利的。(×) 在博弈中存在着先动优势和后动优势,所以后行动的人不一定总有利,例如:在斯塔克伯格模型中,企业就可能具有先动优势。 囚徒的困境博弈中两个囚徒之所以会处于困境,无法得到较理想的结果,是因为两囚徒都不在乎坐牢时间长短本身,只在乎不能比对方坐牢的时间更长。 (×) 纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。(√)不存在纯战略纳什均衡和存在惟一的纯战略纳什均衡,作为原博弈构成的有限次重复博弈,共同特点是重复博弈本质上不过是原博弈的简单重复,重复博弈的子博弈完美纳什均衡就是每次重复采用原博弈的纳什均衡。(√) 多个纯战略纳什均衡博弈的有限次重复博弈子博弈完美纳什均衡路径:两阶段都采用原博弈同一个纯战略纳什均衡,或者轮流采用不同纯战略纳什均衡,或者两次都采用混合战略纳什均衡,或者混合战略和纯战略轮流采用。(√) 如果阶段博弈G={A1, A2,…,An; u1, u2,…,un)具有多重Nash均衡,那么可能(但不必)存在重复博弈G(T)的子博弈完美均衡结局,其中对于任意的t

第五章-博弈论与竞争策略

第五章博弈论与竞争策略 第一节第二节第三节博弈论的基本概念完全信息静态博弈重复博弈和序列博弈 在现实经济社会,完全垄断和完全竞争的市场结构十分少见。厂商在市场中既有一定的垄断势力,又面临很大的竞争压力。厂商之间具有相关性和依存性。因此,可以用博弈论的方法解释和说明厂商的竞争行为和策略。博弈论是70年代中期以来微观经济学发展的一个重要方面。1994年的诺贝尔经济学奖被授予博弈论专家:纳什(Nash)、泽尔腾(Selten)和海萨尼(Harsanyi),他们都对博弈论在经济学中的应用作出了贡献。 70年代以来,博弈论已经发展成为现代经济学的基础重要基础之一,改变了传统经济学的结构,这主要有两 个方面的原因: 1.传统经济学着重研究市场机制和价格制度,分析完全竞争市场中的最优决策,不考虑决策者之间的相互影响。但是,现实经济运行中市场是不完全竞争的,行为主体之间的决策具有相互影响。 2.完全竞争市场是以完全信息为条件的,这在现实经济运行中也难以保证。在信息不对称条件下,考虑行为主体相互影响的非价格制度可以用博弈论分析。 当然,应用博弈论解决竞争策略问题也是有条件的。除了掌握博弈论方法外,关键是正确估计各参与者的策略空间和收益函数。 第一节博弈论的基本概念 一.博弈论及其特点 1.博弈和博弈论 博弈是指具有不同利益和目标的多个行为主体共同参加并相互影响的事态发展过程中的策略决策。 博弈论(Game Theory)也称对策论,它是一种分析博弈过程和结果的数学方法,研究具有理性的多个行为主体的决策和行动直接相互作用和影响时,事态发展过程的决策和均衡问题。广泛应用于政治、军事、经济、外交和日常生活的许多领域。 2.特点: (1)参与者具有各自的目标: (2)参与者都是理性行为者; (3)参与者之间具有相关性; (4)事态发展的结果取决于全部参与者的共同行为; (5)参与者要根据对其他参与者的判断决定自己的行动,因而是对策。 可见,博弈论是与优化论不同的决策理论。优化论是一种单人决策理论;博弈论所揭示的规律是一种多人决策理论。 二.博弈论的基本概念 在博弈论中,博弈的基本要素被概括为以下概念: 1)参与者Players (玩家):即参加博弈过程的行为和决策主体,也是利益主体。在一个博弈中,最少要有两个参与者。 2)策略Strategies (战略或策略行为):即参与者在某个博弈时点,根据其掌握的有关博弈信息而选择的决策变量和行动计划,一个参与者的全部可行策略称为他的策略空间。 接上页 3)收益Payoff(支付、得益)和收益函数:收益是指在既定策略组合条件下参与者的得失情况。每个参与者的收益取决于全部参与者所采取的策略,称为收益函数。 4)结局 outcome(结果):指博弈的结果,指既定策略组合条件下全部参与者所得收益的集合。 5)均衡 Equilibrium (均势):指达到稳定的策略组合或结局。 6)博弈规则:指参与者、策略、结局之间的联系。它是由博弈的环境和参与者之间的相互影响决定的。 例: 可口可乐与百事可乐(参与者)的价格决策: 双方都可以保持价格不变或者提高价格(策略) 博弈的目标和得失情况体现为利润的多少(收益) 利润的大小取决于双方的策略组合(收益函数) 博弈有四种策略组合,其结局是: (1)如果双方都不涨价,各得利润10单位; (2)如果可口可乐不涨价,百事可乐涨价,可口可乐利润100,百事可乐利润-30; (3)如果可口可乐涨价,百事可乐不涨价,可口可乐利润-20,百事可乐利润30;

四川农业大学经济博弈论(本科)期末考试高分题库全集含答案

106307--四川农业大学经济博弈论(本科)期末备考题库106307奥鹏期末考试题库合集 单选题: (1)下面的例子中,()可以说明古诺模型。 A.两商店的距离 B.偏远农产品市场上两大西瓜种植垄断商的价格竞争 C.偏远农产品市场上两大西瓜种植垄断商的产量竞争 D.彩电的尺寸偏好差异 正确答案:C (2)探讨一下在“切蛋糕博弈”中,甲首先负责切蛋糕,而乙负责分配蛋糕,那乙有什么优势呢?() A.先动优势 B.后动优势 C.绝对优势 D.相对优势 正确答案:A (3)博弈中,局中人从一个博弈中得到的结果被称为() A.收益 B.支付 C.决策 D.利润 正确答案:B

(4)信号传递博弈在产业组织理论中的第一个应用是 ( ) A.斯坦克尔伯格模型 B.罗伯兹垄断限价模型 C.古诺模型 D.伯特兰德模型 正确答案:B (5)关于战略式与扩展式,以下命题正确的是 A.战略式方法只能表述静态博弈 B.扩展式方法不能表述无限博弈 C.扩展式方法只能表述动态博弈 D.扩展式与战略式可相互转换 正确答案:D (6)子博弈精炼纳什均衡是:() A.一个纳什均衡 B.不是一个纳什均衡 C.和纳什均衡没有关系 D.不是每一个博弈都有子博弈精炼纳什均衡 正确答案:B (7)经常听到家长对小孩子说:“除非你把碗里的蔬菜吃完,否则不准你吃糖果”,这句话是什么呢?() A.承诺 B.威胁

C.允诺 D.批评 正确答案:B (8)博弈论中,局中人从一个博弈中得到的结果常被称为() A.效用 B.支付 C.决策 D.利润 正确答案:B (9)“人不犯我,我不犯人;人若犯我,我必犯人”是博弈中的() A.策略 B.行动 C.均衡 D.结果 正确答案:A (10)()在1944出版的巨著《博弈论和经济行为》标志着现代博弈论的诞生呢? A.纳什 B.泽尔藤 C.塔克 D.冯?诺伊曼 正确答案:D

经济博弈论试卷B.

一、填空题( 5 × 2 = 10 分) 1. 按 照 信 息 的 完 全 与 否 , 博 弈 模 型 可 划 分 为 5. 承诺行动可以划分为两类: 与 . 二、选择题( 5 × 2 = 10 分) 6. 图 1 所示博弈是一个( ). 贵 州 财 经 学 院 2010—2011 学年第一学期期末考试试卷 试卷名称: 经济博弈论(B 卷) 与 . 2. 提出连锁店悖论的博弈论学者是 . 3. 不完全信息动态博弈的解称之为 . 4. 信号博弈的均衡可划分为三类: , 以及准分离均衡. A. 完全信息静态博弈 C. 不完全信息静态博弈

B卷第1页(共6页)

三、判断题( 5 × 2 = 10 分) 11. 囚徒困境的结果是帕累托有效的. 0,0,0-1,1,2 1,-1,-12,-2,2 -1,1,2-3,3,3 2,-2,-24,-4,-4 图1 第 6-10 题博弈树 7. 在图 1 所示博弈中, 参与人 1, 参与人 2, 以及参与人 3 的信息 集个数分别是( ). A. 1,2,4 B. 1,4,4 C. 1,1,1 D. 1,2,8 8. 在图 1 所示博弈中, 参与人 1, 参与人 2, 以及参与人 3 的纯战 略个数分别是( ). A. 2,2,2 B. 2,4,2 C. 2,4,16 D. 2,2,8 9. 下列选项属于图 1 所示博弈的均衡结果的是( ). A. 行动组合(L,L,R) B. 行动组合(L,R,L) C. 行动组合(R,L,L) D. 行动组合(R,R,R) 10. 图 1 所示博弈子博弈与后续博弈的个数分别是( ). A. 1,3 B. 2,6 C. 3,7 D. 7,7 ( )

经济博弈论5

第五章不对称信息静态博弈 在1960年代末和1970年代初,博弈论的研究开始进入信息不对称的时代。正是信息不对称的考虑,在博弈论的研究中将经济学家与数学家区分开来。本章我们考察静态情况下的不对称信息博弈。 第一节信息不对称博弈的表述 什么是信息不对称呢?参与人在博弈中掌握着不同的信息,就是信息不对称。信息不对称对于博弈的结果或者说预测有什么样的影响呢?我们可以通过一个例子来说明。 5.1.1信息不对称影响资源配置 例子5.1 二手车市场 小李通过了托福考试,被美国一所大学录取了。小李要出国留洋了,打算把自己的座驾卖掉,一是可以处置座驾,二是可以筹一笔钱,好在国外用作为生活费。 小李的座驾是比较新的,去年才买的新车,开了一年,没有什么机械问题,其实由于磨合很好,比起刚刚出厂的新车还要好用呢!小李估计自己的车价值至少值20万元。 老王是一位下岗的师傅,刚刚开了一个小作坊。他准备买辆二手车作为跑业务的交通工具,于是在二手车市场上与小李讨价还价上了。老王不清楚小李的车的质量情况,关于小李提出他自己的车是没有任何质量问题的新车这样的说法,老王是半信半疑的。老王认为小李的

车最多值20万元,但是又很可能在20万元之下,如果存在一些质量问题的话 当然,小李的车看起来还是蛮新的,试驾一下感觉也不错,至少还是值一些钱的,譬如10万元。因此,老王认为小李的车价值在10万到20万元之间。所以,他提出只愿意花一个平均的价格即15万元买小李的车。 但是,小李认为自己的车真正是没有任何质量问题的新车,价值的确是值20万元的。然而,不管小李怎么说,老王就是不相信。因为,老王不认为小李有积极性说真话。 小李现在面临的问题是,是蒙受损失把价值20万元的车以15万元卖掉,还是将车开回去,另外想办法筹钱去美国读书。对于小李来说,损失5万元还是很大一笔数字的。所以,他没有把车低价卖了,而是开回去了。 这边的老王呢?他回头又找到老张,因为老张正在卖一辆旧车。老张的车是与小李的车一样的牌子和车型,并且表面看起来新旧也差不多。 但是,其实老张的车比小李的车旧多了,并且还有机械问题,尽管不容易发现。老张自己也认为这车只值10万元。老王也报出15万元的价格,老张喜出望外,立即答应,并且乐呵呵地说马上帮助老王把车开到老王的家里,晚上还要请老王吃饭呢! 老王是有心计的,他知道,刚才小李不愿意将车以15万元卖给他,

经济博弈论教案

学习好资料欢迎下载 福州海峡职业技术学院教案 课程名称经济博弈论 授课班级 授课教师陈亮贤 总学时 3 2

《经济博弈论》教案 第一章导论 教学目的和要求: 通过本节课的学习,使学生了解什么是博弈,产生学习博弈理论的初步兴趣,同时要求学生掌握几类经典的博弈类型并能应用于现实生活中的相应案例,同时对博弈结构和分类有比较清晰的认识。 教学重点、难点: 博弈的定义、囚徒困境、产量决策的古诺模型、博弈策略。 教学方法: 讲授法与讨论法相结合,并结合案例进行分析。 主要参考资料 1、《妙趣横生博弈论》,阿维纳什K.迪克西特(Avinash K.Dixit), 巴里J.奈尔伯夫(Barry J.Nalebuff)编著,董志强、王尔山、李文霞译,机械工业出版社,第1版(2009年8月1日); 2、《博弈论教程》罗支峰编著,清华大学出版社,北京交通大学出版社,第1版(2007年9月1日)。 教学时数: 2课时 教学内容: 一、导入新课程:什么是博弈 学习一门新课程之前,我们首先要了解下这门课程名称:什么是“博弈”? 博弈,根据《辞海》的解释,就是在多决策主体之间行为具有相互作用时,各主体根据所掌握信息及对自身能力的认知,做出有利于自己的决策的一种行为。说到底,博弈就是决策行为。 (一)从游戏到博弈 博弈起源于游戏中的策略对抗,因此博弈也可以定义为“策略起关键作用的游戏”,在英文中,“博弈”单词为Game,“博弈论”也即为Game Theory,

Game即游戏、竞技。 游戏和经济决策竞争有一些共同要素及特征,如:规则、结果、策略选择,策略和利益相互依存,策略的关键作用。例如: 游戏——下棋、猜大小 经济——寡头产量决策、市场阻入、投标拍卖 政治、军事——美国和伊拉克、以色列和巴勒斯坦 (二)一个非技术性定义 博弈——就是一些个人、队组或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,各自取得相应结果的过程。博弈有四个核心方面: 博弈的参加者(Player)——博弈方 各博弈方的策略(Strategies)或行为(Actions) 博弈的次序(Order) 博弈方的得益(Payoffs) 二、几个经典博弈模型 (一)囚徒的困境 一个经典的“囚徒困境”模型:话说有一天,一位富翁在家中被杀,财物被盗。警方在此案的侦破过程中,抓到两个犯罪嫌疑人A和B,并从他们的住处搜出被害人家中丢失的财物。但是,他们都矢口否认曾杀过人,辩称是先发现富翁被杀,然后只是顺手牵羊偷了点儿东西。于是警方将两人隔离审讯。这个时候,聪明的警官找他们谈话,分别告诉他们说:“你们的偷盗罪确凿,所以可以判你们1年刑期。但是,我可以和你做个交易: 如果你招了,他不招,那么你会作为证人无罪释放,他将被判8年徒刑; 如果你招了,他也招了,你们都将被判5年有期徒刑; 如果他招了,你不招,他无罪释放,你被判8年徒刑; 如果你们都不招,各判1年。” 根据这个模型,我们可以得出嫌疑人A、B的得益矩阵:

经济博弈论(谢织予)课后答案及补充习题答案

第一章 b什么星博弈?博弈论的主要研究内容是什么? 博弈可以用下述方式定义兀博弈即一些个人、队组或其他组织,面对…定的坏境条件■在…运的规则下,同时或先后,一次或多次■从各自允许选择的行为或策略中进行选择并加以实旌,各自取得相应结果的过程寫一个博弈必须包含博弈方、策略空间■博弈的次序和得益(函数〉这几个基本的方面.信息结构、博弈方的行为逻辑和理性层次等其宽也是博弈问题隐含或者需要明确的内容. 博弈论是系统研究可以用上述方法定义的各种博弈问题,寻求在 各博弈方具有充分或者有限理性,能力的条件下■合理的策略选择和合 理选择第略时博弈的结果,并分析这些结果的经济意义、效率意义的理 论和方法。 2. 设定一个博弈榄型必须彼定詡几个方面?券考答案: 设定一个博弈必须确定的方面包括;(1)博弈方,即博弈中进行决策并承担结果的参与者;(2)策略(空间人即博弈方选择的内容,可以是方向、取舍选择,也可以是连续的数量水平等;(3)得益或得益函数,即博弈方行为、策略选择的相应后果、结果,必次是数量或者能够折算成数量;(4)博弈次序,即博弈方行为、选择的先后次序或者重复次数等;(5)信息结构」即博弈方相互对其他博弈方行为或最终利益的了解程度;(6)行为逻辑和理性程度,即博弈方是依据个体理性还是集体理性行为,以及理性的程度等。如果设定博弈模型时不专门设定后两个方面,就是隐含假定是完全、完美信息和完全理性的非合作博弈。 3. 举出烟草.餐饮、股市、房地产■广告、电观等行业的竟争中策略相 互依存的例子. 参考答案I 烟草厂商新产品开发、价格定位的效果*常常取决于其他厂商、竞争对手的相关竟争策略。例如某卷烟厂准备推出一种高价

经济博弈论 期中测验答案_2007

经济博弈论(2007年秋季学期) 期中测验题答案 (2007/11/15) 注意:请将所有题目的答案写在答题册上,写在本试题页上一律无效(需要的图表请重画)。 1、找出下列博弈要求的全部均衡(要求见各小题)。指出均衡结果.. 及每个参与者完整的均衡策略.. 。(20分) Find all the required equilbria (specified in each part) for the following games. Identify the equilibrium outcome and the complete equilibrium strategy for each player. (20 points) (1)反转均衡(或子博弈完美均衡)(6分) Rollback equilibria (or subgame perfect equilibria, SPEs) (6 points) A’s equilibrium strategy is (N1, N4, N5), or “Always N.” B’s equilibrium strategy is “b if N” (or just “b”). C’s equilibrium strategy is “d if S” (or just “d”). Equilibrium payoffs are (2, 3, 2). (A, B, C)

(2)纯策略纳什均衡(6分) Pure-strategy Nash equilibria (6 points) COLUMN East Center West North 2, 3 8, 2 10, 6 ROW Up 3, 0 4, 5 6, 4 Down 5, 4 6, 1 2, 5 South 4, 5 2, 3 5, 2 NE: (North, East). Payoffs: (10, 6) (shown in the figure) (3)纯策略及混合策略纳什均衡(8分) Pure- and mixed-strategy Nash equilibria (8 points) COLUMN A B C D ROW 1 1, 1 2, 2 3, 4 9, 3 2 2, 5 3, 3 1, 2 7, 1 Pure-strategy NE: (1, C) and (2, A). Payoffs: (3, 4) and (2, 5) (shown in the figure) (2 points each) Mixed-strategy NE: For Player Column, strategy D is dominated by C; strategy B is dominated by a 50-50 mixture of A and C. So you need consider a 2*2 game only. Using the opponent indifference, the unique mixed-strategy equilibrium is ((1/2)*1, (1/2)*2) and ((2/3)*A, (1/3)*C). Payoffs are (5/3, 3). (4 points) 2、进入与阻止进入(20分)Entry and Deterrence (20 points) 考虑空客和波音之间在开发新的商用喷气式飞机上的竞争。假定波音在开发过程中已经 捷足先登,空客还在考虑是否要进入与之竞争。如果空客不进入,它获得零利润,而波音得 到垄断利润10亿美元;如果空客决定进入并开发竞争产品,那么波音就不得不决定是与空 客和平相处还是发起价格战。在和平相处的情况下,每个企业获得3亿美元的利润。如果价 格战打响,飞机的价格会暴跌,每个企业都入不敷出,会亏损1亿美元。 Consider the rivalry between Airbus and Boeing to develop a new commercial jet aircraft. Suppose Boeing is ahead in the development process and Airbus is considering whether to enter the competition. If Airbus stays out, it earns zero profit, whereas Boeing enjoys a monopoly and earns a profit of $1 billion. If Airbus decides to enter and develop the rival airplane, then Boeing has to decide whether to accommodate Airbus peaceably or to wage a price war. In the event of peaceful competition, each firm will make a profit of $300 million. If there is a price war, each will lose $100 million because the prices of airplanes will fall so low that neither firm will be able to recoup its development costs. (a)画出博弈树。找到反转均衡并描述每个企业的均衡策略。(10分) Draw the tree for this game. Find the rollback equilibrium and describe the firms’ equilibrium strategies. (8 points) Tree shown as below. Rollback shows that Boeing chooses peace over war if Airbus enters, so Airbus will enter. Rollback equilibrium entails Airbus playing “enter” and Boeing playing “peace

相关主题
相关文档 最新文档