当前位置:文档之家› game theory12 博弈论 英文 例题详细解析

game theory12 博弈论 英文 例题详细解析

game theory12  博弈论 英文 例题详细解析
game theory12  博弈论 英文 例题详细解析

Beer or Quiche game

In this handout, we discuss signaling games of Beer or Quiche type and the way to find the plausible outcome of this type of games – weak perfect Bayesian equilibrium.

The basic idea is that we try all the combinations of actions of all players one by one see if any of them is an equilibrium. In general, we work in the following steps:

Step 1: Start with actions of Player 1 (both types)

Step 2:Find Player 2’s beliefs ba sed on actions of Player 1 (in both information sets)

Step 3: Find optimal response of Player 2 (in both information sets)

Step 4: Check if both types of Player 1 play optimal response:

a.yes, no type of Player 1 wants to deviate => we have WPBE

b.no, at least one type of Player 1 wants to deviate => no WPBE

Step 5: Move to the next possible actions of Player 1

Example: consider the following game.

We will analyze these options:

1.Player 1: Beer if Weak, Quiche if Strong (Separating equilibrium 1)

2.Player 1: Quiche if Weak, Beer if Strong (Separating equilibrium 2)

3.Player 1: Quiche if Weak, Quiche if Strong (Pooling equilibrium 1)

4.Player 1: Beer if Weak, Beer if Strong (Pooling equilibrium 2)

Option 1: Player 1: Beer if Weak, Quiche if Strong (Separating equilibrium 1)

Step 1: Start with actions of Player 1 (both types)

Beer if Weak, Quiche if Strong

Step 2:Find Player 2’s beliefs based on actions of Player 1 (in both information sets)

Information sets are reached, so beliefs are calculated based on actions of Player 1.

Step 3: Find optimal response of Player 2 (in both information sets)

In the left information set, Player 1 knows that Player 2 is of Weak type and Fighting is optimal (3>0).

In the right information set, Player 2 knows that Player 1 is of Strong type and Not Fighting is optimal

(2>0).

Step 4: Check if both types of Player 1 play optimal response

Weak type of Player 1 is satisfied, but Strong type of Player 1 wants to deviate and get higher profit.

So this is not WPBE.

Step 5: Move to the next possible actions of Player 1

Option 2: Player 1: Quiche if Weak, Beer if Strong (Separating equilibrium 2) Step 1: Start with actions of Player 1 (both types)

Quiche if Weak, Beer if Strong

Step 2:Find Player 2’s beliefs based on actions of Player 1 (in both information sets)

Information sets are reached, so beliefs are calculated based on actions of Player 1.

Step 3: Find optimal response of Player 2 (in both information sets)

In the left information set, Player 1 knows that Player 2 is of Strong type and Fighting is optima (4>1).

In the right information set, Player 2 knows that Player 1 is of Weak type and Fighting is optimal

(1>0).

Step 4: Check if both types of Player 1 play optimal response

No type of Player 1 wants to deviate because the payoff would be lower. So this is WPBE.

Step 5: Move to the next possible actions of Player 1

Option 3: Player 1: Quiche if Weak, Quiche if Strong (Pooling equilibrium 1) Step 1: Start with actions of Player 1 (both types)

Quiche if Weak, Quiche if Strong

Step 2:Find Player 2’s beliefs based on actions of Player 1 (in both information sets)

Right information set is reached, so beliefs are calculated based on actions of Player 1. Left information set is not reached, so we are free to choose any beliefs, any set of beliefs is consistent with Player 1’s actions. Denote beliefs p and 1-p.

Step 3: Find optimal response of Player 2 (in both information sets)

In the right information set, Player 2 calculates expected payoff of playing Fight and NotFigt:

EP(Fight) = 0.3*1+0.7*0 = 0.3

EP(NotFight) = 0.3*0+0.7*2 = 1.4

So NotFight is optimal response.

In the left information set, optimal response of Player 2 generally depends on value of p (beliefs). However, in this case, Fight dominates NotFight in the left information set and hence Fight is optimal.

Step 4: Check if both types of Player 1 play optimal response

Actually, no matter what action Player 2 chooses in the left information set, Weak type of Player 1 will always want to deviate. So this is not WPBE.

Step 5: Move to the next possible actions of Player 1

Option 4: Player 1: Beer if Weak, Beer if Strong (Pooling equilibrium 2)

Step 1: Start with actions of Player 1 (both types)

Beer if Weak, Beer if Strong

Step 2:Find Player 2’s beliefs based on actions of Player 1 (in both information sets)

Left information set is reached, so beliefs are calculated based on actions of Player 1. Beliefs in the right information set are denoted p and 1-p because this information set is not reached and hence any set of beliefs is consistent with actions of P1..

Step 3: Find optimal response of Player 2 (in both information sets)

In the left information set, Player 2 calculates expected payoff of playing Fight and NotFigt:

EP(Fight) = 0.3*3+0.7*4 = 3.7

EP(NotFight) = 0.3*0+0.7*1 = 0.7

So Fight is optimal response.

In the right information set, optimal response of Player 2 generally depends on value of p (beliefs).

There are two options, either the optimal response is Fight, but then Weak Player 1 would want to deviate; or the optimal response is NotFight. In this case no type of Player 1 would want to deviate.

So the beliefs have to be set such that expected payoff from NotFight is larger than from Fight.

EP(Fight) < EP(NotFight) => 1*p + 0*(1-p) < 0*p + 2*(1-p) => p<2/3

Step 4: Check if both types of Player 1 play optimal response

No type of Player 1 wants to deviate because the payoff would be lower. So this is WPBE.

Step 5: Move to the next possible actions of Player 1. There are no more possibilities.

There are two WPBE in this game:

1.Weak P1 –Quiche, Strong P1 –Beer; P2 Fight if Beer and Fight if Quiche and p=0 in the left

information set and p=1 in the right information set.

2.Weak P1 – Beer, Strong P1 – Beer; P2 – Fight if Beer and NotFight if Quiche and p<2/

3.

博弈论案例分析

博弈论 博弈论(Game Theory),亦名―对策论‖、―游戏理论‖,属应用数学的一个分支,博弈论已经成为经济学的标准分析工具之一。目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。博弈论主要研究公式化了的激励结构间的相互作用。是研究具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。生物学家使用博弈理论来理解和预测进化论的某些结果。 博弈论是指某个个人或是组织,面对一定的环境条件,在一定的规则约束下,依靠所掌握的信息,从各自选择的行为或是策略进行选择并加以实施,并从各自取得相应结果或收益的过程,在经济学上博奕论是个非常重要的理论概念。 什么是博弈论?古语有云,世事如棋。生活中每个人如同棋手,其每一个行为如同在一张看不见的棋盘上布一个子,精明慎重的棋手们相互揣摩、相互牵制,人人争赢,下出诸多精彩纷呈、变化多端的棋局。博弈论是研究棋手们―出棋‖ 招数中理性化、逻辑化的部分,并将其系统化为一门科学。换句话说,就是研究个体如何在错综复杂的相互影响中得出最合理的策略。现在,我们就一些例子来讨论博弈论相关内容。 一、从“囚徒困境”开始 在博弈论中,含有占优战略均衡的一个著名例子是由塔克给出的―囚徒困境‖(prisoners’ dilemma)博弈模型。该模型用一种特别的方式为我们讲述了一个警察与小偷的故事。假设有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果一个犯罪嫌疑人坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪。如果另一个犯罪嫌疑人也作了坦白,则两人各被判刑8年;如果另一个犯罪嫌人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。下表给出了这个博弈的支付矩阵。 表囚徒困境博弈 [Prisoner's dilemma] 我们来看看这个博弈可预测的均衡是什么。对A来说,尽管他不知道B作何选择,但他知道无论B选择什么,他选择―坦白‖总是最优的。显然,根据对称性,B也会选择―坦白‖,结果是两人都被判刑8年。但是,倘若他们都选择―抵赖‖,每人只被判刑1年。在表2.2中的四种行动选择组合中,(抵赖、抵赖)是帕累托最优的,因为偏离这个行动选择组合的任何其他行动选择组合都至少会使一个人的境况变差。不难看出,―坦白‖是任一犯罪嫌疑人的占优战略,而(坦白,坦白)是一个占优战略均衡。 要了解纳什的贡献,首先要知道什么是非合作博弈问题。现在几乎所有的博弈论教科书上都会讲―囚犯的两难处境‖的例子,每本书上的例子都大同小异。 话说有一天,一位富翁在家中被杀,财物被盗。警方在此案的侦破过程中,抓到两个犯罪嫌疑人,斯卡尔菲丝和那库尔斯,并从他们的住处搜出被害人家中丢失的财物。但是,他们矢口否认曾杀过人,辩称是先发现富翁被杀,然后只是顺手牵羊偷了点儿东西。于是警方将两人隔离,分别关在不同的房间进行审讯。由地方检察官分别和每个人单独谈话。

博弈论期末习题

《博弈论》期末习题 专业:经济学学号:2 ;姓名:王兆丽 一、试写出掷硬币博弈的局中人及其策略与得益函数,并写出双变量得 益矩阵。 答:局中人:盖硬币者和猜硬币者。 策略:有正面和反面两种可选择策略,若猜对,猜者得1盖者-1.否则猜者-1盖者1.由于每一方都不会让对方在选择之前知道自己的决策,所以可以看做是同时做决策的。 双变量得益矩阵; 猜硬币方 二、试举生活中的一例,说明囚徒困境是如何产生的?并试分析可能走 出囚徒困境的途径。 答:例子:中国移动和中国联通之间的价格战。 产生原因:囚徒困境是在个体之间存在行为和利益相互制约的博弈结构中,以个体理性和个体选择为基础的分散决策方式,无法有效地协调各方面的利益,并实现整体、个体利益共同的最优。简单的说,囚徒困境问题都是个体理性与集体理性的矛盾引起的。 可能走出的囚徒困境途径:(1)惩罚。如果政府对实行价格战以获利的企业实行惩罚,那么就会制止这种现象发生。(2)忠诚文化。有时候,建立一种相互忠诚的文化也可以帮助走出囚徒困境。在很多组织中,团体产生所面临的囚徒困境问题的轻重程度是不同的,这种差异的根本来源就是各个组织有自己的文化。(3)长期关系和重复博弈。建立长期关系使得囚徒困境博弈可以多次重复,如果这个“多次”足够长,那么人们就有可能为了长远的将来利益而牺牲眼前的一笔横财,合作也是可以达成的。

三、用逆向归纳法求解下面的博弈的子博弈完美纳什均衡。 答:1、该博弈共包括四个子博弈:(1)从博弈方1选择R 以后博弈方2的第二 阶段选择开始的三阶段动态博弈;(2)从博弈方2第二阶段选择R 以后博弈方1 的开始选择的两个阶段动态博弈;(3)第三阶段博弈方1选择A 以后博弈方2 的单人博弈;(4)第三阶段博弈方1选择B 以后博弈方2的单人博弈 2、根据逆推归纳法先讨论博弈方2在第四阶段的选择。由于选择C 、D 个中 任何一个的得益都相同,因此在这阶段随意选择一个都可以。倒退回第三阶段, 博弈方1选择AB中任何一个都可以。再推回第二阶段,博弈方2选择L将得到 3选择R得到2,因此选择L;最后回到第一阶段,博弈方1选择L得到2选择 R得到3,。所以该博弈的子博弈完美纳什均衡为:博弈方1第一阶段选择R, 博弈方2第二阶段选择L,即(3,1)是该博弈的完美纳什均衡。 四、两个寡头企业进行价格竞争博弈,企业1的利润函数是 q c aq p ++--=21)(π,企业2的利润函数是p b q +--=22)(π,其中p 是企业1 的价格,q 是企业2的价格。求: 1.两个企业同时决策的纯战略纳什均衡; 两个企业同时定价。根据两个企业的得益函数,很容易导出它们各自的反应 函数:απ1 /αp = -2(p-aq+c)=0 ____ p=aq-c απ2/αq = -2(q-b)=0 ______ q=b

生活中的博弈论论文

生活中的博弈论论文 摘要: 生活、博弈、无处不在、利益、老鹰、报价价位、得与失 正文: 博弈无时不在,无处不在,日常生活中的一切,均可从博弈得到解释,大到美日贸易战,小到今天早上你突然生病。可能读者会认为,贸易争端用博弈论来分析是可以的,但对自己生病也可以用博弈论来理解就有点不可思议,因为自己就一个人,和谁进行游戏? 实际上,并非只有一个人,还有一个叫做“自然”(Nature)的参与者。“自然”可以理解为无所不能的上帝,上帝现在有两种策略,让人生病或不生病。人一旦生病,就不得不根据生病的信息判断上帝的策略,然后采取对应的策略。上帝采取让人生病的策略,人就采取吃药的策略来对付;上帝采取不让人生病的策略,人就采取不予理睬的策略。这正是一场人和上帝进行博弈的游戏。 “自然”是研究单人博弈的重要假定。再比如一个农夫种庄稼也是同自然进行博弈的一个过程。自然的策略可以是:天旱、多雨、风调雨顺。农夫对应的策略分别是:防旱、防涝、放心地休息。当然,“自然”究竟采用哪种策略并不确定,于是农夫只有根据经验判断或气象预报来确定自己的行动。如果估计今年的旱情较重,就可早做防旱准备;如果估计水情严重,就早做防涝准备;如果估计是风调雨顺,农夫就可以悠哉游哉了。 生活中更多的游戏不是单人博弈,而是双人或多人的博弈。比如,某一天你觉得应该是你太太的生日,但又不能肯定:如果是太太的生日的话,你可以送一束花,太太会特别高兴;你不送花,太太会埋怨你忘了她的生日;如果不是太太的生日的话,你可以送太太一束花,太太感到意外的惊喜;你不送花,结果生活同往常一样。 在这个博弈里,我们看到,“自然”可以有两种策略:确定今天是太太的生日或确定今天不是太太的生日,但不论“自然”采取何种策略,你的最好行动都是买花。 夫妻吵架也是一场博弈。夫妻双方都有两种策略,强硬或软弱。博弈的可能结果有四种组合:夫强硬妻强硬、夫强硬妻软弱、夫软弱妻强硬、夫软弱妻软弱。 根据生活的实际观察,夫软弱妻软弱是婚姻最稳定的一种,因为互相都不愿让对方受到伤害或感到难过,常常情愿自己让步。动物学的研究有相同的结论,性格温顺的雄鸟和雌鸟更能和睦相处,寿命也更长。 夫强硬妻强硬是婚姻最不稳定的一种,大多数结局是负气离婚。夫强硬妻软弱和妻强硬夫软弱是最常见的一种,许多夫妻吵架都是这样,最后终归是一方让步,不是丈夫撤退到院子里点根烟,就是妻子避让到卧室里号啕大哭。 在竞争激烈的商业界,博弈更为常见。比如两个空调厂家之间的价格战,双方都要判断对方是否降价来决定自己是否降价,显而易见,厂家之间的博弈目标就是尽可能获得最大的市场份额,赚取最多的收益。 事实上,这种有利益(或效用)的争夺正是博弈的目的,也是形成博弈的基础。经济学的最基本的假设就是经济人或理性人的目的就是为了效用最大化,参与博弈的博弈者正是为了自身效用的最大化而互相争斗。参与博弈的各方形成相互竞争相互对抗的关系,以争得效用的多少决定胜负,一定的外部条件又决定了竞争和对抗的具体形式,这就形成了博弈。 如象棋对局的参与者是以将对方的军为目标,战争的目的是为了胜利,古罗马竞技场中角斗士在争夺两人中仅有的一个生存权,企业经营的目的是为了生存发展,而股市中人们所争的很实在,就是金钱。从经济学角度来看,有一种资源为人们所需要,而资源的总量具是

博弈论经典案例分析

博弈论经典案例分析 囚徒困境 案例:警察把甲乙分开关押,并在提审时分别告之,如果你坦白而他不坦白,那么你将只判0年,他将被判8年;如果你不坦白而他坦白,那么你判8年,他判0年;如果你们两人都坦白了,各判5年;如果你们两人都不坦白了,各判1年。 分析:每个博弈方选择自己的策略时,虽然无法知道另一方的实际选择,但他却不能忽视另一方的选择对他自己的得益的影响,因此他应该考虑到另一方有两种可能的选择,并分别考虑自己相应的最佳策略。对囚徒A 来说,囚徒B 有坦白和不坦白两种可能的选择,假设囚徒B 的选择是不坦白,则对囚徒A 来说,不坦白得益为-1,坦白得益为0,他应该选择坦白; 假设囚徒B 选择的是坦白,则囚徒A 不坦白得益为-8,坦白得益为-5,他还是该选择坦白。因此,在此博弈中,无论囚徒B 采取何种策略囚徒A 的选择只有一种,即坦白,因为在另一方两种可能的情况下,坦白给自己带来的得益都是较大的。同样的道理,囚徒B 的唯一的选择也是坦白。 所以最可能的结局:该博弈的最终结果是两博弈方同选择坦白策略。 其支付矩阵如下: 性格大战 案例:一对恋人准备在周末晚上一起出去,男的喜欢看足球,但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。 分析:可以看出,分开将使他们两人得不到任何满足,只要在一起,不管是看时装表演还是看足球,两人都会得到一定的满足。但看足球将使男的得到更大的满足,看时装表演则使女的得到更大的满足。 在这样的一个对局中,男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择,一旦对方选定了某一项活动,另一个人选择同样的活动就是最好的策略。因此,如果男的已经买好了足球的门票,女的当然就不再反对;反之,如果女的已经买好了时装表演票,男的也就会与她一起看时装表演。 1,1 8, 0 不坦白 0,8 5,5 坦白 嫌疑犯乙 不坦白 坦白 嫌疑犯甲 1,2 -1, -1 时装 0,0 2,1 足球 男 时装 足球 女

博弈论第七章习题

第七章习题 一、判断下列表述是否正确,并作简单分析 (1)海萨尼转换可以把不完全信息静态博弈转换为不完美信息博弈,说明有了海萨尼转换,不完全信息静态博弈和一般的不完美信息动态博弈是等同的,不需要另外发展分析不完全信息静态博弈的专门分析方法和均衡概念。 答:错误。即使海萨尼转换把不完全信息静态博弈转换为不完美信息动态博弈,也是一种特殊的有两个阶段同时选择的不完美信息动态博弈,对这种博弈的分析进行专门讨论和定义专门均衡的概念有利于提高分析的效率。 (2)完全信息静态博弈中的混合策略可以被解释成不完全信息博弈的纯策略贝叶斯纳什均衡。 答:正确。完全信息静态博弈中的混合策略博弈几乎总是可以解释成一个有少量不完全信息的近似博弈的一个纯策略Bayes—Nash均衡。夫妻之争的混合策略Nash均衡可以用不完全信息夫妻之争博弈的Bayes—Nash均衡表示就是一个例证。 (3)证券交易所中的集合竞价交易方式本质上就是一种双方报价拍卖。 答:正确。我国证券交易中运用的集合竞价确定开盘价的方式就是一种双方报价拍卖。与一般双方报价拍卖的区别只是交易对象,标的不是一件而是有许多件。 (4)静态贝叶斯博弈中之所以博弈方需要针对自己的所有可能类型,都设定行为选择,而不是只针对实际类型设定行为选择,是因为能够迷惑其他博弈方,从而可以获得对自己更有利的均衡。

答:错误。不是因为能够迷惑其他博弈方,而是其他博弈方必然会考虑这些行为选择并作为他们行为选择的依据。因为只根据实际类型考虑行为选择就无法判断其他博弈方的策略,从而也就无法找出自己的最优策略。其实,在这种博弈中一个博弈方即使自己不设定针对自己所有类型的行为选择,其他博弈方也会替他考虑。因为设定自己所有类型下的行为,实际上是要弄清楚其他博弈方对自己策略的判断。 (5)“鼓励—响应”的直接机制能保证博弈方都按他们的真实类型行为并获得理想的结果。 答:错误。“鼓励—响应”机制也就是说真话的直接机制,实际上只保证博弈方揭示,也就是说出自己的真实类型。 博弈方不直接选择行为,也不保证根据真实类型行为,更谈不上一定能实现最理想的结果。因为直接机制的结果常常是带有随机选择机制的,并不一定理想。实际上对所有博弈方都理想的结果在静态贝叶斯博弈中本身不一定存在。 二、双寡头古诺模型,倒转的需求函数为 ()P Q a Q =-, 其中12Q q q =+为市场总需求,但a 有h a 和l a 两种可能的情况,并且厂商1知道a 究竟是h a 还是l a , 而厂商2只知道h a a =的概率是θ, l a a =的概率是1θ-,这种信息不对称情况双方都是了解的。双方的总成本仍然是i i i c q cq =。如果两厂商同时选择产量,问双方的策略空间是什么?本博弈的贝叶斯纳什均衡是什么? 解:设厂商1已知h a a =时的产量为11()h q a q =,已知l a a =时的产量是11()l q a q =;再假设厂商2的产量是 2q ,这两个函数关系就是两个厂商的策略空间。 11211()h h h h h a q q q cq π=---

博弈论论文

博弈论课程论文生活中的博弈论 学院: 姓名: 学号:

生活中的博弈论 摘要:本文从实际生活入手,主要是把生活中所会出现的一些问题、一些选择用博弈论的思想进行分析。有时候看起来很简单的问题,其实深究起来并不是那么简单,不能只看表面,要仔细分析每一个问题参与者的心理,做出多种情况的假设,才能做出最有利的选择。 关键词:博弈,心理,生活,假设 一、博弈论简介 博弈论又被称为对策论既是现代数学的一个新分支,也是运筹学的一个重要学科。

博弈论主要研究公式化了的激励结构间的相互作用。是研究具有斗争或竞争性质现象的数学理论和方法。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。生物学家使用博弈理论来理解和预测进化论的某些结果。 博弈论已经成为经济学的标准分析工具之一。在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。 基本概念中包括局中人、行动、信息、策略、收益、均衡和结果等。其中局中人、策略和收益是最基本要素。局中人、行动和结果被统称为博弈规则。 类型: (1)合作博弈——研究人们达成合作时如何分配合作得到的收益,即收益分配问题。 (2)非合作博弈——研究人们在利益相互影响的局势中如何选决策使自己的收益最大,即策略选择问题[1]。 (3)完全信息/不完全信息博弈:参与者对所有参与者的策略空间及策略组合下的支付有充分了解称为完全信息;反之,则称为不完全信息。 (4)静态博弈和动态博弈 静态博弈:指参与者同时采取行动,或者尽管有先后顺序,但后行动者不知道先行动者的策略。 动态博弈:指双方的行动有先后顺序并且后行动者可以知道先行动者的策略。 二、博弈例证

博弈论论文-共谋与防共谋案例

农村土地流转市场中三大主体博弈关系分析 摘要:以农村土地流转市场中相关利主体之间的博弈关系, 构建两人或多人博弈模型,基于博弈关系进行理论分析,分析农村土地流转市场中的社会行为,为改进农村土地流转提出对应的建议,完善农村土地流转市场。 关键词:农村土地流转、博弈、共谋与防共谋 一、农村土地流转 伴随我国工业化、信息化、城镇化和农业现代化进程,农村劳动力大量转移,农业物质技术装备水平不断提高,农户承包土地的经营权流转明显加快,发展适度规模经营已成为必然趋势。中共中央办公厅、国务院办公厅2014年11月印发《关于引导农村土地经营权有序流转发展农业适度规模经营的意见》,《关于引导农村土地经营权有序流转发展农业适度规模经营的意见》。 实践证明,土地流转和适度规模经营是发展现代农业的必由之路,有利于优化土地资源配置和提高劳动生产率,有利于保障粮食安全和主要农产品供给,有利于促进农业技术推广应用和农业增效、农民增收,应从我国人多地少、农村情况千差万别的实际出发,积极稳妥地推进。为引导农村土地(指承包耕地)经营权有序流转、发展农业适度规模经营,现提出如下意见。当前农村土地流转的主要类型为土地互换、出租、入股、合作等方式。流转土地要坚持农户自愿的原则,并经过乡级土地管理部门备案,签订流转合同。 二、集体土地流转市场中的利益主体 城乡统筹一体化进程中,在集体土地流转市场制度创新的完整过程中起着重要作用的利益主体有:乡镇政府、农村集体经济组织、农地转出方和农地转人方。 集体土地流转市场能否顺利进行是由国家(乡镇政府作为国家的代理人)、集体经济组织(包括村、组)、农地转出方与农地转入方四方相关利益主体进行博弈的结果,博弈过程是主观意愿根据其了解的情况逐步认识,最终做出结果作为理性的“经济人”,他们根据各自的利益目标,会作出不同的判断和选择,相应的得到各自的报酬。当某一方做出某项决策时,事先会受到他人决策的影响,同时反过来也会影响其他几方的行为。集体土地流转市场制度变迁在很大程度上是相关利益主体共同博弈的结果,利益主体之间的博弈结果,提出了对制度变迁的需求,需求导致了新制度的产生。根据集体土地流转市场相关利益主体之间表现出的博弈关系,进行博弈分析,有助于全面了解利益主体的策略选择,解释现行集体土地流转市场制度存在的不足,为相关管理部门和利益主体进行制度创新供决策参考。

博弈论复习题及标准答案

囚徒困境说明个人的理性选择不一定是集体的理性选择。(√) 子博弈精炼纳什均衡不是一个纳什均衡。(×) 若一个博弈出现了皆大欢喜的结局,说明该博弈是一个合作的正和博弈。( ) 博弈中知道越多的一方越有利。( ×) 纳什均衡一定是上策均衡。(×) 上策均衡一定是纳什均衡。(√) 在一个博弈中只可能存在一个纳什均衡。(×) 在一个博弈中博弈方可以有很多个。(√) 在一个博弈中如果存在多个纳什均衡则不存在上策均衡。 (√ ) 在博弈中纳什均衡是博弈双方能获得的最好结果。(×) 在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。(×)上策均衡是帕累托最优的均衡。 (×) 因为零和博弈中博弈方之间关系都是竞争性的、对立的,因此零和博弈就是非合作博弈。 (×) 在动态博弈中,因为后行动的博弈方可以先观察对方行为后再选择行为,因此总是有利的。(×) 在博弈中存在着先动优势和后动优势,所以后行动的人不一定总有利,例如:在斯塔克伯格模型中,企业就可能具有先动优势。 囚徒的困境博弈中两个囚徒之所以会处于困境,无法得到较理想的结果,是因为两囚徒都不在乎坐牢时间长短本身,只在乎不能比对方坐牢的时间更长。 (×) 纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。(√ ) 不存在纯战略纳什均衡和存在惟一的纯战略纳什均衡,作为原博弈构成的有限次重复博弈,共同特点是重复博弈本质上不过是原博弈的简单重复,重复博弈的子博弈完美纳什均衡就是每次重复采用原博弈的纳什均衡。(√ ) 多个纯战略纳什均衡博弈的有限次重复博弈子博弈完美纳什均衡路径:两阶段都采用原博弈同一个纯战略纳什均衡,或者轮流采用不同纯战略纳什均衡,或者两次都采用混合战略纳什均衡,或者混合战略和纯战略轮流采用。(√) 如果阶段博弈G={A1, A2,…,An; u1, u2,…,un)具有多重Nash均衡,那么可能(但不必)存在重复博弈G(T)的子博弈完美均衡结局,其中对于任意的t

博弈论论文

本科毕业论文(设计) 论文(设计)题目:用博弈论思想分析经济学现象,分析生活中一个经济现象 学院:计算机技术与科学学院 专业:软件工程 年级:软件123 学号: 1208060324 学生姓名:廖杰 指导教师:刘涛 2014年 5月 23日

目录 摘要 (2) ABSTRACT (3) 正文 (4) 一、完全信息讨价还价 (4) 二、不完全信息下的讨价还价 (6) 三、总结 (7) 参考文献 (7) 附录一 (8)

从讨价还价看经济、市场 摘要 本文阐述了博弈论在讨价还价方面的应用理论。主要在完全信息与不完全信息下,进一步针对不同的情况,综合地介绍讨价还价理论模型以及应用。 讨价还价作为市场经济中最常见、普通的事情,也是博弈论中最经典的动态博弈问题。现实经济中充满了“讨价还价”的情形,大到国与国之间的贸易协定,小到个体消费者与零售商的价格商定,还有厂商与工会之间的工资协议、房产商与买者之间关于房价的确定、各种类型的谈判等等。这实际上是两个行为主体之间的博弈问题,也可以把讨价还价看作为一个策略选择问题,即如何分配两个对弈者之间的相互关联的收益问题。 关键词:博弈论,讨价还价,博弈树

Viewing from the bargaining, market economy Abstract This paper expounds the bargaining game theory in the application of theory. Main under complete information and incomplete information, further according to different situation, comprehensive introduction to bargaining model in theory and application. Bargaining as the most common, ordinary things in market economy, as well as the most classical game theory of dynamic game problems. Is full of "bargain" in real economic situations, big to trade agreements between countries and agreed on the price of small to individual consumers and retailers, and manufacturers and the unions wage agreement between, between property developers and buyers about the determination of prices, various types of negotiation, and so on. This is actually a game between two agents, can also read the bargain as a strategy choice problem, namely how to divide the two players of the correlation between income problem. Key words:Game theory Argy-bargy, Game tree

博弈论案例分析

(1)失火了,你往哪个门跑 失火了,你往哪个门跑——这就是博弈论 一天晚上,你参加一个派对,屋里有很多人,你玩得很开心。这时候,屋里突然失火,火势很大,无法扑灭。此时你想逃生。你的面前有两个门,左门和右门,你必须在它们之间选择。但问题是,其他人也要争抢这两个门出逃。如果你选择的门是很多人选择的,那么你将因人多拥挤、冲不出去而烧死;相反,如果你选择的是较少人选择的,那么你将逃生。这里我们不考虑道德因素,你将如何选择?这就是博弈论! 你的选择必须考虑其他人的选择,而其他人的选择也考虑你的选择。你的结果——博弈论称之为支付,不仅取决于你的行动选择——博弈论称之为策略选择,同时取决于他人的策略选择。你和这群人构成一个博弈(game)。 上述博弈是一个叫张翼成的中国人在1997年提出的一个博弈论模型,被称之为少数者博弈或少数派博弈(Minority Game)。当然,原来的博弈形式不是这么简单,这里我把它简化了,我们在第三部分论述归纳推理时还要谈这个博弈模型。现在很多学者在研究这个问题。 生活中博弈的案例很多,你会见到很多例子。只要涉及到人群的互动,就有博弈。 什么叫博弈?博弈的英文为game,我们一般将它翻译成“游戏”。而在西方,game的意义不同于汉语中的游戏。在英语中,game即是

人们遵循一定规则下的活动,进行活动的人的目的是使自己“赢”。奥林匹克运动会叫Olympic Games。在英文中,game有竞赛的意思,进行game的人是很认真的,不同于汉语中游戏的概念。在汉语中,游戏有儿戏的味道。因此将关于game的理论,即game theory翻译成博弈论或者对策论,是恰当的。本书下面统称game theory为博弈论。 博弈论的出现只有50多年的历史。博弈论的开创者为诺意曼与摩根斯坦,他们1944年出版了《博弈论与经济行为》。诺意曼是着名的数学家,他同时对计算机的发明作出了巨大贡献,他去世时博弈论还未对经济学产生广泛影响,否则经济学的诺贝尔奖肯定有他的名字,因为诺贝尔奖有规定,只颁发给在世的学者。谈到博弈论,不能忽略博弈论天才纳什(John Nash)。纳什的开创性论文《n人博弈的均衡点》(1950)、《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。今天博弈论已发展成一个较完善的学科。 博弈论对于社会科学有着重要的意义,它正成为社会科学研究范式中的一种核心工具,以至于我们可称博弈论是“社会科学的数学”,或者说是关于社会的数学。从理论上讲,博弈论是研究理性的行动者(agents)相互作用的形式理论,而实际上它正深入到经济学、政治学、社会学等等,被各门社会科学所应用。甚至有学者声称要用博弈论重新改写经济学。1994年经济学诺贝尔奖颁发给三位博弈论专家:纳什、塞尔屯、哈桑尼(),而像1985年获得诺贝尔奖的公共选择学派的领导者布坎南,1995年获得诺贝尔奖的理性主义学派的领袖卢

博弈论论文

博弈论论文 Prepared on 22 November 2020

博 弈 论 姓名:XXX 学号:XXXXXXXXXXX 专业班级:XXXXXXXXXXXXX 博弈论课堂回顾与总结 还记得当时在纠结抢什么选修的时候,朋友说博弈论好呀!老师经常让我们玩游戏,而且可以学到很多东西。于是乎我就在朋友的强力推荐下抢到了大学的最后一门选修课——博弈论。时光匆匆,转眼12周过去,博弈论课程也接近尾声,在这我以这篇文章回顾总结一下这十三周的课堂与收获。 课堂总结: 博弈论的第一课老师给我们讲了博弈论的定义,让我们首次认识和了解博弈论: 1、博弈论又被称为对策论既是现代数学的一个新分支,也是运筹学的一个重要学科。 2、博弈论主要研究公式化了的激励结构间的相互作用。是研究具有斗争或竞争性质现象的数学理论和方法。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们

的优化策略。生物学家使用博弈理论来理解和预测进化论的某些结果。3、博弈论已经成为经济学的标准分析工具之一。在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。4、基本概念中包括局中人、行动、信息、策略、收益、均衡和结果等。其中局中人、策略和收益是最基本要素。局中人、行动和结果被统称为博弈规则。 在随后的课堂里,老师分别给我们讲了:纳什均衡、囚徒困境、重复博弈、一次博弈、一报还一报(以牙还牙、以眼还眼、悔过的一报还一报、以怨抱怨、以德报怨、以直报怨)、人质困境(多个人的囚徒困境)、酒吧博弈(非线性预测)、枪手博弈(先发优势与后发制人)、智猪博弈、斗鸡博弈、协和谬误等。老师详细讲解了它们的定义、条件、破解、策略以及运用。 例如: 一.酒吧博弈(非线性预测) 前提条件限制:要做出正确的预测必须知道他人的抉择,过去的历史是“任意 的”,未来就不可能得到一个确定的值。 现实启示:1.从一非线性系统整体来说,其变化经济不可预测 2.对于一个混沌系统中个体来说,在无法预测过程中也可采取恰当策 略,并可趋吉避凶,即少数者策略 二. 囚徒困境: 基本精神是背叛,处于囚徒困境时,没有什么十全十美的办法能让自己在困境 中逃脱,只能尽量做到自己不受侵害,两利相对取其重,两害相对取其轻 如何设计:1.博弈双方信息沟通流畅 2.博弈双方互不信任

博弈论经典案例与分析

博弈论的经典案例与分析 囚徒困境 案例:警察把甲乙分开关押,并在提审时分别告之,如果你坦白而他不坦白,那么你将只判0年,他将被判8年;如果你不坦白而他坦白,那么你判8年,他判0年;如果你们两人都坦白了,各判5年;如果你们两人都不坦白了,各判1年。 分析:每个博弈方选择自己的策略时,虽然无法知道另一方的实际选择,但他却不能忽视另一方的选择对他自己的得益的影响,因此他应该考虑到另一方有两种可能的选择,并分别考虑自己相应的最佳策略。对囚徒A来说,囚徒B有坦白和不坦白两种可能的选择,假设囚徒B的选择是不坦白,则对囚徒A来说,不坦白得益为-1,坦白得益为0,他应该选择坦白; 假设囚徒B选择的是坦白,则囚徒A不坦白得益为-8,坦白得益为-5,他还是该选择坦白。因此,在此博弈中,无论囚徒B采取何种策略囚徒A的选择只有一种,即坦白,因为在另一方两种可能的情况下,坦白给自己带来的得益都是较大的。同样的道理,囚徒B 的唯一的选择也是坦白。 所以最可能的结局:该博弈的最终结果是两博弈方同选择坦白策略。 其支付矩阵如下: 性格大战 嫌疑犯乙

案例:一对恋人准备在周末晚上一起出去,男的喜欢看足球,但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。 分析:可以看出,分开将使他们两人得不到任何满足,只要在一起,不管是看时装表演还是看足球,两人都会得到一定的满足。但看足球将使男的得到更大的满足,看时装表演则使女的得到更大的满足。 在这样的一个对局中,男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择,一旦对方选定了某一项活动,另一个人选择同样的活动就是最好的策略。因此,如果男的已经买好了足球的门票,女的当然就不再反对;反之,如果女的已经买好了时装表演票,男的也就会与她一起看时装表演。 价格战 案例:假设市场中仅有A 、B 两家企业,每家企业可采取的定价策略都是10元或15元,我们可以得出得益矩阵如下: 分析:无论对企业A 还是企业B 来说,低价都是他们的占优战略。从表可见,企业A 的占优战略是10元,因为无论B 采取什么战略,企业A 都能获取比定价15元更多的利润。 如果企业B 定价10元,企业A 定价10元能够获利80万元,而定价15元只能获得30万元;如果企业B 定价15元,企业A 定价10元可获利170万元,而定价15元却只能获利120万元。同样地,企业B 的占优战略也是定价10元的策略。 企业B 男

博弈论经典模型全解析

博弈论经典模型全解析(入门级) 1. 囚徒困境这是博弈论中最最经典的案例了——囚徒困境,非常耐人寻味。“囚徒困境”说的是两个囚犯的故事。这两个囚徒一起做坏事,结果被警察发现抓了起来,分别关在两个独立的不能互通信息的牢房里进行审讯。在这种情形下,两个囚犯都可以做出自己的选择:或者供出他的同伙(即与警察合作,从而背叛他的同伙),或者保持沉默(也就是与他的同伙合作,而不是与警察合作)。这两个囚犯都知道,如果他俩都能保持沉默的话,就都会被释放,因为只要他们拒不承认,警方无法给他们定罪。但警方也明白这一点,所以他们就给了这两个囚犯一点儿刺激:如果他们中的一个人背叛,即告发他的同伙,那么他就可以被无罪释放,同时还可以得到一笔奖金。而他的同伙就会被按照最重的罪来判决,并且为了加重惩罚,还要对他施以罚款,作为对告发者的奖赏。当然,如果这两个囚犯互相背叛的话,两个人都会被按照最重的罪来判决,谁也不会得到奖赏。那么,这两个囚犯该怎么办呢?是选择互相合作还是互相背叛?从表面上看,他们应该互相合作,保持沉默,因为这样他们俩都能得到最好的结果:自由。但他们不得不仔细考虑对方可能采取什么选择。A犯不是个傻子,他马上意识到,他根本无法相信他的同伙不

会向警方提供对他不利的证据,然后带着一笔丰厚的奖赏出狱而去,让他独自坐牢。这种想法的诱惑力实在太大了。但他也意识到,他的同伙也不是傻子,也会这样来设想他。所以A犯的结论是,唯一理性的选择就是背叛同伙,把一切都告诉警方,因为如果他的同伙笨得只会保持沉默,那么他就会是那个带奖出狱的幸运者了。而如果他的同伙也根据这个逻辑向警方交代了,那么,A犯反正也得服刑,起码他不必在这之上再被罚款。所以其结果就是,这两个囚犯按照不顾一切的逻辑得到了最糟糕的报应:坐牢。企业在信息化过程中需要与咨询企业、软件供应商打交道的。在与这些企业打交道的过程中,我们不可避免地也会遇到类似的两难境地,这个时候需要相互之间有足够的了解与信任,没有起码的信任做基础,切不可贸然合作。在对对方有了足够的信任之后,诚意也是必不可少的,如果没有诚意或者太过贪婪,就可能闹到双方都没有好处的糟糕情况,造成企业之间的双输。 2. 智猪博弈在博弈论(Game Theory)经济学中,“智猪博弈”是一个着名的纳什均衡的例子。假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽,另一头安装着控制猪食供应的按钮,按一下按钮会有10个单位的猪食进槽,但是谁按按钮就会首先付出2个单位的成本,若大猪先到槽边,大小猪吃到食物的收益比是9∶1;同时到槽边,收益比是

博弈论课文翻译

搏弈论 阿维纳什?迪克斯特&巴里?内尔巴夫 1搏弈是有关策略的科学。它试图以数学和逻辑的方法来帮助搏弈者作出决策,在一系列纷繁复杂的搏弈中应采取何种策略来保证自己获得最大利益。搏弈论研究的搏弈的范围包括了从下棋到抚育儿童,从网球竞技到公司转手。但是所有的博弈都具有一个共同的特征:相互作用。也就是说,每一个博弈者的博弈结果取决于所有博弈参与者的策略选择。在零和搏弈中,搏弈者的利益之间是完全冲突的,因此一方的得利必然导致另一方的损失。更多具有代表性的例子还有会导致共同得利(正和)搏弈和共同损失(负和)搏弈,同样的情况还会发生在另外一些冲突中。 2搏弈论研究的先驱者是普林斯顿数学家约翰?冯?诺依曼。在早先的一段时间里,研究的重点被放在了完全冲突(零和)搏弈(非合作搏弈)上,其他的搏弈当时被认为是以合作形式出现。也就是说,搏弈要求参与者共同地选择和实施他们的行为.最近的研究则把重点放在了那些既不属于零和搏弈也不属于绝对合作搏弈的情况上,在这些搏弈中,搏弈者自主地选择搏弈行为,但他们之间的相互关系中充满了合作与竞争。 3搏弈行为与我们在中性环境中所作的各种决定有着根本性的不同。要说明这一点,我们可以思考一下伐木工人和军队将军所作决定之间的不同。当伐木工人决定要如何砍树时,他不会考虑树木本身会有什么反抗,他所处的环境为中性。而当将军决定要消灭敌军时,他必须提前预料到并消除敌军的反抗。与这一例子中的将军相类似,一个搏弈者必须认识到他与其他机智且怀有争胜之心的竞争者之间的相互作用,他自己所作的决定也必须能够同时应对可能出现的合作或冲突。‖ 4搏弈的实质是搏弈者采取策略之间的相互依赖性。这种策略性的相互依赖表现为两个不同的类别:连续策略之间的相互作用以及联立策略之间的相互作用。就前者而言,搏弈者依次采取行动,每个人都会注意其他搏弈者先前的行为。就后者而言,搏弈者同时采取行动,每个人都会忽略其他搏弈者当前的行为。 5对连续策略博弈中的某一博弈这来说,一个普遍的原则就是放眼前方,及时反思和总结。每个博弈者应该弄清楚其他博弈者会对他当前的策略行为做出怎样的回应,他自己将如何应对等情况。博弈者要预料到他的最初决定会最终导致何种结果,并且运用对形势的判断来计划好当前的最佳策略。在考虑其他博弈者会如何应对时,博弈者必须能设身处地地换位思考,而不能把自己的主观判断强加与人。 6从理论上说,采取固定次序行动的任何连续博弈都可以圆满地完成。我们可以通过预测每个可能的结果来决定各个博弈者的最佳策略。例如象井字棋(tic-tac-toe)这样的简单游戏由于可以以这样的方式完成,因而并不具有挑战性。但诸如象象棋等的其他博弈,即使是借助电脑的帮助,由于其本身的计算过程过于复杂而难以在实践中去实施。因此,博弈者往往会会依据经验提前对形势作出判断并尽可能的评估最终的局面。 7与连续策略博弈的线形思维不同的是,采取共发性策略的博弈要求逻辑思维。在忽略其他参与者当前策略的情况下,尽管博弈者们同时采取行动,每一个参与者必须清楚的意识同时还会有其他的参与者在依次关注整个博弈过程。这时的思维模式可描述为:我想他认为我会这样考虑…。因此,博弈者必须从全体博弈者的立场出发并努力判断出最终的博弈结果。每个参与者的个人最佳行为都是全局谋划中不可或缺的一部分。 8运用普林斯顿数学家约翰?纳什提出的均衡概念,可以推导出这种逻辑思维的结论。我们寻求一系列的策略组合,每个博弈者都会有自己的选择,当所有的对手们在实施他们决定的最佳策略时,我们所做的选择应该对自己是最有利的。换句话说,每个博弈者都会对其他人的策略作出最优化的应对。

生活中的博弈论论文

生活中的博弈论 这学期我在人文课的选择上,我选了“生活中的博弈论”这门课。本来以为会很枯燥乏味,现在课要结束了,回想起来觉得还是挺有趣的。其中含有很浓的智慧气息,趣味横生。下面就是我关于这门课的小论文。 我们首先就会问,什么是博弈论?其实就是研究个体如何在错综复杂的相互影响中得出最合理的策略。生活中每个人,其每一个行为如同在一张看不见的棋盘上布一个子,精明慎重的棋手们相互揣摩、相互牵制,人人争赢,下出诸多精彩纷呈、变化多端的棋局。博弈论是研究棋手们“出棋”着数中理性化、逻辑化的部分,并将其系统化为一门科学。事实上,博弈论正是衍生于古老的游戏或曰博弈如象棋、扑克等。数学家们将具体的问题抽象化,通过建立完备的逻辑框架、体系研究其规律及变化。这可不是件容易的事情,以最简单的二人对弈为例,稍想一下便知此中大有玄妙:若假设双方都精确地记得自己和对手的每一步棋且都是最“理性”的棋手,甲出子的时候,为了赢棋,得仔细考虑乙的想法,而乙出子时也得考虑甲的想法,所以甲还得想到乙在想他的想法,乙当然也知道甲想到了他在想甲的想法… 博弈论怎样着手分析解决问题,怎样对作为现实归纳的抽象数学问题求出最优解、从而为在理论上指导实践提供可能性呢?现代博弈理论由匈牙利大数学家冯·诺伊曼于20世纪20年代开始创立,1944年他与经济学家奥斯卡·摩根斯特恩合作出版的巨著《博弈论与经济行为》,标志着现代系统博弈理论的初步形成。

博弈论是指某个个人或是组织,面对一定的环境条件,在一定的规则约束下,依靠所掌握的信息,从各自选择的行为或是策略进行选择并加以实施,并从各自取得相应结果或收益的过程,博弈论经过了这么多年的发展已经完善成为一门十分重要的经济学分支学科,不管是在结构分析还是决策预测等方面都发挥着越来越重要的作用,尤其对于理性人来说懂得如何博弈就显得越发重要。 下面我说一下我个人的想法。博弈其实就是一种游戏,是如何做出对自己有利选择的游戏,但又区别于传统的如体育运动、下棋、打牌等游戏,同时又和这些有些有本质的共同特征,如都有一定的规则,都有一个结果,策略至关重要,同时策略和得益有相互依存性,游戏者不同的策略会带来不同的结果。这样看来博弈好像和我们身边普通的游戏是一样的,其实这并不奇怪,其实博弈本身的含义就是博弈参与者在一定的规则条件下选择相应的策略以期获得足够的利益的过程,这和传统的游戏是相通的,如最常见的斗地主,就是在一定的规则下(如连牌至少5张一连等等),选择如何出牌(出牌的组合以及出牌的顺序等等)而获胜(当然也可能输)的过程,这本身就是一个三方博弈的过程。 为了能够了解博弈的含义,那么下面我们来看一下经典的博弈模型。 需要提到的当然是任何与博弈有关的书籍中都会讲到的“囚徒困境”。

博弈论的经典案例与分析

博弈论的经典案例与分析 囚徒困境 案例:警察把甲乙分开关押,并在提审时分别告之,如果你坦白而他不坦白,那么你将只判0年,他将被判8年;如果你不坦白而他坦白,那么你判8年,他判0年;如果你们两人都坦白了,各判5年;如果你们两人都不坦白了,各判1年。 分析:每个博弈方选择自己的策略时,虽然无法知道另一方的实际选择,但他却不能忽视另一方的选择对他自己的得益的影响,因此他应该考虑到另一方有两种可能的选择,并分别考虑自己相应的最佳策略。对囚徒A 来说,囚徒B 有坦白和不坦白两种可能的选择,假设囚徒B 的选择是不坦白,则对囚徒A 来说,不坦白得益为-1,坦白得益为0,他应该选择坦白; 假设囚徒B 选择的是坦白,则囚徒A 不坦白得益为-8,坦白得益为-5,他还是该选择坦白。因此,在此博弈中,无论囚徒B 采取何种策略囚徒A 的选择只有一种,即坦白,因为在另一方两种可能的情况下,坦白给自己带来的得益都是较大的。同样的道理,囚徒B 的唯一的选择也是坦白。 所以最可能的结局:该博弈的最终结果是两博弈方同选择坦白策略。 其支付矩阵如下: 性格大战 案例:一对恋人准备在周末晚上一起出去,男的喜欢看足球,但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。 分析:可以看出,分开将使他们两人得不到任何满足,只要在一起,不管是看时装表演还是看足球,两人都会得到一定的满足。但看足球将使男的得到更大的满足,看时装表演则使女的得到更大的满足。 在这样的一个对局中,男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择,一旦对方选定了某一项活动,另一个人选择同样的活动就是最好的策略。因此,如果男的已经买好了足球的门票,女的当然就不再反对;反之,如果女的已经买好了时装表演票,男的也就会与她一起看时装表演。 1,1 8, 0 不坦白 0,8 5,5 坦白 嫌疑犯乙 不坦白 坦白 嫌疑犯甲 1,2 -1, -1 时装 0,0 2,1 足球 男 时装 足球 女

相关主题
文本预览
相关文档 最新文档