当前位置:文档之家› 博弈论基础复习(1)

博弈论基础复习(1)

博弈论基础复习(1)
博弈论基础复习(1)

《博弈论基础》复习大纲

一、名词解释(5×2=10分)

策略型博弈

它是由三个部分组成,即局中人、策略和各种策略组合中所得到的利益。

纳什均衡

指参与博弈的每一局中人在给定其他局中人策略的条件下选择上策所构成的一种策略组合。混合策略

局中人的混合策略是其纯策略空间上的一种概率分布,表示局中人实际博弈时根据这种概率分布在纯策略中随机选择加以实施。

扩展型博弈

博弈存在着局中人行动的先后次序,是对具有动态结构的决策形式进行研究的规范分析工具。博弈树

对于任何一种双人完备博弈,都可以用一个博弈树来描述,并通过博弈树搜索策略寻找最佳解。博弈树类似于状态图和问题求解搜索中使用的搜索树。

完美信息博弈

是指一次只有一个局中人在行动,而且他在行动时知道博弈的所有以往行动历史的一类特殊博弈。

子博弈

指由原扩展型博弈中的一个决策节点与它的所有后续节点组成的博弈。

行为策略

是指每一个参与人在每一个信息集上随机的选择行动。

逆向归纳法

逆向归纳法是求解子博弈精炼纳什均衡的最简便方法。在求解子博弈精炼纳什均衡时,从最后一个子博弈开始逆推上。

冷酷策略

又称触发策略。指参与人在开始时选择合作,在接下来的博弈中,如果对方合作则继续合作,而如果对方一旦背叛,则永远选择背叛,永不合作。

类型

一般地,将一个参与人所拥有的所有私人信息称为他的类型。

静态贝叶斯均衡

是一种与类型有关的策略组合,其中每个局中人在给定自己类型和其它局中人策略的情况下最大化自己的期望效用函数。

信号博弈

是研究具有信息传递作用的信号机制的一般博弈模型,其基本特征是两个博弈方,分别称为信号发出方和信号接收方。

分离均衡

信号博弈中的完美贝叶斯均衡之一,这种均衡中不同类型的发送者以概率1选择不同的信号,接收者完全可以通过信号来准确判断出发送者的类型。

混同均衡

信号博弈中的完美贝叶斯均衡之一,这种均衡中不同类型的发送者选择了相同的信号,接收

者无法从信号中得到新的信息,无法对先验信念进行修正。

联盟

设},,2,1{I 为局中人集合,则其中任意一非空子集 S 为一个联盟。

特征函数

特征函数型博弈对每一种可能联盟给出相应的联盟总和收益,也就是给出了一种集合函数,称为特征函数。

多人合作博弈中所有不被超优的分配的集合。

核仁

合作博弈核仁解所依据的基本思想是:在分配属于核仁的条件下,最不理想的联盟也要优于任何其它分配向量的最不理想的联盟。

二、

判断题(5×1=5分) 三、 简答题(4×7=28分)

策略型博弈的基本要素。

策略型博弈的基本要素有:

局中人:即博弈的参与者,可以是自然人﹑企业﹑政府﹑社团等。

策略:指每个局中人在博弈中可选择采用的行动方案。

支付:指每个局中人从各种策略组合中获得的收益。

什么是纳什均衡?你是如何理解的?

纳什均衡及其理解:

在一个博弈过程中,无论其它局中人的策略选择如何,局中人都会选择某个确定的策略,则该策略被称作支配性策略。如果两个博弈的当事人的策略组合分别构成各自的支配性策略,

局中人谁都没有动机单方面偏离该状态,那么这个组合就被定义为纳什均衡。

1.是完全信息静态博弈的解的一般概念。

2.每一个严格占优战略均衡一定是纳什均衡,反之不然。

3.每一个逐步剔除严格劣战均衡一定是纳什均衡,反之不然。

比较策略型博弈的纯策略和混合策略。

纯策略是指每个局中人在博弈中可选择采用的行动方案,混合策略是局中人的纯策略空间上的一种概率分布,表示局中人实际博弈时根据这种概率分布在纯策略中随机选择加以实施。纯策略可视为混合策略的特例,也就是对某个纯策略赋予概率1而对其他纯策略赋予概率0的混合策略。

分析两人两策略博弈构成囚徒困境博弈应满足的条件。囚徒困境博弈说明了什么问题?P.14

说明了个体理性和集体理性之间的矛盾;巿场失灵。

简要分析扩展型博弈的构成要素。

(1)参与人集合;虚拟参与人——自然。

(2)行动顺序:谁在什么时候行动。

(3)参与人的行动空间:每次行动时,局中人可进行的选择

(4)参与人的信息集:信息是参与人有关博弈的知识,如有关“自然”的选择、其他参与人的特征和行动的知识等。

(5)参与人的支付函数:指在一个特定策略组合下参与人得到的确定(期望)效用水平(6)外生事件的概率分布。

如何理解完全信息动态博弈下的纯策略和行动?

行动与策略

行动:是参与人在博弈的某个时点(某个信息集)的决策变量。

行动组合:参与人的行动的有序集。

策略:是参与人在给定信息集情况下的行动规则,它规定参与人在什么时候选择什么行动。

在静态博弈中,策略和行动是等价的。

在动态博弈中,策略在给定信息集下完整的行动方案,与行动是不同的。

理解子博弈和掌握逆向归纳法求解思想。

子博弈是指由原扩展型博弈中的一个决策节点与它的所有后续节点组成的博弈。

一个扩展式表述博弈的子博弈是原博弈的一部分,它应满足下列条件:

(1).始于单结信息集的决策结x(但不包括原博弈的初始结)。

(2).包含博弈树中策结x的所有后续结(包括终点结)。

(3).没有对任何信息集形成分割。

逆向归纳法思想分析:

有限博弈一定存在一个最后的决策结(其直接后续结是终点结)的集合,在该决策结上行动的参与人将选择一个最大化自己的支付的行动;给定这个参与人的行动,倒数第二个决策结上的参与人将选择一个可行的行动最大化自己的支付;如此类推,直至初始结。

该倒推过程完成时得到了一条路径,该路径给出了每一个参与人的一个特定的策略,它是一个纳什均衡(子博弈精炼纳什均衡)。逆向归纳法实质是重复剔除严格劣策略方法在扩展式博弈中的运用。

你是如何理解混合策略的纯化定理的?

你是如何理解不完全信息博弈中的不完全信息?

不完全信息是指一种博弈局势中局中人对其他局中人(或者他自己)与该种博弈局势有关的事前信息了解不充分,而不是博弈中产生的与局中人实际策略选择有关的信息。

从技术上看,博弈的不完全信息表现为对博弈的基本数学结构了解不充分。在策略型博弈中,则表现为对博弈的三种组成部分,即局中人、策略和支付有着不完全的了解。

在理论上,各类不完全信息情形都可归结为对支付函数的不完全信息。

什么是后续博弈?简要分析完美贝叶斯均衡与后续博弈的关系。

每个信息集开始的博弈的剩余部分称为后续博弈。

完美(精炼)贝叶斯均衡要求在所有的后续博弈上也达到贝叶斯均衡。

什么是信号博弈?简要分析信号博弈的结构。

在信号博弈中,有两个局中人,局中人1是领先者,也称发送者,他发送信号,局中人2是后继者,也称接收者,他接收信息。局中人1具有关于自己类型的私有信息,在集合A1中选择行动a1,局中人2观测到a1后在集合A2中选择行动。

什么是信号传递博弈的分离均衡和混同均衡。针对信号发送者两种类型时,掌握其模型化思想。

分离均衡:不同类型的发送者以1的概率选择不同的信号,接收者完全可以根据信号来准确地判断出发送者的类型。

混同均衡:不同类型的发送者选择相同的信号,此时接收者不修正先验概率。

教育信号模型是怎样的?斯宾塞教育博弈模型说明了什么问题?

他说明了教育的一种特殊功能,被称为教育的“甄别”理论。在教育的教书育人功能之外,它能够给局中人提供一种信号传递的机制。雇主在面对求职者时不知道对方的真实生产力水平,求职者的学历就提供了一种信号,表现求职者的生产力水平高低。因此,即便教育不能真正提高受教育者的社会生产力,它也具有甄别人们能力高低的作用。

理解特征函数和核仁的求解。

特征函数型博弈对每一种可能联盟给出相应的联盟总和收益,也就是给出了一种集合函数,称为特征函数。

合作博弈核仁解所依据的基本思想是:在分配属于核仁的条件下,最不理想的联盟也要优于任何其它分配向量的最不理想的联盟。

比较合作博弈和非合作博弈。

合约强制力不同:

在合作博弈中,协议有外在力量保证强制执行;在非合作博弈中,协议没有外在力量保证强制执行。

研究重点不同:

合作博弈研究的重点是联盟,非合作博弈的重点是个体。

四、计算题(2×8+2×10=36分)

用划线法求解纯策略纳什均衡。(P34:4、6、7)

古诺竞争博弈(P23,P34:习题9)

博弈树与标准式博弈的转换

求解子博弈完美(精炼)纳什均衡。(P49例2.2,P57:习题4)

不完全信息博弈求解(P68例3.3古诺竞争,P69例3.4,P74习题1、5)

分离均衡和混同均衡求解(P90习题5)。

理解特征函数和核仁的求解。

核、核仁中相关定理的证明。

五、论述题(10+11=21分)

谈谈你学习博弈论的心得体会。

什么是逆向选择?谈谈你对逆向选择的理解。举例说明它们在经济金融领域中的应用。

什么是道德风险?谈谈你对道德风险的理解。举例说明它们在经济金融领域中的应用。

你是如何理解委托代理分析框架的?举例说明在经济金融领域中有哪些委托代理问题。

博弈论期末习题

《博弈论》期末习题 专业:经济学学号:2 ;姓名:王兆丽 一、试写出掷硬币博弈的局中人及其策略与得益函数,并写出双变量得 益矩阵。 答:局中人:盖硬币者和猜硬币者。 策略:有正面和反面两种可选择策略,若猜对,猜者得1盖者-1.否则猜者-1盖者1.由于每一方都不会让对方在选择之前知道自己的决策,所以可以看做是同时做决策的。 双变量得益矩阵; 猜硬币方 二、试举生活中的一例,说明囚徒困境是如何产生的?并试分析可能走 出囚徒困境的途径。 答:例子:中国移动和中国联通之间的价格战。 产生原因:囚徒困境是在个体之间存在行为和利益相互制约的博弈结构中,以个体理性和个体选择为基础的分散决策方式,无法有效地协调各方面的利益,并实现整体、个体利益共同的最优。简单的说,囚徒困境问题都是个体理性与集体理性的矛盾引起的。 可能走出的囚徒困境途径:(1)惩罚。如果政府对实行价格战以获利的企业实行惩罚,那么就会制止这种现象发生。(2)忠诚文化。有时候,建立一种相互忠诚的文化也可以帮助走出囚徒困境。在很多组织中,团体产生所面临的囚徒困境问题的轻重程度是不同的,这种差异的根本来源就是各个组织有自己的文化。(3)长期关系和重复博弈。建立长期关系使得囚徒困境博弈可以多次重复,如果这个“多次”足够长,那么人们就有可能为了长远的将来利益而牺牲眼前的一笔横财,合作也是可以达成的。

三、用逆向归纳法求解下面的博弈的子博弈完美纳什均衡。 答:1、该博弈共包括四个子博弈:(1)从博弈方1选择R 以后博弈方2的第二 阶段选择开始的三阶段动态博弈;(2)从博弈方2第二阶段选择R 以后博弈方1 的开始选择的两个阶段动态博弈;(3)第三阶段博弈方1选择A 以后博弈方2 的单人博弈;(4)第三阶段博弈方1选择B 以后博弈方2的单人博弈 2、根据逆推归纳法先讨论博弈方2在第四阶段的选择。由于选择C 、D 个中 任何一个的得益都相同,因此在这阶段随意选择一个都可以。倒退回第三阶段, 博弈方1选择AB中任何一个都可以。再推回第二阶段,博弈方2选择L将得到 3选择R得到2,因此选择L;最后回到第一阶段,博弈方1选择L得到2选择 R得到3,。所以该博弈的子博弈完美纳什均衡为:博弈方1第一阶段选择R, 博弈方2第二阶段选择L,即(3,1)是该博弈的完美纳什均衡。 四、两个寡头企业进行价格竞争博弈,企业1的利润函数是 q c aq p ++--=21)(π,企业2的利润函数是p b q +--=22)(π,其中p 是企业1 的价格,q 是企业2的价格。求: 1.两个企业同时决策的纯战略纳什均衡; 两个企业同时定价。根据两个企业的得益函数,很容易导出它们各自的反应 函数:απ1 /αp = -2(p-aq+c)=0 ____ p=aq-c απ2/αq = -2(q-b)=0 ______ q=b

《经济博弈论》期末考试复习

《经济博弈论》期末考试复习资料 第一章导论 1.博弈的概念: 博弈即一些个人、队组或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,并从中各自取得相应结果的过程。它包括四个要素:参与者,策略,次序和得益。 2.一个博弈的构成要素: 博弈模型有下列要素:(1)博弈方。即博弈中决策并承但结果的参与者.包括个人或组织等:(2)策略。即博弈方决策、选择的内容,包括行为取舍、经济活动水平或多种行为的特定组合等。各博弈方的策略选择范围称策略空间。每个博弈方各选一个策略构成一个策略组合。(3)进行博弈的次序:次序不同一般就是不同的博弈,即使博弈的其他方面都相同。(4)得益。各策略组合对应的各博弈方获得的数值结果,可以是经济利益,也可以是非经济利益折算的效用等。 3.合作博弈和非合作博弈的区别: 合作博弈:允许存在有约束力协议的博弈;非合作博弈:不允许存在有约束力协议的博弈。主要区别:人们的行为互相作用时,当事人能否达成一个具有约束力的协议。 假设博弈方是两个寡头企业,如果他们之间达成一个协议,联合最大化垄断利润,并且各自按这个协议生产,就是合作博弈。 如果达不成协议,或不遵守协议,每个企业都只选择自己的最优产品(价格),则是非合作博弈。 合作博弈:团体理性(效率高,公正,公平) 非合作博弈:个人理性,个人最优决策(可能有效率,可能无效率) 4.完全理性和有限理性: 完全理性:有完美的分析判断能力和不会犯选择行为的错误。 有限理性:博弈方的判断选择能力有缺陷。 区分两者的重要性在于如果决策者是有限理性的,那么他们的策略行为和博弈结果通常与在博弈方有完全理想假设的基础上的预测有很大差距,以完全理性为基础的博弈分析可能会失效。所以不能简单地假设各博弈方都完全理性。 5.个体理性和集体理性: 个体理性:以个体利益最大为目标;集体理性:追求集体利益最大化。 第一章课后题:2、4、5 2.设定一个博弈模型必须确定哪几个方面? 设定一个博弈必须确定的方面包括:(1)博弈方,即博弈中进行决策并承担结果的参与者;(2)策略(空间),即博弈方选择的内容,可以是方向、取舍选择,也可以是连续的数量水平等;(3)得益或得益函数,即博弈方行为、策略选择的相应后果、结果,必须是数量或者能够折算成数量;(4)博弈次序,即博弈方行为、选择的先后次序或者重复次数等;(5)信息结构,即博弈方相互对其他博弈方行为或最终利益

博弈论的基础知识(doc 21页)

博弈论的基础知识与应用(转) 1 基础知识 博弈论是一种独特的处于各学科之间的研究人类行为的方法。与博弈论有关的学科包括数学、经济学以及其他社会科学和行为科学。博弈论(如同计算科学理论和许多其他的贡献一样)是由约翰.冯.诺伊曼(John von Neumann)创立的。博弈论领域第一本重要著作是诺伊曼与另一个伟大的数理经济学家奥斯卡.摩根斯坦(Oskar Morgenstern)共同写成的《博弈论与经济行为》(The Theory of Games and Economic Behavior)。当然,摩根斯坦把新古典经济学的思想带入了合作中,但是诺伊曼也同样意识到那些思想并对新古典经济学做出了其他的贡献。 ■一个科学的隐喻 由于诺伊曼的工作,在更广阔的人类行为互动的范围内,“博弈”成为了一个科学的隐喻。在人类的互动行为中,结局依赖于两个或更多的人们所采取的交互式的战略,这些人们具有相反的动机或者最好的组合动机(mixed motives)。在博弈论中常常讨论的问题包括: 1)当结局依赖于其他人所选择的战略以及信息是完全的时候,“理性地”选择战略意味着什么? 2)在允许共同得益或者共同损失的“博弈”中,寻求合作以实现共同得益(或避免共同损失)是否“理性”?或者,采取侵略

性的行动以寻求私人利益而不顾共同得益或共同损失,这是否是 博弈论的基础知识与应用(转) 1 基础知识 博弈论是一种独特的处于各学科之间的研究人类行为的方法。与博弈论有关的学科包括数学、经济学以及其他社会科学和行为科学。博弈论(如同计算科学理论和许多其他的贡献一样)是由约翰.冯.诺伊曼(John von Neumann)创立的。博弈论领域第一本重要著作是诺伊曼与另一个伟大的数理经济学家奥斯卡.摩根斯坦(Oskar Morgenstern)共同写成的《博弈论与经济行为》(The Theory of Games and Economic Behavior)。当然,摩根斯坦把新古典经济学的思想带入了合作中,但是诺伊曼也同样意识到那些思想并对新古典经济学做出了其他的贡献。 ■一个科学的隐喻 由于诺伊曼的工作,在更广阔的人类行为互动的范围内,“博弈”成为了一个科学的隐喻。在人类的互动行为中,结局依赖于两个或更多的人们所采取的交互式的战略,这些人们具有相反的动机或者最好的组合动机(mixed motives)。在博弈论中常常讨论的问题包括: 1)当结局依赖于其他人所选择的战略以及信息是完全的时候,“理性地”选择战略意味着什么? 2)在允许共同得益或者共同损失的“博弈”中,寻求合作以

博弈论基础复习

《博弈论基础》主要知识点 一、名词解释(5×2=10分) 策略型博弈它是由三个部分组成,即局中人、策略和各种策略组合中所得到的利益。 纳什均衡指参与博弈的每一局中人在给定其他局中人策略的条件下选择上策所构成的一种策略组合。 混合策略局中人的混合策略是其纯策略空间上的一种概率分布,表示局中人实际博弈时根据这种概率分布在纯策略中随机选择加以实施。 扩展型博弈博弈存在着局中人行动的先后次序,是对具有动态结构的决策形式进行研究的规范分析工具。 博弈树对于任何一种双人完备博弈,都可以用一个博弈树来描述,并通过博弈树搜索策略寻找最佳解。博弈树类似于状态图和问题求解搜索中使用的搜索树。 完美信息博弈是指一次只有一个局中人在行动,而且他在行动时知道博弈的所有以往行动历史的一类特殊博弈。 子博弈指由原扩展型博弈中的一个决策节点与它的所有后续节点组成的博弈。行为策略是指每一个参与人在每一个信息集上随机的选择行动。 逆向归纳法逆向归纳法是求解子博弈精炼纳什均衡的最简便方法。在求解子博弈精炼纳什均衡时,从最后一个子博弈开始逆推上。 冷酷策略又称触发策略。指参与人在开始时选择合作,在接下来的博弈中,如果对方合作则继续合作,而如果对方一旦背叛,则永远选择背叛,永不合作。 类型 :一般地,将一个参与人所拥有的所有私人信息称为他的类型。 信号博弈是研究具有信息传递作用的信号机制的一般博弈模型,其基本特征是两个博弈方,分别称为信号发出方和信号接收方。 分离均衡信号博弈中的完美贝叶斯均衡之一,这种均衡中不同类型的发送者以概率1选择不同的信号,接收者完全可以通过信号来准确判断出发送者的类型。 混同均衡信号博弈中的完美贝叶斯均衡之一,这种均衡中不同类型的发送者选择了相同的信号,接收者无法从信号中得到新的信息,无法对先验信念进行修正。 特征函数特征函数型博弈对每一种可能联盟给出相应的联盟总和收益,也就是给出了一种集合函数,称为特征函数。 联盟

博弈期末考试总结

博弈与决策答案 一、名词解释(每小题2分,共16分) 1、博弈 博弈是指一些个人、团队或其他组织,面对一定的环境条件,在一定的规则约束下,依靠掌握的信息,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以施,并从中各自取得相应结果或收益的过程, 2、占优战略均衡 占优战略均衡是指在博弈中,如果所有参与人都有占优策略存在,博弈将在所有参与人的优策略的基础上达到均衡. 3、重复博弈 重复博弈是指同一个博弈在相同的环境、规则下反复多次执行的博弈问题, 4、序列博弈 序列博弈是指对局者选择策略有时问先后的顺序,某些对局者可能率先采取行动.序列博也是一种动态博弈. 5、动态博弈 动态博弈是指在博弈中,参与人的行动有先后顺序且后行动者能够观察到先行动者所选择的行动. 6、占优战略均衡--占优战略均衡是指在博弈中,如果所有参与人都有占优策略存在,博弈将在所有参与人的占优策略的基础上达到均衡. 7、完全信息---完全信息是指在博弈过程中,每一位参与人对其他参与人的特征、策略空间及收益函数有准确的信息. 8、得益 得益是参与人在博弈结束后从博弈中获得的效用,一般是所有参与人的策略或行动的函数,这是每个参与人最关心的东西. 9,博弈论:博弈论就是系统的研究各种各样的博弈问题,寻求各博弈方合理选择策略的情况下博弈的解,并对这些解进行讨论分析的理论。 10,纳什战略均衡:纳什战略均衡指在均衡中,每个博弈参与人都确信,在给定其他参与人选择的策略的情况下,该参与人选择了最优策略以回应对手的策略。 11,静态博弈:静态博弈是指在博弈中,参与人同时选择或非同时选择但后行动者并不知道先行动者采取了什么具体行动。 二、、简答题(每小题6分,共24分) 1、占优战略均衡和纳什均衡的联系与区别如下: 1)每一个占优战略均衡都是纳什均衡,而每一个纳什均衡却未必是占优战略均衡; 2)用重复剔除严格劣战略方法,保留下的唯一的重复剔除的占优均衡,就是纳什均衡. 3)纳什均衡,不会被重复剔除严格劣战略方法剔除掉(但弱劣战略剔除,可能会剔除纳什衡): 4)经重复剔除严格劣战略之后,有不唯一的多个哉略组合保留,其中有的战略组合不一定纳什均衡.即重复剔除严格劣战略方法,无法确保将所有非纳什均衡战略剔除,没有被剔的战略组合不一定是纳什均衡. 5)没有占优战略均衡的博弈,不能用重复剔除严格劣战略方法求解的博弈,可以有纳什均衡2,博弈的构成要素有哪些?并对其进行说明。 2、博弈一般由以下几个要素组成,包括:参与人、行动、信息,策略、得益、结果、均衡等.

博弈论试题及答案

诚信考试沉着应考杜绝违纪 《博弈论》试卷 课堂周四(7/8) 院系专业万方电气系通信工程 学号 余数 0 姓名

河南理工大学2010–2011学年第1学期 《博弈论》课程期末考试试卷 开课学院:经济管理学院,考试形式:开卷,允许带___________入场 考试时间:2010年12月25日-12月25日, 所需时间:周 考生姓名:学号:专业: 题序一二三四五六七八总分得分 评卷人 1、第一题:(10分) (1)举一个你所经历情侣博弈的情形,在实际博弈中你采取什么行动让自己收益最大; 答:作为一个男生,我想很多机会都是把握在自己手中的,情侣博弈有二个“纳什均衡”,一次博弈的结局究竟落到哪一个“纳什均衡”,关键就是要看遇事时自己如何去选择了。 例如:周末和女朋友去逛商场,应该客观地按照需求去采购,在了解女朋友的爱好的前提下,想办法引导她去看性价比最高的商品,并给予一定建议。遇到她特别喜欢的衣服或饰物,只要价格合理,又能满足生活需要,在对方征求意见时应该支持购买并给予肯定答复;当遇到不合理的购买选择时,应简明扼要地说出其不适之处,并建议对方到其它她喜欢的物品处,挑选令其满意的商品。购物中间一旦遇到对方生气或者发火,可以宽容地对待对方,以显示出自己的城府,若对方为无理取闹,应该坦诚地向对方说明情况,让对方明白自己在为她考虑,说明都说清楚了事情也就简化了。另外,在购物结束前,可以给女朋友买些她喜欢的零食,或者一起去对方喜欢的餐饮店,休息的同时也可调节一下情调,让双方都能够感觉到两个人在一起的幸福与甜蜜。 总结一下,在这场情侣博弈中,要想让自己获得最大收益,必须努力做到认真、善意、宽容、强硬、简单明了各种措施相结合。 2、第二题:(20分) 请举例说明下列说法是否正确,构造博弈模型具体说明,阐述原因。 (1)判断分析“先下手为强” 答:“先下手为强”并不满足所有的情形。 博弈中,在有多个"纳什均衡"的情况下,常常是先动手的一方会占一些优势,这和课例中“囚徒困境”情形类似,有一个最佳策略,古代的很多例子也证明了此点,如:诸葛亮先下手为强,占据荆州要势;日本先下手为强,偷袭美国的珍珠港,不然就不会有第二次世界大战;三国曹操先下手为强,迎接汉献帝,后挟天子以令诸侯等。要指出的是,“动态博弈”中也是有很多后动优势的情形,一般是在方案已经制定,自身实力比较弱,需要选择决策的时候,主动放弃先发权利,变先动劣势为后动优势。如:三人参加选举,支持率分别为15%,35%,50%,这个时候,如果15%者先采取行动,可能会立刻被强敌灭掉,所以他必须保存实力,保持低调,不介入强者的争斗,由另两位先动手,争取灭掉一方后均分失败者的支持率,虽然这样扔处于劣势,但比最初情况要好很多。所以,在面对选择

博弈论基础作业及答案

博弈论基础作业 一、名词解释 纳什均衡占优战略均衡纯战略混合战略子博弈精炼纳什均衡 贝叶斯纳什均衡精炼贝叶斯纳什均衡共同知识 见PPT 二、问答题 1.举出囚徒困境和智猪博弈的现实例子并进行分析。 囚徒困境的例子:军备竞赛;中小学生减负;几个大企业之间的争相杀价等等; 以中小学生减负为例:在当前的高考制度下,给定其他学校对学生进行减负,一个学校最好不减负,因为这样做,可以带来比其他学校更高的升学率。给定其他学校不减负,这个学校的最佳应对也是不减负。否则自己的升学率就比其他学校低。因此,不论其他学校如何选择,这个学校的最佳选择都是不减负。每个学校都这样想,所以每个学校的最佳选择都是不减负,因此学生的负担越来越重。 请用同样的方法分析其他例子。 智猪博弈的例子:大企业开发新产品;小企业模仿;股市中,大户搜集分析信息,散户跟随大户的操作策略 以股市为例:给定散户搜集资料进行分析,大户的最佳选择是跟随。而给定散户跟随,大户的最佳选择是自己搜集资料进行分析。但是不论大户是选择分析还是跟随,散户的最佳选择都是跟随。因此如果大户和散户是聪明的,并且大户知道散户也是聪明的,那么大户就会预见到散户会跟随,而给定散户跟随,大户只有自己分析。 请用同样的方法分析其他例子。 2.请用博弈论来说明“破釜沉舟”和“穷寇勿追”的道理。 破釜沉舟是一个承诺行动。目的是要断绝自己的退路,让自己无路可退,让自己决一死战变得可以置信。也就是说与敌人对决时,只有决一死战,这样才可以取得胜利。否则,如果不破釜沉舟,那么遇到困难时,就很有可能退却,也就无法取得胜利。穷寇勿追就是要给对方一个退路,由于有退路,对方就不会殊死抵抗。否则,对方退无可退,只有坚决抵抗一条路,因而必然决一死战。自己也会付出更大的代价。

博弈论理论经典讲解

博弈论经典案例 冰晶淩(杂物区)2010-04-09 22:31:28 阅读258 评论0 字号:大中小订阅 引用 光光的博弈论经典案例 1994年诺贝尔经济学奖授给了三位博弈论专家:纳什,泽尔腾和海萨尼.而博弈论可以划分为合作博弈和非合作博弈.那三位博弈论专家的贡献主要是在非合作博弈方面,而且现在经济学家谈到博弈论,一般指的是非合作博弈,很少指合作博弈.合作博弈与非合作博弈之间的区别主要在于人们的行为相互作用时,当事人能否达成一个具有约束力的协议,如果有,就是合作博弈;反之,就是非合作博弈.非合作博弈强调的是个人理性,个人最优决策,其结果可能是有效率的,也可能是无效率的.而合作博弈强调的是团体理性.下面是我收集的张维迎教授的几个有关博弈论的经典 案例. <案例一:囚徒困境> 囚徒困境讲的是两个嫌疑犯作案后被警察抓住,分别关在不同的屋子里审讯.警察告诉他们:如果两人都坦白,各判刑8年;如果两个都抵赖,各判1年(或许因证据不足);如果其中一人坦白一人抵赖,坦白的放出去,不坦白的判刑10年(这有点'坦白从宽,抗拒从严'的味道).这里,每个囚徒都有两种战略:坦白或抵赖.表中每一格的两个数字代表对应战略组合下两个囚徒的支付(效用),其中第一个数字是第一个囚徒的支付,第二个数字为第二个囚徒的支付.战略形式又称标准形式,是博弈的两种表述形式之一,它特别方便于静态博弈分析. 在这个例子里,纳什均衡就是(坦白,坦白):给定B坦白的情况下,A的最优战略是坦白;同样,给定A坦白的情况下,B的最优战略也是坦白.事实上,这里,(坦白,坦白)不仅是纳什均衡,而且是一个占优战略均衡.就是说,不论对方如何选择,个人的最优选择是坦白.比如说,如果B不坦白,A坦白的话被放出来,不坦白的话判1年,所以坦白比不坦白好;如果B坦白,A坦白的话判8年,不坦白的话判10年,所以,坦白还是比不坦白好。 这样,坦白就是A占优战略;同样,坦白也是B的占优战略.结果是,每个人都选择坦白,各判刑8年. <案例二:智猪博弈> 这个例子讲的是,猪圈里有两头猪,一大一小.猪圈的一头有一个猪食槽,另一头安装一个按钮,控制着猪食的供应。按一下按钮会有10个单位的猪食进槽,但谁按按钮需要付2个单位的成本.若大猪先到,大猪吃到9个单位,小猪只能吃1个单位;若同时到,大猪吃7个单位,小猪吃3个单位;若小猪先到,大猪吃6个单位,小猪吃4个单位。表中第一格表示两猪同时按按钮,因而同时走到猪食槽,大猪吃7个,小猪吃3个,扣除2个单位的 成本,支付水平分别为5和1.其他情形可以类推. 在这个例子中,什么是纳什均衡?首先我们注意到,无论大猪选择"按"还是"等待",小猪的最优选择均是"等待".比如说给定大猪按,小猪也按时得到1个单位,等待则得到4个单位;给定大猪等待,小猪按得到-1单位,等待则得0单位,所以,"等待"是小猪的占优战略.给定小猪总是选择"等待",大猪的最优选择只能是"按".所以,纳什均衡就是:大猪按,小猪等待,各得4个单位.多劳者不多得! <案例三:性别战>

博弈论基础作业及答案

博弈论基础作业及答案Last revision on 21 December 2020

博弈论基础作业 一、名词解释 纳什均衡占优战略均衡纯战略混合战略子博弈精炼纳什均衡 贝叶斯纳什均衡精炼贝叶斯纳什均衡共同知识 见PPT 二、问答题 1.举出囚徒困境和智猪博弈的现实例子并进行分析。 囚徒困境的例子:军备竞赛;中小学生减负;几个大企业之间的争相杀价等等; 以中小学生减负为例:在当前的高考制度下,给定其他学校对学生进行减负,一个学校最好不减负,因为这样做,可以带来比其他学校更高的升学率。给定其他学校不减负,这个学校的最佳应对也是不减负。否则自己的升学率就比其他学校低。因此,不论其他学校如何选择,这个学校的最佳选择都是不减负。每个学校都这样想,所以每个学校的最佳选择都是不减负,因此学生的负担越来越重。 请用同样的方法分析其他例子。 智猪博弈的例子:大企业开发新产品;小企业模仿;股市中,大户搜集分析信息,散户跟随大户的操作策略 以股市为例:给定散户搜集资料进行分析,大户的最佳选择是跟随。而给定散户跟随,大户的最佳选择是自己搜集资料进行分析。但是不论大户是选择分析还是跟随,散户的最佳选择都是跟随。因此如果大户和散户是聪明的,并且大户知道散户也是聪明的,那么大户就会预见到散户会跟随,而给定散户跟随,大户只有自己分析。 请用同样的方法分析其他例子。 2.请用博弈论来说明“破釜沉舟”和“穷寇勿追”的道理。 破釜沉舟是一个承诺行动。目的是要断绝自己的退路,让自己无路可退,让自己决一死战变得可以置信。也就是说与敌人对决时,只有决一死战,这样才可以取得胜利。否则,如果不破釜沉舟,那么遇到困难时,就很有可能退却,也就无法取得胜利。穷寇勿追就是要给对方一个退路,由于有退路,对方就不会殊死抵抗。否则,对方退无可退,只有坚决抵抗一条路,因而必然决一死战。自己也会付出更大的代价。

博弈论蒋文华浙江大学

第一讲、博弈论概述 献给诸位 知人者智,自知者明; 胜人者力,自胜者强; 小胜者术,大胜者德。 第一章何为“博弈” 博:博览全局弈:对弈棋局→谋定而动 是指在一定的游戏规则约束下,基于直接相互作用的环境条件,各参与人依据所掌握的信息,选择各自的策略(行动),以实现利益最大化的过程。 第一节从一个简单的故事说起 博弈时要搞清楚对手是谁!博弈时要搞清楚和别人比什么! 行为选择既跟对手的情况有关,又跟所遇到的外部环境的变化有关。 特别提示: 博弈既可以是竞争,也可以是合作! 特别提示: 博弈,必须学会换位思考! 特别提示: 博弈,只需领先一步,高人一筹! 博弈就是你中有我,我中有你。由于直接相互作用(互动),每个博弈参与者的得益不仅取决于自己的策略(行动),还取决于其他参与者的策略(行动)。博弈的核心在于整体思维基础上的理性换位思考,用他人的得益去推测他人的

策略(行动),从而选择最有利于自己的策略(行动)。 特别提示: 站在别人的立场上想一想,就是为自己未来的遭遇着想。——米兰·昆德拉 特别提示: 如果因为对方眼中的你的傻,而让对方更愿意和你合作,何乐而不为呢(大智若愚) 特别提示: 请不要在一个充分竞争的市场去追求成功! 特别提示: 选对市场(对手)比选对策略更重要! 特别提示: 在博弈之前,博弈就已经开始了! 第二节博弈的渊源 一、中国的理解 博+弈=下围棋 略观围棋,法于用兵,怯者无功,贪者先亡。 ----汉代刘向,《围棋赋》 二、西方的理解 game(规则) 费厄泼赖(fairplay)

第三节学习博弈论的收益 一、当局者清 更有利的选择 更快速的反应 二、旁观者更清 理解历史与现实 预测未来的发展 三、提出完善游戏规则(制度)的建议 第二章发展简史 第一节最初的探索和应用 一、古诺模型 参加博弈的双方以各自在同一时间内相互独立的产量作为决策的变量,是一个产量竞争模型。 二、伯川德模型 该模型与古诺模型的不同之处在于,企业把其产品的价格而不是产量作为竞争手段和决策变量,通过制定一个最优的销售价格来实现利润最大化。 三、斯塔克尔伯格模型 该模型分析的是这么一种市场竞争:企业A先决定一个产量,然后企业B 可以观察到这个产量,并根据所观察到的产量来决定它自己的产量。 第二节理论的诞生与发展 1、20世纪40年代的社会变化。 2、约翰·冯·诺依曼(JohnVonNeumann,1903-1957)的卓越贡献。1944

第一讲 博弈论战略分析

博弈论战略分析 刘会齐 手机:135******** QQ:470498940 Email:commonuse@https://www.doczj.com/doc/683434947.html, 公共:sbsteacherliu@https://www.doczj.com/doc/683434947.html, PIN:1234567890123

考核方式 期末考试占60%,开卷考试 (范围以课堂讲解内容,在ppt上都有)平时占40%,其中考勤占20% 课堂练习占20%

第一章:冲突、战略与博弈 本章主要概念 ●博弈论( Game theory):博弈论是研究理性的经济 个体在相互交往中战略选择问题的理论。 ●博弈分析的关键步骤是找出在别人选择既定的情况 下自己的最优反应战略。依据新古典经济学,我们把一个参与者的最优反应(best response)定义为,在其他参与者已经选定战略,或者可以预计到他们将选择何种战略时,能够给该参与者带来最大收益的战略。 ●博弈论这种说法是一种科学的比喻,很多不被看做 是博弈的行为,如竞争、战争和竞选等都可以作为博弈来处理和分析。

什么是博弈论?它与战略、冲突又有什么关系呢? 显然,包括博弈在内的许多人类活动,都存在着战略和冲突。冲突的结果是一方获胜,一方落败,博弈通常也总是有输有赢。 本讲将向读者介绍一种分析战略的方法,一种源自数学研究的博弈思维方式。 本章首先要回答两个问题:一是何为博弈论(game theory);二是博弈论与战略之间有什么 关系。 为了阐述这些问题,让我们先看几个例子。第一个例子是最常与战略、冲突联系在一起的人类活动:战争。

1.1西班牙叛乱:击溃赫图勒斯 约公元前75年,西班牙(位于拉丁美洲 的伊斯巴尼亚)发生了一起反对罗马的 叛乱,然而,叛乱的发起人却是罗马士 兵和一些膜拜罗马的西班牙人。后人普 遍认为,西班牙叛乱的领导者昆塔斯·塞 多留(Quintus Sertorius)当时是想利用西 班牙来使自己登上罗马帝国的最高统治 宝座。

博弈论基础复习

《博弈论基础》复习大纲 一、名词解释(5×2=10分) 策略型博弈 它是由三个部分组成,即局中人、策略和各种策略组合中所得到的利益。 纳什均衡 指参与博弈的每一局中人在给定其他局中人策略的条件下选择上策所构成的一种策略组合。 混合策略 局中人的混合策略是其纯策略空间上的一种概率分布,表示局中人实际博弈时根据这种概率分布在纯策略中随机选择加以实施。 扩展型博弈 博弈存在着局中人行动的先后次序,是对具有动态结构的决策形式进行研究的规范分析工具。 博弈树 对于任何一种双人完备博弈,都可以用一个博弈树来描述,并通过博弈树搜索策略寻找最佳解。博弈树类似于状态图和问题求解搜索中使用的搜索树。 完美信息博弈 是指一次只有一个局中人在行动,而且他在行动时知道博弈的所有以往行动历史的一类特殊博弈。 子博弈 指由原扩展型博弈中的一个决策节点与它的所有后续节点组成的博弈。 行为策略 是指每一个参与人在每一个信息集上随机的选择行动。 逆向归纳法 逆向归纳法是求解子博弈精炼纳什均衡的最简便方法。在求解子博弈精炼纳什均衡时,从最后一个子博弈开始逆推上。 冷酷策略 又称触发策略。指参与人在开始时选择合作,在接下来的博弈中,如果对方合作则继续合作,而如果对方一旦背叛,则永远选择背叛,永不合作。 类型 一般地,将一个参与人所拥有的所有私人信息称为他的类型。 静态贝叶斯均衡 是一种与类型有关的策略组合,其中每个局中人在给定自己类型和其它局中人策略的情况下最大化自己的期望效用函数。

信号博弈 是研究具有信息传递作用的信号机制的一般博弈模型,其基本特征是两个博弈方,分别称为信号发出方和信号接收方。 分离均衡 信号博弈中的完美贝叶斯均衡之一,这种均衡中不同类型的发送者以概率1选择不同的信号,接收者完全可以通过信号来准确判断出发送者的类型。 混同均衡 信号博弈中的完美贝叶斯均衡之一,这种均衡中不同类型的发送者选择了相同的信号,接收者无法从信号中得到新的信息,无法对先验信念进行修正。 联盟 设},,2,1{I =ζ为局中人集合,则其中任意一非空子集ζ?S 为一个联盟。 特征函数 特征函数型博弈对每一种可能联盟给出相应的联盟总和收益,也就是给出了一种集合函数,称为特征函数。 核 多人合作博弈中所有不被超优的分配的集合。 核仁 合作博弈核仁解所依据的基本思想是:在分配属于核仁的条件下,最不理想的联盟也要优于任何其它分配向量的最不理想的联盟。 二、 判断题(5×1=5分) 三、 简答题(4×7=28分) 策略型博弈的基本要素。 策略型博弈的基本要素有: 局中人:即博弈的参与者,可以是自然人﹑企业﹑政府﹑社团等。 策略:指每个局中人在博弈中可选择采用的行动方案。 支付:指每个局中人从各种策略组合中获得的收益。 什么是纳什均衡?你是如何理解的? 纳什均衡及其理解: 在一个博弈过程中,无论其它局中人的策略选择如何,局中人都会选择某个确定的策略,则该策略被称作支配性策略。如果两个博弈的当事人的策略组合分别构成各自的支配性策略,局中人谁都没有动机单方面偏离该状态,那么这个组合就被定义为纳什均衡。 1.是完全信息静态博弈的解的一般概念。 2.每一个严格占优战略均衡一定是纳什均衡,反之不然。

博弈论部分内容

博弈论基础 本讲要点:博弈论的基本思想,博弈的构成要素,简单博弈的求解方法,纳什均衡的概念,博弈的分类,动态博弈与重复博弈,信息不对称,道德风险,逆向选择,信号传递。 重点:博弈论的基本思想,纳什均衡的概念,信息不对称。 难点:博弈的构成要素,纳什均衡的概念。 一、博弈的基本要素 1、博弈论与古典经济学的区别 古典经济学的基本思路:给定约束条件,考虑行为主体的最优结果。 博弈论的基本思路:以行为主体之间的相互影响为前提,考虑行为主体的最优结果。 两者的根本区别:是否考虑对方的行为。 古典经济学中消费者行为理论:假定收入、商品价格以及效用函数给定,求最优消费组合。消费者A不会考虑消费者B的影响。 古典经济学中的厂商理论:假定生产函数、成本函数、商品价格给定,求厂商的最优生产决策。厂商A不会考虑厂商B的影响。 古典经济学中的宏观经济理论:假定一国的资源禀赋给定,考虑价格指数、利率等因素的变化对国民收入、就业等的影响。国家A不会考虑国家B的影响。 博弈论:每个人要考虑别人的行为怎样影响自己的选择。 扑克牌游戏:一个人不可能只顾自己出牌,而不考虑别人怎么出牌。 下棋:无论中国象棋、国际象棋、围棋,一个人在走某一步之前,都要考虑对手是怎么走的,以及对手在我走了一步之后会怎么走,以及我又会在对手走了一步之后怎么走,以至无穷。 高手与俗手的区别也就在此。高手往往能够考虑10步甚至20步以后的变化。 总之:你的输赢不仅取决于你的决策,而且取决于你对手的决策。 2、博弈论简史 博弈论的思路在古诺(Cournot,Antoine Augustin,1801-1977)的双头垄断模型中最早提出,冯?诺伊曼(John von Neumann,1903-1957)和摩根斯坦恩(Oskar Margenstern, 1902-1977)在1944年出版了《博弈论与经济行为》(Theory of Games and Economic Behavior)一书,最早提出了博弈论的概念。

博弈论基础

ECON 40050 Game Theory Exam 1- Answer Key Instructions: 1) You may use a pen or pencil, a hand-held nonprogrammable calculator, and a ruler. No other materials may be at or near your desk. Books, coats, backpacks, etc... must be placed against the wall. No electronic communication devices may be used. 2) As soon as the instruction to begin the test is given, please check that you have 10 numbered pages. 3) Be sure to show all of your work. Answers without supporting calculations will receive zero credit. You will receive credit only for the answers and supporting calculations that appear in this test packet. 4) All exams must be turned in by 1:45 pm. No extensions will be granted. 5) Be sure to read each question in its entirety before beginning your analysis. 6) The time estimates at the beginning of each question are only suggestions to help you manage your time. NAME ____________________________________________ Question 1 (10 minutes)_______ (15 points) Question 2 (10 minutes)_______ (15 points) Question 3 (10 minutes)_______ (15 points) Question 4 (15 minutes)_______ (15 points) Question 5 (20 minutes)_______ (20 points) Total: (65 minutes)_______ (80 points)

博弈论试题

杭州师范大学2010-2011学年第二学期通识 课程期末考试 《博弈论与企业管理》试卷 一、单项选择题(本大题共12题,每题3分,共36分) 1. 下列关于优势策略均衡和纳什均衡的描述正确的是( ) A 优势策略均衡肯定是纳什均衡; B 纳什均衡都是优势策略均衡; C 纳什均衡是特殊的优势策略均衡; D 以上三种情况都有可能 2. 以下关于承诺的描述不准确的是( ) A 承诺使威胁可置信; B 承诺往往对自己构成约束; C 承诺往往不需要成本; D 承诺往往会给自己带来成本,但最终结果使自己有利 3. 对于以下报酬矩阵,哪个命题是正确的( ) A 甲和乙都有占优策略; B 只有甲有占优策略; C 只有乙有占优策略; D 两人都没有占优策略 4. 对于如下报酬矩阵,乙的占优策略是( ) A 上; B 中; C 左; D 右

5. 对于题4的报酬矩阵,以下哪个是纳什均衡( ) A (上,左);B (上,右);C (下,右);D (上,中) 6. 对于题4的报酬矩阵,如果乙先走一步,并且知道甲再作决策时已经知道乙的决策,那么,乙将采取( ) A 左;B 中; C 右;D 上 7. 交易双方信息不对称,比如买房不知道卖方的一些情况,是由于( ) A 卖方故意隐瞒自己的一些情况; B 买方自身的认识能力有限; C 买方掌握完全信息的成本太高; D 以上三种情况都有可能 8. 面对不对称信息,下列哪一项不能为消费者减少信息不对称( ) A 品牌;B 低价格 C 产品保证 D 长期质量保证书 9. 下列哪一项不是高质量的信号( ) A 产品保证; B 延长的质量保单; C 暂时的经营场所; D 被认可的品牌 10.在二手市场上,( ) A 买主知道商品的质量,而卖主不知道; B 买主不知道商品的质量,而卖主知道; C 卖主和买主都知道商品的质量是低的; D 卖主和买主都不知道商品的质量是低的 11.一个有效的激励机制必须能够( ) A 使代理人参与工作的净收益不低于不工作也能得到的收益; B 使代理人让委托人满意的努力水平也是给代理人带来最大净收益的努力水平; C 尽可能地减少或消除代理人的目标函数与委托人的目标函数之间的冲突; D 以上都是 12.在信息不对称的劳动力市场,效率最低的激励机制是( ) A 固定工资;B 效率工资;C 利润分享; D 提成 二、简答题(本大题共6题,第1、2、3题每题4分,第4、5、6题每题6分,共30分) 1.一个博弈如果出现两败俱伤的结果,这样的博弈一定是非合作的零和博弈吗 2.两个罪犯只打算合伙犯罪一次,所以被捕后出现了囚徒困境的情况。如果这两个罪犯准备合伙犯罪30次,那么在开始的犯罪活动中如果被捕,还会出现囚徒困境吗 3.请举例分析说明在什么条件下博弈者采取威胁对方的策略可以奏效。 4.某博弈的报酬矩阵如下: (1)如果(上,左)是优势策略均衡,那么a ,b ,c ,d 应满足什么条件 (2)如果(上,左)是纳什均衡,那么,又应该满足什么条件 (3)如果(上,左)是优势策略均衡,那么,它是否必定是纳什均衡为什么

博弈论基础

博弈论 博弈论(Game Theory),亦名“对策论”、“赛局理论”,属应用数学的一个分支,博弈论已经成为经济学的标准分析工具之一。目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。博弈论主要研究公式化了的激励结构间的相互作用。是研究具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。生物学家使用博弈理论来理解和预测进化论的某些结果。参见:行为生态学(behavioral ecology)。 约翰·冯·诺依曼 博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的目的。博弈论思想古已有之,中国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论著作。博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展。 博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。 近代对于博弈论的研究,开始于策墨洛(Zermelo),波雷尔(Borel)及冯·诺伊曼(von Neumann)。 1928年,冯·诺依曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。1944年,冯·诺依曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。 1950~1951年,约翰·福布斯·纳什(John Forbes Nash Jr)利用不动点定理证明了均衡点的存在,为博弈论的一般化奠定了坚实的 策墨洛(Zermelo) 基础。纳什的开创性论文《n人博弈的均衡点》(1950),《非合作博弈》(1951)等等,给出

高校博弈论期末试卷

高校博弈论期末试卷(每题10分)1、在下面的战略式表述博弈中,说明两个参与人是否有占优战略及其理由,是否有占优战略均衡,若有,说明均衡结果。DURowColumnRL3,07,-12,55,12、在下面的战略式表述博弈中,说明战略组合(U,L)不是纳什均衡和(D,R)是纳什均衡的理由。DURowColumnRL9,55,36,79,53、求下面扩展式表述博弈的纳什均衡及结果。进入者不进入进入在位者默许斗争默许斗争(0,400)(0,400)(10,30)(40,50)4、求下面战略式表述博弈的混合战略纳什均衡,画出反应对应图。DURowColumnRL2,24,33,42,25、在下面的扩展式表述博弈中,写出两个参与人的战略空间,求其子博弈精炼纳什均衡及结果。在位者默许斗争进入者进入者不进入不进入进入进入(100,90)(0,-10)(300,0)(300,0)6、求下面扩展式表述博弈的子博弈精炼纳什均衡及结果。 3RLDU21(40,50,10)(0,30,20)INOUT(0,50,20)(10,60,0)7、图示以下列战略式表述博弈为阶段博弈的无限重复博弈的纳什威胁点、可行支付集合、个人理性支付集合、个人理性可行支付集合和子博弈精炼可达到的支付集合。DURowColumnRL8,80,66,02,28、写出下列扩展式表述博弈的战略式表述,求出这个博弈的纳什均衡及结果,如何使两个企业既守法又不减少所获收益?企业1违法守法企业2守法违法守法违法(1,1)(2,-1)(-1,2)(1,1)9、在以下静态贝叶斯博弈中,在位者知道自己是低成本的,进入者不知道在位者是高成本还是低成本,但知道在位者是高成本的概率是60%,两个参与人同时行动,画出这个博弈的扩展式表述,说明在进入者选择进入的情况下在位者在两种成本情况下的战略选择,计算进入者两种战略选择的期望支付,写出这个博弈的贝叶斯纳什均衡及结果。在位者低成本[0.4]高成本[0.6]斗争默许斗争默许进入0,4000,4000,3000,300-10,10030,80-10,040,50进入进入者不进入10、在下列不完全信息动态博弈中,自然首先选择参与人1的类型,参与人1知道自己的类型,参与人2不知道参与人1的类型,但知道参与人1属于t1和t2类型的先验概率,(1)写出两个参与人的战略空间;(2)判断在给定的先验概率条件下,若参与人1选择L,参与人2会选择U还是D,若参与人1选择R,参与人2会选择U还是D;(3)给定参与人2的这种选择,若参与人1是t1类型的,将选择L还是R,若参与人1是t2类型的,将选择L还是R;(4)若参与人2观察到参与人1选择R,计算他认为参与人1是t1类型的后验概率,若参与人2观察到参与人1选择L,计算他认为参与人1是t1类型的后验概率;(5)写出这个博弈的精炼贝叶斯均衡,说明参与人1采用的是何种战略。

武汉大学2015-2016学年第二学期博弈论期末考试

武汉大学2015-2016学年第二学期博弈论期末考试 (2016.05.28) 一、判断题(每小题3.5分,共35分) 1、纳什均衡一定是占优均衡。(×) 2、占优均衡一定是纳什均衡。(√) 3、占优均衡是帕累托最优的均衡。(×) 4、囚徒困境说明个人的理性选择不一定是集体的理性选择。(√) 5、子博弈精炼纳什均衡不是一个纳什均衡。(×) 6、在一个博弈中只可能存在一个纳什均衡。(×) 7、在一个博弈中如果存在多个纳什均衡则不存在占优均衡。(√) 8、根据参与人行动的先后顺序,博弈可以划分为静态博弈(static game)和动态博弈(dynamic game)。 9、在博弈中纳什均衡是博弈双方能获得的最好结果。(×) 10、在动态博弈中,因为后行动的博弈方可以先观察对方行为后再选择行为,因此总是有利的。(×) 二、名词解释(每小题2分,共20分) 1、博弈:一些个人、团体或其他组织,在一定的规则约束下,依据所掌握的信息,同时或者先后,一次或者多次从允许选择的行为或战略进行选择并加以实施,并从中各自取得相应结果或收益的过程。 2、静态博弈:指博弈中的参与人同时选择行为,或者虽非同时但后行动者并不知道前行动者采取了什么具体行动; 动态博弈:指参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。 3、囚徒困境:从博弈中的两个利益主体出发选择行为,结果是既没有实现两人总体的最大利益,也没有真正实现自身的个体最大利益,比如经济领域的寡头竞争、公共产品的供给。 4、参与人(player):指的是博弈中选择行动以最大化自己效用(收益)的决策主体,参与人有时也称局中人,可以是个人,也可以是企业、国家等团体; 5、非合作博弈与合作博弈:人们行为相互作用时,当事人能达成一个具有约束力的协议,也就是合作博弈,反之,就是非合作博弈。 6、占优均衡:无论其他参与人选择什么战略,参与人的某一种战略均是最优的。 7、纳什均衡:给定你的策略,我的策略是最好的策略;给定我的策略,你的策略也是最好的策略,即双方在给定的战略上不愿意改变自己的策略。 8、完全信息博弈:每一个参与人对所有其他参与人的特征,战略空间以及支付函数有准确知识的博弈。 9、重复剔除劣战略的占优均衡:首先找到某个参与人的劣战略(假定存在),把这个劣战略删除掉,重新构造一个不包含已删除的劣战略的新的博弈,然后再删除这个新的博弈中的某个参与人的劣战略,一直重复这个过程,直到只剩下唯一的战略组合为止。 10、不可置信的威胁:在纳什均衡中,不可置信的均衡战略,在博弈的规则下,使自己的支付变小的不理性的选择。

相关主题
文本预览
相关文档 最新文档