当前位置：文档之家› 2 同时决策博弈(2)

2 同时决策博弈(2)

新《博弈与决策》期末复习指导

第一章博弈论的基本理论（一）博弈论的基本概念博弈：现实生活中，不同的决策人为了争夺资源、争夺机会使得决策人处于相互依存的复杂关系中，这就不得不思考他人有针对性行为对自身所产生的影响。博弈就是一种游戏，在这种状态下，参与者必须作出选择，并对对方的选择作出判断，这种判断和选择决定了博弈的结果。每个对弈者在决定采取何种行动时不但要根据自身的利益和目的行事，也要考虑自身的决策行为对其他人的可能影响，以及其他人的行为对自身的可能影响，通过选择最佳行动计划，来寻求收益或效用的最大化。博弈论：就是以参与人之间有针对性的行为产生的互动过程为研究对象的理论，探讨在互动过程中参与人的一般行为规律。博弈论的核心问题在于如何在“策略互动”的局势中找到局中人的最佳行为方式，使得采用最佳行为方式的局中人能获得最大的收益。所以博弈论可以简单理解尾研究策略互动局势中的局中人的理性行为的理论。（二）博弈论的构成要素 1、博弈一般由以下几个要素组成，包括：参与人、行动、信息、策略、得益、结果、均衡等。 2、参与人指的是博弈中选择行动以最大化自己效用的决策主体(可以是个人，也可以是团体)； 3、行动是指参与人在博弈进程中轮到自己选择时所作的某个具体决策； 4、策略是指参与人选择行动的规则，即在博弈进程中，什么情况下选择什么行动的预先安排； 5、得益是参与人在博弈结束后从博弈中获得的效用，一般是所有参与人的策略或行动的函数，这是每个参与人最关心的东西； 6、均衡是所有参与人的最优策略或行动的组合；均衡结果是指博弈结束后博弈分析者感兴趣的一些要素的集合，如在各参与人的均衡策略作用下，各参与人最终的行动或效用集合。上述要素中，参与人、行动、结果统称为博弈规则，博弈分析的目的就是使用博弈规则来决定均衡。二、博弈论的发展简史 1、萌芽阶段：博弈论思想古已有之，我国古代的《孙子兵法》就不仅是一部军事著作，而且算是最早的一部博弈论专著。博弈论最初主要研究象棋、桥牌、赌博中的胜负问题，人们对博弈局势的把握只停留在经验上,没有向理论化发展。 2、产生阶段：1944年科学家冯·诺伊曼和经济学家奥斯卡·摩根斯坦合著《博弈论与经济行为》将二人博弈推广到n 人博弈结构并将博弈论系统的应用于经济领域，标志着博弈论作为一门独立的的学科诞生。 3、发展阶段：1950年，约翰·纳什(John Nash)引入均衡(解)的概念，即纳什均衡，将博弈论从零和博弈推进到非零和博

博弈与决策作业1(答案)

博弈与决策平时作业参考答案（1）一、名词解释 1．博弈论：是指研究多个个体或团队之间在特定条件制约下的对局中，利用相关方的策略而实施对应策略的学科。 2．完全信息：是指所有参与者各自选择的行动的不同组合所决定的收益对所有参与者来说是共同知识。 3．静态博弈：是指博弈中参与者同时采取行动，或者尽管参与者行动的采取有先后顺序，但后行动的人并不知道先采取行动的人采取的是什么行动。 4．动态博弈：指的是参与人的行动有先有后，而且后选择行动的一方可以看到先采取行动的人所选择的行动。 5．非合作博弈：如果参与者之间不可能或者根本没办法达成具有约束力的协议，不能在一个统一的框架下采取行动的话，这种博弈类型就是非合作博弈。 6．纳什均衡：是对于每一个博弈参与者来说是这样的一个战略组合，即给定其他参与者的战略，每一个参与者的这个战略能使其期望效用最大化。 7．纯策略：如果在每个给定信息下，只能选择一种特定策略，而且参与者选择了这个策略之后就不会单方面改变自己的策略，这个策略就是纯策略。 8．纯策略纳什均衡：是指在一个纯策略组合中，如果给定其他的策略不变，在该策略组合下参与者不会单方面改变自己的策略，否则会使策略组合令人后悔或者不满意。二、请用剔除劣势策略的方法寻找以下博弈的最优策略。要求: （1）写出剔除的步骤或顺序；（2）画出相应的剔除线；（3）给出最优的博弈结果。乙甲答：（1）对甲而言，抵赖是劣势策略，用横线划去“抵赖”所对应的行；（2）对乙而言，抵赖是劣势策略，用竖线划去“抵赖”所对应的列；（3）余下的策略组合是（坦白，坦白），这就是该博弈的最优结果。 [注：步骤（1）（2）颠倒亦可]

博弈与决策题库

题库一、名词解释 1.动态博弈动态博弈是指在博弈中，参与人的行动有先后顺序且后行动者能够观察到先行动者所选择的行动。 2.逆向归纳法对于动态博弈，特别是在完全信息条件下，最简单的方法就是逆向归纳法。就是从最后一个阶段或者最后一个子博弈开始逆推向上，逐步向前倒推以求解动态博弈均衡。 3.重复博弈重复博弈是指同一个博弈在相同的环境、规则下反复多次执行的博弈问题。 4. 第二价格密封拍卖是由1996年诺贝尔经济学奖获得者威廉?维克瑞设计的，因而又被称为是“维克瑞拍卖”，具体规则如下：每个竞标者分别向拍卖方提交自己的报价，而且他们不知道别人的出价，出价最高的竞标者获得该物品，并按所有的出价中仅次于最高出价的第二高价格支付给卖家。 5.完全信息是指所有参与者各自选择行动的不同组合所决定的收益对所有参与者来说是共同知识。共同知识就是你知道，我知道，你知道我知道的信息。 6.子博弈直观的含义是原博弈的一个部分，它本身也可以作为一个博弈进行分析，博弈树的一个子树所代表的博弈就是子博弈，子博弈的起始点是某个选择的终点，包括这个终点及所有后续结及枝及终点结之后的收益，构成了一个子博弈树，这个博弈树所代表的博弈称为子博弈。 7.公共信息如果有些信息是博弈参与者都知道的，或者是所有有关的参与者都知道的，这些信息就叫“公共信息”或者“共同知识”。 8.贝叶斯纳什均衡不完全信息静态博弈的均衡称为贝叶斯纳什均衡。是指在不完全信息静态博弈中在给定自己类型以及其他参与者的类型与策略选择之间关系的条件下，使得自己的期望效用最大。 9.博弈论博弈论是指研究多个个体或团队在特定条件制约下的对局中，利用相关方的策略而实施对应策略的科学。 10.纳什均衡对于每一个参与者来说是这样一种组合，即给定其他参与者的策略，每一个参与者的这个策略能使其效用最大化。其含义为：当博弈的所有参与者在某一选定的策略组合下都没有动机（单方面）偏离自己选定的策略时，该组合策略就是纳什均衡。 11.混合策略如果在每个给定信息下，参与者只能以某种概率选择不同的策略，就称为混合策略。换句话说，所谓混合策略，不是参与者纯粹地选择什么策略，而是随机地，或者说是以百分之多少的概率选择某一个策略。 12.信息甄别是指在博弈中没有私人信息的一方为了减弱非对称信息对自己的不利影响，以便能够区分不同交易对象而提出的一种交易方式，比如契约、条件等。通俗地讲，信息甄别就是“如何让别人讲真话”的方法。 13.参与人

国家开放大学2020年春季学期电大考试《博弈与决策》形成性考核

博弈与决策平时作业学生姓名：学生学号：分校、工作站：教学班：

博弈与决策第1次平时作业一、名词解释 1．博弈论：是指研究多个个体或团队之间在特定条件制约下的对局中，利用相关方的策略而实施对应策略的学科。 2．完全信息：是指所有参与者各自选择的行动的不同组合所决定的收益对所有参与者来说是共同知识。 3．静态博弈：是指博弈中参与者同时采取行动，或者尽管参与者行动的采取有先后顺序，但后行动的人并不知道先采取行动的人采取的是什么行动。 4．动态博弈：指的是参与人的行动有先有后，而且后选择行动的一方可以看到先采取行动的人所选择的行动。 5．非合作博弈：如果参与者之间不可能或者根本没办法达成具有约束力的协议，不能在一个统一的框架下采取行动的话，这种博弈类型就是非合作博弈。 6．纳什均衡：是对于每一个博弈参与者来说是这样的一个战略组合，即给定其他参与者的战略，每一个参与者的这个战略能使其期望效用最大化。 7．纯策略：如果在每个给定信息下，只能选择一种特定策略，而且参与者选择了这个策略之后就不会单方面改变自己的策略，这个策略就是纯策略。 8．纯策略纳什均衡：是指在一个纯策略组合中，如果给定其他的策略不变，在该策略组合下参与者不会单方面改变自己的策略，否则会使策略组合令人后悔或者不满意。二、请用剔除劣势策略的方法寻找以下博弈的最优策略。要求: （1）写出剔除的步骤或顺序；（2）画出相应的剔除线；（3）给出最优的博弈结果。乙

甲答：（1）对甲而言，抵赖是劣势策略，用横线划去“抵赖”所对应的行；（2）对乙而言，抵赖是劣势策略，用竖线划去“抵赖”所对应的列；（3）余下的策略组合是（坦白，坦白），这就是该博弈的最优结果。百事可乐答：（1）对可口可乐而言，高价是劣势策略，用横线划去“高价”所对应的行；（2）对百事可乐而言，高价是劣势策略，用竖线划去“高价”所对应的列；（3）余下的策略组合是（低价，低价），这就是该博弈的最优结果。员工乙员工甲答：（1）对员工乙而言，策略R 是明显劣势策略，用竖线划去“R ”所对应的列；（2）对员工甲而言，在员工乙剔除R 策略之后，C 策略是劣势策略，用横线划去“C ”所对应的行；（3）对员工乙而言，此时劣势的策略是L ，用竖线划去“L ”所对应的列；（4）对员工甲而言，此时劣势的策略是D ，用竖线划去“D ”所对应的行；（5）余下的策略组合是（U ，M ），这就是该博弈的最优结果

第17章决策与博弈论

第17章决策与博弈论 17.1 复习笔记 1．博弈论的基本概念（1）博弈及其三个要素博弈论是在一个简化的体系里描述复杂的决策问题，这些决策问题往往涉及多个行为者，他们之间的决策相互依存，相互作用。博弈包含三个要素：①参与者；②决策；③报酬。（2）合作与非合作博弈如果在博弈参与者之间可形成共同计划的决策这类具有约束性的合同，那么这类博弈被称为合作性的博弈。如果在参与者之间不能达成或实施有约束性的合同，这类博弈则被称作非合作性的博弈。（3）主导策略（占优策略均衡）主导策略是指对某参与者而言，不管其竞争对手的反应如何，这一决策总是最优的策略。 2. 纳什均衡（1）纳什均衡纳什均衡是指在给定对方行动的前提下可以给每个参与者都带来最佳结果的某种决策（或行动）。达到纳什均衡时，每一个博弈者都确信，在给定竞争对手策略决定的情况下，他选择了最好的策略。也就是说，给定其他人的战略，任何个人都没有积极性去选择其他战略，从而这个均衡没有人有积极性去打破。占优策略均衡即是一种纳什均衡。占优策略均衡若存在，只存在惟一均衡，而纳什均衡可能存在多重解。（2）最大极小决策（囚徒困境）最大极小决策反映的是，从个人角度出发所选择的占优策略，从整体来看，却是最差的结局，即个人理性与团体理性的冲突。这一决策可以发生在不少的博弈场合，也可以解释卡特尔联盟的不稳定性。（3）混合策略在有些博弈中，仅采取一种决策或一种行动的“纯决策”不是最好的决策，即可能不存在纳什均衡。而以某特定的概率P选择一种行为，以1－P的概率选择另一种行为，则有可能是纳什均衡的解。这时的选择被称为混合策略。但反过来需要注意，存在混合策略均衡的博弈也有可能存在非混合策略的均衡。 3. 重复博弈重复博弈即同一个博弈被重复多次的动态博弈，它是反复不断进行的。在无限期重复博弈中，对于任何一个参与者的欺骗和违约行为，其他参与者总会有机会给予报复。所以，每一个参与者都不会采取违约或欺骗的行为，囚犯困境合作的均衡解是存在的。但在有限期重复博弈中，在博弈一开始的第1期，每个参与者就会采取欺骗或违约的不合作策略。所以，在有限期重复博弈中，囚犯困境博弈的纳什均衡是参与者的不合作。 4. 顺序博弈顺序博弈是参与者轮换行动的博弈。分析顺序博弈要比参与者同时决策的博弈简单得多，其关键在于考虑每个参与者可能的行动及其理性的对策。 5. 威胁与承诺行业的主导企业或者在位企业为了维护自己的地位或阻止新企业进入，往往会采用威胁或承诺的手段。威胁通常是不付诸实际行动的，即不会改变报酬矩阵，最终往往使得发出威胁一方无法

《博弈与决策》期末复习资料.doc

《博弈与决策》期末复习资料一、期末考试形式和时间半开卷时间：90分钟二、考试题型 1、名词解释（每小题5分，共20分）； 2、简答题（每小题10分，共30分）； 3、论述题（每小题15分，共30分）； 4、案例分析题（共20分）参考复习资料如下：三、名词解释 1.信号传递：在信息经济学里，具有优势的一方（拥有私人信息的一方）采取某种行动向信息劣势一方（不了解对方私人信息的一方）发送相关信号，来告诉对方自己的真实类型。 2.非合作博弈：是指参与人之间没有一个对各方具有约束力的协议，参与人不在协议范围内进行的博弈。 3.重复博弈：是指同一个博弈在相同的环境、规则下反复多次执行的博弈问题。 4.第一价格密封拍卖：在这种拍卖模式下，投标者利用秘密方式（比如将报价写好装入一个信封）同时投标，所有的投标人都不知道其他投标人的出价，且一旦呈交了投标就没有机会更新。拍卖人当众打开这些信封，出价最高者就是赢者，可以以其所报出的最高价格购买被拍卖物品。 5.静态博弈：是指在博弈中，参与人同时选择或虽非同时选择单后行动者并不知道先行动者采取了什么具体行动。 6.逆向归纳法：就是从最后一个阶段或最后一个子博弈开始逆推上去，逐步向前倒推以求解动态博弈均衡。 7.精炼叶贝斯纳什均衡：在不完全信息动态博弈下，如果给定参与者自己的特征和其他参与者特征概率分布的情况下，每个参与者选择的策略能使自己的期望支付达到最大化, 也就是没有人积极选择其他策略，这就形成了“精炼贝叶斯纳什均衡”。 8.第二价格密封拍卖：每个竞标者分别向拍卖方提交自己的报价，而且他们不知道别人的出价，出价最高的竟标者将获得物品，并按所有的出价中仅次于最高出价的第二高价格支付给卖家。 9.不完全信息：是指在博弈过程中，每一位参与人对其他参与人的特征、策略空间及收益函数信息了解的不够或者不是对所有参与人的特征策略空间及收益函数都有准确的信息。 10.子博弈：是指它本身可以作为一个独立的博弈进行分析，它是原博弈的一部分。任何博弈本身可被称为自身的一个子博弈。 11.完美信息：某个参与人行动前，有足够的信息来确定已经行动的参与人选择了什么行动，这种信息结构称为完美信息。 12.贝叶斯纳什均衡：在给定自己类型以及给定其他参与者的类型与策略选择之间关系的条件下，使自己的棋王小勇最大化，这时形成的一个纳什均衡，就称为“贝叶斯纳什均衡”。 13.参与人：指的是博弈中选择行动以最大化自己效用的决策主体（可以是个人，也可以是团体）； 14.占优战略均衡：占优战略均衡是指在博弈中，如果所有参与人都有占优战略存在，博弈将在所有参与人占优战略的基础上达到均衡。 15.行动：行动是指参与人在博弈进程中轮到自己选择时所作的某个具体决策。 16.动态博弈：动态博弈是指在博弈屮，参与人的行动有先后顺序II后行动者能够观察到先行动者所选择的行动。 17.劣策略：在博弈中，不论其他参与人采収什么策略，某一参与人可能采取的策略中对自己严格不利的策略。 18.信息集：是指某一参与人在某一阶段的行动时由博弈历史信息反映的那一组都有可能是真

博弈论第二章习题

问题1：博弈方2就如何分10000元钱进行讨价还价。假设确定了以下原则：双方提出自己要求的数额1s 和 2s ，10000021≤≤s s ，。如果设博弈方1和，1000021≤+s s ，则两博弈方的要求都得到满足，即分得1s 和2s ；但如果1000021>+s s ，则该笔钱就被没收。问该博弈的纯策略纳什均衡是什么？如果你是其中一个博弈方，你会选择什么数额，为什么？解：112111210000() 010000s s s u s s s ≤-?=?>-?，那么，1210000s s =- 22 1222 1 10000()010000s s s u s s s ≤-?=?>-?那么，2110000s s =- 它们是同一条直线，12 10000s s +=上的任意点12(,)s s ，都是本博弈的纯策略的Nash 均衡。假如我是其中一个博弈方，我将选择15000s =元，因为(5000,5000)是比较公平和容易接受的。它又是一个聚点均衡。问题2：设古诺模型中有n 家厂商。i q 为厂商i 的产量，n q q q Q +++= 21为市场总产量。P 为市场出清价格，且已知Q a Q P P -==)(（当a Q <时，否则0=P ）。假设厂商i 生产产量i q 的总成本为i i i i cq q C C ==)(，也就是说没有固定成本且各厂的边际成本都相同，为常数 )(a c c <。假设各厂同时选择产量，该模型的纳什均衡是什么？当趋向于无穷大时博弈分析是否仍然有效？解：1 ()n i i i j i j pq cq a c q q π==-=--∑，1,2, ,i n = 令 20i i j j i i a c q q q π≠?=---=?∑，1,2,,i n = 解得：* **1 2 1 n a c q q q n -== ==+，2 ** *121n a c n πππ-??== == ? +?? 当n 趋向于无穷大时，这是一个完全竞争市场，上述博弈分析方法其实已经失效。问题3：两寡头古诺模型，Q a Q P P -==)(，但两个厂商的边际成本不同，分别为1 c 和2c 。如果2/0a c i <<，问纳什均衡产量各为多少？如果a c c <<21，但122c a c +>，则纳什均衡产量又为多少？解：双方的反应函数联立求解 12112222q q a c q q a c +=-?? +=-?，解得：*112*2121 (2)3 1(2) 3q a c c q a c c ?=-+????=+-?? 当0/2i c a <<，就是这个博弈的Nash 均衡。如果1 2c c a <<，但212c a c >+，当然可以推得* 20q =。那么厂商1就变成垄断商它的最佳产量当然是*12a c q -=，它的利润是：()2 * 14 a c π-= 。问题4：如果双寡头垄断的市场需求函数是Q a Q P P -==)(，两个厂商都无固定成本边际成本为相同的常数 c 。如果两个厂商都只能要么生产垄断产量的一半，要么生产古诺产量。证明：这

博弈与决策网上作业答案

博弈与决策网上作业答案第一次作业答案 1.博弈当中通常包括下面的内容，除了（支付）。 2.博弈论中，局中人从一个博弈中得到的结果常被称为（损益） 3.一个博弈中，直接决定局中人损益的因素是（策略组合） 4.下列关于策略的叙述哪个是错误的（一个局中人在原博弈中的策略和在子博弈中的策略是相同的） 5.囚徒困境说明（双方都独立依照自己的利益行事，则双方不能得到最好的结果） 6.在具有占优策略均衡的囚徒困境博弈中（两个囚徒都会坦白） 7.策略式博弈，正确的说法是（策略式博弈无法表明行动顺序） 8.市场交易中普遍存在的讨价还价属于哪种博弈。（完全信息动态博弈） 9.公共物品的特征是（不用购买就可消费） 10.下面哪一项物品具有非排他性（国防） 11.在一个博弈中博弈方可以有很多个V 12.在一个博弈中只可能存在一个纳什均衡。X 13.在博弈中知道越多的一方越有利。X 14.在博弈中纳什均衡是博弈双方能获得的最好结果。X 15.在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。X

16.纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。V 17.囚徒困境说明个人的理想选择不一定是集体的理想选择。V 18囚徒的困境博弈中两个囚徒之所以会处于困境，无法得到较理想的结果，因为两囚徒都不在乎坐牢时间长短本身，只在乎不能比对方坐牢的时间更长。X 19.纳什定理说明在任何一个有n个博弈方存在的有限博弈中，都至少存在一个纳什均衡。V 20.根据参与人行动的是否同步来区分，博弈可以划分为静态博弈(static game)和动态博弈（dynamic game）。V 21.在动态博弈中，因为后行动的博弈方可以先观察对方行为后再选择行为，因此总是有利的。X 22.子博弈可以从一个多节点信息集开始。X 23.公共物品实际上就是公用的物品。X 24.公共物品的存在说明了依靠市场机制可以实现资源的有效配置。X 25.混合策略纳什均衡是普遍存在的，纯策略纳什均衡只是混合纳什均衡的一种特例。V 第二次作业答案 1.在一个博弈中博弈方可以有很多个。V 2.市场交易中普遍存在的讨价还价属于哪种博弈。（完全信息动态博弈） 3.一个博弈中，直接决定局中人损益的因素是（策略组合） 4.囚徒的困境博弈中两个囚徒之所以会处于困境，无法得到较理想的结果，因为两囚徒都不在乎坐牢时间长短本身，只在乎不能比对方坐牢的时间更长。X

博弈与决策作业2(答案)

博弈与决策平时作业参考答案（2）一、名词解释 1．不确定性：就是指经济行为者在事先不能准确地知道自己的某种决策的结果，或者说，只要经济行为主体的一种决策的可能结果不止一种，就会产生不确定性。 2．最大期望收益法：就是在事件结果不确定的情况下，应该选择给他带来“期望收益”最大的策略。 3．混合策略：如果在每个给定信息下，参与者只能以某种概率选择不同地策略，就称为混合策略。 4．支付均等法：当一个参与者在均衡中应用一个混合策略时，他所得到的支付必须与他在混合策略中所应用的每一个纯策略的支付相同。 5．子博弈：如果从第一阶段以外的某个阶段开始的后续博弈阶段，也有初始信息集，具备进行博弈所需要的各种信息，能够自成一个博弈，我们就将这个博弈阶段称为原动态博弈的一个“子博弈”。 6．逆向归纳法：从最后一个阶段或最后一个子博弈开始逆推上去，逐步向前倒推以求解动态博弈均衡，这就是逆向归纳法。 7．承诺：就是对愿意与你合作的人给予回报的方式。 8．空洞威胁：当发出威胁的博弈参与者选择威胁所宣称的行动策略时，对自己并没有好处，这就不可信了，这叫做“空洞威胁”。二、请用最大期望收益法寻找最优策略。要求: （1）写出计算步骤；（2）给出最优的策略结果。甲乙两家企业，为了市场份额的争夺，在价格定制问题上各有两种纯策略，如图2-1所示。两家企业都知道自己在各个策略组合下的收益情况，但是并不知道对方的收益。假设甲采取U的概率为0.3，乙采取R的概率为0.6。乙 L R 甲U D 答：（1）当乙采取R策略的可能性为0.6时，采取L策略的可能性为0.4，那么甲据此判断采取自己的策略U时所获得的可能的期望收益EU(U)=0.6×2+0.4×3=2.4。甲采取自己的策略D时所获得的可能的期望收益EU(D)=0.6×4+0.4×1=2.8。很显然，甲应该选择策略D，因为EU(D)> EU(U)。（2）当甲采取U策略的可能性为0.3时，采取D策略的可能性为0.7，那么乙据此判断采取自己的策略L时所获得的可能的期望收益EU(L)=0.3×1+0.7×4=3.1。乙采取自己的策略R时所获得的可能的期望收益EU(R)=0.3×4+0.7×2=2.6。很显然，乙应该选择策略L，因为EU(L)> EU(R)。

博弈论的复习资料

名词解释： 1，共同知识：是指所有当事人对该事件都知道，并且也所有当事人都知道其他当事人也知道这一事件，并且所有当事人都知道所有当事人都知道这一事件。那么该事件就是共同知识。 2，先动优势：在序贯情侣博弈中，任何一方率先采取行动可能得到的好处，都比他或她后行动可能得到的好处大。这种局中人先动得益大于后行得益的情况，叫做先动优势。3，后动优势：后行动的得益比先行动的得益大的情况 4，信息集：我们用一个扁椭圆形的虚线的圈，把所论局中人的若干决策节点罩起来，成为他的一个信息集。 ?单点集：我们把不被扁椭圆虚线罩住的每个决策节点也给以信息集的地位，称为单点集。 ?触发策略：即只要他的对手在博弈中一直采取合作策略，则该局中人也会在博弈中继续采取合作策略；但是，一旦对手在某一个阶段采取背叛策略，将会触发该局中人在往后的一段时期内采取不合作策略，甚至永远采取不合作策略，从而对对手实施惩罚。 ?冷酷策略：双方一开始的时候选择合作，然后继续选择合作，直到有一方选择背叛，从此永远选择背叛。即任何局中人的一次性不合作将触发永远不合作。 ?礼尚往来策略：开始的时候和冷酷策略一样，即双方从合作开始，在以后的每个阶段，如果你的对手在最近的一次博弈中还是采取合作策略，则你继续跟他合作；如果你的对手在上一阶段的博弈中采取背叛策略，则你在下次的博弈中采取背叛策略惩罚他，但是如果你的对手在下一次博弈中改邪归正，采用合作策略，则你在下次继续博弈中还是跟他合作。触发策略是带有奖励和惩罚措施的一种博弈机制。在这个机制中，惩罚措施是其中的关键。注意：（1），一个信息集罩住的必须是同一个局中人的决策点。 ?必须是同一个局中人在同一个时点的决策节点。

博弈与决策网上作业答案-(2)

6.在具有占优策略均衡的囚徒困境博弈中（两个囚徒都会坦白） 7.策略式博弈，正确的说法是（策略式博弈无法表明行动顺序） 8.市场交易中普遍存在的讨价还价属于哪种博弈。（完全信息动态博弈） 9.公共物品的特征是（不用购买就可消费） 10.下面哪一项物品具有非排他性（国防） 11.在一个博弈中博弈方可以有很多个V 12.在一个博弈中只可能存在一个纳什均衡。X 13.在博弈中知道越多的一方越有利。X

14.在博弈中纳什均衡是博弈双方能获得的最好结果。X 15.在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。X 16.纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。V 17.囚徒困境说明个人的理想选择不一定是集体的理想选择。V 18囚徒的困境博弈中两个囚徒之所以会处于困境，无法得到较理想的结果，因为两囚徒都不在乎坐牢时间长短本身，只在乎不能比对方坐牢的时间更长。X 19.纳什定理说明在任何一个有n个博弈方存在的有限博弈中，都至少存在一个纳什均衡。V

20.根据参与人行动的是否同步来区分，博弈可以划分为静态博弈(static game)和动态博弈（dynamic game）。V 21.在动态博弈中，因为后行动的博弈方可以先观察对方行为后再选择行为，因此总是有利的。 X 22.子博弈可以从一个多节点信息集开始。X 23.公共物品实际上就是公用的物品。X 24.公共物品的存在说明了依靠市场机制可以实现资源的有效配置。X 25.混合策略纳什均衡是普遍存在的，纯策略纳什均衡只是混合纳什均衡的一种特例。V 第二次作业答案 1.在一个博弈中博弈方可以有很多个。V

管理决策中的博弈问题与案例分析

《决策理论与方法》课程论文管理决策中的博弈问题与案例分析学院: 经济与管理学院专业: 管理科学与工程学号: 姓名: 日期: 二○一六年十二月

摘要博弈论与决策论之间存在多方面的联系。首先，从理解和优化决策的意义上讲，博弈论应该被看成是一种决策理论，并且是一种规范性（prescriptive）决策理论，它不是描述具体的决策过程，而是指出决策的最优结果应该是什么。其次，博弈论可以帮助我们理解决策者之间存在相互作用的状态。决策论一般处理个人、集体或者组织的决策问题，而不处理决策者之间的相互作用问题。博弈论恰好相反；再次，博弈论的一些分支可以看作是对决策论传统内容的深化。博弈论给现代管理决策和机制设计带来了全新的角度和革新，在现代管理决策中运用博弈论有助于我们做出更加合理正确的决策。关键词：博弈论；决策论；管理决策

1博弈论简介 1.1博弈的起源和发展博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略，达到取胜的目的博弈论思想古已有之，中国古代的《孙子兵法》等著作就不仅是一部军事著作，而且算是最早的一部博弈论著作。博弈论最初主要研究象棋、桥牌、赌博中的胜负问题，人们对博弈局势的把握只停留在经验上，没有向理论化发展。博弈论考虑游戏中的个体的预测行为和实际行为，并研究它们的优化策略。近代对于博弈论的研究，开始于策梅洛（Zermelo），波莱尔（Borel）及冯?诺依曼（von Neumann）。1928年，冯?诺依曼证明了博弈论的基本原理，从而宣告了博弈论的正式诞生。1944年，冯?诺依曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统地应用于经济领域，从而奠定了这一学科的基础和理论体系。 1950～1951年，约翰?福布斯?纳什（John Forbes Nash Jr）利用不动点定理证明了均衡点的存在，为博弈论的一般化奠定了坚实的基础。纳什的开创性论文《n人博弈的均衡点》（1950），《非合作博弈》（1951）等等，给出了纳什均衡的概念和均衡存在定理。此外，莱因哈德?泽尔腾、约翰?海萨尼的研究也对博弈论发展起到推动作用。今天博弈论已发展成一门较完善的学科。 1.2博弈论的基本概念博弈论又被称为对策论（Game Theory）既是现代数学的一个新分支，也是运筹学的一个重要学科。博弈论中的基本要素有以下几个：局中人或参与者（Players）规则（rules）：规定博弈各方的行动顺序、方式、以及最终的结果等。策略（Strategy）:一整套的行动方案，规定了各种情况下的行动。相机策略（contingent strategy）：仅在不确定事件发生时才会采取的策略。行动（action）：局中人在特定条件下的行为。

博弈论与决策思维

《博弈论与决策思维》感想这次很荣幸的去听了郑教授的《博弈论与决策思维》讲座，非常感谢浙江大学东方财智能给我提供的这次机会，听完这个课程之后，内心深处感受颇深，第一次觉得博弈思维是如此的精湛，更令人感叹的是郑教授教了我们在生活当中如何运用博弈思维来处理一些棘手的事。与我以前听过的所有精彩的课程相比，我只想说一句：教授不愧是教授，教授与老师的讲课方式与方法是截然不同的！在整个博弈论课程演讲的过程中，郑教授都是用一些有趣的例子来引导大家在课堂上的互动，从而通过在例子上总结出来的一些启示来告诉大家，在生活当中遇到一些进退两的困境时，我们应当如何巧妙地运用博弈思维来思考问题，并让那些问题能得到妥善的处理。如果就像宣读课本一样把那些道理说给大家听，把那些PPT画面一页页放给大家看的话，那效果肯定就犹如过眼云烟，但是郑教授说的每一点重点我们都会牢牢紧记！比如：田忌赛马，这是大家都知道的故事。大家都只知道田忌之所以赢了齐王是因为他改变了策略，然而改变策略视需要前提条件的：第一就是对方愚蠢，第二就是对方的信息的公知的。所以在现实生活中我们应该用全局、动静思维来考虑问题！博弈分为很多种：换位思考、信任危机、收益问题、隐性激励、推理方式、、、、、其中有一点我记得最清楚的就是隐性激励。说的大概就是一个公司的上层不能什么事都必须是亲力亲为，应该对有些事松松手或者对于有些事假装不清楚，让下属自己拿主意，让他们以后做事能越来越有自信，在这个过程中能逐渐成长起来，正好验证了那句话“水至清则无鱼，人至察则无徒”！不仅人与人之间存在博弈，物品之间也同样存在博弈，只不过换了一种说法。物品间的竞争是替代，合作就是互补。而市场决定着物品之间的关系，所以说博弈是无处不在的。郑教授所讲的博弈内容远不止这么点，用一句话来概括：只可意会不可言传。只有亲自去听了之后才会有那种突然觉自己的智慧一下子就升华了的感觉。学会博弈论会让你活的更有智慧！

博弈与决策测验1-4答案

测验题目1 博弈当中通常包括下面的内容，除了（）。正确的答案是：支付题目2 博弈论中，局中人从一个博弈中得到的结果常被称为（）正确的答案是：损益题目3 一个博弈中，直接决定局中人损益的因素是（）正确的答案是：策略组合题目4 下列关于策略的叙述哪个是错误的（）正确的答案是：一个局中人在原博弈中的策略和在子博弈中的策略是相同的题目5 囚徒困境说明（）正确的答案是：双方都独立依照自己的利益行事，则双方不能得到最好的结果题目6 在具有占优策略均衡的囚徒困境博弈中（）正确的答案是：两个囚徒都会坦白题目7 策略式博弈，正确的说法是（）正确的答案是：策略式博弈无法表明行动顺序题目8 市场交易中普遍存在的讨价还价属于哪种博弈。（）正确的答案是：完全信息动态博弈题目9 公共物品的特征是（）正确的答案是：不用购买就可消费

题目10 下面哪一项物品具有非排他性（

正确的答案是：国防题目11 在一个博弈中博弈方可以有很多个。对题目12 在一个博弈中只可能存在一个纳什均衡。错题目13 在博弈中知道越多的一方越有利。错题目14 在博弈中纳什均衡是博弈双方能获得的最好结果。错题目15 在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。错题目16 纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。对题目17 囚徒困境说明个人的理想选择不一定是集体的理想选择。对题目18 囚徒的困境博弈中两个囚徒之所以会处于困境，无法得到较理想的结果，因为两囚徒都不在乎坐牢时间长短本身，只在乎不能比对方坐牢的时间更长。错题目19 纳什定理说明在任何一个有n个博弈方存在的有限博弈中，都至少存在一个纳什均衡。对题目20 根据参与人行动的是否同步来区分，博弈可以划分为静态博弈(StatiC game)和动态博弈(dyn amic gam?。对题目21 在动态博弈中，因为后行动的博弈方可以先观察对方行为后再选择行为，因此总是有利的。错题目23

博弈与决策作业任务1-4

博弈与决策平时作业(1）一、名词解释 1．博弈论：是指研究多个个体或团队之间在特定条件制约下的对局中，利用相关方的策略而实施对应策略的学科。2．完全信息：是指所有参与者各自选择的行动的不同组合所决定的收益对所有参与者来说是共同知识。 3．静态博弈：是指博弈中参与者同时采取行动，或者尽管参与者行动的采取有先后顺序，但后行动的人并不知道先采取行动的人采取的是什么行动。 4．动态博弈：指的是参与人的行动有先有后，而且后选择行动的一方可以看到先采取行动的人所选择的行动。5．非合作博弈：如果参与者之间不可能或者根本没办法达成具有约束力的协议，不能在一个统一的框架下采取行动的话，这种博弈类型就是非合作博弈。 6．纳什均衡：是对于每一个博弈参与者来说是这样的一个战略组合，即给定其他参与者的战略，每一个参与者的这个战略能使其期望效用最大化。 7．纯策略：如果在每个给定信息下，只能选择一种特定策略，而且参与者选择了这个策略之后就不会单方面改变自己的策略，这个策略就是纯策略。 8．纯策略纳什均衡：是指在一个纯策略组合中，如果给定其他的策略不变，在该策略组合下参与者不会单方面改变自己的策略，否则会使策略组合令人后悔或者不满意。二、请用剔除劣势策略的方法寻找以下博弈的最优策略。要求: （1）写出剔除的步骤或顺序；（2）画出相应的剔除线；（3）给出最优的博弈结果。乙坦白抵赖甲坦白 -3 -3 -5 抵赖 -5 -1 -1 答：（1）对甲而言，抵赖是劣势策略，用横线划去“抵赖”所对应的行；（2）对乙而言，抵赖是劣势策略，用竖线划去“抵赖”所对应的列；（3）余下的策略组合是（坦白，坦白），这就是该博弈的最优结果。 [注：步骤（1）（2）颠倒亦可] 百事可乐低价高价可口可乐低价 3 3 1 6

博弈论与决策论

主讲人：邓光耀

1、几个定义 ?定义1.1 博弈论（Game Theory），亦名“对策论”、“赛局理论”，属应用数学的一个分支, 目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。博弈论主要研究公式化了的激励结构间的相互作用。是研究具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为，并研究它们的优化策略。生物学家使用博弈理论来理解和预测进化论的某些结果。 ?定义1.2 序贯博弈是指参与者选择策略有时间先后的博弈形式。因此，某些对局者可能率先采取行动，它是一种较为典型的动态博弈，而重复博弈则可视为一种特殊的动态博弈形式。 ?在序贯博弈中，先行者可能占据一定的有利地位，我们把它叫做先行者优势。 ?定义1.3 决策论（Decision theory）决策论是根据信息和评价准则，用数量方法寻找或选取最优决策方案的科学，是运筹学的一个分支和决策分析的理论基础。在实际生活与生产中对同一个问题所面临的几种自然情况或状态，又有几种可选方案，就构成一个决策，而决策者为对付这些情况所取的对策方案就组成决策方案或策略。

2、序贯博弈之例 ?例1：桌上有25枚硬币，每次可以取1枚、2枚或者3枚。你与对手交替选择，谁先选到第25枚硬币谁就胜利。假设你首先选择，你这样才能保证自己胜利？ ?解答：你应当这样选择：每次选择的最后一个数依次为1、5、9、13、17、21、25，这样无论对方如何选择，你均可以保证自己胜利。也就是说你要保证每次最后选择的是4n+1型的数。而这种保证是可以做到的，读者可以思考一下原因。

博弈与决策作业3(答案)

博弈与决策平时作业参考答案（3）一、名词解释 1．网络外部性：如果一种产品对消费者的价值会随着其他使用者数量增加而增加，这种产品就具有网络外部性。2．大规模协调博弈：源于网络外部性，假如有成千上万的人在同时进行一次性博弈，那就形成了大规模协调博弈。3．重复博弈：指同样结构的博弈重复许多次，其中的每次博弈称为“阶段博弈”。 4．无名氏定理：只要博弈参与者具有足够的耐心，那么在满足博弈参与者个人理性约束的前提下，博弈参与者之间就总有多种可能达成合作均衡。 5．针锋相对策略：如果博弈参与者第一步采取合作，此后每一步都重复对方上一步的行动，要么是合作要么是背叛，只要是博弈没有确定的期限，由于长期利益对短期行为的制约作用，因此有一些在一次性博弈中不可行的威胁或诺言在重复博弈中会变为可信的，那么就会形成一种持续合作的态势。 6．冷酷策略：是指参与人在开始时选择合作，在接下来的博弈中，如果对方合作则继续合作，而如果对方一旦背叛，则永远选择背叛，永不合作。 7．双边博弈：在某些博弈中，每个博弈者的策略组合都相同，博弈者之间的支付或收益对称，这种博弈被称之为双边博弈。 8．演化稳定策略：说的是，如果均衡一旦得以形成，此后偏离均衡的运动就会受到自然选择的打击。二、请分析以下重复博弈的合作与背叛问题。 1．图3-1和3-2的两个囚徒困境博弈会一直重复下去，而且没有确切的截止日期，请问哪个博弈的参与者更有可能出卖对方？为什么？乙好心坏心甲好心坏心图3-1 乙好心坏心甲好心坏心图3-2

答：图3-1所示的囚徒困境博弈的参与者更容易背叛对方。这图3-1和图3-2的两个博弈中，双方都使用好心时，各自获得20个单位的支付。一个参与人在对方好心而自己使坏心时获得的支付是不一样的，图3-1为40个单位，远大于好心时的20个单位；图3-2 为22个单位，仅稍大于好心时的20个单位。所以，图3-1中的参与者更容易背叛对方。 2．图3-3和3-4的两个囚徒困境博弈会一直重复下去，而且没有确切的截止日期，请问哪个博弈的参与者更有可能出卖对方？为什么？乙好心坏心甲好心坏心图3-3 乙好心坏心甲好心坏心图3-4 答：图3-3所示的囚徒困境博弈的参与者更容易背叛对方。这图3-3和图3-4的两个博弈中，双方都使用好心时，各自获得20个单位的支付；一个参与人在对方好心而自己使坏心时获得的支付为40单位。在图3-3中，即使对方也使用了坏心，双方也还各自获得18个单位支付，与都好心时相差2个单位；而在图3-4中则降低为15个单位，与都好心时相差了5个单位，背叛要付出比较高的代价。所以，图3-3中的参与者更容易背叛对方。三、分析以下博弈的结果及策略。要求: （1）给出可能的博弈均衡；（2）写出应采取的行动策略。 1．假设你是一位非常出众的男士，有一位热恋的女朋友，她各方面则比较普通。今天晚上在洋河体育场有一场足球比赛，你想去看足球比赛。而此时，在奥体中心也有一场王菲的演唱会，你的女朋友想去听演唱会。博弈矩阵如下，请：（1）分析该博弈的均衡；（2）面对着冲突，你有哪些行动可以选择？女方足球赛演唱会男方足球赛演唱会

博弈论第二章习题

问题1:博弈方2就如何分10000元钱进行讨价还价。假设确定了以下原则:双方提出自己要求得数额与,。如果设博弈方1与,,则两博弈方得要求都得到满足,即分得与;但如果,则该笔钱就被没收。问该博弈得纯策略纳什均衡就是什么？如果您就是其中一个博弈方,您会选择什么数额,为什么？解:,那么, 那么, 它们就是同一条直线,上得任意点,都就是本博弈得纯策略得Nash 均衡。假如我就是其中一个博弈方,我将选择元,因为就是比较公平与容易接受得。它又就是一个聚点均衡。问题2:设古诺模型中有家厂商。为厂商得产量,为市场总产量。为市场出清价格,且已知(当时,否则)。假设厂商生产产量得总成本为,也就就是说没有固定成本且各厂得边际成本都相同,为常数。假设各厂同时选择产量,该模型得纳什均衡就是什么？当趋向于无穷大时博弈分析就是否仍然有效？解:, 令, 解得:, 当趋向于无穷大时,这就是一个完全竞争市场,上述博弈分析方法其实已经失效。问题3:两寡头古诺模型,,但两个厂商得边际成本不同,分别为与。如果,问纳什均衡产量各为多少？如果,但,则纳什均衡产量又为多少？解:双方得反应函数联立求解 ,解得: 当,就就是这个博弈得Nash 均衡。如果,但,当然可以推得。那么厂商1就变成垄断商它得最佳产量当然就是,它得利润就是:。问题4:如果双寡头垄断得市场需求函数就是,两个厂商都无固定成本边际成本为相同得常数。如果两个厂商都只能要么生产垄断产量得一半,要么生产古诺产量。证明:这就是一个囚徒困境型得博弈。解:古诺产量,垄断产量得一半,那么分别有四种情况问题5:两个厂商生产一种完全同质得商品,该商品得市场需求函数为,设厂商1与厂商2都没有固定成本。若她们在相互知道对方边际成本得情况下,同时作出产量决策就是分别生产20单位与30单位。问这两个厂商得边际成本各就是多少？各自得利润就是多少？解:, 令, 代入,所以:。问题6:两个企业1、2各有一个工作空缺,企业得工资为,并且。设有两个工人同时决定申请这两个企业得工作,规定每个工人只能申请一份工作,如果一个企业得工作只有一个工人申请,该工人肯定能得到这份工作;但如果一个企业得工作同时有两个工人申请,则企业无偏向地随机选择一个工人,另一个工人则会因为错过向另一个企业申请得时机而失业(这时收益为0)。该博弈得纳什均衡就是什么？该博弈得结果有多少种可能性,各自得概率就是多少？解: 有两个纯策略均衡,, 问题7:五户居民都可以在一个公共得池塘里放养鸭子。每只鸭子得收益就是鸭子总数得函数,并取决于就是否超过某个临界值;如果,收益;如果时,。再假设每只鸭子得成本为元。若所有居民同时决定养鸭得数量 ,问该博弈得纳什均衡就是什么？问题7:就是第个农户养鸭子得数量,,当时, , ,那么 ,那么 (1)如果,则上述临界条件成立,五户居民每户养8只鸭子,就就是该博弈得Nash 均衡。 (2)如果,那么上述条件不成立,

文档之家

2 同时决策博弈(2)

新《博弈与决策》期末复习指导

博弈与决策作业1(答案)

博弈与决策题库

国家开放大学2020年春季学期电大考试《博弈与决策》形成性考核

第17章 决策与博弈论

《博弈与决策》期末复习资料.doc

博弈论第二章习题

博弈与决策网上作业答案

博弈与决策作业2(答案)

博弈论的复习资料

博弈与决策网上作业答案-(2)

管理决策中的博弈问题与案例分析

博弈论与决策思维

博弈与决策测验1-4答案

博弈与决策作业任务1-4

博弈论与决策论

博弈与决策作业3(答案)

博弈论第二章习题

第17章决策与博弈论