当前位置：文档之家› 尼科尔森《微观经济理论——基本原理与扩展》核心讲义(博弈定价模型)【圣才出品】

尼科尔森《微观经济理论——基本原理与扩展》核心讲义(博弈定价模型)【圣才出品】

关于定价的博弈论模型

CH13 关于定价的博弈论模型分析寡头市场的最大困难在于策略问题。在此情形下，市场上仅有几家企业，每一家企业在做决策时，都必须在一定程度上考虑其它企业的行为。博弈论就是用以研究策略选择的一种主要的工具。一、基本概念在一些情况下，个人或企业必须作出策略性选择，并且最终的结果依赖于每一个行动者的选择，这种情况就可以看成是一个博弈。 1．博弈的三要素任何一个博弈都必须具备三个要素：（1）博弈的参与者参与人的具体身份无关紧要，在博弈中没有“好人”与“坏蛋”之分，我们只是简单地假设每个参与者在考虑到对手行为的前提下，做出最有利的策略性选择。（2）策略策略是博弈参与者的行动规则。在非合作博弈中，参与者之间不能就策略选择达成一个有约束力的协议。（3）支付（payoffs ）支付是参与者的最终受益。支付包括了与博弈结果相关的所有方面，既包括显性的货币报酬，也包括隐性的参与者关于结果的心理感受。 2. 符号两个参与者（A 和B ）之间的博弈G 用下式表示 [,,(,),(,A B A B G S S U a b U a b 其中，A S 和B S 分别表示参与者A 和参与者B 的可选策略，(,)A U a b 和(,)B U a b 分别表示当参与者A 和B 分别选择策略a 和策略b 时，各自所得到的支付（,A B a S b S ∈∈）。二、Nash 均衡市场均衡：在均衡价格和产量下，买方和卖方都没有动力去改变自己的行为。

Nash 均衡：对于策略组合（**,a b ），如果给定其它参与者的策略，没有一个参与者会选择单方面偏离，那么这个策略组合就构成一个Nash 均衡。也就是说 ** * (,)(,)A A U a b U a b '≥ 对于所有A a S '∈ ** * (,)(,)B B U a b U a b '≥ 对于所有B b S '∈ 对纳什均衡的理解设想所有参与者在博弈之前达成一个（没有约束力的）协议，规定每个参与人选择一个特定的战略。那么，给定其他参与人都遵守此协议，是否有人不愿意遵守此协议？如果没有参与人有积极性单方面背离此协议，我们说这个协议是可以自动实施的（self-enforcing ），这个协议就构成一个纳什均衡。否则，它就不是一个纳什均衡。三、一个例子两个厂商（A 和B ）决定自己花多少钱用于做广告。每个厂商可以选择较高的预算（H ）或较低的预算（L ）。 1．博弈的扩展式表述图13.1 2．博弈的策略式（规范式）表述表13.1 3．占优策略和Nash 均衡从表13.1可以看出，低预算（L ）是厂商B 的占优策略，即不管厂商A 选择哪一种策略，L 都是厂商B 的最佳选择。由于该博弈的结构是公共知识，厂商A 也知道L 是厂商B 的占优策略，所以厂商A 将选择L 。因此，该博弈的均衡是（L ，L ）。请验证（L ，L ）构成一个Nash 均衡，而其它三个策略组合都不是Nash 均衡。

浅析价格战中的博弈论

价格战中博弈论的浅析 2011-2012学年第一学期课程名称：博弈论班级：10物流治理（采购与供应链1班）学号：1040407122 姓名：曾维乐

二〇一一年十二月十八日价格战中的博弈论浅析摘要：博弈论研究互动决策行为，大多数时候是研究对抗性行为，但并不是所有的对抗行为。博弈论是运筹学的一个重要分支，类型众多。本文在简要介绍了博弈论相关内容的基础上，重点介绍了纳什均衡。通过案例，充分运用囚徒困境、智猪博弈、反向归纳法等进行分析，从而得出在经济决策中行为人如何决定最优决策的方法。在此基础上，结合博弈论相关知识，分析解决经济生活中的一些实际问题。如：针对商家的价格战问题。

关键词：囚徒困境懦夫博弈安全博弈纳什均衡一、理论介绍 1、博弈论简介博弈论(game theory),也称对策论，它是运筹学的一个重要分支，是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题，简单讲来确实是一些个人或其他组织，面对一定的环境条件，在一定的规则下，同时或先后，一次或多次，从各自同意选择的行为或策略中进行选择并加以实施，各自取得相应结果的过程。从上述定义中能够看出，一个完整的博弈一般由以下几个要素组成：博弈的参加者，各博弈方各自选择的全部策略或行为的集合、博弈方的得益（得益矩阵）、结果、均衡等。 1、参与人指的是博弈中选择行动以最大化自己效用的决策主体(能够是个人，也能够是团体)。 2、行动是指参与人在博弈进程中轮到自己选择时所作的某个具体决策。 3、策略是指参与人选择行动的规则，即在博弈进程中，什么情况下选择什么行动的预先安排。 4、信息指的是参与人在博弈中所明白的关于自己以及其他参与人的行动、策略及其得益函数等知识。 5、得益是参与人在博弈结束后从博弈中获得的效用，一般

从博弈论角度看古诺模型

从博弈论角度看古诺模型 WTD standardization office【WTD 5AB- WTDK 08- WTD 2C】

博弈论的观点看古诺模型罗思蕴（华中师范大学数学与应用数学系，武汉430079）摘要：运用博弈论的研究方法，对古诺模型的几种变式进行分析，给出模型解法的代数表达式，并对结果进行适当的对比分析，最后总结出不同模型对结论的改变情况。关键词：古诺模型纳什均衡完全信息不完全信息静态博弈动态博弈古诺模型（Cournot model）是博弈论中最具有代表性的模型之一，也是是纳什均衡最早的版本。它是法国经济学家古诺(Augustin Cournot)在1938年出版的《财富理论的数学原理研究》一书中最先提出的。而古诺的定义比纳什的定义早了一百多年，足以体现博弈论这样一个学科是深深扎根于经济学的土壤中的。从经济学的角度，它的研究价值在于古诺模型是介于两种极端状况完全竞争和垄断之间。在古诺生活的时代，大多数市场都只有少数的厂商经营，所以这个模型在当时是极具现实意义的。随着时间的推移，古诺模型也演变出了各种不同的版本。如果从博弈论的角度分析，有四种情况极具代表性：完全信息静态博弈的古诺模型、不完全信息静态博弈的古诺模型、完全且完美信息动态博弈的古诺模型、无限次重复博弈的古诺模型。 1 经典古诺模型古诺模型最初的形态是来自于经济学的。在经济学中，寡头的概念是指那种在某一产业只有少数几个卖者的市场组织形式。古诺模型对寡头具有如下的基本假设。一，

假定一个产业只有两个寡头，每个寡头生产同质产品，并追求利润最大化。二，两个寡头之间进行的是产量的竞争而不是价格竞争，且产品的价格依赖于两者生产的产品总量。三，寡头之间无勾结行为。四，每个生产者都把对方的产出水平视为定值。五，边际成本为常数。在经典的古诺模型中，每个企业具有相同的不变单位成本：需求函数为：第i个企业的利润为：最优化的一阶条件为：反应函数为：解得纳什均衡为：每个公司的利润为：古诺模型是在假定寡头具有完全信息的基础上导出的。在这一均衡中，每个寡头都可以准确猜测对手的产量，从而选择自己的最大产出。最重要的是，古诺均衡解在寡头无勾结的假定下求出的。如果考虑寡头之间相互勾结而达到均衡的情况，那么经过计算可以得到实际产出水平与实际价格上等于完全垄断条件下达到的产量与价格。更广泛的，考虑无勾结寡头市场、垄断市场、自由市场，可以得到：无论是产量还是价格，无勾结寡头市场都是处于中间的位置。也就是说，如果寡头市场不存在勾结的行为，其效率高于完全垄断，低于完全竞争。 2 博弈分类下的两种古诺模型不完全信息静态博弈的古诺模型完全信息静态博弈的古诺模型即经济学中最经典的形式，它假设了厂商相互完全

博弈论与经济模型第10章

第10章机制设计与拍卖 10.1 导论在本章和下一章里，我们将介绍博弈论中用来处理机制和市场设计的主要工具。存在着许多这样一些类型的例子。政府可能会去规制（regulate）垄断企业，使其行为符合特定的所期望的准则；艺术品收藏家要在出售其手中的画作中获得尽可能高的收益；社会计划者要保证开支在使用者之间有效地分配；学校管理系统要按照某种准则把它的空间在学生之间进行配置，等等。在本章里，我们主要关心销售机制的设计问题；在下一章中，我们将处理两组个体之间的匹配问题。 10.2 拍卖 10.2.1 历史概述在一个“拍卖”中，物品被卖给出价最高的人。广义的“拍卖”是指对重要的经济资源进行配置，从艺术品到短期政府公债到近海油气田开发权再到无线电频率使用权等等。它采用多种不同的形式。例如，可以用轮流报价的方法（如艺术品拍卖）或密封式提交报价等。支付的成交价可以是最高报价，或某些其它价格；如果拍卖的物品不止一种，则既可以采用所有物品打包式的同时报价，也可用每种物品陆续报价的方式。博弈论分析有助于我们理解各类报价设计的结果；例如，它建议出可以最有效配置资源且带来最高收入的拍卖机制设计。在这一节里，我们来讨论这样的拍卖，其中每个买者知道他自己以及每个其他买者对于物品的估价。在后面的章节里，我们还要发展出允许我们假定买者之间互相不知道别人对物品的估价的情况下，对拍卖进行研究的工具来。拍卖的现实背景：从巴比伦到网上购物拍卖有着相当长的历史。Herodotus，公元前1500年的古希腊作家，曾与Thucydies一起创立了历史学，曾对巴比伦的拍卖加以了描述。他写道，巴比伦人“最引人注目”的传统就是每个村庄里一年一度的拍卖，这种拍卖是对到了结婚年龄的女子进行的拍卖。对男人最具吸引力的女人首先被出；他们要求一个正的价格，而最不具吸引力的女人则倒过来向娶她的男子支付价格。在每次拍卖中，报价是轮流出价的，出价最高的男子胜出，并支付他报出的价格。拍卖也出现于公元前1500年和400年的雅典，是出售征税权，对没收的财产的处置权，以及出租土地与矿山等。关于这些拍卖的实质内容的证据很少，但有一些有趣的东西留了下来。例如，雅典政治家Andocides（C.440—391B.C.）曾对一个征税权拍卖中的串谋提出了一个报告。在古罗马经常开展一些拍卖的活动，且在罗马帝国之后的中世纪欧洲还继续着这种活动（例如，在中世纪和早期现代低地国家中的城镇里，每年都要对征税权进行拍卖）。最早出现英语单

价格战中博弈论的浅析

价格战中博弈论的浅析 2011-2012学年第一学期课程名称：博弈论班级：10物流管理（采购与供应链1班）学号：1040407122 姓名：曾维乐二〇一一年十二月十八日

价格战中的博弈论浅析摘要：博弈论研究互动决策行为，大多数时候是研究对抗性行为，但并不是所有的对抗行为。博弈论是运筹学的一个重要分支，类型众多。本文在简要介绍了博弈论相关内容的基础上，重点介绍了纳什均衡。通过案例，充分运用囚徒困境、智猪博弈、反向归纳法等进行分析，从而得出在经济决策中行为人如何决定最优决策的方法。在此基础上，结合博弈论相关知识，分析解决经济生活中的一些实际问题。如：针对商家的价格战问题。关键词：囚徒困境懦夫博弈安全博弈纳什均衡一、理论介绍 1、博弈论简介博弈论(game theory),也称对策论，它是运筹学的一个重要分支，是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题，简单说来就是一些个人或其他组织，面对一定的环境条件，在一定的规则下，同时或先后，一次或多次，从各自允许选择的行为或策略中进行选择并加以实施，各自取得相应结果的过程。从上述定义中可以看出，一个完整的博弈一般由以下几个要素组成：博弈的参加者，各博弈方各自选择的全部策略或行为的集合、博弈方的得益（得益矩阵）、结果、均衡等。 1、参与人指的是博弈中选择行动以最大化自己效用的决策主体(可以是个人，也可以是团体)。 2、行动是指参与人在博弈进程中轮到自己选择时所作的某个具体决策。 3、策略是指参与人选择行动的规则，即在博弈进程中，什么情况下选择什么行动的预先安排。 4、信息指的是参与人在博弈中所知道的关于自己以及其他参与人的行动、

博弈论(整理过名词解释和简答)

一、名词解释： 1、博弈：一些个人、团体或其他组织，在一定的规则约束下，依据所掌握的信息，同时或者先后，一次或者多次从允许选择的行为或战略进行选择并加以实施，并从中各自取得相应结果或收益的过程。 2、囚徒困境：从博弈中的两个利益主体出发选择行为，结果是既没有实现两人总体的最大利益，也没有真正实现自身的个体最大利益，比如经济领域的寡头竞争、公共产品的供给。 3、非合作博弈与合作博弈：人们行为相互作用时，当事人能达成一个具有约束力的协议，也就是合作博弈，反之，就是非合作博弈。 4、常和博弈：是指博弈双方的得益总和为非零的常数变和博弈：是指在不同的策略组合或者结果下，所有博弈方的得益总和一般是不相同的零和博弈：是指在博弈中，一方的得益就是另一方的损失，所有博弈方的得益总和为零5、博弈论：研究决策主体的行为及其相互决策和均衡问题的学科。在经济学中，博弈论是研究经济主体的决策相互影响

6、战略：参与人在给定信息集的情况下的行为规则的完备描述。 7、均衡：所有参与人的最优战略组合。 8、均衡路径：如果一个博弈有几个子博弈，一个特定的纳什均衡决定了原博弈树上唯一的一条路径，或者说是一个纳什均衡结果在博弈树中所形成的路径。 9、占优均衡：无论其他参与人选择什么战略，参与人的某一种战略均是最优的。 10、重复剔除劣战略的占优均衡：首先找到某个参与人的劣战略（假定存在），把这个劣战略删除掉，重新构造一个不包含已删除的劣战略的新的博弈，然后再删除这个新的博弈中的某个参与人的劣战略，一直重复这个过程，直到只剩下唯一的战略组合为止。 11、纳什均衡：给定你的策略，我的策略是最好的策略；给定我的策略，你的策略也是最好的策略，即双方在给定的战略上不愿意改变自己的策略。 12、混合战略：如果一个战略规定参与人在给定信息情况下以某种概率随机选择不同的行为，我们称该战略为混合战略。

第五章-博弈论与竞争策略

第五章博弈论与竞争策略第一节第二节第三节博弈论的基本概念完全信息静态博弈重复博弈和序列博弈在现实经济社会，完全垄断和完全竞争的市场结构十分少见。厂商在市场中既有一定的垄断势力，又面临很大的竞争压力。厂商之间具有相关性和依存性。因此，可以用博弈论的方法解释和说明厂商的竞争行为和策略。博弈论是70年代中期以来微观经济学发展的一个重要方面。1994年的诺贝尔经济学奖被授予博弈论专家：纳什（Nash）、泽尔腾（Selten）和海萨尼（Harsanyi），他们都对博弈论在经济学中的应用作出了贡献。 70年代以来，博弈论已经发展成为现代经济学的基础重要基础之一，改变了传统经济学的结构，这主要有两个方面的原因： 1．传统经济学着重研究市场机制和价格制度，分析完全竞争市场中的最优决策，不考虑决策者之间的相互影响。但是，现实经济运行中市场是不完全竞争的，行为主体之间的决策具有相互影响。 2．完全竞争市场是以完全信息为条件的，这在现实经济运行中也难以保证。在信息不对称条件下，考虑行为主体相互影响的非价格制度可以用博弈论分析。当然，应用博弈论解决竞争策略问题也是有条件的。除了掌握博弈论方法外，关键是正确估计各参与者的策略空间和收益函数。第一节博弈论的基本概念一．博弈论及其特点 1．博弈和博弈论博弈是指具有不同利益和目标的多个行为主体共同参加并相互影响的事态发展过程中的策略决策。博弈论（Game Theory）也称对策论，它是一种分析博弈过程和结果的数学方法，研究具有理性的多个行为主体的决策和行动直接相互作用和影响时，事态发展过程的决策和均衡问题。广泛应用于政治、军事、经济、外交和日常生活的许多领域。 2．特点：（1）参与者具有各自的目标：（2）参与者都是理性行为者；（3）参与者之间具有相关性；（4）事态发展的结果取决于全部参与者的共同行为；（5）参与者要根据对其他参与者的判断决定自己的行动，因而是对策。可见，博弈论是与优化论不同的决策理论。优化论是一种单人决策理论；博弈论所揭示的规律是一种多人决策理论。二．博弈论的基本概念在博弈论中，博弈的基本要素被概括为以下概念： 1）参与者Players （玩家）：即参加博弈过程的行为和决策主体，也是利益主体。在一个博弈中，最少要有两个参与者。 2）策略Strategies （战略或策略行为）：即参与者在某个博弈时点，根据其掌握的有关博弈信息而选择的决策变量和行动计划，一个参与者的全部可行策略称为他的策略空间。接上页 3）收益Payoff（支付、得益）和收益函数：收益是指在既定策略组合条件下参与者的得失情况。每个参与者的收益取决于全部参与者所采取的策略，称为收益函数。 4）结局 outcome（结果）：指博弈的结果，指既定策略组合条件下全部参与者所得收益的集合。 5）均衡 Equilibrium （均势）：指达到稳定的策略组合或结局。 6）博弈规则：指参与者、策略、结局之间的联系。它是由博弈的环境和参与者之间的相互影响决定的。例：可口可乐与百事可乐（参与者）的价格决策：双方都可以保持价格不变或者提高价格（策略）博弈的目标和得失情况体现为利润的多少（收益）利润的大小取决于双方的策略组合（收益函数）博弈有四种策略组合，其结局是：（1）如果双方都不涨价，各得利润10单位；（2）如果可口可乐不涨价，百事可乐涨价，可口可乐利润100，百事可乐利润-30；（3）如果可口可乐涨价，百事可乐不涨价，可口可乐利润-20，百事可乐利润30；

博弈论分析航空定价

基于博弈论的国内五大航空公司串谋联合涨价分析据《国际金融报》记者统计，从今年2月至今，包括东航、南航和海航在内的国内航空公司已经轮番上调了800公里以下和800公里以上的国内航班的燃油附加费，目前分别为60元和110元，较之前上调了20%和22%。同时，诸多国内外航空公司还多次上涨了飞赴欧洲、美洲、中东等航班的燃油附加费。4月20日起，国内航线机票销售已经开始实行新的运价体系，按照新的计算方法，目前广州出港航班机票价格普遍上升一成左右。在没有特价的情况下，运价调整后正常票价最低只能是5.2折，比以前的正常最低票价高了0.8折。另外，国内航线的特价票也比以前少了很多。以前还有0.8折这样的超低折扣，但现在基本绝迹了，特价票能有2~3折左右就不错了。国内五大航空公司：中国东方航空公司、中国国际航空公司、海南航空公司、中国南方航空公司、深圳航空公司，几乎垄断了国内市场，用博弈论可以很好的研究分析他们串谋涨价的行为。寡头企业为获得利润最大化，会联合其他企业寻求合作，他们就像一家企业一样联合行动，如制定价格联盟，限制产量等，对获得市场进行瓜分，这就是企业的串谋行为。假如寡头企业之间各自博弈，为获得市场，可能会率先降价，其他企业就会跟着做出反应纷纷降价，就会陷入囚徒困境，最终结局是个“纳什均衡”，而且价格战的结果是谁都没钱赚。因为博弈双方的利润正好是零。竞争的结果是稳定的。这个结果可能对消费者是有利的，但对厂商而言是灾难性的。所以，价格战对厂商而言意味着自杀。当然五大航空公司自然不会选择独自博弈，相反走向了串谋。当然五大航空公司的经营成本不会相同，基于技术，服务及管理层营销策略不同，又可以将这五大航空公司分为两大类：低成本A类和高成本B类厂商。低成本厂商可以获得利润，而高成本厂商获得微薄利润或者亏损。B类厂商比A 类厂商更有动力提高价格。都不提价时，A类利润/B类利润=（1742997+250783）/(-250783)≈8/(-1)，价格需求弹性Ed=19.23，价格弹性较大。B类厂商单独提价，它的市场份额就会明显下降,因此B类厂商获得收益是-3， A类厂商不提价获得收益是9。如果两类厂商都提价，A类厂商获得收益是10，B类厂商获得收

经济博弈论论文

博弈论及其在现代经济生活中的应用工造3班魏XX [摘要]：本文从“囚徒困境模型”和“智猪博弈模型”两个方面来阐述博弈论及其在现代经济生活中的运用。 [关键词]：博弈论囚徒困境模型智猪博弈模型应用 [正文]：有一个典型的案例：甲乙两人合伙作案，结果被警察抓了起来，分别被隔离审讯。在不能互通信息的情形下———也就是不知道对方是坦白还是缄默的前提下，每个嫌疑犯都可以作出自己的选择：或者供出同伙，即与警察合作，从而背叛同伙；或者保持沉默，也就是与同伙合作，而不是与警察合作。这样会出现以下几种情况：如果两人都不坦白，警察会因证据不足而将两人各判刑! 年；如果一人招供而另外一人不招，坦白者作为证人将不会被起诉，另一人将会被重判!" 年；如果两人都招供，则会因罪名成立各判!# 年。这两个嫌疑犯该怎么办呢？是选择合作还是互相背叛？从表面上看，他们应该互相合作，保持沉默，因为这样对他们整体而言是最好的结果———都只判!年。但是他们不得不仔细考虑对方可能采取的选择。问题就这样开始了，两个人都十分精明，而且只关心减少自己的刑期，并不会在乎对方被判多少年。每个人都会这样推理：假如对方不招，我只要一招供，马上可以获得自由，而不招却要坐牢! 年，显然招比不招好；假如对方招了，我若不招，则要坐牢!" 年。招了只要坐牢!# 年，显然还是招更好些。可见，对方无论招或者不招，我的最佳选择都是招认。两个人都会基于同样的想法作出招供的选择，这对他们个人来说都是最佳策略，但对整体而言却是一个最差的结果。这就是博弈论的一个经典模型———“囚徒困境模型”。作为一种关于决策和策略的理论，博弈论其实就在我们身边，它研究的许多例子来自于日常生活和经济活动中的游戏和事物。博弈的英文即，中文译为“博弈”是非常传神和贴切的，因为中国古代称下棋为“弈”，“博”则含有争斗的意思。在下棋这样的游戏中有一个重要的特点：即策略在其中起着举足轻重的影响和作用。精明慎重的棋手们相互揣摩、相互牵制，人人争赢，布每一个棋子时，都必须考虑到对手的策略选择，从而选择自己的最佳策略。这也就是博弈的核心问题：决策主体的一方行动后，参与博弈的其他人将会采取什么行动？参与人为取得最佳效果应采取怎样的对策？我们可以将博弈论定义为：一些个人、一些团队或其他组织，面对一定的环境条件，在一定的规则约束下，依靠所掌握的信息，同时或先后，一次或多次，从各自允许选择的行为或策略进行选择并加以实施，并从中各自取得相应结果或收益的过程。博弈论是(# 世纪四五十年代发展起来的。美国经济学家冯?诺依曼与奥斯卡?摩根斯特恩于!)**年合著的《博弈论与经济行为》被公认为博弈论诞生的标志。博弈论可以分为合作博弈理论和非合作博弈理论。前者主要强调的是集体理性；而后者主要研究人们在利益相互影响的局势中如何选择策略使自己的收益最大，强调的是个人理性。所谓“个人理性”是反映个体的行为始终都是以实现自身的最大利益为惟一目标，除非是为了实现自身利益的需要，否则不会考虑其他的个体或社会利益这样一种决策原则。非合作博弈要求各参与人之间不能存在任何

第十三章博弈论和竞争策略.

第十三章博弈论和竞争策略教学目的通过本章的学习，使学生掌握博弈论的基本内容，并能够用博弈论历来分析厂商的竞争策略。教学内容博弈与决策、占优策略、纳什均衡、重复博弈、序贯博弈、威胁、承诺和可信性、对进入的威慑教学重点与难点占优策略、纳什均衡、重复博弈、序贯博弈教学方法教师讲授与讨论相结合具体内容第一节博弈和决策博弈论(game theory)，又译为对策论，就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。博弈论的基本概念参与人，又称局中人，是指博弈中选择行动以实现自身利益最大化的决策主体(可以是个人，也可以是团体，如厂商、政府、国家)。行为：指参与人的决策变量，如消费者效用最大化决策中的各种商品的购买量；厂商利润最大化决策中的产量、价格等。策略：又称战略，是指参与人选择其行为的规则，也就是指参与人应该在什么条件下选择什么样的行动，以保证自身利益最大化。信息：是指参与人在博弈过程中的知识，特别是有关其他参与人(对手)的特征和行动的知识。即该参与人所掌握的其他参与人的、对其决策有影响的所有知识。收益：又称支付，是指参与人从博弈中获得的利益水平，它是所有参与人策略或行为的函数，是每个参与人真正关心的东西，如消费者最终所获得的效用、厂商最终所获得的利润。结果：是指博弈分析者感兴趣的要素集合。均衡：是指所有参与人的最优策略或行动的组合。博弈的分类：静态博弈与动态博弈完全信息博弈与不完全信息博弈合作博弈与非合作博弈：若参与者能够达成有约束力的协议，即为合作博弈；反之为非合作博弈。第二节占优策略

占优策略：无论竞争者如何行动，该策略都是最优的。占优策略均衡：不管竞争对手的策略如何，每一家企业的行为总是最优的，这样一个博弈的结构成为占优策略均衡。第三节纳什均衡纳什均衡：给定对方的阿行动，自己的行动是最优策略组合。最大最小策略：限制最小可能收益中的最大值。纯策略：博弈方做出某个具体的限制或者采取某个具体的行动的策略。混合策略：参与者以某种概率分布在两种或更多的行动中随机限制。第四节重复博弈重复博弈：博弈方不断采取行动，同时不断受到效应的收益的博弈。以牙还牙策略：在一个重复博弈中，限制前一轮对手所选择的行动的一种策略，该策略将与合作者保持合作，而报复不合作者。第五节序贯博弈序贯博弈：参与者根据对手的行动和反应轮流行动的博弈。博弈树；先发优势第三节威胁、承诺和可信性策略性行动：限制自身的行动空间从而为自己带来战略好处的行动。空头威胁；承诺和可信性第四节对进入的威慑课程的考核要求：理解重复博弈和序列博弈，掌握占优策略均衡和纳什均衡【复习思考题】 1、什么是占优策略？为什么一个上策的均衡是稳定的？ 2、上策均衡与纳什均衡的区别和联系。 3、什么是“以牙还牙”策略？为什么它是无限重复囚徒困境的理性策略？

博弈论的数学模型

博弈论的数学模型作者：竺可桢学院01混合班王大方何霈邹铭摘要博弈论现在得到了广泛的应用，涉及到人的决策问题都可以用博弈论的模型加以解释。本文首先用数学的方法表述实际生活中的博弈行为，并导出一般情况下的博弈的结果，进而讨论一些不同的外部约束条件对博弈过程的影响。我们用经济学中的垄断竞争现象作为博弈问题的一个实例，讨论生产者在不同状态下的决策，进而分析双方共谋的动机和可能性。（一）基本博弈模型的建立一, 博弈行为的表述博弈的标准式包括： 1．1．博弈的参与者。 2．2．每一个参与者可供选择的战略集。 3．3．针对所有参与者可能选择的战略组合，每一个参与者获得的利益在n人博弈中，用Si为参与者i的可以选择战略空间，其中任意一个特定的纯战略为s i，其中任意特定的纯战略为s i，s i∈Si， n元函数u i（s1，s2，……s n）, 当n个博弈者的决策为s1，s2，……s n时,表示第I各参与者的收益函数。二, 博弈的解当博弈进入一个稳定状态时，参与者选择的战略必然是针对其他参与者既定战略的最优反应，在此状态下没有人愿意单独背离当前的局势。这个局势叫纳什均衡：在n个参与者标准式博弈，G={ S1，S2，……S n；u1，u2，……u n}中，若战略组合{s1*，s2*，……s n*}满足对每一个参与者i，s i*是针对{ s1*，s2*，……s i-1*，s i+1*……s n*}的最优反应战略，，目标战略组合{s1*，s2*，……s n*}为该博弈的纳什均衡。即：u i { s1*，s2*，……s i-1*，s i*，s i+1*……s n*}≥u i { s1*，s2*，……s i-1*，s i，s i+1*……s n*}，对一切s i∈Si均成立。纳什于1950年证明在任何有限个参与者，且每个参与者可选择的纯战略为有限个的博弈中，均存在纳什均衡。（包括混合战略）混合战略指认某种概率分布来取一个战略空间中的战略，在本文中不加讨论。在一般情况中，纳什证明保证了我们的均衡分析有意义。三, 博弈实例：单阶段博弈古诺竞争在古诺竞争中，少数厂商通过改变产量来控制价格，以使他们的收益最大化。我们作如下假设： 1．1．厂商生产的商品是相同的，消费者没有对某家厂商的偏好。 2．2．市场上价格与供给量的函数为p=a-bQ，且供给增加不会导致过剩，而仅仅使价格降低，即厂商可以将生产的产品全部售出。 3．3．厂商都是理性的，即面对既定的情况都做出决策使自己利益最大化。 4．4．信息是完全的，每个厂商都知道其他厂商时理性的，且每个厂商知道别人是理性的这一事实为所有参与者的共识。（二）博弈模型的求解与讨论为了简单起见，我们从一家企业的情况做起：只有一家企业时，目标收益函数u=Q（a-bQ）针对max u 的解为Q0=a/2b，u0=a2/4b 当有两家企业时，设产量分别为Q1，Q2，则 p=a-b（Q1+Q2） u1（Q1，Q2）=p*Q1=Q[a-b（Q1+Q2）]

基于博弈论的闭环供应链定价模型分析

第40卷第2期2008年4月南　京　航　空　航　天　大　学　学　报Jou rnal of N an jing U n iversity of A eronau tics &A stronau tics V o l .40N o.2 　A p r .2008基于博弈论的闭环供应链定价模型分析王玉燕1　李帮义1　申　亮2 (1.南京航空航天大学经济管理学院,南京,210016;2.山东经济学院财政金融学院,济南,250014) 摘要:构建了基于第三方回收模式的闭环供应链定价模型,运用博弈理论分析该系统最优定价策略。研究表明:制造商与零售商、制造商与第三方回收商分别构成了Stackelberg 博弈关系,制造商只有在决策时必须分别考虑零售商、第三方回收商对自己决策的反应,才能实现自身利益最大化,反之,零售商、第三方回收商也要考虑制造商的决策才能实现自身利益的最大化。此外,该文还分析了模型结构对利润的影响。这些结果证实了闭环供应链的理论基础。关键词:供应链;博弈论;制造商;定价策略中图分类号:F 273;O 21 文献标识码:A 文章编号:100522615(2008)022******* 　基金项目:江苏省研究生科技创新基金(X M 062142)资助项目。　收稿日期:2006207206;修订日期:2006212211 　作者简介:王玉燕,女,博士研究生,1978年11月生;李帮义(联系人),男,教授,博士生导师,E 2m ail :libangyi @https://www.doczj.com/doc/4517122925.html, 。 Ana lysis on Pr ice D ec ision of Closed -L oop Supply Cha i n Ba sed on Gam e Theory W ang Y uy an 1 ,L i B angy i 1 ,S hen L iang 2 (1.Co llege of Econom ics and M anagem ent ,N anjing U niversity of A eronautics &A stronautics ,N anjing ,210016,Ch ina ; 2.F inance Institute of Shandong Econom ic U niversity ,J inan ,250014,Ch ina ) Abstract :T he clo sed 2loop supp ly chain (CL SC )p ricing m odel is con structed based on the th ird 2party take 2back m odel .T h is system is m o st superi o r fixed p rice strategy th rough gam b ling theo ry analysis .T he research indicates that m anufactu rers and retailers ,m anufactu rers and the th ird p arty take 2back bu siness con stitu te the Stackelberg gam b ling relati on s ,separately .M anufactu rers can realize their ow n benefit m ax i m izati on on ly w hen they con sider sep arately retailers and the th ird party take 2back bu siness respon se to their decisi on 2m ak ing .O ther w ise ,retailers and the th ird p arty take 2back bu siness also need to con sider m anufactu rer ’s decisi on 2m ak ing ,and they can realize their ow n benefit m ax i m izati on .In additi on ,th is p ap er also analyzes the m odel structu re fo r affecting the p rofit .R esu lts con summ ate the rati onale of CL SC . Key words :supp ly chain s ;gam e theo ry ;m anufactu rer ;p ricing decisi on 引言闭环供应链是在传统的“正向”供应链上加入逆向反馈过程(即逆向供应链[1])而形成的一个完整的供应链体系(C lo sed 2loop supp ly chain , CL SC [2] )。通过产品的正向交付与逆向回收再利用,闭环供应链使“资源—生产—消费—废弃”的开环过程变成了“资源—生产—消费—再生资源”的闭环反馈式循环过程,把经济活动对自然环境的影响程度降低到尽可能小,减少了资源的消耗,降低了产品和服务的成本。目前,一些学者对CL SC 进行了初步研究。 Gu ide ,Sam ee 探讨了CL SC 的实施方案[324] ; Su rendra 研究了CL SC 实施中的关键问题[5] ;D i m itri o s 借助计算机构建了CL SC 的仿真模型[6] ; 许志端从多方面分析了委托第三方回收商回收具有

博弈论模型

1. 囚徒困境这是博弈论中最最经典的案例了——囚徒困境，非常耐人寻味。 “囚徒困境”说的是两个囚犯的故事。这两个囚徒一起做坏事，结果被警察发现抓了起来，分别关在两个独立的不能互通信息的牢房里进行审讯。在这种情形下，两个囚犯都可以做出自己的选择：或者供出他的同伙(即与警察合作，从而背叛他的同伙)，或者保持沉默(也就是与他的同伙合作，而不是与警察合作)。这两个囚犯都知道，如果他俩都能保持沉默的话，就都会被释放，因为只要他们拒不承认，警方无法给他们定罪。但警方也明白这一点，所以他们就给了这两个囚犯一点儿刺激：如果他们中的一个人背叛，即告发他的同伙，那么他就可以被无罪释放，同时还可以得到一笔奖金。而他的同伙就会被按照最重的罪来判决，并且为了加重惩罚，还要对他施以罚款，作为对告发者的奖赏。当然，如果这两个囚犯互相背叛的话，两个人都会被按照最重的罪来判决，谁也不会得到奖赏。那么，这两个囚犯该怎么办呢？是选择互相合作还是互相背叛？从表面上看，他们应该互相合作，保持沉默，因为这样他们俩都能得到最好的结果：自由。但他们不得不仔细考虑对方可能采取什么选择。A犯不是个傻子，他马上意识到，他根本无法相信他的同伙不会向警方提供对他不利的证据，然后带着一笔丰厚的奖赏出狱而去，让他独自坐牢。这种想法的诱惑力实在太大了。但他也意识到，他的同伙也不是傻子，也会这样来设想他。所以A犯的结论是，唯一理性的选择就是背叛同伙，把一切都告诉警方，因为如果他的同伙笨得只会保持沉默，那么他就会是那个带奖出狱的幸运者了。而如果他的同伙也根据这个逻辑向警方交代了，那么，A犯反正也得服刑，起码他不必在这之上再被罚款。所以其结果就是，这两个囚犯按照不顾一切的逻辑得到了最糟糕的报应：坐牢。企业在信息化过程中需要与咨询企业、软件供应商打交道的。在与这些企业打交道的过程中，我们不可避免地也会遇到类似的两难境地，这个时候需要相互之间有足够的了解与信任，没有起码的信任做基础，切不可贸然合作。在对对方有了足够的信任之后，诚意也是必不可少的，如果没有诚意或者太过贪婪，就可能闹到双方都没有好处的糟糕情况，造成企业之间的双输。 2. 智猪博弈在博弈论（Game Theory）经济学中，“智猪博弈”是一个著名的纳什均衡的例子。假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽，另一头安装着控制猪食供应的按钮，按一下按钮会有10个单位的猪食进槽，但是谁按按钮就会首先付出2个单位的成本，若大猪先到槽边，大小猪吃到食物的收益比是 9∶1；同时到槽边，收益比是7∶3；小猪先到槽边，收益比是6∶4。那么，在两头猪都有智慧的前提下，最终结果是小猪选择等待。实际上小猪选择等待，让大猪去按控制按钮，而自己选择“坐船”(或称为搭便车)的原因很简单：在大猪选择行动的前提下，小猪也行动的话，小猪可得到1

从博弈论角度看古诺模型

博弈论知识点总结完整版

博弈论（一）：基本知识 1.1定义:博弈论，又称对策论，是使用严谨的数学模型研究冲突对抗条件下最优决策问题的理论，是研究竞争的逻辑和规律的数学分支。即，博弈论是研究决策主体在给定信息结构下如何决策以最大化自己的效用，以及不同决策主体之间的均衡。 1.2基本要素：参与人、各参与人的策略集、各参与人的收益函数，是博弈最重要的基本要素。 1.3博弈的分类：博弈论根据其所采用的假设不同而分为合作博弈理论和非合作博弈理论。两者的区别在于参与人在博弈过程中是否能够达成一个具有约束力的协议（binding agreement）。倘若不能，则称非合作博弈（Non-cooperative game）。合作博弈强调的是集体主义，团体理性，是效率、公平、公正；而非合作博弈则主要研究人们在利益相互影响的局势中如何选择策略使得自己的收益最大，强调个人理性、个人最优决策，其结果有时有效率，有时则不然。目前经济学家谈到博弈论主要指的是非合作博弈，也就是各方在给定的约束条件下如何追求各自利益的最大化，最后达到力量均衡。博弈的划分可以从参与人行动的次序和参与人对其他参与人的特征、战略空间和支付的知识、信息，是否了解两个角度进行。把两个角度结合就得到了4种博弈： a、完全信息静态博弈，纳什均衡，Nash(1950) b、完全信息动态博弈，子博弈精炼纳什均衡，泽尔腾（1965） c、不完全信息静态博弈，贝叶斯纳什均衡，海萨尼（1967-1968） d、不完全信息动态博弈，精炼贝叶斯纳什均衡，泽尔腾（1975）Kreps, Wilson(1982) Fudenberg, Tirole(1991) 1.4课程主要内容：完全信息静态博弈完全信息动态博弈不完全信息静态博弈机制设计合作博弈 1.5博弈模型的两种表示形式：策略式表述(Strategic form), 扩展式表述（Extensive form） 1.6占优均衡： a、占优策略：在博弈中如果不管其他参与人选择什么策略，一个参与人的某个策略给他带来的支付值始终高于其他策略，或至少不劣于其他策略，则称该策略为该参与人的严格占优策略或占优策略。对于所有的s-i，si*称为参与人 i的严格占优战略，如果满足： ui(si*,s-i)>ui(si',s-i) ?s-i, ?si' ?si* b、占优均衡：一个博弈的某个策略组合中，如果对应的所有策略都是各参与人的占优策略，则称该策略组合为该博弈的一个占优均衡。 1.7重复剔除严劣策略均衡： a、“严劣”和“弱劣”的含义：设s i’和s i’’是参与人i可选择的两个策略，若对其他参与人的任意策略组合s-i, 均成立 u i(s i’, s-i) < u i(s i’’, s-i), 则说策略s i’严劣于策略s i’’。上面式子中，若将“<”改为“≤”，则说策略s i’弱劣于策略s i’’。 b、定义：重复剔除严格策略就是各参与人在其各自策略集中，不断剔除严劣策略…如果最终各参与人仅剩下一个策略，则该策略组合就被称为重复剔除严劣策略均衡。（二）：纳什均衡（Nash Equilibrium） 2.1纳什均衡定义：对于一个策略式表述的博弈G={N,S i, u i,i∈N}，称策略组合s*=(s1, …s i, …, s n)是一个纳什均衡，如果对于每一个i ∈N, s i*是给定其他参与人选择s-i*={s1*, … ,s i-1*, s i+1*, … ,s n*} 情况下参与人i的最优策略（经济理性策略），即：u i(s i*, s-i*) ≥ u i(s i, s-i*), 对于任意的s i∈S i ,任意的i∈N均成立。

博弈论的应用-浅析博弈论经典模型

浅析博弈论经典模型 --囚徒困境模型及其启示一、博弈论概述博弈论又名“对策论”、“赛局理论”，属应用数学的一个分支，表示在多决策主体之间行为具有相互作用时，各主体根据所掌握信息及对自身能力的认知，做出有利于自己的决策的一种行为理论。简单说来就是一些个人或其他组织，面对一定的环境条件，在一定的规则下，同时或先后，一次或多次，从各自允许选择的行为或策略中进行选择并加以实施，各自取得相应结果的过程。由于冲突、合作、竞争等行为是现实世界中常见的现象，因此很多领域都能应用博弈论，例如军事领域、经济领域、政治外交，解决诸如战术攻防、国际纠纷、定价定产、兼并收购、投标拍卖甚至动物进化等问题。二、博弈论的基本原理从上述定义中可以看出，一个完整的博弈一般由以下几个要素组成：博弈的参加者，各博弈方各自选择的全部策略或行为的集合、博弈方的得益、结果、均衡等。 1、参与者指的是博弈中选择行动以最大化自己效用的决策主体(可以是个人，也可以是团体)。 2、行动是指参与人在博弈进程中轮到自己选择时所作的某个具体决策。 3、策略是指参与人选择行动的规则，即在博弈进程中，什么情况下选择什么行动的预先安排。 4、信息指的是参与人在博弈中所知道的关于自己以及其他参与人的行动、策略及其得益函数等知识。

5、得益是参与人在博弈结束后从博弈中获得的效用，一般是所有参与人的策略或行动的函数，这是每个参与人最关心的事情。 6、均衡是所有参与人的最优策略或行动的组合；均衡结果是指博弈结束后博弈分析者感兴趣的一些要素的集合，如在各参与人的均衡策略作用下，各参与人最终的行动或效用集合。上述要素中，参与人、行动和结果统称为博弈规则，博弈分析的目的是使用博弈规则来决定均衡。三、博弈的分类博弈的分类根据不同的标准也有不同的分类。根据参与人的多少，博弈可以分为二人博弈和多人博弈。根据参与人是否合作，博弈可以分为合作博弈和非合作博弈。合作博弈和非合作博弈的区别在于相互发生作用的当事人之间有没有一个具有约束力的协议，如果有，就是合作博弈，如果没有，就是非合作博弈。根据各方得益的不同情况，博弈可以分为零和博弈和变和博弈。零和博弈中各方利益之间是完全对立的。变和博弈有可能存在合作关系，争取双赢的局面。根据行为的时间序列性，博弈可以分为静态博弈、动态博弈。静态博弈是指在博弈中，参与人同时选择或虽非同时选择但后行动者并不知道先行动者采取了什么具体行动；动态博弈是指在博弈中，参与人的行动有先后顺序，且后行动者能够观察到先行动者所选择的行动。根据参与人对其他参与人的了解程度，博弈可以分为完全信息博弈和不完全信息博弈。完全信息博弈是指在博弈过程中，每一位参与人对其他参与人的特征、策略空间及收益函数有准确的信息。不完全信息博弈是指如果参与人对其他参与人的特征、策略空间及收益函数信息了解