第17章决策与博弈论

2023-06-27 来源：小侦探旅游网

第17章决策与博弈论

17.1 复习笔记

1．博弈论的基本概念（1）博弈及其三个要素

博弈论是在一个简化的体系里描述复杂的决策问题，这些决策问题往往涉及多个行为者，他们之间的决策相互依存，相互作用。

博弈包含三个要素：①参与者；②决策；③报酬。（2）合作与非合作博弈

如果在博弈参与者之间可形成共同计划的决策这类具有约束性的合同，那么这类博弈被称为合作性的博弈。

如果在参与者之间不能达成或实施有约束性的合同，这类博弈则被称作非合作性的博弈。

（3）主导策略（占优策略均衡）主导策略是指对某参与者而言，不管其竞争对手的反应如何，这一决策总是最优的策略。 2. 纳什均衡（1）纳什均衡

纳什均衡是指在给定对方行动的前提下可以给每个参与者都带来最佳结果的某种决策（或行动）。达到纳什均衡时，每一个博弈者都确信，在给定竞争对手策略决定的情况下，他选择了最好的策略。也就是说，给定其他人的战略，任何个人都没有积极性去选择其他战略，从而这个均衡没有人有积极性去打破。

占优策略均衡即是一种纳什均衡。占优策略均衡若存在，只存在惟一均衡，而纳什均衡可能存在多重解。

（2）最大极小决策（囚徒困境）

最大极小决策反映的是，从个人角度出发所选择的占优策略，从整体来看，却是最差的结局，即个人理性与团体理性的冲突。这一决策可以发生在不少的博弈场合，也可以解释卡特尔联盟的不稳定性。

（3）混合策略

在有些博弈中，仅采取一种决策或一种行动的“纯决策”不是最好的决策，即可能不存在纳什均衡。而以某特定的概率P选择一种行为，以1－P的概率选择另一种行为，则有可能是纳什均衡的解。这时的选择被称为混合策略。但反过来需要注意，存在混合策略均衡的博弈也有可能存在非混合策略的均衡。

3. 重复博弈重复博弈即同一个博弈被重复多次的动态博弈，它是反复不断进行的。在无限期重复博弈中，对于任何一个参与者的欺骗和违约行为，其他参与者总会有机会给予报复。所以，每一个参与者都不会采取违约或欺骗的行为，囚犯困境合作的均衡解是存在的。但在有限期重复博弈中，在博弈一开始的第1期，每个参与者就会采取欺骗或违约的不合作策略。所以，在有限期重复博弈中，囚犯困境博弈的纳什均衡是参与者的不合作。

4. 顺序博弈

顺序博弈是参与者轮换行动的博弈。分析顺序博弈要比参与者同时决策的博弈简单得多，其关键在于考虑每个参与者可能的行动及其理性的对策。

5. 威胁与承诺

行业的主导企业或者在位企业为了维护自己的地位或阻止新企业进入，往往会采用威胁或承诺的手段。

威胁通常是不付诸实际行动的，即不会改变报酬矩阵，最终往往使得发出威胁一方无法

得到好处，因而是不可信的。承诺通常需要通过实质性的行动来改变报酬矩阵，进而使得双方的决策发生变化，因而往往是可信的，但它具有较大的风险。

6. 进入障碍

在位企业非理性的名声有利于实现阻止新企业进入的目标。如果博弈是无限期重复的，现存企业的降价决策威胁是理性的。

17.2 课后习题详解

1．合作与非合作博弈的差别在哪里？举例说明。

答：在经济学中企业博弈模型可分为两种：合作性博弈与非合作性博弈。如果在博弈参与者之间可形成共同计划的决策这类具有约束性的合同，那么这类博弈被称为合作性的博弈。如果在参与者之间不能达成或实施有约束性的合同，这类博弈则被称作非合作性的博弈。合作与非合作博弈的根本差别在于是否存在合作的可能性，对于合作性博弈来说，约束性合同是可能的，而在非合作性博弈中，约束性合同是不可能的。例如，假设有一个地毯销售商与一个地毯购买者协商地毯价格。假设地毯的制作成本为100元，而购买者愿付200元购买。那么，合作博弈在这种情况下是可能的，因为只要协商的地毯价格处在101元与199元之间，这类协议会使消费的剩余与销售者的利润同时极大化，从而使双方受益。

又如，两个企业协商共同投资来发展某种新的技术，因为单个企业没有足够的资本。如果这两个企业能够协商达成具有约束力的合同，并合理分配由新技术带来的利润，结果是两个企业都受益。

2．什么是主导策略?为什么主导策略的均衡是稳定的? 答：（1）主导策略是指对某参与者而言，不管其竞争对手的反应如何，这一决策总是最优的策略。例如，企业A与B在同一市场上竞争。现在它们要决定的是，是否进行广告宣传来占有更多的市场份额。当然，每一方都认识到自己产品的销售会受到竞争对方广告宣传的影响。该博弈可能的结果如图17-1所示。有时该表被称为支付矩阵。每格中第一个数字是企业A的报酬，第二个是企业B的报酬。从该矩阵中可看出，如果两个企业都决定广告宣传，企业A的利润为10，企业B的利润为5。如果企业A做广告而企业B不作，企业A赚15,企业B的利润为零。

图17-1 广告宣传博弈的报酬矩阵

对于企业A而言，不管企业B如何运作，企业A应该做广告。具体地说，如果企业B做广告，企业A做广告时其利润为10，不做广告时其利润为6。如果企业B不做广告，企业A做广告时获得利润15，而不做广告时获利润10。这样，做广告就成为企业A的主导策略。同理，对于企业B而言，做广告也是企业B的主导策略。不管企业A如何运作，企业B因为做广告而获得的利润总是高于不做广告的利润。因此，在企业均为理性的假设条件下，该博弈的结果是这两个企业都会做广告宣传，因为两个企业都有主导策略。

（2）对于主导策略均衡而言，每一个市场参与者所做选择都是最优的，因而市场的任何一方都不愿意改变其行为，所以主导策略的均衡是稳定的。

3．解释纳什均衡的意义。纳什均衡与主导策略均衡的不同之处在哪儿? 答：（1）纳什均衡是指在给定对方行动的前提下可以给每个参与者都带来最佳结果的某

种决策(或行动)。因为没有任何参与者会背离纳什均衡，所以这些决策是稳定的。（2）纳什均衡与主导策略均衡的不同之处在于：主导策略：“不管你如何行事，我只力图使自己达到最优；你也不管我如何行事，你只力图使自己达到最优。” 纳什均衡：“在你可能如何行事的条件下，我力图使自己达到最优；在我可能如何行事的条件下，你力图使自己达到最优。”

因此，主导策略均衡是纳什均衡的一个特例。

4．纳什均衡与最大极小的解有何不同?在什么条件下最大极小的解比纳什均衡更为可能?

答：（1）纳什均衡是建立在个人理性这个基础上的。每个参与者在策略选择过程中，不仅自身是理性的，而且假定其对手也同样如此。这可能有局限性。

最大极小是指使可获得的极小收利极大化。最大极小的决策是一种比较保守的策略。有最大极小策略构成的均衡是最大极小均衡。

（2）在个人非完全理性的情况下，最大极小的解比纳什均衡解更为可能。 5．什么是“你做我也做”决策?为什么对无限重复的囚犯两难处境来说它是一种理性的策略?

答：（1）“你做我也做”决策又称“以牙还牙”策略，在价格战博弈中，“你做我也做”是指我从高价开始，如果我的竞争对手“与我合作”，我保持高价。一旦竞争对手降价，我也跟着降价。如果后来竞争对手涨价，那我也跟着涨价。“以牙还牙”策略是所有参赛策略中最简单的，这个策略一开始选择合作，然后在每一个回合选择对手在上一回合采取的策略；也就是说，如果对手在上回合选择合作，“以牙还牙”者就在这一回合也选择合作，如果对手在上一回合背叛了他，“以牙还牙”者就在这一回合以背叛相报复。

（2）在无限重复博弈中，我与我的竞争对手永远地在每月中确定价格。假定我的竞争对手知道我采用你做我也做的决策。合作行为(高价)则是理性的结果。假设某个月竞争对手采用低价决策，并占领全部的市场份额。在那个月中，它获取巨大的利润。但是它知道在下个月中，我也会降价，它的利润因此会下降，而且，由于双方削价而导致的利润下跌将会永久地延续下去。因为我们假定了这一博弈是永久性重复的，由此而引起的累积性利润损失肯定会大于任何一个月由于降价而带来的利润。显然，竞争对手在某个月的降价行为是非理性的。

事实上，在一个无限重复的博弈中，竞争对手无需确定我会采取你做我也做的决策而完全可以采用合作决策。原因是在这种博弈中，预期的合作决策带来的收益会超出由降价而带来的短暂的好处，即使我采用你做我也做这一决策的概率非常之小，其结论还是一样。

6．设一博弈，在其中囚犯两难处境会重复10次，博弈双方是理性的，并且知道所有的信息。试问“你做我也做”在该例中是不是最优策略?在什么条件下这一决策是最优的?

答：如果这一博弈的重复次数不是无限而是有限的。如果竞争对手(企业B)是理性的，并且认定我(企业A)也是理性的，那么它会有以下的判断“因为企业A采用你做我也做的策略，我(企业B)只能在最后一个月削价。这时因为博弈已经结束，企业A来不及进行报复，为此，我可以在最后一个月获得较高的利润”。为此，企业B的决策是维持高价一直到最后第二个月，但在最后一个月减价，从而获取高利润。但是，企业A同时也会预测到此种情况的发生，所以企业A在最后一个月中采取减价决策。企业B也会推出此结论，即企业A在最后一个月中减价。企业B会决定在最后第二个月减价，因为在最后一个月中不会有任何合作。当然，企业A也会设想到这一步，所以企业A也会在最后第二个月中减价。我们可以一直这样地推断下去，从中得出的唯一理性的结论就是两个企业在每个月都减价。

只要有可能这样，在时间足够长的条件下，合作便是一种好的策略。尽管竞争对手在猜测我如何决策时会有错，合作行为按预期值来算仍是有利的。在现实生活中，绝大多数的经理们并不知道他们的企业会与竞争对手竞争多长时间，这可以使得合作行为成为一种好的策略。尽管企业间的竞争月份数是有限的，但人们通常不知道具体的数目。在这种条件下，从最后一个月开始的这种推理则不再适用了。和无限重复博弈一样，你做我也做的决策是理性的。

7．假设你与竞争对手进行为图17-2所描述的定价博弈。你们双方必须同时宣布你们的价格。通过告诉你的竞争对手你会采用高价决策你能够改善你自己的地位吗?

图l7-2价格确定问题答：不能够。因为低价对于每一个市场参与者而言，都是主导策略。大家都会选择低价策略。

8．“第一行动好处”是指什么?举一个博弈例子说明首先行动的好处。答：“第一行动好处”是指企业通过率先制定价格或产量行为，从而影响其他市场参与者的行为，给自身带来更多的收益。例如，在古诺模型中，设市场需求函数为：Q=120-P，其中，Q是市场对矿泉水的需求，P是价格。假定企业A和企业B同时确定其产出qA及qB以及Q=qA+qB。利润极大化推出qA=qB=40，以及价格P=40。现假定企业A拥有首先行动的选择。在这种情况下企业A会假设企业B是在给定企业A的行动的基础上作出利润极大化的产出决策，由此企业A在决策时会考虑到这120qA一信息。因为企业A知道企业B的决策是qB=2。它便可以从市场需求函数Q=qA+qB=120-P中推出qA=120-qB-P=120-(120qAqA)-P=60+-P，为此可得出 qA=120-2P。 22120qA12060=22因此、当企业A选择生产能力为qA=60，即其边际收入为零时，即总收入为最大。由于企业A利用了第一进入市场的好处，企业B选择其产出只能是qB=30。这

时市场的总产出为90，矿泉水的价格为30元，企业A的总收入为1800元，比古诺均衡的1600元增加了200元。企业B的收入则相应地减少到900元，这是由于后进入市场所导致。

9．什么是“策略步骤”?建立某种名声是如何成为策略步骤的呢? 答：给予企业这种好处的行动在博弈论中称为策略步骤。策略步骤是通过影响他人对自己行为的预期来影响对手，从而做出有利于自己的决策。企业经常通过限制自己的步骤达到限制对手的行为。

培养起某种企业“名声”可以给予企业策略性的优势。例如，高速引擎公司为赛车汽车公司大车生产大发动机的决策。假设高速引擎公司的经理们在长时间里为他们自己树立了非理性的名声，他们威胁该汽车公司说不管你们生产什么，我们只生产大发动机。这时，无需进一步的行动，这威胁可成为可信的，因为人们不能肯定这些非理性的经理们总会作出利润极大的决策。在博弈中，被认为非理性或甚至有点蠢的参与者可能会拥有显著的优势。培养“名声”在重复性博弈中可以成为一个极为重要的决策。企业可以发现在这一博弈中作出几个非理性的决策时常会是非常有利的，它对增加企业的长期利润有着很大的用处。

10．通过价格战争的威胁是否能够阻止其他企业的进入?企业可以采取什么行动使得这一威胁成为可信的呢?

答：（1）通过价格战争的威胁未必能够阻止其他企业的进入。例如，假设企业A生产某种可以用来处理文字及具其他用途的计算机。企业B生产的计算机只能用来处理文字。图17-3表示报酬矩阵。显然，只要企业A决定高价，两个企业均可获得可观的利润。即便企业B选择低价决策，仍有许多顾客购买企业A的产品，因为它的产品具有多功能。但是当企业A选择低价时，企业B不得不选择低价，否则它的利润为零。当两个企业都选择低价时，它们的利润降低许多。企业A希望的结果是左上角的报酬。对企业B来说，它希望右上角的结果(即低价是主导策略)。为此无论哪个企业首先确定价格，右上角表示的决策是这一博弈的结果。

但是企业A是该工业的“主导”企业，因为它的价格决策对整个工业的利润有着最大的影响。那么，企业A是否能通过采用低价的威胁来迫使企业B选择高价呢?不能。如报酬矩阵图17-3所示，无论企业B采用什么决策，企业A采用低价总是不划算。为此，这种威胁是不可信的，即非实质性的。

图17-3 计算机和文字处理机的价格

（2）在有些场合下，企业可以作出实质性的威胁。培养起某种企业“名声”可以给予企业策略性的优势。这时，无需进一步的行动，这威胁可成为可信的，因为人们不能肯定这些非理性的经理们总会作出利润极大的决策。在博弈中，被认为非理性或甚至有点蠢的参与者可能会拥有显著的优势。

11．策略步骤限制某人的灵活性，却给予他以优势。为什么?举例说明。答：策略步骤是通过影响他人对自己行为的预期来影响对手，从而作出有利于自己的决策。企业经常通过限制自己的步骤达到限制对手的行为。例如，如图17-4所示的博弈，这个例子表明第一个在市场上引进新产品的企业将获最高利润。但是，哪个企业会最先引进新产品?即便两个企业需要相同的时间来引进新产品，每个企业都愿意第一个承诺生产甜早点。这里的关键词是“承诺”。如果企业A仅是口头上宣布它会生产甜早点，企业B不会为此而相信，因为企业B也有动机作出同样的声明。为此企业A必须采取限制自己的步骤，使企业B深信企业A除了生产甜早点外别无选择。企业A能采取的行动可以包括在开始生产之前，大做广告来宣传甜早点，令人相信它会生产甜早点。或者企业A可以签订合同购买大量的砂糖，并把合同公布于众，或至少让企业B知道这一合同。在此最重要的是企业A已承诺将会生产甜早点。承诺是一种策略步骤，它迫使企业B选择企业A想要它作出的决策：生产脆早点。

为什么企业A不能简单地威胁企业B，如果说企业B生产甜早点，它也一定会生产同种产品呢?因为企业B没有任何理由会相信这种威胁。事实上，企业B也可以作出一样的威胁。只有当威胁是可信时，它才是有用的。

图17-4 修改过的产品选择问题

因篇幅问题不能全部显示，请点此查看更多更全内容

查看全文

全部栏目

第17章 决策与博弈论

第17章决策与博弈论