如何用博弈论圈套识破别人的圈套

点击联系发帖人 时间：2011-10-14 18:48

博弈论圈套

3.1K186 条评论分享收藏感谢收起赞同 12K1,050 条评论分享收藏感谢收起如何用博弈论识破别人的圈套_百度知道
如何用博弈论识破别人的圈套
如何用博弈论识破别人的圈套...
如何用博弈论识破别人的圈套
答题抽奖
首次认真答题后
即可获得3次抽奖机会，100%中奖。
★虎年顽童★
★虎年顽童★
获赞数：11
为你推荐：
其他类似问题
您可能关注的内容
个人、企业类
违法有害信息,请在下方选择后提交
色情、暴力
我们会通过消息、邮箱等方式尽快将举报结果通知您。1.5K60 条评论分享收藏感谢收起赞同 26219 条评论分享收藏感谢收起如何用博弈论识破别人的圈套_百度知道
如何用博弈论识破别人的圈套
如何用博弈论识破别人的圈套...
如何用博弈论识破别人的圈套
答题抽奖
首次认真答题后
即可获得3次抽奖机会，100%中奖。
在和别人谈判的时候,如何识破别人话中隐藏的阴谋? FBI阅人术（书摘）第一次和陌生人见面时，如何在一开始谈话的几分钟内，了解这个人？如何和对方观察
对比我抄来的O(∩_∩)O~
为你推荐：
其他类似问题
您可能关注的内容
个人、企业类
违法有害信息,请在下方选择后提交
色情、暴力
我们会通过消息、邮箱等方式尽快将举报结果通知您。13博弈论与生活中的经济学(2010年)_伤城文章网
博弈论与经济学思维兰州大学管理学院贾明琪1一、介绍博弈论?（一）概念，什么是博弈论 1．概念：博弈论ＧａｍｅＴｈｅｏｒｙ，又称对策论，是使用严谨的数学模型研究冲突对抗条件下最优决策问题的理论，是研究竞争的逻辑和规律的数学分支。简单地说，博弈论是研究决策主体在给定信息结构下如何决策以最大化自己的效用，以及不同决策主体之间决策的均衡。2张维迎的定义?“博弈论是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题的”也就是说，当一个主体，好比说一个人或一个企业的选择受到其他人、其他企业选择的影响，而且反过来影响到其他人、其他企业选择时的决策问题和均衡问题。所以在这个意义上说，博弃论又称为 “对策论”.3博弈论（ game theory) 是由美国数学家冯? 诺依曼(Von. Neumann)和经济学家摩根斯坦 (Morgenstern) 于 1944 年创立的带有方法论性质的学科，它被广泛应用于经济学、人工智能、生物学、火箭工程技术、军事及政治科学等。 1994年，三位博弈论专家即数学家纳什(Nash，他的故事被好莱坞拍成电影《美丽心灵》，该影片获得了2002年奥斯卡金像奖的四项大奖)、经济学家海萨尼（ Harsanyi ）和泽尔滕（ Selten ）因在博弈论及其在经济学中的应用研究上所作出巨大贡献而获得诺贝尔经济学奖。41996 年，两位将博弈论应用于不对称信息下机制设计的经济学家莫里斯 (Mirrlees) 和维克里 (Vickrey) 、以及 2001 年三位经济学家阿克洛夫 (Akerlof) 、斯蒂格利茨(Stiglitz)和斯宾塞(Spence)因运用博弈论研究信息经济学所取得的成就而成为这两个年度的诺贝尔经济学奖得主。专家预计，近几年还会有更多的博弈论专家可能获得诺贝尔经济学奖。5为什么博弈论在经济学领域会产生如此大的影响呢？这是因为博弈论从一个独特的视角帮助我们更加深刻地理解和把握经济现象，并指导更加有效的经济政策制订。6博弈论是一门十分有趣但理论上又是十分艰深的学问，我今天打算用一些大家能够凭直观或简单分析就能把握的例子为大家介绍博弈论的基本概念及应用，以引起大家对这门目前已成为热门科学的兴趣和获得初步的了解。这些例子也是我们在日常生活中经常所遇到的问题或观察到的现象，通过博弈论，我们能够更加深刻地理解它们。7(一)什么是博弈论：从“囚徒困境”谈起??囚犯困境（Prisoner`s dilemma）囚犯困境是指这样一种情形，此时两个人（或厂商）合作要比不合作好，但是每个人都觉得不合作符合他的利益，因此每个人的状况都要坏于如果他们合作时的境况。8?囚犯困境（PrisonDilemma）是博弈论的非零和博弈中具代表性的例子，反映个人最佳选择并非团体最佳选择。虽然困境本身只属模型性质，但现实中的价格竞争、环境保护等方面，也会频繁出现类似情况。单次发生的囚徒困境，和多次重复的囚徒困境结果不会一样。 ? 在重复的囚徒困境中，博弈被反复地进行。因而每个参与者都有机会去“惩罚”另一个参与者前一回合的不合作行为。这时，合作可能会作为均衡的结果出现。欺骗的动机这时可能被受到惩罚的威胁所克服，从而可能导向一个较好的、合作的结果。作为反复接近无限的数量，纳什均衡趋向于帕累托最优。 ? 囚犯困境的主旨为，囚犯们虽然彼此合作，坚不吐实，可为全体带来最佳利益（无罪开释），但在资讯不明的情况下，因为出卖同伙可为自己带来利益（缩短刑期），也因为同伙把自己招出来可为他带来利益，因此彼此出卖虽违反最佳共同利益，反而是自己最大利益所在。但实际上，执法机构不可能设立如此情境来诱使所有囚犯招供，因为囚犯们必须考虑刑期以外之因素（出卖同伙会受到报复等），而无法完全以执法者所设立之利益（刑期）作考量。 9? ?经典的囚徒困境 1950年，由就职於兰德公司的梅里尔? 弗勒德（Merrill Flood）和梅尔文? 德雷希尔（Melvin Dresher）拟定出相关困境的理论，後来由顾问艾伯特? 塔克（Albert Tucker）以囚徒方式阐述，并命名为「囚徒困境」。经典的囚徒困境如下：10(一)什么是博弈论：从“囚徒困境”谈起1. 囚徒困境两个小偷甲和乙联手作案，私入民宅被警方逮住但未获证据。警方将两人分别Z于两间房间分开审讯，政策是若一人招供但另一人未招，则招者立即被释放，未招者判入狱10年；若二人都招则两人各判刑8年;若两人都不招则未获证据但因私入民宅各拘留1年。11表1 囚徒困境博弈乙招不招 0,-10 -1,-1招甲不招-8,-8 -10,0（问题1：甲、乙如何选择？）12??关于案例，显然最好的策略是双方都抵赖，结果是大家都只被判1年。但是由于两人处于隔离的情况，首先应该是从心理学的角度来看，当事双方都会怀疑对方会出卖自己以求自保、其次才是亚当?斯密的理论，假设每个人都是“理性的经济人”，都会从利己的目的出发进行选择。这两个人都会有这样一个盘算过程：假如他坦白，我抵赖，得坐10年监狱，坦白最多才8年；他要是抵赖，我招，就可以被释放，而他会坐10年牢。综合以上几种情况考虑，不管他坦白与否，对我而言都是坦白了划算。两个人都会动这样的脑筋，最终，两个人都选择了坦白，结果都被判8年刑期。13??基于经济学中Rational agent的前提假设，两个囚犯符合自己利益的选择是坦白招供，原本对双方都有利的策略不招供从而均被释放就不会出现。这样两人都选择坦白的策略以及因此被判8年的结局，纳什均衡”首先对亚当?斯密的“看不见的手”的原理提出挑战：按照斯密的理论，在市场经济中，每一个人都从利己的目的出发，而最终全社会达到利他的效果。但是我们可以从“纳什均衡”中引出“看不见的手”原理的一个悖论:从利己目的出发,结果损人不利己,既不利己也不利他。14尽管甲不知乙是否招供，但他认为自己选“招”最好，因而甲会选择 “招”，乙也同样会选择“招”，结果各判8年；但若两人都不招，结果是两人只被判1年，但这种结果是不会出现的。我们可以运用“剔除劣战略”的方法来获得这样的结果。15甲或乙可以作出的选择被称为“战略”，如“招”或“不招”都是战略。16对甲来说，尽管他不知道乙是选择了“招”还是“不招”，他发现他自己选择“招” 都是比选择“ 不招 ” 为好的。因此， “不招”是相对于“招”的劣战略，他不会选择劣战略。所以，甲会选择 “招”。同样，根据对称性，乙也会选择 “招”，结果是甲乙两人都“招”。17甲和乙是参与博弈的人，称为“局中人”。表1中每一个小方格内的数字被称为局中人的支付，其中左边的数字代表甲的支付，右边的是乙的支付。表1中的双变量矩阵称为博弈支付矩阵。局中人所选择的战略构成的组合（招,招）被称为博弈均衡。这个组合中前后两个战略分别表示甲和乙所选择的战略。18表1 囚徒困境博弈乙招招甲不招-8,-8 -10,0不招0,-10 -1,-119甲和乙都不会选择劣战略“不招”，称为“剔除劣战略的占优战略均衡”。其中“招”是占优于(优于)“不招”的占优战略。20囚徒困境说明了什么??在（坦白、坦白）这个组合中，Ａ和Ｂ都不能通过单方面的改变行动增加自己的收益，于是谁也没有动力游离这个组合，因此这个组合是纳什均衡，也叫非合作均衡。囚徒困境反映了个人理性和集体理性的矛盾。如果Ａ和Ｂ都选择抵赖，各判刑１年，显然比都选择坦白各判刑８年好得多。当然，Ａ和Ｂ可以在被警察抓到之前订立一个&攻守同盟&，但是这可能不会有用，因为它不构成纳什均衡，没有人有积极性遵守这个协定,显然最好的策略是双方都抵赖.21囚徒困境的意义?“囚徒的两难选择”有着广泛而深刻的意义。个人理性与集体理性的冲突，各人追求利己行为而导致的最终结局是一个“纳什均衡”，也是对所有人都不利的结局。他们两人都是在坦白与抵赖策略上首先想到自己，这样他们必然要服长的刑期。只有当他们都首先替对方着想时，或者相互合谋 (串供)时，才可以得到最短时间的监禁的结果。22对经典经济学的冲击???“纳什均衡”首先对亚当? 斯密的“看不见的手” 的原理提出挑战。按照斯密的理论，在市场经济中，每一个人都从利己的目的出发，而最终全社会达到利他的效果。《国富论》：“通过追求(个人的)自身利益，他常常会比其实际上想做的那样更有效地促进社会利益。” 从“纳什均衡”我们引出了“看不见的手”的原理的一个悖论：从利己目的出发，结果损人不利己，既不利己也不利他。两个囚徒的命运就是如此。从这个意义上说，“纳什均衡”提出的悖论实际上动摇了西方经济学的基石。23怎么看待这个问题?二者是对立统一的，范围不同，在非竞争环境中效率会受到损失；在完全竞争条件下，边际利润等于边际成本，达到效率24NASH均衡条件下的行为规则?合作是有利的“利己策略”。但它必须符合以下黄金律：按照你愿意别人对你的方式来对别人，但只有他们也按同样方式行事才行。所谓“己所不欲勿施于人”。但前提是人所不欲勿施于我。25Nash equilibrium??纳什均衡，Nash equilibrium ,又称为非合作博弈均衡，是博弈论的一个重要术语，以约翰?纳什命名。约翰?纳什1948年作为年轻数学博士生进入普林斯顿大学。其研究成果见于题为《非合作博弈》（1950）的博士论文。该博士论文导致了《n人博弈中的均衡点》（1950）和题为《非合作博弈》（1951）两篇论文的发表。纳什在上述论文中，介绍了合作博弈与非合作博弈的区别。他对非合作博弈的最重要贡献是阐明了包含任意人数局中人和任意偏好的一种通用解概念，也就是不限于两人零和博弈。该解概念后来被称为纳什均衡。26纳什均衡定义??假设有n个局中人参与博弈，给定其他人策略的条件下，每个局中人选择自己的最优策略（个人最优策略可能依赖于也可能不依赖于他人的战略），从而使自己利益最大化。所有局中人策略构成一个策略组合（Strategy Profile）。纳什均衡指的是这样一种战略组合，这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下，没有人有足够理由打破这种均衡。纳什均衡，从实质上说，是一种非合作博弈状态。27哲学思考?如果参与人事前达成一个协议，在不存在外部强制的情况下，每个人都有积极性遵守这个协议，这个协议就是纳什均衡。28Bargaining问题的普遍性?? ??? ? ? ? ?几乎所有的交易都涉及讨价还价：买卖双方之间；雇员与顾主之间；合伙人之间；竞争企业之间夫妻之间；政治领域之间；中央政府与地方政府；国家之间；29所有讨价还价的共同之处?????达成某种协议是当事人的共同利益，但他们之间在究竟达成哪一个协议的问题上存在利益冲突；协议的多重行可能阻止任何协议的出现；典型的“合作与竞争”问题；合作意味着存在着帕累托改进，但不同的当事人偏好不同的帕累托状态。不同与集体选择（唯一均衡）和其他多重均衡；不是零和博弈。30寻找纳什均衡C1 R1 100，100 50，0 0，300 C2 C3 50，101 60，0 200，2000，01，1 0，0R2R331纳什均衡：举例?广告博弈战略做广告企业2做广告不做广告 4，4 15，1 10，10企业1不做广告 1，15?纳什均衡：（做广告，做广告）32利用纳什均衡寻租??考虑股票市场融资的例子：设想企业价值是 100，现在发行的流通股为100股，每股价值1 元。现在假定经理想筹集100元，投资价值只有50元。有人买新股吗？假定每一股配4股，价格为0.25元。如果股东不接受配股：原来一股1元的价值就变成0.3元（=150/500）；如果接受配股，他持有的股票的价值是1.5元；因为配股的成本是1元，所以他的最优选择是接受配股。33所有权配置与等级结构?考虑团队生产：让其中的一个人变成所有者工作偷懒工作偷懒6，68，00，82，234纳什均衡与学习过程 q2R1NER2 q1 35双寡头竞争：Cournot博弈? ?? ?两个企业同时选择产量，价格由市场决定； P(Q) ? a ? (q1 ? q2 ) 假定需求函数为 q1 q2 为企业2的产其中为企业1的产量，量 C(qi ) ? ci qi 假定成本函数为：那么，利润函数为： ? ? q P(Q) ? cq ? q (a ? q ? q ? c)1 1 1 1 1 2? 2 ? q2 P(Q) ? cq2 ? q2 (a ? q1 ? q2 ? c)36双寡头竞争（续）?企业最大化利润的一阶条件为：a ? c q2 q1 ? R1 (q2 ) ? ? 2 2 a ? c q1 q2 ? R2 (q2 ) ? ? 2 2NE 1?纳什均衡产量： q ?qNE 2a?c ? 3( a ? c) 2 ? 937?NE NE 纳什均衡利润为 ?1 ? ?2垄断产量和垄断利润?垄断企业的目标函数：? M ? QP(Q) ? Qc ? Q(a ? Q ? c)?垄断产量：垄断利润： ?a?c QM ? 2M?(a ? c) ? 4238划拳博弈老虎老虎鸡虫杠子 0，0 -1，1鸡1，-1 0，0虫0，0 1，-1杠子-1，1 0，0 1，-1 0，00，0 1，-1-1，10，00，0 -1，139混合战略纳什均衡?有些博弈没有“纯战略”纳什均衡，但有混合战略纳什均衡，如监督博弈。偷懒监督不监督 1，－1 －2，3 不偷懒－1，2 2，2给定工人偷懒，老板的最优选择是监督；给定老板监督，工人的最优选择是不偷懒；给定工人不偷懒，老板的最优选择是不监督；给定老板不监督，工人的最优选择是偷懒；如此循环。40纳什均衡的存在性问题??每一个有限博弈至少存在一个纳什均衡（纯战略或混合战略）；如果一个博弈存在两个纯战略纳什均衡，那么，一定存在第三个混合战略纳什均衡。41风险与均衡?由于纳什均衡要求理性共识和一致预期，当人们可能犯小小的错误时，纳什均衡不一定被选择。如下面这个博弈中，多数人将选择“下” 而不是“上”。左上下 8, 10右-1000,97, 66, 5只要B有千分之一的概念错误地选择右， A将选择下；如果B怀疑 A怀疑自己可能犯错误， B将选择右。所以，出现的不是纳什均衡42有问题的纳什均衡？C1 R1 C2 C3 0，2 3，2 2，22，21，3 2，03，12，2 2，3R2R343纳什均衡的重要影响????纳什均衡理论奠定了现代主流博弈理论和经济理论的根本基础，正如克瑞普斯（Kreps，1990）在《博弈论和经济建模》一书的引言中所说， “在过去的一二十年内，经济学在方法论以及语言、概念等方面，经历了一场温和的革命，非合作博弈理论已经成为范式的中心??在经济学或者与经济学原理相关的金融、会计、营销和政治科学等学科中，现在人们已经很难找到不懂纳什均衡能够‘消费’近期文献的领域。”纳什均衡的重要影响可以概括为以下六个方面（1）改变了经济学的体系和结构。非合作博弈论的概念、内容、模型和分析工具等，均已渗透到微观经济学、宏观经济学、劳动经济学、国际经济学、环境经济学等经济学科的绝大部分学科领域，改变了这些学科领域的内容和结构，成为这些学科领域的基本研究范式和理论分析工具，从而改变了原有经济学理论体系中各分支学科的内涵。（2）扩展了经济学研究经济问题的范围。原有经济学缺乏将不确定性因素、变动环境因素以及经济个体之间的交互作用模式化的有效办法，因而不能进行微观层次经济问题的解剖分析。纳什均衡及相关模型分析方法，包括扩展型博弈法、逆推归纳法、子博弈完美纳什均衡等概念方法，为经济学家们提供了深入的分析工具。（3）加强了经济学研究的深度。纳什均衡理论不回避经济个体之间直接的交互作用，不满足于对经济个体之间复杂经济关系的简单化处理，分析问题时不只停留在宏观层面上而是深入分析表象背后深层次的原因和规律，强调从微观个体行为规律的角度发现问题的根源，因而可以更深刻准确地理解和解释经济问题。44???（4）形成了基于经典博弈的研究范式体系。即可以将各种问题或经济关系，按照经典博弈的类型或特征进行分类，并根据相应的经典博弈的分析方法和模型进行研究，将一个领域所取得的经验方便地移植到另一个领域。（5）扩大和加强了经济学与其他社会科学、自然科学的联系。纳什均衡之所以伟大，就因为它普通，而且普通到几乎无处不在。纳什均衡理论既适用于人类的行为规律，也适合于人类以外的其他生物的生存、运动和发展的规律。纳什均衡和博弈论的桥梁作用，使经济学与其他社会科学、自然科学的联系更加紧密，形成了经济学与其他学科相互促进的良性循环。（6）改变了经济学的语言和表达方法。在进化博弈论方面相当有造诣的坎多利（Kandori，1997）对保罗?萨缪尔森（Paul Samuelson）的名言“你甚至可以使一只鹦鹉变成一个训练有素的经济学家，因为它必须学习的只有两个词，那就是‘供给’和‘需求’”，曾做过一个幽默的引申，他说，“现在这只鹦鹉需要再学两个词，那就是 ‘纳什均衡’”。 453．博弈论的要素?博弈论的提法可能太过于学术化，容易让人们退避三舍。其实它有一个非常通俗的名字--游戏理论（博弈论的英文名字叫做&ＧａｍｅＴｈｅｏｒｙ&，如果直译，就是&游戏理论&）。博弈论在我国还有一个名字，叫对策论。这些名字都很好理解，博弈字面意思就是赌博、下棋，赌博和下棋当然是游戏了，赌博和下棋的时候常常要千方百计地应付对手，自然是要讲究对策了。46参与人 players??一个博弈中的决策主体，他的目的是通过选择行动（或战略）以最大化自己的支付（效用水平）。参与人可能是自然人，也可能是团体，如企业，国家等。重要的是：每个参与人必须有可供选择的行动和一个很好定义的偏好函数。不做决策的被动主体只能被当作环境参数。47虚拟参与人pseudo-player??为了分析方便，自然nature被当作虚拟参与人。自然代表决定外生随机变量的概率分布的机制。比如房地产开发中市场需求的大小。48行动 ACTIONS OR MOVES参与人在博弈的某个时点的决策变量。（坦白） ? N个参与人的行动的有序集称为行动组合（坦白，抵赖）。?49行动的顺序??对于博弈的结果非常重要。有关静态和动态博弈的区分就是基于行动的顺序做出的。同样的行动集合，行动的顺序不同，每个参与人的最有决策就不同，博弈的结果也不同。尤其在不完全信息博弈中，后行动者依赖观察先行动者的行动来获取信息。50信息 information??参与人有关博弈的知识，特别是有关自然的选择，其他参与人的特征和行动的知识。完美信息perfect information:指一个参与人对其他参与人的行动选择有准确的理解，即每个信息集只包含一个值。51共同知识common knowledge?所有参与人知道每一步的信息集。52战略strategies????参与人在给定信息集的情况下的行动规则，它规定参与人在什么时候选择什么行动。战略与行动：战略是行动的规则而不是行动本身。在静态博弈中，战略和行动是相同的。战略必须是完备的，要给出参与人在每一种可想象得到的情况下的行动选择。53支付payoff（效用utility）?在一个特定的战略组合下参与人得到的确定效用水平，或是指参与人得到的期望效用水平。54均衡equilibrium?指所有参与人的最优战略的组合。55（二）历史沿革???犹太法典(Talmud)中一个男人如何将死后的财产发给三个妻子的难题 . 博弈理论开始于1944年由冯? 诺依曼（Von Neumann）和摩根斯坦恩（Morgenstern）合作的《博弈论和经济行为》（The Theory of Games and Economic Behaviour）一书的出版。２０世纪５０年代以来，纳什、泽尔腾、海萨尼等人使博弈论最终成熟并进入实用。56三位大师主要的贡献?1950年和1951年纳什的两篇关于非合作博弈论的重要论文，彻底改变了人们对竞争和市场的看法。他证明了非合作博弈及其均衡解，并证明了均衡解的存在性，即著名的纳什均衡。从而揭示了博弈均衡与经济均衡的内在联系。因为在现实世界中，非合作博弈要比合作博弈普遍得多。57??传统经济学对非合作博弈是以亚当斯密的看不见的手来解释的。他的这项理论工作使得博弈论从此成为经济学家用来分析商业竞争到贸易谈判种种现象的有力工具。 Tucker于1950年定义了“囚徒困境” （prisoners’dilemma）。他们两个人的著作基本上奠定了现代非合作博弈论的基石。到50年代，合作博弈发展到鼎盛期，包括纳什（1950）和夏普里（Shanley，1953）的“讨价还价”模型，Gillles和 Shanley（1953）关于合作博弈中的“核”（core）的概念，以及其他一些人的贡献。58Selten and Harsanyi?泽尔腾（1965）将纳什均衡的概念引入了动态分析，提出了“精炼纳什均衡”概念；以及进一步刻画不完全信息动态博弈的“完备贝叶斯纳什均衡”?而海萨尼则发展了刻画不完全信息静态博弈的“贝叶斯纳什均衡”（1967 －1968）。总之，他俩进一步将纳什均衡动态化，加入了接近实际的不完全信息条件。他们的工作为后人继续发展博弈论，提供了基本思路和模型 59（三）分类和主要思想??博弈论根据其所采用的假设不同而分为合作博弈理论和非合作博弈理论。两者的区别在于参与人在博弈过程中是否能够达成一个具有约束力的协议。倘若不能，则称非合作博弈?Ｎｏｎ－ＣｏｏｐｅｒａｔｉｖｅＧａｍｅ?。合作博弈强调的是集体主义，团体理性 ?ＣｏｌｌｅｃｔｉｖｅＲａｔｉｏｎａｌｉｔｙ?，是效率、公平、公正；60非合作博弈?而非合作博弈则主要研究人们在利益相互影响的局势中如何选择策略使得自己的收益最大，强调个人理性、个人最优决策，其结果是有时有效率，有时则不然。目前经济学家谈到博弈论主要指的是非合作博弈，也就是各方在给定的约束条件下如何追求各自利益最大化，最后达到力量均衡。61例子?比如两家企业Ａ、Ｂ合作建设一条ＶＣＤ的生产线，协议由Ａ方提供生产ＶＣＤ的技术，Ｂ方则提供厂房和设备。在对技术和设备进行资产评估时就形成非合作博弈，因为每一方都试图最大化己方的评估值，这时Ｂ方如果能够获得Ａ方关于技术的真实估价或参考报价这类竞争情报，则可以使自己在评估中获得优势；同理，Ａ方也是一样。至于自己的资产评估是否会影响合作企业的总体运行效率这样的&集体利益&，则不会非常重视。这就是非合作博弈，参与人在选择自己的行动时，优先考虑的是如何维护自己的利益。62顺序和信息?博弈论非常强调时间和信息的重要性，认为时间和信息是影响博弈均衡的主要因素。在博弈过程中，参与者之间的信息传递决定了其行动空间和最优战略的选择；同时，博弈过程中始终存在一个先后问题?Ｓｅｑｕｅｎｃｅ?Ｏｒｄｅｒ?，参与人的行动次序对博弈最后的均衡有直接的影响。63分类?博弈的划分可以从参与人行动的次序和参与人对其它参与人的特征、战略空间和支付的知识、信息，是否了解两个角度进行。把两个角度结合就得到了４种博弈：完全信息静态博弈，完全信息动态博弈，不完全信息静态博弈，不完全信息动态博弈64博弈的分类及对应的均衡静态完全信息完全信息静态博弈；纳什均衡； Nash(1950) 不完全信息静态博弈；贝叶斯纳什均衡；海萨尼（）动态完全信息动态博弈；子博弈精炼纳什均衡；泽尔腾（1965）不完全信息动态博弈，精炼贝叶斯纳什均衡；泽尔腾（1975） Kreps,Wilson(1982), Fudenberg,Tirole(1991) 65不完全信息主要思想??博弈论并不是经济学的一个分支，它只是一种方法，这也是为什么许多人将其看成数学的一个分支的缘故。博弈论已经在政治、经济、外交和社会学领域有了广泛的应用，它为解决不同实体的冲突和合作提供了一个宝贵的方法。在对参与者行为研究这一点上，博弈论和经济学家的研究模式是完全一样的。经济学越来越转向人与人关系的研究，特别是人与人之间行为的相互影响和相互作用，人与人之间利益和冲突、竞争与合作，而这正是博弈论的研究对象。66我们从博弈中学习什么?博弈论告诉人们，要学会理解他人都有自己的思想，每个个体都是理性的，所以必须了解竞争对手的思想。商业关系被认为是一种相互作用。但博弈论并不是疗法，并不是处方，它并不告诉你该付多少钱买东西，这是计算机或者字典的任务。博弈论只是提供一些关系的例证，一些有用的解决问题的方法。这种思维方法也许是企业家应该学习的。对于经济学家，也许需要学习它的理论模型，它的实验方式67对博弈论的两种极端评价???从20世纪70年代末期，学者们逐渐形成一个共识，当一个人或群体与他或他们的博弈论对手都能以理性的方式做出决策行为的时候，那就是博弈论大显身手的场合。有人将博弈论比作Mendel的遗传理论和Darwin的自然选择对生物学的影响，或者Newton的天体力学对物理学的奠基作用。真正的社会并不严格是博弈论的理想对象，无论是股票市场上的投机现象，还是受制于传统文化的惯性影响下的体制选择。如同混沌动力系统理论带给人们的初始兴奋之后，博弈论并不具有有历史上像物理学中理论的预测能力。68四.博弈论与运筹学??运筹学是近代应用数学的一个分支，主要是将生产、管理等事件中出现的一些带有普遍性的运筹问题加以提炼，然后利用数学方法进行解决。前者提供模型，后者提供理论和方法。运筹学本身也在不断发展，现在已经是一个包括好几个分支的数学部门了。比如：数学规划（又包含线性规划；非线性规划；整数规划；组合规划等）、图论、网络流、决策分析、排队论、可靠性数学理论、库存论、对策论、搜索论、模拟等等。69数学规划?数学规划的研究对象是计划管理工作中有关安排和估值的问题，解决的主要问题是在给定条件下，按某一衡量指标来寻找安排的最优方案。它可以表示成求函数在满足约束条件下的极大极小值问题。70排队论?排队论是运筹学的又一个分支，它有叫做随机服务系统理论。它的研究目的是要回答如何改进服务机构或组织被服务的对象，使得某种指标达到最优的问题。比如一个港口应该有多少个码头，一个工厂应该有多少维修人员等71搜索论?搜索论是由于第二次世界大战中战争的需要而出现的运筹学分支。主要研究在资源和探测手段受到限制的情况下，如何设计寻找某种目标的最优方案，并加以实施的理论和方法。在第二次世界大战中，同盟国的空军和海军在研究如何针对轴心国的潜艇活动、舰队运输和兵力部署等进行甄别的过程中产生的。搜索论在实际应用中也取得了不少成效，例如二十世纪六十年代，美国寻找在大西洋失踪的核潜艇“打谷者号”和“蝎子号”，以及在地中海寻找丢失的氢弹，都是依据搜索论获得成功的。72五、完全信息动态博弈???纳什均衡的问题：多均衡、单选择性（静态性），不可置信威胁的存在性（市场进入博弈）泽尔腾剔除了不可置信威胁战略，减少了纳什均衡的个数扩展型表述的要素：参与人、参与人行动的时点、行动集合、信息，支付函数73子博弈精炼纳什均衡?? ?当参与人的战略在每一个子博弈中都构成纳什均衡。每一个子博弈都是最优的。城市姑娘爱上农村小伙子导致姑娘父亲的反应。承诺行动（commitment),当事人使自己威胁战略变得可信的行为。74例子（要挟诉讼，曾诺行动与精炼均衡的关系）?成功可能性非常小，目的是希望和解得 P 指控到补偿。不指控（0，0) 拒绝起诉 P 放弃 (-C,0) 75 P 要求S D 接受 (S-C,-S)(TX-P-C,-TX-D)??原告指控的目的本身意味着TX&P,原告将选择放弃。子博弈精炼纳什均衡是：原告选择（不指控，要求，放弃），被告选择（拒绝）；均衡结果为原告不指控。承诺行为，如果原告将P提前支付，TXC-P&-C-P,只要胜诉的可能大于0，原告将起诉。如果S&TX+D,被告将接受原告的赔偿请求。S的范围（TX,TX+D),赔偿结果为TX+D/276?如果TX+D/2&C+P,原告提起诉讼；即使 TX&C+P,由于D值大， TX+D/2&C+P仍有可能。（ TX+D/2-C-P，-TX-D/2）案件私了。77不完全信息静态博弈??不了解对方的偏好、战略空间及各种战略组合下的利润水平。市场进入博弈在位者默许斗争高成本 -10，0 -10，140 低成本 0，300 0，400 78 进入者40，50 30，100 0，300 不进入 0，400进入海萨尼转换?? ? ??引入虚拟参与人“自然” 在所有后果间是无差异的。自然的选择提供了被选择的参与人真实类型的概率分布。分布函数是共同知识。 “不完全信息”转换为“完全但不完美信息”79贝叶斯纳什均衡Bayesian equilibrium??给定自己的类型和对方类型的概率分布的情况下，每个参与者的期望效用达到了最大化，没有人有积极性选择其他战略的类型战略依存组合。期望利润=40x+(-10)(1-x)80不完全信息动态博弈 -----精炼贝叶斯纳什均衡?? ?垄断限价模型（低成本价格与高成本价格透露的信息）信号传递模型成本的信息含量81求爱博弈???如果男人是柳下惠，女人穿少的时候他会看的概率是20%；如果男人是登徒子，女人穿少的时候他会看的概率是100%。女人根据现有的信息判断男人是柳下惠的概率为70%，因此女人估计自己穿少的时候，男人看的概率为： 0.7*0.2+0.3*1=0.44 这是女人给定男人所属类型的先验概率下，男人可能采取看的概率。82续当男人的确看了的时候，使用贝叶斯法则，根据男人看的这一行动，女人认为男人是柳下惠的概率变为： 0.7*0.2/0.44=0.32?根据这一新的概念，女人估计自己穿少的时候男人会刊的概率为： 0.32*0.2+0.68*1=0.744 如果女人将这种行为再重复一次，男人又看了，则女人认为男人是柳下惠的概率变为：83?0.32*0.2/0.744=0.086这样女人通过男人一次次的看的行为，越来越认为男人是登徒子而不是柳下惠。这就是参与人行为传递信息的作用。84（二）应用与分析?我们可以利用这个道理来分析日常生活中的许多不合作现象。852. 生活中的“囚徒困境”例子例子1 商家价格战出售同类产品的商家之间本来可以通过共同将价格维持在高位而获利，但实际上却是相互杀价，结果都赚不到钱。当一些商家共谋将价格抬高，消费者实际上不用着急，因为商家联合维持高价的垄断行为一般不会持久，可以等待垄断的自身崩溃，价格就会掉下来。86?譬如，2000年我国几家生产彩电的大厂商合谋将彩电价格维持高位，他们搞了一个“彩电厂家价格自律联盟”，并在深圳举行了由多家彩电厂商首脑参加的“彩电厂商自律联盟高峰会议”。当时，国家有关部门还未出台相关的反垄断法律，对于这种在发达国家明显属于违法行为的所谓“自律联盟”，国家在法律上暂时还是无能为力的。寡头厂商在光天化日之下进行价格合谋，并且还通过媒体大肆炒作，这在发达国家是不可思议的。87?但是，尽管政府当时无力制止这种事情，公众也不必担心彩电价格会上涨。这是因为，“彩电厂商自律联盟”只不过是一种“囚徒困境”，彩电价格不会上涨。在高峰会议之后不到二周，国内彩电价格不是上涨而是一路下跌。这是因为厂商们都有这样一种心态：无论其他厂商是否降价，我自己降价是有利于自己的市场份额扩大的。88几个例子?? ??1.囚徒困境在经济学和生活中的例子中东石油输出国 OPEC限产几乎所有的卡特尔都会遭到失败，原因就在于卡特尔的协定（类似囚犯的攻守同盟）不是一个纳什均衡，没有成员有兴趣遵守。那么是不是不可能有卡特尔合作成功了？理论上，如果是无限期的合作，双方考虑长远利益，他们的合作是会成功的。但只要是有限次的合作，合作就不会成功。比如合作１０次，那么在第九次博弈参与人就会采取不合作态度----参与者效用多重性，漂亮女生89价格战?? ?厂家价格大战的结局也是一个“纳什均衡”，而且价格战的结果是谁都没钱赚。因为博弈双方的利润正好是零。竞争的结果是稳定的，即是一个“纳什均衡”。这个结果可能对消费者是有利的，但对厂商而言是灾难性的。所以，价格战对厂商而言意味着自杀。引伸出两个问题，一是竞争削价的结果或“纳什均衡” 可能导致一个有效率的零利润结局。二是如果不采取价格战，作为一种敌对博弈论 (rivalry game)其结果会如何呢？每一个企业，都会考虑采取正常价格策略，还是采取高价格策略形成垄断价格，并尽力获取垄断利润。如果垄断可以形成，则博弈双方的共同利润最大。这种情况就是垄断经营所做的，通常会抬高价格。另一个极端的情况是厂商 90 用正常的价格，双方都可以获得利润。有趣的联系??我们又引出一条基本准则：“把你自己的战略建立在假定对手会按其最佳利益行动的基础上”。事实上，完全竞争的均衡就是“纳什均衡”或“非合作博弈均衡”。在这种状态下，每一个厂商或消费者都是按照所有的别人已定的价格来进行决策。在这种均衡中，每一企业要使利润最大化，消费者要使效用最大化，结果导致了零利润，也就是说价格等于边际成本。在完全竞争的情况下，非合作行为导致了社会所期望的经济效率状态。如果厂商采取合作行动并决定转向垄断价格，那么社会的经济效率就会遭到破坏。这就是为什么WTO和各国政府要加强反垄断的意义所在。91占优战略??不论其他参与人选择什么战略，它的最优战略是唯一的，这样的最优战略被称为占优战略。重复剔除严格劣战略92?双均衡的性别战性别战与先动优势女足球男足球芭蕾芭蕾2 ，10 ，00，01，293纯战略与混合战略??如果一个战略规定参与人在每一个给定的信息情况下只选择一种特定的行动，称为纯战略。如果一个战略规定参与人在给定的信息情况下以某种概率分布随机地选择不同的行动，称为混合战略。94监督博弈的纳税检查?A 为应纳税款，C为检查成本， F是偷税罚款。假定 C&A+F。不存在纯战略纳什纳均衡。纳税人逃税税收机关检查 A-C+F,-A-F 不检查税人不逃税A-C, -A0,0A,-A95纳税检查边际S 为税务机关检查的概率，E为纳税人逃税概率。给定E，税收机关选择检查与否的期望收益： ? K(1,E)=(A-C+F)E+(A-C)(1-E) =EF+A-C K(0,E)=0E+A(1-E)=A(1-E) 解K(1,E)= K(0,E)，得：E=C/(A+F)纳税人逃税概率小于E,税收机关的最优决策是不检查，否则则反。?96逃税边际??? ??给定S，纳税人选择逃税与否的期望收益是： K(S,1)=(-A-F)S+0(1-S)=-(A+F)S K(S,0)=-AS+(-A)(1-S)=-A 解K(S,1)= K(S,0) ，得S=A/(A+F)即，如果税收机关检查的概率小于S,纳税人的最优选择是逃税，否则交税。混合纳什均衡是S,E,即税收机关以S的概率查税，而纳税人以E的概率逃税。97? ? ?污染博弈贸易自由与壁垒博弈论是一个强有力的分析工具。现在，它不仅在经济学领域、在军事、政治、商业征战、社会科学领域以及生物学等自然科学领域都有非常重大的影响，工程学中如控制论工程也少不了它。帮助大家形成博弈论的基本概念，实际上它是非常精深的。现在与它紧密联系的经济学分支是信息经济学。信号游戏、拍卖形式、激励机制、委托人--代理人理论和公共财政学是博弈论和信息经济学研究的重要课题98?例子2 为什么政府要负责修建公共设施，因为私人没有积极性出资修建公共设施设想有两户相居为邻的农家，十分需要有一条好路从居住地通往公路。修一条路的成本为4，每个农家从修好的好路上获得的好处为3。如果两户居民共同出资联合修路，并平均分摊修路成本，则每户居民获得净的好处（支付）为 3-4/2=1 ；当只有一户人家单独出资修路时，修路的居民获得的支付为3-4=-1 （亏损）， “搭便车”不出资但仍然可以使用修好的路的另一户人家获得支付 3-0=3，见表 2。99表2 修路博弈乙修修 1,1 不修 -1,3甲不修3,-10,0100我们看到，对甲和乙两家居民来说， “修路”都是劣战略，因而他们都不会出资修路。这里，为了解决这条新路的建设问题，需要政府强制性地分别向每家征税2 单位，然后投入4单位资金修好这条对大家都有好处的路，并使两家居民的生活水平都得到改善。101这就是我们看到的为什么大多数路、桥等公共设施都是由政府出资修建的原因。同样的道理，国防、教育、社会保障，环境卫生等都由政府承担资金投入，私人一般没有积极性承担这方面服务的积极性和能力。102例子3 苏格兰的草地为什么消失了？公共资源经常被过度利用的原因。在 18 世纪以前，英国苏格兰地区有大量的草地，其产权没有界定，属公共资源，大家都可以自由地在那里放牧。草地属于“可再生资源”，如果限制放牧的数量，没有被牛羊吃掉的剩余草皮还会重新长出大面积草场，但如果不限制放牧规模，过多的牛羊将草吃得一光二净，则今后不会再有新草生长出来，草场就会消失。103由于草地的产权没有界定，政府也没有对放牧作出规模限制，每家牧民都会如此盘算：如果其他牧民不约束自己的放牧规模，让自己的牛羊过多地到草地上吃草，那么，我自己一家约束自己的放牧规模规模对保护草场的贡献是微乎其微的，不会使草场免于破坏；相反，我也加入过度放牧的行列，至少在草场消失之前还会获得一部分短期的收益。104如果其他牧民约束放牧规模，我单独一家人过度放牧不会破坏广褒的牧场，但自己却获得了高额的收益。因此，任何一位牧民的结论都会是：无论其他牧民是否过度放牧，我选择“约束自己的放牧规模”都是劣战略，从而被剔除。大家最终都会选择过度放牧，结果导致草地消失，生态破坏。105?类似的例子还有：渤海中的鱼愈来愈少了，工业化中的大气及河流污染，森林植被的破坏等。解决公共资源过度利用的出路是政府制订相应的规制政策加强管理，如我国政府规定海洋捕鱼中，每年有一段时间的“休渔期”，此时禁止捕鱼，让小鱼苗安安静静地生长，大鱼好好地产卵，并对鱼网的网眼大小作出规定，禁用过小网眼的捕网打鱼，保护幼鱼的生存。又如在三峡库区，为了保护库区水体环境，关闭了前些年泛滥成灾的许多小造纸厂等。106?例子4 为什么在城市中心道路上禁止汽车鸣喇叭？禁鸣喇叭一方面是为了控制城市噪声污染，另一方面是基于以下的博弈论原因。见表3，当汽车司机可以鸣喇叭时，可能为汽车超速抢行提供条件。但当大家都抢行时，城市交通拥挤加重，反而都难以顺利通行，获得低支付（2,2)。107表3 交通博弈司机2 缓行缓行司机1 抢行8,89, 11,92,2抢行108?但当对方缓行时，自己抢行会占便宜，获得支付9。这个博弈中，“缓行”是劣战略，剔除后得到“剔除劣战略后的占优战略均衡”（抢行,抢行），这不是一个好的均衡。当禁止鸣喇叭时，司机为了避免造成交通事故，只得缓行，从而得到好的结果（缓行,缓行）。109?例子5 为什么要加入WTO？WTO是一个自愿性申请加入的自由贸易联盟，即WTO成员国之间实现低关税或零关税的相互间自由贸易。为什么需要一个组织来协调国家之间的自由贸易呢？这是因为，如果没有一个协调组织，国与国之间的贸易就不会呈现低关税或零关税的自由贸易局面，因为这时国与国之间的贸易是一个“囚徒困境”。给定一个国家对另一个国家的货物实行低关税，另一个国家反过来对这个国家的货物实行高关税是占优于实行低关税的战略的。110三、智猪博弈（Pigs’payoffs）：对诸多经济现象的解释?在博弈论（Game Theory）经济学中， “智猪博弈”是一个著名的纳什均衡的例子。假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽，另一头安装着控制猪食供应的按钮，按一下按钮会有10个单位的猪食进槽，但是谁按按钮就会首先付出2个单位的成本，若大猪先到槽边，大小猪吃到食物的收益比是9∶1；同时到槽边，收益比是7∶3；小猪先到槽边，收益比是6∶4。那么，在两头猪都有智慧的前提下，最终结果是小猪选择等待。1111. 智猪博弈（Pigs’payoffs）猪圈中有一头大猪和一头小猪，在猪圈的一端设有一个按钮，每按一下，位于猪圈另一端的食槽中就会有 10 单位的猪食进槽，但每按一下按钮会耗去相当于2单位猪食的成本。如果大猪先到食槽，则大猪吃到9单位食物，小猪仅能吃到1单位食物；如果两猪同时到食槽，则大猪吃 7 单位，小猪吃 3 单位食物；如果小猪先到，大猪吃6单位而小猪吃4单位食物。表4给出这个博弈的支付矩阵。112??实际上小猪选择等待，让大猪去按控制按钮，而自己选择 “坐船”(或称为搭便车)的原因很简单：在大猪选择行动的前提下，小猪也行动的话，小猪可得到1个单位的纯收益(吃到3个单位食品的同时也耗费2个单位的成本，以下纯收益计算相同)，而小猪等待的话，则可以获得4个单位的纯收益，等待优于行动；在大猪选择等待的前提下，小猪如果行动的话，小猪的收入将不抵成本，纯收益为-1单位，如果大猪也选择等待的话，那么小猪的收益为零，成本也为零，总之，等待还是要优于行动。两只猪各会采取什么策略？答案是：小猪将选择“搭便车” 策略，也就是舒舒服服地等在食槽边；而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。原因何在？因为，小猪踩踏板将一无所获，不踩踏板反而能吃上食物。对小猪而言，无论大猪是否踩动踏板，不踩踏板总是好的选择。反观大猪，已明知小猪是不会去踩动踏板的，自己亲自去踩踏板总比不踩强吧，所以只好亲力亲为了。113智猪博弈?每次按出10个萝卜，按者支付2个单位成本，大先，（9，1）小先（6，4）同时（7，3）按小猪等待大猪按等待5，19，-14 ，40 ，0114表4 智猪博弈小猪按大猪等待按 5,1 9, -1 等待 4,4 0,0115?从矩阵中可以看出，当大猪选择行动的时候，小猪如果行动，其收益是1，而小猪等待的话，收益是4，所以小猪选择等待；当大猪选择等待的时候，小猪如果行动的话，其收益是-1，而小猪等待的话，收益是0, 所以小猪也选择等待。综合来看，无论大猪是选择行动还是等待，小猪的选择都将是等待，即等待是小猪的占优策略。116?这个博弈没有“剔除劣战略均衡”，因为大猪没有劣战略。但是，小猪有一个劣战略“按”，因为无论大猪作何选择，小猪选择“等待”是比选择 “按”更好一些的战略。所以，小猪会剔除“按”，而选择“等待”；大猪知道小猪会选择“等待”，从而自己选择“按”，所以，可以预料博弈的结果是 (按,等待）。这称为“重复剔除劣战略的占优战略均衡”，其中小猪的战略“等待”占优于战略“按”，而给定小猪剔除了劣战略“按” 后，大猪的战略“按”又占优于战略“等待”。117??在小企业经营中，学会如何“搭便车”是一个精明的职业经理人最为基本的素质。在某些时候，如果能够注意等待，让其他大的企业首先开发市场，是一种明智的选择。这时候有所不为才能有所为！高明的管理者善于利用各种有利的条件来为自己服务。“搭便车”实际上是提供给职业经理人面对每一项花费的另一种选择，对它的留意和研究可以给企业节省很多不必要的费用，从而使企业的管理和发展走上一个新的台阶。这种现象在经济生活中十分常见，却很少为小企业的经理人所熟识。118“小猪躺着大猪跑”的现象是由于故事中的游戏规则所导致的。规则的核心指标是：每次落下的事物数量和踏板与投食口之间的距离。如果改变一下核心指标，猪圈里还会出现同样的“小猪躺着大猪跑”的景象吗？试试看。改变方案一：减量方案。投食仅原来的一半分量。结果是小猪大猪都不去踩踏板了。小猪去踩，大猪将会把食物吃完；大猪去踩，小猪将也会把食物吃完。谁去踩踏板，就意味着为对方贡献食物，所以谁也不会有踩踏板的动力了。如果目的是想让猪们去多踩踏板，这个游戏规则的设计显然是失败的。改变方案二：增量方案。投食为原来的一倍分量。结果是小猪、大猪都会去踩踏板。谁想吃，谁就会去踩踏板。反正对方不会一次把食物吃完。小猪和大猪相当于生活在物质相对丰富的“共产主义”社会，所以竞争意识却不会很强。对于游戏规则的设计者来说，这个规则的成本相当高（每次提供双份的食物）；而且因为竞争不强烈，想让猪们去多踩踏板的效果并不好。改变方案三：减量加移位方案。投食仅原来的一半分量，但同时将投食口移到踏板附近。结果呢，小猪和大猪都在拼命 119 地抢着踩踏板。等待者不得食，而多劳者多得。每次的收获刚??对于游戏设计者，这是一个最好的方案。成本不高，但收获最大。原版的“智猪博弈”故事给了竞争中的弱者（小猪）以等待为最佳策略的启发。但是对于社会而言，因为小猪未能参与竞争，小猪搭便车时的社会资源配置的并不是最佳状态。为使资源最有效配置，规则的设计者是不愿看见有人搭便车的，政府如此，公司的老板也是如此。而能否完全杜绝“搭便车”现象，就要看游戏规则的核心指标设置是否合适了。比如，公司的激励制度设计，奖励力度太大，又是持股，又是期权，公司职员个个都成了百万富翁，成本高不说，员工的积极性并不一定很高。这相当于“智猪博弈” 增量方案所描述的情形。但是如果奖励力度不大，而且见者有份（不劳动的“小猪”也有），一度十分努力的大猪也不会有动力了----就象“智猪博弈”减量方案一所描述的情形。最好的激励机制设计就象改变方案三----减量加移位的办法，奖励并非人人有份，而是直接针对个人（如业务按比例提成），既节约了成本（对公司而言），又消除了“搭便车”现象，能实现有效的激励。 120实际生活中的智猪博弈?? ? ?“搭便车”现象；公共物品，穷人和富人修路博弈（中产阶级对社会的稳定作用）；大股东对管理者的监督；天塌下来有高个子顶着。121博弈与制度由智猪博弈故事得到的启示?在这个例子中，对小猪而言，无论大猪是否踩动踏板，不去踩踏板总比踩踏板好。反观大猪，明知小猪不会去踩踏板，但是去踩踏板总比不踩强，所以只好亲历亲为了。这个案例令我们不得不思考 : ?“智猪博弈”故事给了竞争中的弱者(小猪)以等待为最佳策略的启发。在博弈中，每一方都要想方设法攻击对方、保护自己，最终取得胜利；但同时，对方也是一个与你一样理性的人，他会这么做吗?这时就需要更高明的智慧。博弈其实是一种斗智的竞争。作为一门科学，博弈论就是研究不同主体之间相互影响行为的一种学问。或者准确地说，博弈论是研究决策主体行为发生直接相互作用时的决策以及这种决策的均衡问题的学问，因此也有人把它称为“对策论”。 ?对于企业经营者来说，如何理解博弈论，如何运用博弈论原理指导企业有效管理，这是值得思考的事情。在价格和产量决策、经济合作和经贸谈判、引进和开发新技术或新产品、参与投标拍卖、处理劳资关系，以及在与政府的关系和合作等多方面，博弈论都是企业经营者十分有效的决策工具，或者至少是比较科学的决策思路。 122???还有一个经典案例，是说当年英国政府将流放澳洲的犯人交给往来于澳洲之间的商船来完成，由此经常会发生因商船主或水手虐待犯人，致使大批流放人员因此死在途中 (葬身大海)的事件发生。后来大英帝国对运送犯人的办法 (制度)稍加改变，流放人员仍然由往来于澳洲的商船来运送，只是运送犯人的费用要等到犯人送到澳洲后才由政府支付给商船。仅就这样一点小小的“改变”，几乎再也没有犯人于中途死掉的事情发生。关于这一问题，现任招商局掌门人秦晓先生在最近做客央视《对话》节目时，也谈了他的一些看法。他认为：企业领导人应该去制定游戏规则，而不应该单纯地去做裁判。他觉得制度应当比个人的权威和魅力更重要。小平同志讲过一句话，说一个好的制度可以约束坏人；一个坏的制度呢可以使好人变坏。回顾历史，我们动不动就说获诺贝尔奖学金会怎么样，爱迪生又发明了什么，但几乎少有人讲保险制度对社会进步的贡献有多大，专利制度对社会进步的贡献有多大。于是乎，又引出另一个新的问题―― 制度与文化 1232. 例子在经济生活中，有许多“智猪博弈”的例子。例子6 股市博弈许多人并未读过“智猪博弈”的故事，但是却在自觉地使用小猪的策略。股市上等待庄家抬轿的散户；等待产业市场中出现具有赢利能力新产品、继而大举仿制牟取暴利的游资；公司里不创造效益但分享成果的人，等等。因此，对于制订各种经济管理的游戏规则的人，必须深谙 “ 智猪博弈 ” 指标改变的个中道理。在股票市场上，大户是大猪，他们要进行技术分析，收集信息、预测股价走势，但大量散户就是小猪。他们不会花成本去进行技术分析，而是跟着大户的投资战略进行股票买卖，即所谓“散户跟大户”的现象。124?例子7 为何股份公司中的大股东才有投票权？在股份公司中，大股东是大猪，他们要收集信息监督经理，因而拥有决定经理任免的投票权，而小股东是小猪，不会直接花精力去监督经理，因而没有投票权。125例子8 为什么中小企业不会花钱去开发新产品？在技术创新市场上，大企业是大猪，它们投入大量资金进行技术创新，开发新产品，而中小企业是小猪，不会进行大规模技术创新，而是等待大企业的新产品形成新的市场后生产模仿大企业的新产品的产品去销售。126例子9 为什么只有大企业才会花巨额金钱打广告？大企业是大猪，中小企业是小猪。大企业投入大量资金为产品打广告，中小企业等大企业的广告为产品打开销路形成市场后才生产类似产品进行销售。127三、纳什均衡与商业中心区的形成表5给出的博弈中，甲和乙都没有劣战略，所以，不能通过重复剔除劣战略获得博弈结果。128表5 存在纳什均衡的博弈乙 L U 甲 D 1,1 2,3 M 4,2 1,2 R 1,3 2,1（问题2：甲和乙分别会选择什么战略？）129当甲选“ U” 时，乙会选“ R” ；而当乙选“R”时，甲应该选“D”而不是“U”；但当甲选“D”时，乙会选“L”；给定乙选“L”，甲选“D” 是最好的选择，他不会改变选择 “D”；给定甲不改变选“D”，乙也不会改变其选择“ L” 。所以，可以预期（D,L）是甲乙最终完成的稳定的选择。130?称（D,L)为 “纳什均衡”。纳什均衡是局中人战略选择上构成的一种“僵局”，给定其他局中人的选择不变，任何一个局中人的选择是最好的，他也不会改变其战略选择。剔除劣战略的占优战略均衡和重复剔除劣战略的占优战略均衡是纳什均衡，但相反的结论不成立。131?在城市街道上，我们常见到一些地段上的商店十分拥挤，构成一个繁荣的商业中心区，但另一些地段却十分冷僻，没什么商店。对于这种现象，我们可以运用纳什均衡的概念来加以解释。甲乙? ? 1/2132图1 商业位置博弈?见图1，有一个长度为1单位的街道，在街道两边均匀地分布着居民。现有两家商店决定在街道上确定经营位Z。如果甲在街道中间位Z1/2处设店，则乙的最好选择是紧靠甲的左边或右边设店。133?当乙在甲的右边紧靠甲设店时，其右边街道上的顾客都是乙的顾客；如果乙不是紧靠甲而是远离甲设店，则其顾客只是其右边街道的居民，不如它紧靠甲设店时多，因而在远离甲的位Z设店是劣战略。所以给定甲在1/2处设店，乙在紧靠甲的左边或右边设店是最优的。反过来，给定乙在接近1/2处设店，甲的最优选择也是在1/2附近设店。这样，甲和乙挤在1/2处设店就是纳什均衡，这就是商业中心区的形成原理。134四、动态博弈与承诺行动如果局中人在进行行动选择时有先后顺序之分，这种博弈就被称为“动态博弈”。在图2中，有两个房地产开发商A和B 分别决定在同一地段上开发一栋写字楼。由于市场需求有限，如果他们都开发，则在同一地段会有两栋写字楼，超过了市场对写字楼的需求，难以完全出售，空Z房太多导致各自亏损1百万。135当只有一家开发商在这个地段开发一栋写字楼时，它可以全部售出，赚得利润1百万。假定A先决策，B在看见A的决策后再决策是否开发写字楼。在图2中，用“博弈树”表示博弈过程。136开发 B 开发A不开发 B不开发开发不开发(-1,-1)(1,0)(0,1)(0,0)图2 房地产开发博弈137?在其中每一条“路径”的末端用向量给出A和B的支付，称为支付向量。下面用“逆向归纳法”可以求解这个博弈。在B进行决策的2个“决策结” 上，B在左边的决策结上选择“不开发 ” ；而在右边的决策结上选择“ 开发”。即给定A开发，B就不开发；给定 A 不开发， B 就开发。 B 应避免同时与 A 都选择开发而蒙受损失。138?在这种情况下，A在自己的决策结上当然选择“开发”，因为他预计当自己选择“开发” 后，B会选择“不开发”，自己就净赚一百万。当 B 威胁 A 说：“不管你是否开发，我都会在这里开发写字楼。”倘若 A 将 B 的话当了真， A 就不敢开发，让 B 单独开发写字楼占便宜。但是，B的威胁是“不可Z信”的。当 A 不理会 B 的威胁而果断地开发出一栋写字楼时，B其实不会将事前的威胁付诸实施。因为“识时务者为俊杰”，在A已开发的情况下， B 的最优决策是“不开发”而不是“开发”。139但是，如果B在向A发出威胁的同时又当着A的面与第三者C打赌一定要在该地段上开发出一栋写字楼，否则输给 C 2 百万元。 B 与 C 为此签定合同并加以公证有效。这时，博弈变成图3所示的动态博弈。140开发 B开发A不开发B不开发开发不开发(-1,-1)(1,-2)(0,1)(0,-2)图3 承诺行动后房地产开发博弈141?称 B 的这种行动为“承诺行动”，它使原来不可Z信的威胁变为可以Z信。这时，A就不得不相信B一定要开发写字楼的威胁了，于是放弃开发写字楼的计划，让B如愿以偿单独开发写字楼。B不仅未向 C 支付 2 百万元，反而净赚 1 百万。我们可以运用“承诺行动”的原理来分析许多经济及军事现象。142例子10 项羽的“破釜沉舟”。例子 11 韩信赵国之战，“置之死地而后生”。例子 12 欧共体在空中客车与波音公司的竞争中对空中客车公司的战略性补贴。欧共体为了打破美国波音公司对全球民航业的垄断，曾放弃欧洲传统的自由竞争精神而对与波音公司进行竞争的空中客车公司进行补贴。143当双方都未获得政府的补贴时，两个公司都开发新型飞机会因市场饱和而亏损，但若一家公司开发而另一家公司不开发时，则开发的那家公司会获巨额利润，见表6。144表6 未补贴时的博弈空中客车开发开发波音不开发 -10,-10 0, 100不开发100,0 0,0145?此时有两个纳什均衡，即一家开发而另一家不开发。下面，考虑欧共体对空中客车进行补贴 20 个单位的情况。此时，当两家都开发时，空中客车仍然盈利 10 单位而不是亏损，博弈矩阵见表7。146表7 有补贴时的博弈空中客车开发开发波音不开发 -10,10 0, 120 不开发 100,0 0,0147这时只有一个纳什均衡，即波音公司不开发和空中客车公司开发的均衡（不开发,开发），这有利于空中客车。在这里，欧共体对空中客车的补贴就是使空中客车一定要开发（无论波音是否开发）的威胁变得可Z信的一种 “承诺行动”。148例子13 为什么大人物、大公司要聘请常年律师？大人物、大公司对声誉十分看重，因而为一些不良人物或公司通过诽谤大人物、大公司企图迫使大人物、大公司花钱“私了”而获利。这是因为，尽管对于一些无端的指控，大人物、大公司可望通过法律手段（打官司）而出清了结，但打官司请律师会增加他们额外的成本。如果能花稍少一些钱“私了”，则既使自己清白又省钱，同时诽谤者也获得收入。149大人物、大公司为了避免这种无端的损失，干脆花钱请常年律师，律师费用已经一次性支付，打官司不会带来额外的花费。这是一个承诺行动，它告诉潜在的诽谤者，大人物、大公司一旦受到无端诽谤必定会让他们吃官司。这样，大人物、大公司因此承诺行动而使自己得到保护，避免了许多无端指控的发生。150例子14 如何以弱敌强在战争史上，以弱胜强的例子是很多的。在商业竞争中，以弱敌强也是经常会遇到的情形。在二战中的诺曼底登陆战的谋略策划中，盟军就面临以弱敌强的问题。盟军有两个可以选择的登陆目标地，一是多佛，二是诺曼底。德国守军在人数上超过了盟军，并且就军事进攻而言，在人数相同的情况下，攻方与守方相比会处于不利的情形。151下面，将这种情形模型化。有一支军队准备进攻一座城市，它有军力两个师。守城军队有三个师。通往城市有甲、乙两条道路或方向。两军相遇时，人数居多的一方取胜，当两方人数相等时，守方获胜。假定军队只能整师调动。152攻方战略：a=两个师集中沿甲方向进攻b=兵分两路，一个师沿甲方向进攻，另一个师沿乙方向进攻c=两个师集中沿乙方向进攻153守方战略： A=三个师集中守甲方向 B=两个师守甲方向，一个师守乙方向 C=一个师守甲方向，两个师守乙方向 D=三个师集中守乙方向154用“+”、“－”，分别表示胜和败，见下表A a 进攻方 b c－，+守方 B C－,+ －,+D+, －+, －－, + －, ++, －+, －+, －－,++, －表1 以弱敌强博弈155用“重复剔除劣战略”分析：进攻方无劣战略，但守方有劣战略，A劣于B， D 劣于 C ，故守方不会采用战略 B 和 C ，剔除后的博弈变为：守方 B C a －，+ +, －进攻方 b －，+ －，+ c +, －－，+ 表2 守方剔除劣战略后的博弈156攻方知道守方不会选A和D，他由此知道博弈变成上图所示。此时，攻方就有一个劣战略b，他剔除b后得到新的博弈，见下表：守方 a －，+ +, －进攻方 +, －－，+ b 表3 攻方剔除劣战略后的博弈157此时，两方的形势是相同的，即攻方尽管开始在军力上劣于守方，但实际上它只要运用计谋，其获胜的可能与守方是相同的。158五、不对称信息下的博弈?博弈论作为经济学研究的有力工具，真正大行其道是在 70 年代不对称信息下经济行为分析的兴起。不对称信息指一些局中人拥有别的局中人不拥有的“私人信息”，也就是说一些局中人知道别的局中人不知道的某些情况。下面用一些例子说明这种情形下的博弈行为。159例子15 二手车市场为什么难以建立？在发达国家，二手车（旧车）的价格往往比新车差一大截，即使旧车本身没有什么质量问题，一旦旧车进入二手车市场，其价格就会与新车相比差得老远。在我国许多城市，二手车市场甚至难以建立起来，原因是进入市场的买车人太少。这是为什么呢？二手车市场的博弈理论为我们解答了这个谜语。160在二手车市场上，卖车人比买车人更多地知道车的质量情况，但卖车人不会将旧车的质量问题老老实实地告诉买车人。买车人也知道这种情形，因此，买车人在开出价格时会考虑到车的质量问题。假定没有问题的好车价值20 万元，有问题的坏车只值10万元，并且设买车人认为市场上出现好车和坏车的可能性各占一半。这时，买车人开出的价格不会高于 1/2×20+1/2×10=15 万元。这样，如果卖车人的车果真是好车，他就不会出售，好车退出市场，但当卖车人的车是坏车时，他会十分积极地将只值10万元的车按15万元卖给他。161但买车人知道愿意按15万元卖的车一定是坏车，从而认定市场上全是坏车。所以，除非他愿意买一辆坏车，否则他会退出市场。当他愿买坏车时，他只开出10万元的价。于是，旧车市场或者建立不起来，没有买主，或者充斥着坏车，真正的好车退出市场，而坏车在不断成交，但价格很低。类似现象广泛存在如人才市场、信贷市场等。如一个公司往往流走的是能力强的人，因为公司不能正确评价一个能力强的员工的能力，给予的薪水低于其市场价值。162例子16 维克里拍卖法如果有一件古董需要拍卖，有许多人参加竞争性拍卖。这件古董在每个买主心中有一个价值评价。但是，卖主不知道买主的评价，买主也不会老实将其对古董的评价告诉卖主。不同买主之间也不知道其他人的价值评价。163?如果采用“英式拍卖法”，买主们轮流出价，直到开出最高价的买主拿走古董并支付所开出的最高价格。按这种拍卖方法，古董并不能按买主心中的最高评价价值卖出。壁如，当买主中的最高评价为 100万元，第二高评价为 90万元时，当评价最高的买主开出91万元时，就可买走其评价为 100 万元的古董但只支付了 91万元。由于这是公开竞价，会出现围标问题，即买主们合谋压价。164另一种方法是：“一级密封价格拍卖法”。买主每人将其开出的价格写入一个信封，密封后交给卖主。卖主拆开所有信封，将古董卖给信封中出价最高的买主，并要求支付最高的价格。这种方法可避免围标，但不能将古董按买主中最高的评价价值卖出。因为买主不会按心中的评价老老实实地将价格写为其价值评价。如果该买主认为古董值100万元，他不会写出价格为100万元，因为当他开出比 100 万更低一些的价格时，有可能赢得古董但净赚一个价值与价格的差额。如当他开出90万元时，有可能成交并净赚10万元。相反，当他开出 100 万元时，即使成交也无赚头。所以，大家都不会老老实实报出心中的价值。165??经济学家维克里发明的“二级密封价格拍卖法”（又称维克里拍卖法或维克里招标法），既可避免围标，又可诱使买主们老老实实地开出心中的真实评价。维克里拍卖法要求每个买主写入信封一个出价，密封后交给卖主，卖主拆开信封后宣布将古董卖给出价最高的人，但只需支付开出的第二高的价格。譬如，出价最高的为100万元，第二高的为90万元，古董就卖给开出100万元的人，但他只需支付给卖主90万元。166对每个买主来说，他不知道其他买主的评价，但给定其他买主的评价（尽管他不知道），他一旦获胜，支付的第二高的价格是固定的，不会随他开出的价格而变；但他开出的价格愈高，获胜的可能就愈大；但是，他不能开出比他的价值评价更高的价格。因为一旦存在别的人开出的价格比他的价值评价还要高，当他获胜时，就必须以高出他的价值评价的价格购买古董，对他来说是得不偿失的。167所以，每个人都会老老实实在按心中的评价开出价格。如果所有人的评价是一样的，古董就以真实的最高价值卖出。维克里拍卖法可以诱使买主说出真话。70年代美国联邦政府运用维克里招标法进行公共工程招标，为联邦政府节省了大笔开支。168例子17 垄断厂商的低价销售：信号传递博弈有许多垄断厂商并未如人们所料想的那样给商品定出一个很高的价格，而是以较低的价格长期销售某种产品。譬如，发达国家的私营铁路、航空、海运码头等的价格都远低于按照其垄断定价方法定出的价格。这是什么原因呢？169记得有一个电视剧，其中有一个情节是一位武林豪杰在交通要道边开了一个酒馆。生产十分兴隆，引起另一位武林高手的垂涎。这位武林高手决定打败那位豪杰然后霸占酒馆。两强相遇，武林豪杰和武林高手相互之间不知对方底细，于是来一番比试。本来，他们俩可以通过打斗来解决问题，但打斗一场双方都会有所损伤，不如通过其他方式比较武功高低。豪杰拿来5块砖，一掌将其击碎，高手也不示弱，照样击碎 5 块砖。于是，豪杰又拿来十块砖，同样是一掌击个粉碎，高手见之，心中没底，于是明白自己武功较豪杰还差一截。于是，这位武林高手甘拜下风，放弃了原来的计划，弃剑而去。170这个电视剧情节在博弈论中被称为 “信号传递博弈”。豪杰身怀绝技、天下无敌。但其他人不一定会相信他是武林第一高手，除非亲自与之交手并败于他。交战虽然可以决出高下，但对双方都会有损失，打个头破血流对谁都不是好事。当然，豪杰可以对外宣布他的武功非凡，其他人不是他的对手，但即使豪杰没有什么本事，也可以如此对外宣布。所以，仅凭口头宣布是难以令人信服的。171俗话说，是骡子是马，拉出去。豪杰用过人武功劈掉别人难以模仿的十块砖，就向别人发出一个信号。这个信号向外传递的信息是：我的武功高强，你们不可匹敌。这样，不用打斗就决出高下，避免了打斗带来的更大损失。现在，我们用这个“信号传递博弈”的原理，来解释为何一些垄断厂商长期在低价格水平上经营。如果这个垄断厂商是一个低生产成本的厂商，当其它较高生产成本厂商也进入这个厂商所经营的行业与之进行竞争时，原先的那个垄断厂商可以通过降价将进入者赶出这个行业，从而继续维持垄断经营。172由于垄断厂商有更低的生产成本，所以，它能够将产品价格降到比进入厂商的生产成本还要低的水平上，这就造成进入者或者高价格经营导致顾客流失，或者同样也降价但价格低于成本，两种情形进入者都会亏损，最后不得不退出行业。但是，这种“打斗”行为尽管可以击退进入者，但由于一段时间的降价经营可能对垄断者带来较大损失。垄断者为了避免这种损失，可以向外宣布它是低成本的，别的厂商休想进来与它竞争。但仅凭口头宣布人家是不会相信的，因为即使垄断者不是低成本的厂商，它也会如此宣布。173一种方法就是，正如电视剧中的故事那样，垄断者向外发送一个信号，向外界传递它真是低成本的信息。它可以长期在一个较低价格水平上经营。如果它的价格足够低，高成本厂商不敢模仿，行内厂商会据此判定它确是低成本的。同时，它的价格也不能太低，以致于较之与进入者进行降价竞争，其损失为小一些。这样，垄断者才会采取如此策略。潜在的高成本进入者不敢进入，垄断者得以保持长期的垄断地位。174例子18 为什么有的商品广告既无商品的价格信息又无售货地点信息，只有明星的表演？通常认为，商业广告的功能是向消费者提供必要的购货信息，如散布商品的价格，质量功能，出售地点等信息。再者，人们还认为有些广告可能是为了引导消费，特别是新产品出现时，消费者还不知道不熟悉它，商业广告中通过一些电影明星使用新产品的图象，利用公众的“追星”心理打造市场。这种关于新产品市场引导的广告在国外的电视广告中特别常见，通常是一位当红明星在电视上用新产品表演一番，既无价格，也无售货地点的介绍，除了显示一下商标外，完全没有对产品性能的说明。不过，对于这类广告，博弈论还有一种“信号传递”的解释呢？175假设有一家企业（记为企业A）开发出一种很有市场潜力的饮料，该产品饮后对人的健康确实有好处。但同时，另一家生产假冒伪劣产品的企业(记为企业B）也准备向市场推出一种伪劣产品饮料。两个企业都会向公众宣布其产品是上乘的，如何如何的好。但公众是理性的，不会仅凭商业宣传就相信它们。但是，如果产品真的好，随着时间的推移，消费者能够识别出来。所以，生产好饮料的的企业A对自己的市场有信心，它相信随着时间的推移，企业B生产的伪劣产品终究会被消费者识破，176顾客会跑到自己这里来，从而自己的市场会不断扩大，销售收入及利润会不断增长，而企业 B 开始可以蒙骗一部分消费者，但时间一长，产品的问题会暴露出来，市场会不断缩小，收入及未来利润都不会有企业 A 的大。这样一来，企业A的未来预期收入远大于企业B。因此，如果企业 A 请一位当红明星打广告，由于是当红明星，他们打广告有很高的市场价格，就可以使企业B不敢模仿。譬如，假定企业A的预期收入为 3 千万元，企业 B 的预期收入为 1 千万元。当红明星打广告的市场价格为 2 千万元，那么，企业A可以请明星打广告但企业B就请不起。177消费者也明白这个道理，从而会在一开始就识别出不能请当红明星打广告的企业B是生产伪劣产品的。这样，企业B一开始就没有市场。当企业 A 请了当红明星打广告时，企业 B 发现这位明星的市场价格太高，自己难以模仿企业A，开始就会放弃生产伪劣产品的计划。所以，企业A通过请当红明星打广告而清除掉了潜在的市场模仿者，它向公众传递自己是生产好产品的信号，这种信号的价值在于其所请来的当红明星有着较高的出场价格，而不在乎明星在广告节目中说了什么，表演了什么，当然更无所谓广告节目是否介绍产品价格等信息了。企业A请当红明星打广告就为公众传递了它是生产好产品的企业的一个信号。178例子19 为什么许多实力雄厚的公司还要向银行借很多钱？在国外，一些资金实力雄厚的公司通常也会向银行贷款。更加令人感到奇怪的是，一些好的公司，一方面自己借钱给别的公司，同时，另一方面又向银行借钱。博弈论运用“信号传递”原理可以对此现象作出解释。179对于一家公司来说，负债增加会增大公司破产的可能性；但是，对于实力雄厚的公司，在同样负债比例下，其破产可能性要小一些。每个公司都会向社会吹嘘自己是好的公司，实力雄厚，但公众不会仅凭口头宣传就相信的。于是，真正好的公司通过向银行借钱来增大自己破产的可能性，令其它实际上不好的公司难以模仿。这种负债比例的增加要做到恰到好处，它既可令其它实力稍弱的公司难以模仿，又使自己能够承受。180这样，公众就能识别出谁是好的公司，从而竞相购买好的公司的股票，导致公司股票价格上涨，结果这家负债公司会因其股价上涨而获资本增值，破产的可能性反而下降了。当然，公司通过增加负债来向投资者传递公司信息的代价可能太高，因而有时公司十分乐意向投资者直接披露内部信息，只要这种信息足以使投资者相信其真实性，就会为公司减少信息传递成本。 (问题3：在中国是否负债比例高的公司就是好的公司？）181例子20 飞机、轮船等设立头等舱、经济舱的道理是什么？无论是买票乘飞机、火车还是轮船，不同的人所愿意支付的价格实际上是不一样的。有的人收入高一些，或对花钱看得比较松一些，就可以支付较高的价格，相反，收入低的人或对花钱看得比较紧一些的人，就只愿支付较低的价格。但是，如果你问他们愿意支付什么样的价格，他们都必定说愿支付较低的价格，因为既使有钱人有也会在同样服务下以低价购买划算一些。182飞机或轮船公司为了将这些在经济学中被称为具有不同支付意愿的人区分开来，让能支付较高价格的人支付较高价格，就设计了一种“信息甄别”的机制，这种机制就是设立头等舱、二等舱、三等舱， …… ，等等。这种机制发挥作用的道理是这样的，我们可以用著名的 “所罗门王断案”的故事来说明。所罗门王是古代以色列国的一位以智慧著称的君主。183一次，两个女人为争夺一个婴儿争扯到所罗门王殿前，她们都说婴儿是自己的，请所罗门王作主。所罗门王稍加思考后作出决定：将婴儿一刀劈为两段，两位妇人各得一半。这时，其中一位妇人立即要求所罗门王将婴儿判给对方，并说婴儿不是自己的，应完整归还给另一位妇人，千万别将婴儿劈成两半。听罢这位妇人的求诉，所罗门王立即作出最终裁决 ―― 婴儿是这位请求不杀婴儿的妇人的，应归于她。184这个故事讲的道理是，尽管所罗门王不知道两位妇人中谁是婴儿的母亲，但他知道婴儿真正的母亲是宁愿失去孩子也不会让孩子被劈成两半的。所罗门王正是利用这一点，一下就识别出谁是婴儿的真正的母亲了。所罗门王的这种方法在博弈论中被称为“机制设计”，即设计一套博弈的规则，令不同类型的人作出不同的选择，尽管每个人的类型可能是隐藏的，别人观察不到，但他们所作出的不同选择却是可以观察到的。观察者可以通过观察不同人的选择而反过来推演出他们的真实类型。185当飞机或轮船的舱位条件和价格完全一样时，不同支付意愿的人都会以最低价格买票，不会有人愿支付比别人更多的钱去买相同的舱位的票。于是，航空公司或轮船公司将舱位分成头等舱、二等舱， …… ，等等，价格稍有不同，当然服务也不同，就将不同支付意愿的顾客区分开了。186头等舱比其它较低等级舱位的价格高许多并不主要是因为它的服务要比其它舱位的服务好许多（当然还是要好一些），而是因为那些坐头等舱的人的支付能力比其它舱位的旅客的支付能力要强许多，说白了，就是坐头等舱的人比坐其它舱位的人更有钱或更能花钱而已！但是，如果航空公司或轮船公司不对舱位作如此区分，即使是有钱人也不会愿意坐同样的舱位而支付比别人支付的更高的价格。187这里，支付能力是旅客的类型，选择舱位等级是他们的选择。支付能力无法观察，但买什么舱位的票却能够观察，航空或轮船公司因此而识别出可以支付更高价格的顾客而赚取更多利润。譬如，有两位旅客甲和乙乘飞机。甲的最高支付能力为 1000 元，乙的最高支付能力为 1500 元。经济舱的服务成本为 800 元，头等舱的服务成本为1200元。188经济舱带给甲和乙的消费满足感（经济学中称为效用）为 1000 元，头等舱带给甲和乙的效用为 1800 元。如果没有头等舱，航空公司最多把票价定到 1000元，利润为2×（）=400元。因为票价一旦高于 1000 元，甲和乙就不会买票了。但当设立头等舱后，航空公司将经济舱票价定为 1000 元，将头等舱票价定为 1500 元。此时，甲以 1000 元买经济舱。189乙如果买经济舱，则其净效用（经济学称为消费者剩余）为，但当乙买头等舱票时的消费者剩余为 0元，所以乙会买头等舱。甲的支付能力只有 1000 元，所以甲只有买经济舱。这时，航空公司的利润增大为 ()+()=500 元 &400 元。通过机制设计增大了公司利润。190类似的还有，酒店的星级分类，五星级、四星级、三星级，……酒店，冰棍的不同品种与价格，影剧院的不同座位价格表等等，都是实现信息甄别的机制设计。191例子21 大智若愚中的智慧:聪明过头没好处美国 19 世纪有一个颇有成就的政治家，其幼年时是流浪街头的孤儿。他经常在大街上向行人讨钱，但当有人让他在一块钱和两块钱之间选择时，他选择了一块钱。于是，许多人都为了亲眼验证关于他的“犯傻”行为的传闻，专门来找他并让他在一块钱和两块钱之间选择。他仍然依然故我地只选择一块钱，于是来找他的人愈来愈多。192终于有一天，有一位女士问他：难道你不知道两块钱比一块钱更多一些钱吗？他如此回答道：如果我有一次选择了两块钱，就不会有人来找我让我在一块钱与两块钱之间选择了，我也讨不到钱了。这个故事告诉我们有时候“扮傻” 也许是有好处的。下面再来看一个例子，这是一个动态博弈，局中人 A 有两次决策机会，一次在局中人 B 决策之前，另一次在B决策之后。193A U L (2,0) (1,1)DBRAD?U?(3,0)(0,2)图4 一个动态博弈运用“ 逆向归纳法”，A在第二次决策时会选择 ? U U? ，B选择L；给定这些结果， A在开始会选择 U，纳什均衡是((U, ),L)。194但是，如果局中人A开始“装傻”，选择D而不是U，当B认为A是傻子时，B D ? ，而这正是B 会以为当他选R后A会选所乐意看到的结果。于是，当 A 开始装傻后，造成B对A的类型的误解，B以为 A是傻子，从而预期当他自己选 R后A还 ? 会“ 犯傻D ”选。于是B就选R而不是均衡中的 L 。但是，当 B 选了 R 后， A 不再“装傻”而一举选达到最大支付3。 U? 这就是A通过“装傻”骗过B使A获利。195第二种情形是，局中人 B“ 装傻”，并使A相信他是傻子。这样，A会认为当他选D时B会选R。于是，A开始就选D，但一旦A选了D，B就不再“装傻”，一举选L。这是B骗过A的情形。下面的一个例子是当所有局中人都 “装傻”时，所有人都受益的情形。196A U BD (1,1)……AU BD DA U B UD D(100,100)D(0,3) (98,98) (97,100) (99,99)(98,101)图5 所有人都“装傻”使所有人都受益的博弈由逆向归纳法，博弈均衡是所有人都选择D，即（ D ， … ， D ）。结果是博弈在一开始就结束了，每个局中人都获得支付1。197如果A开始就装傻，选U而不是D，B 也装傻，选U不选D，则博弈到最后结束时每个局中人得到支付100。相反，下面用一个例子说明当所有人都“聪明过头”时，所有人都受损失的道理。有这样一个故事，称为“旅行者困境”，说的是有两个旅行者甲和乙从一个以出产花瓶的著名旅游胜地回来时，他们都买了花瓶。198提取行查时，发现花瓶被碰破了。他们向航空公司索赔。航空公司估计花瓶的价格在 80 或 90 元的价位左右，但不知道这两位旅客购买的准确价格。航空公司要求两位旅客在100元以内自己写下花瓶价格。若两人写的相同，说明他们说了真话，就照他们写的数额赔偿；如果两人写的不一样，那就认定写得低的旅客讲的是真话，按这个低的价格赔偿，但是对讲真话的旅客奖励2元钱，对讲假话的旅客罚款2元。199如果两人都写 100元，他们都会获得 100 元。但是，给定乙写 100 元，甲改写 99元，则他会获得101元。乙又想，若甲写99元，他自己写98元，比写100元好，因为这样他获 100 元，而写 100 元当甲写 99 元时自己却只获 97 元。而给定乙写 98 元，甲又会写 97 元， …… ，这样，最后落得每人都只写1、2元的境地。所以，还是古人说得好，有时“大智若愚”可能还是上策呢？200六、混合战略博弈小孩玩的游戏“石头，剪子，布”，也是一种博弈。但是，这个博弈有一种有趣的特征，即给定一方的任何选择，另一方都有制胜对方的战略，所以，给定一方任何一个战略，对方都有制胜这个战略的战略，因而这个战略不是最优的。任何“纯战略”都不是最优的，纯战略是“石头，剪子，布”中的任何一个。201但是，我们知道，玩这个游戏是总是以对方不易猜出的随机方式出招。事实上，可以通过数学证明，当双方都以每个战略按1/3的概率出招时，达成一种双方都不愿改变这种概率分布的局面。这被称为“混合战略纳什均衡”，而这种以随机方式选择纯战略的博弈被称为 “混合战略博弈”。以混合战略博弈的概念，我们来看下面几个例子。202例子22 为什么一般人总是小错不断，大错不犯；偷税漏税的一般是中小企业，大企业会老老实实地交税？税务部门不会对所有企业的交税情况每一次都去检查，因为这样做的成本太高，得不偿失。所以，税务部门总是随机地对企业的交税情况进行检查。203企业也是随机地在交税与偷漏税之间进行选择。税收部门与企业间进行的是混合战略博弈。因为如果企业总是交税，税务部门就最好不检查；但给定不检查，企业就会偷漏税。所以，两者只有在随机地检查与不检查，企业随机地在偷漏税与交税之间选择，才会达成均衡。204对于大企业，因一旦偷税就数目巨大，所以，税务部门在随机检查时放在大企业上的可能性就大一些；而给定税务部门检查大企业的可能性较大，大企业偷漏税的行为就较少，否则就容易被逮个正着。所以，偷漏税较多的就是一些中小企业，大企业纳税的积极性较高。同样，大人物或有钱人纳税的积极性应较高，至于我国在过去一段时期有钱人反而不交税的现象主要源于制度不健全或已有的制度得不到贯彻所致。同样的道理，在犯罪或对错误的监督惩罚博弈中，也是混合博弈，人们可能总是大错不犯小错不断。205例子23 田忌赛马新编春秋战国时期，齐威王常与旗下大将田忌赛马。规则是：每次赛三局，每一局齐威王与田忌各出一匹马比赛奔跑速度。每一局中的胜者赢败方一千斤铜。田忌有上、中、下三匹马，而齐威王也有上、中、下三匹马。每次比赛，第一局田忌出上马，齐威王也出上马；第二局田忌出中马，齐威王也出中马；第三局，田忌出下马，齐威王也出下马。齐威王的上马比田忌的上马好，齐威王的中马也比田忌的中马好，齐威王的下马还是比田忌的下马好。于是，每次比赛的结果都是田忌连输三局。206田忌的谋士孙膑了解了田忌的困境后，就打听到这样一个消息：尽管齐威王的上、中、下三匹马都要比田忌的对应上、中、下三匹马好，但碰巧的是田忌的上马可胜齐威王的中马，田忌的中马可胜齐威王的下马。于是，孙膑为田忌献计：下一次比赛中第一局时田忌出下马对齐威王的上马输一局，第二局田忌出上马对齐威王的中马，第三局田忌出中马对齐威王的下马，这样可连赢两局，最后净胜一千斤铜。田忌依计而行，果真赢回一千斤铜。207这个故事曾经被很多人当作博弈论的例子来演绎，但实际上这个故事与博弈论无关。博弈论会假定所有局中人都是理性的，不能假定一些局中人聪明而另一些局中人却是傻子。当田忌出下马时，齐威王最好的选择是出下马而不是上马。孙膑的计谋中假定齐威王是傻子，当田忌出下、上、中马时，他仍然按上、中、下马出，当然要输了。事实上，当田忌出下马时，齐威王应出下马，但齐威王出下马时，田忌不应出下马而是出中马，但此时齐威王又应出中马而不是下马了，……。这样，博弈不会有纯战略的均衡。208两人只能玩混合战略博弈，齐威王分别以1/6随机的概率选择出上、中、下马的任一排列，田忌也如此。由于齐威王存在绝对优势，他平均看来仍然会赢田忌一千斤铜。209例子24 如果曹操与诸葛亮一样聪明：三国演义中的华容道博弈在《三国演义》中，曹操在赤壁大战中一败涂地，率残兵败将向许都方向逃窜。诸葛亮命关羽率兵在途中阻截曹军。当时，第一批拦截大军是赵云率领的，第二批拦截大军是张飞带队的，第三批才是关羽率部伏击。由于曹军兵多将广，前二批伏击军不能逮住曹操，只是抢劫一些军械马匹之类。210待曹军冲过赵云、张飞两道关后，进入关羽的伏击地带。但是，当时关羽与曹操相遇的地方有两条道，一条是华容道，除此外还有另一条道。诸葛亮令关羽伏兵于华容道，并且要求关羽在华容道上点燃树枝冒出烟雾引曹操到来。当时关羽不解，问诸葛亮，“如果在伏兵之处点火，岂不令曹兵看见而改走另一条道逃脱？”诸荀亮叫关羽不要再问，只如此照办即可。211当曹操冲破赵云、张飞的阻截后，来到华容道前，看见华容道上静悄悄的，但有烟火萦绕。曹操大笑道：“孔明以为我会上他的当，故意叫人在华容道上点火让我走另一条道，而他却伏兵于这条道上好逮住我呢！我偏不上他的当！” 于是，曹操令大军径直上华容道上而去，结果与关羽大军撞个正着。212曹操为何进了孔明的圈套呢？这里的道理是这样的：孔明知道曹操是聪明人，而聪明人见华容道上有烟火会认为华容道上有伏兵，于是会避开华容道而走另一条路。如果孔明令关羽在另一条路等着，曹操就被逮住了。但是，曹操不仅聪明，而且还聪明过人，他也知道孔明的如此盘算来诱他上钩，他偏不上当，知道点火的华容道上无人，孔明的队伍在另一条道上呢！于是他选择走华容道。213但是，依《三国演义》作者罗贯中的逻辑，孔明总是比曹操计高一筹，按博弈论的术语来说，就是孔明的理性程度要比曹操高上一阶。孔明也知道曹操知道孔明的打算，于是令关羽正好在点火的华容道上等着曹操。《三国演义》中的这}

天天发财游戏网