如何用博弈论 圈套识破别人的圈套

3.1K186 条评论分享收藏感谢收起赞同 12K1,050 条评论分享收藏感谢收起如何用博弈论识破别人的圈套_百度知道
如何用博弈论识破别人的圈套
如何用博弈论识破别人的圈套...
如何用博弈论识破别人的圈套
答题抽奖
首次认真答题后
即可获得3次抽奖机会,100%中奖。
★虎年顽童★
★虎年顽童★
获赞数:11
为你推荐:
其他类似问题
您可能关注的内容
个人、企业类
违法有害信息,请在下方选择后提交
色情、暴力
我们会通过消息、邮箱等方式尽快将举报结果通知您。1.5K60 条评论分享收藏感谢收起赞同 26219 条评论分享收藏感谢收起如何用博弈论识破别人的圈套_百度知道
如何用博弈论识破别人的圈套
如何用博弈论识破别人的圈套...
如何用博弈论识破别人的圈套
答题抽奖
首次认真答题后
即可获得3次抽奖机会,100%中奖。
在和别人谈判的时候,如何识破别人话中隐藏的阴谋? FBI阅人术(书摘) 第一次和陌生人见面时,如何在一开始谈话的几分钟内,了解这个人?如何和对方观察
对比我抄来的O(∩_∩)O~
为你推荐:
其他类似问题
您可能关注的内容
个人、企业类
违法有害信息,请在下方选择后提交
色情、暴力
我们会通过消息、邮箱等方式尽快将举报结果通知您。13博弈论与生活中的经济学(2010年)_伤城文章网
博弈论与经济学思维兰州大学管理学院 贾 明 琪1 一、介绍博弈论?(一)概念,什么是博弈论 1.概念:博弈论Game Theor y,又称对策论,是使用严谨的数学模型 研究冲突对抗条件下最优决策问题的理论, 是研究竞争的逻辑和规律的数学分支。简 单地说,博弈论是研究决策主体在给定信 息结构下如何决策以最大化自己的效用, 以及不同决策主体之间决策的均衡。2 张维迎的定义?“博弈论是研究决策主体的行为发生直接相 互作用时候的决策以及这种决策的均衡问 题的”也就是说,当一个主体,好比说一 个人或一个企业的选择受到其他人、其他 企业选择的影响,而且反过来影响到其他 人、其他企业选择时的决策问题和均衡问 题。所以在这个意义上说,博弃论又称为 “对策论”.3 博 弈 论 ( game theory) 是 由 美 国 数 学 家 冯? 诺依曼(Von. Neumann)和经济学家摩根斯坦 (Morgenstern) 于 1944 年创立的带有方法论性质 的学科,它被广泛应用于经济学、人工智能、 生物学、火箭工程技术、军事及政治科学等。 1994年,三位博弈论专家即数学家纳什(Nash, 他的故事被好莱坞拍成电影《美丽心灵》,该 影片获得了2002年奥斯卡金像奖的四项大奖)、 经济学家海萨尼( Harsanyi )和泽尔滕( Selten ) 因在博弈论及其在经济学中的应用研究上所作 出巨大贡献而获得诺贝尔经济学奖。4 1996 年,两位将博弈论应用于不对 称信息下机制设计的经济学家莫里斯 (Mirrlees) 和维克里 (Vickrey) 、以及 2001 年三位经济学家阿克洛夫 (Akerlof) 、斯 蒂格利茨(Stiglitz)和斯宾塞(Spence)因运 用博弈论研究信息经济学所取得的成就 而成为这两个年度的诺贝尔经济学奖得 主。专家预计,近几年还会有更多的博 弈论专家可能获得诺贝尔经济学奖。5 为什么博弈论在经济学领域会 产生如此大的影响呢?这是因为博 弈论从一个独特的视角帮助我们更 加深刻地理解和把握经济现象,并指导更加有效的经济政策制订。6 博弈论是一门十分有趣但理论上又 是十分艰深的学问,我今天打算用一些 大家能够凭直观或简单分析就能把握的 例子为大家介绍博弈论的基本概念及应 用,以引起大家对这门目前已成为热门 科学的兴趣和获得初步的了解。这些例 子也是我们在日常生活中经常所遇到的 问题或观察到的现象,通过博弈论,我 们能够更加深刻地理解它们。7 (一)什么是博弈论:从“囚徒困境”谈 起??囚犯困境(Prisoner`s dilemma) 囚犯困境是指这样一种情形,此时两 个人(或厂商)合作要比不合作好,但是 每个人都觉得不合作符合他的利益,因此 每个人的状况都要坏于如果他们合作时的 境况。8 ?囚犯困境(PrisonDilemma)是博弈论的非零和博弈中具代表性的例子,反映个人最佳选择并非团体最佳选择。虽然困 境本身只属模型性质,但现实中的价格竞争、环境保护等方 面,也会频繁出现类似情况。单次发生的囚徒困境,和多次 重复的囚徒困境结果不会一样。 ? 在重复的囚徒困境中,博弈被反复地进行。因而每个参 与者都有机会去“惩罚”另一个参与者前一回合的不合作行 为。这时,合作可能会作为均衡的结果出现。欺骗的动机这 时可能被受到惩罚的威胁所克服,从而可能导向一个较好的、 合作的结果。作为反复接近无限的数量,纳什均衡趋向于帕 累托最优。 ? 囚犯困境的主旨为,囚犯们虽然彼此合作,坚不吐实, 可为全体带来最佳利益(无罪开释),但在资讯不明的情况 下,因为出卖同伙可为自己带来利益(缩短刑期),也因为 同伙把自己招出来可为他带来利益,因此彼此出卖虽违反最 佳共同利益,反而是自己最大利益所在。但实际上,执法机 构不可能设立如此情境来诱使所有囚犯招供,因为囚犯们必 须考虑刑期以外之因素(出卖同伙会受到报复等),而无法 完全以执法者所设立之利益(刑期)作考量。 9 ? ?经典的囚徒困境 1950年,由就职於兰德公司的梅里 尔? 弗勒德(Merrill Flood)和梅尔文? 德雷 希尔(Melvin Dresher)拟定出相关困境的 理论,後来由顾问艾伯特? 塔克(Albert Tucker)以囚徒方式阐述,并命名为「囚徒 困境」。经典的囚徒困境如下:10 (一)什么是博弈论:从“囚徒困境”谈 起1. 囚徒困境两个小偷甲和乙联手作案,私入民宅被警方 逮住但未获证据。警方将两人分别Z于两间房间 分开审讯,政策是若一人招供但另一人未招,则 招者立即被释放,未招者判入狱10年;若二人都 招则两人各判刑8年;若两人都 不招则未获证据但因私入民宅 各拘留1年。11 表1 囚徒困境博弈乙招不招 0,-10 -1,-1招甲 不招-8,-8 -10,0(问题1:甲、乙如何选择?)12 ??关于案例,显然最好的策略是双方都抵赖,结果 是大家都只被判1年。但是由于两人处于隔离的 情况,首先应该是从心理学的角度来看,当事双 方都会怀疑对方会出卖自己以求自保、其次才是 亚当?斯密的理论,假设每个人都是“理性的经 济人”,都会从利己的目的出发进行选择。 这两个人都会有这样一个盘算过程:假如他坦白, 我抵赖,得坐10年监狱,坦白最多才8年;他要 是抵赖,我招,就可以被释放,而他会坐10年牢。 综合以上几种情况考虑,不管他坦白与否,对我 而言都是坦白了划算。两个人都会动这样的脑筋, 最终,两个人都选择了坦白,结果都被判8年刑 期。13 ??基于经济学中Rational agent的前提假设,两个 囚犯符合自己利益的选择是坦白招供,原本对双 方都有利的策略不招供从而均被释放就不会出现。 这样两人都选择坦白的策略以及因此被判8年的 结局,纳什均衡”首先对亚当?斯密的“看不见 的手”的原理提出挑战: 按照斯密的理论,在市场经济中,每一个人都从 利己的目的出发,而最终全社会达到利他的效果。 但是我们可以从“纳什均衡”中引出“看不见的 手”原理的一个悖论:从利己目的出发,结果损人 不利己,既不利己也不利他。14 尽管甲不知乙是否招供,但他认为 自己选“招”最好,因而甲会选择 “招”,乙也同样会选择“招”,结果 各判8年;但若两人都不招,结果是两人 只被判1年,但这种结果是不会出现的。 我们可以运用“剔除劣战 略”的方法来获得这样的结果。15 甲或乙可以作出的选择被 称为“战略”,如“招”或“不招”都是战略。16 对甲来说 ,尽管他不 知道乙是选择了“招”还 是“不招”,他发现他自己选择“招” 都 是 比 选 择“ 不 招 ” 为 好 的 。 因 此 , “不招”是相对于“招”的劣战略,他 不会选择劣战略。所以,甲会选择 “招”。 同样,根据对称性,乙也会选择 “招”,结果是甲乙两人都“招”。17 甲和乙是参与博弈的人,称为“局中 人”。表1中每一个小方格内的数字被称 为局中人的支付,其中左边的数字代表 甲的支付,右边的是乙的支付。表1中的 双变量矩阵称为博弈支付矩阵。 局中人所选择的战略构成的组合 (招,招)被称为博弈均衡。这个组合中 前后两个战略分别表示甲和乙所选择的 战略。18 表1 囚徒困境博弈乙招 招 甲 不招-8,-8 -10,0不招0,-10 -1,-119 甲和乙都不会选择劣战略“不招”,称为“剔除劣战略的占优战 略均衡”。其中“招”是占优于(优 于)“不招”的占优战略。20 囚徒困境说明了什么??在(坦白、坦白)这个组合中,A和B都不能通 过单方面的改变行动增加自己的收益,于是谁也 没有动力游离这个组合,因此这个组合是纳什均 衡,也叫非合作均衡。 囚徒困境反映了个人理性和集体理性的矛盾。如 果A和B都选择抵赖,各判刑1年,显然比都选 择坦白各判刑8年好得多。当然,A和B可以在 被警察抓到之前订立一个&攻守同盟&,但是这可 能不会有用,因为它不构成纳什均衡,没有人有 积极性遵守这个协定,显然最好的策略是双方都抵 赖.21 囚徒困境的意义?“囚徒的两难选择”有着广泛而深刻的意义。 个人理性与集体理性的冲突,各人追求利 己行为而导致的最终结局是一个“纳什均 衡”,也是对所有人都不利的结局。他们 两人都是在坦白与抵赖策略上首先想到自 己,这样他们必然要服长的刑期。只有当 他们都首先替对方着想时,或者相互合谋 (串供)时,才可以得到最短时间的监禁的 结果。22 对经典经济学的冲击???“纳什均衡”首先对亚当? 斯密的“看不见的手” 的原理提出挑战。按照斯密的理论,在市场经济 中,每一个人都从利己的目的出发,而最终全社 会达到利他的效果。 《国富论》:“通过追求(个人的)自身利益,他 常常会比其实际上想做的那样更有效地促进社会 利益。” 从“纳什均衡”我们引出了“看不见的手”的原 理的一个悖论:从利己目的出发,结果损人不利 己,既不利己也不利他。两个囚徒的命运就是如 此。从这个意义上说,“纳什均衡”提出的悖论 实际上动摇了西方经济学的基石。23 怎么看待这个问题?二者是对立统一的,范围不同,在非竞 争环境中效率会受到损失;在完全竞争 条件下,边际利润等于边际成本,达到 效率24 NASH均衡条件下的行为规则?合作是有利的“利己策略”。但它必须 符合以下黄金律:按照你愿意别人对你 的方式来对别人,但只有他们也按同样 方式行事才行。 所谓“己所不欲勿施于 人”。但前提是人所不欲勿施于我。25 Nash equilibrium??纳什均衡,Nash equilibrium ,又称为非合作 博弈均衡,是博弈论的一个重要术语,以约 翰?纳什命名。 约翰?纳什1948年作为年轻数学博士生进入普 林斯顿大学。其研究成果见于题为《非合作博 弈》(1950)的博士论文。该博士论文导致了 《n人博弈中的均衡点》(1950)和题为《非 合作博弈》(1951)两篇论文的发表。纳什在 上述论文中,介绍了合作博弈与非合作博弈的 区别。他对非合作博弈的最重要贡献是阐明了 包含任意人数局中人和任意偏好的一种通用解 概念,也就是不限于两人零和博弈。该解概念 后来被称为纳什均衡。26 纳什均衡定义??假设有n个局中人参与博弈,给定其他人策略的 条件下,每个局中人选择自己的最优策略(个 人最优策略可能依赖于也可能不依赖于他人的 战略),从而使自己利益最大化。所有局中人 策略构成一个策略组合(Strategy Profile)。 纳什均衡指的是这样一种战略组合,这种策略 组合由所有参与人最优策略组成。即在给定别 人策略的情况下,没有人有足够理由打破这种 均衡。纳什均衡,从实质上说,是一种非合作 博弈状态。27 哲学思考?如果参与人事前达成一个协议,在不存在外部 强制的情况下,每个人都有积极性遵守这个协 议,这个协议就是纳什均衡。28 Bargaining问题的普遍性?? ??? ? ? ? ?几乎所有的交易都涉及讨价还价: 买卖双方之间; 雇员与顾主之间; 合伙人之间; 竞争企业之间 夫妻之间; 政治领域之间; 中央政府与地方政府; 国家之间;29 所有讨价还价的共同之处?????达成某种协议是当事人的共同利益,但他们之 间在究竟达成哪一个协议的问题上存在利益冲 突;协议的多重行可能阻止任何协议的出现; 典型的“合作与竞争”问题; 合作意味着存在着帕累托改进,但不同的当事 人偏好不同的帕累托状态。 不同与集体选择(唯一均衡)和其他多重均衡; 不是零和博弈。30 寻找纳什均衡C1 R1 100,100 50,0 0,300 C2 C3 50,101 60,0 200,2000,01,1 0,0R2R331 纳什均衡:举例?广告博弈战略 做广告企业2做广告 不做广告 4,4 15,1 10,10企业1不做广告 1,15?纳什均衡:(做广告,做广告)32 利用纳什均衡寻租??考虑股票市场融资的例子:设想企业价值是 100,现在发行的流通股为100股,每股价值1 元。现在假定经理想筹集100元,投资价值只 有50元。有人买新股吗? 假定每一股配4股,价格为0.25元。如果股东 不接受配股:原来一股1元的价值就变成0.3元 (=150/500);如果接受配股,他持有的股票 的价值是1.5元;因为配股的成本是1元,所以 他的最优选择是接受配股。33 所有权配置与等级结构?考虑团队生产:让其中的一个人变成所 有者工作 偷懒 工作 偷懒6,68,00,82,234 纳什均衡与学习过程 q2R1NER2 q1 35 双寡头竞争:Cournot博弈? ?? ?两个企业同时选择产量,价格由市场决 定; P(Q) ? a ? (q1 ? q2 ) 假定需求函数为 q1 q2 为企业2的产 其中 为企业1的产量, 量 C(qi ) ? ci qi 假定成本函数为: 那么,利润函数为: ? ? q P(Q) ? cq ? q (a ? q ? q ? c)1 1 1 1 1 2? 2 ? q2 P(Q) ? cq2 ? q2 (a ? q1 ? q2 ? c)36 双寡头竞争(续)?企业最大化利润的一阶条件为:a ? c q2 q1 ? R1 (q2 ) ? ? 2 2 a ? c q1 q2 ? R2 (q2 ) ? ? 2 2NE 1?纳什均衡产量: q ?qNE 2a?c ? 3( a ? c) 2 ? 937?NE NE 纳什均衡利润为 ?1 ? ?2 垄断产量和垄断利润?垄断企业的目标函数:? M ? QP(Q) ? Qc ? Q(a ? Q ? c)?垄断产量: 垄断利润: ?a?c QM ? 2M?(a ? c) ? 4238 划拳博弈老虎老虎 鸡 虫 杠子 0,0 -1,1鸡1,-1 0,0虫0,0 1,-1杠子-1,1 0,0 1,-1 0,00,0 1,-1-1,10,00,0 -1,139 混合战略纳什均衡?有些博弈没有“纯战略”纳什均衡,但 有混合战略纳什均衡,如监督博弈。偷懒 监督 不监督 1,-1 -2,3 不偷懒 -1,2 2,2给定工人偷懒,老板的最优 选择是监督;给定老板监督, 工人的最优选择是不偷懒; 给定工人不偷懒,老板的最 优选择是不监督;给定老板 不监督,工人的最优选择是 偷懒;如此循环。40 纳什均衡的存在性问题??每一个有限博弈至少存在一个纳什均衡 (纯战略或混合战略); 如果一个博弈存在两个纯战略纳什均衡, 那么,一定存在第三个混合战略纳什均 衡。41 风险与均衡?由于纳什均衡要求理性共识和一致预期,当人 们可能犯小小的错误时,纳什均衡不一定被选 择。如下面这个博弈中,多数人将选择“下” 而不是“上”。左上 下 8, 10右-1000,97, 66, 5只要B有千分之一的 概念错误地选择右, A将选择下;如果B怀疑 A怀疑自己可能犯错误, B将选择右。所以,出现 的不是纳什均衡42 有问题的纳什均衡?C1 R1 C2 C3 0,2 3,2 2,22,21,3 2,03,12,2 2,3R2R343 纳什均衡的重要影响????纳什均衡理论奠定了现代主流博弈理论和经济理论的根本基础,正如克 瑞普斯(Kreps,1990)在《博弈论和经济建模》一书的引言中所说, “在过去的一二十年内,经济学在方法论以及语言、概念等方面,经历 了一场温和的革命,非合作博弈理论已经成为范式的中心??在经济学 或者与经济学原理相关的金融、会计、营销和政治科学等学科中,现在 人们已经很难找到不懂纳什均衡能够‘消费’近期文献的领域。”纳什 均衡的重要影响可以概括为以下六个方面 (1)改变了经济学的体系和结构。非合作博弈论的概念、内容、模型 和分析工具等,均已渗透到微观经济学、宏观经济学、劳动经济学、国 际经济学、环境经济学等经济学科的绝大部分学科领域,改变了这些学 科领域的内容和结构,成为这些学科领域的基本研究范式和理论分析工 具,从而改变了原有经济学理论体系中各分支学科的内涵。 (2)扩展了经济学研究经济问题的范围。原有经济学缺乏将不确定性 因素、变动环境因素以及经济个体之间的交互作用模式化的有效办法, 因而不能进行微观层次经济问题的解剖分析。纳什均衡及相关模型分析 方法,包括扩展型博弈法、逆推归纳法、子博弈完美纳什均衡等概念方 法,为经济学家们提供了深入的分析工具。 (3)加强了经济学研究的深度。纳什均衡理论不回避经济个体之间直 接的交互作用,不满足于对经济个体之间复杂经济关系的简单化处理, 分析问题时不只停留在宏观层面上而是深入分析表象背后深层次的原因 和规律,强调从微观个体行为规律的角度发现问题的根源,因而可以更 深刻准确地理解和解释经济问题。44 ???(4)形成了基于经典博弈的研究范式体系。即可以将各 种问题或经济关系,按照经典博弈的类型或特征进行分类, 并根据相应的经典博弈的分析方法和模型进行研究,将一 个领域所取得的经验方便地移植到另一个领域。 (5)扩大和加强了经济学与其他社会科学、自然科学的 联系。纳什均衡之所以伟大,就因为它普通,而且普通到 几乎无处不在。纳什均衡理论既适用于人类的行为规律, 也适合于人类以外的其他生物的生存、运动和发展的规律。 纳什均衡和博弈论的桥梁作用,使经济学与其他社会科学、 自然科学的联系更加紧密,形成了经济学与其他学科相互 促进的良性循环。 (6)改变了经济学的语言和表达方法。在进化博弈论方 面相当有造诣的坎多利(Kandori,1997)对保罗?萨缪 尔森(Paul Samuelson)的名言“你甚至可以使一只鹦鹉 变成一个训练有素的经济学家,因为它必须学习的只有两 个词,那就是‘供给’和‘需求’”,曾做过一个幽默的 引申,他说,“现在这只鹦鹉需要再学两个词,那就是 ‘纳什均衡’”。 45 3.博弈论的要素?博弈论的提法可能太过于学术化,容易让人们 退避三舍。其实它有一个非常通俗的名字--游 戏理论(博弈论的英文名字叫做&Game T heory&,如果直译,就是&游戏理论&)。 博弈论在我国还有一个名字,叫对策论。这些 名字都很好理解,博弈字面意思就是赌博、下 棋,赌博和下棋当然是游戏了,赌博和下棋的 时候常常要千方百计地应付对手,自然是要讲 究对策了。46 参与人 players??一个博弈中的决策主体,他的目的是通 过选择行动(或战略)以最大化自己的 支付(效用水平)。参与人可能是自然 人,也可能是团体,如企业,国家等。 重要的是:每个参与人必须有可供选择 的行动和一个很好定义的偏好函数。不 做决策的被动主体只能被当作环境参数。47 虚拟参与人pseudo-player??为了分析方便,自然nature被当作虚拟参 与人。 自然代表决定外生随机变量的概率分布 的机制。比如房地产开发中市场需求的 大小。48 行动 ACTIONS OR MOVES参与人在博弈的某个时点的决策变量。 (坦白) ? N个参与人的行动的有序集称为行动组 合 (坦白,抵赖)。?49 行动的顺序??对于博弈的结果非常重要。有关静态和 动态博弈的区分就是基于行动的顺序做 出的。 同样的行动集合,行动的顺序不同,每 个参与人的最有决策就不同,博弈的结 果也不同。尤其在不完全信息博弈中, 后行动者依赖观察先行动者的行动来获 取信息。50 信息 information??参与人有关博弈的知识,特别是有关自 然的选择,其他参与人的特征和行动的 知识。 完美信息perfect information:指一个参与 人对其他参与人的行动选择有准确的理 解,即每个信息集只包含一个值。51 共同知识common knowledge?所有参与人知道每一步的信息集。52 战略strategies????参与人在给定信息集的情况下的行动规 则,它规定参与人在什么时候选择什么 行动。 战略与行动:战略是行动的规则而不是 行动本身。 在静态博弈中,战略和行动是相同的。 战略必须是完备的,要给出参与人在每 一种可想象得到的情况下的行动选择。53 支付payoff(效用utility)?在一个特定的战略组合下参与人得到的 确定效用水平,或是指参与人得到的期 望效用水平。54 均衡equilibrium?指所有参与人的最优战略的组合。55 (二)历史沿革???犹太法典(Talmud)中一个男人如何将死后的财 产发给三个妻子的难题 . 博弈理论开始于1944年由冯? 诺依曼(Von Neumann)和摩根斯坦恩(Morgenstern)合作 的《博弈论和经济行为》(The Theory of Games and Economic Behaviour)一书的出版。 20世纪50年代以来,纳什、泽尔腾、海萨 尼等人使博弈论最终成熟并进入实用。56 三位大师主要的贡献?1950年和1951年纳什的两篇关于非合作 博弈论的重要论文,彻底改变了人们对 竞争和市场的看法。他证明了非合作博 弈及其均衡解,并证明了均衡解的存在 性,即著名的纳什均衡。从而揭示了博 弈均衡与经济均衡的内在联系。因为在 现实世界中,非合作博弈要比合作博弈 普遍得多。57 ??传统经济学对非合作博弈是以亚当斯密的看不见的 手来解释的。他的这项理论工作使得博弈论从此成 为经济学家用来分析商业竞争到贸易谈判种种现象 的有力工具。 Tucker于1950年定义了“囚徒困境” (prisoners’dilemma)。他们两个人的著作基本上 奠定了现代非合作博弈论的基石。到50年代,合作 博弈发展到鼎盛期,包括纳什(1950)和夏普里 (Shanley,1953)的“讨价还价”模型,Gillles和 Shanley(1953)关于合作博弈中的“核”(core) 的概念,以及其他一些人的贡献。58 Selten and Harsanyi?泽尔腾(1965)将 纳什均衡的概念引 入了动态分析,提 出了“精炼纳什均 衡”概念;以及进 一步刻画不完全信 息动态博弈的“完 备贝叶斯纳什均衡”?而海萨尼则发展了 刻画不完全信息静 态博弈的“贝叶斯 纳什均衡”(1967 -1968)。总之, 他俩进一步将纳什 均衡动态化,加入 了接近实际的不完 全信息条件。他们 的工作为后人继续 发展博弈论,提供 了基本思路和模型 59 (三)分类和主要思想??博弈论根据其所采用的假设不同而分为 合作博弈理论和非合作博弈理论。两者 的区别在于参与人在博弈过程中是否能 够达成一个具有约束力的协议。倘若不 能,则称非合作博弈?Non-Coo perative Game?。 合作博弈强调的是集体主义,团体理性 ?Collective Ration ality?,是效率、公平、公正;60 非合作博弈?而非合作博弈则主要研究人们在利益相 互影响的局势中如何选择策略使得自己 的收益最大,强调个人理性、个人最优 决策,其结果是有时有效率,有时则不 然。目前经济学家谈到博弈论主要指的 是非合作博弈,也就是各方在给定的约 束条件下如何追求各自利益最大化,最 后达到力量均衡。61 例子?比如两家企业A、B合作建设一条VCD的生 产线,协议由A方提供生产VCD的技术,B 方则提供厂房和设备。在对技术和设备进行资 产评估时就形成非合作博弈,因为每一方都试 图最大化己方的评估值,这时B方如果能够获 得A方关于技术的真实估价或参考报价这类竞 争情报,则可以使自己在评估中获得优势;同 理,A方也是一样。至于自己的资产评估是否 会影响合作企业的总体运行效率这样的&集体 利益&,则不会非常重视。这就是非合作博弈, 参与人在选择自己的行动时,优先考虑的是如 何维护自己的利益。62 顺序和信息?博弈论非常强调时间和信息的重要性, 认为时间和信息是影响博弈均衡的主要 因素。在博弈过程中,参与者之间的信 息传递决定了其行动空间和最优战略的 选择;同时,博弈过程中始终存在一个 先后问题?Sequence?Ord er?,参与人的行动次序对博弈最后 的均衡有直接的影响。63 分类?博弈的划分可以从参与人行动的次序和 参与人对其它参与人的特征、战略空间 和支付的知识、信息,是否了解两个角 度进行。把两个角度结合就得到了4种 博弈:完全信息静态博弈,完全信息动 态博弈,不完全信息静态博弈,不完全 信息动态博弈64 博弈的分类及对应的均衡静态 完全 信息 完全信息静态博弈; 纳什均衡; Nash(1950) 不完全信息静态博弈; 贝叶斯纳什均衡; 海萨尼() 动态 完全信息动态博弈; 子博弈精炼纳什均衡; 泽尔腾(1965) 不完全信息动态博弈, 精炼贝叶斯纳什均衡; 泽尔腾(1975) Kreps,Wilson(1982), Fudenberg,Tirole(1991) 65不完 全信 息 主要思想??博弈论并不是经济学的一个分支,它只是一种 方法,这也是为什么许多人将其看成数学的一 个分支的缘故。博弈论已经在政治、经济、外 交和社会学领域有了广泛的应用,它为解决不 同实体的冲突和合作提供了一个宝贵的方法。 在对参与者行为研究这一点上,博弈论和经济 学家的研究模式是完全一样的。经济学越来越 转向人与人关系的研究,特别是人与人之间行 为的相互影响和相互作用,人与人之间利益和 冲突、竞争与合作,而这正是博弈论的研究对 象。66 我们从博弈中学习什么?博弈论告诉人们,要学会理解他人都有自 己的思想,每个个体都是理性的,所以必 须了解竞争对手的思想。商业关系被认为 是一种相互作用。但博弈论并不是疗法, 并不是处方,它并不告诉你该付多少钱买 东西,这是计算机或者字典的任务。博弈 论只是提供一些关系的例证,一些有用的 解决问题的方法。这种思维方法也许是企 业家应该学习的。对于经济学家,也许需 要学习它的理论模型,它的实验方式67 对博弈论的两种极端评价???从20世纪70年代末期,学者们逐渐形成一个共识, 当一个人或群体与他或他们的博弈论对手都能以 理性的方式做出决策行为的时候,那就是博弈论 大显身手的场合。 有人将博弈论比作Mendel的遗传理论和Darwin的 自然选择对生物学的影响,或者Newton的天体力 学对物理学的奠基作用。 真正的社会并不严格是博弈论的理想对象,无论 是股票市场上的投机现象,还是受制于传统文化 的惯性影响下的体制选择。如同混沌动力系统理 论带给人们的初始兴奋之后,博弈论并不具有有 历史上像物理学中理论的预测能力。68 四.博弈论与运筹学??运筹学是近代应用数学的一个分支,主要是将 生产、管理等事件中出现的一些带有普遍性的 运筹问题加以提炼,然后利用数学方法进行解 决。前者提供模型,后者提供理论和方法。 运筹学本身也在不断发展,现在已经是一个包 括好几个分支的数学部门了。比如:数学规划 (又包含线性规划;非线性规划;整数规划; 组合规划等)、图论、网络流、决策分析、排 队论、可靠性数学理论、库存论、对策论、搜 索论、模拟等等。69 数学规划?数学规划的研究对象是计划管理工作中 有关安排和估值的问题,解决的主要问 题是在给定条件下,按某一衡量指标来 寻找安排的最优方案。它可以表示成求 函数在满足约束条件下的极大极小值问 题。70 排队论?排队论是运筹学的又一个分支,它有叫 做随机服务系统理论。它的研究目的是 要回答如何改进服务机构或组织被服务 的对象,使得某种指标达到最优的问题。 比如一个港口应该有多少个码头,一个 工厂应该有多少维修人员等71 搜索论?搜索论是由于第二次世界大战中战争的需要而 出现的运筹学分支。主要研究在资源和探测手 段受到限制的情况下,如何设计寻找某种目标 的最优方案,并加以实施的理论和方法。在第 二次世界大战中,同盟国的空军和海军在研究 如何针对轴心国的潜艇活动、舰队运输和兵力 部署等进行甄别的过程中产生的。搜索论在实 际应用中也取得了不少成效,例如二十世纪六 十年代,美国寻找在大西洋失踪的核潜艇“打 谷者号”和“蝎子号”,以及在地中海寻找丢 失的氢弹,都是依据搜索论获得成功的。72 五、完全信息动态博弈???纳什均衡的问题:多均衡、单选择性 (静态性),不可置信威胁的存在性 (市场进入博弈) 泽尔腾剔除了不可置信威胁战略,减少 了纳什均衡的个数 扩展型表述的要素:参与人、参与人行 动的时点、行动集合、信息,支付函数73 子博弈精炼纳什均衡?? ?当参与人的战略在每一个子博弈中都构 成纳什均衡。每一个子博弈都是最优的。 城市姑娘爱上农村小伙子导致姑娘父亲 的反应。 承诺行动(commitment),当事人使自己 威胁战略变得可信的行为。74 例子(要挟诉讼,曾诺行动与 精炼均衡的关系)?成功可能性非常小,目的是希望和解得 P 指控 到补偿。 不指控(0,0) 拒绝 起诉 P 放弃 (-C,0) 75 P 要求S D 接受 (S-C,-S)(TX-P-C,-TX-D) ??原告指控的目的本身意味着TX&P,原告 将选择放弃。子博弈精炼纳什均衡是: 原告选择(不指控,要求,放弃),被 告选择(拒绝);均衡结果为原告不指 控。 承诺行为,如果原告将P提前支付,TXC-P&-C-P,只要胜诉的可能大于0,原告 将起诉。如果S&TX+D,被告将接受原告 的赔偿请求。S的范围(TX,TX+D),赔偿 结果为TX+D/276 ?如果TX+D/2&C+P,原告提起诉讼;即使 TX&C+P,由于D值大, TX+D/2&C+P仍 有可能。( TX+D/2-C-P,-TX-D/2)案 件私了。77 不完全信息静态博弈??不了解对方的偏好、战略空间及各种战 略组合下的利润水平。 市场进入博弈在位者 默许 斗争 高成本 -10,0 -10,140 低成本 0,300 0,400 78 进入者40,50 30,100 0,300 不进入 0,400进入 海萨尼转换?? ? ??引入虚拟参与人“自然” 在所有后果间是无差异的。 自然的选择提供了被选择的参与人真实 类型的概率分布。 分布函数是共同知识。 “不完全信息”转换为“完全但不完美 信息”79 贝叶斯纳什均衡Bayesian equilibrium??给定自己的类型和对方类型的概率分布 的情况下,每个参与者的期望效用达到 了最大化,没有人有积极性选择其他战 略的类型战略依存组合。 期望利润=40x+(-10)(1-x)80 不完全信息动态博弈 -----精炼贝叶斯纳什均衡?? ?垄断限价模型(低成本价格与高成本价 格透露的信息) 信号传递模型 成本的信息含量81 求爱博弈???如果男人是柳下惠,女人穿少的时候他 会看的概率是20%;如果男人是登徒子, 女人穿少的时候他会看的概率是100%。 女人根据现有的信息判断男人是柳下惠 的概率为70%,因此女人估计自己穿少 的时候,男人看的概率为: 0.7*0.2+0.3*1=0.44 这是女人给定男人所属类型的先验概率 下,男人可能采取看的概率。82 续当男人的确看了的时候,使用贝叶斯法则,根 据男人看的这一行动,女人认为男人是柳下惠 的概率变为: 0.7*0.2/0.44=0.32?根据这一新的概念,女人估计自己穿少的时候男 人会刊的概率为: 0.32*0.2+0.68*1=0.744 如果女人将这种行为再重复一次,男人又看了, 则女人认为男人是柳下惠的概率变为:83 ?0.32*0.2/0.744=0.086这样女人通过男人一次次的看的行为,越 来越认为男人是登徒子而不是柳下惠。 这就是参与人行为传递信息的作用。84 (二)应用与分析?我们可以利用这个道理来分析日常 生活中的许多不合作现象。85 2. 生活中的“囚徒困境”例子例子1 商家价格战出售同类产品的商家之间本来可以 通过共同将价格维持在高位而获利,但 实际上却是相互杀价,结果都赚不到钱。 当一些商家共谋将价格抬高,消费 者实际上不用着急,因为商家联合维持 高价的垄断行为一般不会持久,可以等 待垄断的自身崩溃,价格就会掉下来。86 ?譬如,2000年我国几家生产彩电的大 厂商合谋将彩电价格维持高位,他们搞了 一个“彩电厂家价格自律联盟”,并在深 圳举行了由多家彩电厂商首脑参加的“彩 电厂商自律联盟高峰会议”。当时,国家 有关部门还未出台相关的反垄断法律,对 于这种在发达国家明显属于违法行为的所 谓“自律联盟”,国家在法律上暂时还是 无能为力的。寡头厂商在光天化日之下进 行价格合谋,并且还通过媒体大肆炒作, 这在发达国家是不可思议的。87 ?但是,尽管政府当时无力制止这种 事情,公众也不必担心彩电价格会上涨。 这是因为,“彩电厂商自律联盟”只不 过是一种“囚徒困境”,彩电价格不会 上涨。在高峰会议之后不到二周,国内 彩电价格不是上涨而是一路下跌。这是 因为厂商们都有这样一种心态:无论其 他厂商是否降价,我自己降价是 有利于自己的市场份额扩 大的。88 几个例子?? ??1.囚徒困境在经济学和生活中的例子 中东石油输出国 OPEC限产 几乎所有的卡特尔都会遭到失败,原因就在于 卡特尔的协定(类似囚犯的攻守同盟)不是一 个纳什均衡,没有成员有兴趣遵守。那么是不 是不可能有卡特尔合作成功了?理论上,如果 是无限期的合作,双方考虑长远利益,他们的 合作是会成功的。但只要是有限次的合作,合 作就不会成功。比如合作10次,那么在第九 次博弈参与人就会采取不合作态度----参与者效用多重性,漂亮女生89 价格战?? ?厂家价格大战的结局也是一个“纳什均衡”,而且价 格战的结果是谁都没钱赚。因为博弈双方的利润正好 是零。竞争的结果是稳定的,即是一个“纳什均衡”。 这个结果可能对消费者是有利的,但对厂商而言是灾 难性的。所以,价格战对厂商而言意味着自杀。 引伸出两个问题,一是竞争削价的结果或“纳什均衡” 可能导致一个有效率的零利润结局。 二是如果不采取价格战,作为一种敌对博弈论 (rivalry game)其结果会如何呢?每一个企业,都会 考虑采取正常价格策略,还是采取高价格策略形成垄 断价格,并尽力获取垄断利润。如果垄断可以形成, 则博弈双方的共同利润最大。这种情况就是垄断经营 所做的,通常会抬高价格。另一个极端的情况是厂商 90 用正常的价格,双方都可以获得利润。 有趣的联系??我们又引出一条基本准则:“把你自己的战略建立在 假定对手会按其最佳利益行动的基础上”。事实上, 完全竞争的均衡就是“纳什均衡”或“非合作博弈均 衡”。在这种状态下,每一个厂商或消费者都是按照 所有的别人已定的价格来进行决策。在这种均衡中, 每一企业要使利润最大化,消费者要使效用最大化, 结果导致了零利润,也就是说价格等于边际成本。 在完全竞争的情况下,非合作行为导致了社会所期望 的经济效率状态。如果厂商采取合作行动并决定转向 垄断价格,那么社会的经济效率就会遭到破坏。这就 是为什么WTO和各国政府要加强反垄断的意义所在。91 占优战略??不论其他参与人选择什么战略,它的最 优战略是唯一的,这样的最优战略被称 为占优战略。 重复剔除严格劣战略92 ?双均衡的性别战性别战与先动优势女足球 男 足球芭蕾芭蕾2 ,10 ,00,01,293 纯战略与混合战略??如果一个战略规定参与人在每一个给定 的信息情况下只选择一种特定的行动, 称为纯战略。 如果一个战略规定参与人在给定的信息 情况下以某种概率分布随机地选择不同 的行动,称为混合战略。94 监督博弈的纳税检查?A 为应纳税款,C为检查成本, F是偷税 罚款。假定 C&A+F。不存在纯战略纳什 纳 均衡。 纳税人逃税税收机关 检查 A-C+F,-A-F 不检查 税 人 不逃税A-C, -A0,0A,-A95 纳税检查边际S 为税务机关检查的概率,E为纳税人逃 税概率。给定E,税收机关选择检查与 否的期望收益: ? K(1,E)=(A-C+F)E+(A-C)(1-E) =EF+A-C K(0,E)=0E+A(1-E)=A(1-E) 解K(1,E)= K(0,E),得:E=C/(A+F)纳税人 逃税概率小于E,税收机关的最优决策是 不检查,否则则反。?96 逃税边际??? ??给定S,纳税人选择逃税与否的期望收益是: K(S,1)=(-A-F)S+0(1-S)=-(A+F)S K(S,0)=-AS+(-A)(1-S)=-A 解K(S,1)= K(S,0) ,得S=A/(A+F)即,如果 税收机关检查的概率小于S,纳税人的最优选 择是逃税,否则交税。 混合纳什均衡是S,E,即税收机关以S的概率 查税,而纳税人以E的概率逃税。97 ? ? ?污染博弈 贸易自由与壁垒 博弈论是一个强有力的分析工具。现在,它不 仅在经济学领域、在军事、政治、商业征战、 社会科学领域以及生物学等自然科学领域都有 非常重大的影响,工程学中如控制论工程也少 不了它。帮助大家形成博弈论的基本概念,实 际上它是非常精深的。现在与它紧密联系的经 济学分支是信息经济学。信号游戏、拍卖形式、 激励机制、委托人--代理人理论和公共财政学 是博弈论和信息经济学研究的重要课题98 ?例子2 为什么政府要负责修建公共设施,因 为私人没有积极性出资修建公共设施设想有两户相居为邻的农家,十分需要 有一条好路从居住地通往公路。修一条路的 成本为4,每个农家从修好的好路上获得的好 处为3。如果两户居民共同出资联合修路,并 平均分摊修路成本,则每户居民获得净的好 处(支付)为 3-4/2=1 ;当只有一户人家单独 出资修路时,修路的居民获得的支付为3-4=-1 (亏损), “搭便车”不出资但仍然可以使 用修好的路的另一户人家获得支付 3-0=3,见 表 2。99 表2 修路博弈乙 修 修 1,1 不修 -1,3甲不修3,-10,0100 我们看到,对甲和乙两家居民来说, “修路”都是劣战略,因而他们都不会 出资修路。这里,为了解决这条新路的建设问 题,需要政府强制性地分别向每家征税2 单位,然后投入4单位资金修好这条对大 家都有好处的路,并使两家居民的生活 水平都得到改善。101 这就是我们看到的为什么大多数路、桥等公共设施都是由政府出资修建的原 因。 同样的道理,国防、教育、社会保 障,环境卫生等都由政府承担资金投入, 私人一般没有积极性承担这方面服务的 积极性和能力。102 例子3 苏格兰的草地为什么消失了?公共资源 经常被过度利用的原因。在 18 世纪以前,英国苏格兰地区有 大量的草地,其产权没有界定,属公共 资源,大家都可以自由地在那里放牧。 草地属于“可再生资源”,如果限制放 牧的数量,没有被牛羊吃掉的剩余草皮 还会重新长出大面积草场,但如果不限 制放牧规模,过多的牛羊将草吃得一光 二净,则今后不会再有新草生长出来, 草场就会消失。103 由于草地的产权没有界定,政府也 没有对放牧作出规模限制,每家牧民都 会如此盘算:如果其他牧民不约束自己 的放牧规模,让自己的牛羊过多地到草 地上吃草,那么,我自己一家约束自己 的放牧规模规模对保护草场的贡献是微 乎其微的,不会使草场免于破坏;相反, 我也加入过度放牧的行列,至少在草场 消失之前还会获得一部分短期的收益。104 如果其他牧民约束放牧规模,我单 独一家人过度放牧不会破坏广褒的牧场, 但自己却获得了高额的收益。因此,任 何一位牧民的结论都会是:无论其他牧 民是否过度放牧,我选择“约束自己的 放牧规模”都是劣战略,从而被剔除。 大家最终都会选择过度放牧,结果导致 草地消失,生态破坏。105 ?类似的例子还有:渤海中的鱼愈来愈少了,工业化中的大气 及河流污染,森林植被的破坏等。解决公共资 源过度利用的出路是政府制订相应的规制政策 加强管理,如我国政府规定海洋捕鱼中,每年 有一段时间的“休渔期”,此时禁止捕鱼,让 小鱼苗安安静静地生长,大鱼好好地产卵,并 对鱼网的网眼大小作出规定,禁用过小网眼的 捕网打鱼,保护幼鱼的生存。又如在三峡库区, 为了保护库区水体环境,关闭了前些年泛滥成 灾的许多小造纸厂等。106 ?例子4 为什么在城市中心道路上禁止汽 车鸣喇叭? 禁鸣喇叭一方面是为了控制城市噪 声污染,另一方面是基于以下的博弈论 原因。见表3,当汽车司机可以鸣喇叭时, 可能为汽车超速抢行提供条件。但当大 家都抢行时,城市交通拥挤加重,反而 都难以顺利通行,获得低支付(2,2)。107 表3 交通博弈 司机2 缓行 缓行 司机1 抢行8,89, 11,92,2抢行108 ?但当对方缓行时,自己抢行会占便 宜,获得支付9。 这个博弈中,“缓行”是劣战略, 剔除后得到“剔除劣战略后的占优战略 均衡”(抢行,抢行),这不是一个好的 均衡。当禁止鸣喇叭时,司机为了避免 造成交通事故,只得缓行,从而得到好 的结果(缓行,缓行)。109 ?例子5 为什么要加入WTO?WTO是一个自愿性申请加入的自由贸易 联盟,即WTO成员国之间实现低关税或零关 税的相互间自由贸易。为什么需要一个组织来 协调国家之间的自由贸易呢?这是因为,如果 没有一个协调组织,国与国之间的贸易就不会 呈现低关税或零关税的自由贸易局面,因为这 时国与国之间的贸易是一个“囚徒困境”。给 定一个国家对另一个国家的货物实行低关税, 另一个国家反过来对这个国家的货物实行高关 税是占优于实行低关税的战略的。110 三、智猪博弈(Pigs’payoffs) :对 诸多经济现象的解释?在博弈论(Game Theory)经济学中, “智猪博弈”是一个著名的纳什均衡的例 子。假设猪圈里有一头大猪、一头小猪。 猪圈的一头有猪食槽,另一头安装着控制 猪食供应的按钮,按一下按钮会有10个单 位的猪食进槽,但是谁按按钮就会首先付 出2个单位的成本,若大猪先到槽边,大 小猪吃到食物的收益比是9∶1;同时到槽 边,收益比是7∶3;小猪先到槽边,收益 比是6∶4。那么,在两头猪都有智慧的前 提下,最终结果是小猪选择等待。111 1. 智猪博弈(Pigs’payoffs)猪圈中有一头大猪和一头小猪,在猪圈的 一端设有一个按钮,每按一下,位于猪圈另一 端的食槽中就会有 10 单位的猪食进槽,但每按 一下按钮会耗去相当于2单位猪食的成本。如果 大猪先到食槽,则大猪吃到9单位食物,小猪仅 能吃到1单位食物;如果两猪同时到食槽,则大 猪吃 7 单位,小猪吃 3 单位食物;如果小猪先到, 大猪吃6单位而小猪吃4单位食物。表4给出这个 博弈的支付矩阵。112 ??实际上小猪选择等待,让大猪去按控制按钮,而自己选择 “坐船”(或称为搭便车)的原因很简单:在大猪选择行动 的前提下,小猪也行动的话,小猪可得到1个单位的纯收 益(吃到3个单位食品的同时也耗费2个单位的成本,以下 纯收益计算相同),而小猪等待的话,则可以获得4个单位 的纯收益,等待优于行动;在大猪选择等待的前提下,小 猪如果行动的话,小猪的收入将不抵成本,纯收益为-1单 位,如果大猪也选择等待的话,那么小猪的收益为零,成 本也为零,总之,等待还是要优于行动。 两只猪各会采取什么策略?答案是:小猪将选择“搭便车” 策略,也就是舒舒服服地等在食槽边;而大猪则为一点残 羹不知疲倦地奔忙于踏板和食槽之间。 原因何在?因为,小猪踩踏板将一无所获,不踩踏板 反而能吃上食物。对小猪而言,无论大猪是否踩动踏板, 不踩踏板总是好的选择。反观大猪,已明知小猪是不会去 踩动踏板的,自己亲自去踩踏板总比不踩强吧,所以只好 亲力亲为了。113 智猪博弈?每次按出10个萝卜,按者支付2个单位成 本,大先,(9,1)小先(6,4)同时 (7,3) 按 小猪 等待大猪按 等待5,19,-14 ,40 ,0114 表4 智猪博弈小猪 按大猪 等待 按 5,1 9, -1 等待 4,4 0,0115 ?从矩阵中可以看出,当大猪选择行动的时 候,小猪如果行动,其收益是1,而小猪等 待的话,收益是4,所以小猪选择等待;当 大猪选择等待的时候,小猪如果行动的话, 其收益是-1,而小猪等待的话,收益是0, 所以小猪也选择等待。综合来看,无论大 猪是选择行动还是等待,小猪的选择都将 是等待,即等待是小猪的占优策略。116 ?这个博弈没有“剔除劣战略均衡”,因为 大猪没有劣战略。 但是,小猪有一个劣战略“按”,因为无 论大猪作何选择,小猪选择“等待”是比选择 “按”更好一些的战略。 所以,小猪会剔除“按”,而选择“等 待”;大猪知道小猪会选择“等待”,从而自 己选择“按”,所以,可以预料博弈的结果是 (按,等待)。这称为“重复剔除劣战略的占优 战略均衡”,其中小猪的战略“等待”占优于 战略“按”,而给定小猪剔除了劣战略“按” 后,大猪的战略“按”又占优于战略“等待”。117 ??在小企业经营中,学会如何“搭便车”是一个精 明的职业经理人最为基本的素质。在某些时候, 如果能够注意等待,让其他大的企业首先开发市 场,是一种明智的选择。这时候有所不为才能有 所为! 高明的管理者善于利用各种有利的条件来为 自己服务。“搭便车”实际上是提供给职业经理 人面对每一项花费的另一种选择,对它的留意和 研究可以给企业节省很多不必要的费用,从而使 企业的管理和发展走上一个新的台阶。这种现象 在经济生活中十分常见,却很少为小企业的经理 人所熟识。118 “小猪躺着大猪跑”的现象是由于故事中的游戏规则所导 致的。规则的核心指标是:每次落下的事物数量和踏板与投食 口之间的距离。 如果改变一下核心指标,猪圈里还会出现同样的“小猪躺 着大猪跑”的景象吗?试试看。 改变方案一:减量方案。投食仅原来的一半分量。结果是 小猪大猪都不去踩踏板了。小猪去踩,大猪将会把食物吃完; 大猪去踩,小猪将也会把食物吃完。谁去踩踏板,就意味着为 对方贡献食物,所以谁也不会有踩踏板的动力了。 如果目的是想让猪们去多踩踏板,这个游戏规则的设计显 然是失败的。 改变方案二:增量方案。投食为原来的一倍分量。结果是 小猪、大猪都会去踩踏板。谁想吃,谁就会去踩踏板。反正对 方不会一次把食物吃完。小猪和大猪相当于生活在物质相对丰 富的“共产主义”社会,所以竞争意识却不会很强。 对于游戏规则的设计者来说,这个规则的成本相当高(每 次提供双份的食物);而且因为竞争不强烈,想让猪们去多踩 踏板的效果并不好。 改变方案三:减量加移位方案。投食仅原来的一半分量, 但同时将投食口移到踏板附近。结果呢,小猪和大猪都在拼命 119 地抢着踩踏板。等待者不得食,而多劳者多得。每次的收获刚? ?对于游戏设计者,这是一个最好的方案。成本不高,但收 获最大。 原版的“智猪博弈”故事给了竞争中的弱者(小猪) 以等待为最佳策略的启发。但是对于社会而言,因为小猪 未能参与竞争,小猪搭便车时的社会资源配置的并不是最 佳状态。为使资源最有效配置,规则的设计者是不愿看见 有人搭便车的,政府如此,公司的老板也是如此。而能否 完全杜绝“搭便车”现象,就要看游戏规则的核心指标设 置是否合适了。 比如,公司的激励制度设计,奖励力度太大,又是持 股,又是期权,公司职员个个都成了百万富翁,成本高不 说,员工的积极性并不一定很高。这相当于“智猪博弈” 增量方案所描述的情形。但是如果奖励力度不大,而 且见者有份(不劳动的“小猪”也有),一度十分努力的 大猪也不会有动力了----就象“智猪博弈”减量方案一所 描述的情形。最好的激励机制设计就象改变方案三----减 量加移位的办法,奖励并非人人有份,而是直接针对个人 (如业务按比例提成),既节约了成本(对公司而言), 又消除了“搭便车”现象,能实现有效的激励。 120 实际生活中的智猪博弈?? ? ?“搭便车”现象; 公共物品,穷人和富人修路博弈(中产 阶级对社会的稳定作用); 大股东对管理者的监督; 天塌下来有高个子顶着。121 博弈与制度 由智猪博弈故事得到的启示?在这个例子中,对小猪而言,无论大猪是否踩动踏板,不去踩踏板总比踩踏板好。反观大猪,明知小猪不会去踩踏板,但是 去踩踏板总比不踩强,所以只好亲历亲为了。这个案例令我们 不得不思考 : ?“智猪博弈”故事给了竞争中的弱者(小猪)以等待为最佳策略 的启发。在博弈中,每一方都要想方设法攻击对方、保护自己, 最终取得胜利;但同时,对方也是一个与你一样理性的人,他 会这么做吗?这时就需要更高明的智慧。博弈其实是一种斗智的 竞争。作为一门科学,博弈论就是研究不同主体之间相互影响 行为的一种学问。或者准确地说,博弈论是研究决策主体行为 发生直接相互作用时的决策以及这种决策的均衡问题的学问, 因此也有人把它称为“对策论”。 ?对于企业经营者来说,如何理解博弈论,如何运用博弈论原理 指导企业有效管理,这是值得思考的事情。在价格和产量决策、 经济合作和经贸谈判、引进和开发新技术或新产品、参与投标 拍卖、处理劳资关系,以及在与政府的关系和合作等多方面, 博弈论都是企业经营者十分有效的决策工具,或者至少是比较 科学的决策思路。 122 ???还有一个经典案例,是说当年英国政府将流放澳洲的犯人 交给往来于澳洲之间的商船来完成,由此经常会发生因商 船主或水手虐待犯人,致使大批流放人员因此死在途中 (葬身大海)的事件发生。后来大英帝国对运送犯人的办法 (制度)稍加改变,流放人员仍然由往来于澳洲的商船来运 送,只是运送犯人的费用要等到犯人送到澳洲后才由政府 支付给商船。仅就这样一点小小的“改变”,几乎再也没 有犯人于中途死掉的事情发生。 关于这一问题,现任招商局掌门人秦晓先生在最近做 客央视《对话》节目时,也谈了他的一些看法。他认为: 企业领导人应该去制定游戏规则,而不应该单纯地去做裁 判。他觉得制度应当比个人的权威和魅力更重要。小平同 志讲过一句话,说一个好的制度可以约束坏人;一个坏的 制度呢可以使好人变坏。回顾历史,我们动不动就说获诺 贝尔奖学金会怎么样,爱迪生又发明了什么,但几乎少有 人讲保险制度对社会进步的贡献有多大,专利制度对社会 进步的贡献有多大。于是乎,又引出另一个新的问题―― 制度与文化 123 2. 例子在经济生活中,有许多“智猪博弈”的例子。例子6 股市博弈 许多人并未读过“智猪博弈”的故事,但是却在自觉地使用小猪 的策略。股市上等待庄家抬轿的散户;等待产业市场中出现具有赢利能 力新产品、继而大举仿制牟取暴利的游资;公司里不创造效益但分享成 果的人,等等。因此,对于制订各种经济管理的游戏规则的人,必须深 谙 “ 智 猪 博 弈 ” 指 标 改 变 的 个 中 道 理 。 在股票市场上,大户是大猪,他们要进行技术分析,收集信息、预测股 价走势,但大量散户就是小猪。 他们不会花成本去进行技术分析,而是跟着大户的投资战略进行股 票买卖,即所谓“散户跟大户”的现象。124 ?例子7 为何股份公司中的大股东才有投 票权?在股份公司中,大股东是大猪,他们要收集信息监督经理,因而拥有决定 经理任免的投票权,而小股东是小猪, 不会直接花精力去监督经理,因而没有 投票权。125 例子8 为什么中小企业不会花钱去开发 新产品? 在技术创新市场上,大企业是大猪, 它们投入大量资金进行技术创新,开发 新产品,而中小企业是小猪,不会进行 大规模技术创新,而是等待大企业的新 产品形成新的市场后生产 模仿大企业的新产品的产 品去销售。126 例子9 为什么只有大企业才会花巨额金钱打广告?大企业是大猪,中小企 业是小猪。大企业投入大量 资金为产品打广告,中小企业等大企业的广告为产品打开销路形成市场后才生产类似产品进行销售。127 三、纳什均衡与商业中心区的形成表5给出的博弈中,甲和乙都没有劣战略,所以,不能通过重复剔除劣 战略获得博弈结果。128 表5 存在纳什均衡的博弈 乙 L U 甲 D 1,1 2,3 M 4,2 1,2 R 1,3 2,1(问题2:甲和乙分别会选择什么战略?)129 当甲选“ U” 时,乙会选“ R” ; 而当乙选“R”时,甲应该选“D”而 不是“U”;但当甲选“D”时,乙会 选“L”;给定乙选“L”,甲选“D” 是最好的选择,他不会改变选择 “D”;给定甲不改变选“D”,乙也 不会改变其选择“ L” 。所以,可以 预期(D,L)是甲乙最终完成的稳定 的选择。130 ?称(D,L)为 “纳什均衡”。纳 什均衡是局中人战略选择上构成的 一种“僵局”,给定其他局中人的 选择不变,任何一个局中人的选择 是最好的,他也不会改变其战略选 择。剔除劣战略的占优战略均衡和 重复剔除劣战略的占优战略均衡是 纳什均衡,但相反的结论不成立。131 ?在城市街道上,我们常见到一些地 段上的商店十分拥挤,构成一个繁荣的 商业中心区,但另一些地段却十分冷僻, 没什么商店。对于这种现象,我们可以 运用纳什均衡的概念来加以解释。 甲乙? ? 1/2132图1 商业位置博弈 ?见图1,有一个长度为1单位的街道,在街道两边均匀地分布着居民。现有两家商店决定在街道上确定经营位Z。如果甲在街道中间位Z1/2处设店,则乙的最好选择是紧靠甲 的左边或右边设店。133 ?当乙在甲的右边紧靠甲设店时,其 右边街道上的顾客都是乙的顾客;如果 乙不是紧靠甲而是远离甲设店,则其顾 客只是其右边街道的居民,不如它紧靠 甲设店时多,因而在远离甲的位Z设店 是劣战略。所以给定甲在1/2处设店,乙 在紧靠甲的左边或右边设店是最优的。 反过来,给定乙在接近1/2处设店,甲的 最优选择也是在1/2附近设店。这样,甲 和乙挤在1/2处设店就是纳什均衡,这就 是商业中心区的形成原理。134 四、动态博弈与承诺行动如果局中人在进行行动选择时有先 后顺序之分,这种博弈就被称为“动态 博弈”。 在图2中,有两个房地产开发商A和B 分别决定在同一地段上开发一栋写字楼。 由于市场需求有限,如果他们都开发, 则在同一地段会有两栋写字楼,超过了 市场对写字楼的需求,难以完全出售, 空Z房太多导致各自亏损1百万。135 当只有一家开发商在这个地段开发一栋写字楼时,它可以全部售出,赚得利润1百万。假定A先决策,B在看见A的决策后再决策是否开发写字楼。在图2中, 用“博弈树”表示博弈过程。136 开发 B 开发A不开发 B不开发开发不开发(-1,-1)(1,0)(0,1)(0,0)图2 房地产开发博弈137 ?在其中每一条“路径”的末端用向 量给出A和B的支付,称为支付向量。 下面用“逆向归纳法”可以求解这 个博弈。在B进行决策的2个“决策结” 上,B在左边的决策结上选择“不开 发 ” ; 而 在 右 边 的 决 策 结 上 选 择“ 开 发”。即给定A开发,B就不开发;给定 A 不开发, B 就开发。 B 应避免同时与 A 都选择开发而蒙受损失。138 ?在这种情况下,A在自己的决策结上当然 选择“开发”,因为他预计当自己选择“开发” 后,B会选择“不开发”,自己就净赚一百万。 当 B 威胁 A 说:“不管你是否开发,我都会在 这里开发写字楼。”倘若 A 将 B 的话当了真, A 就不敢开发,让 B 单独开发写字楼占便宜。 但是,B的威胁是“不可Z信”的。 当 A 不理会 B 的威胁而果断地开发出一栋 写字楼时,B其实不会将事前的威胁付诸实施。 因为“识时务者为俊杰”,在A已开发的情况 下, B 的最优决策是“不开发”而不是“开 发”。139 但是,如果B在向A发出威胁的 同时又当着A的面与第三者C打赌一 定要在该地段上开发出一栋写字楼, 否则输给 C 2 百万元。 B 与 C 为此签 定合同并加以公证有效。这时,博弈变成图3所示的动态 博弈。140 开发 B开发A不开发B不开发开发不开发(-1,-1)(1,-2)(0,1)(0,-2)图3 承诺行动后房地产开发博弈141 ?称 B 的这种行动为“承诺行动”, 它使原来不可Z信的威胁变为可以Z信。 这时,A就不得不相信B一定要开发写字 楼的威胁了,于是放弃开发写字楼的计 划,让B如愿以偿单独开发写字楼。B不 仅未向 C 支付 2 百万元,反而净赚 1 百万。 我们可以运用“承诺行动”的原理 来分析许多经济及军事现象。142 例子10 项羽的“破釜沉舟”。 例子 11 韩信赵国之战,“置之死地而后 生”。 例子 12 欧共体在空中客车与波音公司的 竞争中对空中客车公司的战略性补贴。 欧共体为了打破美国波音公司对全球 民航业的垄断,曾放弃欧洲传统的自由竞 争精神而对与波音公司进行竞争的空中客 车公司进行补贴。143 当双方都未获得政府的补贴时,两个公司都开发新型飞机会因市场饱和而亏损,但若一家公司开发而 另一家公司不开发时,则开发的那 家公司会获巨额 利润,见表6。144 表6 未补贴时的博弈 空中客车开发开发 波音 不开发 -10,-10 0, 100不开发100,0 0,0145 ?此时有两个纳什均衡,即一家开 发而另一家不开发。 下面,考虑欧共体对空中客车 进行补贴 20 个单位的情况。此时, 当两家都开发时,空中客车仍然盈 利 10 单位而不是亏损,博弈矩阵见 表7。146 表7 有补贴时的博弈空中客车开发 开发 波音 不开发 -10,10 0, 120 不开发 100,0 0,0147 这时只有一个纳什均衡,即波音公司不开发和空中客车公司开发的均衡(不开发,开发),这有利于空中客车。在这里,欧共体对空中客车的补贴就是使空中客车一定要开发(无论波音 是否开发)的威胁变得可Z信的一种 “承诺行动”。148 例子13 为什么大人物、大公司要聘请常年 律师?大人物、大公司对声誉十分看重,因 而为一些不良人物或公司通过诽谤大人物、 大公司企图迫使大人物、大公司花钱“私 了”而获利。这是因为,尽管对于一些无 端的指控,大人物、大公司可望通过法律 手段(打官司)而出清了结,但打官司请 律师会增加他们额外的成本。如果能花稍 少一些钱“私了”,则既使自己清白又省 钱,同时诽谤者也获得收入。149 大人物、大公司为了避免这种无端 的损失,干脆花钱请常年律师,律师费 用已经一次性支付,打官司不会带来额 外的花费。这是一个承诺行动,它告诉 潜在的诽谤者,大人物、大公司一旦受 到无端诽谤必定会让他们吃官司。这样, 大人物、大公司因此承诺行动而使自己 得到保护,避免了许多无端指控的发生。150 例子14 如何以弱敌强在战争史上,以弱胜强的例子是很多 的。在商业竞争中,以弱敌强也是经常会 遇到的情形。在二战中的诺曼底登陆战的 谋略策划中,盟军就面临以弱敌强的问题。 盟军有两个可以选择的登陆目标地,一是 多佛,二是诺曼底。德国守军在人数上超 过了盟军,并且就军事进攻而言,在人数 相同的情况下,攻方与守方相比会处于不 利的情形。151 下面,将这种情形模型化。有一支军 队准备进攻一座城市,它有军力两个师。 守城军队有三个师。通往城市有甲、乙两 条道路或方向。两军相遇时,人数居多的 一方取胜,当两方人数相等时,守方获胜。 假定军队只能整师调动。152 攻方战略:a=两个师集中沿甲方向进攻b=兵分两路,一个师沿甲方向进攻,另一个师沿乙方向进攻c=两个师集中沿乙方向进攻153 守方战略: A=三个师集中守甲方向 B=两个师守甲方向,一个师守乙方向 C=一个师守甲方向,两个师守乙方向 D=三个师集中守乙方向154 用“+”、“-”,分别表示胜和败,见下 表A a 进攻方 b c-,+守方 B C-,+ -,+D+, -+, --, + -, ++, -+, -+, --,++, -表1 以弱敌强博弈155 用“重复剔除劣战略”分析: 进攻方无劣战略,但守方有劣战略,A劣于B, D 劣于 C ,故守方不会采用战略 B 和 C ,剔除后的 博弈变为: 守方 B C a -,+ +, - 进攻方 b -,+ -,+ c +, - -,+ 表2 守方剔除劣战略后的博弈156 攻方知道守方不会选A和D,他由此 知道博弈变成上图所示。此时,攻方就 有一个劣战略b,他剔除b后得到新的博 弈,见下表: 守方 a -,+ +, - 进攻方 +, - -,+ b 表3 攻方剔除劣战略后的博弈157 此时,两方的形势是相同的, 即攻方尽管开始在军力上劣于守方, 但实际上它只要运用计谋,其获胜 的可能与守方是相同的。158 五、不对称信息下的博弈?博弈论作为经济学研究的有力工具, 真正大行其道是在 70 年代不对称信息下 经济行为分析的兴起。不对称信息指一 些局中人拥有别的局中人不拥有的“私 人信息”,也就是说一些局中人知道别 的局中人不知道的某些情况。下面用一 些例子说明这种情形下的博弈行为。159 例子15 二手车市场为什么难以建立?在发达国家,二手车(旧车)的价 格往往比新车差一大截,即使旧车本身 没有什么质量问题,一旦旧车进入二手 车市场,其价格就会与新车相比差得老 远。在我国许多城市,二手车市场甚至 难以建立起来,原因是进入市场的买车 人太少。这是为什么呢?二手车市场的 博弈理论为我们解答了这个谜语。160 在二手车市场上,卖车人比买车人更多地 知道车的质量情况,但卖车人不会将旧车的质 量问题老老实实地告诉买车人。买车人也知道 这种情形,因此,买车人在开出价格时会考虑 到车的质量问题。假定没有问题的好车价值20 万元,有问题的坏车只值10万元,并且设买车 人认为市场上出现好车和坏车的可能性各占一 半。这时,买车人开出的价格不会高于 1/2×20+1/2×10=15 万元。这样,如果卖车人 的车果真是好车,他就不会出售,好车退出市 场,但当卖车人的车是坏车时,他会十分积极 地将只值10万元的车按15万元卖给他。161 但买车人知道愿意按15万元卖的车一定是 坏车,从而认定市场上全是坏车。所以,除非 他愿意买一辆坏车,否则他会退出市场。当他 愿买坏车时,他只开出10万元的价。于是,旧 车市场或者建立不起来,没有买主,或者充斥 着坏车,真正的好车退出市场,而坏车在不断 成交,但价格很低。 类似现象广泛存在如人才市场、信贷市场 等。如一个公司往往流走的是能力强的人,因 为公司不能正确评价一个能力强的员工的能力, 给予的薪水低于其市场价值。162 例子16 维克里拍卖法 如果有一件古董需要拍卖,有许多 人参加竞争性拍卖。这件古董在每个买 主心中有一个价值评价。但是,卖主不 知道买主的评价,买主也不会老实将其 对古董的评价告诉卖主。不同买主之间也不知道其他人的价值评价。163 ?如果采用“英式拍卖法”,买主们轮流出 价,直到开出最高价的买主拿走古董并支付所 开出的最高价格。按这种拍卖方法,古董并不 能按买主心中的最高评价价值卖出。壁如,当 买主中的最高评价为 100万元,第二高评价为 90万元时,当评价最高的买主开出91万元时, 就可买走其评价为 100 万元的古董但只支付了 91万元。由于这是公开竞价,会出现围标问题, 即买主们合谋压价。164 另一种方法是:“一级密封价格拍卖法”。 买主每人将其开出的价格写入一个信封,密封后 交给卖主。卖主拆开所有信封,将古董卖给信封 中出价最高的买主,并要求支付最高的价格。这 种方法可避免 围标,但不能将古董按买主中最 高的评价价值卖出。因为买主不会按心中的评价 老老实实地将价格写为其价值评价。如果该买主 认为古董值100万元,他不会写出价格为100万元, 因为当他开出比 100 万更低一些的价格时,有可 能赢得古董但净赚一个价值与价格的差额。如当 他开出90万元时,有可能成交并净赚10万元。相 反,当他开出 100 万元时,即使成交也无赚头。 所以,大家都不会老老实实报出心中的价值。165 ??经济学家维克里发明的“二级密封 价格拍卖法”(又称维克里拍卖法或维 克里招标法),既可 避免 围标,又可诱 使买主们老老实实地开出心中的真实评 价。 维克里拍卖法要求每个买主写入信封一 个出价,密封后交给卖主,卖主拆开信 封后宣布将古董卖给出价最高的人,但 只需支付开出的第二高的价格。譬如, 出价最高的为100万元,第二高的为90万 元,古董就卖给开出100万元的人,但他 只需支付给卖主90万元。166 对每个买主来说,他不知道其他买 主的评价,但给定其他买主的评价(尽 管他不知道),他一旦获胜,支付的第 二高的价格是固定的,不会随他开出的 价格而变;但他开出的价格愈高,获胜 的可能就愈大;但是,他不能开出比他 的价值评价更高的价格。因为一旦存在 别的人开出的价格比他的价值评价还要 高,当他获胜时,就必须以高出他的价 值评价的价格购买古董,对他来说是得 不偿失的。167 所以,每个人都会老老实实在按心中 的评价开出价格。如果所有人的评价是 一样的,古董就以真实的最高价值卖出。 维克里拍卖法可以诱使买主说出真话。70年代美国联邦政府运用维克里招标 法进行公共工程招标,为联邦政府节省 了大笔开支。168 例子17 垄断厂商的低价销售:信号传递 博弈 有许多垄断厂商并未如人们所料想 的那样给商品定出一个很高的价格,而 是以较低的价格长期销售某种产品。譬 如,发达国家的私营铁路、航空、海运 码头等的价格都远低于按照其垄断定价 方法定出的价格。这是什么原因呢?169 记得有一个电视剧,其中有一个情节是一 位武林豪杰在交通要道边开了一个酒馆。生产 十分兴隆,引起另一位武林高手的垂涎。这位 武林高手决定打败那位豪杰然后霸占酒馆。两 强相遇,武林豪杰和武林高手相互之间不知对 方底细,于是来一番比试。本来,他们俩可以 通过打斗来解决问题,但打斗一场双方都会有 所损伤,不如通过其他方式比较武功高低。豪 杰拿来5块砖,一掌将其击碎,高手也不示弱, 照样击碎 5 块砖。于是,豪杰又拿来十块砖, 同样是一掌击个粉碎,高手见之,心中没底, 于是明白自己武功较豪杰还差一截。于是,这 位武林高手甘拜下风,放弃了原来的计划,弃 剑而去。170 这个电视剧情节在博弈论中被称为 “信号传递博弈”。豪杰身怀绝技、天 下无敌。但其他人不一定会相信他是武 林第一高手,除非亲自与之交手并败于 他。交战虽然可以决出高下,但对双方 都会有损失,打个头破血流对谁都不是 好事。当然,豪杰可以对外宣布他的武 功非凡,其他人不是他的对手,但即使 豪杰没有什么本事,也可以如此对外宣 布。所以,仅凭口头宣布是难以令人信 服的。171 俗话说,是骡子是马,拉出去。豪杰 用过人武功劈掉别人难以模仿的十块砖,就向 别人发出一个信号。这个信号向外传递的信息 是:我的武功高强,你们不可匹敌。这样,不 用打斗就决出高下,避免了打斗带来的更大损 失。现在,我们用这个“信号传递博弈”的原 理,来解释为何一些垄断厂商长期在低价格水 平上经营。如果这个垄断厂商是一个低生产成 本的厂商,当其它较高生产成本厂商也进入这 个厂商所经营的行业与之进行竞争时,原先的 那个垄断厂商可以通过降价将进入者赶出这个 行业,从而继续维持垄断经营。172 由于垄断厂商有更低的生产成本,所以, 它能够将产品价格降到比进入厂商的生产成本 还要低的水平上,这就造成进入者或者高价格 经营导致顾客流失,或者同样也降价但价格低 于成本,两种情形进入者都会亏损,最后不得 不退出行业。但是,这种“打斗”行为尽管可 以击退进入者,但由于一段时间的降价经营可 能对垄断者带来较大损失。垄断者为了避免这 种损失,可以向外宣布它是低成本的,别的厂 商休想进来与它竞争。但仅凭口头宣布人家是 不会相信的,因为即使垄断者不是低成本的厂 商,它也会如此宣布。173 一种方法就是,正如电视剧中的故 事那样,垄断者向外发送一个信号,向 外界传递它真是低成本的信息。它可以 长期在一个较低价格水平上经营。如果 它的价格足够低,高成本厂商不敢模仿, 行内厂商会据此判定它确是低成本的。 同时,它的价格也不能太低,以致于较 之与进入者进行降价竞争,其损失为小 一些。这样,垄断者才会采取如此策略。 潜在的高成本进入者不敢进入,垄断者 得以保持长期的垄断地位。174 例子18 为什么有的商品广告既无商品的价格 信息又无售货地点信息,只有明星的表演? 通常认为,商业广告的功能是向消费者提 供必要的购货信息,如散布商品的价格,质量 功能,出售地点等信息。再者,人们还认为有 些广告可能是为了引导消费,特别是新产品出 现时,消费者还不知道不熟悉它,商业广告中 通过一些电影明星使用新产品的图象,利用公 众的“追星”心理打造市场。这种关于新产品 市场引导的广告在国外的电视广告中特别常见, 通常是一位当红明星在电视上用新产品表演一 番,既无价格,也无售货地点的介绍,除了显 示一下商标外,完全没有对产品性能的说明。 不过,对于这类广告,博弈论还有一种“信号 传递”的解释呢?175 假设有一家企业(记为企业A)开发出一 种很有市场潜力的饮料,该产品饮后对人的健 康确实有好处。但同时,另一家生产假冒伪劣 产品的企业(记为企业B)也准备向市场推出一 种伪劣产品饮料。两个企业都会向公众宣布其 产品是上乘的,如何如何的好。但公众是理性 的,不会仅凭商业宣传就相信它们。但是,如 果产品真的好,随着时间的推移,消费者能够 识别出来。所以,生产好饮料的的企业A对自 己的市场有信心,它相信随着时间的推移,企 业B生产的伪劣产品终究会被消费者识破,176 顾客会跑到自己这里来,从而自己的市场 会不断扩大,销售收入及利润会不断增长,而 企业 B 开始可以蒙骗一部分消费者,但时间一 长,产品的问题会暴露出来,市场会不断缩小, 收入及未来利润都不会有企业 A 的大。这样一 来,企业A的未来预期收入远大于企业B。因此, 如果企业 A 请一位当红明星打广告,由于是当 红明星,他们打广告有很高的市场价格,就可 以使企业B不敢模仿。譬如,假定企业A的预期 收入为 3 千万元,企业 B 的预期收入为 1 千万元。 当红明星打广告的市场价格为 2 千万元,那么, 企业A可以请明星打广告但企业B就请不起。177 消费者也明白这个道理,从而会在一开始 就识别出不能请当红明星打广告的企业B是生 产伪劣产品的。这样,企业B一开始就没有市 场。当企业 A 请了当红明星打广告时,企业 B 发现这位明星的市场价格太高,自己难以模仿 企业A,开始就会放弃生产伪劣产品的计划。 所以,企业A通过请当红明星打广告而清除掉 了潜在的市场模仿者,它向公众传递自己是生 产好产品的信号,这种信号的价值在于其所请 来的当红明星有着较高的出场价格,而不在乎 明星在广告节目中说了什么,表演了什么,当 然更无所谓广告节目是否介绍产品价格等信息 了。企业A请当红明星打广告就为公众传递了 它是生产好产品的企业的一个信号。178 例子19 为什么许多实力雄厚的公司还要 向银行借很多钱? 在国外,一些资金实力雄厚的公司 通常也会向银行贷款。更加令人感到奇 怪的是,一些好的公司,一方面自己借 钱给别的公司,同时,另一方面又向银 行借钱。博弈论运用“信号传递”原理 可以对此现象作出解释。179 对于一家公司来说,负债增加会增 大公司破产的可能性;但是,对于实力 雄厚的公司,在同样负债比例下,其破 产可能性要小一些。每个公司都会向社 会吹嘘自己是好的公司,实力雄厚,但 公众不会仅凭口头宣传就相信的。于是, 真正好的公司通过向银行借钱来增大自 己破产的可能性,令其它实际上不好的 公司难以模仿。这种负债比例的增加要 做到恰到好处,它既可令其它实力稍弱 的公司难以模仿,又使自己能够承受。180 这样,公众就能识别出谁是好的公司,从 而竞相购买好的公司的股票,导致公司股票价 格上涨,结果这家负债公司会因其股价上涨而 获资本增值,破产的可能性反而下降了。 当然,公司通过增加负债来向投资者传递 公司信息的代价可能太高,因而有时公司十分 乐意向投资者直接披露内部信息,只要这种信 息足以使投资者相信其真实性,就会为公司减 少信息传递成本。 (问题3:在中国是否负债比例高的公司就是 好的公司?)181 例子20 飞机、轮船等设立头等舱、经济舱的 道理是什么? 无论是买票乘飞机、火车还是轮船,不同 的人所愿意支付的价格实际上是不一样的。有 的人收入高一些,或对花钱看得比较松一些, 就可以支付较高的价格,相反,收入低的人或 对花钱看得比较紧一些的人,就只愿支付较低 的价格。但是,如果你问他们愿意支付什么样 的价格,他们都必定说愿支付较低的价格,因 为既使有钱人有也会在同样服务下以低价购买 划算一些。182 飞机或轮船公司为了将这些在经济 学中被称为具有不同支付意愿的人区分 开来,让能支付较高价格的人支付较高 价格,就设计了一种“信息甄别”的机 制,这种机制就是设立头等舱、二等舱、 三等舱, …… ,等等。这种机制发挥作 用的道理是这样的,我们可以用著名的 “所罗门王断案”的故事来说明。所罗 门王是古代以色列国的一位以智慧著称 的君主。183 一次,两个女人为争夺一个 婴儿争扯到所罗门王殿前,她们 都说婴儿是自己的,请所罗门王 作主。所罗门王稍加思考后作出决定:将 婴儿一刀劈为两段,两位妇人各得一半。 这时,其中一位妇人立即要求所罗门王将 婴儿判给对方,并说婴儿不是自己的,应 完整归还给另一位妇人,千万别将婴儿劈 成两半。听罢这位妇人的求诉,所罗门王 立即作出最终裁决 ―― 婴儿是这位请求不 杀婴儿的妇人的,应归于她。184 这个故事讲的道理是,尽管所罗门王不知 道两位妇人中谁是婴儿的母亲,但他知道婴儿 真正的母亲是宁愿失去孩子也不会让孩子被劈 成两半的。所罗门王正是利用这一点,一下就 识别出谁是婴儿的真正的母亲了。所罗门王的 这种方法在博弈论中被称为“机制设计”,即 设计一套博弈的规则,令不同类型的人作出不 同的选择,尽管每个人的类型可能是隐藏的, 别人观察不到,但他们所作出的不同选择却是 可以观察到的。观察者可以通过观察不同人的 选择而反过来推演出他们的真实类型。185 当飞机或轮船的舱位条件和价格完 全一样时,不同支付意愿的人都会以最 低价格买票,不会有人愿支付比别人更 多的钱去买相同的舱位的票。于是,航 空公司或轮船公司将舱位分成头等舱、 二等舱, …… ,等等,价格稍有不同, 当然服务也不同,就将不同支付意愿的 顾客区分开了。186 头等舱比其它较低等级舱位的价格 高许多并不主要是因为它的服务要比其 它舱位的服务好许多(当然还是要好一 些),而是因为那些坐头等舱的人的支 付能力比其它舱位的旅客的支付能力要 强许多,说白了,就是坐头等舱的人比 坐其它舱位的人更有钱或更能花钱而已! 但是,如果航空公司或轮船公司不对舱 位作如此区分,即使是有钱人也不会愿 意坐同样的舱位而支付比别人支付的更 高的价格。187 这里,支付能力是旅客的类型,选择舱位 等级是他们的选择。支付能力无法观察,但买 什么舱位的票却能够观察,航空或轮船公司因 此而识别出可以支付更高价格的顾客而赚取更 多利润。譬如,有两位旅客甲和乙乘飞机。甲的最 高支付能力为 1000 元,乙的最高支付能力为 1500 元。经济舱的服务成本为 800 元,头等舱 的服务成本为1200元。188 经济舱带给甲和乙的消费满足感 (经济学中称为效用)为 1000 元,头等 舱带给甲和乙的效用为 1800 元。如果没 有头等舱,航空公司最多把票价定到 1000元,利润为2×()=400元。 因为票价一旦高于 1000 元,甲和乙 就不会买票了。但当设立头等舱后,航 空公司将经济舱票价定为 1000 元,将头 等舱票价定为 1500 元。此时,甲以 1000 元买经济舱。189 乙如果买经济舱,则其净效用(经 济学称为消费者剩余)为, 但当乙买头等舱票时的消费者剩余为 0元,所以乙会买头等舱。 甲的支付能力只有 1000 元,所以甲只有 买经济舱。这时,航空公司的利润增大 为 ()+()=500 元 &400 元。 通过机制设计增大了公司利润。190 类似的还有,酒店的星级分类, 五星级、四星级、三星级,……酒 店,冰棍的不同品种与价格,影剧院的不同座位价格表等等,都是实现信息甄别的机制设计。191 例子21 大智若愚中的智慧:聪明过头没好处美国 19 世纪有一个颇有成就的政治家, 其幼年时是流浪街头的孤儿。他经常在大街 上向行人讨钱,但当有人让他在一块钱和两 块钱之间选择时,他选择了一块钱。于是, 许多人都为了亲眼验证关于他的“犯傻”行 为的传闻,专门来找他并让他在一块钱和两 块钱之间选择。他仍然依然故我地只选择一 块钱,于是来找他的人愈来愈多。192 终于有一天,有一位女士问他:难 道你不知道两块钱比一块钱更多一些钱 吗?他如此回答道:如果我有一次选择 了两块钱,就不会有人来找我让我在一 块钱与两块钱之间选择了,我也讨不到 钱了。 这个故事告诉我们有时候“扮傻” 也许是有好处的。下面再来看一个例子, 这是一个动态博弈,局中人 A 有两次决 策机会,一次在局中人 B 决策之前,另 一次在B决策之后。193 A U L (2,0) (1,1)DBRAD?U?(3,0)(0,2)图4 一个动态博弈运用“ 逆向归纳法”,A在第二次决策时会选 择 ? U U? ,B选择L;给定这些结果, A在开始会选择 U,纳什均衡是((U, ),L)。194 但是,如果局中人A开始“装傻”, 选择D而不是U,当B认为A是傻子时,B D ? ,而这正是B 会以为当他选R后A会选 所乐意看到的结果。于是,当 A 开始装 傻后,造成B对A的类型的误解,B以为 A是傻子,从而预期当他自己选 R后A还 ? 会“ 犯傻D ”选 。于是B就选R而不是 均衡中的 L 。但是,当 B 选了 R 后, A 不 再“装傻”而一举选 达到最大支付3。 U? 这就是A通过“装傻”骗过B使A获利。195 第二种情形是,局中人 B“ 装傻”, 并使A相信他是傻子。这样,A会认为当 他选D时B会选R。于是,A开始就选D, 但一旦A选了D,B就不再“装傻”,一 举选L。这是B骗过A的情形。 下面的一个例子是当所有局中人都 “装傻”时,所有人都受 益的情形。196 A U BD (1,1)……AU BD DA U B UD D(100,100)D(0,3) (98,98) (97,100) (99,99)(98,101)图5 所有人都“装傻”使所有人都受益的博弈由逆向归纳法,博弈均衡是所有人都选择D, 即( D , … , D )。结果是博弈在一开始就结 束了,每个局中人都获得支付1。197 如果A开始就装傻,选U而不是D,B 也装傻,选U不选D,则博弈到最后结束 时每个局中人得到支付100。 相反,下面用一个例子说明当所有 人都“聪明过头”时,所有人都受损失 的道理。 有这样一个故事,称为“旅行者困 境”,说的是有两个旅行者甲和乙从一 个以出产花瓶的著名旅游胜地回来时, 他们都买了花瓶。198 提取行查时,发现花瓶被碰破了。 他们向航空公司索赔。航空公司估计花 瓶的价格在 80 或 90 元的价位左右,但不 知道这两位旅客购买的准确价格。航空 公司要求两位旅客在100元以内自己写下 花瓶价格。若两人写的相同,说明他们 说了真话,就照他们写的数额赔偿;如 果两人写的不一样,那就认定写得低的 旅客讲的是真话,按这个低的价格赔偿, 但是对讲真话的旅客奖励2元钱,对讲假 话的旅客罚款2元。199 如果两人都写 100元,他们都会获得 100 元。但是,给定乙写 100 元,甲改写 99元,则他会获得101元。乙又想,若甲 写99元,他自己写98元,比写100元好, 因为这样他获 100 元,而写 100 元当甲写 99 元时自己却只获 97 元。而给定乙写 98 元,甲又会写 97 元, …… ,这样,最后 落得每人都只写1、2元的境地。 所以,还是古人说得好,有时“大 智若愚”可能还是上策呢?200 六、混合战略博弈小孩玩的游戏“石头,剪子,布”, 也是一种博弈。但是,这个博弈有一种 有趣的特征,即给定一方的任何选择, 另一方都有制胜对方的战略,所以,给 定一方任何一个战略,对方都有制胜这 个战略的战略,因而这个战略不是最优 的。任何“纯战略”都不是最优的,纯 战略是“石头,剪子,布”中的任何一 个。201 但是,我们知道,玩这个游戏是总 是以对方不易猜出的随机方式出招。事 实上,可以通过数学证明,当双方都以 每个战略按1/3的概率出招时,达成一种 双方都不愿改变这种概率分布的局面。 这被称为“混合战略纳什均衡”,而这 种以随机方式选择纯战略的博弈被称为 “混合战略博弈”。 以混合战略博弈的概念,我们来看 下面几个例子。202 例子22 为什么一般人总是小错不断,大 错不犯;偷税漏税的一般是中小企业, 大企业会老老实实地交税?税务部门不会对所有企业的交税情 况每一次都去检查,因为这样做的成本 太高,得不偿失。所以,税务部门总是 随机地对企业的交税情况进行检查。203 企业也是随机地在交税与偷漏税之 间进行选择。税收部门与企业间进行的 是混合战略博弈。因为如果企业总是交 税,税务部门就最好不检查;但给定不 检查,企业就会偷漏税。所以,两者只 有在随机地检查与不检查,企业随机地 在偷漏税与交税之间选择,才会达成均 衡。204 对于大企业,因一旦偷税就数目巨大,所 以,税务部门在随机检查时放在大企业上的可 能性就大一些;而给定税务部门检查大企业的 可能性较大,大企业偷漏税的行为就较少,否 则就容易被逮个正着。所以,偷漏税较多的就 是一些中小企业,大企业纳税的积极性较高。 同样,大人物或有钱人纳税的积极性应较高, 至于我国在过去一段时期有钱人反而不交税的 现象主要源于制度不健全或已有的制度得不到 贯彻所致。同样的道理,在犯罪或对错误的监 督惩罚博弈中,也是混合博弈,人们可能总是 大错不犯小错不断。205 例子23 田忌赛马新编春秋战国时期,齐威王常与旗下大将田忌 赛马。规则是:每次赛三局,每一局齐威王与 田忌各出一匹马比赛奔跑速度。每一局中的胜 者赢败方一千斤铜。田忌有上、中、下三匹马, 而齐威王也有上、中、下三匹马。每次比赛, 第一局田忌出上马,齐威王也出上马;第二局 田忌出中马,齐威王也出中马;第三局,田忌 出下马,齐威王也出下马。齐威王的上马比田 忌的上马好,齐威王的中马也比田忌的中马好, 齐威王的下马还是比田忌的下马好。于是,每 次比赛的结果都是田忌连输三局。206 田忌的谋士孙膑了解了田忌的困境 后,就打听到这样一个消息:尽管齐威 王的上、中、下三匹马都要比田忌的对 应上、中、下三匹马好,但碰巧的是田 忌的上马可胜齐威王的中马,田忌的中 马可胜齐威王的下马。于是,孙膑为田 忌献计:下一次比赛中第一局时田忌出 下马对齐威王的上马输一局,第二局田 忌出上马对齐威王的中马,第三局田忌 出中马对齐威王的下马,这样可连赢两 局,最后净胜一千斤铜。田忌依计而行, 果真赢回一千斤铜。207 这个故事曾经被很多人当作博弈论的例子 来演绎,但实际上这个故事与博弈论无关。博 弈论会假定所有局中人都是理性的,不能假定 一些局中人聪明而另一些局中人却是傻子。当 田忌出下马时,齐威王最好的选择是出下马而 不是上马。孙膑的计谋中假定齐威王是傻子, 当田忌出下、上、中马时,他仍然按上、中、 下马出,当然要输了。事实上,当田忌出下马 时,齐威王应出下马,但齐威王出下马时,田 忌不应出下马而是出中马,但此时齐威王又应 出中马而不是下马了,……。这样,博弈不会 有纯战略的均衡。208 两人只能玩混合战略博弈,齐威王分别以1/6随机的概率选择出上、中、下马的任一排列,田忌也如此。由于齐威王存在绝对优势,他平均看来仍然会赢田忌一千斤铜。209 例子24 如果曹操与诸葛亮一样聪明: 三国演义中的华容道博弈在《三国演义》中,曹操在赤壁大 战中一败涂地,率残兵败将向许都方向 逃窜。诸葛亮命关羽率兵在途中阻截曹 军。当时,第一批拦截大军是赵云率领 的,第二批拦截大军是张飞带队的,第 三批才是关羽率部伏击。由于曹军兵多 将广,前二批伏击军不能逮住曹操,只 是抢劫一些军械马匹之类。210 待曹军冲过赵云、张飞两道关后, 进入关羽的伏击地带。但是,当时关羽 与曹操相遇的地方有两条道,一条是华 容道,除此外还有另一条道。诸葛亮令 关羽伏兵于华容道,并且要求关羽在华 容道上点燃树枝冒出烟雾引曹操到来。 当时关羽不解,问诸葛亮,“如果在伏 兵之处点火,岂不令曹兵看见而改走另 一条道逃脱?”诸荀亮叫关羽不要再问, 只如此照办即可。211 当曹操冲破赵云、张飞的阻截后, 来到华容道前,看见华容道上静悄悄的, 但有烟火萦绕。曹操大笑道:“孔明以 为我会上他的当,故意叫人在华容道上 点火让我走另一条道,而他却伏兵于这 条道上好逮住我呢!我偏不上他的当!” 于是,曹操令大军径直上华容道上而去, 结果与关羽大军撞个正着。212 曹操为何进了孔明的圈套呢?这里 的道理是这样的:孔明知道曹操是聪明 人,而聪明人见华容道上有烟火会认为 华容道上有伏兵,于是会避开华容道而 走另一条路。如果孔明令关羽在另一条 路等着,曹操就被逮住了。但是,曹操 不仅聪明,而且还聪明过人,他也知道 孔明的如此盘算来诱他上钩,他偏不上 当,知道点火的华容道上无人,孔明的 队伍在另一条道上呢!于是他选择走华 容道。213 但是,依《三国演义》作者罗贯中 的逻辑,孔明总是比曹操计高一筹,按 博弈论的术语来说,就是孔明的理性程 度要比曹操高上一阶。孔明也知道曹操 知道孔明的打算,于是令关羽正好在点 火的华容道上等着曹操。《三国演义》 中的这}

我要回帖

更多关于 博弈论 圈套 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信