短期博弈论定义的定义

点击联系发帖人 时间：2018-05-10 11:37

演化博弈论定义

博弈论两大假设是什么_中华文本库
第 2 节博弈论中的基本假定基本假定:在博弈中每个参与人是理性的是博弈参与人之间的公共知识。这里涉及两个问题:第一,什么是理性;第二,什么是公共知识。 ...
只要涉及到人群的互动,就有博弈。博弈论的几个经典模型引言什么叫博弈? 博弈...理性的人是对现实的人的基本假定,即假定参与者努力用自己的推理能力使自己...
博弈论中理性人假设的困境蟠天群(南京大学哲学系+江苏南京210093) 在博弈论...这个博弈中,两个囚徒均会选择“招认”,因为无论对方选择什么策略,自己选择“...
博弈论复习题及答案_金融/投资_经管营销_专业资料。...答:该博弈分为两个阶段,第一阶段企业 1 选择产量...7、在Bertrand价格博弈中,假定有n个生产企业,需求...
《博弈论与信息经济学》第一次作业 1.(利维坦)假设两个博弈参与人生活在“丛林法则”之下,每一个参与人都可以选择“战争”与“和平”并且其支付矩阵如下所示: ...
故事中涉及的博弈论的假设和结构博弈论的基本假设理性人假设有一个很好定义的偏好(well-defined preference);在给定约束下追求偏好的最大化(maximization) 共同知识...
理性人合作与冲突博弈论 2. 从新古典经济学的两个假设来看假设一:市场是完全竞争的; 假设二:市场是完全信息的。结论:市场可以达到一般均衡, 资源配置达到...
例8.2 (位置博弈) 博弈论能够对这个现象作出科学的解释。首先对一个简单的博弈模型进行叙述: 假设有条完全笔直的公路,连接城市A到城市B之间的交通。这条公路...
( , ) 2 2 4、假定在一个博弈模型中,有两个参与者,一个是政府,一个是...? 0 如果私人都有理性预期, 试运用博弈论的相关知识来证明在短期内政府所...
? ? ? ? (五)博弈模型的分类 (四)博弈论的两个前提假设 (三)纳什均衡 (二)博弈表达的科学式 (一)什么是博弈论 1 我们首先看几个例子。例1 石头、...进化博弈理论_百度百科
清除历史记录关闭
声明：百科词条人人可编辑，词条创建和修改均免费，绝不存在官方及代理商付费代编，请勿上当受骗。
进化博弈理论
进化博弈理论是经济学研究方法的一次创新，该理论从否定赖以成立的基础——假定出发而建立起来一个新的分析框架，它结合了生态学、社会学、心理学及经济学的最新发展成果，从的社会人出发来分析参与人的行为。进化博弈理论是经济学领域的前沿理论，它来源于对生态现象的研究，虽然该理论应用于经济分析的时间不长，但它为经济学研究提供了一个全新的分析方法，较好地克服了及经典博弈理论中理性假定及多重均衡的困难。并且，应用进化博弈理论来研究经济系统能够获得比更准确的结果，能够更加现实地解释经济现象，因而在短期内为多数经济学家所接受。从某种意义上说引入进化博弈理论局部动态法来分析经济中参与人的行为是经济学研究方法的一次创新。
进化博弈理论产生发展
进化博弈理论产生
进化博弈理论源于对生态现象的解释，1960年代生态学家Lewontin就开始运用进化博弈理论的思想来研究生态问题。生态学家从动植物进化的研究中发现，动植物进化结果在多数情况下都可以用博弈论的概念来解释。然而，博弈论是研究的人类互动行为时提出来的，为什么能够解释根本无理性可言的动植物的进化现象呢？我们知道动植物的进化遵循达尔文“优胜劣汰”生物进化理论，生态演化的结果却能够利用博弈理论来给予合理的解释，这种巧合意味着我们可以去掉经典博弈理论中假定的要求。另外，1960年代生态学理论研究取得突破性的进展，非合作博弈理论研究成果也不断涌现并日趋成熟，进化博弈理论具备了产生的现实及理论基础。
进化博弈理论发展
进化博弈理论应用于研究经济学问题在学术界曾经引起极大的争议，争论的焦点在于理性假定。当时由于理性概念在经济学界已经根深蒂固。多数人认为利用研究生态演化的进化博弈理论来研究参与人的行为是不合适的。因为动植物行为是完全由其基因所决定的，而经济问题则涉及到具有逻辑思维及学习、模仿能力的理性参与人的行为，因此，借助于进化博弈理论来研究远比动植物复杂的显然是行不通的。但随着心理学研究的发展及概念的提出，越来越多的经济学家应用进化博弈理论来解释经济现象并获得了巨大的成功，利用进化博弈理论来研究并解释经济现象的文献大量出现于各种经济学期刊了。尽管如此，利用进化博弈理论来解释经济现象还是需要对该理论的框架作出相应的调整。如果去掉参与人、信念及理性假定等条件，那么参与人是如何作出决策的呢？进化博弈理论在处理参与人决策问题时，常常假定参与人遵循某种比贝叶斯法则更简单的行为规则，这种行为规则应该告诉如何采取行动及如何根据经验来改变行为选择，这样参与人只要知道什么会发生，而不必知道为什么会发生。
1970年代，生态学家Maynard Smith and Price（1973）结合生物进化论与经典博弈理论在研究生态演化现象的基础上而提出了进化博弈理论的基本均衡概念----（Evolutionarily stable stragegy ESS），如今学术界普遍认为进化稳定策略概念的提出标志着进化博弈理论的诞生。此后，生态学家Taylor and Jonker（1978）在考察生态演化现象时首次提出了进化博弈理论的基本动态概念----模仿者动态（Replicator Dynamics）。至此，进化博弈理论有了明确的研究目标。
进化博弈理论确立
1980年代以后，随着及博弈论固有的缺陷逐渐被人们所认识，概念得到了学术界的普遍认可，加之进化博弈理论在解释生态现象时获得的巨大成功，特别是经济学界于1992年在康奈尔大学召开的进化博弈理论学术会议，正式确立了该理论的学术地位。一大批如Larry Sameulson、Ken Binmore、Peyton Young等经济学家从不同的角度对传统的进化博弈理论分析框架进行拓展，并使之逐渐转化为描述经济行为的理论。如今，进化博弈理论的基本理论体系虽然已经形成但还是相当粗糙。因此，它仍然处于不断发展和完善的阶段，但该理论提供了比传统理论更具现实性且能够更准确地解释并预测参与人行为的研究方法，从而得到了越来越多的经济学家、社会学家、生态学家的重视，我们有理由相信该理论成为的一部分已经为时不远。
进化博弈理论基本内容
进化博弈理论结合经典博弈理论及生态理论研究成果，并以的参与人群体为研究对象，利用动态分析方法把影响参与人行为的各种因素纳入其模型之中，并以系统论的观点来考察群体行为的演化趋势。
进化生态学与博弈论的结合至少已有三十几年的历史，初看起来使人觉得奇怪，因为博弈论常常假定参与人是完全理性的，而基因和其他的演化载体常常被假定是以一种完全机械的方式运动。然而一旦用参与人群体来代替博弈论中的参与者个人，用群体中选择不同纯策略的个体占群体中个体总数的百分比来代替博弈论中的混合策略，那么这两种理论就达到了形式上的统一。尽管这两种理论在形式上达到了统一，但进化博弈理论与经典博弈理论还是存在本质区别。在进化博弈理论中每个参与人都是随机地从群体中抽取并进行重复、匿名博弈，他们没有特定的博弈对手。在这种情况下，参与人既可以通过自己的经验直接获得决策信息，也可以通过观察在相似环境中其他参与人的决策并模仿而间接地获得决策信息，还可以通过观察博弈的历史而从群体分布中获得决策信息。对参与人来说，观察群体行为的历史即估算群体分布是非常重要的，首先，群体分布包含了对手如何选择策略的信息。其次，通过观察群体分布也有助于参与人知道什么是好的策略什么是不好的策略。参与人常常会模仿好的策略而不好的策略则会在进化过程中淘汰，模仿是学习过程中的一个重要组成部分，成功的行为不仅以说教的形式传递下来，而且也容易被模仿。参与人由于受到理性的约束而其行为是幼稚的（Naive），其决策不是通过迅速的最优化计算得到，而是需要经历一个适应性的调整过程，在此过程中参与人会受到其所处环境中各种确定性或随机性因素影响。因此，系统均衡是达到均衡过程的函数，要更准确地描述参与人行为就必须考察经济系统的动态调整过程，动态均衡概念及动态模型在进化博弈理论中占有相当重要的地位。
进化博弈理论应用
能在多大程度上解决经济和其他社会科学中的实际问题是度量进化博弈理论价值的唯一依据。到目前为止，尽管进化博弈理论还没有形成学术界一致认可的理论体系，其基本框架仍然处于数理研究阶段，但它提供了一种全新的分析问题的方法，国外许多经济学者纷纷应用该理论来分析诸如社会制度形成、行业发展趋势、社会习俗演化等现象，获得了极大的成功。下面略举几例简单地介绍该理论在经济学领域的应用。
Conlisk (1980)
利用带滞后项及随机项的离散时间动态来分析参与人是否总是行为的最优者。他假定有“最优化”及“模仿”两个纯策略，其中非最优化者有一个二次损失函数，在此基础上，他寻求一个满足非最优化者损失函数等于最优化者正的常数成本的均衡群体比率。他的主要结论是：当群体中几乎都是最优化者时，模仿比最优化策略更合算，因此，群体中非最优者在群体中最优化者所占比例并不渐近地收敛于1。这个结论与传统理论的理性人结论显然不一致，即进化选择的结果并不会使所有人都会进行理性选择。
Crawford(1989)
考察了一个对某一公益事业进行捐助的实验，在该实验中要求每个对象选择捐最小数量还是适度数量款。他应用适应性随机动态进化博弈理论模型得出的结论能够很好解释实验中所观察的数据，这篇文章同时表明实验可以作为发现特定进化动态模型的一个有力武器。
Peyton Young（1998a）
把进化博弈理论应用于分析社会习俗、传统、规范等的演化及传统合约的形成原因。他认为现实中每个参与人都是在前人给定的经验知识基础上选择策略，个人选择策略是一个适应性的学习过程。在作出选择时，尽管参与人存在一定的惯性及犯错误的可能性，经过行为的长期演化，这个适应性学习过程也会收敛于一个有效率的传统或合约。Peyton Young利用进化博弈理论分析了社会规范的形成与社会福利的关系。他通过一个简单的左行右行的例子，说明习俗的形成是为了减少不确定性及由此带来的交易成本。
Jones(1976)和Cowen and Kroszner(1987)
利用进化博弈理论研究了在自由竞争易货贸易经济中，存在交易成本时交易媒介是如何进行选择。他们把个人愿意接受不想最终持有某物品的行为看作一个纯策略，认为单个交易媒介存在的实质就是寻求系统的角点均衡而不是内点均衡；
Weitzman(1984)
在行业组织方面的应用，如Weitzman(1984) 利用进化博弈理论分析股份制经济。他认为，如果企业职工都不愿意稀释所有者权益，那么企业实行职工持股的管理方式是动态稳定的；在经济体制分析方面的应用，
青木昌彦（1996）
等利用进化博弈理论来分析社会经济体制的变迁，他们认为任何一种经济体制的产生都具有一定的惯性并随经济所处的外部环境与所积累的内部环境的变化一起逐渐地进化，即经济体制的进化是路径依赖的结果。
清除历史记录关闭院领导集体
谭耀文曝钟镇涛常偷出家门揭秘致命的关节疼痛
谴责炒作将诉诸法律陕西安馨园不放弃收购计划
国务院决定建全科医生制度 东方巨人美式硬汉
一座曾痴恋足球的城市 黄龙士双登杯中国队抽签幸运轮空
7月百城涨幅创新低 斯特恩会熬到12月1日
法官称情节不同 司机将油门当刹车轧死男童获缓刑
乌鸡妖刀铲射锁胜局 中国一季度商标申请量增长25.4%
新疆天山一带普降中到大雪 药店坐堂医生涉嫌非法行医
子弹头列车减速行驶 北大学生自发为去世食堂厨师捐款
齐乐网投域名：航空燃油附加费上调背后玄机 丽悦酒店涨0.58%
我要分享 &
文章来源：站长之家&&&&发布时间：日 16:12&&【字号：&&&&&&】
同时，组建国家药品监督管理局，由国家市场监督管理总局管理。磨刀霍霍不会解决主要问题，类似于脱欧谈判，但在与俄罗斯对话问题上设限，会使‘全球化的英国'在全球的影响下降。等我到80岁，这套80本大全集就出来了。我觉得我能把一介文人表演得那么神气活现，这是我最了不起的地方。
当晚10点5分左右，他和一名同事从灵宝西收费站上了高速，他立马打电话给司机。每经小编（nbdnews）查询第三方购房平台看到，3月北京朝阳区的二手房均价为71717元/平方米。
是日，全国人民代表大会选举，习近平总书记全票当选国家主席，反映了人民的意愿和心声。挂断电话，他马上致电二大队秩序中队中队长柴海峰，要求打开一条通道。李敖表示与年轻人相处，要多加留意：到了一定年纪，人一般容易啰嗦，说话容易惹人讨厌，我在这方面是很警觉的。在政治局委员们的文章里，可以清楚看出这样的逻辑。埃尔多安同时指责美国为库尔德武装人民保护部队提供支持，要求库尔德武装主动撤出幼发拉底河以东地区。
他通过社交媒体称，土耳其在叙军队为土耳其和阿夫林地区保障了和平与稳定南都周刊：你在清华演讲的时候，有人问你会不会再回清华。想尽办法避间谍霍金认为，这次俄罗斯之行与上一次同样有价值。
南都周刊：现在还会容易生气？比如最近你跟小S要打官司之类的事情，看起来还挺生气的。他最先踏入经济领域，是从加入纽约联邦储备银行开始的。
日 16:12这不是我们记忆中的李敖，却是最真实的李敖。生态环境部对外保留国家核安全局牌子。视觉中国资料图3月17日晚间，澎湃新闻记者从资深外交官、中国驻印度加尔各答前总领事毛四维的亲友处了解到，毛四维于2018年3月16日在北京医院病逝，享年66岁。
当时，这位天体物理学家已经彻底坐上轮椅，他的手指也弯曲到无法握住钢笔的程度。小时候曾在上海住了半年的李敖，与上海这座城市也有着难以名状的缘分，2005年李敖的神州文化之旅，上海便成为了他的第二站行程，在复旦大学进行了演讲，说起中国文化、中国字，他一脸骄傲称这正是复兴的好时机。生态环境部对外保留国家核安全局牌子。当时给的建议是：打开绕城高速，社会车辆不进入。资深车评人@韩路说奔驰车主说谎，并分析了当事人录视频时的微表情。
　　相关链接：
（责任编辑：说慕梅）
var _bdhmProtocol = (("https:" == document.location.protocol) ? " https://" : " http://");
document.write(unescape("%3Cscript src='" + _bdhmProtocol + "hm.baidu.com/h.js%3Fddd7f33e60' type='text/javascript'%3E%3C/script%3E"))重复博弈_百度百科
清除历史记录关闭
声明：百科词条人人可编辑，词条创建和修改均免费，绝不存在官方及代理商付费代编，请勿上当受骗。
重复博弈是同样结构的博弈重复进行多次的过程。动态博弈的一种特殊形式。其中每次博弈都被称为“阶段博弈”。在重复博弈的情况下，企业在选择策略的时候不仅需要考虑当前的对局，而且还需考虑当前选择的策略对于以后的对局将产生怎样的影响。
重复博弈简介
顾名思义，（repeated game）
是指同样结构的博弈重复许多次，其中的每次博弈称为“阶段博弈”（stage games）。重复博弈是中的重要内容，它可以是的重复博弈，也可以是的重复博弈。重复博弈
是指同样结构的博弈重复许多次。当博弈只进行一次时，每个参与人都只关心一次性的支付；如果博弈是重复多次的，参与人可能会为了长远利益而牺牲眼前的利益，从而选择不同的均衡策略。因此，重复博弈的次数会影响到的结果。
在重复博弈中，每次博弈的条件、规则和内容都是相同的，但由于有一个长期利益的存在，因此各博弈方在当前阶段的博弈中要考虑到不能引起其它博弈方在后面阶段的对抗、报复或恶性竞争，即不能象在一次性静态博弈中那样毫不顾及其它博弈方的利益。有时，一方做出一种合作的姿态，可能使其它博弈方在今后阶段采取合作的态度，从而实现共同的长期利益。
下面给出两个重要定义：
定义1：可信性是指中先行动的博弈方是否该相信后行动的博弈方会采取对自己有利或不利的行为。
定义2：如果动态博弈中各博弈方的策略在动态博弈本身和所有中都构成均衡，则称该策略组合具有子博弈完美性。
在重复博弈中，可信性同样是非常重要的，也即子博弈完美性仍是判断均衡是否稳定可靠的重要依据，又由于长期利益对短期行为的制约作用，因此有一些在一次性博弈中不可行的威胁或诺言在重复博弈中会变为可信的，从而使博弈的均衡结果出现更多的可能性。
重复博弈特征
重复博弈具有三个基本特征：
A、重复博弈的阶段，博弈之间没有“物质”上的联系，即前一个阶段博弈并不改变后一个阶段的博弈的结构；
B、在重复博弈的每一个阶段，所有参与人都观测到该博弈过去的历史；
C、参与人的是所有阶段博弈的收益的贴现值之和或加权平均数。
重复博弈影响因素
影响重复结果的主要因素是博弈重复的次数和信息的完备性。在重复博弈中，参与人存在着短期利益和长远利益的均衡，有可能为了长远利益牺牲短期利益而选择不同的均衡策略。重复博弈的这个结果，为现实中的许多合作行为和社会规范提供了解释。信息的完备性之所以影响均衡结果，是因为如果每一个参与人的特征不为其他参与人所知时，该参与人就很有可能积极建立一个好声誉，以换取长远利益。根据重复博弈的重复次数，可以将其分为和。
重复博弈分类
重复博弈无限次重复博弈
下面用一个关于产品定价博弈的例子分析重复博弈。
产品定价博弈
高价12，1220，4
4，2015，15
是两个厂商A和B定价的支付矩阵，从中可以看出：在一次性博弈中中，厂商A和厂商B都存在上策，是双方都定低价。
从参与人行为看，由于博弈可以重复无数次，博弈双方为了长期利益有时间进行试探性出价。在第一次博弈时出高价以寻求竞争对手的合作，一旦对局人为了短期利益采取不合作行为，那么就会建立该对局人是不可信任的信念，在下一次的博弈中都采取不合作的低价行为，使对局人的长期利益受损。
可见，厂商B在第一次博弈中由于不合作策略得到的高收益会在以后博弈中因A的报复性策略而抵消，甚至在重复博弈若干次后出现损失。
假如厂商A开始制定的高价策略，从得到厂商B若也定高价，其每次博弈的支付分别为（15，15，15．．．）；若厂商B制定低价，则在第一次博弈中获得高收益，但是随后会由于厂商A的低价行为而使其受损，各次博弈的支付分别为（20，12，12．．．）。厂商A的这种策略被称为“以牙还牙”策略，这种策略是A在初始选择合作，如果B合作，那么A也会一直合作下去；若B在某一次博弈中选择不合作，那么A在以后博弈中都采取不合作策略。“以牙还牙”策略意味着任何一个参与人的一次性不合作将会引起永远的不合作。所有参与人为了长期利益，使得无限次重复的非合作博弈产生合作解。
2.：假定重复有限的N次，这意味着所有参与人都能预测到最后一次（第N次）的收益。在第N次博弈中，各参与人都知道对方的“以牙还牙”，但是他也知道如果在这次博弈中自己选择低价的上策，将使自己受益而其他参与人受损，且也不会留给对方报复的机会（博弈到第N次结束）。所有参与人都明白这一点，因此在最后一次博弈中将都采取，这与一次博弈的结果相同。
在现实中，市场竞争者很难弄清重复博弈的结构。厂商很难预期自己在什么时候会结束经营，也不清楚与对手的竞争何时是第N次博弈。因此，只要竞争时期足够长，竞争的双方都预期未来还要进行很多次博弈，那么，竞争的结构就可能近似于，使得厂商在竞争中出现相互合作的局面。
重复博弈序列博弈
在实践中，在选择行动时可能有先后顺序或某些对局者可能率先采取行动，这种博弈被称为。
1.先行者优势：厂商生产甜味饼干的收益10要高于生产脆味饼干的收益8。假定两个厂商同时独立的做出生产决定，他们都愿意推出甜味饼干——结果是两家收益都受损
甜—3，—38，10
10，8—3，—3
可见，在序列博弈中，先行者可能占据一定的有利地位，这就是先行者优势。厂商1为获得更大收益，会选择推出甜味饼干，使得厂商2只能选择收益较低却是最优的策略——推出脆味饼干。
2.博弈的扩展形式：常用博弈的扩展形式来分析，它用决策树的形式表示可能的行动，并在各枝的结束处给出各行动的支付。
厂商1（2）甜8，10
（1）脆10，8
（3）甜3，-3
博弈的扩展形式的解一般用逆推法推导，由最后的收益逆向归纳，倒推到初始节点1处做出最后决策。
陆雄文．管理学大辞典：上海辞书出版社，2013年
．智库。百科．[引用日期]
．智库文档[引用日期]
清除历史记录关闭}

天天发财游戏网