1、智猪博弈
假设猪圈里有一头大猪、一头小猪。
猪圈的一头有猪食槽(两猪均在食槽端),另一头安装着控制猪食供应的按钮,按一下按钮会有10个单位的猪食进槽,但是在去往食槽的路上会有两个单位猪食的体能消耗,若大猪先到槽边,大小猪吃到食物的收益比是6:4;同时行动(去按按钮),收益比是7∶3;小猪先到槽边,收益比是9:1。
那么,在两头猪都有智慧的前提下,最终结果是小猪选择等待。
"智猪博弈"由纳什于1950年提出。
实际上小猪选择等待,让大猪去按控制按钮,而自己选择“坐船”(或称为搭便车)的原因很简单:在大猪选择行动的前提下,小猪选择等待的话,小猪可得到4个单位的纯收益,而小猪行动的话,则仅仅可以获得大猪吃剩的1个单位的纯收益,所以等待优于行动。
在大猪选择等待的前提下,小猪如果行动的话,小猪的收入将不抵成本,纯收益为-1单位,如果小猪也选择等待的话,那么小猪的收益为零,成本也为零,总之,等待还是要优于行动。
当大猪选择行动的时候,小猪如果行动,其收益是1,而小猪等待的话,收益是4,所以小猪选择等待;当大猪选择等待的时候,小猪如果行动的话,其收益是-1,而小猪等待的话,收益是0,所以小猪也选择等待。
综合来看,无论大猪是选择行动还是等待,小猪的选择都将是等待,即等待是小猪的占优策略。
2、协同攻击难题
两个将军各带领自己的部队埋伏在相距一定距离的两个山上,等候敌人。将军A得到可靠情报说,敌人刚刚到达,立足未稳。如果敌人没有防备,两股部队一起进攻的话,就能够获得胜利;而如果只有一方进攻的话,进攻方将失败。这是两位将军都知道的。
A遇到了一个难题:如何与将军B协同进攻?那时没有电话之类的通讯工具,只有通过派情报员来传递消息。将军A派遣一个情报员去了将军B那里,告诉将军B:敌人没有防备,两军于黎明一起进攻。
然而可能发生的情况是,情报员失踪或者被敌人抓获。即:将军A虽然派遣情报员向将军B传达“黎明一起进攻”的信息,但他不能确定将军B是否收到他的信息。
事实上,情报员回来了。将军A又陷入了迷茫:将军B怎么知道情报员肯定回来了?将军B如果不能肯定情报员回来的话,他必定不会贸然进攻的。于是将军A又将该情报员派遣到B地。然而,他不能保证这次情报员肯定到了将军B那里……
这就是“协同攻击难题”,它是由格莱斯(J. Gray)于1978年提出。更为糟糕的是,有学者证明,不论这个情报员来回成功地跑多少次,都不能使两个将军一起进攻。
扩展资料
1928年,冯·诺依曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。1944年,冯·诺依曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统地应用于经济领域,从而奠定了这一学科的基础和理论体系。
1950~1951年,约翰·福布斯·纳什利用不动点定理证明了均衡点的存在,为博弈论的一般化奠定了坚实的基础。纳什的开创性论文《n人博弈的均衡点》(1950),《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。
此外,莱因哈德·泽尔腾、约翰·海萨尼的研究也对博弈论发展起到推动作用。今天博弈论已发展成一门较完善的学科。在金融学、证券学、生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。
参考资料来源:百度百科-博弈论
.博弈论是指某个个人或是组织,面对一定的环境条件,在一定的规则约束下,依靠所掌握的信息,从各自选择的行为或是策略进行选择并加以实施,并从各自取得相应结果或收益的过程,在经济学上博奕论是个非常重要的理论概念。
什么是博弈论?古语有云,世事如棋。生活中每个人如同棋手,其每一个行为如同在一张看不见的棋盘上布一个子,精明慎重的棋手们相互揣摩、相互牵制,人人争赢,下出诸多精彩纷呈、变化多端的棋局。博弈论是研究棋手们 “出棋” 着数中理性化、逻辑化的部分,并将其系统化为一门科学。换句话说,就是研究个体如何在错综复杂的相互影响中得出最合理的策略。事实上,博弈论正是衍生于古老的游戏或曰博弈如象棋、扑克等。数学家们将具体的问题抽象化,通过建立自完备的逻辑框架、体系研究其规律及变化。这可不是件容易的事情,以最简单的二人对弈为例,稍想一下便知此中大有玄妙:若假设双方都精确地记得自己和对手的每一步棋且都是最“理性” 的棋手,甲出子的时候,为了赢棋,得仔细考虑乙的想法,而乙出子时也得考虑甲的想法,所以甲还得想到乙在想他的想法,乙当然也知道甲想到了他在想甲的想法…
面对如许重重迷雾,博弈论怎样着手分析解决问题,怎样对作为现实归纳的抽象数学问题求出最优解、从而为在理论上指导实践提供可能性呢?现代博弈理论由匈牙利大数学家冯·诺伊曼于20世纪20年代开始创立,1944年他与经济学家奥斯卡·摩根斯特恩合作出版的巨著《博弈论与经济行为》,标志着现代系统博弈理论的初步形成。对于非合作、纯竞争型博弈,诺伊曼所解决的只有二人零和博弈--好比两个人下棋、或是打乒乓球,一个人赢一着则另一个人必输一着,净获利为零。在这里抽象化后的博弈问题是,已知参与者集合(两方) ,策略集合(所有棋着) ,和盈利集合(赢子输子) ,能否且如何找到一个理论上的“解” 或“平衡” ,也就是对参与双方来说都最“合理” 、最优的具体策略?怎样才是“合理” ?应用传统决定论中的“最小最大” 准则,即博弈的每一方都假设对方的所有功略的根本目的是使自己最大程度地失利,并据此最优化自己的对策,诺伊曼从数学上证明,通过一定的线性运算,对於每一个二人零和博弈,都能够找到一个“最小最大解” 。通过一定的线性运算,竞争双方以概率分布的形式随机使用某套最优策略中的各个步骤,就可以最终达到彼此盈利最大且相当。当然,其隐含的意义在於,这套最优策略并不依赖于对手在博弈中的操作。用通俗的话说,这个著名的最小最大定理所体现的基本“理性” 思想是“抱最好的希望,做最坏的打算” 。
2.在经济学中,“智*博弈”(Pigs’payoffs)是一个著名博弈论例子。
这个例子讲的是:*圈里有两头*,一头大*,一头小*。*圈的一边有个踏板,每踩一下踏板,在远离踏板的*圈的另一边的投食口就会落下少量的食物。如果有一只*去踩踏板,另一只*就有机会抢先吃到另一边落下的食物。当小*踩动踏板时,大*会在小*跑到食槽之前刚好吃光所有的食物;若是大*踩动了踏板,则还有机会在小*吃完落下的食物之前跑到食槽,争吃到另一半残羹。
那么,两只*各会采取什么策略?答案是:小*将选择“搭便车”策略,也就是舒舒服服地等在食槽边;而大*则为一点残羹不知疲倦地奔忙于踏板和食槽之间。
原因何在?因为,小*踩踏板将一无所获,不踩踏板反而能吃上食物。对小*而言,无论大*是否踩动踏板,不踩踏板总是好的选择。反观大*,已明知小*是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,所以只好亲力亲为了。
“小*躺着大*跑”的现象是由于故事中的游戏规则所导致的。规则的核心指标是:每次落下的事物数量和踏板与投食口之间的距离。
如果改变一下核心指标,*圈里还会出现同样的“小*躺着大*跑”的景象吗?试试看。
改变方案一:减量方案。投食仅原来的一半分量。结果是小*大*都不去踩踏板了。小*去踩,大*将会把食物吃完;大*去踩,小*将也会把食物吃完。谁去踩踏板,就意味着为对方贡献食物,所以谁也不会有踩踏板的动力了。
如果目的是想让*们去多踩踏板,这个游戏规则的设计显然是失败的。
改变方案二:增量方案。投食为原来的一倍分量。结果是小*、大*都会去踩踏板。谁想吃,谁就会去踩踏板。反正对方不会一次把食物吃完。小*和大*相当于生活在物质相对丰富的“共产主义”社会,所以竞争意识却不会很强。
对于游戏规则的设计者来说,这个规则的成本相当高(每次提供双份的食物);而且因为竞争不强烈,想让*们去多踩踏板的效果并不好。
改变方案三:减量加移位方案。投食仅原来的一半分量,但同时将投食口移到踏板附近。结果呢,小*和大*都在拼命地抢着踩踏板。等待者不得食,而多劳者多得。每次的收获刚好消费完。
对于游戏设计者,这是一个最好的方案。成本不高,但收获最大。
原版的“智*博弈”故事给了竞争中的弱者(小*)以等待为最佳策略的启发。但是对于社会而言,因为小*未能参与竞争,小*搭便车时的社会资源配置的并不是最佳状态。为使资源最有效配置,规则的设计者是不愿看见有人搭便车的,政府如此,公司的老板也是如此。而能否完全杜绝“搭便车”现象,就要看游戏规则的核心指标设置是否合适了。
比如,公司的激励制度设计,奖励力度太大,又是持股,又是期权,公司职员个个都成了百万富翁,成本高不说,员工的积极性并不一定很高。这相当于“智*博弈”
增量方案所描述的情形。但是如果奖励力度不大,而且见者有份(不劳动的“小*”也有),一度十分努力的大*也不会有动力了----就象“智*博弈”减量方案一所描述的情形。最好的激励机制设计就象改变方案三----减量加移位的办法,奖励并非人人有份,而是直接针对个人(如业务按比例提成),既节约了成本(对公司而言),又消除了“搭便车”现象,能实现有效的激励。
许多人并未读过“智*博弈”的故事,但是却在自觉地使用小*的策略。股市上等待庄家抬轿的散户;等待产业市场中出现具有赢利能力新产品、继而大举仿制牟取暴利的游资;公司里不创造效益但分享成果的人,等等。因此,对于制订各种经济管理的游戏规则的人,必须深谙“智*博弈”指标改变的个中道理。
3.背景知识:纳什博弈论的原理与应用
2002年03月21日17:44 北京晚报
1950年和1951年纳什的两篇关于非合作博弈论的重要论文,彻底改变了人们对竞争和市场的看法。他证明了非合作博弈及其均衡解,并证明了均衡解的存在性,即著名的纳什均衡。从而揭示了博弈均衡与经济均衡的内在联系。纳什的研究奠定了现代非合作博弈论的基石,后来的博弈论研究基本上都沿着这条主线展开的。然而,纳什天才的发现却遭到冯·诺依曼的断然否定,在此之前他还受到爱因斯坦的冷遇。但是骨子里挑战权威、藐视权威的本性,使纳什坚持了自己的观点,终成一代大师。要不是30多年的严重精神病折磨,恐怕他早已
站在诺贝尔奖的领奖台上了,而且也绝不会与其他人分享这一殊荣。
纳什是一个非常天才的数学家,他的主要贡献是1950至1951年在普林斯顿读博士学位时做出的。然而,他的天才发现———非合作博弈的均衡,即“纳什均衡”并不是一帆风顺的。
1948年纳什到普林斯顿大学读数学系的博士。那一年他还不到20岁。当时普林斯顿可谓人杰地灵,大师如云。爱因斯坦、冯·诺依曼、列夫谢茨(数学系主任)、阿尔伯特·塔克、阿伦佐·切奇、哈罗德·库恩、诺尔曼·斯蒂恩罗德、埃尔夫·福克斯……等全都在这里。博弈论主要是由冯·诺依曼(1903—1957)创所立的。他是一位出生于匈牙利的天才的数学家。他不仅创立了经济博弈论,而且发明了计算机。早在20世纪初,塞梅鲁(Zermelo)、鲍罗(Borel)和冯·诺伊曼已经开始研究博弈的准确的数学表达,直到1939年,冯·诺依曼遇到经济学家奥斯卡·摩根斯特恩(Oskar Morgenstern),并与其合作才使博弈论进入经济学的广阔领域。
1944年他与奥斯卡·摩根斯特恩合著的巨作《博弈论与经济行为》出版,标志着现代系统博弈理论的的初步形成。尽管对具有博弈性质的问题的研究可以追溯到19世纪甚至更早。例如,1838年古诺(Cournot)简单双寡头垄断博弈;1883年伯特兰和1925年艾奇沃奇思研究了两个寡头的产量与价格垄断;2000多年前中国著名军事家孙武的后代孙膑利用博弈论方法帮助田忌赛马取胜等等都属于早期博弈论的萌芽,其特点是零星的,片断的研究,带有很大的偶然性,很不系统。冯·诺依曼和摩根斯特恩的《博弈论与经济行为》一书中提出的标准型、扩展型和合作型博弈模型解的概念和分析方法,奠定了这门学科的理论基础。合作型博弈在20世纪50年代达到了巅峰期。然而,诺依曼的博弈论的局限性也日益暴露出来,由于它过于抽象,使应用范围受到很大限制,在很长时间里,人们对博弈论的研究知之甚少,只是少数数学家的专利,所以,影响力很有限。正是在这个时候,非合作博弈———“纳什均衡”应运而生了,它标志着博弈论的新时代的开始!纳什不是一个按部就班的学生,他经常旷课。据他的同学们回忆,他们根本想不起来曾经什么时候和纳什一起完完整整地上过一门必修课,但纳什争辩说,至少上过斯蒂恩罗德的代数拓扑学。斯蒂恩罗德恰恰是这门学科的创立者,可是,没上几次课,纳什就认定这门课不符合他的口味。于是,又走人了。然而,纳什毕竟是一位英才天纵的非凡人物,他广泛涉猎数学王国的每一个分支,如拓扑学、代数几何学、逻辑学、博弈论等等,深深地为之着迷。纳什经常显示出他与众不同的自信和自负,充满咄咄逼人的学术野心。1950年整个夏天纳什都忙于应付紧张的考试,他的博弈论研究工作被迫中断,他感到这是莫大的浪费。殊不知这种暂时的“放弃”,使原来模糊、杂乱和无绪的若干念头,在潜意识的持续思考下,逐步形成一条清晰的脉络,突然来了灵感!这一年的10月,他骤感才思潮涌,梦笔生花。其中一个最耀眼的亮点就是日后被称之为“纳什均衡”的非合作博弈均衡的概念。纳什的主要学术贡献体现在1950年和1951年的两篇论文之中(包括一篇博士论文)。1950年他才把自己的研究成果写成题为“非合作博弈”的长篇博士论文,1950年11月刊登在美国全国科学院每月公报上,立即引起轰动。说起来这全靠师兄戴维·盖尔之功,就在遭到冯·诺依曼贬低几天之后,他遇到盖尔,告诉他自己已经将冯·诺依曼的“最小最大原理”(minimax solution)推到非合作博弈领域,找到了普遍化的方法和均衡点。盖尔听得很认真,他终于意识到纳什的思路比冯·诺伊曼的合作博弈的理论更能反映现实的情况,而对其严密优美的数学证明极为赞叹。盖尔建议他马上整理出来发表,以免被别人捷足先登。纳什这个初出茅庐的小子,根本不知道竞争的险恶,从未想过要这么做。结果还是盖尔充当了他的“经纪人”,代为起草致科学院的短信,系主任列夫谢茨则亲自将文稿递交给科学院。纳什写的文章不多,就那么几篇,但已经足够了,因为都是精品中的精品。这一点也是值得我们深思的。国内提一个教授,要求在“核心的刊物”上发表多少篇文章。按照这个标准可能纳什还不一定够资格。
1996年诺贝尔经济学奖得主莫尔里斯当牛津大学艾奇沃思经济学讲座教授时也没有发表过什么文章,特殊的人才,必须有特殊的选拔办法。
纳什在上大学时就开始从事纯数学的博弈论研究,1948年进入普林斯顿大学后更是如鱼得水。20岁出头已成为闻名世界的数学家。特别是在经济博弈论领域,他做出了划时代的贡献,是继冯·诺依曼之后最伟大的博弈论大师之一。他提出的著名的纳什均衡的概念在非合作博弈理论中起着核心的作用。后续的研究者对博弈论的贡献,都是建立在这一概念之上的。由于纳什均衡的提出和不断完善为博弈论广泛应用于经济学、管理学、社会学、政治学、军事科学等领域奠定了坚实的理论基础。
囚犯的两难处境
大理论中的小故事
要了解纳什的贡献,首先要知道什么是非合作博弈问题。现在几乎所有的博弈论教科书上都会讲“囚犯的两难处境”的例子,每本书上的例子都大同小异。
博弈论毕竟是数学,更确切地说是运筹学的一个分支,谈经论道自然少不了数学语言,外行人看来只是一大堆数学公式。好在博弈论关心的是日常经济生活问题,所以不能不食人间烟火。其实这一理论是从棋弈、扑克和战争等带有竞赛、对抗和决策性质的问题中借用的术语,听上去有点玄奥,实际上却具有重要现实意义。博弈论大师看经济社会问题犹如棋局,常常寓深刻道理于游戏之中。所以,多从我们的日常生活中的凡人小事入手,以我们身边的故事做例子,娓娓道来,并不乏味。话说有一天,一位富翁在家中被杀,财物被盗。警方在此案的侦破过程中,抓到两个犯罪嫌疑人,斯卡尔菲丝和那库尔斯,并从他们的住处搜出被害人家中丢失的财物。但是,他们矢口否认曾杀过人,辩称是先发现富翁被杀,然后只是顺手牵羊偷了点儿东西。于是警方将两人隔离,分别关在不同的房间进行审讯。由地方检察官分别和每个人单独谈话。检察官说,“由于你们的偷盗罪已有确凿的证据,所以可以判你们一年刑期。但是,我可以和你做个交易。如果你单独坦白杀人的罪行,我只判你三个月的监禁,但你的同伙要被判十年刑。如果你拒不坦白,而被同伙检举,那么你就将被判十年刑,他只判三个月的监禁。但是,如果你们两人都坦白交代,那么,你们都要被判5年刑。”斯卡尔菲丝和那库尔斯该怎么办呢?他们面临着两难的选择——坦白或抵赖。显然最好的策略是双方都抵赖,结果是大家都只被判一年。但是由于两人处于隔离的情况下无法串供。所以,按照亚当·斯密的理论,每一个人都是从利己的目的出发,他们选择坦白交代是最佳策略。因为坦白交代可以期望得到很短的监禁———3个月,但前提是同伙抵赖,显然要比自己抵赖要坐10年牢好。这种策略是损人利己的策略。不仅如此,坦白还有更多的好处。如果对方坦白了而自己抵赖了,那自己就得坐10年牢。太不划算了!因此,在这种情况下还是应该选择坦白交代,即使两人同时坦白,至多也只判5年,总比被判10年好吧。所以,两人合理的选择是坦白,原本对双方都有利的策略(抵赖)和结局(被判1年刑)就不会出现。这样两人都选择坦白的策略以及因此被判5年的结局被称为“纳什均衡”,也叫非合作均衡。因为,每一方在选择策略时都没有“共谋”(串供),他们只是选择对自己最有利的策略,而不考虑社会福利或任何其他对手的利益。也就是说,这种策略组合由所有局中人(也称当事人、参与者)的最佳策略组合构成。没有人会主动改变自己的策略以便使自己获得更大利益。“囚徒的两难选择”有着广泛而深刻的意义。个人理性与集体理性的冲突,各人追求利己行为而导致的最终结局是一个“纳什均衡”,也是对所有人都不利的结局。他们两人都是在坦白与抵赖策略上首先想到自己,这样他们必然要服长的刑期。只有当他们都首先替对方着想时,或者相互合谋(串供)时,才可以得到最短时间的监禁的结果。“纳什均衡”首先对亚当·斯密的“看不见的手”的原理提出挑战。按照斯密的理论,在市场经济中,每一个人都从利己的目的出发,而最终全社会达到利他的效果。不妨让我们重温一下这位经济学圣人在《国富论》中的名言:“通过追求(个人的)自身利益,他常常会比其实际上想做的那样更有效地促进社会利益。”从“纳什均衡”我们引出了“看不见的手”的原理的一个悖论:从利己目的出发,结果损人不利己,既不利己也不利他。两个囚徒的命运就是如此。从这个意义上说,“纳什均衡”提出的悖论实际上动摇了西方经济学的基石。因此,从“纳什均衡”中我们还可以悟出一条真理:合作是有利的“利己策略”。但它必须符合以下黄金律:按照你愿意别人对你的方式来对别人,但只有他们也按同样方式行事才行。也就是中国人说的“己所不欲勿施于人”。但前提是人所不欲勿施于我。其次,“纳什均衡”是一种非合作博弈均衡,在现实中非合作的情况要比合作情况普遍。所以“纳什均衡”是对冯·诺依曼和摩根斯特恩的合作博弈理论的重大发展,甚至可以说是一场革命。
从“纳什均衡”的普遍意义中我们可以深刻领悟司空见惯的经济、社会、政治、国防、管理和日常生活中的博弈现象。我们将例举出许多类似于“囚徒的两难处境”这样的例子。如价格战、军奋竞赛、污染等等。一般的博弈问题由三个要素所构成:即局中人(players)又称当事人、参与者、策略等等的集合,策略(strategies)集合以及每一对局中人所做的选择和赢得(payoffs)集合。其中所谓赢得是指如果一个特定的策略关系被选择,每一局中人所得到的效用。所有的博弈问题都会遇到这三个要素。
价格战博弈:
现在我们经常会遇到各种各样的家电价格大战,彩电大战、冰箱大战、空调大战、微波炉大战……这些大战的受益者首先是消费者。每当看到一种家电产品的价格大战,百姓都会“没事儿偷着乐”。在这里,我们可以解释厂家价格大战的结局也是一个“纳什均衡”,而且价格战的结果是谁都没钱赚。因为博弈双方的利润正好是零。竞争的结果是稳定的,即是一个“纳什均衡”。这个结果可能对消费者是有利的,但对厂商而言是灾难性的。所以,价格战对厂商而言意味着自杀。从这个案例中我们可以引伸出两个问题,一是竞争削价的结果或“纳什均衡”可能导致一个有效率的零利润结局。二是如果不采取价格战,作为一种敌对博弈论(vivalry game)其结果会如何呢?每一个企业,都会考虑采取正常价格策略,还是采取高价格策略形成垄断价格,并尽力获取垄断利润。如果垄断可以形成,则博弈双方的共同利润最大。这种情况就是垄断经营所做的,通常会抬高价格。另一个极端的情况是厂商用正常的价格,双方都可以获得利润。从这一点,我们又引出一条基本准则:“把你自己的战略建立在假定对手会按其最佳利益行动的基础上”。事实上,完全竞争的均衡就是“纳什均衡”或“非合作博弈均衡”。在这种状态下,每一个厂商或消费者都是按照所有的别人已定的价格来进行决策。在这种均衡中,每一企业要使利润最大化,消费者要使效用最大化,结果导致了零利润,也就是说价格等于边际成本。在完全竞争的情况下,非合作行为导致了社会所期望的经济效率状态。如果厂商采取合作行动并决定转向垄断价格,那么社会的经济效率就会遭到破坏。这就是为什么WTO和各国政府要加强反垄断的意义所在。
污染博弈:
假如市场经济中存在着污染,但政府并没有管制的环境,企业为了追求利润的最大化,宁愿以牺牲环境为代价,也绝不会主动增加环保设备投资。按照看不见的手的原理,所有企业都会从利己的目的出发,采取不顾环境的策略,从而进入“纳什均衡”状态。如果一个企业从利他的目的出发,投资治理污染,而其他企业仍然不顾环境污染,那么这个企业的生产成本就会增加,价格就要提高,它的产品就没有竞争力,甚至企业还要破产。这是一个“看不见的手的有效的完全竞争机制”失败的例证。直到20世纪90年代中期,中国乡镇企业的盲目发展造成严重污染的情况就是如此。只有在政府加强污染管制时,企业才会采取低污染的策略组合。企业在这种情况下,获得与高污染同样的利润,但环境将更好。
生活中的博弈论论文
摘要:
生活、博弈、无处不在、利益、老鹰、报价价位、得与失
正文:
博弈无时不在,无处不在,日常生活中的一切,均可从博弈得到解释,大到美日贸易战,小到今天早上你突然生病。可能读者会认为,贸易争端用博弈论来分析是可以的,但对自己生病也可以用博弈论来理解就有点不可思议,因为自己就一个人,和谁进行游戏? 实际上,并非只有一个人,还有一个叫做“自然”(Nature)的参与者。“自然”可以理解为无所不能的上帝,上帝现在有两种策略,让人生病或不生病。人一旦生病,就不得不根据生病的信息判断上帝的策略,然后采取对应的策略。上帝采取让人生病的策略,人就采取吃药的策略来对付;上帝采取不让人生病的策略,人就采取不予理睬的策略。这正是一场人和上帝进行博弈的游戏。
“自然”是研究单人博弈的重要假定。再比如一个农夫种庄稼也是同自然进行博弈的一个过程。自然的策略可以是:天旱、多雨、风调雨顺。农夫对应的策略分别是:防旱、防涝、放心地休息。当然,“自然”究竟采用哪种策略并不确定,于是农夫只有根据经验判断或气象预报来确定自己的行动。如果估计今年的旱情较重,就可早做防旱准备;如果估计水情严重,就早做防涝准备;如果估计是风调雨顺,农夫就可以悠哉游哉了。
生活中更多的游戏不是单人博弈,而是双人或多人的博弈。比如,某一天你觉得应该是你太太的生日,但又不能肯定:如果是太太的生日的话,你可以送一束花,太太会特别高兴;你不送花,太太会埋怨你忘了她的生日;如果不是太太的生日的话,你可以送太太一束花,太太感到意外的惊喜;你不送花,结果生活同往常一样。
在这个博弈里,我们看到,“自然”可以有两种策略:确定今天是太太的生日或确定今天不是太太的生日,但不论“自然”采取何种策略,你的最好行动都是买花。
夫妻吵架也是一场博弈。夫妻双方都有两种策略,强硬或软弱。博弈的可能结果有四种组合:夫强硬妻强硬、夫强硬妻软弱、夫软弱妻强硬、夫软弱妻软弱。
根据生活的实际观察,夫软弱妻软弱是婚姻最稳定的一种,因为互相都不愿让对方受到伤害或感到难过,常常情愿自己让步。动物学的研究有相同的结论,性格温顺的雄鸟和雌鸟更能和睦相处,寿命也更长。
夫强硬妻强硬是婚姻最不稳定的一种,大多数结局是负气离婚。夫强硬妻软弱和妻强硬夫软弱是最常见的一种,许多夫妻吵架都是这样,最后终归是一方让步,不是丈夫撤退到院子里点根烟,就是妻子避让到卧室里号啕大哭。
在竞争激烈的商业界,博弈更为常见。比如两个空调厂家之间的价格战,双方都要判断对方是否降价来决定自己是否降价,显而易见,厂家之间的博弈目标就是尽可能获得最大的市场份额,赚取最多的收益。
事实上,这种有利益(或效用)的争夺正是博弈的目的,也是形成博弈的基础。经济学的最基本的假设就是经济人或理性人的目的就是为了效用最大化,参与博弈的博弈者正是为了自身效用的最大化而互相争斗。参与博弈的各方形成相互竞争相互对抗的关系,以争得效用的多少决定胜负,一定的外部条件又决定了竞争和对抗的具体形式,这就形成了博弈。
如象棋对局的参与者是以将对方的军为目标,战争的目的是为了胜利,古罗马竞技场中角斗士在争夺两人中仅有的一个生存权,企业经营的目的是为了生存发展,而股市中人们所争的很实在,就是金钱。从经济学角度来看,有一种资源为人们所需要,而资源的总量具是 稀缺的或是有限的,这时就会发生竞争,竞争需要有一个具体形式把大家拉在一起,一旦找到了这种形式就形成了博弈,竞争各方之间就会走到一起开始一场博弈。
《孙子兵法》上说:“知己知彼,百战百胜。”可见竞争对抗还有博弈各方拥有信息的特征。比如上一个例子中,博弈双方都明白对方的策略,从博弈理论来说,更拗口的说法是一方知道另一方知道自己的策略,反之另一方亦然,这种句法我们可以一直这么用下去,一直用到打“„„”,而这正是博弈双方所掌握的公共信息。
据说老鹰是鸟类中寿命最长的,伦敦动物园曾饲养过一只南美洲的安第斯神鹰,在饲养员精心的养育下它活到了73岁。但是,没有多少人知道老鹰如想活得长寿就必须在40岁左右时作出一项困难而重要的抉择——生与死。因为当老鹰活到40岁时它的爪子便会开始老化,从而无法牢牢抓取猎物,喙也会变得又长又弯,几乎能够碰到胸膛,更要命的是鹰的翅膀也会变得十分沉重,在飞翔时显得很吃力。此时,老鹰面临的选择只有两条路:第一是等待死亡,第二就是经历痛苦的蜕变后继续生存。而这个痛苦的蜕变是个相当漫长的过程,老鹰需要用喙不断击打岩石,直到旧喙完全脱落,然后静候新喙的长出。新喙长出后又要用喙把旧指甲一根根拔掉,等待新指甲的长出,接着便是拔掉旧羽毛等待5个月后新羽毛的长出,然后才能开始新的生命阶段。许多遭受病痛折磨的人与老鹰的蜕变也有许多类似之处,有的人通过顽强的毅力最终战胜了病魔,有的人则因不堪忍受折磨而选择了放弃治疗,放弃生命。 让我们一起来看一个例子吧
有位老教授拿出100元交给班长让其组织同学来一次现场拍卖,规定从零元起每5元一个台阶,出价最高的便可以得到这张百元钞票。但是,出次高价的人在得不到钞票的前提下也必须要交出钱,也就是说如果出最高价的人是X,则出X5元的那位也一定要照价付款。接下来这场竞价游戏开始了,如果是你,你会选择什么样的竞价价位?下面我们逐一来分析各种可能的结果:
第一种:报价价位——50元。 这个报价不难理解,因为竞争的是一张百元钞票,在出最高竞价的人通过50元得到100元的同时,次高价也损失了45元,这样两人的合计支付是95元,总共还净赚了5元。如果是55元的话,则与次高价者用105(55+50)元竞争得来100元,这种结果就无利可图。但事实并非如此,出价50元的学生是绝不可能得到这张钞票的,因为这是一场拍卖,如果你出50元,接下来必会有人出55元,此起彼伏的叫价一直会持续上升,直到100元为止。再者,次高价者也不可能会让自己白白损失45元,所以他必定也会采取跟价的策略。
此时,有人会提出这样自以为聪明的建议,为什么事先就不能有两位同学串通好,一个报价45元,另一个跟进50元,然后他们再去分配所得的5元利润。可关键的是这种竞价和合作方式太浅显了,一般人都能想到,这样便会出现N对合作者,在公开的场合谁与谁合作便能一眼识破,所以这种小儿科的诡计是不可能得逞的。
第二种:理性者的最高报价是100元。 在市场公开的前提下无法通过内幕交易达成低价后,只要报价超过50元便会直逼100元。这个价位也不难理解,如果用100元竞得同值的这张百元钞票虽然没有赚,但也不会赔。然而,此时新的问题又出来了,因为前提中规定次高价者也必须要支付95元,有哪个傻瓜会眼睁睁地看到自己白损失95元,所以他必会破釜沉舟地继续跟价,选择105元,因为他认为这样自己顶多只会损失5元,相比95元要少多了。当然,刚才出价100元的也打着同样的算盘,他也不想吃这个哑巴亏,便会进而将价位提升至110元,于是,新的一轮竞价大战又开始了。其实,此后的竞价已经从谋利变成了止损,在这种情况下往往演绎的是两个傻瓜间的对决。
当然,竞价不可能这样无休止地喊下去,因为竞争者要以手头现有的资金来跟价,最后一个傻瓜跟到了245元,而另一个傻瓜则以250元竞得了这张百元钞票。最倒霉的是跟价的那个傻瓜,因为他身上只有245元,否则的话他绝对会选择继续跟进。而最幸运的不是提前退出竞价的那些学生,而是坐在一旁偷着乐的那位教授,因为只用了1个小时他便获得了400%的利润。
从一开始精明的教授便设下了一个保赚不赔的陷阱,从竞价者角度来看,这次竞价过程可以分为两个部分,100元以下可视为理性投资,而100元以上则是典型的非理性投资,谁喊得越高谁损失得就越惨重,而教授所赚取的利润便越丰厚。这个故事,其实就是彰显人类在博弈过程中的种种理性与非理性,在投资过程中的不同心态。
现实生活中也有许多急功近利的例子,不能从长远利益出发,只顾眼前的蝇头小利,结果是丢了西瓜捡芝麻,得不偿失。每个人都盼望着自己的理想尽快实现,但在很多时候盲目求快换来的只能是失败,这便是欲速则不达的道理。做事不能因循守旧,但更不能揠苗助长,就像王安石的《伤仲永》一样,文中提到的方仲永原本是个天资聪颖的神童,五岁便可指物作诗,一时名声远播,于是很多人花钱前来请方仲永题诗,父亲看到利用儿子有利可图,此后便带着方仲永四处游走乡里谋利,忽略了后天的学习和教育,结果长大后的方仲永与平庸人没有了任何区别。一个人能否成才与天资密不可分,但后天的学习更为重要,遗憾的是方仲永有个过于急功近利的父亲,结果一个天资聪慧的神童沦落为了平庸的凡夫俗子。 利益是个好东西,我们每个人也都有趋利的本性,但关键的是要把握个度,既要学会维护属于自己的合法权益,又能禁得住利益的诱惑,不被其迷失了心窍。在平时的工作中多数人总会把待遇的高低放在第一位,谁都向往工资高、工作环境好的国企,但实际上对刚刚踏入工作岗位的年轻人来说只注重待遇的好坏未必就是好事。走出校门后的莘莘学子其实还要有很多的东西要学习,社会阅历、工作经验、岗位培训等等,所以建议年轻的我们在初入社会时还要以学习的目的为主,不要太过计较金钱、荣誉上的得失。趁着年轻多闯一闯,多积累些社会经验才能为以后的事业打下良好的基础。如果踏入社会后只是围着金钱转,我们很可能会被折磨的身心疲惫,忽略了自己的健康、家庭,失去了亲情、爱情、友情带给我们的很多温馨时刻。 得与失是我们日常生活中每天都要面对的博弈,什么事该做,什么事不该做,什么利益必须争取,什么利益敬而远之,这些都需要我们深思熟虑后做出正确的选择。人生就是在得失之间走过的,金钱、荣誉、权势、爱情,我们得到后欣喜若狂,但失去后又愁眉不展。其实,不以得喜,不以失悲,坦然地面对得失才是处世的最高境界,就像佛教中的这首禅偈一样:“富贵贫穷各有由,夙缘分时莫强求。未曾下得春时种,坐守荒田望有秋。”事物的得失都存在一定的因果联系,有付出才会有回报,如果有时尽力了也没有得到想要的结果,你可能会深感上天的不公,但反过来想想,其实你更应该坦然地面对,因为尽力去做的你已经无怨无悔,得不到不是因为你没有去珍惜和努力,而是因为对方本不属于你,所以在人生中我们有时更要学会放弃,学会忘记。
博弈论也也 称为 对策论 或 赛局理论 ,是研究具有斗争或竞争性质现象的数学理论和方法。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。表面上不同的相互作用可能表现出相似的激励结构,所以它们是同一个游戏的特例。其中一个著名有趣的应用例子是囚徒困境。
具有竞争或对抗性质的行为称为博弈行为。在这类行为中,参加斗争或竞争的各方各自具有不同的目标或利益。为了达到各自的目标和利益,各方必须考虑对手的各种可能的行动方案,并力图选取对自己最为有利或最为合理的方案。博弈论就是研究博弈行为中斗争各方是否存在着最合理的行为方案,以及如何找到这个合理的行为方案的数学理论和方法。
约翰·冯·诺伊曼是个超级跨界牛人——他同时在“数学、物理学、经济学、计算机”等多个领域作出了划时代的贡献,并留下一大堆以他命名的东西,比如程序员应该都听说过“冯诺依曼体系”,比如数学领域有“冯诺依曼代数、冯诺依曼遍历定理……”,理论物理领域有“冯诺依曼量子测量、冯诺依曼熵、冯诺依曼方程……”。另外还有很多东西,虽没有以他命名,也是他先搞出来的,比如:量子力学的公理化表述、希尔伯特第5问题、连续几何(其空间维数不是整数)、蒙特卡洛方法、归并排序算法1944年,他与奥斯卡·摩根斯坦合作发表了《博弈论与经济行为》一举奠定博弈论体系的基础,所以他也被称作博弈论之父。
合作博弈 & 非合作博弈
不论是合作博弈与非合作博弈,在博弈过程中都可能会出现合作的现象。差别在于——对于合作博弈,存在某种外部约束力,使得背叛的行为会受到这种外部约束力的惩罚。对于非合作博弈,没有上述这种外部约束力,对背叛的惩罚只能依靠博弈过程的其它参与者。通常所说的博弈大都指非合作博弈。
同时博弈 & 顺序博弈
同时博弈有时也称作静态博弈,指的是——博弈的任何一个参与者在选择自己的行为之前,并不知道其它参与者的行为信息。顺序博弈有时也称作动态博弈。在这类博弈中,参与者的动作有时间上的先后,并且后一个执行动作的博弈者可以看到其他博弈者之前的动作,然后根据别人的动作,思考自己的行为。
零和博弈 & 非零和博弈
零和博弈这个名称具有误导性,使得很多人以为各方的收益总和为零。零和博弈指的是——在博弈结束之后,参与各方的利益总和为常量(可以是零,也可以是正值或负值)。非零和博弈指的是——在博弈结束之后,参与各方的利益总和为变量。所以这类博弈有时候称为变和博弈。对于这类博弈,在某些情况下可能会让参与各方的利益总和变大,从而使得各方存在合作的可能性。
非重复博弈 & 重复博弈
非重复博弈有时也称作单次博弈;相应的,重复博弈也被称作多次博弈。重复博弈还可以进一步细分为有限重复博弈与无限重复博弈。更严谨的说法是:有限重复博弈——重复次数确定的博弈,无限重复博弈——重复次数不确定的博弈
收益矩阵 & 决策树
这两个概念都是为了更直观地描述博弈过程,并帮你看清各方的利弊得失。收益矩阵通常用来描述静态博弈(同时博弈)而且一般是用来描述双人的静态博弈,更多人的静态博弈也可以用收益矩阵表述,但画起来会复杂很多;由于动态博弈(顺序博弈)比较复杂,通常不用“收益矩阵”描述。决策树既可以用来描述静态博弈,也可以用来描述动态博弈。
策略 & 策略集合
以象棋为例,完成一局需要经历很多个步骤,对每个步骤,你都有多个决策选项(要走哪个棋子,走到哪)。而策略指的是——从第一步到最后一步的所有决策选项的总和。你可以把策略通俗理解为某种算法 指导思想,它指导你从第一步走到最后一步。所有可能的策略,构成了策略集合。
有限策略集合 & 无限策略集合
石头剪刀布是典型的有限策略集合,该集合只有3个元素。为了说明无限策略集合这种集合,举个分蛋糕博弈的例子,其中一人先把蛋糕随意分为两块,然后另一个人先挑选其中一块。对于负责分蛋糕的人而言,其策略集合是无穷大。很多人凭直觉会认为:具有无限策略集合的博弈比有限策略集合的博弈更复杂。其实不然,围棋虽然很复杂,但其策略集合依然是有限滴。作为对比,分蛋糕博弈比围棋简单多了,但分蛋糕博弈反而具有无限的策略集合。
纯策略 & 混合策略
在实际博弈时,如果你总是固定选择策略集合中的某一个策略,这种情况称之为纯策略。如果你在博弈时,总是随机选择策略集合中的某几个策略,这种情况称之为混合策略。如果某个混合策略包含了策略集合中的每一个元素,称之为完全混合策略。
支配策略
假设你有两个策略 A & B。如果在任何情况下,A 都比 B 更优,称作 A 支配 B 或者 B 被 A 支配。支配策略又称优势策略。如果某个策略能够支配所有其它策略,那么它就是支配策略。通俗地说,不论你的对手采用何种策略,你的支配策略总是比你的其它策略有更好的结果。有时候会把支配策略进一步细分为强支配和弱支配。对于前者,它在任何情况下都比其它策略更好;对于后者,它在某些情况下比其它策略更好,某些情况下与其它策略一样好。制胜策略也称必胜策略,它通常只用于零和博弈,指的是——只要你采用这个策略,不论对方如何应对你总是赢。制胜策略肯定是支配策略;但支配策略不一定是制胜策略。
最小最大定理
比较绕口的陈述是:最小化最大损失,更通俗的表述是在最坏情况下最小化损失。该定理及算法最早由冯·诺依曼在《博弈论与经济行为》一书中提出。
反向归纳法 & 概念该方法洋
其精髓是正向展望,反向推理,首先,你需要思考自己的每个决策,以及对方在应对你的决策时,会采用何种决策,这个思维过程类似于决策树的展开,这个展开过程要一直推演到最后一步,也就是决策树的叶子节点。此时你就可以看清双方在最后一步各自的最优选择;然后再反向回推到第一步。当你要用反向归纳进行展望与推理,前提是——你要获得充分的信息;或者说,如果某个博弈者所知的信息不够充分,就无法运用该方法。
问题描述
5个海盗抢了100个金币,讨论如何分赃。这5个海盗有等级高低(不妨假设 A>B>C>D>E)。先由等级最高的海盗提出分赃方案,然后投票。如果半数以上(含半数)同意,就按这个方案分,游戏结束;如果同意的不到半数,把提出方案的海盗扔进海里喂鲨鱼,然后由次一等级的海盗提出新的方案;以此类推。每个海盗的特点是:足够理性(追求个人利益最大化)并且知道别人也足够理性;足够残忍(在个人利益等同的情况下,倾向于把更多同伴扔进海里)。
策略分析
为了进行反向推理,假设最后只剩下2个海盗(D & E)。此时的投票肯定过半(D 肯定投票赞同自己的方案)。在这种局面下,D 可以采用最极端的方案——自己全拿100个金币,E 则一个也拿不到。
现在回推一步。当只剩下3个海盗(C、D、E),由 C 提出方案。他只需要分1个金币给 E,E 就会投票支持(否则的话,等到由 D 来提方案,E 啥也拿不到)。所以在 C 的方案中,他自己拿99个金币,E 拿1个金币。
再往前一步。只剩下4个海盗(B、C、D、E),B 提方案,他当然也能想到刚才那些推理。他只需给 D 1个金币,D 就会支持他(如果等到 C 来提方案,D 啥也拿不到)。所以 B 提出的方案是 B:99,C:0,D:1,E:0,同样能得到半数支持。
基于上述分析,再看 A 的方案,就很显然了——A:98,B:0,C:1,D:0,E。
美国数学家纳什在1951年发表了一篇小论文名叫《非合作博弈》,其中提出了纳什均衡的概念并给出了相应的基于不动点定理数学证明。通俗地说是指在多人的非合作博弈中,如果每个博弈者都无法单方面改善自己的境地,此时的局面称作纳什均衡。冯·诺伊曼已经在《博弈论与经济行为》一书中证明了:零和博弈必定存在这样的均衡点。纳什的贡献在于他从零和博弈推广到非零和博弈,并证明了:这样的均衡点依然存在。当博弈的局面处于纳什均衡,此时的系统是稳定滴,如果每个博弈者都足够理性,他们都不愿意主动改变当前的策略。
换位思考
前面聊的很多博弈相关技能都依赖于换位思考这个能力,你需要站在对手的角度进行思考,才能看清局面,从而更好地选择自己的策略。一般来说,那些换位思考能力越强的人,也越善于进行强批判思维。
理性人假设
微观经济学在进行数学建模的时候,通常都会引入一个理性人假设,假定市场的行为主体是充分理性,此处的充分理性还隐含着掌握充分的信息,引入这个假设是为了数学建模的需要。对任何一个国家大多数人都很平庸,他们的共同点之一是非常不理性。充分理性并且掌握了充分信息的个人,那也绝对是凤毛麟角,而理性人假设竟然设定市场的行为主体全都是充分理性的。有了博弈论之后,这个非常扯蛋的理性人假设就可以丢到垃圾桶里。
旧的经济学理论(理性人的解释)会说——所有公司的老板都充分理性,也掌握了充分的信息,知道应该生产何种商品,才能满足市场需求。新的经济学理论(博弈论的解释)会说——公司的老板既有优秀的,也有平庸的。平庸公司生产的商品没人要,自然会亏损并倒闭。随着时间的推移,经过自然选择,活下来的公司当然是那些聪明的。
装疯策略
理性的博弈者把自己伪装成非理性的博弈者,这么干可以获得某种虚张声势的唬人效果。对这种手法,俺称之为装疯策略。
经济学
谈博弈论的影响,当然首先要谈它对经济学的影响。有了博弈论,就不再需要那个扯蛋的理性人假设了,这是博弈论诞生后对微观经济的重大影响,还有很多其它的影响。比如说:博弈论诞生前传统的微观经济学以供给需求来建立价格的数学模型。这个模型只考虑了供应量需求量的变化对价格的影响,而完全不考虑供给双方的力量对比。如果供给双方中,一方变得强势或另一方变得弱势。即使供应量与需求量都维持不变,价格也会发生变动,朝着对强势方有利的方向移动。
生物学
生物学受博弈论影响最大的分支估计是演化生物学,也就是的进化论。借助博弈论的研究成果,演化生物学家可以更好地建立物种演化的数学模型。
一、囚徒困境
故事讲的是,两个嫌疑犯作案后被警察抓住,分别关在不同的屋子里接受审讯。警察知道两人有罪,但缺乏足够的证据。警察告诉每个人:如果两人都抵赖,各判刑一年;如果两人都坦白,各判八年;如果两人中一个坦白而另一个抵赖,坦白的放出去,抵赖的判十年。于是,每个囚徒都面临两种选择:坦白或抵赖。然而,不管同伙选择什么,每个囚徒的最优选择是坦白:如果同伙抵赖、自己坦白的话放出去,不坦白的话判一年,坦白比不坦白好;如果同伙坦白、自己坦白的话判八年,不坦白的话判十年,坦白还是比不坦白好。结果,两个嫌疑犯都选择坦白,各判刑八年。如果两人都抵赖,各判一年,显然这个结果好。但这个帕累托改进办不到,因为它不能满足人类的理性要求。囚徒困境所反映出的深刻问题是,人类的个人理性有时能导致集体的非理性——聪明的人类会因自己的聪明而作茧自缚。
二、旅行者困境
两个旅行者从一个以出产细瓷花瓶著称的地方旅行回来,他们都买了花瓶。提取行李的时候,发现花瓶被摔坏了,于是他们向航空公司索赔。航空公司知道花瓶的价格大概在八九十元的价位浮动,但是不知道两位旅客买的时候的确切价格是多少。于是,航空公司请两位旅客在100元以内自己写下花瓶的价格。如果两人写的一样,航空公司将认为他们讲真话,就按照他们写的数额赔偿;如果两人写的不一样,航空公司就认定写得低的旅客讲的是真话,并且原则上按这个低的价格赔偿,同时,航空公司对讲真话的旅客奖励2元,对讲假话的旅客罚款2元。
为了获取最大赔偿而言,本来甲乙双方最好的策略,就是都写100元,这样两人都能够获赔100元。可是不,甲很聪明,他想:如果我少写1元变成99元,而乙会写100元,这样我将得到101元。何乐而不为?所以他准备写99元。可是乙更聪明,他算计到甲要算计他写99元,于是他准备写98元。想不到甲还要更聪明一个层次,估计到乙要写98元来坑他,于是他准备写97元……大家知道,下象棋的时候,不是说要多“看”几步吗,“看”得越远,胜算越大。 你多看两步,我比你更强多看三步,你多看四步,我比你更老谋深算多看五步。在花瓶索赔的例子中,如果两个人都“彻底理性”,都能看透十几步甚至几十步上百步,那么上面那样“精明比赛”的结果,最后落到每个人都只写一两元的地步。事实上,在彻底理性的假设之下,这个博弈唯一的纳什均衡,是两人都写0。
三、是竞争也是劫持
费城西区有两个互为敌手的商店——纽约廉价品商店和美国廉价品商店.他们正好紧挨着, 两店的老板是死敌, 他们一直进行着没完没了的价格战.出售爱尔兰亚麻床单, 甚至连有鹰一般眼睛的贝蒂·瑞珀女士都不能找出任何疵点, 不信请问她;而这床单的价格又低得可笑, 只需6美元50美分".当一个店的橱窗里出现这样的手写告示时每位顾客都会习惯地等另一家廉价品商店的回音.果然, 大约过了两小时, 另一家商店的橱窗里出现了这样的告示: "瑞珀女士该配副近视眼镜了, 我的床单质量一流, 只需5美元95美分".价格大战的一天就这样开始了.除了贴告示以外, 两店的老板还经常站在店外尖声对骂, 经常发展到拳脚相加, 最后总有一方的老板在这场价格战中停止争斗, 价格不再下降.骂那个人是疯子, 这就意味着那方胜利了.这时, 围观的、路过的、还有附近每一个人都会拥入获胜的廉价品商店, 将床单和其他物品抢购一空.在这个地区, 这两个店的争吵是最激烈的, 也是持续时间最长的, 因此竟很有名声, 住在附近的每个人都从他们的争斗中获益不少, 买到了各式各样的"精美"商品.突然有一天, 一个店的老板死了, 几天以后, 另一个店的老板声称去外地办货, 这两家商店都停业了.过了几个星期, 两个商店分别来了新老板.他们各自对两个商店前任老板的财产进行了详细的调查.一天检查时, 他们发现两店之间有条秘密通道, 并且在两商店的楼上两老板住过的套房里发现了一扇连接两套房子的门.新老板很奇怪, 后来一了解才知道, 这两个死对头竟是兄弟俩.原来, 所有的诅咒、谩骂、威胁以及一切相互间的人身攻击全是在演戏, 每场价格战都是装出来的, 不管谁战胜谁, 最后还是把另一位的一切库存商品与自己的一起卖给顾客.真是绝妙的骗局。
四、酒吧博弈问题(bar problem)
酒吧博弈问题是美国人W. B.Arthur1994年在《美国经济评论》发表的题为《归纳论证和有界理性》一问中提出的,然后他又从1999年的《科学》杂志上发表的《复杂性和经济学》一文中阐述了这个博弈。''该博弈是说:有一群人,例如n=100,每个周末,均要决定是去一酒吧活动还是呆在家里。酒吧的容量是有限的,假定是60人。如果某人预测去酒吧的人超过60人,那么他决定去还是不去?......每个参与者或决策者面临的信息只是以前去酒吧的人数,只能根据以前的人数的信息来归纳出策略来。这是一个典型的动态博弈问题。......通过计算机的模型实验,阿瑟得出了一个有意思的结果:不同的行动者是根据自己的归纳来行动的,并且,去酒吧的人数没有一个固定的规律,然而,经过一段时间以后,去的平均人数总是趋于60。阿瑟说,预测者自组织到一个均衡系统中去和不去的人群,或形成一个生态稳定系统。......这就是酒吧问题。
酒吧问题所反映的是这样一个社会现象,正象阿瑟教授说的那样,我们在许多行动中,要猜测别人的行动,然而我们没有更多关于他人的信息,我们只有通过分析过去的历史来预测未来。
五、枪手博弈
今天,我讲一个有关博弈论的经典故事。
彼此痛恨的甲、乙、丙三个枪手准备决斗。甲枪法最好,十发八中;乙枪法次之,十发六中;丙枪法最差,十发四中。
先提第一个问题:如果三人同时开枪,并且每人只发一枪;第一轮枪战后,谁活下来的机会大一些?
一般人认为甲的枪法好,活下来的可能性大一些。但合乎推理的结论是,枪法最糟糕的丙活下来的几率最大。
我们来分析一下各个枪手的策略。
枪手甲一定要对枪手乙先开枪。因为乙对甲的威胁要比丙对甲的威胁更大,甲应该首先干掉乙,这是甲的最佳策略。
同样的道理,枪手乙的最佳策略是第一枪瞄准甲。乙一旦将甲干掉,乙和丙进行对决,乙胜算的概率自然大很多。
枪手丙的最佳策略也是先对甲开枪。乙的枪法毕竟比甲差一些,丙先把甲干掉再与乙进行对决,丙的存活概率还是要高一些。
我们计算一下三个枪手在上述情况下的存活几率:
甲:24%(被乙丙合射40% X 60% = 24%)
乙:20%(被甲射100% - 80% = 20%)
丙:100%(无人射丙)
通过概率分析,我们发现枪法最差的丙存活的几率最大,枪法好于丙的甲和乙的存活几率远低于丙的存活几率。
但是,上面的例子隐含一个假定,那就是甲乙丙三人都清楚地了解对手打枪的命中率。但现实生活中,因为信息不对称,比如枪手甲伪装自己,让枪手乙和丙认为甲的枪法最差,在这种情况下,最终的幸存者一定是甲。所以,无论是历史,还是现实,那些城府很深的奸雄往往能成为最后的胜利者。这样的例子,对你的职场生涯或者官场生涯是否很有启发呢?
我们继续假定,甲乙丙三人互相不了解对手的枪法水平。在这种情况下,甲被乙射、甲被丙射、甲被乙丙射及甲不被乙丙射的机率各为25%,按贝氏(Bayes)定理计算甲的存活率:
甲活率:31%([被乙射:25% X 40% = 10%] + [被丙射:25% X 60% = 15%] + [被乙丙射:25% X 40% X 60% = 6%])。
乙活率:23%([被甲射:25% X 20% = 5%] + [被丙射:25% X 60% = 15%] + [被甲丙射:25%X20%X60% = 3%])。
丙活率:17%([被甲射:25% X 20% = 5%] + [被乙射:25% X 40% = 10%] + [被甲乙射:25% X 20% X 40% = 2%])。
在枪手互相不知道对手命中率的信息的情况下,这时命中率最高的枪手甲存活的几率最大,枪法最差的丙存活的可能性最小。
我们现在回到甲乙丙都知道对手命中率的情形,进行第二轮枪战的分析。
在第一轮枪战后,丙有可能面对甲,也可能面对乙,甚至同时面对甲与乙,除非第一轮中甲乙皆死。尽管第一轮结束后,丙极有可能获胜(即甲乙双亡),但是第二轮开始,丙就一定处于劣势,因为不论甲或乙,他们的命中率都比丙的命中率为高。
这就是枪手丙的悲哀。能力不行的丙玩些花样虽然能在第一轮枪战中暂时获胜。但是,如果甲乙在第一轮枪战中没有双亡的话,在第二轮枪战结束后,丙的存活的几率就一定比甲或乙为低。
第二轮枪战中甲乙丙存活的几率粗算如下:
(1) 假设甲丙对决:甲的存活率为60%,丙的存活率为20%。
(2) 假设乙丙对决:乙的存活率为60%,丙的存活率为40%。
这似乎说明,能力差的人在竞争中耍弄手腕能赢一时,但最终往往不能成事。我们现在用严格的概率方法计算一下两轮枪战后,甲乙丙各自的存活的几率。
(1) 第一轮:
甲射乙,乙射甲,丙射甲。
甲的活率为24%(40% X 60%),乙的活率为20%(100% - 80%),丙的活率为100%(无人射丙)。
(2) 第二轮:
情况1:甲活乙死(24% X 80% = 19.2%)
甲射丙,丙射甲──甲的活率为60%,丙的活率为20%。
情况2:乙活甲死(20% X 76% = 15.2%)
乙射丙,丙射乙──乙的活率为60%,丙的活率为40%。
情况3:甲乙皆活(24% X 20% = 4.8%)
重复第一轮。
情况4:甲乙皆死(76% X 80% = 60.8%)
枪战结束。
甲的活率为12.672%
(19.2% X 60%) + (4.8% X 24%) = 12.672%
乙的活率为10.08%
(15.2% X 60%) + (4.8% X 20%) = 10.08%
丙的活率为75.52%
(19.2% X 20%) + (15.2% X 40%) + (4.8% X 100%) + (60.8% X 100%) = 75.52%
通过对两轮枪战的详细概率计算,我们仍然发现枪法最差的丙存活的几率最大,枪法较好的甲和乙的存活几率仍远低于丙的存活几率。
对于这样的例子,有人会发出“英雄创造历史,庸人繁衍子孙”的感叹。
我们现在改变游戏规则,假定甲乙丙不是同时开枪,而是他们轮流开一枪。在这个例子中,我们发现丙的机会好于他的实力,丙不会被第一枪干掉,并且他可能极有机会在下一轮中先开枪。
先假定开枪的顺序是甲、乙、丙,甲一枪将乙干掉后(80%的几率),就轮到丙开枪,丙有40%的几率一枪将甲干掉。即使乙躲过甲的第一枪,轮到乙开枪,乙还是会瞄准枪法最好的甲开枪,即使乙这一枪干掉了甲,下一轮仍然是轮到丙开枪。无论是甲或者乙先开枪,乙都有在下一轮先开枪的优势。
如果是丙先开枪,情况又如何呢?
丙可以向甲先开枪,即使丙打不中甲,甲的最佳策略仍然是向乙开枪。但是,如果丙打中了甲,下一轮可就是乙开枪打丙了。因此,丙的最佳策略是胡乱开一枪,只要丙不打中甲或者乙,在下一轮射击中他就处于有利的形势。
我们通过这个例子,可以理解人们在博弈中能否获胜,不单纯取决于他们的实力,更重要的是取决于博弈方实力对比所形成的关系。
在上面的例子中,乙和丙实际上是一种联盟关系,先把甲干掉,他们的生存几率都上升了。我们现在来判断一下,乙和丙之中,谁更有可能背叛,谁更可能忠诚?
任何一个联盟的成员都会时刻权衡利弊,一旦背叛的好处大于忠诚的好处,联盟就会破裂。在乙和丙的联盟中,乙是最忠诚的。这不是因为乙本身具有更加忠诚的品质,而是利益关系使然。只要甲不死,乙的枪口就一定会瞄准甲。但丙就不是这样了,丙不瞄准甲而胡乱开一枪显然违背了联盟关系,丙这样做的结果,将使乙处于更危险的境地。
合作才能对抗强敌。只有乙丙合作,才能把甲先干掉。如果,乙丙不和,乙或丙单独对甲都不占优,必然被甲先后解决。
六、智猪博弈
猪圈里有两头猪,一头大猪,一头小猪。猪圈的一边有个踏板,每踩一下踏板,在远离踏板的猪圈的另一边的投食口就会落下少量的食物。如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。当小猪踩动踏板时,大猪会在小猪跑到食槽之前刚好吃光所有的食物;若是大猪踩动了踏板,则还有机会在小猪吃完落下的食物之前跑到食槽,争吃到另一半残羹。
那么,两只猪各会采取什么策略?答案是:小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边;而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。
原因何在?因为,小猪踩踏板将一无所获,不踩踏板反而能吃上食物。对小猪而言,无论大猪是否踩动踏板,不踩踏板总是好的选择。反观大猪,已明知小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,所以只好亲历亲为了。
改变方案一:减量方案。投食仅原来的一半分量。结果是小猪大猪都不去踩踏板了。小猪去踩,大猪将会把食物吃完;大猪去踩,小猪将也会把食物吃完。谁去踩踏板,就意味着为对方贡献食物,所以谁也不会有踩踏板的动力了。
如果目的是想让猪们去多踩踏板,这个游戏规则的设计显然是失败的。
改变方案二:增量方案。投食为原来的一倍分量。结果是小猪、大猪都会去踩踏板。谁想吃,谁就会去踩踏板。反正对方不会一次把食物吃完。小猪和大猪相当于生活在物质相对丰富的“共产主义”社会,所以竞争意识却不会很强。
对于游戏规则的设计者来说,这个规则的成本相当高(每次提供双份的食物);而且因为竞争不强烈,想让猪们去多踩踏板的效果并不好。
改变方案三:减量加移位方案。投食仅原来的一半分量,但同时将投食口移到踏板附近。结果呢,小猪和大猪都在拼命地抢着踩踏板。等待者不得食,而多劳者多得。每次的收获刚好消费完。
对于游戏设计者,这是一个最好的方案。成本不高,但收获最大。
许多人并未读过“智猪博弈”的故事,但是却在自觉地使用小猪的策略。股市上等待庄家抬轿的散户;等待产业市场中出现具有赢利能力新产品、继而大举仿制牟取暴利的游资;公司里不创造效益但分享成果的人,等等。比如,公司的激励制度设计,奖励力度太大,又是持股,又是期权,公司职员个个都成了百万富翁,成本高不说,员工的积极性并不一定很高。这相当于“智猪博弈”增量方案所描述的情形。但是如果奖励力度不大,而且见者有份(不劳动的“小猪”也有),一度十分努力的大猪也不会有动力了----就象“智猪博弈”减量方案一所描述的情形。最好的激励机制设计就象改变方案三----减量加移位的办法,奖励并非人人有份,而是直接针对个人(如业务按比例提成),既节约了成本(对公司而言),又消除了“搭便车”现象,能实现有效的激励。
而从整个社会来讲,自身需求大的群体往往才是社会生产力推动的主力。换句话说,要迅速提高整个社会的生产力水平,就需要有一个自身具有很大消费需求的群体,并且需要给他们一定程度的奖励。第三种改变方案反映的就是这种情况,方案中降低了取食的成本,在现实中,也可以等同于增加了对取食者的奖励。