.博弈论是指某个个人或是组织,面对一定的环境条件,在一定的规则约束下,依靠所掌握的信息,从各自选择的行为或是策略进行选择并加以实施,并从各自取得相应结果或收益的过程,在经济学上博奕论是个非常重要的理论概念。
什么是博弈论?古语有云,世事如棋。生活中每个人如同棋手,其每一个行为如同在一张看不见的棋盘上布一个子,精明慎重的棋手们相互揣摩、相互牵制,人人争赢,下出诸多精彩纷呈、变化多端的棋局。博弈论是研究棋手们 “出棋” 着数中理性化、逻辑化的部分,并将其系统化为一门科学。换句话说,就是研究个体如何在错综复杂的相互影响中得出最合理的策略。事实上,博弈论正是衍生于古老的游戏或曰博弈如象棋、扑克等。数学家们将具体的问题抽象化,通过建立自完备的逻辑框架、体系研究其规律及变化。这可不是件容易的事情,以最简单的二人对弈为例,稍想一下便知此中大有玄妙:若假设双方都精确地记得自己和对手的每一步棋且都是最“理性” 的棋手,甲出子的时候,为了赢棋,得仔细考虑乙的想法,而乙出子时也得考虑甲的想法,所以甲还得想到乙在想他的想法,乙当然也知道甲想到了他在想甲的想法…
面对如许重重迷雾,博弈论怎样着手分析解决问题,怎样对作为现实归纳的抽象数学问题求出最优解、从而为在理论上指导实践提供可能性呢?现代博弈理论由匈牙利大数学家冯·诺伊曼于20世纪20年代开始创立,1944年他与经济学家奥斯卡·摩根斯特恩合作出版的巨著《博弈论与经济行为》,标志着现代系统博弈理论的初步形成。对于非合作、纯竞争型博弈,诺伊曼所解决的只有二人零和博弈--好比两个人下棋、或是打乒乓球,一个人赢一着则另一个人必输一着,净获利为零。在这里抽象化后的博弈问题是,已知参与者集合(两方) ,策略集合(所有棋着) ,和盈利集合(赢子输子) ,能否且如何找到一个理论上的“解” 或“平衡” ,也就是对参与双方来说都最“合理” 、最优的具体策略?怎样才是“合理” ?应用传统决定论中的“最小最大” 准则,即博弈的每一方都假设对方的所有功略的根本目的是使自己最大程度地失利,并据此最优化自己的对策,诺伊曼从数学上证明,通过一定的线性运算,对於每一个二人零和博弈,都能够找到一个“最小最大解” 。通过一定的线性运算,竞争双方以概率分布的形式随机使用某套最优策略中的各个步骤,就可以最终达到彼此盈利最大且相当。当然,其隐含的意义在於,这套最优策略并不依赖于对手在博弈中的操作。用通俗的话说,这个著名的最小最大定理所体现的基本“理性” 思想是“抱最好的希望,做最坏的打算” 。
2.在经济学中,“智*博弈”(Pigs’payoffs)是一个著名博弈论例子。
这个例子讲的是:*圈里有两头*,一头大*,一头小*。*圈的一边有个踏板,每踩一下踏板,在远离踏板的*圈的另一边的投食口就会落下少量的食物。如果有一只*去踩踏板,另一只*就有机会抢先吃到另一边落下的食物。当小*踩动踏板时,大*会在小*跑到食槽之前刚好吃光所有的食物;若是大*踩动了踏板,则还有机会在小*吃完落下的食物之前跑到食槽,争吃到另一半残羹。
那么,两只*各会采取什么策略?答案是:小*将选择“搭便车”策略,也就是舒舒服服地等在食槽边;而大*则为一点残羹不知疲倦地奔忙于踏板和食槽之间。
原因何在?因为,小*踩踏板将一无所获,不踩踏板反而能吃上食物。对小*而言,无论大*是否踩动踏板,不踩踏板总是好的选择。反观大*,已明知小*是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,所以只好亲力亲为了。
“小*躺着大*跑”的现象是由于故事中的游戏规则所导致的。规则的核心指标是:每次落下的事物数量和踏板与投食口之间的距离。
如果改变一下核心指标,*圈里还会出现同样的“小*躺着大*跑”的景象吗?试试看。
改变方案一:减量方案。投食仅原来的一半分量。结果是小*大*都不去踩踏板了。小*去踩,大*将会把食物吃完;大*去踩,小*将也会把食物吃完。谁去踩踏板,就意味着为对方贡献食物,所以谁也不会有踩踏板的动力了。
如果目的是想让*们去多踩踏板,这个游戏规则的设计显然是失败的。
改变方案二:增量方案。投食为原来的一倍分量。结果是小*、大*都会去踩踏板。谁想吃,谁就会去踩踏板。反正对方不会一次把食物吃完。小*和大*相当于生活在物质相对丰富的“共产主义”社会,所以竞争意识却不会很强。
对于游戏规则的设计者来说,这个规则的成本相当高(每次提供双份的食物);而且因为竞争不强烈,想让*们去多踩踏板的效果并不好。
改变方案三:减量加移位方案。投食仅原来的一半分量,但同时将投食口移到踏板附近。结果呢,小*和大*都在拼命地抢着踩踏板。等待者不得食,而多劳者多得。每次的收获刚好消费完。
对于游戏设计者,这是一个最好的方案。成本不高,但收获最大。
原版的“智*博弈”故事给了竞争中的弱者(小*)以等待为最佳策略的启发。但是对于社会而言,因为小*未能参与竞争,小*搭便车时的社会资源配置的并不是最佳状态。为使资源最有效配置,规则的设计者是不愿看见有人搭便车的,政府如此,公司的老板也是如此。而能否完全杜绝“搭便车”现象,就要看游戏规则的核心指标设置是否合适了。
比如,公司的激励制度设计,奖励力度太大,又是持股,又是期权,公司职员个个都成了百万富翁,成本高不说,员工的积极性并不一定很高。这相当于“智*博弈”
增量方案所描述的情形。但是如果奖励力度不大,而且见者有份(不劳动的“小*”也有),一度十分努力的大*也不会有动力了----就象“智*博弈”减量方案一所描述的情形。最好的激励机制设计就象改变方案三----减量加移位的办法,奖励并非人人有份,而是直接针对个人(如业务按比例提成),既节约了成本(对公司而言),又消除了“搭便车”现象,能实现有效的激励。
许多人并未读过“智*博弈”的故事,但是却在自觉地使用小*的策略。股市上等待庄家抬轿的散户;等待产业市场中出现具有赢利能力新产品、继而大举仿制牟取暴利的游资;公司里不创造效益但分享成果的人,等等。因此,对于制订各种经济管理的游戏规则的人,必须深谙“智*博弈”指标改变的个中道理。
3.背景知识:纳什博弈论的原理与应用
2002年03月21日17:44 北京晚报
1950年和1951年纳什的两篇关于非合作博弈论的重要论文,彻底改变了人们对竞争和市场的看法。他证明了非合作博弈及其均衡解,并证明了均衡解的存在性,即著名的纳什均衡。从而揭示了博弈均衡与经济均衡的内在联系。纳什的研究奠定了现代非合作博弈论的基石,后来的博弈论研究基本上都沿着这条主线展开的。然而,纳什天才的发现却遭到冯·诺依曼的断然否定,在此之前他还受到爱因斯坦的冷遇。但是骨子里挑战权威、藐视权威的本性,使纳什坚持了自己的观点,终成一代大师。要不是30多年的严重精神病折磨,恐怕他早已
站在诺贝尔奖的领奖台上了,而且也绝不会与其他人分享这一殊荣。
纳什是一个非常天才的数学家,他的主要贡献是1950至1951年在普林斯顿读博士学位时做出的。然而,他的天才发现———非合作博弈的均衡,即“纳什均衡”并不是一帆风顺的。
1948年纳什到普林斯顿大学读数学系的博士。那一年他还不到20岁。当时普林斯顿可谓人杰地灵,大师如云。爱因斯坦、冯·诺依曼、列夫谢茨(数学系主任)、阿尔伯特·塔克、阿伦佐·切奇、哈罗德·库恩、诺尔曼·斯蒂恩罗德、埃尔夫·福克斯……等全都在这里。博弈论主要是由冯·诺依曼(1903—1957)创所立的。他是一位出生于匈牙利的天才的数学家。他不仅创立了经济博弈论,而且发明了计算机。早在20世纪初,塞梅鲁(Zermelo)、鲍罗(Borel)和冯·诺伊曼已经开始研究博弈的准确的数学表达,直到1939年,冯·诺依曼遇到经济学家奥斯卡·摩根斯特恩(Oskar Morgenstern),并与其合作才使博弈论进入经济学的广阔领域。
1944年他与奥斯卡·摩根斯特恩合著的巨作《博弈论与经济行为》出版,标志着现代系统博弈理论的的初步形成。尽管对具有博弈性质的问题的研究可以追溯到19世纪甚至更早。例如,1838年古诺(Cournot)简单双寡头垄断博弈;1883年伯特兰和1925年艾奇沃奇思研究了两个寡头的产量与价格垄断;2000多年前中国著名军事家孙武的后代孙膑利用博弈论方法帮助田忌赛马取胜等等都属于早期博弈论的萌芽,其特点是零星的,片断的研究,带有很大的偶然性,很不系统。冯·诺依曼和摩根斯特恩的《博弈论与经济行为》一书中提出的标准型、扩展型和合作型博弈模型解的概念和分析方法,奠定了这门学科的理论基础。合作型博弈在20世纪50年代达到了巅峰期。然而,诺依曼的博弈论的局限性也日益暴露出来,由于它过于抽象,使应用范围受到很大限制,在很长时间里,人们对博弈论的研究知之甚少,只是少数数学家的专利,所以,影响力很有限。正是在这个时候,非合作博弈———“纳什均衡”应运而生了,它标志着博弈论的新时代的开始!纳什不是一个按部就班的学生,他经常旷课。据他的同学们回忆,他们根本想不起来曾经什么时候和纳什一起完完整整地上过一门必修课,但纳什争辩说,至少上过斯蒂恩罗德的代数拓扑学。斯蒂恩罗德恰恰是这门学科的创立者,可是,没上几次课,纳什就认定这门课不符合他的口味。于是,又走人了。然而,纳什毕竟是一位英才天纵的非凡人物,他广泛涉猎数学王国的每一个分支,如拓扑学、代数几何学、逻辑学、博弈论等等,深深地为之着迷。纳什经常显示出他与众不同的自信和自负,充满咄咄逼人的学术野心。1950年整个夏天纳什都忙于应付紧张的考试,他的博弈论研究工作被迫中断,他感到这是莫大的浪费。殊不知这种暂时的“放弃”,使原来模糊、杂乱和无绪的若干念头,在潜意识的持续思考下,逐步形成一条清晰的脉络,突然来了灵感!这一年的10月,他骤感才思潮涌,梦笔生花。其中一个最耀眼的亮点就是日后被称之为“纳什均衡”的非合作博弈均衡的概念。纳什的主要学术贡献体现在1950年和1951年的两篇论文之中(包括一篇博士论文)。1950年他才把自己的研究成果写成题为“非合作博弈”的长篇博士论文,1950年11月刊登在美国全国科学院每月公报上,立即引起轰动。说起来这全靠师兄戴维·盖尔之功,就在遭到冯·诺依曼贬低几天之后,他遇到盖尔,告诉他自己已经将冯·诺依曼的“最小最大原理”(minimax solution)推到非合作博弈领域,找到了普遍化的方法和均衡点。盖尔听得很认真,他终于意识到纳什的思路比冯·诺伊曼的合作博弈的理论更能反映现实的情况,而对其严密优美的数学证明极为赞叹。盖尔建议他马上整理出来发表,以免被别人捷足先登。纳什这个初出茅庐的小子,根本不知道竞争的险恶,从未想过要这么做。结果还是盖尔充当了他的“经纪人”,代为起草致科学院的短信,系主任列夫谢茨则亲自将文稿递交给科学院。纳什写的文章不多,就那么几篇,但已经足够了,因为都是精品中的精品。这一点也是值得我们深思的。国内提一个教授,要求在“核心的刊物”上发表多少篇文章。按照这个标准可能纳什还不一定够资格。
1996年诺贝尔经济学奖得主莫尔里斯当牛津大学艾奇沃思经济学讲座教授时也没有发表过什么文章,特殊的人才,必须有特殊的选拔办法。
纳什在上大学时就开始从事纯数学的博弈论研究,1948年进入普林斯顿大学后更是如鱼得水。20岁出头已成为闻名世界的数学家。特别是在经济博弈论领域,他做出了划时代的贡献,是继冯·诺依曼之后最伟大的博弈论大师之一。他提出的著名的纳什均衡的概念在非合作博弈理论中起着核心的作用。后续的研究者对博弈论的贡献,都是建立在这一概念之上的。由于纳什均衡的提出和不断完善为博弈论广泛应用于经济学、管理学、社会学、政治学、军事科学等领域奠定了坚实的理论基础。
囚犯的两难处境
大理论中的小故事
要了解纳什的贡献,首先要知道什么是非合作博弈问题。现在几乎所有的博弈论教科书上都会讲“囚犯的两难处境”的例子,每本书上的例子都大同小异。
博弈论毕竟是数学,更确切地说是运筹学的一个分支,谈经论道自然少不了数学语言,外行人看来只是一大堆数学公式。好在博弈论关心的是日常经济生活问题,所以不能不食人间烟火。其实这一理论是从棋弈、扑克和战争等带有竞赛、对抗和决策性质的问题中借用的术语,听上去有点玄奥,实际上却具有重要现实意义。博弈论大师看经济社会问题犹如棋局,常常寓深刻道理于游戏之中。所以,多从我们的日常生活中的凡人小事入手,以我们身边的故事做例子,娓娓道来,并不乏味。话说有一天,一位富翁在家中被杀,财物被盗。警方在此案的侦破过程中,抓到两个犯罪嫌疑人,斯卡尔菲丝和那库尔斯,并从他们的住处搜出被害人家中丢失的财物。但是,他们矢口否认曾杀过人,辩称是先发现富翁被杀,然后只是顺手牵羊偷了点儿东西。于是警方将两人隔离,分别关在不同的房间进行审讯。由地方检察官分别和每个人单独谈话。检察官说,“由于你们的偷盗罪已有确凿的证据,所以可以判你们一年刑期。但是,我可以和你做个交易。如果你单独坦白杀人的罪行,我只判你三个月的监禁,但你的同伙要被判十年刑。如果你拒不坦白,而被同伙检举,那么你就将被判十年刑,他只判三个月的监禁。但是,如果你们两人都坦白交代,那么,你们都要被判5年刑。”斯卡尔菲丝和那库尔斯该怎么办呢?他们面临着两难的选择——坦白或抵赖。显然最好的策略是双方都抵赖,结果是大家都只被判一年。但是由于两人处于隔离的情况下无法串供。所以,按照亚当·斯密的理论,每一个人都是从利己的目的出发,他们选择坦白交代是最佳策略。因为坦白交代可以期望得到很短的监禁———3个月,但前提是同伙抵赖,显然要比自己抵赖要坐10年牢好。这种策略是损人利己的策略。不仅如此,坦白还有更多的好处。如果对方坦白了而自己抵赖了,那自己就得坐10年牢。太不划算了!因此,在这种情况下还是应该选择坦白交代,即使两人同时坦白,至多也只判5年,总比被判10年好吧。所以,两人合理的选择是坦白,原本对双方都有利的策略(抵赖)和结局(被判1年刑)就不会出现。这样两人都选择坦白的策略以及因此被判5年的结局被称为“纳什均衡”,也叫非合作均衡。因为,每一方在选择策略时都没有“共谋”(串供),他们只是选择对自己最有利的策略,而不考虑社会福利或任何其他对手的利益。也就是说,这种策略组合由所有局中人(也称当事人、参与者)的最佳策略组合构成。没有人会主动改变自己的策略以便使自己获得更大利益。“囚徒的两难选择”有着广泛而深刻的意义。个人理性与集体理性的冲突,各人追求利己行为而导致的最终结局是一个“纳什均衡”,也是对所有人都不利的结局。他们两人都是在坦白与抵赖策略上首先想到自己,这样他们必然要服长的刑期。只有当他们都首先替对方着想时,或者相互合谋(串供)时,才可以得到最短时间的监禁的结果。“纳什均衡”首先对亚当·斯密的“看不见的手”的原理提出挑战。按照斯密的理论,在市场经济中,每一个人都从利己的目的出发,而最终全社会达到利他的效果。不妨让我们重温一下这位经济学圣人在《国富论》中的名言:“通过追求(个人的)自身利益,他常常会比其实际上想做的那样更有效地促进社会利益。”从“纳什均衡”我们引出了“看不见的手”的原理的一个悖论:从利己目的出发,结果损人不利己,既不利己也不利他。两个囚徒的命运就是如此。从这个意义上说,“纳什均衡”提出的悖论实际上动摇了西方经济学的基石。因此,从“纳什均衡”中我们还可以悟出一条真理:合作是有利的“利己策略”。但它必须符合以下黄金律:按照你愿意别人对你的方式来对别人,但只有他们也按同样方式行事才行。也就是中国人说的“己所不欲勿施于人”。但前提是人所不欲勿施于我。其次,“纳什均衡”是一种非合作博弈均衡,在现实中非合作的情况要比合作情况普遍。所以“纳什均衡”是对冯·诺依曼和摩根斯特恩的合作博弈理论的重大发展,甚至可以说是一场革命。
从“纳什均衡”的普遍意义中我们可以深刻领悟司空见惯的经济、社会、政治、国防、管理和日常生活中的博弈现象。我们将例举出许多类似于“囚徒的两难处境”这样的例子。如价格战、军奋竞赛、污染等等。一般的博弈问题由三个要素所构成:即局中人(players)又称当事人、参与者、策略等等的集合,策略(strategies)集合以及每一对局中人所做的选择和赢得(payoffs)集合。其中所谓赢得是指如果一个特定的策略关系被选择,每一局中人所得到的效用。所有的博弈问题都会遇到这三个要素。
价格战博弈:
现在我们经常会遇到各种各样的家电价格大战,彩电大战、冰箱大战、空调大战、微波炉大战……这些大战的受益者首先是消费者。每当看到一种家电产品的价格大战,百姓都会“没事儿偷着乐”。在这里,我们可以解释厂家价格大战的结局也是一个“纳什均衡”,而且价格战的结果是谁都没钱赚。因为博弈双方的利润正好是零。竞争的结果是稳定的,即是一个“纳什均衡”。这个结果可能对消费者是有利的,但对厂商而言是灾难性的。所以,价格战对厂商而言意味着自杀。从这个案例中我们可以引伸出两个问题,一是竞争削价的结果或“纳什均衡”可能导致一个有效率的零利润结局。二是如果不采取价格战,作为一种敌对博弈论(vivalry game)其结果会如何呢?每一个企业,都会考虑采取正常价格策略,还是采取高价格策略形成垄断价格,并尽力获取垄断利润。如果垄断可以形成,则博弈双方的共同利润最大。这种情况就是垄断经营所做的,通常会抬高价格。另一个极端的情况是厂商用正常的价格,双方都可以获得利润。从这一点,我们又引出一条基本准则:“把你自己的战略建立在假定对手会按其最佳利益行动的基础上”。事实上,完全竞争的均衡就是“纳什均衡”或“非合作博弈均衡”。在这种状态下,每一个厂商或消费者都是按照所有的别人已定的价格来进行决策。在这种均衡中,每一企业要使利润最大化,消费者要使效用最大化,结果导致了零利润,也就是说价格等于边际成本。在完全竞争的情况下,非合作行为导致了社会所期望的经济效率状态。如果厂商采取合作行动并决定转向垄断价格,那么社会的经济效率就会遭到破坏。这就是为什么WTO和各国政府要加强反垄断的意义所在。
污染博弈:
假如市场经济中存在着污染,但政府并没有管制的环境,企业为了追求利润的最大化,宁愿以牺牲环境为代价,也绝不会主动增加环保设备投资。按照看不见的手的原理,所有企业都会从利己的目的出发,采取不顾环境的策略,从而进入“纳什均衡”状态。如果一个企业从利他的目的出发,投资治理污染,而其他企业仍然不顾环境污染,那么这个企业的生产成本就会增加,价格就要提高,它的产品就没有竞争力,甚至企业还要破产。这是一个“看不见的手的有效的完全竞争机制”失败的例证。直到20世纪90年代中期,中国乡镇企业的盲目发展造成严重污染的情况就是如此。只有在政府加强污染管制时,企业才会采取低污染的策略组合。企业在这种情况下,获得与高污染同样的利润,但环境将更好。
贸易自由与壁垒:
这个问题对于刚刚加入WTO的中国而言尤为重要。任何一个国家在国际贸易中都面临着保持贸易自由与实行贸易保护主义的两难选择。贸易自由与壁垒问题,也是一个“纳什均衡”,这个均衡是贸易双方采取不合作博弈的策略,结果使双方因贸易战受到损害。X国试图对Y国进行进口贸易限制,比如提高关税,则Y国必然会进行反击,也提高关税,结果谁也没有捞到好处。反之,如X和Y能达成合作性均衡,即从互惠互利的原则出发,双方都减少关税限制,结果大家都从贸易自由中获得了最大利益,而且全球贸易的总收益也增加了。
参考资料:
纳什均衡,Nash equilibrium ,又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。
纳什均衡是一种策略组合,使得同一时间内每个参与人的策略是对其他参与人策略的最优反应。
假设有n个局中人参与博弈,如果某情况下无一参与者可以独自行动而增加收益(即为了自身利益的最大化,没有任何单独的一方愿意改变其策略的[1] ),则此策略组合被称为纳什均衡。所有局中人策略构成一个策略组合(Strategy Profile)。纳什均衡,从实质上说,是一种非合作博弈状态。
纳什均衡达成时,并不意味着博弈双方都处于不动的状态,在顺序博弈中这个均衡是在博弈者连续的动作与反应中达成的。纳什均衡也不意味着博弈双方达到了一个整体的最优状态,需要注意的是,只有最优策略才可以达成纳什均衡,严格劣势策略不可能成为最佳对策,而弱优势和弱劣势策略是有可能达成纳什均衡的。在一个博弈中可能有一个以上的纳什均衡,而囚徒困境中有且只有一个纳什均衡。
只有一次
1994年10月11日,瑞典皇家科学院宣布,由于纳什博士对非合作博弈理论中的均衡问题进行了开创性分析,与哈尔萨尼教授( P rofessor JohnC.Harsanyi)和泽尔滕教授( P rofessorDr. Reinhard Selten)分享了该年度的诺贝尔经济学奖,奖金93万美元。
纳什在1950年和1951年发表了两篇关于非合作博弈的论文,《 n人博弈中的均衡点》和《非合作博弈》,定义了“纳什均衡”概念,与 T ucker于1950年定义的“囚徒困境”一起,奠定了当代非合作博弈论的基石。纳什获得诺贝尔经济学奖,就是基于这两篇论文。
1、纳什均衡,Nash equilibrium ,又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。
2、约翰·纳什1948年作为年轻数学博士生进入普林斯顿大学。其研究成果见于题为《非合作博弈》(1950)的博士论文。该博士论文导致了《n人博弈中的均衡点》(1950)和题为《非合作博弈》(1951)两篇论文的发表。纳什在上述论文中,介绍了合作博弈与非合作博弈的区别。他对非合作博弈的最重要贡献是阐明了包含任意人数局中人和任意偏好的一种通用解概念,也就是不限于两人零和博弈。该解概念后来被称为纳什均衡。
3、纳什的主要学术贡献体现在1950年和1951年的两篇论文,1950年他才把自己的研究成果写成题为“非合作博弈”的文章刊登在美国全国科学院每月公报上,立即引起轰动。说起来这全靠师兄戴维·盖尔之功,就在遭到冯·诺依曼贬低,嘲笑几天之后,他遇到盖尔,像说梦话似的告诉他自己已经将冯·诺依曼的“最小最大原理找到了普遍化的方法和均衡点。纳什这个初出茅庐的小子,根本不知道竞争的险恶,从没想到学术欺骗的后果。结果还是戴维·盖尔充当了他的“经纪人”,起草致科学院的短信,系主任列夫谢茨则利用方便的人脉关系亲自将文稿递交给科学院。纳什写的文章不多,他辩解说:少了才是精品。中国国内提一个教授,要求在“核心的刊物”上发表多少篇文章。按照这个标准可能纳什还不一定够资格。
4、1996年诺贝尔经济学奖得主莫尔里斯当牛津大学艾奇沃思经济学讲座教授时也没有发表过什么文章,特殊的人才,必须有特殊的选拔办法。
5、Nash平衡是指博弈中这样的局面,对于每个参与者来说,只要其他人不改变策略,他就无法改善自己的状况。Nash在证明了在每个参与者都只有有限种策略选择、并允许混合策略的前提下,Nash平衡一定存在。以两家公司的价格大战为例,Nash平衡意味着两败俱伤的可能:在对方不改变价格的条件下,既不能提价,否则会进一步丧失市场;也不能降价,因为会出现赔本甩卖。于是两家公司可以改变原先的利益格局,通过谈判寻求新的利益评估分摊方案,也就是Nash平衡。类似的推理当然也可以用到选举,群体之间的利益冲突,潜在战争爆发前的僵局,议会中的法案争执等。
6、假设有n个局中人参与博弈,给定其他人策略的条件下,每个局中人选择自己的 纳什均衡
7、最优策略(个人最优策略可能依赖于也可能不依赖于他人的战略),从而使自己利益最大化。所有局中人策略构成一个策略组合(Strategy Profile)。纳什均衡指的是这样一种战略组合,这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下,没有人有足够理由打破这种均衡。纳什均衡,从实质上说,是一种非合作博弈状态。
8、纳什均衡达成时,并不意味着博弈双方都处于不动的状态,在顺序博弈中这个均衡是在博弈者连续的动作与反应中达成的。纳什均衡也不意味着博弈双方达到了一个整体的最优状态,以下的囚徒困境就是一个例子。
博弈论原来是用在赌牌上的 一种数学运算的高概率 的方法 但现在的定义是从复杂的现象中抽象出基本的元素,对这些元素构成的数学模型进行分析,而后逐步引入对其形势产影响的其他因素,从而分析其结果。乔治纳什的开创性论文《n人博弈的均衡点》(估计你读不懂- -) 哲学是一种先进的世界观的方法论- -(估计你还是不明白)(高中课本上有标准定义的 我这个不完全也不算太准确)推荐书 笛卡尔的书(是一名数学家, 特点,通过数学方法推理得出结论) 叔本华的 康德的 尼采的 (鲁迅的 超人(进化论) 的思想 就是从这来的) 书名,纯粹理性批判(你还是读不懂) 精神现象与表像世界(你更读不懂了)(先不要去碰唯心 唯物你现在做的先去感受明白吗你肯定地不懂事当然的了) 最后告你一句,你最好是去上学 比我说得清楚因为我把上就上高中了happy~~~(没人在生活中理解我,如果过多的去深究 你也会变成那样的。)
美国环球公司(Universal Pictures,USA)2001年出品的电影《美丽心灵》(A Beautiful Mind)可谓家喻户晓。该片一举囊括了第59届金球奖5项大奖,并荣获2002年第74届奥斯卡奖4项大奖。影片本身与银幕背后的人物原型,都深深震撼了全世界人们的心灵。
《美丽心灵》艺术地再现了数学天才、1994年诺贝尔经济学奖得主之一、罹患妄想型精神分裂症30多年又奇迹般恢复正常的约翰•纳什(John Nash)传奇般的人生经历。
在一般的纪实性电影中,演员形象总是比真实生活中的原型要更具有动人风采。然而,让人难以置信的是,现实的纳什无论容貌风度都比男主角奥斯卡影帝罗素•克洛(Crowe Russell)略胜一筹。
正是这个曾如希腊古神一般英俊潇洒却又古怪精灵的数学与经济学的双料天才———纳什,其早年在博弈理论方面的巨大贡献一直改变着我们的生活。
然而,《美丽心灵》却又如实地反映出纳什喜悲交加的一生:纳什在数学领域工作,从早年开始就非常优异,1958年他被美国《财富》(Fortune)杂志评为新一代天才数学家中最杰出的人物。就在纳什春风得意、事业将达到顶峰时,却突然遭受命运无情的重重一击,从云端坠入地狱:30岁的纳什患上了严重的精神分裂症。天才的他一生为精神分裂症所困扰,并在私生活上毫不检点。纳什青年时代曾与一位大他5岁的姑娘交往,两人还有个私生子,纳什在精神分裂症发作之前一直与她保持着若即若离的暧昧关系。他的父母4年之后发现此事,不久后纳什父亲去世,不知是否与这个打击有关。父亲去世之后,纳什与麻省理工学院(MIT)年轻美丽的女学生爱莉西娅(Alicia)结婚,此后40多年患难与共的爱情和亲情中可以见证这是他的个人生活中最完美、最幸运的时光。
就在爱莉西娅身怀有孕,正待分娩的同年,纳什的精神状况却日益恶化。他的举止越来越古怪,正一步步走向心智狂乱。他麻烦缠身,有一次竟然因为在男洗手间“不恰当地”暴露了自己的身体被逮捕。
万般无奈之下,爱莉西娅于1962年和纳什离婚。但是她对他的忠诚爱情并没有就此消失。1970年,纳什的母亲去世,而他的姐姐无法负担他,就在纳什孤苦无依、就要流落街头的时候,善良的爱莉西娅接他来与自己同住。她不仅在起居上关心他,而且以女性特有的细心敏感照料着他的情感生活。她体贴他不肯去医院封闭治疗的愿望,把家搬到远离尘世喧嚣的普林斯顿,希望宁静熟悉的学术氛围有助于稳定纳什的情绪。
爱莉西娅不能眼睁睁看着这个天赋异禀的天才就这样消沉。作为妻子的爱莉西娅用爱去挽救丈夫,尽管这对幸福的人在恋爱时的卿卿我我此时已荡然无存。纳什被妻子的这种无可动摇的爱和坚定的信念所感染,决心同疾病抗争到底。在深爱他的妻子爱莉西娅的帮助下,在他自己的天才与狂乱中,纳什陷入了一种狂热的智力上的极高的境界。
这改变了一切。经过很多年的艰苦努力,纳什最终走出阴霾,理性为他带来了心灵的平和。终于在1994年纳什凭借他在现代博弈理论上的卓越贡献,获得科学界的最高荣誉———诺贝尔奖。
人们在观看影片的时候,不禁会想,天才纳什在博弈上的贡献主要是什么?为什么好莱坞会为这样一个充满传奇色彩的博弈论大师拍摄出这样纪实性的影片呢?这部片子为什么又是如此地震撼了全球亿万观众的心灵?
可能很多人对博弈论的兴趣正是《美丽心灵》这部传世之作所引发出的。
众所周知,现代博弈理论由匈牙利大数学家冯•诺伊曼(John von Neumann)于20世纪20年代开始创立,1944年他与经济学家奥斯卡•摩根斯特恩(Oskar Morgenstern)合作出版的巨著《博弈论与经济行为》,标志着现代系统博弈理论的初步形成。
对于非合作、纯竞争型博弈,诺伊曼所解决的只有二人零和博弈,比如两个人打乒乓球,一方赢则另一方必输,两个人获利的总和为零。在这里能否且如何找到一个理论上的“解”或“平衡”,也就是对参与双方来说都最“合理”或者是最优的具体策略?怎么样的策略才是“合理”?
应用传统决策论中的“最小最大”准则,即博弈的每一方都假设对方的所有策略的根本目的是使自己最大程度地失利,并据此最优化自己的对策,诺伊曼从数学上证明,通过一定的线性运算,对于每一个二人零和博弈,都能够找到一个“最小最大解”。用通俗的话说,这个著名的最小最大定理所体现的基本思想是“抱最好的希望,做最坏的打算”。
虽然二人零和博弈的解决具有重大的意义,但作为一个理论来说,它应用于实践的范围是极其有限的。二人零和博弈主要的局限性:一是在各种社会活动中,常常有多方参与而不是只有两方;二是参与各方相互作用的结果并不一定有人得利就有人失利,整个群体可能具有大于零或小于零的净获利。
1949年,21岁的纳什写下一篇著名的论文《多人博弈的均衡点》,提出了纳什均衡的概念和解法。这是整个现代非合作型博弈论中最重要的思想之一,也奠定了44年后他获得诺贝尔奖的基础。
1950年纳什曾带着他的想法去会见当时名满天下的冯•诺依曼(博弈论创始人之一,天才数学家),遭到断然否定,在此之前他还受到爱因斯坦的冷遇。但是在普林斯顿大学宽松的科学环境下,他的论文仍然得到发表并引起了轰动。
对于多人参与、非零和的博弈问题,在纳什之前,无人知道如何求解,或者说怎样找到类似于最小最大解那样的“平衡”。而找不到解,下面的研究当然无法进行,更谈不上指导实践了。纳什对博弈论的巨大贡献,正在于他天才性地提出了“纳什均衡”的基本概念,为更加普遍广泛的博弈问题找到了解。
1950年和1951年纳什的两篇关于非合作博弈论的重要论文,彻底改变了人们对竞争和市场的看法。他证明了非合作博弈及其均衡解,并证明了均衡解的存在性,即著名的纳什均衡。从而揭示了博弈均衡与经济均衡的内在联系。纳什的研究奠定了现代非合作博弈论的基石,后来的博弈论研究基本上都是沿着这条主线展开的。
纳什的好友,普林斯顿大学经济学教授迪克西特曾说:“如果每次有人说起或写下纳什均衡这几个字,纳什都能拿到一块钱的话,那么他现在会是个大富翁了!”
诺伊曼在《博弈论与经济行为》一书中还建立了合作型博弈论的基本模型,但是对于其中双向协商问题,也就是参与者如何“讨价还价”的问题,没有给出一个确定的解。
纳什对这一领域同样作出了卓越贡献,他不仅提出了讨价还价问题的公理化解法,还在理论上利用这个解法良好的预测性进一步提出纳什方案:将合作型博弈中的协商转化为一个更广泛的非合作型博弈的一个步骤———协商的目的最终仍是最大化自己的利益。
此外,在测试博弈论的行为实验学上,纳什也是一名先驱。他曾展开讨价还价和联盟形成的实验,并曾敏锐地指出,在其他实验者的囚徒困境实验里,反复让一对参与者重复实验实际上将单步策略问题转化成了一个大的多步策略问题。这一思想初次提示了在重复博弈理论中串谋的可能性,这一发现在经济和政治领域起到重要的作用。
在《美丽心灵》中有这样的情节:1994年美国政府向商家拍卖大部份电磁波谱。这一多回合拍卖由很多博弈论专家精心设计,设计的目的就是最大化政府收益和各商家利用率。这个设计取得极大的成功。政府获得超过100亿美元的收入,各频率的波谱也都找到了满意的归宿。
与此相对应的是,新西兰一个类似的拍卖会惨遭失败。因为他们没有经过博弈理论来设计拍卖规则。结果,政府只获得预计收入的15%,而被拍卖的频率也未能物尽其用。譬如因为无人竞争,一个大学生只花1美元就买到了一个电视台许可证。
正是因为博弈论对现代经济生活具有如此重大的冲击和影响,1994年瑞典皇家学院宣布该年全世界科学家的最高荣誉诺贝尔奖之经济学奖颁发给包括纳什在内的三位数学家,以表彰他们对非合作型博弈论的开拓性分析。
也许正如罗素•克洛在领奖时对《美丽心灵》的评价一样,纳什与他的博弈论对我们,“能帮助我们敞开心灵,给予我们信念,生活中真地会有奇迹发生。”
博弈论广泛应用于经济学、管理学、社会学、政治学、军事科学等领域
1950年和1951年纳什的两篇关于非合作博弈论的重要论文,彻底改变了人们对竞争和市场的看法。他证明了非合作博弈及其均衡解,并证明了均衡解的存在性,即著名的纳什均衡。从而揭示了博弈均衡与经济均衡的内在联系。纳什的研究奠定了现代非合作博弈论的基石,后来的博弈论研究基本上都沿着这条主线展开的。然而,纳什天才的发现却遭到冯·诺依曼的断然否定,在此之前他还受到爱因斯坦的冷遇。但是骨子里挑战权威、藐视权威的本性,使纳什坚持了自己的观点,终成一代大师。要不是30多年的严重精神病折磨,恐怕他早已
站在诺贝尔奖的领奖台上了,而且也绝不会与其他人分享这一殊荣。
纳什是一个非常天才的数学家,他的主要贡献是1950至1951年在普林斯顿读博士学位时做出的。然而,他的天才发现———非合作博弈的均衡,即“纳什均衡”并不是一帆风顺的。
1948年纳什到普林斯顿大学读数学系的博士。那一年他还不到20岁。当时普林斯顿可谓人杰地灵,大师如云。爱因斯坦、冯·诺依曼、列夫谢茨(数学系主任)、阿尔伯特·塔克、阿伦佐·切奇、哈罗德·库恩、诺尔曼·斯蒂恩罗德、埃尔夫·福克斯……等全都在这里。博弈论主要是由冯·诺依曼(1903—1957)创所立的。他是一位出生于匈牙利的天才的数学家。他不仅创立了经济博弈论,而且发明了计算机。早在20世纪初,塞梅鲁(Zermelo)、鲍罗(Borel)和冯·诺伊曼已经开始研究博弈的准确的数学表达,直到1939年,冯·诺依曼遇到经济学家奥斯卡·摩根斯特恩(Oskar Morgenstern),并与其合作才使博弈论进入经济学的广阔领域。
1944年他与奥斯卡·摩根斯特恩合著的巨作《博弈论与经济行为》出版,标志着现代系统博弈理论的的初步形成。尽管对具有博弈性质的问题的研究可以追溯到19世纪甚至更早。例如,1838年古诺(Cournot)简单双寡头垄断博弈;1883年伯特兰和1925年艾奇沃奇思研究了两个寡头的产量与价格垄断;2000多年前中国著名军事家孙武的后代孙膑利用博弈论方法帮助田忌赛马取胜等等都属于早期博弈论的萌芽,其特点是零星的,片断的研究,带有很大的偶然性,很不系统。冯·诺依曼和摩根斯特恩的《博弈论与经济行为》一书中提出的标准型、扩展型和合作型博弈模型解的概念和分析方法,奠定了这门学科的理论基础。合作型博弈在20世纪50年代达到了巅峰期。然而,诺依曼的博弈论的局限性也日益暴露出来,由于它过于抽象,使应用范围受到很大限制,在很长时间里,人们对博弈论的研究知之甚少,只是少数数学家的专利,所以,影响力很有限。正是在这个时候,非合作博弈———“纳什均衡”应运而生了,它标志着博弈论的新时代的开始!纳什不是一个按部就班的学生,他经常旷课。据他的同学们回忆,他们根本想不起来曾经什么时候和纳什一起完完整整地上过一门必修课,但纳什争辩说,至少上过斯蒂恩罗德的代数拓扑学。斯蒂恩罗德恰恰是这门学科的创立者,可是,没上几次课,纳什就认定这门课不符合他的口味。于是,又走人了。然而,纳什毕竟是一位英才天纵的非凡人物,他广泛涉猎数学王国的每一个分支,如拓扑学、代数几何学、逻辑学、博弈论等等,深深地为之着迷。纳什经常显示出他与众不同的自信和自负,充满咄咄逼人的学术野心。1950年整个夏天纳什都忙于应付紧张的考试,他的博弈论研究工作被迫中断,他感到这是莫大的浪费。殊不知这种暂时的“放弃”,使原来模糊、杂乱和无绪的若干念头,在潜意识的持续思考下,逐步形成一条清晰的脉络,突然来了灵感!这一年的10月,他骤感才思潮涌,梦笔生花。其中一个最耀眼的亮点就是日后被称之为“纳什均衡”的非合作博弈均衡的概念。纳什的主要学术贡献体现在1950年和1951年的两篇论文之中(包括一篇博士论文)。1950年他才把自己的研究成果写成题为“非合作博弈”的长篇博士论文,1950年11月刊登在美国全国科学院每月公报上,立即引起轰动。说起来这全靠师兄戴维·盖尔之功,就在遭到冯·诺依曼贬低几天之后,他遇到盖尔,告诉他自己已经将冯·诺依曼的“最小最大原理”(minimax solution)推到非合作博弈领域,找到了普遍化的方法和均衡点。盖尔听得很认真,他终于意识到纳什的思路比冯·诺伊曼的合作博弈的理论更能反映现实的情况,而对其严密优美的数学证明极为赞叹。盖尔建议他马上整理出来发表,以免被别人捷足先登。纳什这个初出茅庐的小子,根本不知道竞争的险恶,从未想过要这么做。结果还是盖尔充当了他的“经纪人”,代为起草致科学院的短信,系主任列夫谢茨则亲自将文稿递交给科学院。纳什写的文章不多,就那么几篇,但已经足够了,因为都是精品中的精品。这一点也是值得我们深思的。国内提一个教授,要求在“核心的刊物”上发表多少篇文章。按照这个标准可能纳什还不一定够资格。
1996年诺贝尔经济学奖得主莫尔里斯当牛津大学艾奇沃思经济学讲座教授时也没有发表过什么文章,特殊的人才,必须有特殊的选拔办法。
纳什在上大学时就开始从事纯数学的博弈论研究,1948年进入普林斯顿大学后更是如鱼得水。20岁出头已成为闻名世界的数学家。特别是在经济博弈论领域,他做出了划时代的贡献,是继冯·诺依曼之后最伟大的博弈论大师之一。他提出的著名的纳什均衡的概念在非合作博弈理论中起着核心的作用。后续的研究者对博弈论的贡献,都是建立在这一概念之上的。由于纳什均衡的提出和不断完善为博弈论广泛应用于经济学、管理学、社会学、政治学、军事科学等领域奠定了坚实的理论基础。
博弈论是指某个个人或是组织,面对一定的环境条件,在一定的规则约束下,依靠所掌握的信息,从各自选择的行为或是策略进行选择并加以实施,并从各自取得相应结果或收益的过程,在经济学上博奕论是个非常重要的理论概念。
什么是博弈论?古语有云,世事如棋。生活中每个人如同棋手,其每一个行为如同在一张看不见的棋盘上布一个子,精明慎重的棋手们相互揣摩、相互牵制,人人争赢,下出诸多精彩纷呈、变化多端的棋局。博弈论是研究棋手们 “出棋” 着数中理性化、逻辑化的部分,并将其系统化为一门科学。换句话说,就是研究个体如何在错综复杂的相互影响中得出最合理的策略。事实上,博弈论正是衍生于古老的游戏或曰博弈如象棋、扑克等。数学家们将具体的问题抽象化,通过建立自完备的逻辑框架、体系研究其规律及变化。这可不是件容易的事情,以最简单的二人对弈为例,稍想一下便知此中大有玄妙:若假设双方都精确地记得自己和对手的每一步棋且都是最“理性” 的棋手,甲出子的时候,为了赢棋,得仔细考虑乙的想法,而乙出子时也得考虑甲的想法,所以甲还得想到乙在想他的想法,乙当然也知道甲想到了他在想甲的想法…
================================================
纳什博弈论的原理与应用
2002年03月21日17:44 北京晚报
1950年和1951年纳什的两篇关于非合作博弈论的重要论文,彻底改变了人们对竞争和市场的看法。他证明了非合作博弈及其均衡解,并证明了均衡解的存在性,即著名的纳什均衡。从而揭示了博弈均衡与经济均衡的内在联系。纳什的研究奠定了现代非合作博弈论的基石,后来的博弈论研究基本上都沿着这条主线展开的。然而,纳什天才的发现却遭到冯·诺依曼的断然否定,在此之前他还受到爱因斯坦的冷遇。但是骨子里挑战权威、藐视权威的本性,使纳什坚持了自己的观点,终成一代大师。要不是30多年的严重精神病折磨,恐怕他早已
站在诺贝尔奖的领奖台上了,而且也绝不会与其他人分享这一殊荣。
纳什是一个非常天才的数学家,他的主要贡献是1950至1951年在普林斯顿读博士学位时做出的。然而,他的天才发现———非合作博弈的均衡,即“纳什均衡”并不是一帆风顺的。
1948年纳什到普林斯顿大学读数学系的博士。那一年他还不到20岁。当时普林斯顿可谓人杰地灵,大师如云。爱因斯坦、冯·诺依曼、列夫谢茨(数学系主任)、阿尔伯特·塔克、阿伦佐·切奇、哈罗德·库恩、诺尔曼·斯蒂恩罗德、埃尔夫·福克斯……等全都在这里。博弈论主要是由冯·诺依曼(1903—1957)创所立的。他是一位出生于匈牙利的天才的数学家。他不仅创立了经济博弈论,而且发明了计算机。早在20世纪初,塞梅鲁(Zermelo)、鲍罗(Borel)和冯·诺伊曼已经开始研究博弈的准确的数学表达,直到1939年,冯·诺依曼遇到经济学家奥斯卡·摩根斯特恩(Oskar Morgenstern),并与其合作才使博弈论进入经济学的广阔领域。
1944年他与奥斯卡·摩根斯特恩合著的巨作《博弈论与经济行为》出版,标志着现代系统博弈理论的的初步形成。尽管对具有博弈性质的问题的研究可以追溯到19世纪甚至更早。例如,1838年古诺(Cournot)简单双寡头垄断博弈;1883年伯特兰和1925年艾奇沃奇思研究了两个寡头的产量与价格垄断;2000多年前中国著名军事家孙武的后代孙膑利用博弈论方法帮助田忌赛马取胜等等都属于早期博弈论的萌芽,其特点是零星的,片断的研究,带有很大的偶然性,很不系统。冯·诺依曼和摩根斯特恩的《博弈论与经济行为》一书中提出的标准型、扩展型和合作型博弈模型解的概念和分析方法,奠定了这门学科的理论基础。合作型博弈在20世纪50年代达到了巅峰期。然而,诺依曼的博弈论的局限性也日益暴露出来,由于它过于抽象,使应用范围受到很大限制,在很长时间里,人们对博弈论的研究知之甚少,只是少数数学家的专利,所以,影响力很有限。正是在这个时候,非合作博弈———“纳什均衡”应运而生了,它标志着博弈论的新时代的开始!纳什不是一个按部就班的学生,他经常旷课。据他的同学们回忆,他们根本想不起来曾经什么时候和纳什一起完完整整地上过一门必修课,但纳什争辩说,至少上过斯蒂恩罗德的代数拓扑学。斯蒂恩罗德恰恰是这门学科的创立者,可是,没上几次课,纳什就认定这门课不符合他的口味。于是,又走人了。然而,纳什毕竟是一位英才天纵的非凡人物,他广泛涉猎数学王国的每一个分支,如拓扑学、代数几何学、逻辑学、博弈论等等,深深地为之着迷。纳什经常显示出他与众不同的自信和自负,充满咄咄逼人的学术野心。1950年整个夏天纳什都忙于应付紧张的考试,他的博弈论研究工作被迫中断,他感到这是莫大的浪费。殊不知这种暂时的“放弃”,使原来模糊、杂乱和无绪的若干念头,在潜意识的持续思考下,逐步形成一条清晰的脉络,突然来了灵感!这一年的10月,他骤感才思潮涌,梦笔生花。其中一个最耀眼的亮点就是日后被称之为“纳什均衡”的非合作博弈均衡的概念。纳什的主要学术贡献体现在1950年和1951年的两篇论文之中(包括一篇博士论文)。1950年他才把自己的研究成果写成题为“非合作博弈”的长篇博士论文,1950年11月刊登在美国全国科学院每月公报上,立即引起轰动。说起来这全靠师兄戴维·盖尔之功,就在遭到冯·诺依曼贬低几天之后,他遇到盖尔,告诉他自己已经将冯·诺依曼的“最小最大原理”(minimax solution)推到非合作博弈领域,找到了普遍化的方法和均衡点。盖尔听得很认真,他终于意识到纳什的思路比冯·诺伊曼的合作博弈的理论更能反映现实的情况,而对其严密优美的数学证明极为赞叹。盖尔建议他马上整理出来发表,以免被别人捷足先登。纳什这个初出茅庐的小子,根本不知道竞争的险恶,从未想过要这么做。结果还是盖尔充当了他的“经纪人”,代为起草致科学院的短信,系主任列夫谢茨则亲自将文稿递交给科学院。纳什写的文章不多,就那么几篇,但已经足够了,因为都是精品中的精品。这一点也是值得我们深思的。国内提一个教授,要求在“核心的刊物”上发表多少篇文章。按照这个标准可能纳什还不一定够资格。
1996年诺贝尔经济学奖得主莫尔里斯当牛津大学艾奇沃思经济学讲座教授时也没有发表过什么文章,特殊的人才,必须有特殊的选拔办法。
纳什在上大学时就开始从事纯数学的博弈论研究,1948年进入普林斯顿大学后更是如鱼得水。20岁出头已成为闻名世界的数学家。特别是在经济博弈论领域,他做出了划时代的贡献,是继冯·诺依曼之后最伟大的博弈论大师之一。他提出的著名的纳什均衡的概念在非合作博弈理论中起着核心的作用。后续的研究者对博弈论的贡献,都是建立在这一概念之上的。由于纳什均衡的提出和不断完善为博弈论广泛应用于经济学、管理学、社会学、政治学、军事科学等领域奠定了坚实的理论基础。
囚犯的两难处境
大理论中的小故事
要了解纳什的贡献,首先要知道什么是非合作博弈问题。现在几乎所有的博弈论教科书上都会讲“囚犯的两难处境”的例子,每本书上的例子都大同小异。
博弈论毕竟是数学,更确切地说是运筹学的一个分支,谈经论道自然少不了数学语言,外行人看来只是一大堆数学公式。好在博弈论关心的是日常经济生活问题,所以不能不食人间烟火。其实这一理论是从棋弈、扑克和战争等带有竞赛、对抗和决策性质的问题中借用的术语,听上去有点玄奥,实际上却具有重要现实意义。博弈论大师看经济社会问题犹如棋局,常常寓深刻道理于游戏之中。所以,多从我们的日常生活中的凡人小事入手,以我们身边的故事做例子,娓娓道来,并不乏味。话说有一天,一位富翁在家中被杀,财物被盗。警方在此案的侦破过程中,抓到两个犯罪嫌疑人,斯卡尔菲丝和那库尔斯,并从他们的住处搜出被害人家中丢失的财物。但是,他们矢口否认曾杀过人,辩称是先发现富翁被杀,然后只是顺手牵羊偷了点儿东西。于是警方将两人隔离,分别关在不同的房间进行审讯。由地方检察官分别和每个人单独谈话。检察官说,“由于你们的偷盗罪已有确凿的证据,所以可以判你们一年刑期。但是,我可以和你做个交易。如果你单独坦白杀人的罪行,我只判你三个月的监禁,但你的同伙要被判十年刑。如果你拒不坦白,而被同伙检举,那么你就将被判十年刑,他只判三个月的监禁。但是,如果你们两人都坦白交代,那么,你们都要被判5年刑。”斯卡尔菲丝和那库尔斯该怎么办呢?他们面临着两难的选择——坦白或抵赖。显然最好的策略是双方都抵赖,结果是大家都只被判一年。但是由于两人处于隔离的情况下无法串供。所以,按照亚当·斯密的理论,每一个人都是从利己的目的出发,他们选择坦白交代是最佳策略。因为坦白交代可以期望得到很短的监禁———3个月,但前提是同伙抵赖,显然要比自己抵赖要坐10年牢好。这种策略是损人利己的策略。不仅如此,坦白还有更多的好处。如果对方坦白了而自己抵赖了,那自己就得坐10年牢。太不划算了!因此,在这种情况下还是应该选择坦白交代,即使两人同时坦白,至多也只判5年,总比被判10年好吧。所以,两人合理的选择是坦白,原本对双方都有利的策略(抵赖)和结局(被判1年刑)就不会出现。这样两人都选择坦白的策略以及因此被判5年的结局被称为“纳什均衡”,也叫非合作均衡。因为,每一方在选择策略时都没有“共谋”(串供),他们只是选择对自己最有利的策略,而不考虑社会福利或任何其他对手的利益。也就是说,这种策略组合由所有局中人(也称当事人、参与者)的最佳策略组合构成。没有人会主动改变自己的策略以便使自己获得更大利益。“囚徒的两难选择”有着广泛而深刻的意义。个人理性与集体理性的冲突,各人追求利己行为而导致的最终结局是一个“纳什均衡”,也是对所有人都不利的结局。他们两人都是在坦白与抵赖策略上首先想到自己,这样他们必然要服长的刑期。只有当他们都首先替对方着想时,或者相互合谋(串供)时,才可以得到最短时间的监禁的结果。“纳什均衡”首先对亚当·斯密的“看不见的手”的原理提出挑战。按照斯密的理论,在市场经济中,每一个人都从利己的目的出发,而最终全社会达到利他的效果。不妨让我们重温一下这位经济学圣人在《国富论》中的名言:“通过追求(个人的)自身利益,他常常会比其实际上想做的那样更有效地促进社会利益。”从“纳什均衡”我们引出了“看不见的手”的原理的一个悖论:从利己目的出发,结果损人不利己,既不利己也不利他。两个囚徒的命运就是如此。从这个意义上说,“纳什均衡”提出的悖论实际上动摇了西方经济学的基石。因此,从“纳什均衡”中我们还可以悟出一条真理:合作是有利的“利己策略”。但它必须符合以下黄金律:按照你愿意别人对你的方式来对别人,但只有他们也按同样方式行事才行。也就是中国人说的“己所不欲勿施于人”。但前提是人所不欲勿施于我。其次,“纳什均衡”是一种非合作博弈均衡,在现实中非合作的情况要比合作情况普遍。所以“纳什均衡”是对冯·诺依曼和摩根斯特恩的合作博弈理论的重大发展,甚至可以说是一场革命。
从“纳什均衡”的普遍意义中我们可以深刻领悟司空见惯的经济、社会、政治、国防、管理和日常生活中的博弈现象。我们将例举出许多类似于“囚徒的两难处境”这样的例子。如价格战、军奋竞赛、污染等等。一般的博弈问题由三个要素所构成:即局中人(players)又称当事人、参与者、策略等等的集合,策略(strategies)集合以及每一对局中人所做的选择和赢得(payoffs)集合。其中所谓赢得是指如果一个特定的策略关系被选择,每一局中人所得到的效用。所有的博弈问题都会遇到这三个要素。
价格战博弈:
现在我们经常会遇到各种各样的家电价格大战,彩电大战、冰箱大战、空调大战、微波炉大战……这些大战的受益者首先是消费者。每当看到一种家电产品的价格大战,百姓都会“没事儿偷着乐”。在这里,我们可以解释厂家价格大战的结局也是一个“纳什均衡”,而且价格战的结果是谁都没钱赚。因为博弈双方的利润正好是零。竞争的结果是稳定的,即是一个“纳什均衡”。这个结果可能对消费者是有利的,但对厂商而言是灾难性的。所以,价格战对厂商而言意味着自杀。从这个案例中我们可以引伸出两个问题,一是竞争削价的结果或“纳什均衡”可能导致一个有效率的零利润结局。二是如果不采取价格战,作为一种敌对博弈论(vivalry game)其结果会如何呢?每一个企业,都会考虑采取正常价格策略,还是采取高价格策略形成垄断价格,并尽力获取垄断利润。如果垄断可以形成,则博弈双方的共同利润最大。这种情况就是垄断经营所做的,通常会抬高价格。另一个极端的情况是厂商用正常的价格,双方都可以获得利润。从这一点,我们又引出一条基本准则:“把你自己的战略建立在假定对手会按其最佳利益行动的基础上”。事实上,完全竞争的均衡就是“纳什均衡”或“非合作博弈均衡”。在这种状态下,每一个厂商或消费者都是按照所有的别人已定的价格来进行决策。在这种均衡中,每一企业要使利润最大化,消费者要使效用最大化,结果导致了零利润,也就是说价格等于边际成本。在完全竞争的情况下,非合作行为导致了社会所期望的经济效率状态。如果厂商采取合作行动并决定转向垄断价格,那么社会的经济效率就会遭到破坏。这就是为什么WTO和各国政府要加强反垄断的意义所在。
污染博弈:
假如市场经济中存在着污染,但政府并没有管制的环境,企业为了追求利润的最大化,宁愿以牺牲环境为代价,也绝不会主动增加环保设备投资。按照看不见的手的原理,所有企业都会从利己的目的出发,采取不顾环境的策略,从而进入“纳什均衡”状态。如果一个企业从利他的目的出发,投资治理污染,而其他企业仍然不顾环境污染,那么这个企业的生产成本就会增加,价格就要提高,它的产品就没有竞争力,甚至企业还要破产。这是一个“看不见的手的有效的完全竞争机制”失败的例证。直到20世纪90年代中期,中国乡镇企业的盲目发展造成严重污染的情况就是如此。只有在政府加强污染管制时,企业才会采取低污染的策略组合。企业在这种情况下,获得与高污染同样的利润,但环境将更好。
贸易自由与壁垒:
这个问题对于刚刚加入WTO的中国而言尤为重要。任何一个国家在国际贸易中都面临着保持贸易自由与实行贸易保护主义的两难选择。贸易自由与壁垒问题,也是一个“纳什均衡”,这个均衡是贸易双方采取不合作博弈的策略,结果使双方因贸易战受到损害。X国试图对Y国进行进口贸易限制,比如提高关税,则Y国必然会进行反击,也提高关税,结果谁也没有捞到好处。反之,如X和Y能达成合作性均衡,即从互惠互利的原则出发,双方都减少关税限制,结果大家都从贸易自由中获得了最大利益,而且全球贸易的总收益也增加了。(孙健)
博弈论及其在现代经济生活中的应用
有一个典型的案例:甲乙两人合伙作案,结果被警察抓了起来,分别被隔离审讯。在不能互通信息的情形下———也就是不知道对方是坦白还是缄默的前提下,每个嫌疑犯都可以作出自己的选择:或者供出同伙,即与警察合作,从而背叛同伙;或者保持沉默,也就是与同伙合作,而不是与警察合作。这样会出现以下几种情况:如果两人都不坦白,警察会因证据不足而将两人各判刑! 年;如果一人招供而另外一人不招,坦白者作为证人将不会被起诉,另一人将会被重判!" 年;如果两人都招供,则会因罪名成立各判!# 年。这两个嫌疑犯该怎么办呢?是选择合作还是互相背叛?从表面上看,他们应该互相合作,保持沉默,因为这样对他们整体而言是最好的结果———都只判!年。但是他们不得不仔细考虑对方可能采取的选择。问题就这样开始了,两个人都十分精明,而且只关心减少自己的刑期,并不会在乎对方被判多少年。每个人都会这样推理:假如对方不招,我只要一招供,马上可以获得自由,而不招却要坐牢! 年,显然招比不招好;假如对方招了,我若不招,则要坐牢!" 年。招了只要坐牢!# 年,显然还是招更好些。可见,对方无论招或者不招,我的最佳选择都是招认。两个人都会基于同样的想法作出招供的选择,这对他们个人来说都是最佳策略,但对整体而言却是一个最差的结果。
这就是博弈论的一个经典模型———“囚徒困境模型”。作为一种关于决策和策略的理论,博弈论其实就在我们身边,它研究的许多例子来自于日常生活和经济活动中的游戏和事物。
博弈的英文即,中文译为“博弈”是非常传神和贴切的,因为中国古代称下棋为“弈”,“博”则含有争斗的意思。在下棋这样的游戏中有一个重要的特点:即策略在其中起着举足轻重的影响和作用。精明慎重的棋手们相互揣摩、相互牵制,人人争赢,布每一个棋子时,都必须考虑到对手的策略选择,从而选择自己的最佳策略。这也就是博弈的核心问题:决策主体的一方行动后,参与博弈的其他人将会采取什么行动?参与人为取得最佳效果应采取怎样的对策?我们可以将博弈论定义为:一些个人、一些团队或其他组织,面对一定的环境条件,在一定的规则约束下,依靠所掌握的信息,同时或先后,一次或多次,从各自允许选择的行为或策略进行选择并加以实施,并从中各自取得相应结果或收益的过程。博弈论是(# 世纪四五十年代发展起来的。美国经济学家冯•诺依曼与奥斯卡•摩根斯特恩于!)**年合著的《博弈论与经济行为》被公认为博弈论诞生的标志。
博弈论可以分为合作博弈理论和非合作博弈理论。前者主要强调的是集体理性;而后者主要研究人们在利益相互影响的局势中如何选择策略使自己的收益最大,强调的是个人理性。所谓“个人理性”是反映个体的行为始终都是以实现自身的最大利益为惟一目标,除非是为了实现自身利益的需要,否则不会考虑其他的个体或社会利益这样一种决策原则。非合作博弈要求各参与人之间不能存在任何有约束力的协议,也就是各个参与人不能公开“串通”或“共谋”。(# 世纪"# 年代,数学家纳什提出了著名的非合作博弈的纳什均衡理论,奠定了现代非合作博弈论的基石,后来的博弈论研究基本上是沿着这条主线展开的。纳什均衡理论地提出和不断完善为博弈论广泛应用于经济学、管理学、社会学、政治学、军事科学等领域奠定了坚实的理论基础。现在人们所说的博弈论基本是指非合作博弈论。这是因为竞争是一切社会经济关系的根本基础。在现实生活中非合作的情况要比合作普遍,不合作是基本的,合作是有条件和暂时的。事实上在我们证明非合作博弈的无效率或低效率的同时,就自然说明了博弈论及其在现代经济生活中的应用!# 杨佳佳!"存在着合作的可能性和必要性。“囚徒困境模型”在现代经济生活中有着广泛而深刻的应用。比如,我们经常会遇到各种各样的价格大战,家用电器大战、服装大战、机票打折大战⋯⋯。
按照囚徒困境模型,各个厂家都将选择降价作为自己的优势策略。因为别的厂家如果不降价,我选择降价将会获得更多的市场份额;别的厂家如果降价,我只有跟着降价才能维持本来的市场份额。最后,博弈的结果是各个厂家谁都没有多少钱赚。再如,在遗失钱物时,遗失人和拾得人的心态其实也就像这两个囚徒,前者希望不给任何报酬能失而复得,后者怕得不到报答干脆占为己有,博弈的结果通常是遗失物被拾得人侵占。“囚徒困境博弈”准确地抓住了人性的真实一面———相互防范背叛与彼此的不信任,以及这种心理对合作的破坏作用。
但是,在现实生活中,我们巴不得囚徒之间以及各个厂家之间不能合作。因为我们不愿意看到危险的罪犯通过合作逃脱了法律的制裁或者是几个大企业联合起来形成对行业的垄断,导致我们不能享受合理的价格。在现实生活中,我们也期待遗失人和拾得人能更多地为对方的利益着想,从而提升整个社会的道德水准。当我们试图阻挠或者促进“囚徒”之间的合谋,希望通过法律或者道德维系良好的社会秩序时,我们必须了解什么样的途径可以破解“囚徒困境”,并且正视人们正当的逐利心态在博弈过程中的影响。比如:很多发达国家往往利用法律的形式对垄断行为进行严格的限制。反垄断法的实施阻挠了企业之间的价格合谋,并且激励企业改善管理,开发技术,努力以较低的成本生产质量较好的产品,提高企业的市场竞争力。同时,如果我们期待拾金不昧的博弈结果,那么就要鼓励归还失物这一善行。怎么鼓励呢?中国人的道德宗师孔子两千年前就回答了这个问题。孔子的弟子有一次救了一个溺水的人。被救者酬谢这位弟子一头牛,他收下了。孔子对这个弟子的行为大加赞赏。因为这会激励更多的人去救人,今后也会有更多溺水的人得到营救。道德准则要求人们不要惟利是图,但是从不反对社会成员通过自己的正当行为获取收益。如果德行善举得不到报答和补偿,那么它就只能是少数圣贤的“专利”而不会成为社会公德。“智猪博弈模型”是博弈论中另一个经典的模型。它说的是:猪圈里有两头猪,一头大猪,一头小猪。猪圈的一边有个踏板,每踩一下踏板,在远离踏板猪圈的另一边的投食口就会落下少量的食物。如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。当小猪踩动踏板时,大猪会在小猪跑到投食口之前刚好吃完所有的食物;若是大猪踩动了踏板,则还有机会在小猪吃完落下的食物之前跑到投食口,争吃到另一半残羹。那么,两只猪各会采取什么策略?答案是小猪将选择“搭便车”策略,也就是舒舒服服地等在投食口旁;而大猪则为一点残羹不知疲倦地奔忙于踏板和投食口之间。原因何在?因为,小猪踩踏板将会一无所获,不踩踏板反而能吃上食物。对小猪而言,无论大猪是否踩动踏板,不踩踏板总是最好的选择。反观大猪,已经明知小猪是不会踩动踏板的,自己踩总比不踩强,所以,只好亲历亲为了。
这个经典模型揭示了市场竞争中大企业与小企业之间的关系。研究开发,为新产品做广告,对大企业是值得的,对小企业则得不偿失。小企业应把精力花在模仿上,或等待大企业用广告打开市场后出售廉价产品,而大企业应当以主动的态度来开拓市场。一个理性的企业,就应该象“智猪”一样,选择自己的优势策略。在欧佩克中,各个成员的生产能力各不相同。同属一个同盟的大成员和小成员,他们应该选择遵守协议还是选择作弊多生产石油呢?假设以沙特阿拉伯和科威特为例。假定在合作的情况下,科威特每天应当生产!"" 万桶石油,沙特阿拉伯则生产#"" 万桶。对于他们两家而言,作弊意味着每天多生产!"" 万桶。科威特有一个优势策略:作弊每天生产$"" 万桶。沙特阿拉伯的优势策略则是遵守协议,每天仍然生产#"" 万桶。为什么会这样呢?沙特阿拉伯选择遵守协议也是出于纯粹的自利心理。假如它有一个较低的生产数量,则市场价格攀升,欧佩克全体成员的边际利润上扬。如果它的产量只占欧佩克总产量一个很小的份额,它自然很难发现价格上扬对自己的好处。如果它占的份额很大,他将占有上扬的边际利润的大部分好处,因此牺牲一些产量也是值得的。智猪博弈模型给了竞争中的弱者(小猪)最佳策略的启发。但是对于社会而言,由于小猪未能参加竞争,小猪搭便车式的社会资源配置并不是最佳状态。为使资源有效配置,避免“小猪躺着大猪跑”的现象,游戏规则的设计就非常关键了。规则的核心指标是:每次落下的食物数量和踏板与投食口之间的距离。如果改变核心指标,会出现什么样的现象呢?改变方案一:减量方案。投食仅是原来的一半分量。结果是大猪和小猪都不去踩踏板了。因为无论谁去踩,对方都会把食物吃完,所以谁都不会有踩踏板的动力了。这个游戏规则的设计抑制了竞争,显然是失败的。
结果是小猪大猪都会去踩踏板,反正对方不会一次性把食物吃完。这个规则的成本相当高(每次提供双份食物),而且竞争也不强烈,效果也不好。改变方案三:减量加移位方案。投食仅为原来的一半分量,但同时将投食口移到踏板附近。结果大猪和小猪都拼命抢着踩踏板,多劳多得,每次的收获刚好消费完。这个游戏的规则是最好的,成本不高,但收获最大。在现实生活中,公司的激励制度设计就必须充分利用智猪博弈的策略。如果公司的奖励力度太大,又是持股,又是期权,公司职员各个都成了百万富翁,成本高不说,员工的积极性并不一定很高;如果奖励力度不大,而且见者有份(不劳动的小猪也有),一度十分努力的大猪也不会有动力了;最好的激励机制就是———奖励并非人人有份,而是直接针对个人(如业务按比例提成),这样既节约了公司的成本,又消除了“搭便车”现象,能够实现有效的激励。随着社会生活各个方面的竞争性和对抗性的增强,随着人们对自身行为和决策的理性及效率的更高层次的追求,更多地利用博弈的原理指导我们的行动,能让我们在既定规则下选择更为适宜的策略,或是在制度设计、规则优化方面思路更开阔,考虑更全面,从而获得更加理想的结果。! 作者单位:国家发改委价检司"#$%&’———我对你诉说# 王春廷张海涛许多双手敲打着不同电话机上的#$%&’———这同一键盘不同声音诉说着问题疑难对可信赖的你发出渴望公平的呼唤你是一柄利剑高悬于不法经营者之顶违规“必斩”你是一把标尺准确丈量价格的法律界限事实为鉴因你的存在我们不再把受到的委屈强行吞咽因你的秉公经济上的损失被追还捍卫了应有的尊严价格领域的法官你倾听百姓的肺腑之言作出公正的评断你给出的满意答案就是一股春风化解了群众的抱怨因为你消费者们不再心烦意乱因为你迷茫中找到失落已久的主见有了你生活更加圆满有了你生存更觉安全每个人心中溢满由衷的称赞对你的认识也许并不全面但我们知晓“全心全意为人民服务”就是你工作的出发点及时准确严谨实办是你永恒的职业理念微欲微慎微独微权是你永不忘却的誓言让世间不再有狡诈欺骗是你不懈的追求即便是永久的失业也心甘情愿!#"$#%$&%’风雨中的一把伞!#"$#%$&%’寒冬里的一缕暖一株常青树因所有人的倾情浇灌枝繁叶茂茁壮参天!作者单位:山东省夏津县物价局!"