博弈论论文大纲_博弈论论文大纲是什么

博弈论论文大纲

博弈论的概念

博弈论又被称为对策论（Games Theory),是研究具有斗争或竞争性质现象的理论和方法，它既是现代数学的一个新分支，也是运筹学的一个重要学科。

博弈论的发展

博弈论思想古已有之，我国古代的《孙子兵法》就不仅是一部军事著作，而且算是最早的一部博弈论专著。博弈论最初主要研究象棋、桥牌、赌博中的胜负问题，人们对博弈局势的把握只停留在经验上,没有向理论化发展，正式发展成一门学科则是在20世纪初。1928年冯·诺意曼证明了博弈论的基本原理，从而宣告了博弈论的正式诞生。1944年，冯·诺意曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域，从而奠定了这一学科的基础和理论体系。谈到博弈论就不能忽略博弈论天才纳什，纳什的开创性论文《n人博弈的均衡点》（1950），《非合作博弈》（1951）等等，给出了纳什均衡的概念和均衡存在定理。此外，塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。今天博弈论已发展成一门较完善的的学科。

博弈论的基本概念

博弈要素

(1)局中人：在一场竞赛或博弈中，每一个有决策权的参与者成为一个局中人。只有两个局中人的博弈现象称为“两人博弈”,而多于两个局中人的博弈称为 “多人博弈”。

(2)策略：一局博弈中，每个局中人都有选择实际可行的完整的行动方案，即方案不是某阶段的行动方案，而是指导整个行动的一个方案，一个局中人的一个可行的自始至终全局筹划的一个行动方案，称为这个局中人的一个策略。如果在一个博弈中局中人都总共有有限个策略，则称为“有限博弈”，否则称为“无限博弈”。

(3)得失：一局博弈结局时的结果称为得失。每个局中人在一局博弈结束时的得失，不仅与该局中人自身所选择的策略有关，而且与全局中人所取定的一组策略有关。所以，一局博弈结束时每个局中人的“得失”是全体局中人所取定的一组策略的函数，通常称为支付（payoff）函数。

(4)对于博弈参与者来说，存在着一博弈结果

(5)博弈涉及到均衡：均衡是平衡的意思，在经济学中，均衡意即相关量处于稳定值。在供求关系中，某一商品市场如果在某一价格下，想以此价格买此商品的人均能买到，而想卖的人均能卖出，此时我们就说，该商品的供求达到了均衡。所谓纳什均衡，它是一稳定的博弈结果。

纳什均衡(Nash Equilibrium)：在一策略组合中，所有的参与者面临这样一种情况，当其他人不改变策略时，他此时的策略是最好的。也就是说，此时如果他改变策略他的支付将会降低。在纳什均衡点上，每一个理性的参与者都不会有单独改变策略的冲动。纳什均衡点存在性证明的前提是“博弈均衡偶”概念的提出。所谓“均衡偶”是在二人零和博弈中，当局中人A采取其最优策略a*,局中人B也采取其最优策略b*,如果局中人仍采取b*,而局中人A却采取另一种策略a，那么局中人A的支付不会超过他采取原来的策略a*的支付。这一结果对局中人B亦是如此。

这样，“均衡偶”的明确定义为：一对策略a*(属于策略集A)和策略b*（属于策略集B）称之为均衡偶，对任一策略a(属于策略集A)和策略b（属于策略集B），总有：偶对（a, b*）≤偶对(a*,b*)≤偶对（a*，b）。

对于非零和博弈也有如下定义：一对策略a*（属于策略集A）和策略b*（属于策略集B）称为非零和博弈的均衡偶，对任一策略a(属于策略集A）和策略b（属于策略集B），总有：对局中人A的偶对（a, b*） ≤偶对(a*,b*);对局中人B的偶对（a*，b）≤偶对(a*,b*)。

有了上述定义，就立即得到纳什定理：
任何具有有限纯策略的二人博弈至少有一个均衡偶。这一均衡偶就称为纳什均衡点。

纳什定理的严格证明要用到不动点理论，不动点理论是经济均衡研究的主要工具。通俗地说，寻找均衡点的存在性等价于找到博弈的不动点。

纳什均衡点概念提供了一种非常重要的分析手段，使博弈论研究可以在一个博弈结构里寻找比较有意义的结果。

但纳什均衡点定义只局限于任何局中人不想单方面变换策略，而忽视了其他局中人改变策略的可能性，因此，在很多情况下，纳什均衡点的结论缺乏说服力，研究者们形象地称之为“天真可爱的纳什均衡点”。

塞尔顿（R·Selten)在多个均衡中剔除一些按照一定规则不合理的均衡点，从而形成了两个均衡的精炼概念：子博弈完全均衡和颤抖的手完美均衡。

博弈的类型

(1)合作博弈——研究人们达成合作时如何分配合作得到的收益，即收益分配问题。

(2)非合作博弈——研究人们在利益相互影响的局势中如何选决策使自己的收益最大，即策略选择问题。

(3)完全信息不完全信息博弈：参与者对所有参与者的策略空间及策略组合下的支付有充了解称为完全信息；反之，则称为不完全信息。

(4)静态博弈和动态博弈

静态博弈：指参与者同时采取行动，或者尽管有先后顺序，但后行动者不知道先行动者的策略。
动态博弈：指双方的的行动有先后顺序并且后行动者可以知道先行动者的策略。

财产分配问题和夏普里值（Shapley value）

考虑这样一个合作博弈：a、b、c、投票决定如何分配100万，他们分别拥有50％、40％、10％的权力，规则规定，当超过50%的票认可了某种方案时才能通过。那么如何分配才是合理的呢?按票力分配，a50万、b40万、c10万c向a提出：a70万、b0、c30万b向a提出：a80万、b20万、c0……

权力指数：每个决策者在决策时的权力体现在他在形成的获胜联盟中的“关键加入者”的个数，这个“关键加入者”的个数就被称为权利指数。

夏普里值：在各种可能的联盟次序下，参与者对联盟的边际贡献之和除以各种可能的联盟组合。

次序 abc acb bac bca cab cba
关键加入者 a c a c a b

由此计算出a,b,c的夏普里值分别为4/6,1/6,1/6
所以a,b,c应分别获得100万的2/3,1/6,1/6。

博弈论的意义

弈论的研究方法和其他许多利用数学工具研究社会经济现象的学科一样，都是从复杂的现象中抽象出基本的元素，对这些元素构成的数学模型进行分析，而后逐步引入对其形势产影响的其他因素，从而分析其结果。

基于不同抽象水平，形成三种博弈表述方式，标准型、扩展型和特征函数型利用这三种表述形式,可以研究形形色色的问题。因此,它被称为“社会科学的数学”从理论上讲，博弈论是研究理性的行动者相互作用的形式理论，而实际上正深入到经济学、政治学、社会学等等，被各门社会科学所应用。

博弈论是指某个个人或是组织，面对一定的环境条件，在一定的规则约束下，依靠所掌握的信息，从各自选择的行为或是策略进行选择并加以实施，并从各自取得相应结果或收益的过程，在经济学上博弈论是个非常重要的理论概念。

什么是博弈论？古语有云，世事如棋。生活中每个人如同棋手，其每一个行为如同在一张看不见的棋盘上布一个子，精明慎重的棋手们相互揣摩、相互牵制，人人争赢，下出诸多精彩纷呈、变化多端的棋局。博弈论是研究棋手们 “出棋” 着数中理性化、逻辑化的部分，并将其系统化为一门科学。换句话说，就是研究个体如何在错综复杂的相互影响中得出最合理的策略。事实上，博弈论正是衍生于古老的游戏或曰博弈如象棋、扑克等。数学家们将具体的问题抽象化，通过建立自完备的逻辑框架、体系研究其规律及变化。这可不是件容易的事情，以最简单的二人对弈为例，稍想一下便知此中大有玄妙：若假设双方都精确地记得自己和对手的每一步棋且都是最“理性” 的棋手，甲出子的时候，为了赢棋，得仔细考虑乙的想法，而乙出子时也得考虑甲的想法，所以甲还得想到乙在想他的想法，乙当然也知道甲想到了他在想甲的想法…

面对如许重重迷雾，博弈论怎样着手分析解决问题，怎样对作为现实归纳的抽象数学问题求出最优解、从而为在理论上指导实践提供可能性呢？现代博弈理论由匈牙利大数学家冯·诺伊曼于20世纪20年代开始创立，1944年他与经济学家奥斯卡·摩根斯特恩合作出版的巨著《博弈论与经济行为》，标志着现代系统博弈理论的初步形成。对于非合作、纯竞争型博弈，诺伊曼所解决的只有二人零和博弈--好比两个人下棋、或是打乒乓球，一个人赢一着则另一个人必输一着，净获利为零。在这里抽象化后的博弈问题是，已知参与者集合(两方) ，策略集合(所有棋着) ，和盈利集合(赢子输子) ，能否且如何找到一个理论上的“解” 或“平衡” ，也就是对参与双方来说都最“合理” 、最优的具体策略？怎样才是“合理” ？应用传统决定论中的“最小最大” 准则，即博弈的每一方都假设对方的所有功略的根本目的是使自己最大程度地失利，并据此最优化自己的对策，诺伊曼从数学上证明，通过一定的线性运算，对于每一个二人零和博弈，都能够找到一个“最小最大解” 。通过一定的线性运算，竞争双方以概率分布的形式随机使用某套最优策略中的各个步骤，就可以最终达到彼此盈利最大且相当。当然，其隐含的意义在于，这套最优策略并不依赖于对手在博弈中的操作。用通俗的话说，这个著名的最小最大定理所体现的基本“理性” 思想是“抱最好的希望，做最坏的打算” 。

博弈论论文

博弈论是指某个个人或是组织，面对一定的环境条件，在一定的规则约束下，依靠所掌握的信息，从各自选择的行为或是策略进行选择并加以实施，并从各自取得相应结果或收益的过程，在经济学上博奕论是个非常重要的理论概念。

什么是博弈论？古语有云，世事如棋。生活中每个人如同棋手，其每一个行为如同在一张看不见的棋盘上布一个子，精明慎重的棋手们相互揣摩、相互牵制，人人争赢，下出诸多精彩纷呈、变化多端的棋局。博弈论是研究棋手们 “出棋” 着数中理性化、逻辑化的部分，并将其系统化为一门科学。换句话说，就是研究个体如何在错综复杂的相互影响中得出最合理的策略。事实上，博弈论正是衍生于古老的游戏或曰博弈如象棋、扑克等。数学家们将具体的问题抽象化，通过建立自完备的逻辑框架、体系研究其规律及变化。这可不是件容易的事情，以最简单的二人对弈为例，稍想一下便知此中大有玄妙：若假设双方都精确地记得自己和对手的每一步棋且都是最“理性” 的棋手，甲出子的时候，为了赢棋，得仔细考虑乙的想法，而乙出子时也得考虑甲的想法，所以甲还得想到乙在想他的想法，乙当然也知道甲想到了他在想甲的想法…

面对如许重重迷雾，博弈论怎样着手分析解决问题，怎样对作为现实归纳的抽象数学问题求出最优解、从而为在理论上指导实践提供可能性呢？现代博弈理论由匈牙利大数学家冯·诺伊曼于20世纪20年代开始创立，1944年他与经济学家奥斯卡·摩根斯特恩合作出版的巨著《博弈论与经济行为》，标志着现代系统博弈理论的初步形成。对于非合作、纯竞争型博弈，诺伊曼所解决的只有二人零和博弈--好比两个人下棋、或是打乒乓球，一个人赢一着则另一个人必输一着，净获利为零。在这里抽象化后的博弈问题是，已知参与者集合(两方) ，策略集合(所有棋着) ，和盈利集合(赢子输子) ，能否且如何找到一个理论上的“解” 或“平衡” ，也就是对参与双方来说都最“合理” 、最优的具体策略？怎样才是“合理” ？应用传统决定论中的“最小最大” 准则，即博弈的每一方都假设对方的所有功略的根本目的是使自己最大程度地失利，并据此最优化自己的对策，诺伊曼从数学上证明，通过一定的线性运算，对於每一个二人零和博弈，都能够找到一个“最小最大解” 。通过一定的线性运算，竞争双方以概率分布的形式随机使用某套最优策略中的各个步骤，就可以最终达到彼此盈利最大且相当。当然，其隐含的意义在於，这套最优策略并不依赖于对手在博弈中的操作。用通俗的话说，这个著名的最小最大定理所体现的基本“理性” 思想是“抱最好的希望，做最坏的打算” 。

2.在经济学中，“智*博弈”（Pigs’payoffs）是一个著名博弈论例子。
这个例子讲的是：*圈里有两头*，一头大*，一头小*。*圈的一边有个踏板，每踩一下踏板，在远离踏板的*圈的另一边的投食口就会落下少量的食物。如果有一只*去踩踏板，另一只*就有机会抢先吃到另一边落下的食物。当小*踩动踏板时，大*会在小*跑到食槽之前刚好吃光所有的食物；若是大*踩动了踏板，则还有机会在小*吃完落下的食物之前跑到食槽，争吃到另一半残羹。
那么，两只*各会采取什么策略？答案是：小*将选择“搭便车”策略，也就是舒舒服服地等在食槽边；而大*则为一点残羹不知疲倦地奔忙于踏板和食槽之间。
原因何在？因为，小*踩踏板将一无所获，不踩踏板反而能吃上食物。对小*而言，无论大*是否踩动踏板，不踩踏板总是好的选择。反观大*，已明知小*是不会去踩动踏板的，自己亲自去踩踏板总比不踩强吧，所以只好亲力亲为了。
“小*躺着大*跑”的现象是由于故事中的游戏规则所导致的。规则的核心指标是：每次落下的事物数量和踏板与投食口之间的距离。
如果改变一下核心指标，*圈里还会出现同样的“小*躺着大*跑”的景象吗？试试看。
改变方案一：减量方案。投食仅原来的一半分量。结果是小*大*都不去踩踏板了。小*去踩，大*将会把食物吃完；大*去踩，小*将也会把食物吃完。谁去踩踏板，就意味着为对方贡献食物，所以谁也不会有踩踏板的动力了。
如果目的是想让*们去多踩踏板，这个游戏规则的设计显然是失败的。
改变方案二：增量方案。投食为原来的一倍分量。结果是小*、大*都会去踩踏板。谁想吃，谁就会去踩踏板。反正对方不会一次把食物吃完。小*和大*相当于生活在物质相对丰富的“共产主义”社会，所以竞争意识却不会很强。
对于游戏规则的设计者来说，这个规则的成本相当高（每次提供双份的食物）；而且因为竞争不强烈，想让*们去多踩踏板的效果并不好。
改变方案三：减量加移位方案。投食仅原来的一半分量，但同时将投食口移到踏板附近。结果呢，小*和大*都在拼命地抢着踩踏板。等待者不得食，而多劳者多得。每次的收获刚好消费完。
对于游戏设计者，这是一个最好的方案。成本不高，但收获最大。
原版的“智*博弈”故事给了竞争中的弱者（小*）以等待为最佳策略的启发。但是对于社会而言，因为小*未能参与竞争，小*搭便车时的社会资源配置的并不是最佳状态。为使资源最有效配置，规则的设计者是不愿看见有人搭便车的，政府如此，公司的老板也是如此。而能否完全杜绝“搭便车”现象，就要看游戏规则的核心指标设置是否合适了。
比如，公司的激励制度设计，奖励力度太大，又是持股，又是期权，公司职员个个都成了百万富翁，成本高不说，员工的积极性并不一定很高。这相当于“智*博弈”
增量方案所描述的情形。但是如果奖励力度不大，而且见者有份（不劳动的“小*”也有），一度十分努力的大*也不会有动力了----就象“智*博弈”减量方案一所描述的情形。最好的激励机制设计就象改变方案三----减量加移位的办法，奖励并非人人有份，而是直接针对个人（如业务按比例提成），既节约了成本（对公司而言），又消除了“搭便车”现象，能实现有效的激励。
许多人并未读过“智*博弈”的故事，但是却在自觉地使用小*的策略。股市上等待庄家抬轿的散户；等待产业市场中出现具有赢利能力新产品、继而大举仿制牟取暴利的游资；公司里不创造效益但分享成果的人，等等。因此，对于制订各种经济管理的游戏规则的人，必须深谙“智*博弈”指标改变的个中道理。
3.背景知识：纳什博弈论的原理与应用

2002年03月21日17:44 北京晚报
1950年和1951年纳什的两篇关于非合作博弈论的重要论文，彻底改变了人们对竞争和市场的看法。他证明了非合作博弈及其均衡解，并证明了均衡解的存在性，即著名的纳什均衡。从而揭示了博弈均衡与经济均衡的内在联系。纳什的研究奠定了现代非合作博弈论的基石，后来的博弈论研究基本上都沿着这条主线展开的。然而，纳什天才的发现却遭到冯·诺依曼的断然否定，在此之前他还受到爱因斯坦的冷遇。但是骨子里挑战权威、藐视权威的本性，使纳什坚持了自己的观点，终成一代大师。要不是30多年的严重精神病折磨，恐怕他早已
站在诺贝尔奖的领奖台上了，而且也绝不会与其他人分享这一殊荣。

纳什是一个非常天才的数学家，他的主要贡献是1950至1951年在普林斯顿读博士学位时做出的。然而，他的天才发现———非合作博弈的均衡，即“纳什均衡”并不是一帆风顺的。

1948年纳什到普林斯顿大学读数学系的博士。那一年他还不到20岁。当时普林斯顿可谓人杰地灵，大师如云。爱因斯坦、冯·诺依曼、列夫谢茨(数学系主任)、阿尔伯特·塔克、阿伦佐·切奇、哈罗德·库恩、诺尔曼·斯蒂恩罗德、埃尔夫·福克斯……等全都在这里。博弈论主要是由冯·诺依曼(1903—1957)创所立的。他是一位出生于匈牙利的天才的数学家。他不仅创立了经济博弈论，而且发明了计算机。早在20世纪初，塞梅鲁(Zermelo)、鲍罗(Borel)和冯·诺伊曼已经开始研究博弈的准确的数学表达，直到1939年，冯·诺依曼遇到经济学家奥斯卡·摩根斯特恩(Oskar Morgenstern)，并与其合作才使博弈论进入经济学的广阔领域。

1944年他与奥斯卡·摩根斯特恩合著的巨作《博弈论与经济行为》出版，标志着现代系统博弈理论的的初步形成。尽管对具有博弈性质的问题的研究可以追溯到19世纪甚至更早。例如，1838年古诺(Cournot)简单双寡头垄断博弈；1883年伯特兰和1925年艾奇沃奇思研究了两个寡头的产量与价格垄断；2000多年前中国著名军事家孙武的后代孙膑利用博弈论方法帮助田忌赛马取胜等等都属于早期博弈论的萌芽，其特点是零星的，片断的研究，带有很大的偶然性，很不系统。冯·诺依曼和摩根斯特恩的《博弈论与经济行为》一书中提出的标准型、扩展型和合作型博弈模型解的概念和分析方法，奠定了这门学科的理论基础。合作型博弈在20世纪50年代达到了巅峰期。然而，诺依曼的博弈论的局限性也日益暴露出来，由于它过于抽象，使应用范围受到很大限制，在很长时间里，人们对博弈论的研究知之甚少，只是少数数学家的专利，所以，影响力很有限。正是在这个时候，非合作博弈———“纳什均衡”应运而生了，它标志着博弈论的新时代的开始！纳什不是一个按部就班的学生，他经常旷课。据他的同学们回忆，他们根本想不起来曾经什么时候和纳什一起完完整整地上过一门必修课，但纳什争辩说，至少上过斯蒂恩罗德的代数拓扑学。斯蒂恩罗德恰恰是这门学科的创立者，可是，没上几次课，纳什就认定这门课不符合他的口味。于是，又走人了。然而，纳什毕竟是一位英才天纵的非凡人物，他广泛涉猎数学王国的每一个分支，如拓扑学、代数几何学、逻辑学、博弈论等等，深深地为之着迷。纳什经常显示出他与众不同的自信和自负，充满咄咄逼人的学术野心。1950年整个夏天纳什都忙于应付紧张的考试，他的博弈论研究工作被迫中断，他感到这是莫大的浪费。殊不知这种暂时的“放弃”，使原来模糊、杂乱和无绪的若干念头，在潜意识的持续思考下，逐步形成一条清晰的脉络，突然来了灵感！这一年的10月，他骤感才思潮涌，梦笔生花。其中一个最耀眼的亮点就是日后被称之为“纳什均衡”的非合作博弈均衡的概念。纳什的主要学术贡献体现在1950年和1951年的两篇论文之中(包括一篇博士论文)。1950年他才把自己的研究成果写成题为“非合作博弈”的长篇博士论文，1950年11月刊登在美国全国科学院每月公报上，立即引起轰动。说起来这全靠师兄戴维·盖尔之功，就在遭到冯·诺依曼贬低几天之后，他遇到盖尔，告诉他自己已经将冯·诺依曼的“最小最大原理”(minimax solution)推到非合作博弈领域，找到了普遍化的方法和均衡点。盖尔听得很认真，他终于意识到纳什的思路比冯·诺伊曼的合作博弈的理论更能反映现实的情况，而对其严密优美的数学证明极为赞叹。盖尔建议他马上整理出来发表，以免被别人捷足先登。纳什这个初出茅庐的小子，根本不知道竞争的险恶，从未想过要这么做。结果还是盖尔充当了他的“经纪人”，代为起草致科学院的短信，系主任列夫谢茨则亲自将文稿递交给科学院。纳什写的文章不多，就那么几篇，但已经足够了，因为都是精品中的精品。这一点也是值得我们深思的。国内提一个教授，要求在“核心的刊物”上发表多少篇文章。按照这个标准可能纳什还不一定够资格。

1996年诺贝尔经济学奖得主莫尔里斯当牛津大学艾奇沃思经济学讲座教授时也没有发表过什么文章，特殊的人才，必须有特殊的选拔办法。

纳什在上大学时就开始从事纯数学的博弈论研究，1948年进入普林斯顿大学后更是如鱼得水。20岁出头已成为闻名世界的数学家。特别是在经济博弈论领域，他做出了划时代的贡献，是继冯·诺依曼之后最伟大的博弈论大师之一。他提出的著名的纳什均衡的概念在非合作博弈理论中起着核心的作用。后续的研究者对博弈论的贡献，都是建立在这一概念之上的。由于纳什均衡的提出和不断完善为博弈论广泛应用于经济学、管理学、社会学、政治学、军事科学等领域奠定了坚实的理论基础。

囚犯的两难处境

大理论中的小故事

要了解纳什的贡献，首先要知道什么是非合作博弈问题。现在几乎所有的博弈论教科书上都会讲“囚犯的两难处境”的例子，每本书上的例子都大同小异。

博弈论毕竟是数学，更确切地说是运筹学的一个分支，谈经论道自然少不了数学语言，外行人看来只是一大堆数学公式。好在博弈论关心的是日常经济生活问题，所以不能不食人间烟火。其实这一理论是从棋弈、扑克和战争等带有竞赛、对抗和决策性质的问题中借用的术语，听上去有点玄奥，实际上却具有重要现实意义。博弈论大师看经济社会问题犹如棋局，常常寓深刻道理于游戏之中。所以，多从我们的日常生活中的凡人小事入手，以我们身边的故事做例子，娓娓道来，并不乏味。话说有一天，一位富翁在家中被杀，财物被盗。警方在此案的侦破过程中，抓到两个犯罪嫌疑人，斯卡尔菲丝和那库尔斯，并从他们的住处搜出被害人家中丢失的财物。但是，他们矢口否认曾杀过人，辩称是先发现富翁被杀，然后只是顺手牵羊偷了点儿东西。于是警方将两人隔离，分别关在不同的房间进行审讯。由地方检察官分别和每个人单独谈话。检察官说，“由于你们的偷盗罪已有确凿的证据，所以可以判你们一年刑期。但是，我可以和你做个交易。如果你单独坦白杀人的罪行，我只判你三个月的监禁，但你的同伙要被判十年刑。如果你拒不坦白，而被同伙检举，那么你就将被判十年刑，他只判三个月的监禁。但是，如果你们两人都坦白交代，那么，你们都要被判5年刑。”斯卡尔菲丝和那库尔斯该怎么办呢？他们面临着两难的选择——坦白或抵赖。显然最好的策略是双方都抵赖，结果是大家都只被判一年。但是由于两人处于隔离的情况下无法串供。所以，按照亚当·斯密的理论，每一个人都是从利己的目的出发，他们选择坦白交代是最佳策略。因为坦白交代可以期望得到很短的监禁———3个月，但前提是同伙抵赖，显然要比自己抵赖要坐10年牢好。这种策略是损人利己的策略。不仅如此，坦白还有更多的好处。如果对方坦白了而自己抵赖了，那自己就得坐10年牢。太不划算了！因此，在这种情况下还是应该选择坦白交代，即使两人同时坦白，至多也只判5年，总比被判10年好吧。所以，两人合理的选择是坦白，原本对双方都有利的策略(抵赖)和结局(被判1年刑)就不会出现。这样两人都选择坦白的策略以及因此被判5年的结局被称为“纳什均衡”，也叫非合作均衡。因为，每一方在选择策略时都没有“共谋”(串供)，他们只是选择对自己最有利的策略，而不考虑社会福利或任何其他对手的利益。也就是说，这种策略组合由所有局中人(也称当事人、参与者)的最佳策略组合构成。没有人会主动改变自己的策略以便使自己获得更大利益。“囚徒的两难选择”有着广泛而深刻的意义。个人理性与集体理性的冲突，各人追求利己行为而导致的最终结局是一个“纳什均衡”，也是对所有人都不利的结局。他们两人都是在坦白与抵赖策略上首先想到自己，这样他们必然要服长的刑期。只有当他们都首先替对方着想时，或者相互合谋(串供)时，才可以得到最短时间的监禁的结果。“纳什均衡”首先对亚当·斯密的“看不见的手”的原理提出挑战。按照斯密的理论，在市场经济中，每一个人都从利己的目的出发，而最终全社会达到利他的效果。不妨让我们重温一下这位经济学圣人在《国富论》中的名言：“通过追求(个人的)自身利益，他常常会比其实际上想做的那样更有效地促进社会利益。”从“纳什均衡”我们引出了“看不见的手”的原理的一个悖论：从利己目的出发，结果损人不利己，既不利己也不利他。两个囚徒的命运就是如此。从这个意义上说，“纳什均衡”提出的悖论实际上动摇了西方经济学的基石。因此，从“纳什均衡”中我们还可以悟出一条真理：合作是有利的“利己策略”。但它必须符合以下黄金律：按照你愿意别人对你的方式来对别人，但只有他们也按同样方式行事才行。也就是中国人说的“己所不欲勿施于人”。但前提是人所不欲勿施于我。其次，“纳什均衡”是一种非合作博弈均衡，在现实中非合作的情况要比合作情况普遍。所以“纳什均衡”是对冯·诺依曼和摩根斯特恩的合作博弈理论的重大发展，甚至可以说是一场革命。

从“纳什均衡”的普遍意义中我们可以深刻领悟司空见惯的经济、社会、政治、国防、管理和日常生活中的博弈现象。我们将例举出许多类似于“囚徒的两难处境”这样的例子。如价格战、军奋竞赛、污染等等。一般的博弈问题由三个要素所构成：即局中人(players)又称当事人、参与者、策略等等的集合，策略(strategies)集合以及每一对局中人所做的选择和赢得(payoffs)集合。其中所谓赢得是指如果一个特定的策略关系被选择，每一局中人所得到的效用。所有的博弈问题都会遇到这三个要素。

价格战博弈：

现在我们经常会遇到各种各样的家电价格大战，彩电大战、冰箱大战、空调大战、微波炉大战……这些大战的受益者首先是消费者。每当看到一种家电产品的价格大战，百姓都会“没事儿偷着乐”。在这里，我们可以解释厂家价格大战的结局也是一个“纳什均衡”，而且价格战的结果是谁都没钱赚。因为博弈双方的利润正好是零。竞争的结果是稳定的，即是一个“纳什均衡”。这个结果可能对消费者是有利的，但对厂商而言是灾难性的。所以，价格战对厂商而言意味着自杀。从这个案例中我们可以引伸出两个问题，一是竞争削价的结果或“纳什均衡”可能导致一个有效率的零利润结局。二是如果不采取价格战，作为一种敌对博弈论(vivalry game)其结果会如何呢？每一个企业，都会考虑采取正常价格策略，还是采取高价格策略形成垄断价格，并尽力获取垄断利润。如果垄断可以形成，则博弈双方的共同利润最大。这种情况就是垄断经营所做的，通常会抬高价格。另一个极端的情况是厂商用正常的价格，双方都可以获得利润。从这一点，我们又引出一条基本准则：“把你自己的战略建立在假定对手会按其最佳利益行动的基础上”。事实上，完全竞争的均衡就是“纳什均衡”或“非合作博弈均衡”。在这种状态下，每一个厂商或消费者都是按照所有的别人已定的价格来进行决策。在这种均衡中，每一企业要使利润最大化，消费者要使效用最大化，结果导致了零利润，也就是说价格等于边际成本。在完全竞争的情况下，非合作行为导致了社会所期望的经济效率状态。如果厂商采取合作行动并决定转向垄断价格，那么社会的经济效率就会遭到破坏。这就是为什么WTO和各国政府要加强反垄断的意义所在。

污染博弈：

假如市场经济中存在着污染，但政府并没有管制的环境，企业为了追求利润的最大化，宁愿以牺牲环境为代价，也绝不会主动增加环保设备投资。按照看不见的手的原理，所有企业都会从利己的目的出发，采取不顾环境的策略，从而进入“纳什均衡”状态。如果一个企业从利他的目的出发，投资治理污染，而其他企业仍然不顾环境污染，那么这个企业的生产成本就会增加，价格就要提高，它的产品就没有竞争力，甚至企业还要破产。这是一个“看不见的手的有效的完全竞争机制”失败的例证。直到20世纪90年代中期，中国乡镇企业的盲目发展造成严重污染的情况就是如此。只有在政府加强污染管制时，企业才会采取低污染的策略组合。企业在这种情况下，获得与高污染同样的利润，但环境将更好。谢谢采纳

博弈论的论文该怎么写？

博弈论论文的写作格式、流程与写作技巧广义来说，凡属论述科学技术内容的作品，都称作科学著述，如原始论著（论文）、简报、综合报告、进展报告、文献综述、述评、专著、汇编、教科书和科普读物等。但其中只有原始论著及其简报是原始的、主要的、第一性的、涉及到创造发明等知识产权的。其它的当然也很重要，但都是加工的、发展的、为特定应用目的和对象而撰写的。下面仅就论文的撰写谈一些体会。在讨论论文写作时也不准备谈有关稿件撰写的各种规定及细则。主要谈的是论文写作中容易发生的问题和经验，是论文写作道德和书写内容的规范问题。论文写作的要求下面按论文的结构顺序依次叙述。(一)论文——题目科学论文都有题目，不能“无题”。论文题目一般20字左右。题目大小应与内容符合，尽量不设副题，不用第1报、第2报之类。论文题目都用直叙口气，不用惊叹号或问号，也不能将科学论文题目写成广告语或新闻报道用语。(二)论文——署名科学论文应该署真名和真实的工作单位。主要体现责任、成果归属并便于后人追踪研究。严格意义上的论文作者是指对选题、论证、查阅文献、方案设计、建立方法、实验操作、整理资料、归纳总结、撰写成文等全过程负责的人，应该是能解答论文的有关问题者。现在往往把参加工作的人全部列上，那就应该以贡献大小依次排列。论文署名应征得本人同意。学术指导人根据实际情况既可以列为论文作者，也可以一般致谢。行政领导人一般不署名。(三)论文——引言是论文引人入胜之言，很重要，要写好。一段好的论文引言常能使读者明白你这份工作的发展历程和在这一研究方向中的位置。要写出论文立题依据、基础、背景、研究目的。要复习必要的文献、写明问题的发展。文字要简练。(四)论文——材料和方法按规定如实写出实验对象、器材、动物和试剂及其规格，写出实验方法、指标、判断标准等，写出实验设计、分组、统计方法等。这些按杂志对论文投稿规定办即可。(五)论文——实验结果应高度归纳，精心分析，合乎逻辑地铺述。应该去粗取精，去伪存真，但不能因不符合自己的意图而主观取舍，更不能弄虚作假。只有在技术不熟练或仪器不稳定时期所得的数据、在技术故障或操作错误时所得的数据和不符合实验条件时所得的数据才能废弃不用。而且必须在发现问题当时就在原始记录上注明原因，不能在总结处理时因不合常态而任意剔除。废弃这类数据时应将在同样条件下、同一时期的实验数据一并废弃，不能只废弃不合己意者。实验结果的整理应紧扣主题，删繁就简，有些数据不一定适合于这一篇论文，可留作它用，不要硬行拼凑到一篇论文中。论文行文应尽量采用专业术语。能用表的不要用图，可以不用图表的最好不要用图表，以免多占篇幅，增加排版困难。文、表、图互不重复。实验中的偶然现象和意外变故等特殊情况应作必要的交代，不要随意丢弃。(六)论文——讨论是论文中比较重要，也是比较难写的一部分。应统观全局，抓住主要的有争议问题，从感性认识提高到理性认识进行论说。要对实验结果作出分析、推理，而不要重复叙述实验结果。应着重对国内外相关文献中的结果与观点作出讨论，表明自己的观点，尤其不应回避相对立的观点。论文的讨论中可以提出假设，提出本题的发展设想，但分寸应该恰当，不能写成“科幻”或“畅想”。(七)论文——结语或结论论文的结语应写出明确可靠的结果，写出确凿的结论。论文的文字应简洁，可逐条写出。不要用“小结”之类含糊其辞的词。(八)论文——参考义献这是论文中很重要、也是存在问题较多的一部分。列出论文参考文献的目的是让读者了解论文研究命题的来龙去脉，便于查找，同时也是尊重前人劳动，对自己的工作有准确的定位。因此这里既有技术问题，也有科学道德问题。一篇论文中几乎自始至终都有需要引用参考文献之处。如论文引言中应引上对本题最重要、最直接有关的文献;在方法中应引上所采用或借鉴的方法；在结果中有时要引上与文献对比的资料；在讨论中更应引上与论文有关的各种支持的或有矛盾的结果或观点等。一切粗心大意，不查文献；故意不引，自鸣创新；贬低别人，抬高自己；避重就轻，故作姿态的做法都是错误的。而这种现象现在在很多论文中还是时有所见的，这应该看成是利研工作者的大忌。其中，不查文献、漏掉重要文献、故意不引别人文献或有意贬损别人工作等错误是比较明显、容易发现的。有些做法则比较隐蔽，如将该引在引言中的，把它引到讨论中。这就将原本是你论文的基础或先导，放到和你论文平起平坐的位置。又如科研工作总是逐渐深人发展的，你的工作总是在前人工作基石出上发展起来做成的。正确的写法应是，某年某人对本题做出了什么结果，某年某人在这基础上又做出了什么结果，现在我在他们基础上完成了这一研究。这是实事求是的态度，这样表述丝毫无损于你的贡献。有些论文作者却不这样表述，而是说，某年某人做过本题没有做成，某年某人又做过本题仍没有做成，现在我做成了。这就不是实事求是的态度。这样有时可以糊弄一些不明真相的外行人，但只需内行人一戳，纸老虎就破，结果弄巧成拙，丧失信誉。这种现象在现实生活中还是不少见的。(九)论文——致谢论文的指导者、技术协助者、提供特殊试剂或器材者、经费资助者和提出过重要建议者都属于致谢对象。论文致谢应该是真诚的、实在的，不要庸俗化。不要泛泛地致谢、不要只谢教授不谢旁人。写论文致谢前应征得被致谢者的同意，不能拉大旗作虎皮。(十)论文——摘要或提要：以200字左右简要地概括论文全文。常放篇首。论文摘要需精心撰写，有吸引力。要让读者看了论文摘要就像看到了论文的缩影，或者看了论文摘要就想继续看论文的有关部分。此外，还应给出几个关键词，关键词应写出真正关键的学术词汇，不要硬凑一般性用词。推荐一些比较好的论文网站。论文之家优秀论文杂志论文资料网法律图书馆法学论文资料库中国总经理网论文集 mba职业经理人论坛财经学位论文下载中心公开发表论文_深圳证券交易所中国路桥资讯网论文资料中心论文商务中心法律帝国：学术论文论文统计北京大学学位论文样本收藏学位论文（清华大学）中国科技论文在线论文中国 : 新浪论文网分类: 中国论文联盟: 大学生论文库论文资料网:

浅谈“博弈论”

以前没发现，但在学习了博弈论基础的知识后，很容易的发现，博弈如同空气般，围绕在我们身边，无处不在。生活中的大小事怎么个博弈法，下面的内容将娓娓道来。

无论在日常生活中还是在工作中，“博弈”都是一个高频的词汇，生活中的博弈和经济学中的博弈有怎样的关系，精通“博弈”的人会不会特别擅长“套路”，“博弈论”到底是怎样的一种思维？下面我们来从以下方面谈论一下。

一、博弈论的定义

博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略，达到取胜的目的。博弈论思想古已有之，中国古代的《孙子兵法》等著作就不仅是一部军事著作，而且算是最早的一部博弈论著作。

二、博弈论的发展

博弈论最初主要研究象棋、桥牌、赌博中的胜负问题，人们对博弈局势的把握只停留在经验上，没有向理论化发展。近代对博弈论的研究，开始于策梅洛、波莱尔、冯·诺依曼。

1928年，冯·诺依曼证明了博弈论的基本原理，从而宣告了博弈论的正式诞生。1944年，冯·诺依曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统地应用于经济领域，从而奠定了这一学科的基础和理论体系。

1950～1951年，约翰·福布斯·纳什利用不动点定理证明了均衡点的存在，为博弈论的一般化奠定了坚实的基础。纳什的开创性论文《n人博弈的均衡点》（1950），《非合作博弈》（1951）等等，给出了纳什均衡的概念和均衡存在定理。此外，莱因哈德·泽尔腾、约翰·海萨尼的研究也对博弈论发展起到推动作用。今天博弈论已发展成一门较完善的学科。

三、博弈论的例子

“博弈论”中有一些由点及面、发人深思的经典案例，这些案例不仅使专业研究人士如醉如痴，也使一些普通民众兴致盎然；不仅成为“博弈论”中的一道亮丽风景，也是整个经济学领域中的学术奇葩。

一囚徒困境

囚徒困境的故事讲的是，两个嫌疑犯作案后被警察抓住，分别关在不同的屋子里接受审讯。警察知道两人有罪，但缺乏足够的证据。警察告诉每个人：如果两人都抵赖，各判刑一年；如果两人都坦白，各判八年；如果两人中一个坦白而另一个抵赖，坦白的放出去，抵赖的判十年。于是，每个囚徒都面临两种选择：坦白或抵赖。然而，不管同伙选择什么，每个囚徒的最优选择是坦白：如果同伙抵赖、自己坦白的话放出去，抵赖的话判一年，坦白比不坦白好；如果同伙坦白、自己坦白的话判八年，比起抵赖的判十年，坦白还是比抵赖的好。结果，两个嫌疑犯都选择坦白，各判刑八年。如果两人都抵赖，各判一年，显然这个结果好。但这个帕累托改进办不到，因为它不能满足人类的个体的理性要求。

囚徒困境所反映出的深刻问题是，人类的个人理性有时能导致集体的非理性——聪明的人类会因自己的聪明而作茧自缚，或者损害集体的利益。

前几年，我国彩电市场上，生产厂家基于自我利益选择大幅降价，但由此引发的价格战使所有生产厂家都遭受重创，这也是一种囚徒困境。

二智猪博弈

猪圈里面有两只猪，一只大，一只小。猪圈很长，一头有一个踏板，另一头是饲料的出口和食槽。每踩一下踏板，在远离踏板的猪圈的另一边的投食口就会落下少量的食物。如果有一只猪去踩踏板，另一只猪就有机会抢先吃到另一边落下的食物。当小猪踩动踏板时，大猪会在小猪跑到食槽之前刚好吃光所有的食物；若是大猪踩动了踏板，则还有机会在小猪吃完落下的食物之前跑到食槽，争吃到另一半残羹。所以呢小猪为了能吃饭东西，最好的策论就是大大猪的“便车”。这种情况在现实中比比皆是。

比如，在某种新产品刚上市，其性能和功用还不为人所熟识的情况下，如果进行新产品生产的不仅是一家小企业，还有其他生产能力和销售能力更强的企业。那么，小企业完全没有必要作出头鸟，自己去投入大量广告做产品宣传，只要采用跟随战略即可。

“智猪博弈”告诉我们，谁先去踩这个踏板，就会造福全体，但多劳却并不一定多得。

三那什均衡

纳什均衡最核心的其实就是互利的思想。有个小故事就可以体现。街上相邻的地方有两家小店，一家卖稀饭豆浆，一家卖油条馒头，一般客人都是买上馒头油条去和稀饭豆浆，所以开始两家的生意都很红火。后来卖豆浆的觉得卖油条的抢了生意，双方产生了矛盾，卖油条的走了，结果连带自己的生意也不行了。

其实我们生活中有很多与博弈相关的例子。而在这样一个复杂的博弈战场上，我们怎么能使得自己在博弈场上获得最大的利益就是一门很大的学问了。所以，博弈论是一门很有用的学科。通过读书学习让我又懂得了一问学问。

博弈论主要讲什么？

博弈论(Game Theory)，有时也称为对策论，或者赛局理论，是研究具有斗争或竞争性质现象的理论和方法，它是应用数学的一个分支，既是现代数学的一个新分支，也是运筹学的一个重要学科。目前在生物学、经济学、国际关系学、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。主要研究公式化了的激励结构（游戏或者博弈（Game)）间的相互作用，是研究具有斗争或竞争性质现象的数学理论和方法，也是运筹学的一个重要学科。

　　博弈论考虑游戏中的个体的预测行为和实际行为，并研究它们的优化策略。表面上不同的相互作用可能表现出相似的激励结构(incentive structure)，所以他们是同一个游戏的特例。其中一个有名有趣的应用例子是囚徒困境悖论(Prisoner's dilemma)。

　　具有竞争或对抗性质的行为成为博弈行为。在这类行为中，参加斗争或竞争的各方各自具有不同的目标或利益。为了达到各自的目标和利益，各方必须考虑对手的各种可能的行动方案，并力图选取对自己最为有利或最为合理的方案。比如日常生活中的下棋，打牌等。博弈论就是研究博弈行为中斗争各方是否存在着最合理的行为方案，以及如何找到这个合理的行为方案的数学理论和方法。

　　生物学家使用博弈理论来理解和预测进化论的某些结果。例如：John Maynard Smith 和George R. Price 在1973年发表于Nature上的论文中提出的“evolutionarily stable strategy”的这个概念就是使用了博弈理论。还可以参见演化博弈理论（evolutionary game theory）和行为生态学（behavioral ecology）。

　　博弈论也应用于数学的其他分支，如概率、统计和线性规划等。
博弈论思想古已有之，我国古代的《孙子兵法》就不仅是一部军事著作，而且算是最早的一部博弈论专著。博弈论最初主要研究象棋、桥牌、赌博中的胜负问题，人们对博弈局势的把握只停留在经验上,没有向理论化发展，正式发展成一门学科则是在20世纪初。

　　对于博弈论的研究，开始于策墨洛(Zermelo,1913)、波雷尔(Borel,1921)及冯·诺伊曼(von Neumann, 1928)，后来由冯·诺伊曼和奥斯卡·摩根斯坦(von Neumann and Morgenstern，1944，1947)首次对其系统化和形式化（参照Myerson, 1991）。随后约翰·福布斯·纳什(John Forbes Nash Jr., 1950, 1951)利用不动点定理证明了均衡点的存在，为博弈论的一般化奠定了坚实的基础。此外，塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。今天博弈论已发展成一门较完善的的学科。

　　当代博弈论的“三大家”和“四君子”

　　"三大家" 包括约翰·福布斯·纳什、约翰·C·海萨尼以及莱因哈德·泽尔腾。这三人同时因为他们对博弈论的突出贡献而获得1994年的瑞典银行经济学奖（也称诺贝尔经济学奖）。

　　"四君子" 包括罗伯特·J·奥曼、肯·宾摩尔、戴维·克瑞普斯以及阿里尔·鲁宾斯坦。
博弈要素:

　　(1)局中人（players）：在一场竞赛或博弈中，每一个有决策权的参与者成为一个局中人。只有两个局中人的博弈现象称为“两人博弈”,而多于两个局中人的博弈称为 “多人博弈”。

　　(2)策略(strategiges)：一局博弈中，每个局中人都有选择实际可行的完整的行动方案，即方案不是某阶段的行动方案，而是指导整个行动的一个方案，一个局中人的一个可行的自始至终全局筹划的一个行动方案，称为这个局中人的一个策略。如果在一个博弈中局中人都总共有有限个策略，则称为“有限博弈”，否则称为“无限博弈”。

　　(3)得失(payoffs)：一局博弈结局时的结果称为得失。每个局中人在一局博弈结束时的得失，不仅与该局中人自身所选择的策略有关，而且与全局中人所取定的一组策略有关。所以，一局博弈结束时每个局中人的“得失”是全体局中人所取定的一组策略的函数，通常称为支付（payoff）函数。

　　(4)次序（orders）：各博弈方的决策有先后之分，且一个博弈方要作不止一次的决策选择，就出现了次序问题；其他要素相同次序不同，博弈就不同。

　　(5)博弈涉及到均衡：均衡是平衡的意思，在经济学中，均衡意即相关量处于稳定值。在供求关系中，某一商品市场如果在某一价格下，想以此价格买此商品的人均能买到，而想卖的人均能卖出，此时我们就说，该商品的供求达到了均衡。所谓纳什均衡，它是一稳定的博弈结果。

　　纳什均衡(Nash Equilibrium)：在一策略组合中，所有的参与者面临这样一种情况，当其他人不改变策略时，他此时的策略是最好的。也就是说，此时如果他改变策略他的支付将会降低。在纳什均衡点上，每一个理性的参与者都不会有单独改变策略的冲动。纳什均衡点存在性证明的前提是“博弈均衡偶”概念的提出。所谓“均衡偶”是在二人零和博弈中，当局中人A采取其最优策略a*,局中人B也采取其最优策略b*,如果局中人仍采取b*,而局中人A却采取另一种策略a，那么局中人A的支付不会超过他采取原来的策略a*的支付。这一结果对局中人B亦是如此。

　　这样，“均衡偶”的明确定义为：一对策略a*(属于策略集A)和策略b*（属于策略集B）称之为均衡偶，对任一策略a(属于策略集A)和策略b（属于策略集B），总有：偶对（a, b*）≤偶对(a*,b*)≤偶对（a*，b）。

　　对于非零和博弈也有如下定义：一对策略a*（属于策略集A）和策略b*（属于策略集B）称为非零和博弈的均衡偶，对任一策略a(属于策略集A）和策略 b（属于策略集B），总有：对局中人A的偶对（a, b*） ≤偶对(a*,b*);对局中人B的偶对（a*，b）≤偶对(a*,b*)。

　　有了上述定义，就立即得到纳什定理：

　　任何具有有限纯策略的二人博弈至少有一个均衡偶。这一均衡偶就称为纳什均衡点。

　　纳什定理的严格证明要用到不动点理论，不动点理论是经济均衡研究的主要工具。通俗地说，寻找均衡点的存在性等价于找到博弈的不动点。

　　纳什均衡点概念提供了一种非常重要的分析手段，使博弈论研究可以在一个博弈结构里寻找比较有意义的结果。

　　但纳什均衡点定义只局限于任何局中人不想单方面变换策略，而忽视了其他局中人改变策略的可能性，因此，在很多情况下，纳什均衡点的结论缺乏说服力，研究者们形象地称之为“天真可爱的纳什均衡点”。

　　塞尔顿（R·Selten)在多个均衡中剔除一些按照一定规则不合理的均衡点，从而形成了两个均衡的精炼概念：子博弈完全均衡和颤抖的手完美均衡。

谁能讲讲博弈论？

博弈论又被称为对策论（Games Theory),是研究具有斗争或竞争性质现象的理论和方法，它既是现代数学的一个新分支，也是运筹学的一个重要学科。

博弈论思想古已有之，我国古代的《孙子兵法》就不仅是一部军事著作，而且算是最早的一部博弈论专著。博弈论最初主要研究象棋、桥牌、赌博中的胜负问题，人们对博弈局势的把握只停留在经验上,没有向理论化发展，正式发展成一门学科则是在20世纪初。1928年冯·诺意曼证明了博弈论的基本原理，从而宣告了博弈论的正式诞生。1944年，冯·诺意曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域，从而奠定了这一学科的基础和理论体系。谈到博弈论就不能忽略博弈论天才纳什，纳什的开创性论文《n人博弈的均衡点》（1950），《非合作博弈》（1951）等等，给出了纳什均衡的概念和均衡存在定理。此外，塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。今天博弈论已发展成一门较完善的的学科。

博弈要素

(1)局中人：在一场竞赛或博弈中，每一个有决策权的参与者成为一个局中人。只有两个局中人的博弈现象称为“两人博弈”,而多于两个局中人的博弈称为 “多人博弈”。

(2)策略：一局博弈中，每个局中人都有选择实际可行的完整的行动方案，即方案不是某阶段的行动方案，而是指导整个行动的一个方案，一个局中人的一个可行的自始至终全局筹划的一个行动方案，称为这个局中人的一个策略。如果在一个博弈中局中人都总共有有限个策略，则称为“有限博弈”，否则称为“无限博弈”。

(3)得失：一局博弈结局时的结果称为得失。每个局中人在一局博弈结束时的得失，不仅与该局中人自身所选择的策略有关，而且与全局中人所取定的一组策略有关。所以，一局博弈结束时每个局中人的“得失”是全体局中人所取定的一组策略的函数，通常称为支付（payoff）函数。

(4)对于博弈参与者来说，存在着一博弈结果

(5)博弈涉及到均衡：均衡是平衡的意思，在经济学中，均衡意即相关量处于稳定值。在供求关系中，某一商品市场如果在某一价格下，想以此价格买此商品的人均能买到，而想卖的人均能卖出，此时我们就说，该商品的供求达到了均衡。所谓纳什均衡，它是一稳定的博弈结果。

纳什均衡(Nash Equilibrium)：在一策略组合中，所有的参与者面临这样一种情况，当其他人不改变策略时，他此时的策略是最好的。也就是说，此时如果他改变策略他的支付将会降低。在纳什均衡点上，每一个理性的参与者都不会有单独改变策略的冲动。纳什均衡点存在性证明的前提是“博弈均衡偶”概念的提出。所谓“均衡偶”是在二人零和博弈中，当局中人A采取其最优策略a*,局中人B也采取其最优策略b*,如果局中人仍采取b*,而局中人A却采取另一种策略a，那么局中人A的支付不会超过他采取原来的策略a*的支付。这一结果对局中人B亦是如此。

这样，“均衡偶”的明确定义为：一对策略a*(属于策略集A)和策略b*（属于策略集B）称之为均衡偶，对任一策略a(属于策略集A)和策略b（属于策略集B），总有：偶对（a, b*）≤偶对(a*,b*)≤偶对（a*，b）。

对于非零和博弈也有如下定义：一对策略a*（属于策略集A）和策略b*（属于策略集B）称为非零和博弈的均衡偶，对任一策略a(属于策略集A）和策略b（属于策略集B），总有：对局中人A的偶对（a, b*） ≤偶对(a*,b*);对局中人B的偶对（a*，b）≤偶对(a*,b*)。

有了上述定义，就立即得到纳什定理：
任何具有有限纯策略的二人博弈至少有一个均衡偶。这一均衡偶就称为纳什均衡点。

纳什定理的严格证明要用到不动点理论，不动点理论是经济均衡研究的主要工具。通俗地说，寻找均衡点的存在性等价于找到博弈的不动点。

纳什均衡点概念提供了一种非常重要的分析手段，使博弈论研究可以在一个博弈结构里寻找比较有意义的结果。

但纳什均衡点定义只局限于任何局中人不想单方面变换策略，而忽视了其他局中人改变策略的可能性，因此，在很多情况下，纳什均衡点的结论缺乏说服力，研究者们形象地称之为“天真可爱的纳什均衡点”。

塞尔顿（R·Selten)在多个均衡中剔除一些按照一定规则不合理的均衡点，从而形成了两个均衡的精炼概念：子博弈完全均衡和颤抖的手完美均衡。

博弈的类型

(1)合作博弈——研究人们达成合作时如何分配合作得到的收益，即收益分配问题。

(2)非合作博弈——研究人们在利益相互影响的局势中如何选决策使自己的收益最大，即策略选择问题。

(3)完全信息不完全信息博弈：参与者对所有参与者的策略空间及策略组合下的支付有充了解称为完全信息；反之，则称为不完全信息。

(4)静态博弈和动态博弈

静态博弈：指参与者同时采取行动，或者尽管有先后顺序，但后行动者不知道先行动者的策略。
动态博弈：指双方的的行动有先后顺序并且后行动者可以知道先行动者的策略。

财产分配问题和夏普里值（Shapley value）

考虑这样一个合作博弈：a、b、c、投票决定如何分配100万，他们分别拥有50％、40％、10％的权力，规则规定，当超过50%的票认可了某种方案时才能通过。那么如何分配才是合理的呢?按票力分配，a50万、b40万、c10万c向a提出：a70万、b0、c30万b向a提出：a80万、b20万、c0……

权力指数：每个决策者在决策时的权力体现在他在形成的获胜联盟中的“关键加入者”的个数，这个“关键加入者”的个数就被称为权利指数。

夏普里值：在各种可能的联盟次序下，参与者对联盟的边际贡献之和除以各种可能的联盟组合。

博弈论入门

第1节什么是博弈论：从“囚徒困境”说起

一天，警局接到报案，一位富翁被杀死在自己的别墅中，家中的财物也被洗劫一空。经过多方调查，警方最终将嫌疑人锁定在杰克和亚当身上，因为事发当晚有人看到他们两个神色慌张地从被害人的家中跑出来。警方到两人的家中进行搜查，结果发现了一部分被害人家中失窃的财物，于是将二人作为谋杀和盗窃嫌疑人拘留。

但是到了拘留所里面，两人都矢口否认自己杀过人，他们辩称自己只是路过那里，想进去偷点东西，结果进去的时候发现主人已经被人杀死了，于是他们便随便拿了点东西就走了。这样的解释不能让人信服，再说，谁都知道在判刑方面杀人要比盗窃严重得多。警察决定将两人隔离审讯。

隔离审讯的时候，警察告诉杰克：“尽管你们不承认，但是我知道人就是你们两个杀的，事情早晚会水落石出的。现在我给你一个坦白的机会，如果你坦白了，亚当拒不承认，那你就是主动自首，同时协助警方破案，你将被立即释放，亚当则要坐10年牢；如果你们都坦白了，每人坐8年牢；都不坦白的话，可能以入室盗窃罪判你们每人1年，如何选择你自己想一想吧。”同样的话，警察也说给了亚当。

一般人可能认为杰克和亚当都会选择不坦白，这样他们只能以入室盗窃的罪名被判刑，每人只需坐1年牢。这对于两人来说是最好的一种结局。可结果会是这样的吗？答案是否定的，两人都选择了招供，结果各被判了8年。

事情为什么会这样呢？杰克和亚当为什么会做出这样“不理智”的选择呢？其实这种结果正是两人的理智造成的。我们先看一下两人坦白与否及其结局的矩阵图：

当警察把坦白与否的后果告诉杰克的时候，杰克心中就会开始盘算坦白对自己有利，还是不坦白对自己有利。杰克会想，如果选择坦白，要么当即释放，要么同亚当一起坐8年牢；要是选择不坦白，虽然可能只坐1年牢，但也可能坐10年牢。虽然（1，1）对两人而言是最好的一种结局，但是由于是被分开审讯，信息不通，所以谁也没法保证对方是否会选择坦白。选择坦白的结局是8年或者0年，选择不坦白的结局是10年或者1年，在不知道对方选择的情况下，选择坦白对自己来说是一种优势策略。于是，杰克会选择坦白。同时，亚当也会这样想。最终的结局便是两个人都选择坦白，每人都要坐8年牢。

上面这个案例就是著名的“囚徒困境”模式，是博弈论中最出名的一个模式。为什么杰克和亚当都选择了对自己最有利的策略，最后得到的却是最差的结果呢？这其中便蕴涵着博弈论的道理。

博弈论是指双方或者多方在竞争、合作、冲突等情况下，充分了解各方信息，并依此选择一种能为本方争取最大利益的最优决策的理论。

“囚徒困境”中杰克和亚当便是参与博弈的双方，也称为博弈参与者。两人之所以陷入困境，是因为他们没有选择对两人来说最优的决策，也就是同时不坦白。而根本原因则是两人被隔离审讯，无法掌握对方的信息。所以，看似每个人都做出了对自己最有利的策略，结果却是两败俱伤。

我们身边的很多事情和典故中也有博弈论的应用，我们就用大家比较熟悉的“田忌赛马”这个故事来解释一下什么是博弈论。

齐国大将田忌，平日里喜欢与贵族赛马赌钱。当时赛马的规矩是每一方出上等马、中等马、下等马各一匹，共赛三场，三局两胜制。由于田忌的马比贵族们的马略逊一筹，所以十赌九输。当时孙膑在田忌的府中做客，经常见田忌同贵族们赛马，对赛马的比赛规则和双方马的实力差距都比较了解。这天田忌赛马又输了，非常沮丧地回到府中。孙膑见状，便对田忌说：“明天你尽管同那些贵族们下大赌注，我保证让你把以前输的全赢回来。”田忌相信了孙膑，第二天约贵族赛马，并下了千金赌注。

孙膑为什么敢打保证呢？因为他对这场赛马的博弈做了分析：双方都派上等、中等、下等马各一匹，田忌每一等级的马都比对方同一等级的马慢一点，因为没有规定出场顺序，所以比赛的对阵形式可能有六种，每一种对阵形式的结局是很容易猜测的：

第一种情况：上等马对上等马，中等马对中等马，下等马对下等马。结局：三局零胜。第二种情况：上等马对上等马，下等马对中等马，中等马对下等马。结局：三局一胜。

第三种情况：中等马对上等马，上等马对中等马，下等马对下等马。结局：三局一胜。

第四种情况：中等马对上等马，下等马对中等马，上等马对下等马。结局：三局一胜。

第五种情况：下等马对上等马，上等马对中等马，中等马对下等马。结局：三局两胜。

第六种情况：下等马对上等马，中等马对中等马，上等马对下等马。结局：三局一胜。

六种对阵形式中，只有一种能使田忌取胜，孙膑采取的正是这一种。赛前孙膑对田忌说：“你用自己的下等马去对阵他的上等马，然后用上等马去对阵他的中等马，最后用中等马去对阵他的下等马。”比赛结束之后，田忌三局两胜，赢得了比赛。田忌从此对孙膑刮目相看，并将他推荐给了齐威王。同样的马，只是调整了出场顺序，便取得截然相反的结果。这里边蕴涵着博弈论的道理。

在田忌赛马这个故事中，田忌同齐国的贵族便是博弈的双方，也称为博弈的参与者。孙膑充分了解了各方的信息，也就是比赛的规则与各匹马之间的实力差距，并在六种可以选择的策略中帮田忌选择了一个能争取最大利益的策略，也就是最优策略。所以说，这是一个很典型的博弈论在实际中应用的例子。

在这里还要区分一下博弈与博弈论的概念，以免搞混。它们既有共同点，又有很大的差别。“博弈”的字面意思是指赌博和下围棋，用来比喻为了利益进行竞争。自从人类存在的那一天开始，博弈便存在，我们身边也无时无刻不在上演着一场场博弈。而博弈论则是一种系统的理论，属于应用数学的一个分支。可以说博弈中体现着博弈论的思想，是博弈论在现实中的体现。

博弈作为一种争取利益的竞争，始终伴随着人类的发展。但是博弈论作为一门科学理论，是1928年由美籍匈牙利数学家约翰·冯·诺依曼建立起来的。他同时也是计算机的发明者，计算机在发明最初不过是庞大、笨重的算数器，但是今天已经深深影响到了我们生活、工作的各个方面。博弈论也是如此，最初冯·诺依曼证明了博弈论基本原理的时候，它只不过是一个数学理论，对现实生活影响甚微，所以没有引起人们的注意。直到1944年，冯·诺依曼与摩根斯坦合著的《博弈论与经济行为》发行出版。这本书的面世意义重大，先前冯·诺依曼的博弈理论主要研究二人博弈，这本书将研究范围推广到多人博弈；同时，还将博弈论从一种单纯的理论应用于经济领域。在经济领域的应用，奠定了博弈论发展为一门学科的基础和理论体系。

谈到博弈论的发展，就不能不提到约翰·福布斯·纳什。这是一位传奇的人物，他于1950年写出了论文《n人博弈中的均衡点》，当时年仅22岁。第二年他又发表了另外一篇论文《非合作博弈》。这两篇论文将博弈论的研究范围和应用领域大大推广。论文中提出的“纳什均衡”已经成为博弈论中最重要和最基础的理论。他也因此成为一代大师，并于1994年获得诺贝尔经济学奖。后面我们还会详细介绍纳什其人与“纳什均衡”理论。

经济学史上有三次伟大的革命，它们是“边际分析革命”“凯恩斯革命”和“博弈论革命”。博弈论为人们提供了一种解决问题的新方法。

博弈论发展到今天，已经成了一门比较完善的学科，应用范围也涉及各个领域。研究博弈论的经济学家获得诺贝尔经济学奖的比例是最高的，由此也可以看出博弈论的重要性和影响力。2005年的诺贝尔经济学奖又一次颁发给了研究博弈论的经济学家，瑞典皇家科学院给出的授奖理由是“他们对博弈论的分析，加深了我们对合作和冲突的理解”。

那么博弈论对我们个人的生活有什么影响呢？这种影响可以说是无处不在的。

假设，你去酒店参加一个同学的生日聚会，当天晚上他的亲人、朋友、同学、同事去了很多人，大家都玩得很高兴。可就在这时，外面突然失火，并且火势很大，无法扑灭，只能逃生。酒店里面人很多，但是安全出口只有两个。一个安全出口距离较近，但是人特别多，大家都在拥挤；另外一个安全出口人很少，但是距离相对远。如果抛开道德因素来考虑，这时你该如何选择？

这便是一个博弈论的问题。我们知道，博弈论就是在一定情况下，充分了解各方面信息，并做出最优决策的一种理论。在这个例子里，你身处火灾之中，了解到的信息就是远近共有两个安全门，以及这两个门的拥挤程度。在这里，你需要做出最优决策，也就是最有可能逃生的选择。那应该如何选择呢？

经济学博弈论，主要讲的是什么？上哪学？

经济学博弈论是理论，博弈，也就是赌博。但不是我们所认为的赌钱。
博弈，也就是赌博。但不是我们所认为的赌钱。举个例子来说，在一些新的领域，所谓的冷门，我们要大胆的去尝试，以一种全新的理念，去赌博，以不同的观念来博弈这场经济的走向趋势！博弈，以非常人的思想来创造我们自己认为能获得的利益！博弈论最初主要研究象棋、桥牌、赌博中的胜负问题，人们对博弈局势的把握只停留在经验上,没有向理论化发展，正式发展成一门学科则是在20世纪初。1928年冯·诺意曼证明了博弈论的基本原理，从而宣告了博弈论的正式诞生。1944年，冯·诺意曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域，从而奠定了这一学科的基础和理论体系。谈到博弈论就不能忽略博弈论天才纳什，纳什的开创性论文《n人博弈的均衡点》（1950），《非合作博弈》（1951）等等，给出了纳什均衡的概念和均衡存在定理。此外，塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。今天博弈论已发展成一门较完善的的学科。

推荐使用书籍进行学习：《经济博弈论》
《经济博弈论》行文深入浅出，尽可能用通俗易懂的语言和简单直观的例子等，介绍博弈论的概念、原理和分析方法。《经济博弈论》能够帮助读者尽快掌握现代博弈论的基本理论和应用能力，是学习博弈论比较理想的入门教材。《经济博弈论》适合作为经济、管理类专业大学生、研究生博弈论及相关课程的教材和教学参考书，也可供经济理论工作者、经济管理人员参考，法律、政治等专业的理论和实践工作者阅读《经济博弈论》也会很有收获。

博弈论的理论历史

博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略，达到取胜的目的。博弈论思想古已有之，中国古代的《孙子兵法》等著作就不仅是一部军事著作，而且算是最早的一部博弈论著作。博弈论最初主要研究象棋、桥牌、赌博中的胜负问题，人们对博弈局势的把握只停留在经验上，没有向理论化发展。博弈论考虑游戏中的个体的预测行为和实际行为，并研究它们的优化策略。近代对于博弈论的研究，开始于策梅洛（Zermelo），波莱尔（Borel）及冯·诺依曼（von Neumann）。1928年，冯·诺依曼证明了博弈论的基本原理，从而宣告了博弈论的正式诞生。1944年，冯·诺依曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统地应用于经济领域，从而奠定了这一学科的基础和理论体系。1950～1951年，约翰·福布斯·纳什（John Forbes Nash Jr）利用不动点定理证明了均衡点的存在，为博弈论的一般化奠定了坚实的基础。纳什的开创性论文《n人博弈的均衡点》（1950），《非合作博弈》（1951）等等，给出了纳什均衡的概念和均衡存在定理。此外，莱因哈德·泽尔腾、约翰·海萨尼的研究也对博弈论发展起到推动作用。今天博弈论已发展成一门较完善的学科。

博弈论论文大纲_博弈论论文大纲是什么