博弈论案例

经典散文 2019-07-14 23:22:03 经典散文

小中大

手机查看

[摘要]博弈论案例篇(1):“博弈论”中的经典案例“博弈论”中的经典案例 “博弈论”中一些经典案例，不仅使专业研究人士如醉如痴，也使一些普通民众兴致盎然。 “博弈论”中有一些由点及面、发人深思的经典案例，这些案例不仅使专业研究人士如醉如痴，也使一些普通民众兴致盎然；不仅成为“博弈论”中的一道亮丽

【www.shanpow.com--经典散文】

博弈论案例篇(1):“博弈论”中的经典案例

“博弈论”中的经典案例    “博弈论”中一些经典案例，不仅使专业研究人士如醉如痴，也使一些普通民众兴致盎然。    “博弈论”中有一些由点及面、发人深思的经典案例，这些案例不仅使专业研究人士如醉如痴，也使一些普通民众兴致盎然；不仅成为“博弈论”中的一道亮丽风景，也是整个经济学领域中的学术奇葩。
1、囚徒困境    假设警察局抓住了两个合伙犯罪的嫌疑犯，但获得的证据并不十分确切，对于两者的量刑就可能取决于两者对于犯罪事实的供认。警察局将这两名嫌疑犯分别关押以防他们串供。两名囚徒明白，如果他们都交代犯罪事实，则可能将各被判刑5年；如果他们都不交代，则有可能只会被以较轻的妨碍公务罪各判1年；如果一人交代，另一人不交代，交代者有可能会被立即释放，不交代者则将可能被重判8年。    对于两个囚徒总体而言，他们设想的最好的策略可能是都不交代。但任何一个囚徒在选择不交代的策略时，都要冒很大的风险，一旦自己不交代而另一囚徒交代了，自己就将可能处于非常不利的境地。对于囚徒A而言，不管囚徒B采取何种策略，他的最佳策略都是交代。对于囚徒B而言也是如此。最后两人都会选择交代。因此，囚徒困境反映了个体理性行为与集体理性行为之间的矛盾、冲突。    囚徒困境现象在现实生活中比比皆是。记得姜昆和唐杰忠过去说过一个公共楼道占用问题的相声。住户在公共楼道里堆满了杂物，结果大家都极不方便，以致即将分娩的妇女都没法及时被送往医院。但你如果不占用公共楼道，别人也会占用。每一居住面积狭小的住户从自我利益最大化出发，都会选择占用。但占用的结果却最终损害了大家的利益。    前几年，我国彩电市场上，生产厂家基于自我利益选择大幅降价，但由此引发的价格战使所有生产厂家都遭受重创，这也是一种囚徒困境。
2、斗鸡博弈    两只公鸡面对面争斗，继续斗下去，两败俱伤，一方退却便意味着认输。在这样的博弈中，要想取胜，就要在气势上压倒对方，至少要显示出破釜沉舟、背水一战的决心来，以迫使对方退却。但到最后的关键时刻，必有一方要退下来，除非真正抱定鱼死网破的决心。    这类博弈也不胜枚举。如两人反向过同一独木桥，一般来说，必有一人选择后退。在该种博弈中，非理性、非理智的形象塑造往往是一种可选择的策略运用。如那种看上去不把自己的生命当回事的人，或者看上去有点醉醺醺、傻乎乎的人，往往能逼退独木桥上的另一人。还有夫妻争吵也常常是一个“斗鸡博弈”，吵到最后，一般地，总有一方对于对方的唠叨、责骂装聋作哑，或者干脆妻子回娘家去冷却怒火。冷战期间，美苏两大军事集团的争斗也是一种“斗鸡博弈”。在企业经营方面，在市场容量有限的条件下，一家企业投资了某一项目，另一家企业便会放弃对该项目的觊觎。    当然，“博弈论”中还有其他一些著名案例，这里无法一一加以剖析。上述的三大案例、尤其是前两大案例，已经成为经济学中的专用名词，成为经济学中对许多问题进行分析的分析支架。
3、博弈策略    博弈策略的成功运用须依赖一定的环境、条件，在一定的博弈框架中进行。    谈到博弈策略问题，可以说在我国传统文化中，包含有许多精妙的博弈策略。许多成语及成语典故，就是对博弈策略的令人叫绝的运用和归纳。如围魏救赵、背水一战、暗渡陈仓、釜底抽薪、狡兔三窟、先发制人、借鸡生蛋等等。当然，博弈策略的成功运用须依赖一定的环境、条件，在一定的博弈框架中进行。    在博弈中，人们经常采用威胁策略，但其他博弈方也会采取对威胁的辨别和反威胁策略。经济学家泽尔腾就将不可置信的威胁剔除出去，解决了一个博弈中可能存在多个“纳什均衡”的问题，从而使人们能方便地预测博弈的结果。举一个通俗的例子来说，父母不同意女儿所交的男友，威胁女儿说：“如果你再同他交往，我们就与你断绝关系。”但这样的威胁往往是不可信的。对爱情执着的聪明女儿会置父母的不可置信的威胁于不顾，继续与男友交往甚至最终与之结婚，父母最后也会承认那个当初他们并不喜欢的女婿。这个结果便是剔除了不可置信的威胁后的“纳什均衡”，“博弈论”中称其为“子博弈精炼纳什均衡”。    “博弈论”研究还发现，在重复博弈中，如果博弈的次数是无限的，博弈方会选择相互合作的策略。因为如果一家企业采取不合作的低价倾销策略，其他企业也会采取相同的策略进行报复性竞争，长期下去，这些企业都将完蛋。企业深谙此理后，便会在相互默契中将价格维持在一个合适水平，尽量避免长期性、大规模的低价杀伤战。美国水表生产的四大巨头企业(班琪表业等)在长达几十年的时期内都维持了这种定价方面的良好合作关系，成为“博弈论”中经常被提及的案例。    但如果重复博弈的次数较少，则合作就不可能实现。如生产彩电的某企业已决定转产而不再生产彩电，它就不会与其他彩电企业继续价格方面的合作，而可能对库存品低价甩卖，因为别的彩电企业对它没有报复的机会了。一些人在快调离原单位或快退休时的拙劣表现，也属此列(包括所谓的“59岁现象”)。
     再举一个生活中的例子：如果你去菜场买菜，当你对某种菜的质量、口味等有疑虑时，卖菜的阿姨常会讲：“你放心，我一直在这儿卖呢！”这句朴实的话中其实包含了华丽的“博弈论”思想：我卖与你们买是一个次数无限的重复博弈，我今天骗了你，你们今后就不会再来我这儿买了，所以我不会骗你的，菜的质量、口味肯定没问题。而你在听了阿姨的上述一句话后，常常也会打消疑虑，买菜回家。    在博弈中，人们掌握的信息经常是不完全的，这就需要在博弈进行过程(即动态博弈)中不断地收集信息、积累知识、修正判断。成语故事“黔驴技穷”实际上就包含了一个不完全信息动态博弈。毛驴刚到贵州时，老虎摸不准这个大动物究竟有多大本领，因而躲在树林里偷偷观察，这在老虎当时拥有的信息条件下是一种最优策略选择。过了一阵子，老虎走出树林，逐渐接近毛驴，就是想获得有关毛驴的进一步信息。一天，毛驴大叫一声，老虎吓了一跳，急忙逃走，这也是最优策略选择。又过了一些天，老虎又来观察，并对毛驴挨得很近，往毛驴身上挤碰，故意挑衅它。毛驴在忍无可忍的情况下，就用蹄子踢老虎，除此之外，别无它法。老虎最终了解到毛驴的真实本领后，就扑过去将它吃了。在这个故事里，老虎通过观察毛驴的行为逐渐修正对毛驴的看法，直到看清它的真面目。事实上，毛驴的策略也是正确的，它知道自己的技能有限，总想掩藏自己的真实技能。老虎吃掉毛驴的策略，在“博弈论”中就是所谓的“精炼贝叶斯均衡”。    人们常提到的“上有政策、下有对策”，其实是对管理者与被管理者之间的动态博弈的一种描述，面对上边的政策，下边寻求对策是正常的、必然的。从“博弈论”的角度讲，上边的政策制定必须在考虑到下边可能会有的对策的基础上进行，否则，政策就不会是科学、合理的。    从以上对“博弈论”简要、通俗的介绍中可以发现，我们身边充满了博弈，或者说，我们身边的许多行为、现象都可用博弈来概括。“博弈论”不仅属于经济学，也理应属于社会学、政治学、心理学、历史学等，这些学科也有理由分享“博弈论”那旖旎的学术风光和精细的分析技巧。＜案例二：智猪博弈＞

　　这个例子讲的是，猪圈里有两头猪，一大一小．猪圈的一头有一个猪食槽，另一头安装一个按钮，控制着猪食的供应。按一下按钮会有１０个单位的猪食进槽，但谁按按钮需要付２个单位的成本．若大猪先到，大猪吃到９个单位，小猪只能吃１个单位；若同时到，大猪吃７个单位，小猪吃３个单位；若小猪先到，大猪吃６个单位，小猪吃４个单位。表中第一格表示两猪同时按按钮，因而同时走到猪食槽，大猪吃７个，小猪吃３个，扣除２个单位的成本，支付水平分别为５和１．其他情形可以类推．

　　在这个例子中，什么是纳什均衡？首先我们注意到，无论大猪选择＂按＂还是＂等待＂，小猪的最优选择均是＂等待＂．比如说给定大猪按，小猪也按时得到１个单位，等待则得到４个单位；给定大猪等待，小猪按得到－１单位，等待则得０单位，所以，＂等待＂是小猪的占优战略．给定小猪总是选择＂等待＂，大猪的最优选择只能是＂按＂．所以，纳什均衡就是：大猪按，小猪等待，各得４个单位．多劳者不多得！

　　＜案例三：性别战＞

　　这个例子讲的是一男一女谈恋爱，有些业余活动要安排，或者去看足球比赛，或者去看芭蕾舞演出．男的偏好足球，女的则更喜欢芭蕾，但他们都宁愿在一起，不愿分开。这个博弈中，有两个纳什均衡：（足球，足球）（芭蕾，芭蕾）．就是说，给定一方去足球场，另一方也会去足球场；类似的，给定一方去看芭蕾舞，另一方也会去看芭蕾舞．那么，究竟哪一个纳什均衡会实际发生？我们不知道．只有看实际生活了．

　　＜案例四：斗鸡博弈＞

　　设想两个人举着火棍从独木桥的两端走向中央进行火拼，每个人都有两种战略：继续前进，或退下阵来．若两人都继续前进，则两败俱伤；若一方前进另一方退下来，前进者取得胜利，退下来的丢了面子；若两人都退下来，两人都丢面子．这个博弈里也有两个均衡：如果一方进，另一方的最优战略就是退。两人都进或退都不是纳什均衡。

　　＜案例五：市场进入阻挠＞
　　这是产业组织经济学中的一个例子．设想有一个垄断企业已在市场上（称为＂在位者＂），另一个企业虎视眈眈想进入（＂进入者＂）．在位者想保持自己的垄断地位，所以就要阻挠进入者进入．

　　在这个博弈中，进入者有两种战略可以选择：进入还是不进入；在位者也有两种战略：默许或斗争．假定进入之前垄断利润为３００，进入之后寡头利润合为１００（各得５０），进入成本为１０．各种战略组合下的支付矩阵亦可列表．这个博弈中也有两个纳什均衡，即（进入，默许），（不进入，斗争）．为什么（进入，默许）是纳什均衡？因为给定进入者进入，在位者选择默许时得５０单位利润，选择斗争时得不到利润，所以，最优战略是默许。类似的，给定在位者选择默许，进入者的最优战略就是进入．尽管在进入者选择不进入时，默许和斗争对在位者是一个意思，只有当在位者选择斗争时，不进入才是进入者的最优选择，所以，（不进入，斗争）是一个纳什均衡，而（不进入，默许）不是一个纳什均衡。

　　＜案例六：承诺行动＞
　　现实中我们知道存在很多不可置信的威胁，而如何令不可置信的威胁变的真正具有威胁能力呢？那就要引入＂承诺行动＂这个概念。

　　承诺行动是当事人使自己的威胁战略变的可置信的行动．一种威胁在什么时候才是可置信的？答案是，只有当事人在不实行这种威胁时，就会遭受更大的损失的时候．所以说，承诺行动意味着当事人要为自己的＂失信＂付出成本，尽管这种成本并不一定真的发生．但承诺行动会给当事人带来很大的好处，因为它会改变均衡结果．举例说，在市场进入博弈中，如果在位者通过某种承诺行动使自己的＂斗争＂威胁变的可置信，进入者就不敢进入，在位者可以获得更多的利润．一种简单的方法是，在位者与某个第三者打个赌：如果进入者进入后他不斗争，他就付给后者１００．这时，斗争就变成了一种可置信的威胁．因为，如果进入后不斗争而是选择默许，在位者得到５０的寡头利润，去掉１００的赌注，净得－５０；而若选择＂斗争＂，利润为０，所以斗争比合作好．注意，有了这个赌，进入者就不敢进入了，在位者实际上无需支付１００的赌注，却得到３００垄断利润（在这个例子中，承诺行动的实际成本为０，但一般来说，承诺行动的成本不为零．而且，承诺行动的成本越高，威胁就越值得置信）．

博弈论案例篇(2):博弈论案例分析

博弈论案例分析庚甲发表于2010年02月27日 18:06 阅读(12) 评论(0) 分类：个人日记
举报博弈论分析　　一、经济学中的“智猪博弈”（Pigs’payoffs）　　这个例子讲的是：猪圈里有两头猪，一头大猪，一头小猪。猪圈的一边有个踏板，每踩一下踏板，在远离踏板的猪圈的另一边的投食口就会落下少量的食物。如果有一只猪去踩踏板，另一只猪就有机会抢先吃到另一边落下的食物。当小猪踩动踏板时，大猪会在小猪跑到食槽之前刚好吃光所有的食物；若是大猪踩动了踏板，则还有机会在小猪吃完落下的食物之前跑到食槽，争吃到另一半残羹。
　　那么，两只猪各会采取什么策略？答案是：小猪将选择“搭便车”策略，也就是舒舒服服地等在食槽边；而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。
　　原因何在？因为，小猪踩踏板将一无所获，不踩踏板反而能吃上食物。对小猪而言，无论大猪是否踩动踏板，不踩踏板总是好的选择。反观大猪，已明知小猪是不会去踩动踏板的，自己亲自去踩踏板总比不踩强吧，所以只好亲力亲为了。
　　“小猪躺着大猪跑”的现象是由于故事中的游戏规则所导致的。规则的核心指标是：每次落下的事物数量和踏板与投食口之间的距离。
　　如果改变一下核心指标，猪圈里还会出现同样的“小猪躺着大猪跑”的景象吗？试试看。
　　改变方案一：减量方案。投食仅原来的一半分量。结果是小猪大猪都不去踩踏板了。小猪去踩，大猪将会把食物吃完；大猪去踩，小猪将也会把食物吃完。谁去踩踏板，就意味着为对方贡献食物，所以谁也不会有踩踏板的动力了。
　　如果目的是想让猪们去多踩踏板，这个游戏规则的设计显然是失败的。
　　改变方案二：增量方案。投食为原来的一倍分量。结果是小猪、大猪都会去踩踏板。谁想吃，谁就会去踩踏板。反正对方不会一次把食物吃完。小猪和大猪相当于生活在物质相对丰富的“共产主义”社会，所以竞争意识却不会很强。
　　对于游戏规则的设计者来说，这个规则的成本相当高（每次提供双份的食物）；而且因为竞争不强烈，想让猪们去多踩踏板的效果并不好。
　　改变方案三：减量加移位方案。投食仅原来的一半分量，但同时将投食口移到踏板附近。结果呢，小猪和大猪都在拼命地抢着踩踏板。等待者不得食，而多劳者多得。每次的收获刚好消费完。
　　对于游戏设计者，这是一个最好的方案。成本不高，但收获最大。
　　原版的“智猪博弈”故事给了竞争中的弱者（小猪）以等待为最佳策略的启发。但是对于社会而言，因为小猪未能参与竞争，小猪搭便车时的社会资源配置的并不是最佳状态。为使资源最有效配置，规则的设计者是不愿看见有人搭便车的，政府如此，公司的老板也是如此。而能否完全杜绝“搭便车”现象，就要看游戏规则的核心指标设置是否合适了。
　　比如，公司的激励制度设计，奖励力度太大，又是持股，又是期权，公司职员个个都成了百万富翁，成本高不说，员工的积极性并不一定很高。这相当于“智猪博弈”增量方案所描述的情形。但是如果奖励力度不大，而且见者有份（不劳动的“小猪”也有），一度十分努力的大猪也不会有动力了----就象“智猪博弈”减量方案一所描述的情形。最好的激励机制设计就象改变方案三----减量加移位的办法，奖励并非人人有份，而是直接针对个人（如业务按比例提成），既节约了成本（对公司而言），又消除了“搭便车”现象，能实现有效的激励。
　　许多人并未读过“智猪博弈”的故事，但是却在自觉地使用小猪的策略。股市上等待庄家抬轿的散户；等待产业市场中出现具有赢利能力新产品、继而大举仿制牟取暴利的游资；公司里不创造效益但分享成果的人，等等。因此，对于制订各种经济管理的游戏规则的人，必须深谙“智猪博弈”指标改变的个中道理。
　　二、囚徒困境博弈　　在博弈论中，含有占优战略均衡的一个著名例子是由塔克给出的“囚徒困境”（prisoners’ dilemma）博弈模型。该模型用一种特别的方式为我们讲述了一个警察与小偷的故事。假设有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯，对每一个犯罪嫌疑人，警方给出的政策是：如果一个犯罪嫌疑人坦白了罪行，交出了赃物，于是证据确凿，两人都被判有罪。如果另一个犯罪嫌疑人也作了坦白，则两人各被判刑8年；如果另一个犯罪嫌人没有坦白而是抵赖，则以妨碍公务罪（因已有证据表明其有罪）再加刑2年，而坦白者有功被减刑8年，立即释放。如果两人都抵赖，则警方因证据不足不能判两人的偷窃罪，但可以私入民宅的罪名将两人各判入狱1年。下表给出了这个博弈的支付矩阵。
　　表囚徒困境博弈 [Prisoner"s dilemma]
B　坦白　 B　抵赖 A　　坦白 –8, –8 　0, –10 A　　抵赖 –10, 0　 –1, –1
　　我们来看看这个博弈可预测的均衡是什么。对A来说，尽管他不知道B作何选择，但他知道无论B选择什么，他选择“坦白”总是最优的。显然，根据对称性，B也会选择“坦白”，结果是两人都被判刑8年。但是，倘若他们都选择“抵赖”，每人只被判刑1年。在表2.2中的四种行动选择组合中，（抵赖、抵赖）是帕累托最优的，因为偏离这个行动选择组合的任何其他行动选择组合都至少会使一个人的境况变差。不难看出，“坦白”是任一犯罪嫌疑人的占优战略，而（坦白，坦白）是一个占优战略均衡。
　　要了解纳什的贡献，首先要知道什么是非合作博弈问题。现在几乎所有的博弈论教科书上都会讲“囚犯的两难处境”的例子，每本书上的例子都大同小异。
　　博弈论毕竟是数学，更确切地说是运筹学的一个分支，谈经论道自然少不了数学语言，外行人看来只是一大堆数学公式。好在博弈论关心的是日常经济生活问题，所以不能不食人间烟火。其实这一理论是从棋弈、扑克和战争等带有竞赛、对抗和决策性质的问题中借用的术语，听上去有点玄奥，实际上却具有重要现实意义。博弈论大师看经济社会问题犹如棋局，常常寓深刻道理于游戏之中。所以，多从我们的日常生活中的凡人小事入手，以我们身边的故事做例子，娓娓道来，并不乏味。
　　话说有一天，一位富翁在家中被杀，财物被盗。警方在此案的侦破过程中，抓到两个犯罪嫌疑人，斯卡尔菲丝和那库尔斯，并从他们的住处搜出被害人家中丢失的财物。但是，他们矢口否认曾杀过人，辩称是先发现富翁被杀，然后只是顺手牵羊偷了点儿东西。于是警方将两人隔离，分别关在不同的房间进行审讯。由地方检察官分别和每个人单独谈话。
　　检察官说，“由于你们的偷盗罪已有确凿的证据，所以可以判你们一年刑期。但是，我可以和你做个交易。如果你单独坦白杀人的罪行，我只判你三个月的监禁，但你的同伙要被判十年刑。如果你拒不坦白，而被同伙检举，那么你就将被判十年刑，他只判三个月的监禁。但是，如果你们两人都坦白交代，那么，你们都要被判5年刑。”斯卡尔菲丝和那库尔斯该怎么办呢？他们面临着两难的选择——坦白或抵赖。显然最好的策略是双方都抵赖，结果是大家都只被判一年。但是由于两人处于隔离的情况下无法串供。所以，按照亚当·斯密的理论，每一个人都是从利己的目的出发，他们选择坦白交代是最佳策略。因为坦白交代可以期望得到很短的监禁———3个月，但前提是同伙抵赖，显然要比自己抵赖要坐10年牢好。这种策略是损人利己的策略。不仅如此，坦白还有更多的好处。如果对方坦白了而自己抵赖了，那自己就得坐10年牢。太不划算了！因此，在这种情况下还是应该选择坦白交代，即使两人同时坦白，至多也只判5年，总比被判 10年好吧。所以，两人合理的选择是坦白，原本对双方都有利的策略(抵赖)和结局(被判1年刑)就不会出现。
　　这样两人都选择坦白的策略以及因此被判5年的结局被称为“纳什均衡”，也叫非合作均衡。因为，每一方在选择策略时都没有“共谋”(串供)，他们只是选择对自己最有利的策略，而不考虑社会福利或任何其他对手的利益。也就是说，这种策略组合由所有局中人(也称当事人、参与者)的最佳策略组合构成。没有人会主动改变自己的策略以便使自己获得更大利益。“囚徒的两难选择”有着广泛而深刻的意义。个人理性与集体理性的冲突，各人追求利己行为而导致的最终结局是一个“纳什均衡”，也是对所有人都不利的结局。他们两人都是在坦白与抵赖策略上首先想到自己，这样他们必然要服长的刑期。只有当他们都首先替对方着想时，或者相互合谋(串供)时，才可以得到最短时间的监禁的结果。“纳什均衡”首先对亚当·斯密的“看不见的手”的原理提出挑战。按照斯密的理论，在市场经济中，每一个人都从利己的目的出发，而最终全社会达到利他的效果。
　　不妨让我们重温一下这位经济学圣人在《国富论》中的名言：“通过追求(个人的)自身利益，他常常会比其实际上想做的那样更有效地促进社会利益。”从“纳什均衡”我们引出了“看不见的手”的原理的一个悖论：从利己目的出发，结果损人不利己，既不利己也不利他。两个囚徒的命运就是如此。从这个意义上说，“纳什均衡”提出的悖论实际上动摇了西方经济学的基石。因此，从“纳什均衡”中我们还可以悟出一条真理：合作是有利的“利己策略”。但它必须符合以下黄金律：按照你愿意别人对你的方式来对别人，但只有他们也按同样方式行事才行。也就是中国人说的“己所不欲勿施于人”。但前提是人所不欲勿施于我。其次，“纳什均衡”是一种非合作博弈均衡，在现实中非合作的情况要比合作情况普遍。所以“纳什均衡”是对冯·诺依曼和摩根斯特恩的合作博弈理论的重大发展，甚至可以说是一场革命。
　　从“纳什均衡”的普遍意义中我们可以深刻领悟司空见惯的经济、社会、政治、国防、管理和日常生活中的博弈现象。我们将例举出许多类似于“囚徒的两难处境” 这样的例子。如价格战博弈、军奋竞赛博弈、污染博弈等等。一般的博弈问题由三个要素所构成：即局中人(players)又称当事人、参与者、策略等等的集合，策略 (strategies)集合以及每一对局中人所做的选择和赢得(payoffs)集合。其中所谓赢得是指如果一个特定的策略关系被选择，每一局中人所得到的效用。所有的博弈问题都会遇到这三个要素。
美国密西根大学一位叫做罗伯特·爱克斯罗德的人。爱克斯罗德是一个政治科学家，他组织了一场计算机竞赛。这个竞赛的思路非常简单：任何想参加这个计算机竞赛的人都扮演“囚徒困境”案例中一个囚犯的角色。他们把自己的策略编入计算机程序，然后他们的程序会被成双成对地融入不同的组合。分好组以后，参与者就开始玩“囚徒困境”的游戏。他们每个人都要在合作与背叛之间做出选择。关键问题在于，他们不只玩一遍这个游戏，而是一遍一遍地玩上200次。这就是博弈论专家所谓的“重复的囚徒困境”。　　“重复的囚徒困境”更逼真地反映了具有经常而长期性的人际关系。而且，这种重复的游戏允许程序在做出合作或背叛的抉择时参考对手程序前几次的选择。如果两个程序只玩过一个回合，则背叛显然就是唯一理性的选择。但如果两个程序已经交手过多次，则双方就建立了各自的历史档案，用以记录与对手的交往情况。同时，它们各自也通过多次的交手树立了或好或差的声誉。虽然如此，对方的程序下一步将会如何举动却仍然极难确定。实际上，这也是该竞赛的组织者爱克斯罗德希望从这个竞赛中了解的事情之一。一个程序总是不管对手作何种举动都采取合作的态度吗？或者，它能总是采取背叛行动吗？它是否应该对对手的举动回之以更为复杂的举措？如果是，那会是怎么样的举措呢？　　事实上，竞赛的第一个回合交上来的14个程序中包含了各种复杂的策略。但使爱克斯罗德和其他人深为吃惊的是，竞赛的桂冠属于其中最简单的策略：一报还一报。我把它叫做“以其人之道，还治其人之身”。　　“一报还一报”的策略是这样的：它总是以合作开局，但从此以后就采取以其人之道还治其人之身的策略。也就是说，一报还一报的策略实行了胡萝卜加大棒的原则。它永远不先背叛对方，从这个意义上来说它是“善意的”。它会在下一轮中对对手的前一次合作给予回报（哪怕以前这个对手曾经背叛过它），从这个意义上来说它是“宽容的”。但它会采取背叛的行动来惩罚对手前一次的背叛，从这个意义上来说它又是“强硬的”。而且，它的策略极为简单，对手程序一望便知其用意何在，从这个意义来说它又是“简单明了的”。
　　三、价格战博弈　　现在我们经常会遇到各种各样的家电价格大战，彩电大战、冰箱大战、空调大战、微波炉大战……这些大战的受益者首先是消费者。每当看到一种家电产品的价格大战，百姓都会“没事儿偷着乐”。在这里，我们可以解释厂家价格大战的结局也是一个“纳什均衡”，而且价格战的结果是谁都没钱赚。因为博弈双方的利润正好是零。竞争的结果是稳定的，即是一个“纳什均衡”。这个结果可能对消费者是有利的，但对厂商而言是灾难性的。所以，价格战对厂商而言意味着自杀。从这个案例中我们可以引伸出两个问题，一是竞争削价的结果或“纳什均衡”可能导致一个有效率的零利润结局。二是如果不采取价格战，作为一种敌对博弈论 (vivalry game)其结果会如何呢？每一个企业，都会考虑采取正常价格策略，还是采取高价格策略形成垄断价格，并尽力获取垄断利润。如果垄断可以形成，则博弈双方的共同利润最大。这种情况就是垄断经营所做的，通常会抬高价格。另一个极端的情况是厂商用正常的价格，双方都可以获得利润。从这一点，我们又引出一条基本准则：“把你自己的战略建立在假定对手会按其最佳利益行动的基础上”。事实上，完全竞争的均衡就是“纳什均衡”或“非合作博弈均衡”。在这种状态下，每一个厂商或消费者都是按照所有的别人已定的价格来进行决策。在这种均衡中，每一企业要使利润最大化，消费者要使效用最大化，结果导致了零利润，也就是说价格等于边际成本。在完全竞争的情况下，非合作行为导致了社会所期望的经济效率状态。如果厂商采取合作行动并决定转向垄断价格，那么社会的经济效率就会遭到破坏。这就是为什么WTO和各国政府要加强反垄断的意义所在。
　　四、污染博弈：　　假如市场经济中存在着污染，但政府并没有管制的环境，企业为了追求利润的最大化，宁愿以牺牲环境为代价，也绝不会主动增加环保设备投资。按照看不见的手的原理，所有企业都会从利己的目的出发，采取不顾环境的策略，从而进入“纳什均衡”状态。如果一个企业从利他的目的出发，投资治理污染，而其他企业仍然不顾环境污染，那么这个企业的生产成本就会增加，价格就要提高，它的产品就没有竞争力，甚至企业还要破产。这是一个“看不见的手的有效的完全竞争机制”失败的例证。直到20世纪90年代中期，中国乡镇企业的盲目发展造成严重污染的情况就是如此。只有在政府加强污染管制时，企业才会采取低污染的策略组合。企业在这种情况下，获得与高污染同样的利润，但环境将更好。
　　五、贸易战博弈论　　这个问题对于刚刚加入WTO的中国而言尤为重要。任何一个国家在国际贸易中都面临着保持贸易自由与实行贸易保护主义的两难选择。贸易自由与壁垒问题，也是一个“纳什均衡”，这个均衡是贸易双方采取不合作博弈的策略，结果使双方因贸易战受到损害。X国试图对Y国进行进口贸易限制，比如提高关税，则Y国必然会进行反击，也提高关税，结果谁也没有捞到好处。反之，如X和Y能达成合作性均衡，即从互惠互利的原则出发，双方都减少关税限制，结果大家都从贸易自由中获得了最大利益，而且全球贸易的总收益也增加了。
　　博弈论--这是一个热得烫手的概念。它不仅仅存在于数学的运筹学中，也正在经济学中占据越来越重要的地位（近几年诺贝尔经济学奖就频频授予博弈论研究者），但如果你认为博弈论的应用领域仅限于此的话，那你就大错了。实际上，博弈论甚至在我们的工作和生活中无处不在！在工作中，你在和上司博弈，也在和下属博弈，你也同样会跟其他相关部门人员博弈；而要开展业务，你更是在和你的客户以及竞争对手博弈。在生活中，博弈仍然无处不在。博弈论代表着一种全新的分析方法和全新的思想。
　　诺贝尔经济学奖获得者包罗·萨缪尔逊如是说：要想在现代社会做个有价值的人,你就必须对博弈论有个大致的了解。也可以这样说,要相赢得生意,不可不学博弈论;要想赢得生活,同样不可不学博弈论。弈中最优策略的产生　　艾克斯罗德（Robert Axelrod）在开始研究合作之前，设定了两个前提：一、每个人都是自私的；二、没有权威干预个人决策。也就是说，个人可以完全按照自己利益最大化的企图进行决策。在此前提下，合作要研究的问题是：第一、人为什么要合作；第二、人什么时候是合作的，什么时候又是不合作的；第三、如何使别人与你合作。
　　社会实践中有很多合作的问题。比如国家之间的关税报复，对他国产品提高关税有利于保护本国的经济，但是国家之间互提关税，产品价格就提高了，丧失了竞争力，损害了国际贸易的互补优势。在对策中，由于双方各自追求自己利益的最大化，导致了群体利益的损害。对策论以著名的囚犯困境来描述这个问题。
　　A和B各表示一个人，他们的选择是完全无差异的。选择C代表合作，选择D代表不合作。如果AB都选择C合作，则两人各得3分；如果一方选C，一方选D，则选C的得零分，选D的得5分；如果AB都选D，双方各得1分。
　　显然，对群体来说最好的结果是双方都选C，各得3分，共得6分。如果一方选C，一方选D，总体得5分。如果两人都选D，总体得2分。
　　对策学界用这个矩阵来描述个体理性与群体理性的冲突：每个人在追求个体利益最大化时，就使群体利益受损，这就是囚徒困境。在矩阵中，对于A来说，当对方选 C，他选D得5分，选C只得3分；当对方选D，他选D得1分，选C得零分。因此，无论对方选C或D，对A来说，选D都得分最多。这是A单方面的优超策略。而当两个优超策略相遇，即A，B都选D时，结果是各得1分。这个结果在矩阵中并非最优。困境就在于，每个人采取各自的优超策略时，得出的解是稳定的，但不是帕累托最优的，这个结果体现了个体理性与群体理性的矛盾。在数学上，这个一次性决策的矩阵没有最优解。
　　如果博弈进行多次，只要对策者知道博弈次数，他们在最后一次肯定采取互相背叛的策略。既然如此，前面的每一次也就没有合作的必要，因此，在次数已知的多次博弈中，对策者没有一次会合作。
　　如果博弈在多人间进行，而且次数未知，对策者就会意识到，当持续地采取合作并达成默契时，对策者就能持续地各得3分，但如果持续地不合作的话，每个人就永远得1分。这样，合作的动机就显现出来。多次对局下，未来的收益应比现在的收益多一个折现率W，W越大，表示未来的收益越重要。在多人对策持续进行下去，且W比较大，即未来充分重要时，最优的策略是与别人采取的策略有关的。假设某人的策略是，第一次合作，以后只要对方不合作一次，他就永不合作。对这种对策者，当然合作下去是上策。假如有的人不管对方采取什么策略，他总是合作，那么总是对他采取不合作的策略得分最多。对于总是不合作的人，也只能采取不合作的策略。
　　艾克斯罗德做了一个实验，邀请多人来参加游戏，得分规则与前面的矩阵相同，什么时候结束游戏是未知的。他要求每个参赛者把追求得分最多的策略写成计算机程序，然后用单循环赛的方式将参赛程序两两博弈，以找出什么样的策略得分最高。
　　第一轮游戏有14个程序参加，再加上艾克斯罗德自己的一个随机程序(即以50%的概率选取合作或不合作)，运转了300次。结果得分最高的程序是加拿大学者罗伯布写的"一报还一报"(tit for tat)。这个程序的特点是，第一次对局采用合作的策略，以后每一步都跟随对方上一步的策略，你上一次合作，我这一次就合作，你上一次不合作，我这一次就不合作。艾克斯罗德还发现，得分排在前面的程序有三个特点：第一，从不首先背叛，即"善良的"；第二，对于对方的背叛行为一定要报复，不能总是合作，即" 可激怒的"；第三，不能人家一次背叛，你就没完没了的报复，以后人家只要改为合作，你也要合作，即"宽容性"。
　　为了进一步验证上述结论，艾氏决定邀请更多的人再做一次游戏，并把第一次的结果公开发表。第二次征集到了62个程序，加上他自己的随机程序，又进行了一次竞赛。结果，第一名的仍是"一报还一报"。艾氏总结这次游戏的结论是：第一，"一报还一报"仍是最优策略。第二，前面提到的三个特点仍然有效，因为63人中的前15名里，只有第8名的哈灵顿程序是"不善良的"，后15名中，只有1个总是合作的是"善良的"。可激怒性和宽容性也得到了证明。此外，好的策略还必须具有的一个特点是"清晰性"，能让对方在三、五步对局内辨识出来，太复杂的对策不见得好。"一报还一报"就有很好的清晰性，让对方很快发现规律，从而不得不采取合作的态度。
[编辑]合作的进行过程及规律　　"一报还一报"的策略在静态的群体中得到了很好的分数，那么，在一个动态的进化的群体中，这种合作者能否产生、发展、生存下去呢？群体是会向合作的方向进化，还是向不合作的方向进化？如果大家开始都不合作，能否在进化过程中产生合作？为了回答这些疑问，艾氏用生态学的原理来分析合作的进化过程。
　　假设对策者所组成的策略群体是一代一代进化下去的，进化的规则包括：一，试错。人们在对待周围环境时，起初不知道该怎么做，于是就试试这个，试试那个，哪个结果好就照哪个去做。第二，遗传。一个人如果合作性好，他的后代的合作基因就多。第三，学习。比赛过程就是对策者相互学习的过程，"一报还一报"的策略好，有的人就愿意学。按这样的思路，艾氏设计了一个实验，假设63个对策者中，谁在第一轮中的得分高，他在第二轮的群体中所占比例就越高，而且是他的得分的正函数。这样，群体的结构就会在进化过程中改变，由此可以看出群体是向什么方向进化的。
　　实验结果很有趣。"一报还一报"原来在群体中占1/63，经过1000代的进化，结构稳定下来时，它占了24%。另外，有一些程序在进化过程中消失了。其中有一个值得研究的程序，即原来前15名中唯一的那个"不善良的"哈灵顿程序，它的对策方案是，首先合作，当发现对方一直在合作，它就突然来个不合作，如果对方立刻报复它，它就恢复合作，如果对方仍然合作，它就继续背叛。这个程序一开始发展很快，但等到除了"一报还一报"之外的其它程序开始消失时，它就开始下降了。因此，以合作系数来测量，群体是越来越合作的。
　　进化实验揭示了一个哲理：一个策略的成功应该以对方的成功为基础。"一报还一报"在两个人对策时，得分不可能超过对方，最多打个平手，但它的总分最高。它赖以生存的基础是很牢固的，因为它让对方得到了高分。哈灵顿程序就不是这样，它得到高分时，对方必然得到低分。它的成功是建立在别人失败的基础上的，而失败者总是要被淘汰的，当失败者被淘汰之后，这个好占别人便宜的成功者也要被淘汰。
　　那么，在一个极端自私者所组成的不合作者的群体中，"一报还一报"能否生存呢？艾氏发现，在得分矩阵和未来的折现系数一定的情况下，可以算出，只要群体的 5%或更多成员是"一报还一报"的，这些合作者就能生存，而且，只要他们的得分超过群体的总平均分，这个合作的群体就会越来越大，最后蔓延到整个群体。反之，无论不合作者在一个合作者占多数的群体中有多大比例，不合作者都是不可能自下而上的。这就说明，社会向合作进化的棘轮是不可逆转的，群体的合作性越来越大。艾克斯罗德正是以这样一个鼓舞人心的结论，突破了"囚犯困境"的研究困境。
　　在研究中发现，合作的必要条件是：第一、关系要持续，一次性的或有限次的博弈中，对策者是没有合作动机的；第二、对对方的行为要做出回报，一个永远合作的对策者是不会有人跟他合作的。
　　那么，如何提高合作性呢？首先，要建立持久的关系，即使是爱情也需要建立婚姻契约以维持双方的合作。（火车站的小贩为什么要骗人？为什么工作中要形成小组制度？换防的时候一方总是要小小地进攻一下的，在中越前线就是这样）第二、要增强识别对方行动的能力，如果不清楚对方是合作还是不合作，就没法回报他了。第三、要维持声誉，说要报复就一定要做到，人家才知道你是不好欺负的，才不敢不与你合作。第四、能够分步完成的对局不要一次完成，以维持长久关系，比如，贸易、谈判都要分步进行，以促使对方采取合作态度。第五、不要嫉妒人家的成功，"一报还一报"正是这样的典范。第六、不要首先背叛，以免担上罪魁祸首的道德压力。第七、不仅对背叛要回报，对合作也要作出回报。第八、不要耍小聪明，占人家便宜。
　　艾克斯罗德在《合作的进化》一书结尾提出几个结论。第一、友谊不是合作的必要条件，即使是敌人，只要满足了关系持续，互相回报的条件，也有可能合作。比如，第一次世界大战期间，德英两军在战壕战中遇上了三个月的雨季，双方在这三个月中达成了默契，互相不攻击对方的粮车给养，到大反攻时再你死我活地打。这个例子说明，友谊不是合作的前提。第二、预见性也不是合作的前提，艾氏举出生物界低等动物、植物之间合作的例子来说明这一点。但是，当有预见性的人类了解了合作的规律之后，合作进化的过程就会加快。这时，预见性是有用的，学习也是有用的。
　　当游戏中考虑到随机干扰，即对策者由于误会而开始互相背叛的情形时，吴坚忠博士经研究发现，以修正的"一报还一报"，即以一定的概率不报复对方的背叛，和 "悔过的一报还一报"，即以一定的概率主动停止背叛。群体所有成员处理随机环境的能力越强，"悔过的一报还一报"效果越好，"宽大的一报还一报"效果越差。
[编辑]艾克斯罗德的贡献与局限性　　艾克斯罗德通过数学化和计算机化的方法研究如何突破囚徒困境，达成合作，将这项研究带到了一个全新境界，他在数学上的证明无疑是十分雄辩和令人信服的，而且，他在计算机模拟中得出的一些结论是非常惊人的发现，比如，总分最高的人在每次博弈中都没有拿到最高分。（刘邦和项羽的战争）
　　艾氏所发现的"一报还一报"策略，从社会学的角度可以看作是一种"互惠式利他"，这种行为的动机是个人私利，但它的结果是双方获利，并通过互惠式利他有可能覆盖了范围最广的社会生活，人们通过送礼及回报，形成了一种社会生活的秩序，这种秩序即使在多年隔绝，语言不通的人群之间也是最易理解的东西。比如，哥伦布登上美洲大陆时，与印地安人最初的交往就开始于互赠礼物。有些看似纯粹的利他行为，比如无偿损赠，也通过某些间接方式，比如社会声誉的获得，得到了回报。研究这种行为，将对我们理解社会生活有很重要的意义。
　　囚徒困境扩展为多人博弈时，就体现了一个更广泛的问题──"社会悖论"，或"资源悖论"。人类共有的资源是有限的，当每个人都试图从有限的资源中多拿一点儿时，就产生了局部利益与整体利益的冲突。人口问题、资源危机、交通阻塞，都可以在社会悖论中得以解释，在这些问题中，关键是通过研究，制定游戏规则来控制每个人的行为。
　　艾克斯罗德的一些结论在中国古典文化道德传统中可以很容易地找到对应，"投桃报李"、"人不犯我，我不犯人"都体现了"tit for tat"的思想。但这些东西并不是最优的，因为"一报还一报"在充满了随机性的现实社会生活里是有缺陷的。对此，孔子在几千年前就说出了"以德报德，以直报怨"这样精彩的修正策略，所谓"直"，就是公正，以公正来回报对方的背叛，是一种修正了的"一报还一报"，修正的是报复的程度，本来会让你损失5分，现在只让你损失3分，从而以一种公正审判来结束代代相续的报复，形成文明。
　　但是，艾氏对博弈者的一些假设和结论使其研究不可避免地与现实脱节。首先，《合作的进化》一书暗含着一个重要的假定，即，个体之间的博弈是完全无差异的。现实的博弈中，对策者之间绝对的平等是不可能达到的。一方面，对策者在实际的实力上有差异，双方互相背叛时，可能不是各得1分，而是强者得5分，弱者得0分，这样，弱者的报复就毫无意义。另一方面，即使对局双方确实旗鼓相当，但某一方可能怀有赌徒心理，认定自己更强大，采取背叛的策略能占便宜。艾氏的得分矩阵忽视了这种情形，而这种赌徒心理恰恰在社会上大量引发了零和博弈。因此，程序还可以在此基础上进一步改进。
　　其次，艾氏认为合作不需预期和信任。这是他受到质疑颇多之处。对策者根据对方前面的战术来制定自己下面的战术，合作要求个体能够识别那些曾经相遇过的个体并且记得与其相互作用的历史，以便作出反应，这些都暗含着"预期"行为。在应付复杂的对策环境时，信任可能是对局双方达成合作的必不可少的环节。但是，预期与信任如何在计算机的程序中体现出来，仍是需要研究的。
　　最后，重复博弈在现实中是很难完全实现的。一次性博弈的大量存在，引发了很多不合作的行为，而且，对策的一方在遭到对方背叛之后，往往没有机会也没有还手之力去进行报复。比如，资本积累阶段的违约行为，国家之间的核威慑。在这些情况下，社会要使交易能够进行，并且防止不合作行为，必须通过法制手段，以法律的惩罚代替个人之间的"一报还一报"，规范社会行为。这是艾克斯罗德的研究对制度学派的一个重要启发。
[编辑]博弈论案例分析 [编辑]案例一:博弈论在企业人力资本投资中的应用[1] 　　一、引言
　　一个企业能否在市场中取得经济优势,依赖于企业科技优势、产品的市场适应性等等,而这一切又源于人才优势。因此,一个企业面临着如何尽可能地保持自己人力资源的优势,如何吸引优秀人才加入企业添加新动力,如何有效培训使己有员工获得技能的提高,如何使员工适应外部环境变化的要求,如何有效挽留公司的核心人才等等。但是统计调查显示,我国的培训现状不尽如人意。总体来看,我国企业培训管理的制度化、规范化程度有待加强,培训计划执行不力,培训效果跟踪与评价环节薄弱,培训对改善员工绩效的效用没有发挥,培训结果与员工晋升没有太大影响等。造成这种现状的原因固然是多方面的,其中一个主要原因就是人力资本投资收益的滞后性和不确定性,担心员工“硬了翅膀就飞走”,得不偿失。企业是否增加人力资本投资,员工是否留任企业,都是利益的博弈,结果是选择有利于自己的战略。本文用博弈论对企业人力资本投资作分析,说明企业应当进行人力资本投资和投资后应采取措施保证人力资本投资收益的获取。
　　二、概念和假定
　　1.概念界定
　　①人力资本。人力资本是通过投资于已有人力资源而形成的、以复杂劳动力为载体的、能实现价值增值的可变资本。
　　②企业人力资本投资。企业人力资本投资是指企业通过一定的投入(货币、资本或实物)获得人力资源,增加企业员工的知识、技能、健康水平,提高企业管理、文化水平和企业形象,从而提升企业人力资本存量,使企业经济效益提高的一种投资行为。
　　2.基本假设
　　①经济人。经济人假设是指无论是组织还是个人,追求自身利益的最大化。
　　②完全信息。完全信息是指信息是完全通畅的,不存在滞塞,而且客观存在的信息的获取是不需要成本的。
　　③物质资本充足。商品的生产总是物质资本和人力资本结合在一起进行的。
　　要使生产高效率的进行,物质资本和人力资本必须保持适当的比例。
　　三、人力资本投资与员工个人的博弈分析
　　本文从企业与员工之间的角度作人力资本投资的完全信息静态博弈分析,重点分析企业是否增加人力资本投资以及投资后如何行动。
　　假定在完全信息的条件下,企业和员工都是理性的。企业可以选择对员工培训或不培训。根据企业的选择,员工会做出留下或是转投其他企业的选择。假设企业不对员工进行培训是员工的收入为d,当企业选择培训,假设分摊到员工个人的培训费用为c,经过培训后多支付员工的薪水为e(e可以为零,即经过培训后不增加员工薪水),经过培训后员工为企业带来的收益增加值为b。又假设员工离职去另一单位获得的报酬为a。这里为了分析更简单一些,假设员工经过培训与未经过培训跳槽的收入一样,都为a。有时候培训后由于员工技能提高跳槽会获得更多的收入,但是并不影响下面的分析。企业培训博弈分析如表1所示:　　当b-c-e<0时,即企业对员工培训后得到的收益增加值小于支出时,不管员工做出如何决策,企业都不会得到任何的收益增加值,因此企业是不会对员工进行培训投入的。
　　当b-c-e>0时,该博弈成立并可能会出现两种均衡:如果此时员工选择留下所获得的收益d+e大于其选择跳槽时所获的收益a时,理性的员工必定会留在原来的企业,企业也必然会选择培训投入,这也是这个博弈中双方的最优决策;如果此时员工选择留下所获得的收益d+e小于其选择跳槽时所获的收益a时,理性的员工必定选择跳槽,此时企业损失为c,损失最惨重。对企业而言,如果知道这样做令员工跳槽的话,那么企业还不如刚开始就不培训,那样蒙受的损失会少些。这里需要指出的是,一个员工是否跳槽并不简单的取决于对方企业开出的薪酬。影响因素有很多,比如员工个性是否与企业匹配、员工个人发展前景、员工兴趣与岗位的匹配等等。上述表格中,企业如果不对员工进行培训,那么员工留下或离职取决于现有收入d和跳槽企业的薪酬a。
　　如果d>a,员工留下:反之员工跳槽

总之,员工是否留任企业,是一种利益的博弈,并且企业与员工之间存在着信息的不对称,企业必须采取先发行动传递信号减弱员工离任的动机,只要企业能留住员工,人力资本投资就会给企业带来巨大的经济效益。
[编辑]案例二:博弈论在企业经营活动的应用策略[2] 　　哈佛商学院波特教授的竞争五种力量,给出了我们思考行业市场竞争状况和态势时一种全面而详细的分析方法,其中一种力量是潜在进入者的威胁。
　　那么,根据市场类型(完全竞争市场、垄断竞争市场、完全垄断市场和寡头垄断市场),由于多数行业市场属于垄断竞争市场,就存在现有企业和新进入者之间的进入和退出博弈,这取决于彼此结构性的进入障碍、对关键资源的控制度、规模经济效应及现有企业的市场优势的因素。
　　如果你是现有行业的垄断者和一定程度的影响者,阻止潜在进入者进入市场或遏止现有企业恶性竞争的博弈策略有:
　　1.扩大生产能力策略
　　垄断者为阻止潜在进入者进入市场,垄断者可能对潜在进入者进行威胁。但垄断者的这种威胁是否能达到阻止进入的目的,取决于其承诺。所谓承诺(Promise),是指对局者所采取的某种行动,这种行动使其威胁成为一种令人可信的威胁。那么,一种威胁在什么条件下会变得令人可信呢?一般是,只有当对局者在不实行这种威胁会遭受更大损失的时候,与承诺行动相比,空头威胁无法有效阻止市场进入的主要原因是,它是不需要任何成本的。发表声明是容易的,仅仅宣称将要做什么或者标榜自己是说一不二的人也都缺乏实质性的意义。因此,只有当对局者采取了某种行动,而且这种行动需要较高的成本或代价,才会使威胁变得可信。
　　2.保证最低价格条款的策略
　　所谓“保证最低价格”条款策略,即可采取限制性定价策略,通过收取低于进入发生时的价格来防范进入。如某商店规定,顾客在本商店购买这种商品一定时期内(如一个月),如果其他任何商店以更低的价格出售同样的商品,本店将退还差价,并补偿差额的一定百分比(如10% )。例如,如果你在该商店花5 000元购买了一架尼康相机,一周后你在另一家商店发现那里只卖4500元,那么你就可以向该商店交涉,并获得550元的退款。
　　又如假定一个将存在两期的市场。在第1期只有一个厂商,面临两种选择:
　　①制定一个垄断高价60元,可获1 000元的利润,但会使潜在企业认为该行业有利可图,从而选择在第2期进入;而一旦该市场有两个企业存在,将会使市场价格下降到30元,企业利润降为200元。这样,两期的总利润是1000+200=1200元。
　　②制定低价40元,潜在企业如果进来,价格降到20元,两个企业的利润都将是0。
　　故此时潜在企业将不会进入。这样,第二期的价格可以确定一个垄断高价60元,因此总利润将为600+1000=1600元。
　　对消费者来说,保证最低价格条款使你至少在一个月内不会因为商品降价而后悔你的购买,但这种条款对消费者是承诺,对竞争者是警告,无疑是企业之间竞争的一种手段。
　　保证最低价格条款是一种承诺,由于法律的限制,商店在向消费者公布了这一条款之后是不能不实行的,因此它是绝对可信的。这一承诺隐含着企业A向企业B发出的不要降价竞争的威胁,并使这种威胁产生其预期的效果。
　　3.限制进入定价策略
　　限制进入定价是指现有企业通过收取低于进入发生的价格的策略来防范进入,潜在进入者看到这一低价后,推测出进入后价格也会那么低甚至更低,因而进入该市场终将无利可图而放弃进入。
　　4.掠夺性定价策略
　　掠夺性定价是指将价格设定为低于成本来达到驱逐其他企业的目的,而期望由此发生的损失在新进入企业或者竞争对手被逐出市场后,掠夺企业能够行使市场权力时可能得到补偿,即在驱逐其他企业后,再制定垄断高价以弥补前期的损失。这也是一种价格报复策略。掠夺性定价与限制定价之间的差异在于限制定价是针对那些尚未进入市场的企业,是想较长一段时间内维持低价来限制新企业的进入,而掠夺性定价则将矛头指向已经进入的企业或即将来临之际。如你产能过剩,在新企业进入时可以进行产能扩张,将商品大幅降价防堵其进入。
　　5.广告战博弈
　　有些商品只有在使用后才知道其质量真正如何,我们把这种商品称为经验品。只有生产那些高质量经验品的企业才会选择做巨额广告,而低质量的企业将不会做广告。原因是高质量经验品会有大量的回头客,而低质量经验品则鲜有人再次光顾。
　　另外现有厂商之间产量、价格竞争的博弈,尚有古诺模型、伯川德模型可以描述。博弈理论在宏微观层面对企业参与竞争、制定竞争策略均有指导意义。著名营销专家希顿曾说,企业家的艺术就是对企业的策略性经营和管理,博弈作为策略,企业在当今激烈的市场竞争中需要博弈!
[编辑]案例三:博弈论在企业管理中的应用[3] 　　一、博弈论在企业决策中的应用
　　1.博弈论成果与经营决策
　　博弈论的研究成果可直接运用于现代企业的经营决策之中。在市场经济条件下，企业之间的竞争日益加剧，行业内的竞争逐渐表现为几个大型集团之间的直接对抗。从博弈定义来看，这类问题都可归结为博弈问题。因此企业运用博弈论中的决策模型进行决策，将使决策过程更加合理化。当今社会，各个方面的竞争性和对抗性日益加剧，人们对自身行为、理性决策和对效率的追求日益增高，现代企业管理充满了博弈的思想。
　　2.博弈论与企业最优决策
　　在社会经济生活中，企业或个人为了自身利益的最大化，面对市场会做出自己的最优决策，不同的市场情形会影响经济主体人的决策行为。在完全竞争市场条件下，企业会根据给定商品的市场价格计算出生产和供应到市场上的商品的数量，以实现最大的利润。而寡头市场的情形要比完全竞争市场复杂得多。企业大量面对的是信息不完全的市场，企业不知道面对强大的竞争对手该如何做出抉择，市场的时效性要求企业必须在信息不完全的情况下做出决策。在这样的决策中存在着三个合理的假设。
　　第一，理性的“经济人”。每一个行为主体都依据自身利益的最大化作为行动的出发点。
　　第二，每一个行为主体做出的决策都不是在真空的世界中。现实的世界使得一个人的生存必须以他人的生存为前提。这种相互依赖的关系使得一个行为主体的决策会对其他行为主体产生重要的影响，其他行为主体的决策也会直接影响着这个行为主体的决策结果。
　　第三，寡头市场的情形。也即一个行业里面只有少数几家企业，甚至只有两三家企业，每一方的市场份额都很大。由于竞争对手很少，每一个主体的行为产生的后果受对手行为的影响都很大。那么这样的决策就带有了博弈的色彩。
　　3.博弈均衡理论与企业决策
　　企业决策要充分考虑均衡，博弈论的精髓在于其中的任何一个理性决策者，必须考虑在其他局中人反应的基础上来选择自己最理想的行动方案。所谓均衡，即所有局中参与人的最优策略组合，各方博弈产生的结果是一个均衡结局，它可能不是局中各方及整体的利益最大化，但它是在已给定信息与知识条件下的一种必然结果，因为任何一方改变策略而导致均衡的变化都有可能使自己得到一个更差的结果。近来，人们越来越重视博弈论在市场竞争过程中的作用，人们正在通过调整决策，避免冲突以寻求合作，实现共赢，规避双输。
　　二、博弈论在构建和谐企业中的应用
　　博弈论的研究成果，提高了人们对竞争和冲突这一社会现象的认识，对于我们在现实生活中如何运用合作的理念，创建和谐企业具有重要的启示和作用。企业作为社会的组成单元，在构建社会主义和谐社会中承担着义不容辞的责任。对企业来说，“和谐”的基本特征应当表现为依法治企、科学发展、协调有序、安全环保、公平诚信、服务社会，并建立一个长效的协调机制，其核心在于通过促进企业内外环境的“和谐”，达到企业的经济效益与社会效益相统一，最终实现企业健康、协调、可持续发展。
　　1.处理好个人、集体和国家的利益关系
　　在市场经济中，个人、企业和政府都会追求自己的利益，在各自的运转环境中，实际上都处于博弈状态，各自都是在现实生活环境中的博弈一方，冲突和矛盾是难免的。随着国有企业改革的不断深化，在股份制改造和现代化企业制度建设过程中，轮岗、下岗、合并、重组等问题所引发的分工、收入、保障的差距越来越成为矛盾的焦点。掩盖这种利益的差别，否认博弈的现实并不能解决问题。所以，需要客观地看待这些差别。
　　2.处理好博弈与规则透明、诚实守信的关系
　　规则透明和诚实守信是博弈各方达成协议的基础，规则透明是互信的条件。管理者要想取得人们的信任，政策必须公开、公正。对于企业，企业管理者要取得职工的信任和拥护，企业要在市场上立得住、站得稳，必须讲诚信、讲公平、讲公正。如果所要的结果不是通过透明、可信的规则取得的，必然不会与职工群众达成共识，企业氛围也不会是和谐的、稳定的。
　　3.处理好博弈过程中利益各方的关系
　　和谐企业建立的基础是企业各方面的共赢，博弈各方达成的协议虽然未必是利益均等，但应该是各方面都能接受的。建立和谐企业，需要从根本上、制度上解决问题，而制度的建立、措施的完善应建立在科学的基础上，建立在各方都能接受的共赢的基础上，而不是企业方想怎样做就怎样做。如果不能保证各方共赢，必然得不到其他方面的支持，那它必然是不稳定的、不和谐的，甚至会导致更多、更严重的问题。
　　4.处理好经济利益之外的博弈关系
　　和谐不完全建立在经济利益上，除此之外仍然有很多人文因素影响着社会的和谐。因此，企业管理者的充分沟通、理解职工的非经济期望和需求，给予人文关怀，对于促进和谐社会的形成有着不可忽视的作用。
　　三、博弈论在企业价格战中的应用
　　在现实生活中，我们经常会遇到各种各样的价格大战，如彩电大战、冰箱大战、空调大战等，这些大战的受益者首先是消费者。在这里，厂家价格大战的结局是一个“纳什均衡”，而且价格战的结果是谁都没赚到钱，因为博弈双方的利润正好是零。这个结果可能对消费者是有利的，但对厂商而言是灾难性的。所以，价格战对于厂商而言意味着自杀。从中我们可以引申出两个问题，一是竞争削价的结果或“纳什均衡”可能导致一个零利润结局；二是如果不采取价格战，作为一种敌对博弈论其结果有两种，一种是企业采取正常价格策略，另一种是采取高价格策略形成垄断价格。事实上，完全竞争的均衡就是“纳什均衡”或“非合作博弈均衡”。在这种状态下，没一个厂商或者消费者是按照别人已定的价格来进行决策。在这种均衡中，企业要使利润最大化，消费者要使效用最大化，结果导致了零利润，也就是说价格等于边际成本。

博弈论案例篇(3):博弈论经典案例“囚徒困境”及其实证分析

博弈论经典案例“囚徒困境”及其实证分析
发帖时间：2005-10-27 11:06:52
功能：[回复] [收藏] [使用卡片] [违规举报] 【复制地址】 [点242/回2]
分页：第一页 [1-50] 下一页尾页 [新开阅读] [只看楼主] [刷新本帖]
[楼主] [每日必看] [大字小字]博弈论经典案例“囚徒困境”及其实证分析
分类：博弈论与信息经济学        博弈论与信息经济学  文章提交者：刘健发表时间：2003-09-03
博弈论经典案例“囚徒困境”及其实证分析
北京工商大学  刘健
    最近三四十年，经济学经历了一场“博弈论革命”，就是引入博弈论的概念和方法改造经济学的思维，推进经济学的研究。诺贝尔经济学奖授予包括美国普林斯顿大学的纳什博士在内的3位博弈论专家，可以看作是一个标志，这自然也激发了人们了解博弈论的热情。博弈论作为现代经济学的前沿领域，已成为占据主流的基本分析工具。
    博弈论是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡，也就是说，当一个主体的选择受到其他主体选择的影响，而且反过来影响到其他主体选择时的决策问题和均衡问题。
一个完整的博弈应当包括五个方面的内容：第一，博弈的参加者，即博弈过程中独立决策、独立承担后果的个人和组织；第二，博弈信息，即博弈者所掌握
的对选择策略有帮助的情报资料；第三，博弈方可选择的全部行为或策略的集合；第四，博弈的次序，即博弈参加者做出策略选择的先后；第五，博弈方的收益，即
各博弈方做出决策选择后的所得和所失。
    “囚徒困境”
    “囚徒困境”是博弈论里最经典的例子之一。讲的是两个嫌疑犯（Ａ和Ｂ）作案后被警察抓住，隔离审讯；警方的政策是"坦白从宽，抗拒从严"，如果两人都坦白则各判８年；如果一人坦白另一人不坦白，坦白的放出去，不坦白的判１０年；如果都不坦白则因证据不足各判１年。
　　在这个例子里，博弈的参加者就是两个嫌疑犯Ａ和Ｂ，他们每个人都有两个策略即坦白和不坦白，判刑的年数就是他们的支付。可能出现的四种情况：
Ａ和Ｂ均坦白或均不坦白、Ａ坦白Ｂ不坦白或者Ｂ坦白Ａ不坦白，是博弈的结果。Ａ和Ｂ均坦白是这个博弈的纳什均衡。这是因为，假定Ａ选择坦白的话，Ｂ最好是
选择坦白，因为Ｂ坦白判８年而抵赖却要判十年；假定Ａ选择抵赖的话，Ｂ最好还是选择坦白，因为Ｂ坦白判不被判刑而抵赖确要被判刑１年。即是说，不管Ａ坦白
或抵赖，Ｂ的最佳选择都是坦白。反过来，同样地，不管Ｂ是坦白还是抵赖，Ａ的最佳选择也是坦白。结果，两个人都选择了坦白，各判刑８年。在（坦白、坦白）
这个组合中，Ａ和Ｂ都不能通过单方面的改变行动增加自己的收益，于是谁也没有动力游离这个组合，因此这个组合是纳什均衡。
    囚徒困境反映了个人理性和集体理性的矛盾。如果Ａ和Ｂ都选择抵赖，各判刑１年，显然比都选择坦白各判刑８年好得多。当然，Ａ和Ｂ可以在被警察抓到之前订立一个"攻守同盟"，但是这可能不会有用，因为它不构成纳什均衡，没有人有积极性遵守这个协定。
    实证分析：
    "囚犯困境"在经济学上有很多应用，也有力地解释了一些经济现象。
一．电信价格竞争
    根据我国电信业的实际情况，我们来构造电信业价格战的博弈模型。假设此博弈的参加者为电信运营商A与B, 他们在电信某一领域展开竞争，
一开始的价格都是P0。A（中国电信）是老牌企业，实力雄厚，占据了绝大多数的市场份额；B（中国联通）则刚刚成立不久，翅膀还没有长硬，是政府为了打破
垄断鼓励竞争而筹建起来的。
    正因为B是政府扶植起来鼓励竞争的，所以B得到了政府的一些优惠，其中就有B的价格可以比P0低10％。这一举动，还不会对A产生多大
的影响，因为A的根基实在是太牢固了。在这样的市场分配下，A、B可以达到平衡，但由于B在价格方面的优势，市场份额逐步壮大，到了一定程度，对A造成了
影响。这时候，A该怎么做？不妨假定：
    A降价而B维持，则A获利15，B损失5，整体获利10；
    A维持且B也维持，则A获利5，B获利10，整体获利15；
    A维持而B降价，则A损失10，B获利15，整体获利5；
    A降价且B也降价，则A损失5，B损失5，整体损失10。
    从A角度看，显然降价要比维持好，降价至少可以保证比B好，在概率均等的情况下，A降价的收益为15×50％－5×50％＝5，维持的收
益为5×50％－10×50％＝－2．5，为了自身利益的最大化，A就不可避免地选择了降价。从B角度看，效果也一样，降价同样比维持好，其降价收益为
5，维持收益为2．5，它也同样会选择降价。在这轮博弈中，A、B都将降价作为策略，因此各损失5，整体损失10，整体收益是最差的。这就是此博弈最终所
出现的纳什均衡。我们构造的这一电信业价格战博弈模型是典型的囚徒困境现象，各个局部都寻求利益的最大化，而整体利益却不是最优，甚至是最差。
    许多其他行业的价格竞争都是典型的囚徒困境现象，如可口可乐公司和百事可乐公司之间的竞争、各大航空公司之间的价格竞争等等。
二．OPEC组织成员国之间的合作与背叛
    “囚徒困境”告诉我们，个人理性和集体理性之间存在矛盾，基于个人理性的正确选择会降低大家的福利，也就是说，基于个人利益最大化的前提下，帕累托改进得不到进行，帕累托最优得不到实现。
    上述我们在对电信价格竞争的博弈分析中，只是一次性的“囚徒困境”博弈，因此得到了互相降价的纳什均衡。而在现实生活当中，信任与合作很
少达到如此两难的境地，无论在自然界还是在人类社会，“合作”都是一种随处可见的现象。比如中东石油输出国组织
（ＯｒｇａｎｉｚａｔｉｏｎｏｆＰｅｔｒｏｌｅｕｍＥｘｐｏｒｔｉｎｇＣｏｕｎｔｒｉｅｓ简称ＯＰＥＣ）的成立，本身就是要限制各石油生产国的
产量，以保持石油价格，以便获取利润，是合作的产物。OPEC之所以能够成立，各组织成员国之间之所以能够合作，是因为囚徒困境如果是一次性博弈
(One shot game)的话，基于个人利益最大化，得到纳什均衡解，但如果是多次博弈，人们就有了合作的可能性，囚徒困境就有可能破解，合作就有
可能达成。连续的合作有可能成为重复的囚徒困境的均衡解，这也是博弈论上著名的“大众定理”(Folk Theorem)的含义。
    但合作的可能性不是必然性。博弈论的研究表明，要想使合作成为多次博弈的均衡解，博弈的一方（最好是实力更强的一方）必须主动通过可信
的承诺(Credible commitment) ，向另一方表示合作的善意，努力把这个善意表达清楚，并传达出去。如果该困境同时涉及多个对手，则要
在博弈对手中形成声誉，并用心地维护这个声誉。这里“可信的承诺”是一个很牵强的翻译，“Credible commitment”并不是什么空口诺言，
而是实实在在的付出。所以合作是非常困难的。所以OPEC组织经常会有成员国不遵守组织的协定，私自增加石油产量。每个成员国都这样想，只要他们不增加
产量，我增加一点点产量对价格没什么影响，结果每个国家都增加产量，造成石油价格下跌，大家的利润都受到损失。当然，一些产量增加较少的国家损失更多，于
是也更加大量生产，造成价格进一步下降――结果，陷入一个困境：大家都增加产量，价格下跌，大家再增加产量，价格再下跌……。
    理论上，几乎所有的卡特尔都会遭到失败，原因就在于卡特尔的协定（类似囚犯的攻守同盟）不是一个纳什均衡，没有成员有兴趣遵守。那么是
不是不可能有卡特尔合作成功了？理论上，如果是无限期的合作，双方考虑长远利益，他们的合作是会成功的。但只要是有限次的合作，合作就不会成功。比如合作
１０次，那么在第九次博弈参与人就会采取不合作态度，因为大家都想趁最后一次机会捞一把，反正以后我也不会跟你合作了。但是大家料到第九次会出现不合作，
那么就很可能在第八次就采取不合作的态度。第八次不合作会使大家在第七次就不合作……一直到，从第一次开始大家都不会采取合作态度。
    以上是运用博弈论中的经典案例“囚徒困境”对现实经济生活的一些简单的理论上的分析，虽然在现实生活当中影响人们决策和态度的因素很多，但是，博弈论作为现代经济学的前沿领域，始终是一个强有力的分析工具。

本文来源：https://www.shanpow.com/wx/374401/

《博弈论案例.doc》

将本文的Word文档下载到电脑，方便收藏和打印

推荐度：

点击下载文档

文档为doc格式