纳什及其“博弈论”评析


 

我把这篇文章放在这部分的最后,是有我的理由的。

我跟纳什还是很有缘分的。读大学的时候,我曾经花了很多时间学习《运筹学》,但最后印象最深的就算博弈论了,像线性规划、多目标决策、货郎担问题等等,虽然还记得,但已经模糊。因为当时的我已经对人的行为、情感、心理、动机以及中国的文化作了很多的思考,博弈论的逻辑与思路对我帮助很大。最后抛弃博弈论,想到了秩序论。但当时不知道纳什。

对纳什了解最开始源于电影《美丽心灵》,可能是因为演员是我最喜欢的演员之一罗素克罗,可能是电影中的台词吸引了我,可能是主人公的性格与笔者本人类似,可能是电影的剧情非常精彩,反正不知为什么,对纳什产生了强烈的兴趣。后来就自己搜集了许多关于纳什的资料,深入的了解之后,越发的敬重他了。

后来,有一次到长沙,顺便逛了逛书店。原本想买一本《博弈论》,但遭到老婆的强烈反对,他也是为我好。因为当时的我大病初愈,还处在恢复期,极其脆弱。只好做罢。

如果说我对其他的伟大的人像爱因斯坦、奥尔森、哈耶克等等只是尊敬、佩服的话,对纳什我是非常有感情的。原因我就不说了,很复杂。可以说,世界上正真理解纳什的只有笔者。无论是他生病还是未生病。

纳什的伟大就是告诉世人一个道理:你们之所以无法达到自己的最大利益,恰恰就是因为你们的自利。

这是一个非常了不起的观念。对亚当·斯密的看不见的手的原理提出挑战甚至否定。按照斯密的理论,在市场经济中,每一个人都从利己的目的出发,而最终全社会达到利他的效果。根据博弈论我们发现一个悖论:从利己目的出发,结果损人不利己,既不利己也不利他,最后可能损人损己。这实际上动摇了西方经济学的基石。

经济学有个“阿罗不可能原理”,是否存在另一个不可能定理:自利的人无法达到利益最大化。或者说个人理性与集体理性不可能同时达到最大呢,尽管我们合作?

后来有许多人对博弈论的发展做出了巨大的贡献。莱茵哈德泽尔腾、罗伯特爱克斯罗德、托马斯谢林、罗伯特奥曼甚至马斯金他们等等。但笔者看来,基本上还是未有重大突破。

我们先来看一个经典的“非合作博弈”的例子——囚徒困境。

假设有两个小偷AB联合犯事被警察抓住。警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果两个犯罪嫌疑人都坦白了罪行,各被判刑8年;如果只有一个犯罪嫌疑人坦白,另一个人没有坦白而抵赖的再加刑2年,而坦白者有功立即释放。如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。

最终的结果是两人都被判刑8年。但是,有一个最好的结果,倘若他们都选择抵赖,每人只被判刑1年。但为什么这种结果难以出现呢?

典型的个人理性导致集体的无理性。为什么?

假如那两个小偷是我和我弟弟的的话,肯定是各判一年刑。无论如何我都不会承认,我弟弟也一样。

差别在哪里?

第一、  我相信我弟弟不会说,我弟弟也一样。

第二、  即使我弟弟说了,我也不后悔。

上面例子里两个小偷之所以达不到最大理性,自利不是根本原因,真正的原因是彼此不信任,同时没有去考虑他人利益。而我和我弟弟恰恰相反。

正是这种不信任所建立的秩序,让自利的人达不到最大理性。现实生活中,这种例子随处可见。从而使一些出发点很好的想法最后达不到预期的效果。

有人或许会说,你是不是违背了自利原则?看结果就知道了,我只被判刑1年,这还不够吗?

再看另一个例子——智猪博弈。

猪圈里有两头猪,一头大猪,一头小猪。猪圈的一边有个踏板,每踩一下踏板,在远离踏板的猪圈的另一边的投食口就会落下少量的食物。如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。当小猪踩动踏板时,大猪会在小猪跑到食槽之前刚好吃光所有的食物;若是大猪踩动了踏板,则还有机会在小猪吃完落下的食物之前跑到食槽,争吃到另一半残羹。结果呢,小猪将选择搭便车策略,也就是舒舒服服地等在食槽边;而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。

有人说这不合理,小猪不劳而获,大猪太辛苦了。可以改变规则来改变状况。对。然而显然没有看到问题。

大小猪这种博弈的平衡会维持下去吗?很难。因为会有公平感这个幽灵出来。

大猪会觉得不公平。我辛辛苦苦的付出,你小猪不劳而获,凭什么?结果呢?大猪不会再去踏踏板了,一起挨饿。这种例子在现实社会中有很多。像改革前的国企,大猪是管理者,小猪是其他员工,由于工资差别不大,管理者的报酬显然不合理,因此最终的结果就是缺乏效率、亏损、甚至倒闭。

小猪也会觉得不公平。你就按了一下按钮,就吃这么多,凭什么,我也会按。于是事情就变得复杂了。至少小猪会愤愤不平。看看,现在对企业高管的薪酬有意见的人多了吧,对富人的仇视心理正在积聚吧。这一次AIG高管分红引起的巨大反响实际就是小猪就得不公平了。

这种不公平感引起的问题远不止如此。大猪觉得不公平,他会想办法增加自己的所得,而且他也有办法。看看我们现在的国企的高管,薪酬已经高的离谱了。看看历朝历代的“公务员”的收入就明白了。

小猪觉得不公平,抱怨是最基本、最温和的对抗。他会寻找一切机会改变这种不公平感。有一种可能,就是攻击大猪,甚至把它消灭掉。社会现实中小猪的数量远远多于大猪,他是有这个实力的。只是需要寻找机会与联合。历史上的农民起义、革命实际就是小猪觉得不公平了。一起联合起来消灭大猪。这一次全美国甚至全世界的小猪对AIG的高管口诛笔伐、最终强迫政府采取措施让他们不能如愿。一样的逻辑。

这种博弈的均衡点在哪里?谁也不知道。记得AIG一位分部的副总裁在《纽约时报》全文刊登了他的辞职信。问题复杂了。

因为公平感是无法把握的。只要我们还把公平感当回事,这个博弈就很难找到一个均衡点。因此我在《论公平》里面提到我们要抛弃贞操感一样抛弃公平感。

这两个例子说明,正是一些观念形成的秩序,让我们在博弈中达不到各自最大的利益。还有很多的观念会带来一样的效果,我就不一一举例了。

下面我说一个所有中国人津津乐道的例子——田忌赛马。

齐王要田忌和他赛马,规定每个人从自己的上、中、下三等马中各选一匹来赛;当时,齐王的每一等次的马比田忌同样等次的马都要强,因此田忌肯定要输三次。田忌的谋士孙膑给他出了一个主意,让田忌用自己的下等马去与齐王的上等马比,用自己的上等马与齐王的中等马比,用自己的中等马与齐王的下等马比。结果呢,田忌不仅没有输反而赢了。

我们被教育,要像孙膑一样聪明。然而事情真的这样简单吗?

我们继续博弈看看会有什么结果。齐王不会再这么傻了,如此简单的道理,即使田忌不告诉他,相信他也能看出其中奥秘。于是第二次赛马的时候,他不会让田忌看出自己马的等次了,把自己的信息隐藏起来。而田忌呢,取胜的唯一希望就是掌握齐王的马的分类,于是他会千方百计的得到这个信息。现在,赛马已经不重要了,关键是获得信息。也就是演变成了获得信息与隐藏信息的博弈了。

然而信息不是那么容易获得的。要想获胜,还有很多办法既可靠又简单,那就是在齐王的马上面做文章,让他瘸,反正让他跑不了。或者让自己的马吃兴奋剂,等等。方法可以有千万种,我们的祖先为我们留下了无穷的智慧。

复杂了吧。单次博弈与多次博弈的结果会有很大的不同。而我们现实的世界正是多次博弈形成的结果。尽管主角可能换了。

笔者看来很简单:形成了“不择手段”的秩序。这种秩序会产生极坏的结果。赛马已经失去他原有的意义——培养好马。最终是以还是以集体的无理性结束,社会上没有好马可骑。

中国的历史恰恰是这种“不择手段”的秩序尽情展示的过程。一部“尔虞我诈”的历史。讲仁义的宋襄公终究免不了一败,并背上迂腐的骂名,有人评价他为蠢猪式的军事家”。尽管许多文人墨客对项羽推崇有加,然而还是免不了自刎江东。普希金似的人物与行为在中国是很难看到的。

但我们想过没有,如果我们的博弈规则就像如上人物的行为一样,今天的中国会是个什么样子?

可是现实恰恰相反。为了获利,父母可以不要、妻儿可以不要、朋友可以背叛利用、可以背信弃义、可以撒谎欺骗、可以不顾集体、他人利益、一切道德、法律可以违背。等等。

看看博弈的结果吧。

没有智慧、学问可以,只要能评上教授、院士就行了。

功课不行可以,只要能作弊、爸爸舍得花钱、有本事,一样可以上名校。

人民不满意可以,只要能做出获得上级认可的政绩,一样可以晋升。

产品质量不行可以,欺骗消费者可以,只要瞒得住,用不了多久就可以赚到大把大把的钞票,等到东窗事发,或许早就高就了,或者可以用钱摆平一切,或者用赚到的钱足可以荣华富贵了。

国家的前途可以不管,只要社会基本稳定,不出大乱子,自己平平安安的过完任期,积攒一点名声,就可以名垂青史了。等等。

而最终的结果呢,没有第二条路——集体的无理性。中国从西方学了许多的东西,包括制度,尽管愿望与理论基础都很好,然而实施的结果却是天壤之别,只因为我们的决策者,智囊人物看不到我们的秩序——不择手段,对理论也是一知半解不知道调整。

博弈或者叫竞争显然能到来好处,然而我们必须清醒的认识到,他一样是把双刃剑,她所促成的坏秩序一样可以给我们带来巨大的痛苦与灾难。

下面我们来分析一下博弈论的一些理论要点或者叫结论吧。看看他的局限性与不足。

看看纳什均衡。

 假设有n个局中人参与博弈,给定其他人策略的条件下,每个局中人选择自己的最优策略从而使自己利益最大化。这样就构成一个策略组合。如果在给定别人策略的情况下,没有人有足够理由打破这种均衡,我们把这种状态叫做纳什均衡。

有些博弈中显然存在这个均衡。像“囚徒困境”。然而在许多博弈中根本就不存在这个均衡。研究者们形象地称之为天真可爱的纳什均衡点

夫妻吵架、不和、背叛,实际就是一个博弈的过程。然而,最终的结果是,很多夫妻离婚了,均衡点在哪里?

战国时期,诸侯混战,战争延绵几百年,最终以秦国统一天下为终结,均衡点在哪里?

中日战争的均衡点在哪里?

价格战,中国许许多多行业爆发了残酷的价格战,最终的结果往往是导致整个行业的衰退与亏损,当然还有一种结果——垄断,均衡点在哪里?

一些行业,一致性的采用欺骗、误导消费者的手段来竞争、来获得发展。最终结果呢?摧毁了整个行业。均衡点在哪里?

为什么形不成均衡?很简单,恶性竞争。只要是恶性竞争就形不成均衡。

而观念恰恰是造成恶性竞争的罪魁祸首。

如果有人想要当皇帝,当老大,战争、博弈就没有均衡点。

有人不择手段,忽视规则、毫无原则,博弈就很可能没有均衡点。

博弈的获利与损失不是同一个主体来承担,就不会有均衡点。

博弈的参与者对失去的与获得的东西的判断出现非常大的偏差的时候,博弈往往没有均衡点。等等。

博弈论大师托马斯谢林的判断就失误过,根据他们提出的通过持续逐步升级的轰炸可以达到迫使越南屈服的策略,军方在196532日至24日实施了轰炸越南北部的“滚雷行动”。最终的结果是,6百万吨的炸药最终造成了2百万人的死亡,但根本没有影响到越南人民抗美的决心

很简单,这是一个没有均衡点的博弈。谢林教授没有看到这一点。

而恶性竞争最终的结果就是集体的无理性。

看看博弈论的条件与完善过程。

纳什的博弈论条件是非常苛刻的。第一、完全信息,也就是他的策略可以预见。显然现实生活中不可能。第二、均衡对协议能够实现自我约束,上面我已经分析了这个条件有时候不可能存在。

约翰·查里斯·哈萨尼提出了不完全信息博弈,罗伯特约翰奥曼创立了重复博弈论。他们的成就虽然对解决社会问题给与很大的理论指导,然而,只要跳不出博弈论的逻辑,就不可能在个人理性与集体理性的一致上再有重大的突破。现实就证明了这一点。随处可见的恶性的博弈,导致个人与集体的无理性。核扩散、环境问题、恐怖主义、行贿受贿等等。

我下面提出几个问题。

第一、         参与人数。几十上百人你可以分析,上万呢,上亿呢?

第二、         个人策略。人是很复杂又很聪明的,他能想出的策略的数量足够惊人,而且他创造性的想出的一些策略往往会让你大吃一惊,目瞪口呆。随便举几个例子。人肉炸弹、层出不穷的骗术、贪污腐败的手段高价回收药品背后反映的事实等等。眼花缭乱、不一而足。就像魔术。如果你连参与者的策略都不可以预测,你敢用博弈论去分析吗?中国许多政策失效,就是源于对现实估计不足。

第三、         我们来看看几个例子。我在秩序论的文章里多次提过。随地吐痰、城市牛皮廯、不敢做好人、欺骗成风、行贿受贿变成正常现象等等。怎么用博弈论来解释与解决。

   我们再来看看另外两个人的理论成果。

一个是罗伯特爱克斯罗德。他通过模拟实验的办法得出一个结论,就是具备以下特征的人总是赢家。

1.善意的,2.宽容的、3.强硬的、4.简单明了的。

最后简单的讲就是一报还一报的策略。

   另一个人就是托马斯谢林。他在《冲突战略》一书指出,冲突中的一方可以通过自陷绝境来加强自己的地位;拥有报复手段比抵抗手段更重要;难以预料的报复手段比已知的报复手段更有效,寻找“聚集点”。

看得出来他们两人的理论有相通的地方。

在现实生活中,秉持这些原则对你与人相处或是管理会很有好处。笔者的日常行为准则就跟这个很吻合。

但是放到社会上、世界上去就有很大的问题。

现实生活的例子也证明了这个理论的局限性。善良、宽容的人会取胜吗,老实人为什么总是吃亏?一报还一报,可能吗?骗子骗了你,你怎么报?报了又会怎么样呢?武侠小说里不是有句话吗,冤冤相报何时了。何况有人会利用这一原则,让你为他效力。

另外,按这个理论分析,本拉登是对的,入侵伊拉克是对的、苏联入侵捷克是对的、俄罗斯入侵格鲁吉亚是对的、恐怖主义是对的、“圣战”的非常手段是对的、核扩散是对的、中国应该教训一下周边与自己有领土争端的国家等等。结果会怎样?

所以谢林会在越南问题上犯错误。

我们没有看到,之所以我们会出现集体的无理性,有时候恰恰就是因为“博弈”。要想改变只有抛弃博弈。正如我们研究战争的,最终就是为了要抛弃他一样。这才是我们研究博弈论的最好目的。

举个例子来结束我的文章。

我们到店子里面去买东西,很可能会讨价还价,这就是博弈。即使做成了交易,也是不理性的,浪费了时间。对于商家而言,也会有可能损失,因为客户对你不信任,很可能只是试探你的价格,获得更多信息,然后会到另一家再去博弈,增加博弈获胜的可能性。

实际还有一种方法,像超市一样,明码标价。商家好、客户也好。对整个社会形成良性竞争也大有好处。商家只要关心产品对消费者的吸引力。

这才是我们的未来。