网络公共理性博弈模型--莫愁世间无方舟
近一个时期以来,天灾人祸不断,圈内朋友忧国忧民,不知何处有方舟。对于天灾,人类能克服就克服,不能克服就适应或者忍受,因为有时候“忍受也是克服”。然而对于人祸,最终则是可以被遏制的。
一天,孔子问他的学生,如果有人打了你左面一个耳光,你应该怎么办?学生甲说,我就还他左右两个耳光,让他加倍偿还我的损失。学生乙说,我就让他再打我右面一个耳光,让他良心发现,不再欺负别人。学生丙说,我要给他左面一个同样的耳光,让他为自己的行为付出代价。
孔子点评说,甲的行为叫做“以怨报怨”,会引起冲突升级,你还给他两个耳光,他又要对你实施过度报复,打你三个耳光,你再给他四个耳光―――,我们的社会将永无宁日。乙的行为叫做“以德报怨”,这样会纵容恶人危害社会,也是不可取的。只有丙的做法叫做“以直抱怨”,让恶人得到应有的惩罚,是对社会负责任的表现。
假设世界上只有孔子的学生甲、乙、丙这样三种人,每一种都只有三个人,一共是九个人。让他们各自按照恶人、善人、常人的禀赋相互交往,恶人与任何人交往都永远采取不合作态度,善人与任何人交往都永远采取合作态度,常人与他人交往则永远采取“一还一报、以直抱怨”的态度。不合作者与不合作者交往一次各得零分;不合作者与合作者交往一次,不合作者得2分,合作者得负2分;合作者与合作者交往一次各得一分。这样就构建了一个最简单的三类人重复博弈模型。在重复博弈中,每次得分最少者即被淘汰出局,结果会怎样呢?
甲1与甲2、甲3交往,甲2、甲3不合作,按照记分规则,甲1甲2甲3各得0分。
甲1与乙1、乙2、乙3交往,乙1、乙2、乙3合作,甲1得6分,乙1、乙2、乙3各得负2分。
甲1与丙1、丙2、丙3交往,丙1、丙2、丙3不合作,甲1得零分,丙1、丙2、丙3各得0分。
接着是甲2、甲3与其他人主动交往,结果与上一番相同,于是可以计算出该次博弈中甲1、甲2、甲3各得正6分;乙1、乙2、乙3各得负6分;丙1、丙2、丙3各得0分。
第二次博弈开始,
乙1与、乙2、乙3交往,乙2、乙3均合作,乙1得2分,乙2、乙3各得1分。
乙1与甲1、甲2、甲3交往,甲1、甲2、甲3不合作各得2分,乙1均合作得负6分。
乙1与丙1、丙2、丙3交往,乙1均合作得3分,丙1、丙2、丙3合作各得1分。
接着是乙2、乙3与其他人主动交往,结果与上一番相同,于是可以算出该次博弈中甲1、甲2、甲3各得6分,乙1、乙2、乙3各得1分,丙1、丙2、丙3各得1分。
第三次博弈开始,
丙1与丙2、丙3交往,均合作,丙1得2分,丙2、丙3各得1分。
丙1与甲1、甲2、甲3交往,均不合作大家都得0分。
丙1与乙1、乙2、乙3交往,均合作大家各得1分。
接着由丙2、丙3与他人主动交往,结果与上一番相同,于是可以算出该次博弈中,甲1、甲2、甲3各得0分;乙1、乙2、乙3各得3分;丙1、丙2、丙3各得4分。
累计该轮博弈总分排名:甲1、甲2、甲3各得12分;乙1、乙2、乙3各得负2分;丙1、丙2、丙3各得5分。按照预定规则,乙1、乙2、乙3均被淘汰出局。
下面进行第二轮6人博弈,
甲1与甲2、甲3交往,均不合作,各得0分。
甲1与丙1、丙2、丙3交往,均不合作,各得0分。
甲2、甲3主动与他人交往,与甲1交往的结果相同。
第二次博弈开始,
丙1与丙2、丙3交往,均合作,丙1得2分,丙2、丙3各得1分。
丙1与甲1、甲2、甲3交往,均不合作,各得0分
丙2、丙3主动与他人交往,与丙1交往的结果相同。
累计该轮博弈总分排名:甲1、甲2、甲3各得0分;丙1、丙2、丙3各得4分。按照预定规则,甲1、甲2、甲3均被淘汰出局,只剩下丙种持“一还一报、以直抱怨”态度者获得了持久生存和繁衍机会。
当然,以上博弈是在信息完全透明的情况下进行的,也就是说,甲乙丙这三种人的交往态度大家都相互知晓,才能实现这样的最终结果。在现实经济活动中,情况要复杂的多,在一定时间段很可能是善于坑蒙拐骗的人获得最大收益。但是许多文献已经证明,即使在充斥狡诈和诡计多端博弈者的情况下,经过成百上千次重复博弈以后,最终依然是平等合作者胜出。好在近20年来,光导纤维、移动通信、互联网的快速普及,我们的社会将越来越变得透明,不论人们是否愿意,透明交易将逐渐成为主流模式,最后依然是唯有平等交易方可获得持续获利的机会。
――选自即将出版《网络钟型社会》