对逆推归纳法的逻辑思考


  (为了让我的朋友们未发表的文章能够实现价值,我特设专栏陆续将他们的文章介绍给大家。由于未发表所以无法转载,只能选择原创,故在此首先介绍一下作者。本文作者欧阳贵望,燕山大学逻辑学硕士。)

  摘要:逆推归纳法不会产生逻辑悖论,蜈蚣悖论也并非真正的悖论。运用逆推归纳法产生的结果与现实直觉相矛盾的问题,是人们在整个过程先后采取了两种不同性质的推理方法造成的。逆推归纳法作为一种求必然解的逻辑方法,可以认为是现实博弈的一种特殊情况,即风险概率为零的情况。也正是这种必然性,使得逆推归纳法存在较大的局限性。

  关键词:逆推归纳法;蜈蚣博弈;悖论

  一逆推归纳法及其存在的问题

  逆推归纳法是博弈论中分析完全且完美信息动态博弈的一种核心方法。该方法由Zermelo年首先使用的,而后又由Selten加以完善和推广。逆推归纳法的逻辑基础如下:动态博弈中先行为的理性博弈方,在前面阶段选择行为时必然会先考虑后行为博弈方在后面阶段中将如何选择行为,只有在博弈的最后一个阶段选择的,不再有后续阶段牵制的博弈方,才能直接做出明智的选择。当后面阶段博弈方的选择确定以后,前一阶段博弈方的行为也就确定了。由于逆推归纳法确定的各个博弈方在各阶段的选择,都是建立在后续阶段各个博弈方理性选择的基础上的,因此排除了包含不可信的威胁或承诺的可能性,因此它得出的结论是比较可靠的,确定的各个博弈方的策略组合是有稳定性的。[1](P134-135)

  逆推归纳法是一种完全归纳推理,其推理是演绎必然的。正是这种必然性,逆推归纳法作为一种有力的工具,得以广泛应用于完全且完美信息动态博弈分析之中。然而蜈蚣悖论的提出,揭示出逆推归纳法应用的局限性。

  蜈蚣博弈问题又被称为蜈蚣悖论,是一种合理行为选择的悖论。是由罗森塞尔Rosenthal在1981年提出的一个动态博弈问题。由于这个博弈的扩展形很像一条蜈蚣,因此被称为“蜈蚣博弈”。

  蜈蚣博弈是指这样一个博弈:两个博弈方A、B轮流进行策略选择:可供选择的策略有“合作”和“不合作”两种。规则是:A、B两次决策为一组,第一次若A决策结束,A、B都得n,第二次若B决策结束,A得n-1而B得n+2;下一轮则从A、B都得n+1开始。假定A先选,然后是B,接着是A,如此交替进行。A、B之间的博弈次数为一有限次,比如198次。假定这个博弈的各自的支付给定如下:

  RrRrRr

  A→B→A→……B→A→B→(100,100)

  D↓d↓D↓d↓D↓d↓

  (1,1)(0,3)(2,2)(97,100)(99,99)(98,101)

  注:R,r表示合作;D,d表示不合作。得益数组中第一个数字表示博弈方A的得益,第二个数字表示博弈方B的得益。

  这个博弈奇特之处在于:当A决策时,他考虑博弈的最后一步即第198步:B在“合作”和“不合作”之间作出选择时,因“合作”给B带来100的收益,而“不合作”带来101的收益,根据理性人假定,B会选择“不合作”。但是,要经过第197步才到第198步,在197步,A考虑到B在第198步时会选择“不合作”,此时A的收益是98,小于B合作时的100。那么在第197步时,他的最优策略是“不合作”,因为“不合作”的收益99大于“合作”的收益98。如此归纳推理下去。最后的结论是:在第一步A将选择“不合作”,此时的收益数组为为(1,1)。

  在这里,运用逆推归纳法得出的结果是令人无法接受的。从逻辑推理来看,逆推归纳法是严密的,其结果的得出是必然的。但问题在于得出的结论违反直觉。直觉告诉我们,一开始就停止的策略A、B均只能获取1,而采取合作性策略有可能均获取100,当然A一开始采取合作性策略有可能获得0,但1或者0与100相比实在是太小了。直觉告诉我们采取“合作”策略是好的。而从逻辑的角度看,A一开始应选择“不合作”的策略。并且对蜈蚣博弈进行实验的结果也证实了人们的自觉,在绝大多数随意选择的博弈方之间进行该博弈,通常都不会出现上述逆推归纳法预测的结果。

  二蜈蚣悖论的反思

  蜈蚣悖论的产生使得人们对逆推归纳法的有效性产生了质疑,认为逆推归纳法会产生逻辑悖论,蜈蚣悖论是逆推归纳法悖论的典型。[2]对于这点,笔者认为逆推归纳法并没有产生悖论,蜈蚣悖论也并非真正的悖论。运用逆推归纳法产生的与直觉相矛盾的问题,关键在于这两者的逻辑基础是不同的。

  悖论(paradox)源自希腊语,意思是令人难以置信。在目前的用法中,悖论一般指“由肯定它真,就推出它假,由肯定它假,就推出它真的一类命题”[3](P229)。比较严格的定义是指这样一种理论事实或状况,在某些公认正确的背景知识之下,可以合乎逻辑地建立严格意义上的两个矛盾命题相互推出矛盾等价式[4](P108)。矛盾等价式又称矛盾互推式,是指如果假设某事实真则会推出该事实假,而如果假设事实假又会推出该事实真。所以悖论的构成需具备三个不可或缺的要素:公认正确的背景知识;严密无误逻辑推导;可以构成矛盾等价式[4](P67)。

  《墨经》中的“以言为尽悖”,因明中的“一切言皆妄”古希腊的“说谎者悖论”都可以看成是悖论。原因在于它们从合理的前提,经过逻辑推导,都会得出两个自相矛盾的命题。以强化说谎者悖论为例:一个人说了唯一一句话:我正在说的这句话是假的。如果这句话是真的,则它说的是真实的情景,而它说它本身是假的,因此它是假的;如果这句话是假的。则它说的不是真实的情形,而它说它本身是假的,因此它本身不是假的,因而是真的。于是这句话是真的当且仅当这句话是假的,这就是悖论。

  不管是松散的定义还是较严格的定义,都包含着必须得出两个自相矛盾的命题。缺乏了这点,也就不够成悖论。按照上述定义,蜈蚣博弈满足悖论构成的前两个条件,公认正确的背景知识和严密无误逻辑推导。博弈的双方基于两个基本假设:理性人假设和一致预期假设。他们对博弈结构,规则,得益情况都十分清楚,属于完全且完美动态博弈,这些构成公认正确的背景知识。整个分析过程采用的是逆推归纳法,逆推归纳法是完全归纳推理,结论是必然的,满足严密无误的逻辑推导的条件。但是蜈蚣博弈并不满足第三个条件,即得出矛盾等价式。当我们采用逆推归纳法从最后一阶段开始推理,我们得出博弈会在第一阶段终止;但若直接从第一阶段开始推理,却得出博弈不会在该段终止。这并非矛盾等价式,也就是说,我们不能从肯定某一阶段推出否定某一阶段;也不能从否定某一阶段推出肯定某一阶段。之所以认为其是悖论,原因在于其结果与直观现实相悖。但是有“悖”于相应概念的常识、直观、经验等等的悖论,最多只能算作直观悖论[3](P227)。并不是真正意义上的逻辑悖论。

  蜈蚣博弈用逆推归纳法得出的结果与直观现实相矛盾,从逻辑角度来看,是人们在整个过程先后采取了两种不同性质的推理方法造成的:理论上的必然推理和现实中的或然推理。

  现实博弈中,A在一开始会采取合作性策略,因为即使B第一次选择了不合作,对A来说1的损失并不很大,A所冒的是一个不大的风险。选择不合作虽然会得到1收益,但与选择合作所将获得的潜在100相比,不合作显然不是好的选择。因此在博弈的初始,把选择主动权交与对方,让博弈延续下去,对双方都是有很大潜在利益的投机。因此我们说A选择合作的原因在于对未来的预期,是从现在的经验跳到对未来的预测。这种预测不是必然的,而是或然的。当A一开始选择合作时,他并不能保证B一定会选择合作,只能是认为B合作的可能性是很大的,是值得冒风险的。A的选择是一种风险性选择,一种在概率基础上进行的选择。因此从第一阶段A的选择开始,整个博弈过程都是基于概率基础。开始时双方均选择合作这一概率是相当大的,随着博弈的进行,合作的概率逐渐降低,当到达某一方认为不再值得冒风险时,就会中断合作。在该中断点以前,因为可能存在的合作,逆推归纳法是失效的。但是在该中断点以后,逆推归纳法却是起作用的。

  正是因为现实博弈存在风险性选择,是建立在概率基础上。逆推归纳法作为一种求必然解的逻辑方法,可以认为是现实博弈的一种特殊情况,即风险概率为零(采用绝对的风险规避)的情况。在这个情况下,A一开始就会排除选择合作,不管预期的收益有多大,合作的概率有多么高,因此博弈终止于第一阶段将是必然的。这与用逆推归纳法求解蜈蚣博弈,得出的结果是一致的。我们发现,蜈蚣博弈采用逆推归纳法得出的结果之所以违法人们的自觉,原因在于在现实中,人们没有或很少采用风险概率为零的选择。现实中人们的博弈行为受多种因素的影响,其选择往往带有概率性。正是因为现实中存在某种概率性的选择,因此当我们用逆推归纳法这种必然的手段分析动态博弈时,得出的结果往往与预期的不一致,这不是逻辑上的矛盾。这个结果反映的是多主体下个体理性的局限[5]。

  当上述蜈蚣博弈的阶段数大大减少,比如只有3,5个阶段,那么开始时合作的可能性就要小得多。因为选择合作的潜在利益小了很多,而承担的初始风险却相同,逆推归纳法将随时可能起作用。而当阶段数长度进一步增长时,那么合作的概率就会比原先的更大,合作的阶数也相应的增长。一旦A采用风险性选择,只要合作概率大于某个基数时,A的选择就会偏离由逆推归纳法得到的结果。

  三逆推归纳法局限性的逻辑探讨

  利用逆推归纳法分析动态博弈不会产生逻辑上的悖论,但却会产生和实际博弈不一致的结果。原因就在于其推理结构的演绎性,现实博弈的或然性。因此逆推归纳法不能解决诸如蜈蚣博弈等含有或然性的、完全且完美的动态博弈问题。从逻辑角度看,逆推归纳法的有效性存在以下局限:

  首先,逆推归纳法只适合含有唯一子纳什均衡的动态博弈。逆推归纳法是一种寻求必然解的方法。它从动态博弈的最后阶段开始对前一种可能进行分析比较,从中选取最优均衡路径的方法。它得出的结果必须是唯一确定的,因此当出现两条利益相同的路径时,就会无法确定唯一的最优选择,逆推归纳将会在这里中断。再次,逆推归纳法不适合较长的动态博弈。现实生活中,人们的选择往往带有概率性。当博弈的结构较长时,合作的概率就会增加。当超过一定基数时,为了获取长远的利益,博弈双方就会在该概率的基础上选择合作,偏离逆推归纳法的结果。

  参考文献

  [1]谢识予.经济博弈论[M].上海:复旦大学出版社,2002.

  [2]张峰.蜈蚣悖论引发的思考[J].湖南科技大学学报(社会科学版),2005(1).

  [3]陈波.逻辑哲学导论[M].北京;中国人民大学出版社,2002.

  [4]张建军,黄展骥.矛盾与悖论新论[M].石家庄:河北教育出版社,1998.

  [5]潘天群,博弈行为中的演绎与归纳推理及其问题[J],自然辩证法研究2003(3).