第28章 蜈蚣博弈,想到百步之后(1)
这是一场颠前倒后的博弈。蜈蚣博弈的机理是以最终的结果倒退至开始。这是一个睿智的策略,因果相报,把握好因缘,自有好结果。它的另一个好处,就是使得未来的计划明晰化,使你不再徘徊。
做任何事情的时候,你都可以从目标出发,根据目标的要求,规划实现目标的路径,明了实现目标的条件,并在实际工作中努力去发现、借助和创造实现目标的条件,按照路径一步步推进,最终实现目标。
逻辑和直觉的悖论
蜈蚣博弈是由罗森塞尔(Rosenthal)提出的。它是这样一个博弈:两个参与者A、B轮流进行策略选择,可供选择的策略有“合作”和“背叛”(“不合作”)两种。假定A先选,然后是B,接着是A,如此交替进行。A、B之间的博弈次数为有限次,比如100次。假定这个博弈各自的支付给定如下:
合作 合作 合作 合作 … 合作 合作
A B A B …… A B (100,100)
合作 合作 合作 合作 … 合作 背叛
A B A B …… A B (98,101)
这个博弈因形状像一只蜈蚣,而被命名成蜈蚣博弈。
现在的问题是:A、B是如何进行策略选择的?
这个博弈的奇特之处是:当A决策时,他考虑博弈的最后一步即第100步;B在“合作”和“背叛”之间作出选择时,因“合作”给B带来100的收益,而“不合作”带来101的收益,根据理性人的假定,B会选择“背叛”。但是,要经过第99步才到第100步,在99步,A考虑到B在100步时会选择“背叛”——此时A的收益是98,小於B合作时的100,那么在第99步时,他的最优策略是“背叛”——因为“背叛”的收益99大於“合作”的收益98……如此推论下去,最后的结论是:在第一步A将选择“不合作”,此时各自的收益为1,远远小於大家都采取“合作”策略时的收益:A:100,B:100-99。
不难看出,在该博弈的推理过程中,运用的是逆推归纳法。从逻辑推理来看,逆推归纳法是严密的,但结论是违反直觉的。直觉告诉我们,一开始就停止的策略A、B均只能获取1,而采取合作性策略有可能均获取100,当然A一开始采取合作性策略有可能获得0,但1或者0与100相比实在是太小了。直觉告诉我们采取“合作”策略是好的。而从逻辑的角度看,A一开始应选择“不合作”的策略。是逆推归纳法错了,还是直觉错了?人们在博弈中的真实行动“偏离”了运用逆推归纳法关於博弈的理论预测,造成二者间的矛盾和不一致,这就是蜈蚣博弈的悖论。
对蜈蚣博弈进行实验的结果也表明,在绝大多数任意选择的博弈方之间进行该博弈,一般都不会出现逆推归纳法预测的博弈方A在一开始就选择结束博弈时双方收益为1的结果。蜈蚣悖论对逆推归纳法的有效性提出了严重的质疑:逆推归纳法是否失效了?
对於蜈蚣悖论,许多博弈专家都在寻求它的解答。在西方有研究博弈论的专家做过实验(目前通过实验验证集体的交互行为已成时尚,正如博弈论专家英国的宾莫(Ken Binmore)所言,诺贝尔奖也无疑在考虑这方面的先驱者),实验发现,不会出现一开始选择“不合作”策略而双方获得收益1的情况。双方会自动选择合作性策略,从而走向合作。这种做法违反倒推法,但实际上双方这样做,要好於一开始A就采取不合作的策略。
倒推法似乎是不正确的。对此,许多学者进行了研究,结果认为双方开始时将选择合作性策略,虽然这违反博弈中的倒推分析方法的逻辑,但的确要好於最初就选择背叛所带来的收益。只不过理性的人会出於自身利益的考虑,在某一步选择背叛,即虽然最初选择了合作,但这种合作却不可能坚持到底。倒推法肯定在某一步要起作用。只要倒推法在起作用,合作便不能进行下去。
这个悖论在现实中的对应情形是,参与者不会在开始时确定他的策略为“不合作”,但他难以确定在何处采取“不合作”策略。
在蜈蚣博弈中,根据逆推归纳法,博弈方在一开始就应该选择结束博弈,即博弈双方的得益均为1。这是不符合双方的长远利益的。逆推归纳法的路径与博弈方的长远利益相悖,因而博弈方不会按逆推归纳法的逻辑推理去决策。在该博弈中,如果博弈的双方彼此信任、默契,彼此相信对方是理性的,彼此相信对方会追求自身的长远利益与整体利益,那么双方选择合作策略的可能性会更大。而且在现实生活中,如果博弈双方相互信任、从长远利益与整体利益出发去进行策略选择,结果往往是双赢。
下面我们来举一个生活中的恋爱故事来说明这个博弈:
爱情就其本质来说是一种交往,人交往的目的在於个人效用最大化,不管这个效用是金钱,还是愉快的感觉、幸福的感觉。只要追求个人效用,就必定存在利益博弈,因而,我们的爱情交往是一个典型的双人动态博弈过程。爱情博弈不等同於其他动态博弈的一个重要点是:爱情的效用随着交往程度的加深和时间推移有上升趋势。
假定茱丽叶(女)和罗密欧(男)是这个蜈蚣博弈的主角,这个博弈中他们每人都有两个战略选择,一是继续,一是甩。他们的博弈展开式如下:
■
在上图中,博弈从左到右进行,横向连杆代表继续交往战略,向下的连杆代表甩掉她(他)战略。每个人下面对应的括号代表相应的人甩了对方,爱情结束后,各自的爱情效用收益,括号内左边的数字代表茱丽叶的收益,右边代表罗密欧的收益。可以看到,罗密欧和茱丽叶甩战略对应的括号数字每个都不同,这是因为爱情效用在不断增加,这里假设爱情每继续一次总效用增加1,如第一个括号中总效用为1+1=2,第二个括号则为0+3=3,只是由於选择甩战略的人不同,而在两人之间进行分配。由於男女生理结构和现实因素不同,茱丽叶甩战略只能使效用在二人之间平分,即两败俱伤,罗密欧选择甩战略则能占到3个便宜。显然,甩战略对於被甩的一方来说是一种欺骗行为。
请看,首先,交往初期茱丽叶如果甩了罗密欧,则两人各得1的收益,茱丽叶如果选择继续,则轮到罗密欧选择,罗密欧如果选择甩了茱丽叶,则茱丽叶属受骗,收益为0,罗密欧占了便宜收益为3,这样完成一个阶段的博弈。可以看到每一轮交往之后,双方了解程度加深,两人爱情总效用在不断增长。这样一直博弈下去,直到最后两人都得到10的收益,为圆满爱情结局——总体效益最大。遗憾的是这个圆满结局很难达到!
大家注意,当罗密欧到达甩了茱丽叶可得收益是10的时候,他很难有动力继续交往下去,继续下去不但收益不会增长,而且有被茱丽叶甩掉反而减少收益的风险。茱丽叶则更不利,因为她从来就没有占先的机会,她无论哪次选择甩罗密欧,二者都是两败俱伤,而且还有可能被罗密欧欺骗减少收益的危险,在爱情过程中,女人总体来讲处於不利地位。因此,每一次交往,无论罗密欧还是茱丽叶都有选择甩来中止爱情的动机,更详细的数学可以证明,如果他们是极端个人主义的话,爱情圆满的结局不可能达到。个人效益最大与总体效益最大之间有矛盾。
怎样才能达到圆满结局呢?有三个因素决定,一是罗密欧和茱丽叶之间的爱情信念,即追求两个人的爱情效用最大,而不是单方面的,相信坚持下去会有好的结果;二是选择充分信任对方的行为,不要摆明了猜忌对方;三是最终结局的可能性,在博弈论中这个叫贴现因子,也就是未来的收益对於现在的收益来讲,哪个更大,比如对罗密欧来讲,最终结局的收益10肯定不会等於当前甩了茱丽叶得到的10,哪个更大,罗密欧就选择哪个。两人对於爱情未来的观念和信念真的很重要。
通过这个恋爱的分析,你可以发现,遵循於逻辑倒推的蜈蚣博弈在某些条件下,不一定会成立,并且有很大的局限性。倒推法的成立是需要一定条件的,不适於分析所有动态博弈。不过,只要条件容许,被分析的问题符合客观成立的要求,倒推法绝对是一种分析动态博弈的有效方法,我们可以通过这种方法来改善我们的生活,解决遇到的难题,甚至是帮助自己走向成功。