打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
“好人终有好报”是否只是我们天真的幻想


最近在读《自私的基因》,这本书意在讨论个体的自私性和利他性。其中有一章的内容非常吸引我,题目是《好人终有好报》。小的时候看影视作品,经常会听到这样的台词,那时候我对这句话是坚信不疑的。但随着年纪渐长,如果我说我还相信这一点,大概会被人认为太过于天真,没有遭受过社会的毒打。他们会说这句话只是对吃了亏的好人的安慰而已,身边有太多例子印证了这不是一句真理。

到底是不是一句正确的话,我们先暂且不提。我想我们大部分人一般得出的结论,都是从已有的经验来判断,但作者并没有从一般的认知上来考虑这个问题,他没有从历史的角度来论证“好人终有好报”这一命题,而是另辟蹊径,采用了逻辑推理的方式来验证“好人终有好报”。

博弈论:囚徒困境

首先,他引入了博弈论,囚徒博弈最原始版本是这样的:一个银行家判定两位玩家的输赢,并对赢家付与报酬。我们手中各有两张牌,“合作”与“背叛”,我们每一回合选定一张牌,由银行家来翻牌。我们一共有2X2=4张牌,所以也便有了四种输赢结果。

结果1:我们都选择合作,银行家给我们俩每人300美元,这是对相互合作的奖赏。
结果2:我们都选择背叛,银行家对每个人罚款10美元,这是对相互背叛的惩罚。
结果3:你选择合作,而我选择背叛。银行家付给我500美元,罚了你100美元。
结果4:你选择背叛,而我选择合作。银行家将背叛的诱惑500美元付给了你,而我要被罚款100美元。

结果3和4互为镜像,一个玩家得到好处,而另一个付出代价。而在结果1和2里,我们俩则得到相同的结果,结果1对我们都有好处,结果2对我们都没有什么好处。

这个博弈结果的排列顺序:背叛的诱惑(500美元)>相互合作的奖赏(300美元)>相互背叛的惩罚(-10美元)>失败的代价(-100美元)。(注:背叛的诱惑与失败的大家的平均值不可高于相互合作的奖赏)

但这为什么是一个困境呢?

如果你在打出“背叛”,那么我最好的选择也只能是“背叛”,虽然这也会受到惩罚,但我知道,如果我打出“合作”,失败者的代价只会更高;而如果你选择了“合作”,我的最好结果也只能选择“背叛”,如果我们合作,我们都能得到300美元,但如果我选择背叛,我将得到更多——500美元。这里的结论是:无论你选择哪张牌,我最好的选择是永远背叛。

而你也将推理出同样的结果,于是当两个理性的对手相对时,他们将同时背叛,并同时被罚款。             

而囚徒困境是一个更特殊的例子,两个囚犯A和B被各自关押在单独牢房中,被各自劝诱背叛他们的同伙,以将所有犯罪证据栽赃于对方。


如果仅以理性的自我利益为动机,两人都只能背叛对方,接受重罚。逃离困境的办法是合作,但没有任何方法可以达成信任,这个博弈注定以相互背叛,相互损伤而告终。在“囚徒困境”这个简单的博弈里,没有任何方法可以达成信任,善良不可能适应这个世界。

重复博弈

但是重复博弈不一样,重复博弈只是简单将上述博弈同一个对手无限次重复,所有规则都一样,只是一轮博弈后会开始下一轮,这下一轮的游戏给予我们机会重新建立信任与怀疑,实施对抗或和解,给予报仇或宽恕。在这无限长的博弈里,我们最重要的任务是赢了银行家,而不是对方。

在10次博弈后,理论上我们可以获得最高5000美元,但只有其中一方是傻瓜,我们才有可能每次都得到“背叛的诱惑”。更实际一点,我们10次都合作,这样我们可以从银行家那里各自得到3000美元的奖赏,也有可能我们10次都背叛,或者打出各种次序的“合作”和“背叛”。

善良和宽容是最佳策略

简单博弈中,背叛是唯一的理性策略,但重复博弈不同,它提供了许多选择范围。接下来研究者组织了一场竞赛,14个策略加上一个随机策略(简单随机打出“合作”或“背叛”),并把他们翻译成计算机语言,在一个大型计算机中设定这些策略相互博弈。

最后胜出的策略是一个叫作“针锋相对”的策略,它是这其中最简单,看起来最不聪明的一个策略。它在第一回合采取合作,然后在接下来的所有步骤里,只是简单复制对手上一步的行动,它下一步的出牌完全取决于对手,如果双方都选择针锋相对策略,合作开场,那么双方都能获得100%的600分基准分。也就是说,“针锋相对”是我首先选择善良,可如果你一旦背叛,我也绝不手软,让你也常常报复的滋味,但如果你以后悔改了,继续合作,那么我也既往不咎,下一轮也会和你继续合作。

其他成绩比较好的策略还有“老实人探测器”(基本等同于针锋相对,但每隔一会儿这个策略会打出恶意的背叛牌。但下一步针锋相对就会开始报复打出背叛,而老实人探测器继续合作)和“愧疚探测器”(类似于老实人探测器,但是会因愧疚而终止报复),“愧疚探测器”的成绩好于“老实人探测”器。而最失败的策略是最复杂的那个。

这些成绩在前面的策略里,最重要的类别是善良,善良类别指的是那些从不率先背叛的策略。而另一个术语则是宽容,一个宽容的策略只有短期记忆,虽然它也采取报复行为,但很快就会遗忘。“针锋相对”便是一个宽容的策略,面对背叛毫不手软,但之后则让往事随风。而这其中善良却绝不宽容的策略,在所有善良策略中排倒数第二,即使对手悔改,它也不愿打破相互背叛的恶性循环,因此无法取得高分。

他们甚至为了测试宽容的重要性,又设计了“两报还一报”的策略,允许对手连续两次背叛后才开始报复,这看起来似乎过分大度了,但只要有它在,它便一定会得到冠军,因为它可以有效避免长期的互相伤害。

通过这个实验,所有人都惊讶于这个几乎乌托邦式的结论:“善良和宽容会得到好报。

环境同样很重要

于是又举办了第二次竞赛,第一次竞赛的结果和分析都分享给了参赛者。这一次有62个策略+随机策略。一位参赛者提交了最为宽容的“三报还一报”的策略,另一组认为既然大家读了上一次竞赛的分析,大概都会提交善良策略,于是便提交了恶意的策略,以期在对手中占到便宜。然而这一次,恶意再一次没有得到好报。“针锋相对”再一次获胜,获得满分的96%,而善意策略又再一次赢得了恶意策略,前15名只有一个策略是恶意策略,倒数15名中只有一个是善意策略。而这一次更为宽容的“两报还一报”却没有成功,因为这次竞赛有一些更为狡猾的恶意策略,它们善于伪装自己,无情地抛弃那些善良的人们。

第二次竞赛揭示了非常重要的一点:成功的策略取决于你的对手的策略。第一次竞赛中,刚好参赛的策略基本都是善意的策略,所以“针锋相对”胜出,而如果更宽容的“两报还一报”参赛,则会赢了“针锋相对”。但如果几乎所有参赛策略都是恶意策略,“针锋相对”不可能成功,因为环境太差。

如何减少环境的主观性?

那么问题来了,环境不是由谁可以主观决定的,我们如何减少竞赛的主观性?答案是“进化稳定策略”。进化稳定策略(Evolutionarily Stable Strategy),凡是种群的大部分成员采用某种策略,而这种策略的好处为其它策略所不及的,这种策略就是进化上的稳定策略。换句话说,对于个体而言,最好的策略取决于种群的大多数成员在做什么。由于种群的其余部分也是由个体组成而它们都力图最大限度地扩大其各自的成就,因而能够持续存在的必将是这样一种策略。

如果说“针锋相对”策略是一种进化稳定策略,那么在充满“针锋相对”的大环境中,“针锋相对”策略便会得到不错的结果。这便是一种特殊的强劲,在达尔文主义的世界里,成功不是赢得金钱,而是获得后裔,一个成功策略将是一个在种群策略中数量众多的策略,也就是说它在充满自身复制大环境中能得到特别好的结果。

这一次竞赛组织者又模仿自然选择,进行了第三场竞赛来寻找进化稳定策略。他将第二次竞赛中的63个策略再次丢给了计算机,来制造进化演替的“第一代”。比赛结束后,赢家不再得到金钱或分数,而是与其完全相同的后代。世世代代如此传递,一些策略变得数目稀少,甚至完全绝迹,另一些策略则数目众多。当环境中策略的比例变化,博弈中策略的出牌也在随之变化。

最终在1000代之后,种群不再变化,环境也没有再改变,稳定状态已经形成。一些策略在一开始便已经灭绝,大多数则在200代之后彻底灭绝。在那些恶意策略中,有一两个一开始蓬勃发展,但它们的繁荣只是昙花一现。它们刚开始欺负如“两报还一报”之类过于宽容的老实人以获得发展,但当老实人消失后,它们失去猎物,也跟随着它们的命运而灭绝。这让我想起一句话,当羊都被狼吃光以后,狼也就成了羊。那么存活下来的策略都类似于“针锋相对”,既善良又容易被煽动报复。

“针锋相对”在第三轮竞赛中,6次有5次赢了第一,另外5个虽善良但容易报复的策略几乎和它一样成功(在种群的数目上),还有一个策略赢了第六次比赛。当所有恶意策略都灭绝后,所有善良的策略都无法辨认彼此了,它们只是简单与所有对手合作到底。

无法辨别使得“针锋相对”在严格意义上并不是一个真正的进化稳定策略。在善意策略群体里,它们行为相同,比如“永远合作”这种选择优势不如“针锋相对”的策略,也可以溜进来不被发现。“永远合作”并不能抵挡一些恶意策略的入侵,比如“永远背叛”,它每次都可以得到最高分。类似“永远背叛”这样的恶意策略会减少过分善良策略的数目。这和我们人类的生活几乎如出一辙,过分善良就是会被欺负,要适当展现我们具有报复的能力,当受到欺负后我们能够反击,才会让那些怀有恶意的人心有顾虑。

在实际操作中,我们还是可以将这一类善意又宽容、与“针锋相对”类似的策略近似看作进化稳定策略,也是可行的,甚至可以包括一小部分恶意策略。“针锋相对多疑版”,第一回合背叛,之后和针锋相对完全相同的恶意策略,如果它在针锋相对主导的环境中,它的先行背叛会导致相互背叛的恶性循环。它们把“两报还一报”与“针锋相对多疑版”组合到一块,由于“两报还一报”的宽容,它们可以做到共生繁荣,进而影响“针锋相对”种群。这里我们似乎可以看到人类生活的对照。

“永远背叛”策略也可以和“针锋相对”一样稳定,但被它控制的种群中,没有任何策略可以取胜。但正如我们可以预见的那样,永远背叛个体的聚合,不仅不能彼此互助而获得群体繁荣,还会使各自的生存环境更加恶劣,这似乎就是寓言中描述的地狱的样子。

而“针锋相对”却拥有更高的稳定性,用长远的目光看,它们能够通过互相合作来达到数目繁荣,即使最初很少,也会逐渐扩散,甚至包括“永远背叛”主导的地区。最后它能先达到决胜点(达到某一数量优势就会稳定),得到自然选择的青睐。这也是当今世界提倡共赢的原因,如果尽是做损人不利己的事,最终自己也会走向衰落和灭亡

不嫉妒也是很重要

什么是不嫉妒,嫉妒是希望赢过对手,获得比对手更多的金钱,而不是追求从银行家手中得到绝对数量较大的收获。不嫉妒表示当对手获得与你一样的金钱时,只要大家都能从银行家那里获得更大收获,你也同样高兴。“针锋相对”从未赢得比赛,它除了报复之外从未背叛,它的最好成绩是平局,但它尽量在每一场博弈中都获得尽量高的共享分数。

心理学家在人群中实验囚徒困境的博弈时,发现几乎所有人都会嫉妒,这表示许多人在潜意识中更倾向于击败对手,而不是与他人一起合作击败银行家。

博弈理论家将博弈分为“零和”与“非零和” 两种。零和博弈指一方的胜出即是对方的损失,棋类游戏便是一种零和博弈,因为博弈双方的目标是胜过对方。囚徒困境则是非零和博弈。在这里,银行家支付了金钱,博弈双方可以携手合作,一起笑到最后。

莎士比亚写过一句精彩的台词:“我们要做的第一件事,就是把所有律师都先杀了。”——《亨利六世》

在民事争议中,事实上经常有很大空间可以合作,一个看似零和博弈的争议也许只要加入少许善意,便可以转化为双方互利的非零和博弈。比如离婚,一个好的婚姻明显是一个非零和博弈,充满了互助合作的空间。但即使当它瓦解时,夫妻们依然可以继续合作,以非零和博弈来看待离婚,并从中得到好处。双方律师的高昂费用就很有说服力,因为他给家庭财政造成巨大损失。而只要律师以完全相反的方式工作,劝说顾客放弃零和博弈的厮杀,就可以从庭外和解的非零和博弈中得到更多好处。在生活中值得注意的是,我们是否被嫉妒所驱使,把非零和博弈误会为零和博弈。

足球比赛是一场零和博弈,一般情况都如此,但少数情况下它能变成非零和博弈。比如在赛季结束时,甲级中排名最后的3个俱乐部则降级,进入乙级联赛。在现实中会有这样的情况,本来都需要力争赢得比赛,但因为另外两支队伍的比赛结果已经提前知道,那么最后一场比赛只要这两支队伍踢成平局,他们们就都可以保级成功,他们无需拼尽全力去争个你死我活了,只要平局就可以,于是这最后一场比赛变成了非零和博弈。

博弈必须重复,并且“未来阴影”足够长

现实生活中大部分情况都是非零和博弈,社会扮演了银行家的角色,个人可以从对方的成功中获益,即使在自私的人类社会,合作与互助同样促使社会兴旺发展,也就是我们经常说的人和人之间都是相互成全的。但这只能发生在博弈重复的情况下,理论上来说,博弈长度并不重要,重要的是“未来阴影”足够长,也就是博弈双方必须都不清楚博弈结束的时间。假设双方知道第100回合就结束博弈,那么第100回合就将等同于一场简单的一次性囚徒困境,他们一定会在最后一轮打出背叛,自然也就预测了对方都会背叛,既然如此,那么99轮的唯一理性决策也只能是背叛了,以此类推,如果他们知道了回合数,他们就会不停背叛彼此。

在第一次世界大战时,英军和德军会在圣诞节一起喝酒。甚至他们双方还会心照不宣地相互合作,他们都相信“让自己活,也让别人活”。在当时的壕堑战中,每个野战排的未来阴影都很长,他们也许要对峙几个月,没有人知道何时会离开。也就是说他们双方都不清楚博弈结束的具体时间,他们都相信相互合作对彼此都有利,因为士兵都想活下去,于是他们之间形成了类似于针锋相对的行为策略。

他们双方选择在固定的时间向固定的方向发射炮弹,而不会伤到双方的任何人,这种仪式性的炮击仪式与规律性的开火表达了双重信息。对于上级,它们表达了抗争,而对于敌军,它们传递了和平。

“让自己活,也让别人活”的这个理性的策略是通过回应对方行为的方式传递的,在一系列的局部约定中形成。 一个策略是否善良,仅由其行为所确认,并非由动机和作者的性格决定。这个有些类似于我们说的论迹不论心。

一些有益于人体的细菌,会在人们受伤时,变成有害甚至致命的败血症。医生会解释为人体抵抗力下降,但从另一个角度来看,在人体与细菌的博弈中,未来阴影通常很长,一个普通人可以活很多年,而严重受伤者则可能给其寄生菌带来较短的未来。背叛的诱惑突然比互相合作的奖赏更具诱惑力,于是它们背叛了。

自然界广泛采用“针锋相对”策略

植物虽然没有意识,但他们甚至会懂得复仇。无花果树和榕小蜂是紧密合作的关系,榕小蜂栖息在无花果中,并在里面产卵,同时为无花果树授粉,但如果榕小蜂不为它的花朵授粉,无花果树会去除掉这颗还处于生长中的无花果,使得所有榕小蜂的后代都走向死亡。

雌雄同体的海鲈鱼也说明了自然界中针锋相对的现象。每一条海鲈鱼都有雄性和雌性的功能,在每一对夫妻组合中,轮流扮演爸爸和妈妈的角色。我们可以推测,由于爸爸生完孩子就可以溜之大吉,不必承担抚养后代的责任,所以海鲈鱼也许更愿意当爸爸。事实上,它们却是轮流来担任爸爸和妈妈的,并且非常严格。如果一条海鲈鱼这一次做了爸爸,下一次却拒绝当妈妈,那么它就是背叛了,它的伴侣一定会报复它,会拒绝扮演妈妈或者直接和它中断伴侣关系。

社会心理学家也提出一个问题:为什么有人会愿意无偿捐赠血液?这些长期血液捐赠者需要输血时,并未得到任何优先次序。这是一种真正的、纯粹的无私利他主义。而吸血鬼蝙蝠之间也会同室友进行血液共享,它们以吸血为生,但得到食物并不容易,总有一些时候它们会饿肚子,而另一些则找到了一个受害者,吸了充足的血液。以后的每个晚上,同样的故事又在上演。于是吸饱血液的蝙蝠会把这些血液分享给那些跟自己同一巢穴里饿着肚子的蝙蝠,它这么做完全是因为有时候它也会饿着肚子回来,也同样希望得到同伴的馈赠得以继续活下去,这是一个关于共享、互助、合作的故事。但对于陌生的吸血蝙蝠,它们可就没有那么慷慨了,因为它们不能确认它是否值得信任,可以和它们建立长期的合作关系。

达尔文主义赋予我们的并不是一个特定生物的描述,而是一个更微妙、却更有价值的工具:对原理的理解。而这些吸血鬼蝙蝠昭示着一个善良的思想:即使我们都被自私的基因操控,但好人终有好报。

“好人终有好报”原来不只是我们天真的幻想,即使它的实现是有条件的。

经由以上的论证,我们发现在自然界,无论是动物还是植物,善良和宽容都能让自己的种群繁荣,但仅仅是善良和宽容却不足够支撑这一切,它们必须同时展现自己的报复能力,第一时间让对手知道自己也可以选择不合作的这样才能够对恶意的对手产生威慑力,让它们乖乖合作下去。它们要同时拥有菩萨心肠和金刚手段,才能生存繁衍下去。而如果为了让利益最大化,它们也要做到不嫉妒,彼此成全,达到共赢才是最终的奥义。

而这一切的前提条件是,你和对手的博弈时间足够长,长到你们双方都无法获知何时会结束这场博弈。推及到我们人类的社会生活,我想这些结论也是很有启发的。至少你可以知道,和陌生人的交往中,我们要做到防人之心不可无,而当你面临一个绝对的恶劣环境,一味地善良和宽容是行不通的,你的选择不是忍耐下去或者同他们一样变得恶意,而是尽快逃离这个恶劣的环境,到一个正常的环境中去作一个善良、宽容而不嫉妒的人

“好人终有好报”,无论是宗教也好,哲学也好,其实最终都推向了这样的一个结论,也许古代的圣贤是通过观察生活发现了这样的规律,如今我们找到了更科学的论证方法。我很欣慰看到了这样的结论,原来“好人终有好报”不只是我们天真的幻想,即使它的实现是有条件的。

P.S.为了写这一篇,真的是耗费了好多脑细胞:)

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
最优策略是动态的
博弈论案例分析
背叛还是合作--这是一个难题?
好人终有好报 ——《自私的基因》共读打卡集锦12 | 悦读读书会出品
自私基因
商战“囚徒困境”有解
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服