打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
盛·趣谈| 囚徒困境,选择合作还是背叛

“囚徒困境”是关于博弈论的一个故事(模型),在哲学、伦理学、社会学、经济学乃至生物学学科中,都获得了极为广泛的应用(该理论诞生自1950年)


故事的大意是这样的:

一天一位富翁被杀,财物被盗。警方在此案的侦破过程中,抓到两个犯罪嫌疑人,但是他们都矢口否认曾杀过人,辩称是发现了富翁被杀后,顺手牵羊偷了点儿东西。于是警方将两人隔离审讯。检察官分别对他们这样说的:

“你的偷盗罪确凿,所以可以判你1年刑期。但是,我可以和你做个交易。如果你单独坦白杀人的罪行,我只判你3个月的监禁,但你的同伙要被判10年刑。如果你拒不坦白,而被同伙检举,那么你就将被判10年刑,他只判3个月的监禁。但是,如果你们两人都坦白交代,那么,你们都要被判5年刑。” 

囚徒困境中的纳什均衡▲

当然最好的策略是双方都抵赖,大家都只被判1年,但是,由于两人处于隔离的情况下无法串供,而且即使他们能交谈,还是未必能够尽信对方不会反水。而选择“沉默”将会使自己面临“被判10年”的风险。试想下这种情况中两名理性囚徒会如何做出选择:

※若对方沉默,背叛会让我获释,选择背叛

※若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以还是选择背叛

鉴于二人面对的情况一样,所以这场博弈中唯一可达到的平衡,就是双方参与者都背叛对方,结果二人同样服刑5年

如此一来,在以上四种行动选择组合中,(抵赖、抵赖)是“帕累托最优”,因为该种状况外的其他状况都会使一个人的境况变差。而这样(坦白,坦白)是一个占优战略均衡,即如此都被判5年被称为“纳什均衡”,也叫非合作均衡。从这里可以引出一个悖论:损人却不利己。它阐明了为什么“在合作对双方都有利时,保持合作也是困难的”。

现实中的“重复的囚徒困境”。

按照囚徒困境,合作最好,背叛则两败俱伤,但最终还是会选择背叛。而在现实中,类似囚徒困境的场景常常出现,但更多的结局则是合作而不是背叛。为什么?


可能的原因是,通常困境不止这一次


比如就像“电影”中那样,两个囚徒属于同一个组织,背叛之后将会被组织追责.....如此,他们可能需要重复博弈,或者受到更强大的制约。这样合作就比较容易出现了。

实际生活里我们会面临多次重复的囚徒困境,博弈被反复地进行,因此,每个参与者都有机会去“惩罚”另一个参与者前一回合的不合作行为。这时,合作可能会作为均衡的结果出现。欺骗的动机这时就会被受到惩罚的威胁所克服,从而可能导向一个较好的、合作的结果。

简而言之,为避免“冤冤相报何时了”,纳什均衡将趋向于帕累托最优

善意的决策可能吃亏,但也会成为别人今后和你合作时进行决策的依据,所以,与其被迫在得到惩罚之后才选择合作,不如大家都遵守游戏规则。当然,现实生活的复杂程度也许会超出我们的想象,我们也不能单纯地信任别人。

真实案例分享

现实中囚徒困境可以广为地使用,更是说明这种博弈的重要性。以下为例:

关税战

两个国家,在关税上可以有以两个选择:

提高关税,以保护自己的商品。(背叛)

与对方达成关税协定,降低关税以利各自商品流通。(合作)

当一国因某些因素不遵守关税协定,而独自提高关税(背叛)时,另一国也会作出同样反应(亦背叛),这就引发了关税战,两国的商品失去了对方的市场,对本身经济也造成损害(共同背叛的结果)。然后二国又重新达成关税协定。(重复博弈的结果是将发现共同合作利益最大。)

双赢局面

美国《60分钟时事》报道:曾经在一段长达52周的时间里,可口可乐和百事可乐分别放了26期折扣券,其间没有出现两家同时发放折扣券的现象。

若无事先合作(或默契),这种情况发生的可能性低于四千万亿分之一。

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
博弈中的黑马——纳什均衡
博弈论与共享经济——囚徒困境与配对理论分析
从自私走向合作(1)
从博弈论角度分析给定党政一把手合作责任的弊端
极简博弈论,学习之后、智慧大增
《囚徒困境》论文
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服