打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
“下有对策”难以禁绝之谜

               “下有对策”难以禁绝之谜

                 --“囚徒困境”新解

     公众微信号zhq540605

    规范国有企业体制改革,重要的一项住务是要规范“上有政策下有对策”的现象,可以因此把它视为“政策”与“对策”的博弈。“对策”的出现原因是多方面的,其中很大程度上是由于部分企业管理者自以为得计的策略选择,类似于“囚徒困境”中的权衡。因而借鉴“囚徒困境”中的管理学意义,对于揭开“上有政策下有对策”的产生以及其难以禁绝之谜,规范国企改革,进而规范管理者的管理行为或许是有益的。

                 管理者的另类自由度

    博弈论中对“囚徒困境”的分析被美国经济学家萨缪尔森引入《经济学》一书后,在经济管理领域产生了重要影响。尤其是诺贝尔奖得主纳什提出“纳什均衡”的概念后,把企业管理者的管理行为与“囚徒困境”中的策略选择联系起来进行分析,成为西方经济学中传统假说的一块基石。但是经济学家们对“囚徒困境”的研究,迄今主要是针对囚徒之间可供选择的方案进行,即两个“囚徒”之间是选择合作还是不合作的价值取向或者自由度,对检察官给定的“规则”是不加怀疑的。其实,只要囚徒们冷静地分析一下检察官给定的“规则”,就会发现自己的对手并非仅限于自己的同伙,负责办案的检察官才是更重要的博弈对象,在检察官面前,囚徒们才具有更多的“共同利益”。囚徒们虽然被分别关押,各行其事,完全可以根据他们的“共同利益”独立做出判断,做出暂不伤及同伙,而对囚徒一方更为有利的策略选择。因为这种与检察官合作还是不合作以及如何应对的权衡和选择,我们可以称之为另类自由度。比如在实践中,对公司员工而言,知道了领导的水平,判断领导们是否有能力领导企业,就得到了自己在这里是否有发展的推测,这要比在同事之间相互折台具有更重要的意义。

    西方经济学家对“囚徒困境”中另类自由度的忽视或许是为了研究的方便,但也有西方文化背景的影响。西方文明对正义的理解富有自己的特色,其法治意识较强,强调自然法则。在“囚徒困境”中,就假定了检察官和他们谈话时给定的“规则”是天然正义的。囚徒们或许以为检察官只会严格按照法律原则办案,不会对权力的行使作过多的猜测。东方文明虽然也强调“中正”,但往往离不开“人治”,看重权力。而这两者之间是有区别的。一位西方哲人曾经说过:一个人罪有应得,受到法律的制裁,这是正义的力量;而一个人罪当处死而由皇帝或某高官以不同形式予以减缓,那就是权力。依靠权力,希望自己得“例外”行事之便利的潜意识在东方文化中是无法被忽略的,这种特征在管理中表现的更为明显。在中国传统文化中,管理之道如同兵法,兵不厌诈,重视知彼,擅于权变,讲究方圆。其中,“方”就是基本法规,“圆”是应该有弹性的部分。在东方人看来,像检察官办案之类,一定有他的“权限”范围,利用法律可能存在的弹性,在“权限”之内他是有权变通的,在“权限”之外,他还可以向上级述求。因而他所管辖的囚徒在其给定的“规则”引导下,总有争取法外开恩、变通倾斜的希望。在这种潜意识的指导下,囚徒既使在困境中也不会放弃“另类自由度”的努力。因此,它应当成为对于“囚徒困境”的分析不可忽略的一个变项,至少在中国式的企业管理领域是如此。

    在“囚徒困境”中进行另类自由度上的策略选择,往往并不需要和其他囚徒进行信息沟通,也不需要和其他囚徒合作,完全可以单独进行,有时候单独进行更为有利,因此进行另类自由度上的策略选择是不是被分别关押并不重要。当然,企业管理者不是囚徒,只要他们愿意,就可以进行信息沟通,为谋取某种共同利益达成一定程度的共识,例如签定价格协议之类,另类自由度上的策略选择也就较为便利。西方经济学家也并没有忽略这种倾向,对此也进行了深入的研究,但那主要是“囚徒”之间的横向联合。而我们在这里所说的另类自由度中的策略选择,则主要是指单个的囚徒与检察官之间的“纵向联合”,在现实中的表现就是所谓的跑“部”、“公”关,争取优惠、扶植和政策倾斜等等。或许,检察官先生不会和囚徒共谋,不可能形成正式的联合形式,但这并不等于关闭了所有的沟通渠道,囚徒仍有可能与检察官套近乎,达成其种默契,彼此心照不宣,增加“关照”、“倾斜”的权重。既使囚徒无法实施或者实现不了与检察官的“沟通”,他仅凭其在谈话中给定的“规则”,对这种必要和有限的信息进行深入地分析,仍然可以发现策略迭择的另类自由度的大小。

                既定政策总有“精妙”之处

    在“囚徒困境”中,检察官认定,根据目前掌握的证据,既使两个囚徒均不认罪和坦白,也可以分别判他们各自两年的监禁;如果其中一个人坦白另一个不坦白,那么只对坦白的人监禁半年以下,而对不坦白的人监禁10年以上;但是如果两个人都坦白了,则分别对两人各自监禁5年。这种“规则”对于囚徒来说,显然没有商量的余地,似乎不平等。但是既然做为一种“规则”,就应该对囚徒与检察官双方均有约束力,在这个意义上讲,双方又应当是“平等”的。如果从市场行为来看,“规则”的执行就是检察官与囚徒的“交易”。在这种“交易规则”的约定中尽管检察官居于优势地位,可当他表示要这样办案,也就等于同时做出了愿意遵守的承诺。既然这种“交易规则”更有利于检察官办案,那么也就不难发现其间的破绽:很明显,其真实意图就是想方设法从囚徒的口中掏出新的线索,而那些巧妙的“承诺”都是在为办案服务。

    首先,通过检察官给定的“规则”,囚徒可以推断出“规则”背后隐含的信息。例如可以通过检察官给定的“规则”中推断出检察官目前对两个囚徒共同犯罪所掌握的证据尚有不足之处,根据目前掌握的材料只能分别判他们各自一年监禁;检察官所言两个囚徒都坦白后,将各判他们五年监禁,只能说明检察官推测两个囚徒的犯罪事实可能更严重,而且可以进一步肯定他没有掌握这方面足够的证据;检察官或许根据现有线索进行推测,经过自己的努力可以掌握犯罪更为严重的证据,但是这样做比较困难,或者需要付出额外的努力,或者需要动用更多的资源,而且不能保证有绝对成功的把握,所以他才试图与囚徒进行“交易”。如果说检察官并非刻意偷懒,那么他多少是想在两个囚徒间制造冲突和竞争,以坐收渔翁之利。检察官采取以“规则”与囚徒进行心智的较量的办法,说明检察官先生并非完全是在秉公执法,多少掺进了个人的私念。

    如果我们“上纲上线”地进行分析,甚至可以说他在不择手段,为了达到有利于自己的效果,不惜混淆相关概念,对相关的价值观念进行误导。例如,如果把坦白从宽做为一种法律原则,那么它对每一个囚徒都应当是单独适用的,不能把甲囚徒的坦白与否与乙囚徒的认罪态度进行株联,反过来也是一样。如果量刑要以事实情节为依据,那么就不能轻信口供,即不管囚徒坦白与否都可以定罪。假如双方都坦白时量刑五年为公正的话,那么在一个坦白另一个不坦白的情况下对前者量刑半年对后者量刑10年显然是畸重畸轻,偏离了以事实为依据的原则。检察官给定的“规则”固然是“透明”的,有利于对分别关押的囚徒各个击破,但是在其中制造相互猜疑和算计,则涉嫌诱供,是在对“诚信”缺失风气的推波助澜。如果检察官断定两个囚徒均不坦白时只能各判一年监禁,那么在他们都没有坦白前就断定他们坦白后明确的刑期,显然是一种有罪推定,很难说检察官比囚徒更为“诚信”。如果把囚徒之间的合作当做囚徒职业道德的话的,也很难说检察官比囚徒更讲职业道德,都在挑战职业道德。

    再次,根据“纳什均衡”的原则,囚徒之间两个人都坦白是最好的策略选择,因为在囚徒之间的价值取向或者自由度中,这样做了以后两个人都不会感到“后悔”。但是如果他们果真都坦白了之后,就会大为“后悔”,因为针对囚徒与检察官之间的价值取向或者自由度中,两个囚徒都不坦白时,检察官只能各判他们一年监禁,而两个囚徒都坦白了反而都被判了五年监禁,太不合算了。只要两个囚徒都能认识到这一点,就不难求同存异,做出最佳选择。如果两个囚徒能从同伙之间争高下的思维惯性中摆脱出来,把检察官的“规则”吃透,敏锐地捕捉住其间的“另类”信息:目前掌握的证据只能各判一年,如果都坦白了则要各判五年,从整体利益出发两相比较还是不坦白划算……吃透了其中的精妙之处,囚徒就不难做出最佳的策略选择,实现“帕累托最优”。这样做自己虽然放弃了单独坦白而获减刑的机会,却可以避免大幅加刑的风险,又获得了同伙的信任,在心理上仍然可以实现“纳什均衡”。

    如果我们把检察官给定的“规则”叫做“政策”,那么囚徒针对自己与检察官之间合作与否的价值取向或者自由度,做出不坦白的策略选择就是“对策”,因为这种“对策”破译了“政策”的精妙之处,可以同时得到“帕累托最优”和“纳什均衡”,实现另类双赢,“对策”产生也就不足为怪,反过来说,没有这种“对策”的产生才是奇怪的。

              “对策”有望进一步发挥

    在“囚徒困境”中囚徒针对同伙的策略选择被称为同步博弈,即他们只能同时做出选择;而囚徒分别与检察官的过招则可能会成为交替博弃,因为是检察官的规则出台在先,囚徒们的对策选择在后。从惩罚犯罪的动态过程来看,既使囚徒选择坦白,也不是受政策的道义感召,而是纯理性的趋利行为,很难设想他们能够“痛改前非”。当他们再次犯罪时,可能会更加理性,进一步策划自己的对策,利用犯罪经验钻政策的空子,有望将对政策的“运用”发挥到淋漓尽致的程度。

    第一,当囚徒把自己策略选择的焦点瞄准“政策”,并且发现其中有破绽、有机巧,发现检察官掌握的资源有限时,就可以断定检察官并非法力无边,竟然要尝试着利用自己,有求于自己,因此也就树立了与检察官博弈的信心,开始虚与周旋、讨价还价,即耍花招。当然,这时的囚徒绝不会和检察官直接对抗,而是要以“合作”的态度,得到检察官某种程度的认可,争取检察官透露更多的信息,起到“通风报信”、资源倾斜的实际作用,从而促使他做出变通式的让步。“聪明的”囚徒既可以与同伙进行绝不至于相互直接伤害的博弈,也可以用囚徒方面的“正当”权益要求检察官信守“政策”,把“政策”当作承诺,或者修改某些“规则”。这样,囚徒就可以享受到“双轨制”的好处。

    第二,通过“政策”中所体现的某种机巧,囚徒可以进一步推断检察官有对自己特殊利益的述求,可以投其所好。既然检察官试图利用机巧代替艰苦的调查取证,那么他就有可能将这种机巧用在其他方面,包括用在个人生活领域。囚徒在进行策略选择时就会试图突破“政策”本身的框框,在其他方面对检察官施加影响。例如利用各种可能的渠道通过亲朋好友与检察官拉关系、套近乎,了解检察官有什么个人嗜好。既然检察官希望通过机巧走捷径,进行舒适的工作,那么囚徒就可以投其所好,直接为他提供更为理想的可供舒适工作和生活的物质条件,以争取法外开恩。

    第三,从社会的动态过程来看,既使检察官或检察官的管理机关发现了现行政策的弊端,被囚徒的对策钻了空子,从而修订原有政策,推出新的政策,囚徒仍然会发现新的破绽,推出新的对策。这并非政策的不完善,而是因为无论检察官还是检察官的管理机关,都是社会中的人,都是由具体的个体组成的,而他们所代表的“正义”却是抽象的,总隔着一层皮,总有空子可钻。而且政策的规定越细致、越具体,对策的思考也就越深入、越开阔,越容易打“擦边球”。例如规定囚徒在什么时候坦白,坦白到什么程度算坦白,主犯与从犯的坦白意义有无区别等等,这固然可以限制检察官的自由裁量权,增加了可操作性,但这也同时等于告诉了囚徒在坦白时应当注意的分寸,双方可以在具体尺度上进一步博弈,从而使得对策花样翻新。

    总之,只要有管制的存在,只要存在资源的限制并由管制者负责有限资源的分配,而在分配时又有意无意地要利用某种机巧,就总会有相应的对策出现;当对策屡试不爽时,它也就难以禁绝。如果说社会是永不停息的博弈过程,那么通过“囚徒困境”的分析探讨“下有对策”难以禁绝之谜或许不是什么新发现。但是我们通过“囚徒困境”中另类自由度的分析可以看出,禁绝上有政策下有对策之类的现象,扼制对策固然重要,反思政策的工作也必不可少,后者的规范或许具有更为重要的意义。在政策中,不应当形成“纳什均衡”与“帕累托最优”的巨大反差,否则,政策的执行者在其中追求另类“双赢”,被政策管制的一方仅仅追求“帕累托最优”的努力就会使种种对策产生;而要消除“纳什均衡”与“帕累托最优”的反差,减少政策中隐含的绥靖主义、本位主义、机会主义成份也是必不可少的,这就是“囚徒困境”的新解。

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
陷入“囚徒困境”,何去何从?
2017年10月25日今晚报《日知录》囚徒困境
博弈论经典案例“囚徒困境”及其实证分析
走出学生减负的“囚徒困境”
博弈论之囚徒困境
什么是博弈论:从“囚徒困境“说起
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服