稳定匹配理论与市场设计实践

一年一度的诺贝尔经济学奖举世注目，但诺贝尔评奖委员会的结果有些出人预料，美国经济学家沙普利（Shapley）和罗斯（Roth）摘得此项桂冠，原因是他们在稳定匹配理论及市场设计实践方面作出了卓越贡献。在欧美发达国家深受高失业困扰的今日，对有助于雇主和求职者结合的稳定匹配理论，及可降低市场失灵的市场设计机制授以殊荣，反映出诺贝尔奖委员会希望以经济学理论推动社会发展的良苦用心。

　　稳定匹配理论：稳定性思想

　　在介绍稳定匹配理论之前，先从合作博弈理论的角度介绍一下稳定性的思想。

　　效用可转移条件下的联盟博弈

　　假定市场上有N名个体市场参与者，一群个体参与者通过建立联盟（经济组织）互相合作。联盟形式的博弈具有效用转移的特性，即联盟的总效用不能低于独立个体效用之和。联盟运用其经济资源创造的价值（效用）被称为经济剩余。联盟创造的效用（或利润）可以通过成员认可的任何方式分配，每个成员的效用等于他获得的经济剩余份额，这就是可转移效用。

　　合作博弈理论研究联盟成员的个体激励问题，假定联盟成员内部利益冲突可以通过合约约束化解。合约内容包括联盟成员采取行动实现联盟经济剩余的最大化，这个最大化的剩余就是联盟的价值。然而，如果联盟的剩余还依赖非成员的行动时，困难就会出现。在这种情况下，联盟的价值通过相同的方式实现，即假定非成员也试图最大化自己的效用。

　　在效用可转移博弈中，假定参与者可通过单边支付（私下交易）自由转移自己的效用。但在某些情况下，单边支付受到制约，参与者的效用不可转移。比如在人体器官捐献机构中，单边交易被认为是非法和令人反感的。

　　稳定性与核心

　　稳定性思想在合作博弈理论中，与非合作博弈理论中的纳什均衡相对应。在非合作博弈理论中，纳什均衡是指一种状态，在这种状态下没有参与者可以偏离并使自己变得更好。从经济学角度看，稳定性构成了理想的无摩擦市场中的重要方面。如果个人拥有无限的时间和能力进行相互交换（即交易成本为零），那么结果肯定满足稳定性，或者必定有积极性形成一些联盟来增加成员的效用。沙普利是最先清晰阐述稳定性概念的经济学家之一。

　　我们通过一个例子来解释如何识别稳定匹配，并表明核心（一系列稳定匹配）有时会相当之多。

　　有一家由一名高级合伙人（玛丽）和两名初级合伙人（彼得和保罗）组成的联盟的利润是135，如果玛丽离开联盟，她每年可以赚50。而每一名初级合伙人离开联盟每年可赚10。假定玛丽与任何一名初级合伙人联盟可以赚90，两名初级合伙人联盟可以赚25。在效用可转移情况下，最理想的联盟收益是135，且成员可以无成本地以任何方式分配135单位收益。而玛丽可以得到的最低收益是50，每个初级合伙人最低收益是10，这样才可能促使他们建立联盟。因此，稳定性的条件是玛丽至少得到50，而彼得和保罗至少各自得到10。

　　“二人联盟”假定，当两名初级合伙人的收益之和小于25时，他们可以通过联盟增加他们的收益；玛丽和任何一名初级合伙人的收益之和小于90时，他们也可以通过联盟提升他们的收益。这也是稳定性需要满足的两个条件。

　　以上的几个条件与三人组成联盟的利润为135这一约束条件归在一起，可以得出在联盟中玛丽的最低收益是50，最高收益是110（原因是彼得和保罗联盟的最低收益是25）。

　　稳定匹配的存在性

　　玛丽例子中显示的核心可能相当之多，但在其他情形下，核心可能并不存在。如将上文最理想联盟的经济剩余修改为101，另外的几个条件也满足，就可以发现联盟仅产生101的经济剩余不能形成稳定的匹配。一般认为，如果联盟不能形成足够的剩余，那么联盟内不可能形成稳定的分配方式。早在20世纪60年代，沙普利等经济学家证实了这一点。

　　核心与竞争均衡

　　经济学家埃奇沃斯最早对参与者不满足他们的市场收益可以退出市场通过私下交易增加收益的观点提出质疑，他认为合约曲线由一系列不可通过重新签约撼动的结果组成。埃奇沃斯认为，当市场上有足够的参与者时，合约曲线将接近于竞争均衡，他对市场上仅有两种货物和两名参与者的模型进行了修正。其他学者对埃奇沃斯的理论在更加普遍的假设下进行了补充：如果经济中可复制出足够多的各种类型的参与者，那么核心（稳定匹配的集合）就接近于充分竞争的均衡点。于是，在缺乏特定详细的交易规则的条件下，核心为竞争均衡提供了理论基石。

　　稳定匹配理论：匹配市场

　　在很多市场上，货物是私人的，但它们是不可分割和非同质的，因此传统假定的充分竞争条件并不满足。如熟练技工市场，由于没有两名特征完全相同的技术工人，特定工种的技术工人服务市场相当小。在这些市场中，参与者通过相互交换实现大致的匹配。

　　双向匹配

　　假设有两组相互分离参与者的市场，如买方和卖方、工人和雇主、学生与学校，他们必需匹配才能履行相应的职能。1962年，盖尔和沙普利对双向匹配市场进行了研究，他们排除了单边支付（私下交易）情形，认为工资及其他匹配特征并非通过协商完成的。

　　稳定匹配。具体来说，假定市场由一方是医学院学生和另一方是医院科室构成，每个医院科室只需要一名实习医生，而一名医学院学生只需要一个实习机会。匹配就是将实习机会分配给申请的学生。很自然，学生对科室偏好不同，科室对不同学生的偏好也不同。为了方便研究，假定偏好是严格的，当参与者匹配后状况恶化则匹配将不被接受。

　　一般而言，当不能通过联盟改进参与者效用时，匹配就是稳定的。在这个特定的模型中，一个稳定的匹配必须满足以下两个条件：没有参与者认为这个匹配不可接受，没有科室和学生联盟希望重新匹配而不愿保持现状。第一个条件是个人理性条件，而第二个条件则是指成对匹配是稳定的。这两个条件暗示着没有任何联盟和“科室-学生”组合可以对匹配进行改进。

　　“盖尔-沙普利机制”。盖尔和沙普利于1962年设计了一套延迟接受机制（算法）以发现稳定匹配。其设计是，市场的一方是医疗科室，它们给申请者——医学院学生——发出录取通知，每个学生对他收到的录取通知进行评估，接受他愿意的科室，拒绝其余的通知。这个机制的重要方面是学生并不需要立即接受满意的录取，只要简单持有即可。任何医院科室的录取被拒绝后可以向其他学生发送录取通知，直到医院科室所发放录取通知被学生接受为止。

　　在这个过程中，每个科室先向顶级的申请者发放录取通知，如果录取被拒绝，它们再向二级申请者发放。根据操作规则，科室不断降低其录取标准向下一级的申请者发放录取通知。相反，由于学生总是持有他们最理想的录取通知，而通知不可以收回。当科室的期望降低到与申请者增加的志愿一致时，匹配过程结束。

　　激励相容。“盖尔-沙普利机制”在现实世界中对参与者是否真的有用？要回答这个问题，需要进行非合作博弈分析，即详细分析匹配过程规则和战略行动激励。

　　上面所提到的延迟接受机制可理解为分散的申请、录取、拒绝和接受的过程，但在现实中，此机制通过交易机构集中进行。每个申请人都服从他的偏好顺序，他对雇主由满意到不满意进行排序，而雇主也根据自己对申请人的评价对其进行排序。根据这些服从的偏好，交易机构运用一定规则进行匹配。用机制设计理论的术语讲，交易机构根据揭示机制进行匹配，但并不是所有市场都需要依赖此机制运行。揭示机制引发的同时进行行为博弈，其中，所有参与者服从自己的偏好排序，并假定完全理解交易机制如何使所有参与者的偏好相匹配。

　　罗斯等人运用计算机对随机产生的数据进行模拟，数据来自全国住院医生匹配系统（NRMP），对延迟接受规则下战略操纵的收益进行分析。研究发现，在庞大的市场上，如果供求双方均没有机构参与，通过操纵机制（算法）可以获益。

　　可调整的价格与工资。沙普利等将可转移效用版的“盖尔-沙普利模型”称为分配博弈。当雇主与工人匹配（联盟）时，可转移效用意味着特定匹配工资通过内生调整可实现市场出清。

　　沙普利等认为分配博弈的核心并非空集，匹配竞争对一系列核心配置形成了严格限制。通过可转移效用，任何核心配置必须满足经济剩余最大化的目标。总之，这种匹配是唯一的。然而，工资通常不是单一决定的，会产生利益的两极分化。当雇主最优或者工人最优的稳定匹配出现时，相应的特征是市场以最低工资或最高工资水平出清。分配博弈紧扣自由竞争概念继承了传统的竞争分析，事实上，这个模型是连接核心理念与竞争均衡间的桥梁。

　　研究发现，在雇主发起机制下，每个雇主开始都给想聘用的求职者报出低工资，每个求职者都收到多份聘书，将满意的通知保留，其他的予以拒绝。遭到拒绝的雇主继续发放聘书，要么对原来的求职者提高待遇，要么向新求职者发放聘书。这个过程最终会实现雇主最优的稳定匹配。

　　单边匹配

　　沙普利等对单边市场进行了研究，交易者在这个市场上对不可分割的商品进行交换，不能使用单边支付（私下交易），且每个交易者最初都拥有一件物品。沙普利证实所谓“高级交易环机制”通常可以实现稳定匹配。该机制运行为：从初始禀赋开始，每个参与者都表明他最想要的物品，这个被描述为定向图景。在定向图景中，至少必须存在一个“环”，即通过市场互换，参与者都能获得自己想要的物品。当满意的互换发生，心满意足的参与者及相关物品从市场上退出，剩下的参与者及物品继续进行交换，直到所有的物品交换到参与者最满意为止。

　　罗斯等证明，如果参与者对物品的偏好是严格的，且稳定性定义在弱改进，则对于任何给定初始禀赋条件下，最终只有一个稳定匹配。选择唯一稳定匹配的揭示机制，是“高级交易环规则”根据服从偏好顺序和初始禀赋计算出来的，稳定匹配对所有参与者都满足激励相容。

　　市场设计

　　医生市场设计

　　罗斯的研究解释了在医生市场上为什么陈旧的、分散化的系统已经失败，以及被全国住院医生匹配系统采用的新延迟接受机制为什么表现成功。然而，正如罗斯1999年描述的那样，医生市场结构的变迁给NRMP带来了新的复杂性，要求对其运行机制进行完善。从20世纪60年代开始，医生市场上从医学院毕业的医生夫妻日益增加，他们通常绕过NRMP直接与医院签订就业协议。一对夫妻可以视为一名综合求职者，他们在同一地区需要两份工作，其偏好违反了可替换性假定。罗斯研究发现，在存在夫妻医生求职者较多的地区不存在稳定的匹配。

　　“罗斯-佩朗森机制”。20世纪90年代，NRMP机制遭遇了司法挑战。尤其是有人质疑它基于雇主发起机制对医院有利而不利于医生。

　　前文提到，双边匹配理论表明，雇主发起机制对求职者不满足激励相容，理论上讲，医院可以通过操纵匹配机制获利。然而，求职者发起机制只满足对求职者的激励相容。复杂的医生市场涉及到求职者和医院的互补性，这意味着匹配稳定理论不能直接应用。然而，模拟实验表明即使在复杂的环境下，匹配稳定理论仍能提供参考意见。总之，看起来存在着坚实的理由让NRMP机制变更为求职者发起机制。

　　1995年，NRMP董事会聘请罗斯设计新的机制，设计的目标是“建立一个能形成稳定匹配，尽可能满足求职者偏好，并满足医生市场特定约束的机制”。罗斯等设计的新机制，属于求职者发起机制，并通过修订满足了夫妻医生的求职需要，使夫妻医生共同求职现象引发的不稳定性消除。模拟实验表明，新机制比老机制更有利于求职者。自从1997年NRMP采用新机制以来，每年有超过2万名医生通过该系统实现了就业。

　　学校招生机制

　　许多学生直接到他居住地的学校就读。然而，有时学生有潜力进入更好的学校。学生与学校的匹配要考虑到学生和家长的偏好，这是一个社会普遍关注的复杂问题。

　　一名申请学生可能优先考虑上特定的学校（可能是他住在这所学校附近，或者是他的兄弟姐妹已在这所学校上学，或者是他在统考中获得了高分）。在这种情况下，学校对学生也有选择偏好，学校倾向于招收更具优先权的学生。例如，在就读学校方面，学生甲比学生乙具有优先权，如果学校录取了学生乙，那么学生甲至少要上一所不比学生乙差的学校，这样才能满足稳定性。

　　学校招生模型与之前的双边模型分析的一个重要区别，在于学生的优先性排序是基于客观的量化指标。在学校招生中，激励相容问题并不必然产生，且学生的优先性与普通的偏好排序并不具有相同的福利。有学者建议在学校招生中运用申请人发起的延迟接受机制，这不仅能满足对申请人的激励相容，而且对申请人是最优的。纽约市的公立高中2003年开始使用申请人发起的延迟接受机制招生，取得了理想的效果。

　　在2003年之前，纽约市的公立高中要求申请学生将填报的前五所学校志愿发给学校，学校决定录取、拒绝或是让其等待。整个录取过程重复两轮以上，对于三轮仍未被录取的学生，由政府主管部门进行直接分派。整个招生过程中出现了严重的堵塞问题，学生没有足够的机会来表达他们的偏好，学校也没有充分的机会来发放录取书。造成了纽约市公立高中招生市场的严重失灵，每年有超过3万名学生不得不通过行政手段来分配学校。

　　上述招生过程显然不满足激励相容。学校更倾向按照第一志愿来录取，因此，如果一名学生觉得考入某校的可能性不大，他最优战略就是将录取可能性最大的学校作为第一志愿。2003年，罗斯和他的同事们为纽约市重新设计了招生系统，新系统运用了申请人发起的延迟接受机制（算法），而且符合纽约市法律及习惯的要求。新机制满足对申请人的激励相容，即他们真实表达自己的偏好是他们的最优选择，招生堵塞问题也被解决。实施新招生系统的第一年，仅有3000名学生接受了行政分配的学校，相比之前减少了90%。

　　简评

　　尽管沙普利和罗斯的匹配稳定理论及市场设计实践并不如金融市场的泡沫理论、套利理论般炙手可热，但从克服市场失灵，提升资源配置效率角度看，这些理论及其应用具有巨大现实意义和深远的影响，对市场机制不完善的发展中国家更是如此。

本站仅提供存储服务，所有内容均由用户发布，如发现有害或侵权内容，请点击举报。