打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
顶刊推介 | JOP:国家能力的易读性和信息基础
国家能力的易读性和信息基

作者:梅丽莎·M.李(Melissa M. Lee),普林斯顿大学;张楠(Nan Zhang),马克思普朗克研究所。

评介:肖俊鹏,外交学院。 

文献来源:Lee M M, Zhang N. Legibility and the informational foundations of state capacity[J]. The Journal of Politics, 2017, 79(1): 118-132.(转载自“政治经济学新时空”公众号)

本文主要观点

近年来,政治学对国家在遏制暴力和促进社会和经济发展方面重要性的重点研究,导致学术界对国家能力基础的兴趣激增。本文认为,国家能力部分取决于“易读性(Legibility)”——即国家对其公民及其公民活动了解的广度和深度——而易读性对于有效的集中治理至关重要。通过将易读性与国家在遏制集体行动困境中搭便车方面的作用联系起来的新颖论点来说明易读性的重要性。然后,使用基于全国人口普查的原始易读性衡量标准,在对公共物品的税收贡献的背景下证明了这一论点。本文最后讨论了未来如何利用指标的特殊时间和地理覆盖范围来推进国家研究中的新研究途径。

事实上,国家机构有效性与经济增长、内战爆发、逃税和其他形式的非法行为的结果相关。此外,学者和政策制定者开始以国家能力的概念和经验为基础,探讨提高公共机构的有效性,以超越“强”“弱”国家的简单分类。

本文认为国家能力取决于国家对其公民及公民活动的了解的广度和深度。这一描述建立在詹姆斯·斯科特(James·Scott)的开创性工作之上易读性表示,首先国家拥有有关当地实践的信息;其次信息是以国家管理者能理解的标准化形式呈现(如地籍图、出生证明、财产登记册等)。因此,易读性能够促进建立有效的社会秩序并说明其对国家能力理论的重要性。自然推出易读性是解决集体行动环境中搭便车问题的核心,因为它允许国家有效监控私人行为并执行规则和法规。

本文通过税收和公共物品供给来提出验证性操作,以1960-2012年间120多个国家和次国家层面的人口普查数据进行估计,在控制经济、地理和时间因素情况下,可读性较高的地区有更有效的税收和公共产品供给。这就证明本文易读性是国家能力和管理的一个关键但在很大程度上未得到充分研究的组成部分。

本文创新性在于三点:首先是易读性的概念,强调了国家的信息功能;其次提出新的论点,将将易读性与国家在集体行动环境中控制机会主义行为的作用联系起来;最后是引入了一种可在国家和次国家层面计算的原始易读性衡量标准。

本文结构如下:首先,本文详细描述了易读性的重要性,并提供了其在解决社会困境方面的核心地位的案例;其次,提出了操作策略和程序描述,展示了对全国人口普查中的年龄准确性估计;再次,证明测量是基于可读性的,能够有效检验国家能力;最后,探讨了易读性、税收贡献和公共产品结果之间的经验关系,并提出未来设想。

一、易读性、集体商品和搭便车
“易读性”是指国家对其公民及其活动的了解的广度和深度。这种易读性要求国家所掌握的信息不能是复杂的、情景化的知识形式,而是对于国家官僚易于理解的格式和信息集合。以前现代欧洲为例,品脱(pints)和欧恩(aunes)都是常用计量单位,但是不同地方对它们确切数量的规定有很大差异,如十八世纪的巴黎,一品脱为0.93升,而在塞纳-蒙大拿省则为1.99升。标准的差异导致国家对地区生产的偏误。再如斯科特对前现代英国命名惯例的讨论,会使得不清楚地区习惯的国家管理者难以精准识别个人身份和社会贡献。易读性的缺乏造成行政上对个人身份和社会规则的混乱,可能导致搭便车行为的猖獗。搭便车行为是集体行动困境的具体体现。其是指在共同利益体中,部分成员自觉或不自觉的不付出成本而享受他人之利。在这种情况下,正式的、集中的权力机构的一个重要功能是监督机会主义行为和执行财政规则,从而维持合作成果。

易读性的重要性也就不言而喻了。在税收领域,信息不透明的情况下,如何规避因资本流动、转移资产、逃税漏税导致的财政搭便车问题,精准控制国家税负可征收性,基于清晰明确的易读性问题并非不可克服。以瑞典为例,自1540年开始,瑞典皇家法警就在做编制农民家庭详细税务登记册的努力;1628年瑞典政府完成被称为西方世界第一份地籍图,详细描绘了国家范围土地产业、产出、估值等价值信息;1686年教会法要求神职人员保留教区居民的税收清单,进一步增强了国家收集财政信息的能力;至1920年,瑞典约80%的经济活跃人口已在税务机关登记。通过对国家物质资源的清晰可读,可以显著的抑制财政搭便车的程度。合理明确的财政政策和征税使得瑞典相对同时期其他欧洲国家保有更高的军事能力。

二、易读性的操作化
本节将介绍易读性操作化的经验策略。本文通过采用比较方法来衡量政治单位和随着时间的推移的易读性,专注于全国人口普查的数据系列进行论述。从历史上看,人口普查是该国人口信息的主要来源之一,人口数据关涉国家内公共产品和配套服务设施的供给和分配,是国家治理中最重要的信息之一。但是早期对人口普查数据的研究并不理想。首先,由于只有少数处于“失败国家”范围的极端国家不收集人口普查数据,早期的研究忽略了易读性问题范围的实质性变化;其次,这种方法忽略了普查质量的次国家差异。
因而,本文采取的易读性措施是通过考虑现有人口普查中确切年龄信息的准确性来解决可比性问题和控制误差范围。


人口统计学家明确人口中的真实年龄分布遵循自然平滑的曲线。例如,图1A中显示的瑞士案例,我们可以发现年龄分布的明显潜在模式,每个精确年龄的个体数量年度变化很小。虽然人口曲线形状会因社会环境而异(特别是突发灾难性事件),但是年龄计数的逐年变化依旧遵循自然规律的趋势。如图1B,反映法国2006年全国人口普查的人口数据。即使存在二战后婴儿潮和70年代生育率下降,年龄分布仍旧符合自然规律。相比之下,当年龄数据存在错误,数据的不连续“堆积”就会破坏潜在年龄曲线的平滑度。如图1C,塞拉利昂人口普查数据,每五年形成一个年龄高峰且每个高峰与5为单位的年龄间隔完全对应,这是违背自然规律的。接下来,本文将介绍一种量化这些误差幅度的方法。然而,在此之前,首先讨论数据生成过程,因为这涉及本文对人口普查措施的解释。

三、数据生成过程
面对上述人口年龄信息的偏误,可以说代表了更广泛的易读性问题。在图1C中反映的反常模式很可能是,由于整个人口缺乏年龄意识亦或管理者难以找到或接触“偏远”地区人口。
关于人口缺乏年龄意识,既有研究已证明,当真实年龄未知时会发生年龄堆积。此时,通过人口普查中记录的年龄建模提供接近真实年龄的猜测,但这种猜测倾向于聚焦或“堆积”于特定数字上(焦点数字选择因社会和时间段而异)。当然也可能出现年龄谎报的问题,但是根据图像中散点分布规律可以看出,并没有特异性聚焦年龄,本文就不再讨论这种情况。
当年龄意识较低的情况下,其他问题领域的易读性也可能较低。首先,国家通常以年龄定义某些权利、责任和资格的关键信息。当权利和责任是以年龄为条件,那么年龄的显著性就会随着国家-社会互动的密度而增加,个人记录确切年龄的可能性也会增加。其次,通过与国家机构的互动,个人会获得文件资料证明或追踪年龄。这些文件的发行还可以为个人提供机会了解他们以前不知道的年龄。此外,一旦该人拥有反映其真实年龄的文件,则国家可能会在所有后续交互中准确记录信息。

总之,当国家与公民互动过少,公民的年龄意识越淡薄。失去了精确地年龄信息,人口普查过程中的易读性问题就会普遍存在。

至于管理者难以找到或接触“偏远”地区人口,则是属于管理者没能正确的记录信息。派出的调查者自身的惰性,在安全或基础设施不足的情况下,普查员可能有系统地偷懒,这使得接触人口变得危险或困难,以及抽样方法偏误都将导致人口年龄数据可读性问题。
这两种情况能够相互强化,因为在“偏远”地区国家与公民的互动联系更少,而交通基础设施的匮乏与安全缺失又会促使公民降低国家意识,减少与国家互动的可能。

四、量化年龄准确性
人口统计学家已经制定了几个指标来量化年龄堆积的程度。这些指标出发点是,如果真实年龄的报告没有系统的不规则形,那么按年龄末尾数字的人口分布应当满足均匀分布。例如,假定报告年龄介于15-74之间的人口数据,如果不存在堆积,则10%的人口应报告年龄以0结尾,10%应报告以1结尾,依此类推。最直观的是惠普尔指数(the Whipple Index),它只是计算记录年龄以5或0结尾的人口百分比,并确定该百分比与预期值20%的偏差程度。惠普尔指数范围从100(即20%/20%),代表不偏爱以5或0结尾的年龄,到500(即,100%/20%),代表所有报告的年龄都有终端数字的情况5或0。然而,自然种群中始终会受到死亡率的影响,会导致年龄末尾数字均匀分布偏误。这种影响无论如何定义年龄区间都很难避免。

为了纠正这种现象,迈耶斯(Robert J.Myers,1940)开发了一种创建“混合”人口的技术——它本质上是报告年龄以十个终端数字中的每一个结尾的人数的加权总和。由于在任何给定数字处开始一个[bin]夸大了该数字的相对频率,迈耶斯指数通过依次从每个数字开始,对每个数字进行“完全公正”。例如,每个终端数字的频率首先为bin[15-64]列出10次,从每个终端数字开始:首先计数[15-64],然后[16-65],继续直到[24-73]。将10个计数相加并转换为总人口总数的百分比。所得的迈耶斯指数范围从0(表示任何数字上没有堆积)到90(表示所有年龄都在单个终端数字处报告的情况)。

再回到上文图1提到的三个国家,计算每个分布的惠普尔指数和迈耶斯指数。瑞士的惠普尔指数为102.86,迈耶斯指数为0.22,表明报告的数据几乎没有错误。法国的得分与瑞士相似,尽管其分布因与战争相关的人口冲击而不连续。相比之下,我们计算出塞拉利昂2004年的惠普尔指数为228.20,迈耶斯指数为26.48。异常的指数得分表明出现了年龄堆积,正符合图1C中所反映的。

研究者需要对惠普尔指数和迈耶斯方法进行选择。迈耶斯方法的优势在于它不需要指定可能发生堆积的精确数字,这一特性在处理跨国或跨文化数据时特别有吸引力,其中数字偏好(或避免)的确切形式变化或未知。迈耶斯方法也考虑了死亡率,而惠普尔指数则没有。然而,两者应用的权衡在于方差的规模。迈耶斯方法在非常小的种群规模(<5,000个人)和非常低的真实错误率(<5%)下向上偏误,而惠普尔指数在这些条件下表现要好得多。接下来的分析中,本文应用迈耶斯方法研究发展中国家,国家层面或人口众多的次一级国家单位中的年龄数据,尽可能排除规模差异问题。

五、全球易读性差异

本文的完整数据集包括1960年至2012年期间的370次人口普查。近一半的原始数据直接来源于国家人口普查报告,使易读性数据集成为撰写本文时最全面的人口普查数据概要。国家层面的迈耶斯指数数据有三个特征。首先,全世界范围内的迈耶斯指数范围相当大,数据集的平均值为8.21。1973年的巴基斯坦在数据集中的得分最差,其指数为45.67,意味着近46%的年龄数据在那个人口普查年存在误报。最优的则是1991年的加拿大,指数为0.18,但实际上迈耶斯指数的差异在1.00以下没有特别意义。

其次,数据表现出显著的偏斜(见图2A)。与大多数政治现象一样,这种偏斜可归因于国家之间在易读性方面的差异,而不是时间的长短差异。要了解情况如何,请考虑图2B,该图绘制了减去国家均值后的迈耶斯指数直方图。这样做之后,数据近似正态分布。
最后,纵观1960年至2012年期间的世界(见表1),迈耶斯指数似乎反映了各国在制度有效性方面的合理排名。亚洲、撒哈拉以南非洲和中东/北非在迈耶斯指数中表现出异常,其最大值(巴基斯坦1971、尼日尔1977和摩洛哥1960)接近或处于世界最大值。尽管这三个地区的均值相似,但亚洲的中位数远小于撒哈拉以南非洲或中东的中位数,这表明亚洲易读性差的极端情况较少。我们还看到东欧和拉丁美洲看起来非常相似,尽管东欧的迈耶斯指数略低。最后,正如人们所料,西方国家享有非常高的可读性。图3显示了2005-14年全球人口普查的这些模式。总而言之,大多数分析人员直觉上认为是高发展度国家的年龄堆积较少
资料来源:区域来自少数群体风险项目(2009 年)。
六、验证
本节中将更广泛地证明迈耶斯指数作为衡量易读性的合理性。回到前文对激励和人工制品的讨论。更具体地说,本文认为国家与公民互动稀少的情况下,低年龄意识将造成更多的易读性问题。通过检验迈耶斯指数与政府信息(出生登记和出生证明)之间的实证关系。由于这些数据源仅适用于选定数量的国家,因此我们将注意力限制在以下方面的关系上:次国家级。关于这些数据的更多信息见附录。

出生登记是国家获取公民身份信息的重要手段。通过创建个人从出生时起的行政记录,国家不仅知道谁出生的时间和地点,而且知道谁将获得与国家有关的权利、责任和特权。由于出生登记和出生证明是国家使其人口清晰易读的一种手段,我们预计迈耶斯指数将与出生证明的登记和拥有相关联。为便于解释,我们反转了迈耶斯指数,以便更高的值表示更高的易读性水平(见表2)。
作为一项额外的有效性测试,我们检查了迈耶斯指数与常见的基于感知的国家能力指数之间的国家层面相关性。如果我们认为易读性与国家能力相关是正确的,我们应该观察到(倒置的)迈耶斯指数与所有指标之间存在正相关关系,但FSI除外,该指数经过缩放,因此较高的值表示更糟的结果。事实上,如表2所示,相关性相对较强,并且在预测方向上有符号。

七、结果:合法性、税收和公共物品
本节探讨易读性将如何帮助国家促进有效的社会秩序。获取行政上有用的信息使国家能够监控个人行为并强制遵守规则和法规。通过税收为公共物品的贡献做背景进行测试两个相关问题,更高的易读性与更高的税收合规性亦或与提供公共物品和服务相关的更好结果相关。目的在于证明迈耶斯指数的价值,同时证明易读性概念的理论和实质性重要性。

为了评估易读性和税收之间的关系,本文利用了国家内部的地方差异。选取的样本包括:阿根廷、巴西、希腊、印度、印度尼西亚、意大利、墨西哥、菲律宾、南非、坦桑尼亚、泰国和土耳其。通过对省级数据进行对比,控制不同国家不同财政制度差异所造成的的潜在影响。考察的两个因变量是税收收入(各省征收的所得税金额)和税收比率(即征收的所得税与省级GDP的比率)。控制包括人口密度、地域差异、地区发达程度等要素的影响。由于偏度,所有变量都已进行对数转换。描述性统计见表3。
本文使用普通最小二乘法(OLS)模型测试易读性对税收的影响,标准差按国家/地区聚类,迈耶斯指数滞后一年。为便于解释,将变量标准化为均值0和标准差1,还反转了迈耶斯指数,值越高表示可读性越好。如表4所示,发现迈耶斯指数的一个标准差变化会导致税收收入发生大约10%的变化。以印度北方邦2012年数据为例。以人均计算,北方邦人均GDP为372美元,是印度最贫穷的邦之一。按照迈耶斯指数是排名倒数四分之一,但2012年印度政府在北方邦征收23亿税收,按照易读性标准差偏误10%计算,将可能额外增加3.2亿税收,非常大的一笔收入。
易读性对税收比率影响同样强大。如表4第4列,易读性每增加一个标准差会导致税收比率增加6%的标准差。同样是印度北方邦,这种变化将使税收比率由约3%增加至约6.5%。这在统计学上显著。

关于易读性与公共物品供给相关性。本文考量的是婴儿死亡率、成人识字率和小学入学率。应用检验中,使用了跨国差异扩大考察范围,并使用国家固定效应达到控制变量的效果。样本涵盖了来自世界多达111个国家的数据。描述性统计见表5。
记录数据中,婴儿死亡率定义为新生命第一年死亡人数,用以解释偏度。成人识字率和小学入学率以百分比显示。控制协变量:人均GDP、政权类型、人口密度和地形崎岖程度。同样,将变量标准化为均值0和标准差1,迈耶斯指数倒置,以便更高的值表示更高的易读性。由于数据的稀缺性,所有变量代表十年均值。

同样使用OLS回归模型来检验易读性对公共产品结果的影响,模型包括十年固定效应和国家聚类标准误差。表6显示了三个因变量的结果。查看第2、4和6列,这些列显示了完整协变量集的结果,我们看到易读性在统计上是显着的。更高的可读性与更低的婴儿死亡率和更高的识字率和小学入学率有关。以2000年的肯尼亚为例,可读性每增加一个标准差,每1,000名婴儿死亡人数就会减少约17个,识字率和小学入学率分别增加11和3个百分点。
总之,通过模型检验可验证,易读性是国家遏制集体行动中搭便车的能力的核心。当然,有两点需要注意。首先,如果易读性在帮助国家促进和维持良好的集体成果方面没有发挥作用,我们就不会观察到易读性、税收和公共产品之间的显着关系,尤其是在人均GDP和政权类型等强大的解释因素存在的情况下。其次,我们在税收和公共产品领域的应用证明了易读性概念和我们基于人口普查的措施的潜力,可以为广大学者感兴趣的重要理论和经验问题提供新的思路。

八、结论
本文中始终强调易读性是作为理解国家能力的一个关键但是经常被忽略的因素。易读性通过促进集体行动环境中的搭便车效应,为社会和经济发展提供了关键基础。本文使用人口普查数据的原始易读性衡量标准,通过税收对公共产品供给的贡献验证这一论点。验证过程中,始终强调国家作为外部监督者和执法者在控制机会主义行为和支持有效社会秩序方面的重要性。

首先,虽然本文的理论和经验本身贡献很重要,但是易读性的应用对更广泛的国家能力文献同样具有影响,本文的案例验证了易读性对国家权力性质的数量和质量变化相关。

其次,这项研究最重要的实证贡献涉及易读性数据集的制作和传播。本文希望特别强调数据测量的地理和时间覆盖范围,可以为任何可以获得单一年龄数据的国家或次国家单位计算。
再次,本文的理论见解和数据集对一系列研究计划有影响。例如,国家能力在解释内战开始、终止或冲突过程中的作用。

最后,本文的研究对有关政治和经济发展的文献具有理论意义,同时本文的数据集为研究国家能力开辟新途径。

总之,本文相信,重新关注易读性有可能为政治科学家感兴趣的一系列结果产生新的理论和经验见解。本文才刚刚开始探索这些令人兴奋的新研究前沿。

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
中国超2亿人单身,年轻人不愿意结婚的根本原因?
为什么不能用调查数据中"直接汇总"的总和生育率
中国还是低生育率国家吗
2020年人口普查不登记会怎么样?
第七次人口普查数据
2010年人口普查数据:分年龄组汉族和少数民族人口构成
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服