QCA方法中的核心概念：真值表

简易阅读指南

本章将从方法和技术层面讲解一个QCA方法中的核心概念：真值表。QCA方法可以被理解为构建真值表的研究阶段。真值表包含了研究人员收集的经验信息。QCA包括对真值表的形式分析，即逻辑最小化，其目的是识别充分（和必要）条件。因此，无论使用清晰集或模糊集，真值表都是QCA方法中不可或缺的工具。这也意味着本书中所述的关于真值表及其分析的大部分内容都适用于csQCA和fsQCA。

第3章在没有使用真值表的情况下介绍了必要性和充分性分析。（译者注1：第3章的内容主要涉及集合关系以及必要条件和充分条件的分析，暂未翻译整理，可参考推送：定性比较分析（QCA）的集合关系：超集与子集、必要与充分、一致性与覆盖度）本章接下来将展示，真值表是测试集合关系的适合工具，主要是因为它们将关注焦点从经验案例转移至条件组合。这是一种完全不同且更有效的充分性分析方法。基于数据矩阵的充分性分析以自下而上的方式进行，首先关注简单集合，然后再处理更复杂的集合。（译者注2：自下而上的方式，通常是直接构建条件组合，然后检查改组合与结果的超子集关系，从而判断是否作为充分条件）而基于真值表的充分性分析采取自上而下的方式，首先筛选所有逻辑上可能的条件组合，然后对所有通过充分性测试的组合进行逻辑最小化。

值得注意的是，对于充分性而言，真值表方法是一种主导的方法，但对于必要性分析，自上而下的方法毫无意义，自下而上的方法显然更可取。原因很简单：对于两个或多个条件的合取项，当且仅当其中涉及的所有条件本身都是必要时，才可能对Y是必要条件。（译者注3：这里提到一个知识点，对于一个组合ABC，三者中任意一个条件对结果Y充分时，该组合便是Y的充分条件。相反，A、B、C三个条件必须都是Y的必要条件，ABC这一组合才是Y的必要条件。现有的QCA运用进展，很少测试组合条件的必要性，可能是未来的一个方向）

本章的内容结构包括：阐明什么是真值表（4.1）后，将展示如何根据案例的经验信息构建真值表（4.2）。4.3节将解释如何借助布尔代数分析真值表。本章是整本书的核心章节，因为真值表是QCA的必要技术。应仔细阅读本章内容。本章还提供了真值表算法的重要信息，这是目前公认的QCA最低标准（将在第7章中介绍）。

4.1 什么是真值表？

真值表的概念起源于形式逻辑。像传统的数据矩阵一样，真值表的每列都表示不同的变量（QCA方法里称集合）。不同的是，在标准数据矩阵中，每一行表示不同的案例（或观察单位）。而在真值表中，每一行代表一个条件组合。由于每个单独的条件可以以存在（present）或缺席（absent）的形式出现，因此，真值表的总行数为2^k。

公式2^k指的是逻辑上可能的组合，k表示所用的条件数量。因此，真值表行的数量随着条件数量的增加呈指数增长。3个条件有8种组合，4个条件则有16种组合，5个条件有32种组合，10个条件将有1,024种逻辑上可能的组合。在社会现实与社会科学研究实践中，并非所有潜在组合都能有实际案例。第6章将重点阐述有限多样性的现象，并提供如何处理逻辑余项的策略（译者注4：这两个问题也可以参考推送：为什么QCA得出的三种解完全一致？理解逻辑余项的应用）。为了正确介绍真值表的含义和分析，本章只讲解没有任何逻辑余项的真值表行。

维恩图是一种直观地可视化2^k种逻辑组合的方法。图4.1展示了三个条件的维恩图（A、B、C）。它们重叠形成8个不同的区域。维恩图中的每个区域对应于真值表中的一行，每个区域都可以用布尔表达式进行描述。例如，图中A、B和C重叠的区域是指包含A、B和C同时存在的情况的区域，可写成A*B*C，或者简写为ABC。集合A的上部区域是条件A存在（A=1）而B和C不存在的区域（B=0，C=0），该区域表示集合A*~B*~C或简写为A~B~C。三个圆圈之外但处于矩形内的区域表示三个条件都不存在的情况，可以写为~A*~B*~C或~A~B~C，以此类推。

4.2 如何从数据矩阵到真值表

4.2.1 清晰集

本节将以3.1.1.2节中的数据矩阵为例（表4.1），根据数据矩阵中的案例信息构建真值表（表4.2）。虽然大多数相关软件包都能够基于包含集合隶属度的数据矩阵生成真值表，但有三个简单步骤值得一提。

首先，排出k个条件所组成的2^k个逻辑上可能的组合，将结果值列留空。

其次，将数据矩阵中的案例根据其各个条件的值分配到真值表行。每个案例只能属于一个真值表行，但单个真值表行可以包含多个案例。在我们的例子中，阿根廷（ARG）和委内瑞拉（VEN）在所有3个条件的值相同——剧烈的动荡（A）、有种族同质化的人口（B）和多元化的政党制度（C），因此它们属于同一真值表行A*B*C。秘鲁（PER）和厄瓜多尔（ECU/EC）也是如此，它们都属于行A*~B*~C（剧烈的动荡，没有种族同质化的人口，没有多元化的政党制度）。通过这种方式，所有案例可以分配至8个逻辑上可能的真值表行。

第三，对每个真值表行赋值。真值表行的结果值由相应行所分配案例的结果值决定。例如，哥伦比亚（COL）属于行~A*~B*~C，结果为Y=1，且没有其他案例属于该行。因此，~A*~B*~C行的结果值为Y=1。同样，阿根廷和委内瑞拉都没有表现出稳定的民主，真值表A*B*C行的结果值为Y=0。以此类推，表4.1中的数据矩阵产生了表4.2中展示的真值表。

真值表由2³=8行组成。严格来说，列“Row”、“Cases”和“Y”不属于真值表，但出于为了解释说明而包含在内。理解“结果（Outcome）”栏中包含的信息很重要。从案例的角度来看，值“1”表示具有这些特征的案例产生了结果。例如，从表4.2的第1行中发现，没有发生剧烈动荡（~A）、没有种族同质化的人口（~B）以及没有多元化政党制度（~C）的案例将产生稳定的民主国家。如果我们将视角从案例转向组合，我们可以说组合~A~B~C（第1行）将产生结果Y。真值表行与结果Y=1明确相关（Ragin & Rihoux，2004）。本质上，每个真值表行都是一个充分性陈述（Ragin，2008a）。

4.2.2 模糊集

将数据矩阵转换为真值表的三个步骤同样适用于模糊集。我们首先创建真值表，然后将每个案例分配给真值表行，最后确定每一行的结果值。

真值表的创建是最简单的步骤。与清晰集一样，模糊集的真值表行数为2^k。这是因为模糊集认为处于定性锚点0.5以上的案例（更多处于集合内）与该锚点以下的案例（更多处于集合外）之间有质的差异。

除将案例直观地划入属性空间角（也称为理想类型）之外，是否有一种标准化的方法来确定真值表行中案例的隶属度呢？当然是有的。2^k个角中的每一个都对应于2^k个逻辑上可能的AND条件组合之一，而且交集中案例的隶属度由它们在单个条件中的最小隶属度决定。因此，很容易计算案例对于所有逻辑上可能的条件组合（即属性空间的角落）的隶属度。表4.5包含表4.4中显示的两个案例的信息。

委内瑞拉（VEN）在理想类型ABC中的模糊集隶属度为0.6。这是条件A(0.9)、B(0.7)和C(0.6)中的最小值。厄瓜多尔（ECU）在理想类型A~B~C中的隶属度为0.7。虽然每个案例在所有行中都有部分隶属关系，但只在某一行中的集合隶属度超过定性锚点0.5。模糊集有一条一条黄金法则：无论由多少个模糊集进行组合，任何给定案例在且仅在2^k个逻辑可能组合中的某一组合的隶属度高于0.5。模糊集的这一重要数学属性对于识别一个案例应该属于哪个真值表行至关重要，也就是找到其集合隶属度高于0.5的真值表行。

（译者注5：简言之，模糊集中，每个条件以0.5作为分界点，小于0.5为0，大于0.5为1，即可构建真值表行。原文介绍了属性空间（property space）的概念来论述更详细的原理，这里不再翻译）

这一规则也有例外，即案例属于多种逻辑上可能的组合。当案例在一个或多个条件中的隶属度恰好为0.5时，它对于任何真值表行的隶属度都不会超过0.5。为了说明这一点，表4.6添加了第三个假设情况：案例HYP在条件C中的隶属度为0.5。由于C和~C的值都为0.5，因此该案例在八种可能的案例组合中，没有隶属度可以达到大于0.5的理想类型。三个条件以及他们的补集中的最小值都没有大于0.5的值。此外，有两个理想类型的最小值正好是0.5。锚点0.5有时被称为最大模糊点（Ragin，2000）。它表达了一个事实，即一个案例的经验属性无法确定该案例属于某个集合还是其补集。这种模棱两可的状态使得该案例或其补集无法归入2^k个逻辑上可能的理想类型中的任何一个。

因此，将0.5的模糊集隶属度分数分配给案例时要小心。这样做不仅可以防止将这种情况无法归入任何真值表行，而且表达了关于该案例的最弱概念陈述。

（译者注6：这样就是推送经典方法论书籍系列——集合的概念与校准中，提到的校准避免0.5隶属度的原理）

我们现在知道真值表有2^k行，并且每个案例只属于真值表的其中一行。还需要确定2^k行中的每行的结果值。每个真值表行都是一个充分性陈述。这意味着如果该行每个案例的隶属度都小于或等于它对于结果的隶属度，则每个真值表行都应该被认为是结果的充分组合（参见3.1.2.1节）。

表4.7展示了10个假设案例在3个条件、8个真值表行和结果变量（稳定民主(Y)）的模糊集隶属度分数。我们评估每个案例在真值表行的隶属度是否小于或等于其对于Y的隶属度。如果是，则相应行是结果的子集，满足充分条件的标准，因此得分为1（即该组合中所有案例的隶属度X都小于等于Y）。但是，如果行中的一个或多个案例的隶属度超过对于结果变量的隶属度，则相应行不是Y的完美子集，得分为0（即该组合中有一个及以上案例的隶属度大于 Y）。表4.7的最后一行显示，三个组合——A~BC、~A~BC和~A~B~C——是Y的完美子集。因此，对于其他真值表行，如果一个或多个案例偏离了充分性的子集模式，那么这些行则不是Y的充分条件。

根据以上提及的步骤，我们可以将模糊集数据矩阵转化为标准的清晰集真值表形式。对于每一行，我们知道哪些案例属于它，以及它是否是结果的子集。由模糊集数据得出的真值表如表4.8所示。

（译者注7：理解这两步很关键，是QCA真值表分析的重中之重。针对QCA学习的新手，建议手算一遍，把这10个案例的ABC和Y隶属度记下后，推演后面的组合隶属度，并确定真值表中的Y值。）

在继续解释如何使用形式逻辑工具分析真值表之前，有几个要点值得一提。首先，无论使用清晰集还是模糊集，真值表都是QCA的核心。其次，当使用清晰集的真值表中表示模糊集时，模糊集中包含的更细粒度的信息至关重要，并且始终可用。换句话说，推演出表4.8中真值表的步骤不涉任何将模糊集转换为清晰集的转换。将案例分配给真值表行以及评估真值表行是否是结果变量的子集时，都将用到模糊集的分数。

第三，在基于模糊集生成真值表时，结果列中的值（1或0）并不意味着该行中的各个案例对于结果变量Y的隶属度为1或0。相反，结果变量列中的值表示该行是否可以被认为是结果的充分条件。这就是为什么在表4.8中我们将结果列标记为“Y的充分条件”。第四，在评估行和结果集之间的子集关系时，所有案例都应被考虑在内，而不仅仅是那些特定行的好实例（即隶属度分数高于0.5的案例）。因此，0.5定性锚点对于将案例分配至行至关重要，但在评估两个模糊集之间的子集关系时无关紧要。

4.3 分析真值表

真值表可以通过清晰集数据和模糊集数据创建。结果列指的是特定真值表行或条件组合是否是结果的充分条件。如果是，则结果列的值为1。因此，如果我们研究结果变量的充分条件，真值表提供了第一个答案：结果值为1的所有行是充分条件。然而，这个答案通常没有什么信息量且难以处理，因为真值表中可能有很多这样的行。我们希望得到一个更简洁的答案。为此，在QCA中使用布尔代数的规则。Quine-McCluskey算法可用于逻辑最小化。下面介绍Quine-McCluskey算法中涉及的步骤。

4.3.1 匹配相似条件

本节将使用4.2.1节中的清晰集真值表作为案例进行讲解。请注意，这样的真值表也可能是将模糊集数据矩阵转换为真值表的结果。因此，尽管我们现在讲解的是从清晰集中得出的例子，但无论基础数据是由清晰集还是模糊集组成，真值表分析都是相同的（译者注8：因此清晰集条件和模糊集条件可以一起使用fsqca软件分析）。

第一步是为所有与结果相关（Y=1）的真值表行（第1、2、3、4和6行）创建一个布尔表达式（也称原始表达式，primitive expressions）。第1行可以写为~A~B~C，第2行可以写为~A~BC，以此类推。表4.9中包含的信息可以表示如下：~A~B~C+~A~BC+~AB~C+~ABC+A~BC→Y。

在创建真值表的过程中，这五个原始表达式都是Y的充分条件。这个公式是表达真值表中所包含充分条件的最复杂的方式。接下来将简化这些表达。

逻辑最小化的第一原则指导：如果两个真值表行都与结果相关联，仅在一个条件下不同——该条件在一行中存在而另一行中缺失——那么这个条件可以被认为是逻辑冗余的条件，在真值表行的其余条件存在时，该条件与结果的发生不相关。这个逻辑上冗余的条件可以省略，且这两行可以合并成一条更简单的充分条件组合。例如，第1行(~A~B~C)和第2行(~A~BC)除了条件C以外其余条件是相同的：条件C在第1行中不存在而在第2行中存在。因此，这两行可简化为~A~B。换句话说，我们可以将表4.9中包含的信息写成：~A~B+~AB~C+~ABC+A~BC→Y。

将逻辑最小化原则应用于原始表达式~AB~C（第3行）和~ABC（第4行）。它们仅在条件C的值有所不同，因此可以将两行简化为~AB。原表达式可简化为：~A~B+~AB+A~BC→Y。

相同的逻辑最小化原则，即匹配一对仅在一个条件值不同的原始表达式，同样适用于结果变量值相同的任何两个组合。在示例中，组合~A~B和~AB仅在条件B的值不同，那么条件B可以去掉，两个表达式可以简化为~A。这意味着对于Y来说，条件~A都是充分条件，无论条件B或C如何取值。表达式可进一步简化为：~A+A~BC→Y。

这个公式在逻辑上等同于最复杂的表达式和所有中间表达式。由于这是基于3.1.1.2节中案例相同的数据，我们注意到解项的差异。在3.1.1.2节中，相同的数据得出的解项为：~A+~BC→Y。

不同之处在于条件A与~BC的结合。当为表4.9中的信息找出最简洁的解项时，是否需要包含条件A？答案是不需要。因为组合~BC包含原始表达式A~BC（第6行）和~A~BC（第2行），也就是说，~BC对于Y是充分条件，我们也可以说A~BC和~A~BC都是Y的充分条件。由于这两个原始表达式仅在A的值上有所不同，因此可以删除条件A。请注意，逻辑最小化过程中，允许在多个逻辑最小化中使用相同的原始表达式。在我们的示例中，第2行中的原始表达式~A~BC可以与第1行的原始表达式匹配（~A~B~C，从而得到~A~B），也可与第6行的原始表达式匹配（A~BC，从而得到~BC）。这意味着第2行的原始表达式包含多个质蕴涵项（prime implicant），我们将在第4.3.2节中更详细地讨论这个问题。目前，我们可认为解项是：~A+~BC→Y。

（译者注9：这里提到了质蕴含项选择的问题，也是新手经常遇见但难以理解的问题，请参考推送：为什么简约解这么多？——QCA中冗余质蕴含项的选择问题（Use of prime implicants））。

这个公式是总结表4.9中包含的充分性信息的几种方法之一。此处所提及的所有不同的解项，以及最小化过程的中间步骤，（a）在逻辑上是等价的；(b)表达真值表中的相同信息；(c)不相互矛盾，也不与真值表中包含的信息相矛盾；(d)是现有经验信息的总结。

真值表中的数据有多种解是可接受且逻辑正确的，这也是QCA的一般特征。而选择哪种解作为可用信息的实质性解读，取决于特定研究问题，与公式逻辑并无关系。相比于“~A+~BC→Y”，我们可能更喜欢“~A+A~BC→Y”，主要原因如下。

例如，关于稳定民主国家出现的文献（Y）提出了一个强有力的观点，即民主不可能在暴力动荡的情况下形成。而解项A~BC提供了实证证据，证明了这个观点：如果与~BC结合，A确实可以成为Y的INUS条件。文中的案例与文献中的假设观点相反，稳定的民主政体可以在有暴力动乱的情况下出现——但只有当这些国家还同时拥有种族非同质的人口（~B）和多元化的政党制度(C)时才能出现。虽然解项~A+~BC→Y是正确的，也包含此信息，但条件A的作用并不明显。在该特定话题下，包含A~BC的解项，有助于将实证证据与之前存在的理论知识及期望联系起来。（译者注10：结合实践知识来选择质蕴含项）

与此相关的一个论点是，更复杂的解项将有助于解答那些无法解释的情况。想象一下，关于民主稳定的文献迄今未能解释为什么某个国家（我们将称之为X）是一个稳定的民主国家。我们假设X国可以用A~BC组合进行描述。通过选择包含该组合解作为导致Y的充分条件，我们能够以一种更简捷的方式证明为什么X国能成为稳定的民主国家。（译者注11：结合理论知识来选择质蕴含项）

4.3.2逻辑冗余的质蕴涵项（同样参考推送：为什么简约解这么多？——QCA中冗余质蕴含项的选择问题（Use of prime implicants））

4.3.3 与结果缺失分析的相关问题

集合关系是不对称的（见3.3.3节）。这种不对称的一个含义是，结果的出现和缺失需要单独分析。前文提到的从数据矩阵到真值表的所有分析步骤以及逻辑最小化同样适用于分析结果的缺失。继续采用表4.2中的案例，现在将~Y（不稳定的民主制度国家的集合）作为感兴趣的结果变量。

从必要性分析开始，我们发现只要~Y存在，A也存在（另见3.2.1.2节）：A←~Y。即经历剧烈的动荡是拥有不稳定的民主制度的必要条件。

对于充分性分析，采用Quine-McCluskey算法对~Y=1的所有行进行分析，并得到以下结果：A~C+AB→~Y。

这可以通过析出条件A（第2.4.1节）重写为：A(B+~C)→~Y。

在经历过剧烈动荡的社会中，如果同时拥有种族同质的人口和/或没有多元化的政党制度，将产生不稳定的民主国家。产生结果~Y的解项与对产生Y的解项不同。

有三点值得说明。第一点是普遍性的，第二点和第三点源于我们选择的案例的特殊性。首先，如果一种现象的发生和不发生（缺失），例如民主的稳定性和不稳定是两种性质不同的事件且需要单独解释，那么它通常需要用不同的理论和假设来解释这些结果。也就是说，研究者可能需要选择不同的条件构建一个全新的真值表（译者注12：选择一个不同的~Y变量，或使用不同的测量，或采用不同的校准），而不仅仅是在同一个真值表中将结果值从Y更改为~Y。这是由于概念不对称性，即一个概念的否定通常包含一些性质不同的概念。例如，非民主国家的集合指的是军政权、神权政体和一党政权等等。同样，例如，未婚人士的集合包括单身、寡妇等。简而言之，不对称性可能不仅需要使用不同的条件来分别解释Y和~Y，它可能还需要采用不同的条件对性质不同的~Y进行解释。

第二个注意事项：在必要性分析中，我们将条件A确定为必要条件。同时，对充分性的分析揭示了两条路径，且这两条路径都涉及条件A。因此，看起来，只要一个条件是所有充分路径的一部分，那么这个条件就将是结果的必要条件。如果在所有充分路径中都没有出现条件，则不是必要条件。但是，这两个结论在QCA的应用中都可能是错误的。只有对于某些特定的真值表如此分析，也即在真值表的2^k个逻辑可能的条件组合中，每个组合的结果值都是1或0时，这两个结论才成立。

正如5.1、6.1和6.2节所展示的，在实际中社会科学数据非常复杂，几乎不会出现这种情况。在QCA方法的应用中，真值表无法避免包含矛盾行或逻辑余项。当出现这些情况时，真值表的充分性分析可能无法正确揭示必要条件存在或不存在。在第9章中，我们详细说明了错误必要条件出现和真实必要条件消失的具体情况。就目前而言，建议将必要性和充分性分析分开，而对于必要性和充分性的陈述仅基于分别对必要性和充分性的分析。

第三个注意事项与第二个类似。由于本文的例子很简单，它产生了一个例外：在这个例子中，可以根据Y的公式推导出~Y的充分性解项，而无需进行单独的分析。根据DeMorgan定律，我们可以将Y的充分性解项由~A+~B*C→Y转换为A*(B+~C)→~Y。这与根据表4.2对结果~Y的实证分析得出的公式相同。然而，如前所述，在社会科学研究实践中，这个步骤是有问题的。它仅在特定的真值表中才是对的，也即，当真值表没有矛盾项（第5.1节）或逻辑余项（第6.1和6.2节）时。否则，应用DeMorgan定律产生的结果将导致一些真值表行要么被忽略，要么不成立，或两者都有（第8章和第9.1节）。由于特定的真值表在实际生活中很少见，因此正确使用此处描述的步骤以及DeMorgan定律的场景非常有限。

由于所有这些原因，在实践应用中（第11.1节），应始终对结果的发生和缺失进行单独分析，并对必要性和充分性进行独立分析，因为因果不对称也指的是实际上可能需要分别使用不同的前因因素来解释结果的发生和不同类型的缺失。

一目了然

Quine-McCluskey算法在真值表中使用布尔表达式进行简化。它首先列出所有充分性的条件组合。随后，通过布尔代数规则对逻辑表达式进行简化。检查质蕴涵项通常能够对不够明显的解项进行进一步简化。

在所有充分性解项中析出的INUS条件并不一定是结果发生的必要条件。因此，必须分别分析必要条件和充分条件。建议先进行必要条件分析，后进行充分条件分析。

结果的缺失必须单独分析。只有当组合中既没有逻辑余项，也不存在矛盾的真值表行时，才能应用DeMorgan定律。请注意，给定真值表中包含的所有信息可以通过不同的解项来表示。逻辑最小化原则将确保这些信息在逻辑上是等价的，仅在复杂程度上有所不同。需要根据理论和实践来决定对哪些解项进行解读。

原文：Schneider, C., & Wagemann, C. (2012). Truth tables. In Set-Theoretic Methods for the Social Sciences: A Guide to Qualitative Comparative Analysis (Strategies for Social Inquiry, pp. 23-41). Cambridge: Cambridge University Press.

本站仅提供存储服务，所有内容均由用户发布，如发现有害或侵权内容，请点击举报。