政志编译「001」｜Charles C. Ragin（查尔斯·拉金）：超越定量分析的政策研究

政志编译 (创刊号001) | 超越定量分析的政策研究

作者：Charles C. Ragin | University of Arizona

文章节选自：Innovative Comparative Methods For Policy Analysis：Beyond the Quantitative-Qualitative Divide. Springer. 2006

传统的多元回归分析之类的数据分析方法构成了今日社会科学中政策研究的基础。这些方法被认为是所有已有的方法中最严谨、最规范、最科学的。如果社会科学致力于影响政策，那它一定立足于这些最严谨的分析方法所得出的结果之上。

尽管传统定量方法非常的严谨，仍要注意的是这些“严谨性”是特定的，而不是普适的。本文关注的是传统定量方法众多特征中的一种，即致力于估计自变量对结果产生的“净效应”（net effect）。

本文所批判的传统方法是基于政策相关的大样本（large-N）数据集，而相关的替代方法，即模糊集/定性比较分析（fuzzy set/Qualitative comparative analysis），拒绝了认为社会科学就是计算自变量的净效应之假设，而是使用模糊集分析、组态（configurations）分析、案例导向（case-oriented）的社会科学研究方法。这种方法是净效应分析的一种补充，而不是替代。

一、什么是净效应思维？

在一般社会科学中，研究者将衡量从相互竞争的理论中发掘出的具有因果联系的变量的相对重要性作为基本的任务。在理想化的条件下，相关的理论侧重于不同的变量，并提出了这些变量如何与经验结果相联系的清晰的、不模糊的命题。

然而，在实践中，社会科学中大部分理论在澄清因果关系时都是模糊的，在论及因果条件与特定结果有何种联系时更是如此。如果与一特定理论相连的变量被证明是对所产生结果的最有力的预测（对变异的最佳解释），那么这种理论就胜出了。这么做定量研究在今天已经是个默认的流程。

净效应分析的思路是基于每一个变量自身都有能力影响结果出现的概率或产生结果的水平这一假设。尽管将“因果的”和“独立的”两个词作为“变量”一词的同义修饰词是很常见的，必须明确的是“独立的”一词的核心含义是自主性能力（autonomous capacity）。这也就意味着，假设一个自变量可以在不考虑其他变量的情况下影响结果。对净效应的估计因此存在可加性（additivity）假定，即所有自变量及其不同的组合对结果产生的净效应是等价的。

为了计算自变量的净效应，研究者通过从每个变量的效应的估计值中减去与其他因果变量相同的因变量所解释的变异来抵消竞争性因果条件的影响。这就是“净效应”的核心含义：对各变量对解释结果的变异的非重叠贡献的计算（the calculation of the non-overlapping contribution of each variable to explained variation in the outcome）。重叠度是相关系数的一个直接函数：一般而言，自变量和其竞争变量相关性越大，其净效应就越小。

模糊的理论和净效应思维间有着潜在的联系。解释力较弱的理论只能提供对社会现象宽泛的描述，并且无法描述复杂的因果性。研究人员经常宣称，他们使用线性、可加性模型是因为它们是“最简单的可能”，对因果性做出“最少的假设”。在这种观点中，可加性（及简单性）成为了默认的；任何对非可加性的分析都需要明确的理论支持，而这却总是缺乏。对净效应的共识也与社会研究的首要目标是计算不同理论中各变量的相对解释力这一观念相吻合。净效应分析为非重叠解释变量提供了明确的定量评估，这些变量又是每个理论的变量。

然而，理论之间往往并不矛盾，因此也不存在真正的竞争。毕竟，典型的社会科学理论不过是一幅模糊的画像。因此，净效应方法的使用可能会在研究中造成对理论的武断选择（theory adjudication），而这是不必要的，甚至是不可能的。

二、净效应思维的局限

当净效应方法被用作政策研究的主要手段时，会产生实践上和概念上的问题。一个基本的实践问题是净效果的评估依赖于模型设定（model specification）。竞争性变量之间的相关性会极大地影响着对自变量净效应的估计。如果限制相关变量的数量，那我们选择的自变量对结果产生的净效应将很显著。但若把它们都算上，净效应可能直降为零。

净效应估计对模型设定的依赖是众所周知的，这就是为什么学习定量研究就要掌握“正确的”模型设定。然而，正确的模型设定依赖于有力的理论和深厚的知识，而这两者在典型的净效应方法应用中通常都是缺乏的。

模型设定的重要性是很明显的，例如在Hermstein and Murray所著的The Bell Curve一书对National Longitudinal Survey of Youth的分析中。这项研究报告了一个非常巨大的净效应结果：Armed Forces Qualifying Test分数越高，贫困率就越低。但相对的是，Fischer等人使用相同的数据和技术（logistic回归）却得到了较弱的净效应。这两者关键的区别在于Herrnstein和Murray只加入了一到两个变量，而Fischer等人则加入了多个变量。

那么哪一个估计是“正确的”？答案取决于哪种设定被认为是“正确的”。因此，关于净效应的争论常常因为模型设定的不同而陷入僵局。虽然社会科学家倾向于认为拥有更多的变量比拥有很少的变量要好，但正如Fischer等人的分析表明的，加入太多的自变量将是严重的错误。

另一个实践问题是，社会科学家感兴趣的许多自变量彼此之间高度相关，因而只能得到非常有限的非重叠效应。让我们回到The Bell Curve一书。AFQT分数和出身家庭的社会经济地位是密切相关的，而这两个变量与其他潜在相关变量（如受教育年限、社区和学校特征等）也是密切相关的。因为各种因素的不平等相互重叠，样本的自变量值往往集中在一起：高AFQT分数往往与更好的家庭背景、更好的学校、更好的社区等相关。当然，这些并非完全相关，从数据中“挤出”净效应估计值也是可能的。另一个事实是不平等性正是由于相互重叠，才得以强化。考虑到社会现象的这一特征，定量研究几乎完全依赖于估计每一个因果变量独立的净效应技术是天然不足的。

更广泛的说，整体地研究案例作为特定的属性组态（configurations of attributes），与检验变量之间的相关性都是有用的。在这种视角下，案例以不同的属性组合而成，评估这些不同的组合的结果就是很重要的。以反贫困为例。大学教育对高收入家庭的已婚白人男性有影响吗？也许没有，或者区别不大。但是大学教育可能对来自低收入家庭的未婚黑人女性产生巨大的影响。

将样本以组态分析，使得条件相关（context-specific）的分析成为可能，此类分析使我们可以提出因果在何种条件下实现的问题。在什么情况下，考试分数对避免贫困很重要？在什么情况下婚姻是重要的？这些变量在白人女性和黑人男性之间有什么不同吗？这类问题超出了传统的集中于估计与环境无关的净效应分析的范围。

上述的组态分析与政策密切相关。政策话语通常关注人群（或案例）的类别，而不是变量及其对异质性群体的净效应。想想“真正处于不利地位的”、“有工作的穷人”和“接受救济的母亲”等短语。一般来说，此类种属包含了不同属性的组合。还要考虑这样一个事实，即政策从根本上是与社会干预有关的。虽然知道教育在总体上降低了贫困的几率（即显著的负向净效应）。但从政策的角度看，更重要、更有用的是了解教育在什么情况下会产生决定性的影响，保护弱势群体免受贫困所害。净效应是在整个群体的样本中计算出来的，而不是以特定种属的案例做出“结构化、聚焦性的比较”。最后，虽然净效应的计算为从不同理论中得出的变量的相对解释力提供了简明的评估，但哪个理论更好并不是政策研究的中心问题。哪一种理论更能解释变异只是一个学术问题。政策研究的核心问题是确定在何种情况下，哪些因果条件是决定性的，而不是考虑（通常是模糊的）理论。

Political理论志出品欢迎各种方式转载

编译 | 王柯宁

主审 | 李致宪

欢迎分享到朋友圈哦

我们期待

政治学与社会学人

投稿｜关注｜分享｜加入

「热爱生活，热爱中国。」

含情脉脉地摸索中国的政治与社会

举报/反馈

Political理论志

8获赞 680粉丝

政治学理论、社会学理论前沿研究

关注