作者:尹蕙兰
量表题是调查中常用的一种题型,它可以帮助研究者对研究对象的一些潜在特质或心理变量进行“度”的测量,如受访者对某事物的满意度、忠诚度,或其他意愿、态度的强度。在设计量表题时,设计者首先要考虑应该使用多少级的刻度(scale point)。
由于问卷实际需求的不同,关于量表的刻度级别其实并没有一个固定的最优数值。在一些经典的调查中,我们可以看到2、3、4、5、7、9、10、11甚至101级等各类量表。总的来说,目前应用最广泛的是5级、7级、10级和11级的量表,比如下面是一个我们熟悉的5级量表:
您是否同意为了保护我国经济而限制外国产品进口?1. 非常同意2. 比较同意3. 既不同意也不反对4. 比较不同意5. 非常不同意
量表题的基本设计原则
那么,面临各式各样级别的量表,研究者应该如何选择?在设计量表题时,我们首先需要遵循以下四个基本的设计原则。这四个原则中任何一个得不到满足,数据的质量都会受到影响。
第一,整个量表区间需要覆盖要测量的变量的全部范围。
例如,我们要测试消费者对某广告品牌的喜爱度,如果区间的范围只是从比较喜爱到非常喜爱,那这个量表显然是不规范的,因为不喜欢该广告品牌的人无法选择与其态度相对应的值。
第二,量表从一端到另一端的各个刻度值所表示的含义应该是有顺序的,且所指代的内容不能有重合的部分。
例如,在调查受访者进行某项活动的频率时,如果两个相邻的点一个表示“不定期地”,另一个表示“偶尔”,那么就会给受访者带来困惑,因为这二者在语义上是相同的含义。
第三,每个受访者对于量表上的每个刻度的含义应该有准确而且稳定的理解。
比如,如果一个受访者对量表刻度的含义的理解在一周前和一周后不一致,那么在他的态度没有发生变化的情况下,我们也会错误地测量出他的态度的变化。
第四,大部分或者全部的受访者对于量表上的每个刻度的含义应该有一致的理解。否则,对于两个态度一样的受访者,我们会得到不一样的数值答案。
量表题的刻度级别选择
在符合基本设计原则的前提下,我们需要进一步考虑该如何选择符合问题属性和研究需求的量表级别。我们仍以消费者对品牌广告的喜爱度为例:
级别比较少的量表,如2级量表和3级量表通常都不能够完全覆盖消费者的态度。一个2级量表的选项只可能为喜爱或不喜爱,那么对于持中间态度的受访者来说,2级量表并不能准确表达他们的想法;3级量表虽然可能有中间值,但是对于抱有“有点喜爱/不喜爱”态度的受访者来说,他们也很难做出选择。
◆ 量表级数越多,越细化,受访者可提供的潜在信息就越多。
例如,相较于2级量表和3级量表,5级量表可以让受访者表达中等程度喜爱/不喜爱的态度。然而,对于有些人来说,他们的喜爱或不喜爱的程度更加细致地分为极其喜爱/不喜爱、中度喜爱/不喜爱和轻微喜爱/不喜爱,因而5级量表仍不足以供他们准确表达他们的态度,这就至少需要7级量表才能满足这些受访者的分级需求。
◆ 然而,也并不是量表的刻度级别越多越好。
通常,研究者需要向受访者明确指出各个刻度所表示的具体含义。然而,如果一个量表超过了7级,这便很难做到。更常见的做法是只标注两侧端点的含义,并以数字来标示中间的各个刻度。比如:
因此,量表的级别越多,受访者就越难准确理解每个点具体代表的含义,而且不同的受访者对于每个点的含义理解也越容易产生分歧。
比如,对一个101分的量表来说,76、77、78分别代表什么含义,多给一分和少给一分的受访者的差别在哪,这些都很难解释清楚。因此,研究者需要在量级和含义表达上进行取舍。
◆ 从信度(reliability)来看,学者们对不同级别的量表的信度的评估结果多多少少有些不同,但相对一致的结论是,2级和3级量表相比多级量表的信度要小。不过,也并不是级别越多信度越高,超过7级后,级别增加所带来的信度的提高便越来越少了。
◆ 从效度(validity)来看,中等级别的量表的效度会高于相对较少级别的量表,太长的量表的效度也会减低。研究综合表明,7级量表在大多数情况下都是相对理想的,因此在不确定使用何种量表的时候,选择7级量表的风险最小。
参考文献:
Krosnick, Jon A., and Stanley Presser. 2010. “Question and Questionnaire Design.” in Handbook of Survey Research,Second Edition.