心理学常常是伪科学的重灾区。
中国心理学最近二三十年发展迅猛,但还是远远满足不了国人的巨大需求。于是就给了很多人可乘之机。据说,某个从未受过正规心理学训练的非专业人士靠几天培训拿下一个MBTI [1]的证书就可以两个小时收取1500元咨询费。
且不说MBTI测验其实很容易获取,随便一个商学院老师就可以轻松搞到。重要的是,MBTI不但不像吹的那么神,简直可以说完全没有用处,不能帮助人了解自己,更无法有效规划职业,更不要说由一个不懂心理测量的外行来解释。
MBTI测试中使用的4个维度 | dylanninin.com
MBTI测试会将人归入上述16种性格之一 | dylanninin.com
下面我就以MBTI为例,来讲解一些心理测量的基本原理,帮助大家识别有价值的和欺人的心理测量工具。
理论基础:完全缺乏实证
先简单回顾一下MBTI的来龙去脉。
1921年,卡尔·荣格(是的,就是弗洛伊德的朋友那个荣格)一拍脑门就写了本书,叫做《心理类型》(Psychological Types),里面提出了4个维度,把人按照人格分成16种类型 [2]。
卡尔·荣格,约1935年丨Wikipedia
先不要急着责怪荣格,他明确指出了这个分类只是出自自己的观察,有待实证检验。1942年,凯瑟琳·布里格斯从费城某银行的人力资源经理那里学习了一些测验的基本方法。于是,她和女儿,这两个没有经过任何正规心理学培训的人就开发出了这个80年后仍经久不衰的MBTI测验。
你可能会说,英雄不问出处,人家母女不能自学成才么。其实,心理学界真的不是因为歧视人家母女才挤兑MBTI,再说荣格可是大名鼎鼎的。
MBTI的问题还是在于这个测验本身。
测量工具:信度差是致命问题
心理测验是根据理论开发的测量工具,要判断工具的有效性,首先要从理论入手。
荣格对心理的把握还是很有一套的,他提出来的内外向维度可能是有史以来最广为人知的心理类型。不过,荣格和很多同时代的心理学家一样,理论强,但是缺乏实证的训练。他的4种心理类型理论现在已经被实证基础更强、更全面、更经得起推敲的“大五”人格理论所取代 [3]。
从这个角度来说,不能就说荣格的理论是完全错误、没有价值的,但是已经有了更好的理论,为什么还要抱残守缺呢?
MBTI最致命的问题,来自它的测量工具。
判断一个测验是否有效,需要考察两个指标:信度和效度。这里先说前者。
信度简单来说就是测量工具的一致性。比如,尺子是测量身高的工具,信度高的尺子不管是今天测还是明天测,不管是在中国测还是在美国测,不管是你来测还是我来,结果都是一样的。
如果测出来的结果差异太大,这尺子就要扔掉,因为信度太差。MBTI就是信度很差的一把心理测量的“尺子”。同一个人,今天测量可能是个ENTJ,过几天可能就是个INFP(大家莫担心,这些字母不过是表示你属于哪一类,这里无需考虑具体含义)[4]。
为什么会信度低呢?问题首先出在背后的理论上。假设要画老虎,找不到老虎怎么办,只好照猫画虎。理论(猫)是对现实(虎)的抽象,测验工具(画)是对理论的量化表达。
问题是,照猫画虎,画得再像也不是老虎。
MBTI理论中,评价人的个性有4个维度:内向型-外向型、直觉型-实感型、理解型-判断型以及思考型-情感型。所有人在每个维度上都是非此即彼,即要么内向,要么外向;要么思考型,要么情感型。
但实际上,这4个维度中只有内外向是符合这个描述的——即一个人要么内向,要么外向,不能同时兼备。其他3个维度上,这个说法则是错误的:一个人完全可以智商很高(思考型),同时情商(情感型)也高,或者二者都很低。因此这个二分法是对现实对一个错误描述,是有缺陷的。
另外,二分法认为人群的分布符合双峰分布,而不是正态分布。举例来说,人类的身高就是双峰分布,比如下图中男性身高多集中在70英寸(177厘米),女人则是65英寸(165厘米);而如果只考虑男人的身高,就是正态分布。在同一个维度上,证据表明人类心理是正态分布,而不是双峰分布。
计分方法:强行归类不靠谱
MBTI的计分方法有两大问题。
一是迫选。MBTI的题目是二选一。比如,你是喜欢坐在屋里看电视还是喜欢找人侃大山。甲根本无法独处,时刻和朋友在一起。乙两者都喜欢,不过侃大山的时候更多些。丙其实独处更多些,但是刚刚和好基友倾谈了一番,于是自然选择了侃大山。根据答案,这3个差别很大的人都被归类为外向。等下周再测的时候,乙和丙手一抖就能变成内向。
而绝大部分人更接近乙和丙而不是甲,因此,MBTI的重测信度很差。迫选的理由是因为背后的理论,前面说过了双峰分布理论是错误的,因此迫选法也是有问题的。
二是分类。MBTI在每个维度上把人分为两类,如果你得分超过中值,就归为一类,否则为另一类。以内外向为例,得分51%(甲)和90%(乙)都会归为外向。事实上,甲更接近丙(49%)而不是乙,而丙的MBTI类型则是内向。
在其他3个维度上,分成两类问题更大。以思考型-情感型为例,甲智商很高,遇事爱思考,同时情商也高,让他在思考型和情感型之间迫选会很痛苦。乙智商情商都很平庸,让他在两者之间迫选估计和甲一样痛苦。丙的智商明显高于情商。这三个人最终可能都选择了思考型,从得分上看没有区别,但是这三个人事实上区别很大。
图片来源 | Pixabay
因此,任何把人强分入几类的,不管是用颜色、星座还是任何其他东西,都是胡扯。按照MBTI,全世界才16种人,可信吗?
测量效度:
信度都没有,谈什么效度?
效度是考察测量工具的另一个关键指标。简单来说,效度就是该工具测量出来的东西是否有效,能否预测重要的结果。
一个测量光有信度是不够的。比如,星座的信度就极高,只要知道你的出生日期,任何人都几乎可以准确知道你的星座。问题是,星座测量再准确也是无用,因为星座的理论是错误的,人出生的时辰和人的性格,运势,姻缘没半毛钱关系。
效度的检验大体是这样的:假如理论说A推出B,结果A的测量工具果然能够预测B,那么就是效度高。
当理论是正确的,测验工具的信度就会影响效度。比如,身高和体重有正相关,因此知道了身高,就可以在一定程度上预测体重。信度越高的测量身高的工具,预测体重就越准确。
信度是效度的基础。信度低的工具,每次测量的结果都不同,怎么能准确预测任何东西。MBTI的信度就很低,因此效度根本无从谈起。
大五人格靠谱,但也别过度迷信
你可能会说,如果只是迫选和分类的问题,那改良一下不就得了?或者既然分类法问题这么大,为什么很多心理学理论都在用呢?难道用分类的都不科学?或者既然MBTI不科学,那么我想了解自己的个性怎么办呢?
如果你问得出前两个问题,说明你的批判思维很强,赞一个。
以内外向为例,这是MBTI的一个维度,也是目前心理学界比较公认的最为靠谱的“大五”人格理论中最重要的维度之一(你看,心理学界并不歧视荣格或者迈尔斯母女)。
另外,先不要忙着指责:16个分类不行,5个怎么会更靠谱?要记住,这5个是“维度”,不是“分类”。大五人格能预测很多重要的指标 [5],比如工作表现,学业成绩等。现在也有很多证据证明基因对大五人格的影响,甚至大五人格也被证明具有神经基础。
虽然大五人格被广为接受,但过分相信大五人格测验仍然是危险的。
以尺子为例,用它来测量身高的误差是很小的,用数字来说可以轻松达到0.99(1.00是满分,代表没有误差)甚至更高,因此可以信任。而人格测量的信度极少能达到0.90。因此,必须明白大五人格测验的结果可以参考,但不能迷信。
和方便面一样,“图片仅供参考”丨Pixabay
你要是批评说:“你们心理学搞了100多年才搞到这样”?我只能回答:“是的”。考虑到人的复杂性,这已经是很了不起的成就了。
心理学给不了人生终极解答
总结来说,考察一个测验,要看它的信度和效度。信度取决于具体的测量实践(如题目选取、计分方法、汇报形式等)。
迫选和人为分类是早期心理测量常用的方法,因为其信度低,所以已经被其他量化方法所取代。
简单分类也已经基本消失。一个靠谱的心理学家不会简单地说你是内向或者外向,而会说你的得分在内外向维度上的排名是多少百分比,至少也要加上你是非常外向,比较外向,还是接近中间(和大多数人一样,既不怎么外向也不怎么内向)。
这是给个人反馈用,如果是专业用途(如招聘选拔),还有更多的细节要注意。
希望大家看完这篇文章,能掌握基本的判断心理测验的基本概念:信度和效度。另外,无论是自测还是有专家解读的时候,都要记住心理测验的功能和局限性。考虑到人群是正态分布的,我们大部分人都更接近中等外向,中等宜人,中等尽责等等。
也就是普通人丨Pixabay
对于生活,我们每个人都有很多问题,我的命运是什么,该干什么工作,该与谁结婚等等。
好消息是,心理学能给出一些答案,比如一些婚恋机构就通过心理测试来进行匹配,并且取得了一些成就(好于随机配对)。坏消息是,这些答案恐怕不是很多人心目中的终极答案。毕竟,生活还是要你自己去过的。但有一点可以确定的是:心理学解答不了,星象什么的更是不行。
心理测量工具也有高下之分,明白了信度和效度,至少就不容易被哄骗了。
来源:果壳