大家好啊!最近SPSSAU后台有很多小伙伴留言提问,其中有两个问题:
其实上面的问题,主要是想要研究定类数据和定类数据之间的差异关系,而不是相关性的分析,我们进行数据研究,就是想要挖掘数据间的信息和价值,看清数据间的关系。数据间的关系可以分为三类关系,差异关系、相关关系、其它关系。
其中差异关系和相关关系有时候会被搞混,它们是不同的,区别是:
差异研究的目的在于比较两组数据或多组数据之间的差异。差异关系中的差异是指不同样本组的某个指标的差异,例如男生和女生的智力差异,涉及到了变量的分组;相关分析是两个变量之间的关系,和样本分组无关,例如智力和学习成绩是否相关。
今天这篇文章总结几个常用的差异性分析的方法,分享怎么简单选择出合适的分析方法。
一、
实际研究中有三种常见的差异性分析方法:T检验、方差分析、卡方检验。三个方法的区别如下表:
其实核心的区别在于:数据类型不一样。如果是定类和定类,此时应该使用卡方分析;如果是定类和定量,此时应该使用方差或者T检验。
方差和T检验的区别在于,对于T检验的X来讲,其只能为2个类别比如男和女。如果X为3个类别比如本科以下,本科,本科以上;此时只能使用方差分析。
二、
上面三种方法还可以细分:
01 T检验
T检验共分为三种方法,分别是独立样本T检验,配对样本T检验和单样本T检验。
独立样本T检验和单因素方差分析功能上基本一致,但是独立样本T检验只能比较两组选项的差异,比如男性和女性。
相对来讲,独立样本T检验在实验比较时使用频率更高,尤其是生物、医学相关领域。针对问卷研究,如果比较的类别为两组,独立样本T检验和单因素方差分析均可实现,研究者自行选择使用即可。
独立样本T检验和配对样本T检验功能上都是比较差异,而且均是比较两个组别差异。但二者有着实质性区别,如果是比较不同性别,婚姻状况(已婚和未婚)样本对某变量的差异时,应该使用独立样本T检验。如果比较组别之间有配对关系时,只能使用配对样本T检验,配对关系是指类似实验组和对照组的这类关系。另外独立样本T检验两组样本个数可以不相等,而配对样本T检验的两组样本量需要完全相等。
T检验的第三种分析方法为单样本T检验。单样本T检验是比较某个题项的平均得分是否与某数字(例子是与3进行对比)有着明显的差异,如果呈现出显著性差异,即说明明显该题项平均打分明显不等于3分。此分析方法在问卷研究中较少使用,平均得分是否明显不为3分可以很直观的看出,而不需要单独进行检验分析。
02 方差分析
根据X的不同,方差分析又可以进行细分。X的个数为一个时,我们称之为单因素方差;X为2个时则为双因素方差;X为3个时则称作三因素方差,依次下去。当X超过1个时,统称为多因素方差。
03卡方检验
卡方检验用于分析定类数据与定类数据之间的关系情况。例如研究人员想知道两组学生对于手机品牌的偏好差异情况,则应该使用卡方分析。卡方是通过分析不同类别数据的相对选择频数和占比情况,进而进行差异判断,单选题或多选题均可以使用卡方分析进行对比差异分析。
卡方拟合优度检验用于研究实际比例情况,是否与预期比例表现一致,它只针对于类别数据。比如总共收集100份数据,其中男性为48个,女性为52个;在收集数据之前预期男女比例应该是4:6 (40%为男性,60%为女性),分析预期的比例是否与实际的比例有着明显的差异性,则可以使用卡方拟合优度检验。
三、
SPSSAU进行差异性分析的操作也很容易,具体怎么用?这里以卡方检验的一个例子作为说明:
研究者希望研究化妆情况(全妆,淡妆,不化妆)与外出情况(出,不出)之间的差异性,调查了100个样本。化妆情况和外出情况都是定类变量,这里使用卡方检验分析方法。
首先,整理数据为加权格式上传到SPSSAU中:
接着,简单三步完成分析操作:
得出分析结果表格:
同时提供智能文字分析:
可视化:
便于研究者深入分析还提供卡方检验统计量过程值表格和效应量指标表格:
自动生成卡方检验的多重比较结果:
又到周三啦,第五节入门数据分析公开课就在今晚,这节课带来数据清理的一些方法,一般来说,获得的原始数据因为各种原因都会存在错误。如果在数据分析前,没有把原始数据处理好,很有可能导致后面数据分析不出真实的结果,甚至是错误的结论~
今晚19:00我们在B站直播间等你
也可以在B站搜索:SPSSAU就可以观看直播了