卡方分析
卡方检验是研究数据比率上的差异性,用于比较定类与定类数据的关系情况。
1. 数据类型
卡方检验要求X、Y项均为定类数据,即数字大小代表分类。
如果X是定类数据,Y是定量数据,且X组别多于2组,则应该使用方差分析。如果X是定类数据,Y是定量数据,且X组别仅为两组,则应该使用T检验。
2. 研究目的
一般使用卡方检验进行分析的目的都是比较差异性。
如现状调查类问卷,以及一般调查问卷中,常使用卡方检验对样本背景信息题(性别、年龄等指标)与核心题项进行交叉分析,来说明样本背景这类指标对核心变量是否存在影响。
医学研究里,卡方分析尤其常见,比如研究不同种药物对某种疾病的疗效有无差别等。
除了上述研究场景外,卡方检验还可用于研究配对数据的差异性,比如用两种方法诊断癌症,看两种方法的诊断结果是否有差异,则要使用配对卡方检验
如果研究目的在于分析实际观测的比例与期望比例是否一致。比如实际抽样的男女比例,与预期比例是否存在差异,此时可使用卡方拟合优度
3. 数据格式
定类数据涉及两种格式可供选择:原始格式和加权格式。
如果数据经过了统计整理,则需要整理为加权格式,分析时将频数列放入【加权项】即可,得到的结果与原始数据结果完全一致。
加权格式如何录入可以查看我们之前推送的文章:什么时候需要加权数据?
4. SPSSAU操作
(1)交叉卡方
如上图,分析不同性别的人群,使用理财产品的情况是否有差别。这里Y项也可以放入多个标题,一起分析。
分析时先看P值情况,P值小于0.05或0.01即说明X与Y之间呈现出显著性,然后可以再进一步比较括号中的百分比,对每一项进行描述。
如果P>0.05了,则代表没有统计学意义,通常就不再进行深入分析。
具体分析步骤可参考SPSSAU输出的“分析建议”及“智能分析”。
(2)卡方检验
如果使用加权数据,就要用“实验研究”→“卡方检验”。
如下面例子:A、B两种药治疗感冒,分析两种药的疗效是否有差别?
放置位置和交叉卡方一样,只是多加了一个加权项。
卡方检验分析结果
深入指标
卡方检验增加了一些过程值的输出,原因在于实验研究中样本个数通常比较少,而默认使用的pearson卡方,要求总样本量n≥40,且所有的期望频数E≥5。当n≥40且存在任意一个1 ≤E<5,则使用yates校正卡方。当n<40,或E<1时,则用Fisher卡方。这个选择过程SPSSAU会自动进行判断,并输出适合的卡方值及结果,直接使用该结果即可。
深入指标反映的是变量之间的相关程度,即在分析结果已经得出P<0.05,两种药物治疗感冒的疗效确实存在显著性差异时,进一步比较两种药品的疗效差异幅度究竟有多大。
SPSSAU提供了五个指标,分别对应不同的情况。可结合给出的”分析建议”进行选择,帮助手册中也有对应说明,不会时可以查阅。
由于篇幅原因,配对卡方与卡方拟合优度的操作说明,就不再展开说明,详细步骤可以查看帮助手册。
5. 其他说明
多选题中的卡方值
特别说明一下,多选题也属于定类数据,所以一上来,会有用户以为多选题做交叉分析要用到卡方分析,实际上也没有错,多选题与其他题项的交叉分析就是采用卡方检验,只是SPSSAU把多选题单独设计为一个方法,计算方法上依然使用了卡方检验。
卡方检验的结果显示在左下角,P>0.05代表性别对于理财产品选择并不会呈现出差异性。
总结
以上就是卡方分析的流程梳理。卡方检验无论是在问卷调研或是医学实验中,都是非常实用高效的方法,没有展开说明的部分建议大家查阅SPSSAU帮助手册进行学习。
举报/反馈

SPSSAU

1.2万获赞 1.2万粉丝
SPSSAU 数据科学 一点就好
SPSSAU官方账号,优质教育领域创作者
关注
0
0
收藏
分享