我们一般会在文献的统计方法部分看到这样的描述:
对于数值变量,首先进行正态性检验,如果各组均满足正态性,采用均数(标准差)进行统计描述,采用t检验进行组间比较;否则采用中位数(四分位数间距)进行统计描述,采用非参数检验进行组间比较。
大家对于四分位数间距可能会比较陌生,一般遇到数据不符合正态分布时,手足无措。
今天,我们一起来看看。
1
四分位数(Quartile)是统计学中分位数的一种,即把所有数值由小到大排列并分成四等份,处于三个分割点位置的数值就是四分位数。
第三四分位数与第一四分位数的差值称为四分位数间距(InterQuartile Range, IQR),简称四分位距。
四分位距(interquartile range, IQR)是描述统计学中的一种方法,但由于四分位距不受极大值或极小值的影响,常用于描述非正态分布资料的离散程度,其数值越大,变异度越大,反之,变异度越小。
2
1、复制数据:在Excel中,Ctrl+A全选数据集,Ctrl+C复制
2、数据导入到SPSS中
选中最左上角的单元格-右键-与变量名称一起粘贴
3、变量设置
进行简单的变量设置,分类变量group设为测量,小数位数为0,其他数值变量设置为标度。
4、计算中位数(四分位数间距)
分析-描述统计-探索
数值变量-选入因变量列表
分组变量-选入因子列表
进一步点击-统计-勾选描述-勾选百分位数(P)-继续(C)
5、查看统计结果
根据红框中的内容,整理后的统计结果为:组1年龄的中位数(四分位数间距)为53.5(29.5),组2年龄的中位数(四分位数间距)为55.0(20.0)。
其实,统计结果表中也给出了均数(标准差)的数值。
思考题:
相信如何获取中位数(四分位数间距),大家都学会了,那么问题来了:如果有的杂志要求写成中位数(第三四分位数-第一四分位数)呢?
又该如何计算,请在留言处留言。
END
本文作者:刘老师,北大公卫硕士,就职于某医学中心,发表SCI和北大核心期刊论文10余篇,具有丰富的统计分析与文章投稿经验。
如你有如下问题:数据清洗、数据整理、统计分析、样本量计算、诊断试验、ROC曲线、临床预测模型、统计图、R语言、研究设计等问题,均可向刘老师咨询(需收取一定费用)。
以下是刘老师个人微信,添加时请注明:统计咨询。