SPSS数据分析方法有很多,本文从描述性分析、问卷分析、量化分析、统计建模、差异性分析这几个模块,用一句话简述各个分析方法的作用以及分享案例示例
频数分析:一组数据的不同数值的频数频数进行统计
案例示例:汇总统计本校学生的性别(男性、女性的个数)与年龄(18 岁及其以下、28-25 岁之间、25 岁以上)
描述型统计:对调查总体所有变量的有关数据进行统计性描述,包括数据的集中趋势与离散趋势
案例示例:查看考试的平均成绩、最高分、最低分成绩集中在哪个分数段等
分类汇总:根据定类变量分类进行汇总,按照某一标准进行分类,然后在分完类的基础上对各类别相关数据分别进行求和、求平均数、求个数、求最大值、求最小值等方法的汇总
案例示例:统计公司最近 2 个月的办公设备采购情况,分别按照设备类型、数量、采购金额进行汇总分析
正态性分析:检验数据是否满足正态分布,一些算法需要数据满足正态分布
案例示例:电话银行月费、最近一个月消费金额
相关性分析:对变量两两之间的相关程度进行分析
案例示例:人的身高和体重之间;空气中的相对湿度与降雨量之间的相关关系
交叉分析:分析两两分组变量之间的交叉分布,比较各组的分布状况寻找变量间的关系
案例示例:不同地区(城市/农村)和性别的同学在玩电脑游戏的分布状况
信度分析:检测问卷中量表所测结果的稳定性以及一致性
案例示例:测量收集到的客户满意度量表,结果是否可靠
效度分析:问卷量表的有效性和正确性,即分析问卷题目的设计是否合理
案例示例:测量收集到的客户满意度量表,测量其题目设计是否合理
熵权法:对问卷调查的指标的重要性进行计算出各个指标的权重,为多指标综合评价提供依据
案例示例:100个客户的各方面(担保,资本,环境)评分,用熵权法来计算各个变量(担保,资本,环境)的重要性,即所占的权重
验证性因子分析:测试一个因子与相对应的测度项之间的关系,是否符合研究者所设计的理论关系
案例示例:已知100 名同学的语文、数学、英语、物理、生物、化学成绩,验证他们的语文、英语成绩是否可以反映理科班的文科成绩水平
Kappa一致性检验:定类数据的相关性检验,定量数据的相关性检验为皮尔逊相关系数
案例示例:问卷调查一个班级的两个体育老师对学生体育锻炼的态度(分为:从不、偶尔、经常)划分情况,检验是否存在一致性
组内相关系数:衡量和评价观察者间信度和复测信度的信度系数指标
案例示例:5 个评委对于同一批选手进行评分,测量其评分是否一致
秩和比综合评价法(RSR):将效益型指标从小到大排序进行排名、成本型指标从大到小排序进行排名,再计算秩和比,最后统计回归、分档排序
案例示例:对某省 10 个地区的孕妇保健工作的三个指标进行综合评价
优劣解距离法(TOPSIS):组内综合评价方法,能充分利用原始数据的信息,其结果能精确地反映各评价方案之间的差距
案例示例:为了客观地评价各风景地点的性价比,根据风景、人文,拥挤程度、票价等因素对各风景地点进行评估
线性回归(最小二乘法):利用数理统计中回归分析,来确定两种或两种以上变量间相互依赖的定量关系
案例示例:通过自变量(房子年龄、是否有电梯、楼层高度、房间平方)拟合预测因变量(房价)
主成分分析(PCA):将多个有一定相关性的指标进行线性组合以最少的维度解释原数据中尽可能多的信息为目标进行降维,降维后的各变量间彼此线性无关,最终确定的新变量是原始变量的线性组合
案例示例:某金融服务公司为了了解贷款客户的信用程度,评价客户的信用等级,采用信用评级常用的 5C(能力,品格 ,担保 ,资本,环境)方法, 说明客户违约的可能性
因子分析(探索性):基于降维的思想,在尽可能不损失或者少损失原始数据信息的情况下,将错综复杂的众多变量聚合成少数几个独立的公共因子
案例示例:根据该地区 2021 年的生产总值、人均可支配收入等多个指标量化评估多个省市地区的经济发展水平排名或者各指标的权重
岭回归:专用于共线性数据分析的有偏估计回归方法实质上是一种改良的最小二乘估计法,通过放弃最小二乘法的无偏性,以损失部分信息、降低精度为代价获得回归系数
案例示例:通过自变量(房间面积、楼层高度、房子单价、是否有电梯、周围学校数量、距地铁站位置)拟合预测因变量(房价)现在发现房子单价与楼层高度之间有着很强的共线性,VIF 值高于 20;不能使用常见的最小二乘法 OLS 回归分析
时间序列模型(ARIMA):常见的用来进行时间序列预测的模型
案例示例:基于 1985-2021 年某杂志的销售量,预测某商品的未来五年的销售量
方差分析:用于定类字段(X)与 1 个或 1 个以上的定量字段(Y)之间的差异性研究
案例示例:分析个人受教育程度(定类变量)是否给个人的经济收入(定量变量)带来显著性影响
独立样本t检验:用于分析一个定类变量与一个或者多个定量变量之间有无明显差异
案例示例:如研究不同学校的学生(各学校学生数不一定相等)成绩是否存在差异性
单样本t检验:比较样本数据与一个特定数值之间的差异情况,同时要求数据呈现正态性分布
案例示例:如研究一家食品生产企业的罐装食品标准重量是不是 100g
卡方检验:比较定类变量与定类变量之间的差异性分析
案例示例:从某高中学随机抽取两个以上的班级,调查他们对待文理分科的态度是否有显著差异