线性回归用于确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法如果线性回归分析中包括两个或两个以上的自变量,且因变量和自变量之间是线性关系,则称为多元线性回归分析。
1、独立性:多元线性回归模型中的每个观察值都应该是相互独立的,即任何一个观察值的存在与否不会影响其他观察值的结果。
2、正态性:因变量和自变量都应该服从正态分布,即数据的频数分布应该接近正态分布。
3、线性关系:因变量和自变量之间应该存在线性关系,即因变量随着自变量的变化而变化。
4、多重共线性:多元线性回归模型中的自变量之间应该相互独立,即自变量之间不存在高度相关性。
5、观测值要足够多:多元线性回归模型需要有足够的样本量,以确保模型的统计意义和显著性。
1、预测:多元线性回归可以用来预测因变量的值,根据多个自变量的值预测出因变量的值。例如预测房价、销售量等。
2、因果关系分析:多元线性回归可以用来分析因变量与多个自变量之间的因果关系,例如研究广告投入与销售量之间的关系。
3、变量选择:多元线性回归可以用来确定对因变量影响最大的自变量,例如确定哪些因素最影响人们的消费决策。
4、模型优化:多元线性回归可以用来确定模型的最佳形式,从而使模型更加准确和可靠。例如确定哪些自变量应该包含在模型中,以及如何对自变量进行变换和转换。
如果对SPSS软件不熟练,我们可以使用SPSSPRO数据分析网站操作,具体步骤:
1、打开SPSSPRO网站,上传数据
2、选择线性回归,拖入变量
3、点击开始分析,系统自动分析出结果可免费下载分析结果
如果对SPSS软件不熟练,我们可以使用SPSSPRO免费数据分析网站操作,具体步骤:
1、打开SPSSPRO网站,上传数据
2、选择线性回归,拖入变量
3、点击开始分析,系统自动分析出结果可免费下载分析结果
案例数据:通过自变量(房子年龄、是否有电梯、楼层高度、房间平方)拟合预测因变量(房价)
术语解释:
R²代表曲线回归的拟合程度,越接近1效果越好。
VIF是共线性。VIF值代表多重共线性严重程度,用于检验模型是否呈现共线性,即解释变量间存在高度相关的关系(VIF应小于10或者5,严格为5)若VIF出现inf,则说明VIF值无穷大,建议检查共线性,或者使用岭回归。
B是有常数情况下的的系数。标准误=B/t值。标准化系数是将数据标准化后得到的系数。
F(df1,df2)是df1等于自变量数量;df2等于样本量-(自变量数量+1)。
F检验是为了判断是否存在显著的线性关系,R²是为了判断回归直线与此线性模型拟合的优劣。在线性回归中主要关注F检验是否通过,而在某些情况下R²大小和模型解释度没有必然关系。
SPSSPRO智能分析:
F检验的结果分析可以得到,显著性P值为0.000***,水平上呈现显著性,拒绝回归系数为0的原假设,因此模型基本满足要求。
对于变量共线性表现,VIF全部小于10,因此模型没有多重共线性问题,模型构建良好。
模型的公式如下:y=-5.741 + 1.756*房间平方(m2) - 0.108*楼层(层) + 2.783*房龄(年) - 1.128*配套电梯 。
以上。