如何检验多重共线性的严重程度 spss线性回归模型的四个标准假设?
土壤和植被养分是影响作物产量的重要因素。为了探讨土壤和叶片营养元素对作物产量的影响,在某地区30个样地测定了作物产量、土壤pH值、有机质含量(SOM)、碱解氮含量(SAN)、有效磷含量(SAP)、叶片氮含量(STN)和磷含量(STP)。一些数据如下:
注:表中数据随机生成,不能用于其他用途。
在本研究中,我们希望建立变量(pH、SOM、SAN等)之间的回归方程。)和产量。这时候可以考虑采用多元线性回归分析。
数据分析
值得注意的是,多元线性回归分析要求数据满足以下四个假设:
(1)至少需要2个自变量,且相互独立(本次为6个);
(2)因变量是连续变量(这种情况下的输出是连续变量);
(3)数据具有方差齐性、无异常值、正态分布的特点(检验方法);
(4)自变量之间不存在多重共线性。
前两个假设可以根据实验设计直接判断;假设(3)的测试已经在前面的教程中介绍过了,单击 "测试方法 "查看它。
假设(4)的检验方法如下:
1.点击分析→回归→线性。
2.在自变量框中选择自变量,如pH,在因变量框中选择输出,然后单击统计。
3.在统计窗口中选择共线性诊断,单击继续,然后单击主页上的确定。
4.结果判断:我们只需要关注结果中的系数表。当VIF值大于或等于10时,我们认为变量之间存在严重的共线性。当VIF值小于10时,我们认为数据基本符合多元线性分析的假设(4),即不存在多重共线性问题。
所以这种情况下的数据都满足以上四个假设,可以进行多元线性回归。
SPSS分析步骤
一.准备工作
SPSS软件(我用的是IBM SPSS Statistics 25的中文版,其实每个版本的模式都差不多。如果需要我的版本,可以直接点击(安装包)下载;
共线性会导致系数估计的标准差增加。同样,可以通过自变量的相关矩阵进行诊断。或者使用通用VIF进行诊断。
在了解了多重共线性是如何影响我们对模型的分析和预测能力之后,学习如何检测数据中多重共线性的存在是非常重要的。
随着以下方法可用于检测多重共线性:
r平方值较大,但作为β-权值统计意义不大,即整体模型的F检验显著,但个别系数估计的T检验不显著。
变量对之间有很大的相关性。
差别通货膨胀系数。
版权声明:本文内容由互联网用户自发贡献,本站不承担相关法律责任.如有侵权/违法内容,本站将立刻删除。