2016 - 2025

感恩一路有你

如何检验多重共线性的严重程度 spss线性回归模型的四个标准假设?

浏览量:3919 时间:2023-05-25 13:25:55 作者:采采

土壤和植被养分是影响作物产量的重要因素。为了探讨土壤和叶片营养元素对作物产量的影响,在某地区30个样地测定了作物产量、土壤pH值、有机质含量(SOM)、碱解氮含量(SAN)、有效磷含量(SAP)、叶片氮含量(STN)和磷含量(STP)。一些数据如下:

注:表中数据随机生成,不能用于其他用途。

在本研究中,我们希望建立变量(pH、SOM、SAN等)之间的回归方程。)和产量。这时候可以考虑采用多元线性回归分析。

数据分析

值得注意的是,多元线性回归分析要求数据满足以下四个假设:

(1)至少需要2个自变量,且相互独立(本次为6个);

(2)因变量是连续变量(这种情况下的输出是连续变量);

(3)数据具有方差齐性、无异常值、正态分布的特点(检验方法);

(4)自变量之间不存在多重共线性。

前两个假设可以根据实验设计直接判断;假设(3)的测试已经在前面的教程中介绍过了,单击 "测试方法 "查看它。

假设(4)的检验方法如下:

1.点击分析→回归→线性。

2.在自变量框中选择自变量,如pH,在因变量框中选择输出,然后单击统计。

3.在统计窗口中选择共线性诊断,单击继续,然后单击主页上的确定。

4.结果判断:我们只需要关注结果中的系数表。当VIF值大于或等于10时,我们认为变量之间存在严重的共线性。当VIF值小于10时,我们认为数据基本符合多元线性分析的假设(4),即不存在多重共线性问题。

所以这种情况下的数据都满足以上四个假设,可以进行多元线性回归。

SPSS分析步骤

一.准备工作

SPSS软件(我用的是IBM SPSS Statistics 25的中文版,其实每个版本的模式都差不多。如果需要我的版本,可以直接点击(安装包)下载;

共线性会导致系数估计的标准差增加。同样,可以通过自变量的相关矩阵进行诊断。或者使用通用VIF进行诊断。

在了解了多重共线性是如何影响我们对模型的分析和预测能力之后,学习如何检测数据中多重共线性的存在是非常重要的。

随着以下方法可用于检测多重共线性:

r平方值较大,但作为β-权值统计意义不大,即整体模型的F检验显著,但个别系数估计的T检验不显著。

变量对之间有很大的相关性。

差别通货膨胀系数。

数据 共线性 变量 线性

版权声明:本文内容由互联网用户自发贡献,本站不承担相关法律责任.如有侵权/违法内容,本站将立刻删除。