2016 - 2024

感恩一路有你

数据缺失值的4种处理方法 spss数据中缺失值处理方法?

浏览量:1907 时间:2021-03-13 18:39:35 作者:admin

spss数据中缺失值处理方法?

缺失值处理就是简单的两种处理,一种是删除缺失,另一种是填充缺失

当缺失值只占总样本量的很小比例时,各种处理方法都可以使用,差别不大

最简单的就是找到三个缺失数据,并删除缺失的案例,即不使用主题。

第二种方法是多用人,均值填充法,在SPSS菜单中选择:Transform replace missing value,The missing variables into The right analysis box,默认方法是均值填充法,OK

第三种方法比均值填充法好一点,在SPSS菜单中选择:分析-缺失值分析,将缺失变量放入右边的框中,注意类别变量和数量变量之间的差异。在估计方法中,给出了四种方法。前两种是删除法,后两种是填充法。推荐的最佳方法是em。选中em复选框后,底部的em按钮将从灰色变为黑色。单击此按钮,选中保存完成的数据复选框,然后命名新数据。确定后,SPSS会生成一个新的数据集,数据集中的数据是填写的缺失值

如果缺失值只占数据的5%以下,那么缺失值对数据的影响很小,各种缺失处理方法也没有什么区别。最好是简单处理,比如填写均值,或者直接删除缺失的案例,但是均值填写不能利用缺失数据中可能包含的有效信息,删除案例可能会导致数据结构效益影响的不确定性(例如,在绩效考核中,不合格者没有成绩,形成缺憾,删除缺憾会使数据缺乏代表性,只有合格者,没有不合格者)。与均值插补法相比,回归插补法更准确(仅限于缺失值不多的情况,否则回归会产生偏估计)。如果存在大量缺失值,建议使用EM算法。通过模拟研究,许多研究者表明,这种插补方法可以得到最准确的结果。其操作是在SPSS菜单中选择“分析缺失值分析”,弹出对话框,在右边的变量框中选择要填充的缺失数据(注意变量类型),在估算方法中选择em,然后单击em,将填充的数据保存为新的数据集

数据缺失值的4种处理方法 简述处理缺失数据的一般方法 补全缺失数据的方法

版权声明:本文内容由互联网用户自发贡献,本站不承担相关法律责任.如有侵权/违法内容,本站将立刻删除。