缺失值填充研究能发论文。
数据缺失在实际中是经常发生的,甚至是不可避免的。造成数据缺失可能是信息(暂时)无法获取或者在操作过程中被遗漏等。数据缺失对数据挖掘的过程和结果都有十分严重的影响。数据缺失可能直接影响到模式发现的准确性和运行性能,甚至导致错误的挖掘模型。
处理有缺失数据的数据集是极端困难的,因为现有的模式发现算法通常假设输入的数据是无缺失的。于是这些可用的模式发现算法和实际数据之间存在一条不可逾越的鸿沟。 缺失数据的处理方法可分为删除元组、缺失数据填充和不处理三大类。
相关知识:
野生的数据经常出现缺失值,这个很好理解,填写表格也经常心浮气躁,有一些内容可能就漏填了,譬如说在性别一栏留下了空白,这就是缺失值。
如果光看机器学习的教程,很容易觉得提供给机器学习的数据应该就像一个一个排列整齐的方阵,都已经蓄势待发准备好接受某个模型的检阅。但在真实的环境中数据更像是Jerrys最爱的奶酪,上面布满了空空洞洞的缺失值。
以上内容参考:百度百科--缺失值