【问题1】本问题以CKD数据为例,统计数据缺失值的情况。数据中的缺失值以固定符号表示,因此本问题实质上就是统计各列中缺失值符号出现的次数,以及含缺失值符号的数据条数。
【问题2】本问题在问题1的基础上,对数据缺失值进行填充。填充的方式较多,如取上一有效数据项的值、取下一有效数据项的值、取同一列所有有效数据项的中值、取同一列所有有效数据项的均值、建模完成缺失值填充等,这里我们使用“取同一列所有有效数据项的均值”这种填充方法。