手记

数据预处理

构建好的数据集 – Data Preprocessing

机器学习算法的最终结果的优劣取决于:

  • 数据的质量;
  • 数据中蕴含的有用信息量。

缺失数据的处理

样本由于各种原因缺失一些值是很常见的现象。其原因主要有:

  • 数据采集过程查询的错误;
  • 常用的度量方法不适用于某些特征;
  • 调查过程中有些数据没有填写等。

更多内容见 Notebook

0人推荐
随时随地看视频
慕课网APP