天天向上鴨
2019-09-09 11:39
如果数据集里有很多特征,如何挑选特征放进模型呢?全部都放进去再看哪个有效,还是先挑选一部分?
通常来说,如果特征本身不是很多,那可以考虑把所有的特征都放入模型,这通常可能提高你的模型表现,缺点就是可能导致过拟合,即对新数据的预测不够准确。
从已有特征中挑选特征的方式可以考虑:1、基于经验,即根据主观经验挑选影响比较大的特征,比如预测疾病可能性,那年龄肯定是一个因素;2、对比有某一个特征与没有某个特征情况下,模型的表现,判断该特征的重要性。
人工智能入门:Python实现机器学习
27166 学习 · 81 问题
相似问题